KR20210126019A - 엔지니어링된 아릴 설페이트-의존 효소 - Google Patents

엔지니어링된 아릴 설페이트-의존 효소 Download PDF

Info

Publication number
KR20210126019A
KR20210126019A KR1020217025890A KR20217025890A KR20210126019A KR 20210126019 A KR20210126019 A KR 20210126019A KR 1020217025890 A KR1020217025890 A KR 1020217025890A KR 20217025890 A KR20217025890 A KR 20217025890A KR 20210126019 A KR20210126019 A KR 20210126019A
Authority
KR
South Korea
Prior art keywords
seq
sulfotransferase
amino acid
enzyme
acid sequence
Prior art date
Application number
KR1020217025890A
Other languages
English (en)
Inventor
타시스 게스테이라 페레이라
Original Assignee
옵팀비아, 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 옵팀비아, 엘엘씨 filed Critical 옵팀비아, 엘엘씨
Publication of KR20210126019A publication Critical patent/KR20210126019A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/13Transferases (2.) transferring sulfur containing groups (2.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/04Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/64Preparation of S-glycosides, e.g. lincomycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y208/00Transferases transferring sulfur-containing groups (2.8)
    • C12Y208/02Sulfotransferases (2.8.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y208/00Transferases transferring sulfur-containing groups (2.8)
    • C12Y208/02Sulfotransferases (2.8.2)
    • C12Y208/02008[Heparan sulfate]-glucosamine N-sulfotransferase (2.8.2.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y208/00Transferases transferring sulfur-containing groups (2.8)
    • C12Y208/02Sulfotransferases (2.8.2)
    • C12Y208/02023[Heparan sulfate]-glucosamine 3-sulfotransferase 1 (2.8.2.23)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Polysaccharides And Polysaccharide Derivatives (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

본 발명은, 설포 그룹 공여체로서 천연 기질 3'-포스포아데노신 5'-포스포설페이트 대신에 아릴 설페이트 화합물과 반응하고 설포 그룹 수용체로서 헤파로산-계 다당류, 특히 헤파란 설페이트와 반응하도록 가공된(engineered) 복수의 비-천연적으로 존재하는 설포트랜스퍼라제 효소를 제공한다. 각각의 가공된 설포트랜스퍼라제 효소는 글루코사미닐 N-설포트랜스퍼라제 활성, 헥수로닐 2-O 설포트랜스퍼라제 활성, 글루코사미닐 6-O 설포트랜스퍼라제 활성, 또는 글루코사미닐 3-O 설포트랜스퍼라제 활성을 포함하는 설포 그룹을 수용하는 헤파로산-계 다당류내 위치에 의해 특성화된 생물학적 활성을 가진다. 본 발명은 또한 상기 가공된 설포트랜스퍼라제를 항응고 활성을 갖는 다당류를 포함하는 설페이트 헤파로산-계 다당류를 생성하는데 사용하는 방법을 제공한다.

Description

엔지니어링된 아릴 설페이트-의존 효소
[서열목록의 참조]
본 출원은 전자문서 형태의 서열목록과 함께 출원된다. 서열목록은 2019년 12월 30일 생성된 "OPT-001X PCT_Sequence_Listing.txt"의 명칭의 파일로 제공되면, 크기는 390,921 byte이다. 서열목록의 전자문서 형태의 정보는 본 문서에 참조로서 통합된다.
[발명의 분야]
본 발명은 설포 그룹 공여체(sulfo group donor)로서, 아릴 설페이트 화합물, 3'-포스포아데노신 5'-포스포설페이트와 반응하도록 가공된 비-천연의 설포트랜스퍼라제 효소에 관한 것이다.
설포트랜스퍼라제는 설포 그룹 공여체로부터 설포 그룹 수용체로 설포 그룹의 전달을 촉매하는 효소의 필수 부류이다. 설포트랜스퍼라제는 천연적으로 거의 편재되어 있으며, 이들은 거의 모든 유형의 유기체, 예를 들면, 세균, 효모, 및 사람을 포함하는 동물내에 존재한다. 유사하게, 설포트랜스퍼라제 효소는 스테로이드, 다당류, 단백질, 제노바이오틱스(xenobiotics), 및 다른 분자의 많은 유형을 포함하는, 광범위한 설포 그룹 수용체의 황산화(sulfation)에 중요한 역할을 한다.
예를 들면, 더마탄, 케라탄, 헤파로산, 및 콘드로이틴을 포함하는, 설포 그룹 수용체로서 이용될 수 있는 수개의 다당류가 존재한다. 특히, 헤파로산은 1→4 글리코시드적으로 연결된, 글루쿠론산 및 N-아세틸화된 글루코사민([β(1,4)GlcA-α(1,4)GlcNAc]n) 잔기의 반복된 이당류 단위를 포함하며, 이들 중 임의의 것은 하나 이상의 효소-촉매된 탈아세틸화, 황산화, 또는 에피머화(epimerization) 반응에 의해 추가로 개질될 수 있다. 헤파로산-계 다당류의 황산화는 4개 이하의 설포트랜스퍼라제 효소에 의해 촉매될 수 있고, 하나 이상의 글루코사민 잔기의 탈아세틸화 및 하나 이상의 글루쿠론산 잔기의 에피머화와 함께 특수한 순서로 수행되는 경우, 항응고 활성을 갖는 헤파란 설페이트(HS) 다당류를 형성하도록 이용될 수 있다.
그러나, 설포 그룹 수용체의 세트와 같이 광범위하고 방대하게 존재할 수 있으므로, 설포 그룹 공여체로서 설포트랜스퍼라제 효소에 의해 이용될 수 있는 단지 하나의 분자의 커플이 존재한다. 4개의 HS 설포트랜스퍼라제 각각에 대해 포함하는, 거의 편재된 설포 그룹 공여체는 3'-포스포아데노신 5'-포스포설페이트이다. 이러한 생체내(in vivo) 시스템은 반감기가 짧고 필요한 경우, 유기체에 의해 용이하게 합성 및 대사될 수 있으므로, 3'-포스포아데노신 5'-포스포설페이트를 전적으로 이용하도록 진화되었다. 그러나, 3'-포스포아데노신 5'-포스포설페이트는 설포트랜스퍼라제의 생물학적 활성을 활성적으로 억제하는 3',5'-디포스페이트로 용이하게 분해될 수 있으므로, 이러한 동일한 짧은 반감기는 3'-포스포아데노신 5'-포스포설페이트가 설포트랜스퍼라제를 이용하는, 대부분의 시험관내(in vitro) 합성, 특히 대규모 합성에 부적절하게 되도록 한다. 그 결과, 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트를 전적으로 이용하는 설포트랜스퍼라제의 천연의 활성은 항응고제 다당류의 시험관내 화학효소 합성에 대해 급격한 장벽을 나타낸다.
아릴 설페이트 화합물, 예를 들어, p-니트로페닐 설페이트(PNS) 및 4-메틸움벨리페릴 설페이트(MUS)는 특정의 작은 분자 생성물을 합성하기 위한 매우 제한된 수의 설포트랜스퍼라제를 지닌 설포 공여체로서 유용할 수 있는 저렴하고, 광범위하게 이용가능한 화합물로서 확인되었다 (참조: Malojcic, G., et al. (2008) Proc. Nat. Acad. Sci. 105 (49):19217-19222 및 Kaysser, L., et al., (2010) J. Biol. Chem. 285 (17):12684-12694, 이들 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 아직까지는, 작은 수의 세균 설포트랜스퍼라제 만이 설포 그룹 공여체로서 아릴 설페이트 화합물과 반응하는 것으로 밝혀졌으며, 이들 중 어느 것도 설포 그룹 수용체로서, 헤파로산-계 다당류는 고사하고, 다당류와 반응하지 않는다. 그 결과, 설포트랜스퍼라제가 황산화된 다당류의 시험관내 합성에 사용되는 경우, 3'-포스포아데노신 5'-포스포설페이트는 반응 혼합물 속에 포함되어 설포 그룹 전달을 효과적으로 촉매하여야 하며, 아릴 설페이트 화합물은 3'-포스포아데노신 5'-포스포설페이트를 지닌 시스템을 재생시키도록 간접적으로만 사용될 수 있다 (참조: U.S. Pat. No. 6,255,088, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다).
결과적으로, 설포 그룹 공여체로서 아릴 설페이트 화합물 뿐만 아니라 설포 그룹 수용체로서 다당류와 반응하는 설포트랜스퍼라제 효소를 개발할 필요성이 존재한다. 특히, 설포 그룹 공여체로서 아릴 설페이트 화합물과 반응하고 설포 그룹 수용체로서 헤파로산-계 다당류와 반응할 수 있는 설포트랜스퍼라제 효소의 개발이 시험관내에서 항응고제 다당류의 대규모 합성의 개발을 향한 큰 진보를 나타낼 수 있다.
본 발명은 기질로서 아릴 설페이트 화합물을 인식하여, 이에 결합하고 이와 반응할 수 있는 몇가지 가공된, 생물학적으로 활성인 효소를 제공한다. 본 발명에 따르면, 가공된 효소는 설파타제 활성을 가질 수 있다. 본 발명에 따르면, 가공된 효소는 설포트랜스퍼라제 활성을 가질 수 있다.
본 발명에 따르면, 설파타제 및/또는 설포트랜스퍼라제 활성을 가진 가공된 효소는 p-니트로페닐 설페이트 (PNS), 4-메틸움벨리페릴 설페이트, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 2-나프틸 설페이트(2NapS), 및 4-니트로카테콜 설페이트(NCS)로 이루어진 그룹으로부터 선택된 아릴 설페이트 화합물과 반응할 수 있다. 본 발명에 따르면, 가공된 설포트랜스퍼라제는 설포 그룹 공여체로서 PNS를 인식하여, 이에 결합하고, 이와 반응할 수 있다. 본 발명에 따르면, 가공된 설포트랜스퍼라제는 설포 그룹 공여체로서 NCS를 인식하여, 이에 결합하고, 이와 반응할 수 있다. 본 발명에 따르면, 가공된 설포트랜스퍼라제는 설포 그룹 공여체로서 PNS 또는 NCS를 인식하여, 이에 결합하고, 이와 반응할 수 있다.
본 발명의 양태에서, 본 발명의 가공된 효소는 설파타제 생물학적 활성을 가질 수 있다. 본 발명에 따르면, 설파타제 활성은 설페이트 그룹의 가수분해를 유발하고 활성 부위로부터 방향족 모이어티(moiety)를 방출시키는, 아릴 설페이트 화합물내 황 원자의 친핵성 공격을 포함한다. 본 발명에 따르면, 황 원자의 친핵성 공격은 가공된 효소의 활성 부위내 아미노산 잔기, 특히 히스티딘 잔기에 의해 개시될 수 있다. 본 발명에 따르면, 아릴 설페이트 화합물과의 반응은 설포히스티딘 중간체를 생성할 수 있고, 여기서 설페이트 그룹은 아미노산 친핵체, 특히 히스티딘 잔기에 공유결합으로 결합된다.
본 발명에 따르면, 설파타제 활성을 갖는 본 발명의 가공된 효소는 전형적으로 500개 이상의 아미노산 잔기, α-포르밀글리신이되도록 해독후 개질된 적어도 하나의 시스테인 또는 세린 잔기, 및 시스테인 또는 세린의 α-포르밀글리신으로의 해독 후 개질을 지시하는, 하나 이상의 특징적인 표시 서열, C/S-X-P-S/X-R-X-X-X-L/X-T/X-G/X-R/X 또는 G-Y/V-X-S/T-X-X-X-G-K-X-X-H를 갖는 다른 공지된 설파타제와 상이하다. 따라서, 본 발명에 따르면, 설파타제 활성을 갖는 가공된 효소는 500개 미만의 아미노산 잔기를 가질 수 있다. 본 발명에 따르면, 설파타제 활성을 갖는 가공된 효소는 0개(zero)의 α-포르밀글리신 잔기를 가질 수 있다. 본 발명에 따르면, 설파타제 활성을 갖는 가공된 효소는 C/S-X-P-S/X-R-X-X-X-L/X-T/X-G/X-R/X 또는 G-Y/V-X-S/T-X-X-X-G-K-X-X-H를 포함하는 아미노산 서열 모티프(motif)를 가지지 않을 수 있다.
본 발명에 따르면, 설파타제 활성을 갖는 본 발명의 가공된 효소는 아릴 설페이트 화합물의 친핵성 공격이 활성 부위 아미노산 잔기, 바람직하게는 히스티딘 잔기에 의해 개시되는 한, 임의의 아미노산 서열을 포함할 수 있다. 본 발명에 따르면, 설파타제 활성을 갖는 가공된 효소는 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 및 서열 번호: 151로 이루어진 그룹으로부터 선택된 아미노산 서열을 가질 수 있다. 본 발명에 따르면, 설파타제 활성을 갖는 가공된 효소는 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 66, 서열 번호: 68, 서열 번호: 69, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160으로 이루어진 그룹으로부터 선택된 아미노산 서열을 가질 수 있다. 본 발명에 따르면, 설파타제 활성을 갖는 가공된 효소는 상기 임의의 아미노산 서열과 생물학적 등가물인 임의의 아미노산 서열을 포함할 수 있다.
본 발명의 다른 양태에서, 본 발명의 가공된 효소는 설포트랜스퍼라제 생물학적 활성을 가질 수 있다. 본 발명에 따르면, 설포트랜스퍼라제 활성은 아릴 설페이트 화합물로부터 설포 그룹의 설포 그룹 수용체로의 효소적 전달을 포함한다. 본 발명에 따르면, 설포 그룹 수용체는 다당류일 수 있다. 본 발명에 따르면, 설포 그룹 수용체 다당류는 헤파로산-계 다당류일 수 있다. 본 발명에 따르면, 헤파로산-계 다당류는 N-탈아세틸화된 헤파로산일 수 있다. 본 발명에 따르면, 헤파로산-계 다당류는 N-황산화된 헤파로산일 수 있다. 본 발명에 따르면, 헤파로산-계 다당류는 N-황산화된, 2-O 황산화된 헤파란 설페이트(N,2O-HS)일 수 있다. 본 발명에 따르면, 헤파로산-계 다당류는 N-황산화된, 2-O 황산화된, 6-O 황산화된 헤파란 설페이트(N,2O,6O-HS)일 수 있다. 본 발명에 따르면, 헤파로산-계 다당류는 N-황산화된, 2-O 황산화된, 3-O 황산화된, 6-O-황산화된 헤파란 설페이트 (N,2O,3O,6O-HS)일 수 있다. 본 발명에 따르면, 헤파로산-계 다당류는 헤파로산-계 다당류를 포함하는 임의의 이당류 단위내에서, 임의의 N-, 2-O, 3-O, 및/또는 6-O 위치에서 황산화될 수 있다. 본 발명에 따르면, 헤파로산-계 다당류는 글루쿠론산 잔기 대신에 치환된 하나 이상의 이두론산 잔기를 포함할 수 있다. 본 발명에 따르면, 이두론산 잔기 중 하나 이상은 2-O 황산화될 수 있다.
본 발명에 따르면, 가공된 설포트랜스퍼라제 효소에 의해 촉매된 설포전달 반응은 설포히스티딘 중간체가 효소와 아릴 설페이트 사이의 반응에 이어, 활성 부위내에서 헤파로산-계 다당류의 결합, 및 설포히스티딘 중간체로부터 다당류로 설포 그룹의 후속적인 전달에 의해 먼저 형성된다. 대안적으로, 본 발명에 따르면, 가공된 설포트랜스퍼라제 효소에 의해 촉매된 설포전달 반응은 아릴 설페이트 화합물 및 헤파로산-계 다당류 둘 다가 활성 부위내에서 결합되는 반응 메카니즘을 통해 진행될 수 있고, 효소는 아릴 설페이트 화합물로부터 다당류로 설포 그룹의 직접적인 전달을 촉매한다.
본 발명에 따르면, 가공된 설포트랜스퍼라제 효소는 설포 그룹을 수용하는 헤파로산-계 다당류내 위치에 의해 특성화된 생물학적 활성, 예를 들면, 글루코사미닐 N-설포트랜스퍼라제 활성, 헥수로닐 2-O-설포트랜스퍼라제 활성, 글루코사미닐 6-O 설포트랜스퍼라제 활성, 또는 글루코사미닐 3-O-설포트랜스퍼라제 활성을 가질 수 있다. 각각의 설포트랜스퍼라제 생물학적 활성은 하기에 상세히 기술되어 있다.
본 발명의 양태에서, 가공된 설포트랜스퍼라제 효소는 아릴 설페이트 화합물로부터 헤파로산-계 다당류내 비치환된 글루코사민 잔기의 N-위치로 설포 그룹의 전달을 포함하는, 글루코사미닐 N-설포트랜스퍼라제 활성을 가질 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 N-설포트랜스퍼라제는, 설포 그룹 공여체가 아릴 설페이트 화합물이고 설포 그룹 수용체가 헤파로산-계 다당류인 한, 임의의 아미노산 서열을 포함할 수 있다.
본 발명에 따르면, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 효소 부류(EC) 2.8.2.8의 구성원인, HS 글루코사미닐 N-설포트랜스퍼라제 활성을 갖는 천연의 설포트랜스퍼라제의 돌연변이체일 수 있다. 본 발명의 가공된 글루코사미닐 N-설포트랜스퍼라제 효소와는 대조적으로, EC-2.8.2.8 내 천연 효소 는 아릴 설페이트 화합물과 반응하지 않으며, 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트와만 반응한다. 그러나, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 설포 그룹 수용체로서 헤파로산-계 다당류를 지닌 EC 2.8.2.8 내 천연 효소 와 동일한 생물학적 활성을 보유할 수 있다. 본 발명에 따르면, 임의의 가공된 글루코사미닐 N-설포트랜스퍼라제 효소를 지닌 설포 수용체로서 이용될 수 있는 헤파로산-계 다당류는 하기 화학식 II의 구조를 갖는 하나 이상의 이당류 단위를 포함할 수 있다:
[화학식 II]
Figure pct00001
상기 화학식 II에서,
n은 정수이고, R은 수소 원자 또는 설포 그룹으로 이루어진 그룹으로부터 선택된다. 본 발명에 따르면, 이당류내 R 그룹 둘 다는 수소 원자일 수 있다. 본 발명에 따르면, 동일한 다당류 분자내 R 그룹 모두는 수소 원자일 수 있다. 설포 수용체 다당류가 화학식 II의 구조를 포함하는 경우, 아릴 설페이트 화합물로부터 설포 그룹의 전딜시, 황산화된 다당류 생성물은 하기 화학식 III의 구조를 포함한다:
[화학식 III]
Figure pct00002
상기 화학식 III에서,
n은 정수이고 R은 수소 원자 또는 설포 그룹으로 이루어진 그룹으로부터 선택된다.
본 발명에 따르면, 설포 그룹을 수용하는 글루코사민 잔기가 상기 화학식 II 및 화학식 III에 나타낸 바와 같이, N-치환되지만, 동일한 다당류 분자내 다른 글루코사민 잔기는 N-아세틸화, N-황산화, 또는 N-비치환된, 3-O 황산화, 및/또는 6-O 황산화될 수 있다. 유사하게, 설포 그룹을 수용하는 글루코사민 잔기에 인접하지 않은 다당류내 다른 위치에서 헥수론산 잔기는 글루쿠론산 또는 이두론산 잔기일 수 있고, 이들 중 어느 것도 임의로 2-O-황산화될 수 있다. 본 발명에 따르면, 및 일부 바람직한 구현예에서, 헤파로산-계 다당류는 N-탈아세틸화된 헤파로산일 수 있고, 여기서 글루코사민 잔기 모두는 N-비치환되거나, N-아세틸글루코사민과 N-비치환된 글루코사민의 혼합물로서 존재한다.
본 발명에 따르면, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 설포 그룹 공여체로서 아릴 설페이트 화합물과 결합하고 반응할 수 있는 단일의 N-설포트랜스퍼라제 도메인으로 이루어질 수 있다. 그러나, EC 2.8.2.8내의 대부분의 천연 효소 는 이중 N-데아세틸라제/N-설포트랜스퍼라제 활성을 가지며, 하나의 도메인은 N-데아세틸라제 활성에 대해 구조적으로 구성되고 다른 도메인은 N-설포트랜스퍼라제 활성에 대해 구조적으로 구성된다. 따라서, 본 발명에 따르면, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 임의의 EC 2.8.2.8 효소의 N-데아세틸라제 도메인에 대해 동일하거나 돌연변이된 아미노산 서열을 갖는 N-데아세틸라제 도메인을 포함할 수 있다.
설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트와의 이의 전적인 반응성을 촉진하기 위하여, 천연의 EC 2.8.2.8 효소는 전형적으로 활성 부위를 정의하고 효소 인식, 결합, 및 3'-포스포아데노신 5'-포스포설페이트와의 반응성을 지배하는 고도로 보존되거나 동일한 아미노산 서열을 포함한다. 본 발명에 따르면, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소의 아미노산 서열은 천연의 EC 2.8.2.8 효소에 대해 하나 이상의 돌연변이를 포함함으로써 3'-포스포아데노신 5'-포스포설페이트 대신 아릴 설페이트 화합물의 결합을 촉진할 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 EC 2.8.2.8 내 천연 효소의 N-설포트랜스퍼라제 도메인에 대해 적어도 하나의 아미노산 돌연변이, 예를 들면, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50개, 적어도 100개 이하의 아미노산 돌연변이를 갖는 아미노산 서열을 포함할 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 효소의 활성 부위를 정의하는 것으로 알려진 영역내에서 EC 2.8.2.8 내 임의의 천연 효소 의 아미노산 서열에 대하여 적어도 하나의 아미노산 돌연변이, 예를 들면, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15개 아미노산 돌연변이, 적어도 20개 이하의 아미노산 돌연변이를 포함할 수 있다.
본 발명에 따르면, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소의 아미노산 서열은 EC 2.8.2.8 내 천연 효소 중 하나 이상의 아미노산 서열 및 예를 들면, 이의 생물학적 기능성 단편에 대해, 특히, EC 2.8.2.8 내 천연 효소 중 하나 이상의 N-설포트랜스퍼라제 도메인에 대해 "동일성 퍼센트" 또는 "동일성%"로서 나타낼 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 EC 2.8.2.8 내 임의의 효소의 N-설포트랜스퍼라제와 적어도 50% 서열 동일성, 및 적어도 97% 이하의 서열 동일성을 가질 수 있다. 본 발명에 따르면, 이러한 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 또한 EC 2.8.2.8 내 임의의 효소와 동일한 N-데아세틸라제 도메인을 가지거나 이에 대해 하나 이상의 아미노산 돌연변이를 함유할 수 있다.
본 발명에 따르면, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 EC 2.8.2.8 내 하나 이상의 천연 효소에서 발견된 보존된 아미노산 서열 모티프에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 각각의 돌연변이된 아미노산 서열 모티프는, 존재하는 경우, EC-2.8.2.8 내 천연 효소 내 상응하는 보존된 아미노산 서열 모티프에 대해 적어도 하나의 아미노산 돌연변이를 가질 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 다음의 보존된 글루코사미닐 N-설포트랜스퍼라제 아미노산 서열 모티프: (Q-K-T-G-T-T-A-L-Y-L), (T-F-E-E), (F-E-K-S-A), (S-W-Y-Q-H, 및 (C-L-G-K/R-S-K-G-R)에 대해 1, 2, 3, 4, 또는 5개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 돌연변이된 아미노산 서열 모티프의 비-제한적인 예는 하기에 추가로 상세히 기술된다.
본 발명에 따르면, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 및 서열 번호: 25로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있고, 이들 각각은 EC 2.8.2.8 내 천연 효소 의 N-설포트랜스퍼라제 도메인을 정의하는 고도로 보존된 아미노산 서열에 대해 이루어진 몇가지 아미노산 돌연변이를 함유한다. 본 발명에 따르면, 본원에 기술된 임의의 방법에 따라 이용된 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 또한 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 및 서열 번호: 25 로 이루어진 그룹으로부터 선택된 아미노산 서열의 동일한 등가물, 및/또는 이의 기능성 단편인 임의의 아미노산 서열을 포함할 수 있다.
본 발명에 따르면, 상술된 임의의 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 및 서열 번호: 25로 이루어진 그룹으로부터 선택된 아미노산 서열에 의해 개시된 아미노산 서열과 비교하여 하나 이상의 잔기 차이 또는 돌연변이를 지닐 수 있다. 이러한 잔기 차이의 비-제한적 예는 아미노산 삽입, 결실, 치환, 또는 이러한 변화의 임의의 조합을 포함한다. 본 발명에 따르면, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 및 서열 번호: 25로 이루어진 그룹으로부터 선택된 아미노산 서열내 개시된 아미노산 서열로부터의 차이는 비-보존적 치환, 보존적 치환 뿐만 아니라, 보존적 및 비-보존적 아미노산 치환의 조합을 포함할 수 있다. 본 발명에 따르면, 아미노산 돌연변이는, 돌연변이 효소가 설포 그룹 공여체로서 아릴 설페이트 화합물 및 설포 그룹 수용체로서 화학식 II의 구조를 포함하는 헤파로산-계 다당류와 이의 글루코사미닐 N-설포트랜스퍼라제 활성을 유지하는 한, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 및 서열 번호: 25 내 임의의 위치에서 이루어질 수 있다.
본 발명에 따르면, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 서열 번호: 18의 아미노산 서열을 포함할 수 있다. 서열 번호: 18 내에서, 정의 "Xaa"를 갖는 잔기는 서열 번호: 5, 서열 번호: 7, 및 서열 번호: 15의 아미노산 서열 내 특수한 위치에서 동일성의 결여가 존재하는 공지된 예를 나타낸다. 따라서, "Xaa"는 이러한 위치에서의 아미노산이 서열 번호: 18로 정의된 바와 같은, 2개 이상의 아미노산의 그룹으로부터 선택될 수 있음을 나타낸다.
본 발명에 따르면, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 서열 번호: 19의 아미노산 서열을 포함할 수 있다. 서열 번호: 19 내에서, 정의 "Xaa"를 갖는 잔기는 서열 번호: 9, 서열 번호: 11, 및 서열 번호: 13의 아미노산 서열 내 특수한 위치에서 동일성의 결여가 존재하는 공지된 예를 나타낸다. 따라서, "Xaa"는 이러한 위치에서의 아미노산이 서열 번호: 19로 정의된 바와 같은, 2개 이상의 아미노산의 그룹으로부터 선택될 수 있음을 나타낸다.
또한, 본 발명에 따르면, 아미노산 돌연변이는, 돌연변이된 효소가 설포 그룹 공여체로서 아릴 설페이트 화합물과 함께 이의 글루코사미닐 N-설포트랜스퍼라제 활성을 유지하는 한, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 및 서열 번호: 25 내 하나 이상의 위치에서 이루어질 수 있다. 본 발명에 따르면, 서열 번호: 18 또는 서열 번호: 19의 아미노산 서열을 포함하는 아릴 설페이트-의존성 효소는 "Xaa"로 지정되지 않은 위치에서 하나 이상의 아미노산 돌연변이를 임의로 포함할 수 있지만, 설포 그룹 공여체로서 아릴 설페이트 화합물과 함께 이의 글루코사미닐 N-설포트랜스퍼라제 활성을 여전히 보유한다.
본 발명의 양태에서, 가공된 설포트랜스퍼라제 효소는 아릴 설페이트 화합물로부터 헤파로산-계 다당류 내 헥수론산 잔기의 2-O-위치로 설포 그룹의 전달을 포함하는 헥수로닐 2-O 설포트랜스퍼라제 활성을 가질 수 있다. 본 발명에 따르면, 가공된 헥수로닐 2-O 설포트랜스퍼라제는, 설포 그룹 공여체가 아릴 설페이트 화합물이고 설포 그룹 수용체가 헤파로산-계 다당류인 한, 임의의 아미노산 서열을 포함할 수 있다.
본 발명에 따르면, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 효소 부류 (EC) 2.8.2.-의 구성원인, HS-헥수로닐 2-O 설포트랜스퍼라제 활성을 갖는 천연의 설포트랜스퍼라제의 돌연변이체일 수 있다. 본 발명의 가공된 헥수로닐-2-O 설포트랜스퍼라제 효소와는 대조적으로, EC 2.8.2.- 내 천연의 헥수로닐 2-O-설포트랜스퍼라제 효소는 아릴 설페이트 화합물과 반응하지 않고, 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트와만 반응한다. 그러나, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 설포 그룹 수용체로서 헤파로산-계 다당류를 지닌 EC 2.8.2.- 내 천연의 헥수로닐 2-O 설포트랜스퍼라제 효소와 동일한 생물학적 활성을 보유할 수 있다. 본 발명에 따르면, 임의의 가공된 헥수로닐 2-O-설포트랜스퍼라제 효소와 함께 설포 수용체로서 이용될 수 있는 헤파로산-계 다당류는 하기 구조식 IV의 구조를 갖는 하나 이상의 구조적 모티프를 포함할 수 있다:
[화학식 IV]
Figure pct00003
화학식 IV에 나타낸 바와 같이, 헥수론산 잔기는 글루쿠론산이다. 본 발명에 따르면, 및 다른 비-제한적 예에서, 헥수론산 잔기가 이두론산인 경우, 헤파로산-계 다당류는 하기 화학식 V의 구조를 포함한다:
[화학식 V]
Figure pct00004
.
본 발명에 따르면, 헤파로산-계 다당류가 화학식 IV의 구조를 포함하는 경우, 2-O 황산화된 다당류 생성물은 하기 화학식 VI의 구조를 포함한다:
[화학식 VI]
Figure pct00005
.
본 발명에 따르면, 헤파로산-계 다당류가 화학식 V의 구조를 포함하는 경우, 2-O 황산화된 다당류 생성물은 하기 화학식 VII의 구조를 포함한다:
[화학식 VII]
Figure pct00006
.
본 발명에 따르면, 화학식 IV 또는 화학식 V의 구조를 포함하는 헤파로산-계 다당류는 N-황산화된 헤파로산일 수 있다. 본 발명에 따르면, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소에 대한 설포 그룹 수용체는 화학식 IV 및/또는 화학식 V의 구조를 포함하는 다수의 모티프를 포함할 수 있고, 이들 중 임의의 것 또는 모두는 효소에 의해 황산화될 수 있다. 본 발명에 따르면, 및 상기 화학식 IV 및 화학식 V에 나타낸 바와 같이, 설포 그룹을 수용하는 헥수론산에 인접한 글루코사민 잔기 둘 다는 N-황산화되어 있다. 본 발명에 따르면, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소에 대한 설포 그룹 수용체는 상술한, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소의 황산화된 다당류 생성물일 수 있다. 본 발명에 따르면, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소에 의해 형성되고 화학식 VI 및/또는 화학식 VII의 구조(들)를 포함하는 황산화된 다당류 생성물은 N,2O-HS 생성물이다.
본 발명에 따르면, 설포 그룹을 수용하는 헥수론산 잔기에 인접하지 않은 다당류내 글루코사민 잔기는 임의로 N-, 3-O, 및/또는 6-O 황산화되거나, N-아세틸화되거나, N-비치환될 수 있다. 유사하게, 설포 그룹을 수용하는 글루코사민 잔기에 인접하지 않은 다당류내 다른 위치에서 헥수론산 잔기는 글루쿠론산 또는 이두론산 잔기일 수 있고, 이들 중 임의의 것은 임의로 2-O-황산화될 수 있다.
본 발명에 따르면, 화학식 IV 및/또는 화학식 V의 구조를 포함하는 다당류는 글루쿠로닐 C5-에피머라제 효소와 반응하여 C5-탄소의 입체화학을 역으로 전환시킴으로써 글루쿠론산으로부터 이두론산(iduronic acid)을 형성하고, 이의 역도 가능하다. 그러나, 헥수론산 잔기가 2-O 황산화되면, 이는 또한 글루쿠로닐 C5-에피머라제와 더 이상 반응하지 않을 수 있다. 일부 바람직한 구현예에서, 글루쿠로닐 C5-에피머라제 효소를 사용하여 화학식 III의 구조를 포함하는 N-황산화된 헤파로산 다당류내 헥수론산 잔기의 입체화학을 역전시키고 헥수로닐 2-O 설포트랜스퍼라제 효소와 반응하기 전에, 화학식 V의 구조를 포함하는 구조적 모티프를 형성할 수 있다. 본 발명에 따르면, 글루쿠로닐 C5-에피머라제 효소는 서열 번호: 67의 아미노산 서열, 바람직하게는 서열 번호: 67의 34 내지 617번 잔기를 포함할 수 있다. 본 발명에 따르면, 글루쿠로닐 C5-에피머라제 효소를 사용하여 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소와 반응시키기 전에, N-황산화된 헤파로산내 하나 이상의 글루쿠론산 잔기의 이두론산 잔기로의 전환을 촉매할 수 있다.
설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트와의 이의 전적인 반응성을 촉진시키기 위해, EC 2.8.2.- 내 천연의 헥수로닐 2-O 설포트랜스퍼라제 효소는 전형적으로 활성 부위를 정의하고 효소의 인식, 결합, 및 3'-포스포아데노신 5'-포스포설페이트와의 반응성을 정의하는 고도로 보존되거나 동일한 아미노산 서열을 포함할 수 있다. 본 발명에 따르면, 가공된 헥수로닐 2-O-설포트랜스퍼라제 효소의 아미노산 서열은 EC 2.8.2.- 내 하나 이상의 천연의 헥수로닐 2-O 설포트랜스퍼라제 효소에 대해 하나 이상의 돌연변이를 포함함으로써, 3'-포스포아데노신 5'-포스포설페이트 대신에 아릴 설페이트 화합물의 결합을 촉진할 수 있다. 본 발명에 따르면, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 EC 2.8.2.- 내 임의의 천연의 헥수로닐 2-O 설포트랜스퍼라제 효소에 대해 적어도 하나의 아미노산 돌연변이, 예를 들면, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 적어도 100개 이하의 아미노산 돌연변이를 갖는 아미노산 서열을 포함할 수 있다. 본 발명에 따르면, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 효소의 활성 부위를 정의하는 것으로 알려진 영역내에서, EC 2.8.2.- 내 임의의 천연의 헥수로닐 2-O 설포트랜스퍼라제 효소의 아미노산 서열에 대해 적어도 하나의 아미노산 돌연변이, 예를 들면, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15개의 아미노산 돌연변이, 적어도 20개 이하의 아미노산 돌연변이를 포함할 수 있다.
본 발명에 따르면, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소의 아미노산 서열은 이의 생물학적 기능성 단편을 포함하는, EC 2.8.2.- 내 천연의 헥수로닐 2-O 설포트랜스퍼라제 효소 중 하나 이상의 아미노산 서열에 대해 "동일성 퍼센트" 또는 "동일성%"로서 나타낼 수 있다. 본 발명에 따르면, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 EC 2.8.2.- 내 임의의 헥수로닐 2-O-설포트랜스퍼라제 효소와 적어도 50% 서열 동일성, 및 적어도 97% 이하의 서열 동일성을 가질 수 있다.
본 발명에 따르면, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 EC 2.8.2.- 내 하나 이상의 천연의 헥수로닐 2-O 설포트랜스퍼라제 효소에서 발견된 보존된 아미노산 서열 모티프에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 각각의 돌연변이된 아미노산 서열 모티프는, 존재하는 경우, EC 2.8.2.- 내 천연의 헥수로닐 2-O 설포트랜스퍼라제 효소 내에 상응하는 보존된 아미노산 서열 모티프에 대해 적어도 하나의 아미노산 돌연변이를 가질 수 있다. 본 발명에 따르면, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 다음의 보존된 헥수로닐 2-O 설포트랜스퍼라제 아미노산 서열 모티프: (R-V-P-K-T-A/G-S-T), (N-T-S/T-K-N), (Y-H-G-H), (F-L-R-F/H-G-D-D/N-F/Y), (R-R-K/R-Q-G), 및 (S-H-L-R-K/R-T)에 대해 1, 2, 3, 4, 5, 또는 6개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다.
본 발명에 따르면, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 서열 번호: 63, 서열 번호: 65, 서열 번호: 68, 및 서열 번호: 69로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있고, 이들 각각은 EC 2.8.2.- 내 천연의 헥수로닐 2-O 설포트랜스퍼라제 효소를 정의하는 고도로 보존된 아미노산 서열에 대해 이루어진 몇가지 아미노산 돌연변이를 함유한다. 본 발명에 따르면, 본원에 기술된 임의의 방법에 따라 사용된 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 또한 서열 번호: 63, 서열 번호: 65, 서열 번호: 68, 및 서열 번호: 69로 이루어진 그룹으로부터 선택된 아미노산 서열과 생물학적 등가물, 및/또는 이의 기능성 단편인 임의의 아미노산 서열을 포함할 수 있다.
본 발명에 따르면, 상술한 임의의 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 서열 번호: 63, 서열 번호: 65, 서열 번호: 68, 및 서열 번호: 69로 이루어진 그룹으로부터 선택된 아미노산 서열에 의해 개시된 아미노산 서열과 비교하여 하나 이상의 잔기 차이 또는 돌연변이를 지닐 수 있다. 이러한 잔기 차이의 비-제한적 예는 아미노산 삽입, 결실, 치환, 또는 이러한 변화의 임의의 조합을 포함한다. 본 발명에 따르면, 서열 번호: 63, 서열 번호: 65, 서열 번호: 68, 및 서열 번호: 69 로 이루어진 그룹으로부터 선택된 아미노산 서열 내 개시된 아미노산 서열로부터의 차이는 비-보존적 치환, 보존적 치환 뿐만 아니라, 보존적 및 비-보존적 아미노산 치환의 조합을 포함할 수 있다. 본 발명에 따르면, 아미노산 돌연변이는, 돌연변이된 효소가 설포 그룹 공여체로서 아릴 설페이트 화합물 및 설포 그룹 수용체로서 화학식 IV 및/또는 화학식 V의 구조를 포함하는 헤파로산-계 다당류를 지닌 이의 헥수로닐 2-O 설포트랜스퍼라제 활성을 보유하는 한, 서열 번호: 63, 서열 번호: 65, 서열 번호: 68, 또는 서열 번호: 69 내 임의의 위치에서 이루어질 수 있다.
본 발명의 양태에서, 가공된 설포트랜스퍼라제 효소는 아릴 설페이트 화합물로부터 헤파로산-계 다당류내 글루코사민 잔기의 6-O 위치로 설포 그룹의 전달을 포함하는, 글루코사미닐 6-O 설포트랜스퍼라제 활성을 가질 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 6-O-설포트랜스퍼라제는, 설포 그룹 공여체가 아릴 설페이트 화합물이고 설포 그룹 수용체가 헤파로산-계 다당류인 한, 임의의 아미노산 서열을 포함할 수 있다.
본 발명에 따르면, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 EC 2.8.2.-의 구성원인, 글루코사미닐-6-O-설포트랜스퍼라제 활성을 갖는 천연의 설포트랜스퍼라제의 돌연변이체일 수 있다. 본 발명의 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소와는 대조적으로, EC 2.8.2.- 내의 천연의 글루코사미닐 6-O-설포트랜스퍼라제 효소는 아릴 설페이트 화합물과 반응하지 않고, 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트와만 반응한다. 그러나, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 설포 그룹 수용체로서 헤파로산-계 다당류를 지닌, EC 2.8.2.- 내 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소와 동일한 생물학적 활성을 보유할 수 있다.
본 발명에 따르면, 6-O 위치에서 설포 그룹을 수용하는 글루코사민 잔기는 효소와 반응하기 전에, N-황산화, N-비치환, 및/또는 3-O 황산화될 수 있다. 본 발명에 따르면, 설포 수용체 다당류 내 임의의 다른 글루코사민 잔기는 임의로 N-, 3-O, 및/또는 6-O 황산화, N-아세틸화, 또는 N-비치환될 수 있다. 본 발명에 따르면, 헤파로산-계 다당류내 임의의 헥수론산 잔기, 예를 들어, 설포 그룹을 수용하는 글루코사민 잔기에 인접한 헥수론산 잔기는 임의로 이두론산 또는 글루쿠론산일 수 있고, 글루코사미닐 6-O 설포트랜스퍼라제 효소와 반응하기 전에, 임의로 2-O 황산화될 수 있다.
임의의 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소와 함께 설포 수용체로서 이용될 수 있는 헤파로산-계 다당류의 하나의 비-제한적 예는 하기 화학식 VIII의 구조를 갖는 하나 이상의 구조적 모티프를 포함하는 헤파로산-계 다당류이다:
[화학식 VIII]
Figure pct00007
상기 화학식 VIII에서,
X는 상기 화학식 VIII에 나타낸 임의의 헥수론산 잔기를 포함한다. 설포 수용체 다당류가 화학식 VIII의 구조를 포함하는 경우, 아릴 설페이트 화합물로부터의 설포 그룹의 전달 시, 황산화된 다당류 생성물은 하기 화학식 IX의 구조를 포함한다:
[화학식 IX]
Figure pct00008
상기 화학식 IX에서,
X는 상기 화학식 IX에 나타낸 임의의 헥수론산 잔기를 포함한다.
본 발명에 따르면, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소에 대한 설포 그룹 수용체는 화학식 VIII의 구조를 포함하는 다수의 구조적 모티프를 포함할 수 있고, 이들 중 임의의 것 또는 모두는 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소에 의해 황산화될 수 있다. 본 발명에 따르면, 설포 그룹 수용체는 N-탈아세틸화된 헤파로산일 수 있다. 본 발명에 따르면, 설포 그룹 수용체는 N-황산화된 헤파로산일 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 6-O-설포트랜스퍼라제에 대한 설포 그룹 수용체는 N,2O-HS일 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소에 대한 설포 그룹 수용체는 상술한, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소에 의해 형성된 황산화된 다당류 생성물일 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소에 대한 설포 그룹 수용체는 상술한, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소에 의해 형성된 황산화된 다당류 생성물일 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소의 황산화된 다당류 생성물은 N,2O,6O-HS 생성물이다.
설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트와의 이의 독점적인 반응성을 촉진하기 위하여, EC 2.8.2.- 내의 천연의 글루코사미닐 6-O-설포트랜스퍼라제 효소는 전형적으로 활성 부위를 정의하고 효소의 인식, 결합 및 3'-포스포아데노신 5'-포스포설페이트와의 반응성을 지배하는 고도로 보존되거나 동일한 아미노산 서열을 포함한다. 본 발명에 따르면, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소의 아미노산 서열은 EC 2.8.2.- 내 천연의 글루코사미닐 6-O-설포트랜스퍼라제 효소에 대해 하나 이상의 돌연변이를 포함함으로써, 3'-포스포아데노신 5'-포스포설페이트 대신에 아릴 설페이트 화합물의 결합을 촉진할 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 EC 2.8.2.- 내 임의의 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소에 대해 적어도 하나의 아미노산 돌연변이, 예를 들면, 적어도 2, 3, 4, 5, 6, 7, 8, 9, `0, 11, 12, 13, 14, 15, 20, 30, 40, 50, 적어도 100개 이하의 아미노산 돌연변이를 갖는 아미노산 서열을 포함할 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 효소의 활성 부위를 정의하는 것으로 알려진 영역 내, EC 2.8.2.- 내 임의의 천연의 글루코사미닐 6-O-설포트랜스퍼라제 효소의 아미노산에 대해 적어도 하나의 아미노산 돌연변이, 예를 들면, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15개 아미노산 돌연변이, 적어도 20개 이하의 아미노산 돌연변이를 포함할 수 있다.
본 발명에 따르면, 가공된 글루코사미닐 6-O- 설포트랜스퍼라제 효소의 아미노산 서열은 EC 2.8.2.- 내 천연의 글루코사미닐 6-O-설포트랜스퍼라제 효소 중 하나 이상의 아미노산 서열에 대해, 특히 EC 2.8.2.- 내 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소의 하나 이상의 아미노산 서열에 대해, 및 이의 생물학적 기능성 단편을 포함하여, "동일성 퍼센트" 또는 "동일성%"로 나타낼 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 EC-2.8.2.- 내 임의의 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소와 적어도 50% 서열 동일성, 및 적어도 97% 이하의 서열 동일성을 가질 수 있다.
본 발명에 따르면, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 EC 2.8.2.- 내 하나 이상의 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소에서 발견된 보존된 아미노산 서열 모티프에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 각각의 돌연변이된 아미노산 서열 모티프는, 존재하는 경우, EC-2.8.2.- 내 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소 내 상응하는 보존된 아미노산 서열 모티프에 대해 적어도 하나의 아미노산 돌연변이를 가질 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 다음의 보존된 글루코사미닐 6-O 설포트랜스퍼라제 아미노산 서열 모티프: (Q-K-T-G-G-T), (C-G-L-H-A-D), (L-R-D-V-P-S), (S-E-W-R/K-H-V-Q-R-G-A-T-W-K), 또는 (L-T-E-F/Y-Q)에 대해 1, 2, 3, 4, 또는 5개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 돌연변이된 아미노산 서열 모티프의 비-제한된 예는 하기에 추가로 상세히 기술되어 있다.
본 발명에 따르면, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 및 서열 번호: 122로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있고, 이들 각각은 EC 2.8.2.- 내 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소의 고도로 보존된 아미노산 서열에 대해 이루어진 수개의 아미노산 돌연변이를 함유한다. 본 발명에 따르면, 본원에 기술된 임의의 방법에 따라 사용된 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 또한 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 및 서열 번호: 122로 이루어진 그룹으로부터 선택된 아미노산 서열의 생물학적 등가물, 및/또는 이의 기능적 단편인 임의의 아미노산 서열을 포함할 수 있다.
본 발명에 따르면, 상술된 임의의 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 및 서열 번호: 122로 이루어진 그룹으로부터 선택된 아미노산 서열에 의해 개시된 아미노산 서열과 비교하여 하나 이상의 잔기 차이 또는 돌연변이를 지닐 수 있다. 이러한 잔기 차이의 비-제한적 예는 아미노산 삽입, 결실, 치환, 또는 이러한 변화의 임의의 조합을 포함한다. 본 발명에 따르면, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 및 서열 번호: 122로 이루어진 그룹으로부터 선택된 아미노산 서열내 개시된 아미노산 서열로부터의 차이는 비-보존적 치환, 보존적 치환 뿐만 아니라, 보존적 및 비-보존적 아미노산 치환의 조합을 포함할 수 있다. 본 발명에 따르면, 아미노산 돌연변이는, 돌연변이된 효소가 설포 그룹 공여체로서 아릴 설페이트 화합물 및 설포 그룹 수용체로서 상술한 임의의 헤파로산-계 다당류와 함께 이의 과 함께 이의 글루코사미닐 6-O 설포트랜스퍼라제 활성을 보유하는 한, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 및 서열 번호: 122내 임의의 위치에서 이루어질 수 있다.
본 발명에 따르면, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 서열 번호: 112의 아미노산 서열을 포함할 수 있다. 서열 번호: 112 내에서, 명칭, "Xaa"를 가진 잔기는 서열 번호: 104, 서열 번호: 106, 및 서열 번호: 108의 아미노산 서열 내 특수한 위치에서 동일성의 결여가 있는 공지된 예를 나타낸다. 따라서, "Xaa" 명칭은 서열 번호: 112로 정의된 바와 같은 2개 이상의 아미노산의 그룹으로부터 선택될 수 있는 위치에서의 아미노산을 나타낸다.
본 발명에 따르면, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 서열 번호: 113의 아미노산 서열을 포함할 수 있다. 본 발명에 따르면, 서열 번호: 113 내에서, 명칭, "Xaa"를 갖는 잔기는 서열 번호: 104, 서열 번호: 106, 및 서열 번호: 108의 아미노산 서열 내 특수한 위치에서 동일성의 결여가 존재하는 공지된 예를 나타낸다. 본 발명에 따르면, 서열 번호: 113은 비-제한적인 예로서, 마우스, 사람, 및 돼지 글루코사미닐 6-O 설포트랜스퍼라제 효소를 포함하는, EC 2.8.2.- 내 수개의 완전한 길이의 글루코사미닐 6-O 설포트랜스퍼라제 효소의 N-말단 잔기 1-66, 및 C-말단 잔기 378-411를 포함한다. 따라서, "Xaa" 명칭은 서열 번호: 113으로 정의된 바와 같은 2개 이상의 아미노산의 그룹으로부터 선택될 수 있는 위치에서의 아미노산을 나타낸다.
또한, 본 발명에 따르면, 아미노산 돌연변이는, 돌연변이된 효소가 설포 그룹 공여체로서 아릴 설페이트 화합물과 함께 이의 글루코사미닐 6-O 설포트랜스퍼라제 활성을 보유하는 한, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 및 서열 번호: 122 내 하나 이상의 위치에서 이루어질 수 있다. 본 발명에 따르면, 서열 번호: 132 또는 서열 번호: 133 의 아미노산 서열을 포함하는 아릴 설페이트-의존성 효소는 "Xaa"로 지정되지 않은 위치에서 하나 이상의 아미노산 돌연변이를 임의로 포함할 수 있으나, 설포 그룹 공여체로서 아릴 설페이트 화합물과 함께 이의 글루코사미닐 6-O 설포트랜스퍼라제 활성을 여전히 보유한다.
본 발명의 양태에서, 가공된 설포트랜스퍼라제 효소는 아릴 설페이트 화합물로부터 헤파로산-계 다당류 내 글루코사민 잔기의 3-O 위치로 설포 그룹의 전달을 포함하는 글루코사미닐 3-O 설포트랜스퍼라제 활성을 갖는다. 본 발명에 따르면, 가공된 글루코사미닐 3-O-설포트랜스퍼라제는, 설포 그룹 공여체가 아릴 설페이트 화합물이고 설포 그룹 수용체가 헤파로산-계 다당류인 한, 임의의 아미노산 서열을 포함할 수 있다.
본 발명에 따르면, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 EC 2.8.2.23의 구성원인, HS 글루코사미닐 3-O-설포트랜스퍼라제 활성을 갖는 천연의 설포트랜스퍼라제의 돌연변이체일 수 있다. 본 발명의 가공된 글루코사미닐-3-O-설포트랜스퍼라제 효소와는 대조적으로, EC 2.8.2.23 내 천연의 글루코사미닐 3-O-설포트랜스퍼라제 효소는 아릴 설페이트 화합물과 반응하지 않고, 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트와만 반응한다. 그러나, 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소는 설포 그룹 수용체로서 헤파로산-계 다당류를 지닌 EC 2.8.2.23 내 천연의 글루코사미닐 3-O 설포트랜스퍼라제 효소와 동일한 생물학적 활성을 보유한다.
본 발명에 따르면, 3-O 위치에서 설포 그룹을 수용할 수 있는 헤파로산-계 다당류 내 글루코사민 잔기는 N-황산화되어 있고, 6-O 설포 그룹을 또한 임의로 포함할 수 있다. 본 발명에 따르면, 설포 수용체 다당류 내 임의의 다른 글루코사민 잔기는 임의로 N-, 3-O, 및/또는 6-O 황산화되거나, N-아세틸화되거나, N-비치환될 수 있다. 본 발명에 따르면, 헤파로산-계 다당류 내 글루코사민 잔기 중 하나 이상, 예를 들어, 3-O 황산화된 글루코사민 잔기는 N-황산화되고 6-O 황산화될 수 있다. 본 발명에 따르면, 3-O 황산화된 글루코사민 잔기는 비-환원 말단에서 황산화되지 않은 글루쿠론산 잔기 및 환원 말단에서 이두론산 잔기에 인접할 수 있다. 본 발명에 따르면, 3-O 황산화된 글루코사민 잔기의 환원 말단에서 이두론산 잔기는 임의로 2-O 황산화될 수 있다. 본 발명에 따르면, 글루코사미닐 3-O 설포트랜스퍼라제에 대한 설포 그룹 수용체로서 작용하는 헤파로산-계 다당류 내 임의의 다른 헥수론산 잔기는 임의로 이두론산 또는 글루쿠론산일 수 있고, 임의로 2-O 황산화될 수 있다. 임의의 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소와 함께 설포 수용체로서 이용될 수 있는 헤파로산-계 다당류의 하나의 비-제한적 예는 하기 화학식 X의 구조를 갖는 하나 이상의 구조적 모티프를 포함하는 헤파로산-계 다당류이다:
[화학식 X]
Figure pct00009
상기 화학식 X에서,
X는 설포 그룹 또는 아세테이트 그룹이고 Y는 설포 그룹 또는 하이드록실 그룹이다. 본 발명에 따르면, 일부 바람직한 구현예에서, X는 설포 그룹일 수 있고 Y는 설포 그룹일 수 있다. 헤파로산-계 다당류가 화학식 X의 구조를 포함하는 경우, 3-O 황산화된 다당류 생성물은 하기 화학식 I의 구조를 포함한다:
[화학식 I]
Figure pct00010
상기 화학식 I에서,
X는 설포 그룹 또는 아세테이트 그룹이고 Y는 설포 그룹 또는 하이드록실 그룹이다. 본 발명에 따르면, 일부 바람직한 구현예에서, X는 설포 그룹일 수 있고 Y는 설포 그룹일 수 있다. 본 발명에 따르면, 화학식 I의 구조를 포함하고, 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소와의 반응시 형성된 N,2O,3O,6O-HS 생성물은 항응고 활성을 가질 수 있다. N,2O,3O,6O-HS 다당류의 항응고 활성은 하기에 추가로 상세히 기술되어 있다.
본 발명에 따르면, 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소에 대한 설포 그룹 수용체는 화학식 X의 구조를 포함하는 다수의 구조적 모티프를 포함할 수 있고, 이들 중 임의의 것 또는 모두는 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소에 의해 황산화될 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 3-O-설포트랜스퍼라제에 대한 설포 그룹 수용체는 N,2O,6O-HS일 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소에 대한 설포 그룹 수용체는 상술한 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소에 의해 형성된 황산화된 다당류 생성물일 수 있다.
설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트와의 이의 전적인 반응성을 촉진하기 위하여, EC 2.8.2.23 내 천연의 글루코사미닐 3-O-설포트랜스퍼라제 효소는 전형적으로 활성 부위를 정의하고 효소의 인식, 결합, 및 3'-포스포아데노신 5'-포스포설페이트와의 반응성을 지배하는 고도로 보존되거나 동일한 아미노산 서열을 포함한다. 본 발명에 따르면, 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소의 아미노산 서열은 EC 2.8.2.23 내 천연의 글루코사미닐 3-O-설포트랜스퍼라제 효소에 대해 하나 이상의 돌연변이를 포함함으로써, 3'-포스포아데노신 5'-포스포설페이트대신 아릴 설페이트 화합물의 결합을 촉진할 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소는 효소의 활성 부위를 정의하는 것으로 알려진 영역내, EC 2.8.2.23 내 임의의 천연의 글루코사미닐 3-O 설포트랜스퍼라제 효소의 아미노산 서열에 대해 적어도 하나의 아미노산 돌연변이, 예를 들면, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15개, 적어도 20개 이하의 아미노산 돌연변이를 포함할 수 있다.
본 발명에 따르면, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소의 아미노산 서열은 EC 2.8.2.23 내 천연의 글루코사미닐 3-O 설포트랜스퍼라제 효소 중 하나 이상의 아미노산 서열, 특히 EC 2.8.2.23 내 천연의 글루코사미닐 3-O 설포트랜스퍼라제 효소 중 하나 이상, 및 예를 들면, 이의 생물학적 기능성 단편에 대해, "동일성 퍼센트" 또는 "동일성 %"로서 나타낼 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 EC 2.8.2.23 내 임의의 천연의 글루코사미닐 3-O 설포트랜스퍼라제 효소와 적어도 50% 서열 동일성, 및 적어도 97% 이하의 서열 동일성을 가질 수 있다.
본 발명에 따르면, 이러한 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 EC 2.8.2.23 내 하나 이상의 천연의 글루코사미닐 3-O 설포트랜스퍼라제 효소에서 발견된 보존된 아미노산 서열 모티프에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 각각의 돌연변이된 아미노산 서열 모티프는, 존재하는 경우, EC-2.8.2.23 내 천연의 글루코사미닐 3-O 설포트랜스퍼라제 효소내 상응하는 보존된 아미노산 서열 모티프에 대해 적어도 하나의 아미노산 돌연변이를 가질 수 있다. 본 발명에 따르면, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 다음의 보존된 글루코사미닐 3-O 설포트랜스퍼라제 아미노산 서열 모티프: (G-V-R-K-G-G), (P-A/G-Y-F), (S-D-Y-T-Q-V), 또는 (Y-K-A)에 대해 1, 2, 3, 또는 4개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 돌연변이된 아미노산 서열 모티프의 비-제한적인 예는 하기에 추가로 상세히 기술된다.
본 발명에 따르면, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160 으로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있고, 이들 각각은 EC 2.8.2.23 내 천연의 글루코사미닐 3-O 설포트랜스퍼라제 효소의 고도로 보존된 아미노산 서열에 대해 이루어진 몇가지 아미노산 돌연변이를 함유한다. 본 발명에 따르면, 본원에 기술된 임의의 방법에 따라 이용된 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 또한 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160 으로 이루어진 그룹으로부터 선택된 아미노산 서열의 동일한 등가물, 및/또는 이의 기능성 단편인 임의의 아미노산 서열을 포함할 수 있다.
본 발명에 따르면, 상술된 임의의 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소는 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160 으로 이루어진 그룹으로부터 선택된 아미노산 서열에 의해 개시된 아미노산 서열과 비교하여 하나 이상의 잔기 차이 또는 돌연변이를 지닐 수 있다. 이러한 잔기 차이의 비-제한적 예는 아미노산 삽입, 결실, 치환, 또는 이러한 변화의 임의의 조합을 포함한다. 본 발명에 따르면, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160 으로 이루어진 그룹으로부터 선택된 아미노산 서열내 개시된 아미노산 서열로부터의 차이는 비-보존적 치환, 보존적 치환 뿐만 아니라, 보존적 및 비-보존적 아미노산 치환의 조합을 포함할 수 있다. 본 발명에 따르면, 아미노산 돌연변이는, 돌연변이 효소가 설포 그룹 공여체로서 아릴 설페이트 화합물 및 설포 그룹 수용체로서 상술한 헤파로산-계 다당류와 이의 글루코사미닐 3-O 설포트랜스퍼라제 활성을 유지하는 한, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160 내 임의의 위치에서 이루어질 수 있다.
본 발명에 따르면, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 서열 번호: 154의 아미노산 서열을 포함할 수 있다. 서열 번호: 154 내에서, 명칭 "Xaa"를 갖는 잔기는 서열 번호: 147, 서열 번호: 149, 및 서열 번호: 151의 아미노산 서열 내 특수한 위치에서 동일성의 결여가 존재하는 공지된 예를 나타낸다. 따라서, "Xaa" 명칭은 이러한 위치에서의 아미노산이 서열 번호: 112로 정의된 바와 같은, 2개 이상의 아미노산의 그룹으로부터 선택될 수 있음을 나타낸다.
또한, 본 발명에 따르면, 아미노산 돌연변이는, 돌연변이된 효소가 설포 그룹 공여체로서 아릴 설페이트 화합물과 이의 글루코사미닐 3-O 설포트랜스퍼라제 활성을 유지하는 한, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160 내 하나 이상의 위치에서 이루어질 수 있다. 본 발명에 따르면, 서열 번호: 154 의 아미노산 서열을 포함하는 아릴 설페이트-의존성 효소는 "Xaa"로서 지정되지 않은 위치에서 하나 이상의 아미노산 돌연변이를 임의로 포함할 수 있지만, 설포 그룹 공여체로서 아릴 설페이트 화합물과 함께 이의 글루코사미닐 3-O 설포트랜스퍼라제 활성을 여전히 보유한다.
다른 양태에서, 본 발명은 아릴 설페이트 화합물로부터의 설포 그룹을 다당류로 효소적으로 전달하여 황산화된 다당류 생성물을 형성시키는 방법을 제공한다. 본 발명에 따르면, 다당류는 헤파로산-계 다당류일 수 있다. 본 발명에 따르면, 아릴 설페이트 화합물로부터의 설포 그룹을 헤파로산-계 다당류로 효소적으로 전달하기 위한 방법은 다음의 단계를 포함할 수 있다: (a) 아릴 설페이트 화합물을 제공하는 단계; (b) 상술된 임의의 가공된 설포트랜스퍼라제 효소를 제공하는 단계로서, 여기서 가공된 설포트랜스퍼라제 효소는 설포 그룹 공여체로서 아릴 설페이트 화합물과 함께 생물학적 활성을 갖는 단계; (c) 헤파로산-계 다당류를 제공하는 단계; (d) 아릴 설페이트 화합물, 설포트랜스퍼라제 효소, 및 헤파로산-계 다당류를 반응 혼합물내로 조합하는 단계; 및 (e) 설포트랜스퍼라제 효소를 사용하여, 아릴 설페이트 화합물로부터 헤파로산-계 다당류로 설포 그룹을 전달함으로써, 황산화된 다당류 생성물을 형성시키는 단계. 본 발명에 따르면, 아릴 설페이트 화합물은 PNS, 4-메틸움벨리페릴 설페이트, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 2NapS, 및 NCS로 이루어진 그룹으로부터 선택될 수 있다. 본 발명에 따르면, 아릴 설페이트 화합물은 PNS일 수 있다. 본 발명에 따르면, 아릴 설페이트 화합물은 NCS일 수 있다.
본 발명에 따르면, 가공된 설포트랜스퍼라제는 상술한 임의의 가공된 글루코사미닐 N-설포트랜스퍼라제 효소, 바람직하게는 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 및 서열 번호: 25 를 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소일 수 있다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 헤파로산-계 다당류는 N-탈아세틸화된 헤파로산일 수 있다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 헤파로산-계 다당류는 화학식 II의 구조를 포함하는 하나 이상의 이당류 단위를 포함할 수 있다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 황산화된 다당류 생성물은 화학식 III의 구조를 포함한다.
본 발명에 따르면, 가공된 설포트랜스퍼라제는 임의의 상술된 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소, 바람직하게는 서열 번호: 65, 서열 번호: 66, 서열 번호: 67, 및 서열 번호: 69 로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소일 수 있다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 헤파로산-계 다당류는 N-황산화된 헤파로산일 수 있다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 헤파로산-계 다당류는 화학식 IV 및/또는 화학식 V의 구조를 포함하는 하나 이상의 구조적 모티프, 및 바람직하게는 화학식 V의 구조를 포함하는 적어도 하나의 구조적 모티프를 포함할 수 있다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 방법은 글루쿠로닐 C5-에피머라제, 바람직하게는 서열 번호: 67의 아미노산 서열, 및 보다 바람직하게는 서열 번호: 67의 잔기 34 내지 617을 포함하는 글루쿠로닐 C5-에피머라제를 제공하는 단계를 추가로 포함할 수 있다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 황산화된 다당류 생성물은 화학식 VI 및/또는 화학식 VII의 구조를 포함한다.
본 발명에 따르면, 가공된 설포트랜스퍼라제는 임의의 상술한 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소, 바람직하게는 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 및 서열 번호: 122 로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소일 수 있다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 헤파로산-계 다당류는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소에 대해 적합한 설포 수용체인 상술한 임의의 헤파로산-계 다당류일 수 있다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 헤파로산-계 다당류는 N,2O-HS일 수 있다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 헤파로산-계 다당류는 화학식 VIII의 구조를 포함하는 하나 이상의 구조적 모티프를 포함할 수 있다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 황산화된 다당류 생성물은 화학식 IX의 구조를 포함한다.
본 발명에 따르면, 가공된 설포트랜스퍼라제는 임의의 상술한 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소, 바람직하게는 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160으로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소일 수 있다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 헤파로산-계 다당류는 N,2O,6O-HS일 수 있다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 헤파로산-계 다당류는 화학식 X의 구조를 포함하는 하나 이상의 구조적 모티프를 포함할 수 있다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 황산화된 다당류 생성물은 화학식 I의 구조를 포함한다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 화학식 I의 구조를 포함하는 황산화된 다당류 생성물은 항응고 활성을 가질 수 있다.
본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 출발 물질 또는 황산화된 다당류 생성물로서 사용된 헤파로산-계 다당류를 포함하는 임의의 반응 혼합물 또는 조성물 내에서, 다당류는 다양한 측쇄, 분자량, N-아세틸화, 및/또는 N-, 2-O, 6-O, 또는 3-O 황산화를 갖는 다당류의 다분산성 혼합물일 수 있다. 대안적으로, 본 발명에 따르면, 상술된 임의의 다당류는 동일한 쇄 길이, 분자량, N-아세틸화, 및/또는 N-, 2-O, 6-O, 또는 3-O 황산화를 갖는 다당류로 구성된 균질한 조성물로서 존재할 수 있다.
본 발명에 따르면, 및 상기 양태 및 구현예 중 하나 이상과의 조합시 유용한, 기질로서 아릴 설페이트 화합물과 함께 설파타제 및/또는 설포트랜스퍼라제 활성을 갖는 본 발명의 가공된 효소는 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 66, 서열 번호: 68, 서열 번호: 69, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 서열 번호: 160 의 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 임의의 뉴클레오타이드 서열을 포함하는 핵산으로부터 발현될 수 있다. 본 발명에 따르면, 이러한 뉴클레오타이드 서열은 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 및 서열 번호: 152로 이루어진 그룹으로부터 선택될 수 있고, 이는 각각 아미노산 서열 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 또는 서열 번호: 151을 암호화한다. 당해 분야의 기술자는 상기 나열된 뉴클레오타이드 서열 및 목적한 가공된 효소의 동일성을 기반으로, 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 66, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160 의 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 적절한 뉴클레오타이드 서열을 결정할 수 있다.
본 발명에 따르면, 및 상기 양태 및 구현예 중 하나 이상과의 조합시 유용한, 상술한 임의의 가공된 효소를 암호화하는 뉴클레오타이드 서열을 포함하는 핵산을 발현 벡터를 보유하고 목적한 효소를 과발현하도록 구성된 생물학적 숙주 세포내로 삽입되도록 가공된 발현 벡터내로 삽입시킬 수 있다. 본 발명에 따르면, 발현 벡터내로 삽입된 핵산은 상술한 임의의 가공된 효소를 암호화하는 임의의 뉴클레오타이드 서열, 특히, 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 66, 서열 번호: 68, 서열 번호: 69, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160 의 아미노산 서열을 포함하는 것을 포함할 수 있다. 본 발명에 따르면, 발현 벡터내로 삽입된 핵산은 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 및 서열 번호: 152로 이루어진 그룹으로부터 선택된 임의의 뉴클레오타이드 서열을 포함할 수 있다.
본 발명에 따르면, 및 상기 양태 및 구현예 중 하나 이상과의 조합시 유용한, 발현 벡터는 본 발명의 가공된 효소의 생산을 보충하는 단백질 또는 숙주 인식 부위를 암호화하는 하나 이상의 핵산 서열 또는 유전자를 임의로 추가로 포함할 수 있다. 비-제한적 예는 프로모터 서열, 항생제 내성 유전자, 및 가공된 설포트랜스퍼라제 효소의 폴딩(folding) 및 안정성을 보조하는 융합 단백질을 암호화하는 유전자를 포함한다. 본 발명에 따르면, 상술된 임의의 발현 벡터는 말토즈 결합 단백질(MBP)를 암호화하는 에스케리키아 콜라이(Escherichia coli)로부터의 malE 유전자를 추가로 포함할 수 있다. 본 발명에 따르면, 상술한 임의의 발현 벡터는 작은 유비퀴틴-관련 개질제(small ubiquitin-related modifier)(SUMO) 단백질을 암호화하는 유전자, 바람직하게는 SUMO1 단백질을 암호화하는, SUMO1 유전자를 추가로 포함할 수 있다. 그 결과, 및 본 발명에 따르면, 단백질 발현이 개시되면, MBP 또는 SUMO 뿐만 아니라, 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 66, 서열 번호: 68, 서열 번호: 69, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160으로 이루어진 그룹으로부터 선택된 아미노산 서열을 갖는 가공된 효소를 포함하는 융합 단백질이 형성될 수 있다.
발현 벡터는 전형적으로 이로부터 효소가 과발현되어 추출될 수 있는 숙주 세포내로 형질전환된다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 하나 이상과의 조합시 유용한, 숙주 세포는 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 서열 번호: 152 로 나타낸 핵산 서열, 또는 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 66, 서열 번호: 68, 서열 번호: 69, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160의 아미노산 서열을 갖는 효소를 암호화하는 임의의 서열을 함유하는 발현 벡터로 형질전환될 수 있다. 본 발명에 따르면, 숙주 세포내로 형질전환된 임의의 상기 발현 벡터는 malE 또는 SUMO1 유전자를 추가로 포함할 수 있다. 본 발명에 따르면, 형질전환된 숙주 세포는 세균, 효모, 곤충, 또는 포유동물 세포일 수 있다. 본 발명에 따르면, 숙주 세포는 세균 세포일 수 있다. 본 발명에 따르면, 세균 세포는 에스케리키아 콜라이(이. 콜라이(E. coli))의 비-병원성 균주로부터 유래될 수 있다.
본 발명의 다른 양태에서, 상술된 임의의 방법에 따른, 황산화된 다당류 생성물, 특히 항응고제 N,2O,3O,6O-HS 생성물을 형성하기 위한 키트(kit)가 제공된다. 본 발명에 따르면, 키트는 적어도 하나의 가공된 아릴 설페이트-의존성 설포트랜스퍼라제 및 적어도 하나의 아릴 설페이트 화합물, 바람직하게는 PNS 또는 NCS를 포함할 수 있다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 키트는 가공된 글루코사미닐 N-설포트랜스퍼라제, 가공된 헥수로닐 2-O 설포트랜스퍼라제, 가공된 글루코사미닐 6-O 설포트랜스퍼라제, 및/또는 가공된 글루코사미닐 3-O 설포트랜스퍼라제를 포함할 수 있고, 이들 각각은 설포 그룹 공여체로서 아릴 설페이트 화합물과의 반응하여 설포 그룹의 다당류, 바람직하게는 헤파로산-계 다당류로의 전달을 촉매하는데 의존적이다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 키트는 설포 그룹 공여체로서 상술한 임의의 헤파로산-계 다당류를 추가로 포함할 수 있다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 키트는 글루쿠로닐 C5-에피머라제, 바람직하게는 서열 번호: 67의 아미노산 서열을 포함하는 에피머라제, 및 보다 바람직하게는 서열 번호: 67의 아미노산 잔기 34 내지 617번을 포함하는 에피머라제를 추가로 포함할 수 있다.
본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용한, 임의의 황산화된 다당류 생성물, 예를 들면, 상술한 임의의 방법에 따라 제조된, 항응고제 N,2O,3O,6O-HS 생성물은 약제학적으로 허용되는 염, 특히 알칼리 또는 알칼리 토금속 염, 예를 들면, 그러나 이에 한정되지 않는 나트륨, 리튬, 또는 칼슘 염으로서 제조될 수 있다.
본 발명의 이러한 및 다른 구현예는 다음의 상세할 설명으로부터 당해 분야의 통상의 기술자에게 명백할 것이다.
도 1은 PNS가 기질인 경우, 본 발명의 가공된 효소 중 하나에 의해 촉매된 설파타제 활성을 나타낸다.
도 2는 설페이트 에스테르 연결의 가수분해 및 설포히스티딘 중간체의 형성에 대한 이론적 반응 메카니즘을 나타낸다.
도 3a 및 도 3b는 α-포르밀글리신 잔기를 사용하여 촉매된, 천연의 설파타제 효소에 대한 2개의 제안된 반응 메카니즘을 나타낸다.
도 4a, 도 4b, 및 도 4c는 제안된 반응 메카니즘, 전이 상태, 및 천연의 사람 글루코사미닐 3-O 설포트랜스퍼라제 효소, 3'-포스포아데노신 5'-포스포설페이트와 헤파로산-계 다당류 사이에 설포전달 반응(sulfotransfer reaction)의 결과로서 형성된 생성물을 나타낸다.
도 5는 본 발명의 가공된 글루코사미닐 N-설포트랜스퍼라제 효소와 함께 설포 그룹 수용체로서 사용될 수 있는 헤파로산-계 다당류의 비-제한적 예를 나타낸다.
도 6a, 도 6b, 및 도 6c는 전반적인 서열 동일성과 상관없이 나타난 보존된 아미노산 서열 모티프를 나타내는, 15개의 야생형 EC-2.8.2.8 효소의 N-설포트랜스퍼라제 도메인에 대한 다중 서열 정렬을 나타낸다.
도 7a, 도 7b, 및 도 7c는 반응 메카니즘, 전이 상태, 및 천연의 글루코사미닐 N-설포트랜스퍼라제 효소, 3'-포스포아데노신 5'-포스포설페이트와 N-탈아세틸화된 헤파로산 사이의 설포전달 반응의 결과로서 형성된 생성물을 나타낸다.
도 8은 EC. 2.8.2.8 효소 부류로부터의 천연 효소의 N-설포트랜스퍼라제 도메인의 결정 구조 위에 겹쳐진, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소의 활성 부위내에서 결합된 PNS의 3차원 모델을 나타낸다.
도 9는 활성 부위 내에 존재하는 아미노산 돌연변이를 나타내는, 도 8에 모델링된 가공된 효소의 3차원 모델을 나타낸다.
도 10은 EC. 2.8.2.8 효소 부류로부터의 천연 효소 의 N-설포트랜스퍼라제 도메인의 결정 구조에 겹쳐진, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소의 활성 부위내에 결합된 PNS의 다른 3차원 모델을 나타낸다.
도 11은 활성 부위 내에 존재하는 아미노산 돌연변이를 나타내는, 도 10에서 모델링된 가공된 효소의 3차원 모델을 나타낸다.
도 12는 각각의 나열된 서열 사이에 아미노산 잔기 차이의 위치 및 동일성을 나타내는, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15 각각의 아미노산 서열을 포함하는 폴리펩타이드의 서열 정렬을 나타낸다.
도 13은 본 발명의 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소와 함께 설포 그룹 수용체로서 사용될 수 있는 헤파로산-계 다당류의 비-제한적 예를 나타낸다.
도 14는 본 발명의 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소와 함께 설포 그룹 수용체로서 사용될 수 있는 헤파로산-계 다당류의 다른 비-제한적 예를 나타내고, 여기서 설페이트 그룹은 헤파로산-계 다단류내 글루쿠론산 잔기의 2-O 위치에서 전달된다.
도 15는 본 발명의 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소와 함께 설포 그룹 수용체로서 사용될 수 있는 헤파로산-계 다당류의 다른 비-제한적 예를 나타내고, 여기서 설페이트 그룹은 다당류 내 이두론산 잔기의 2-O 위치로 전달된다.
도 16은 본 발명의 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소와 함께 설포 그룹 수용체로서 사용될 수 있는 헤파로산-계 다당류의 다른 비-제한적 예를 나타내고, 여기서 설페이트 그룹은 다당류내 글루쿠론산 잔기의 2-O 위치 및 이두론산 잔기의 2-O 위치 둘 다로 이전된다.
도 17a, 도 17b, 도 17c, 및 도 17d는 전반적인 서열 동일성과 상관없이 보존된 아미노산 서열 모티프를 나타내는, EC 2.8.2.- 내 12개의 야생형 헥수로닐 2-O 설포트랜스퍼라제 효소에 대한 다중 서열 정렬을 나타낸다.
도 18a, 도 18b, 및 도 18c는 제안된 반응 메카니즘, 전이 상태, 및 천연의 헥수로닐 2-O 설포트랜스퍼라제 효소, 3'-포스포아데노신 5'-포스포설페이트, 및 헤파로산-계 다당류 내 보존된 잔기 사이의 설포전달 반응의 결과로서 형성된 생성물을 나타낸다.
도 19는 천연의 2-O-설포트랜스퍼라제 효소의 결정 구조 위에 겹쳐진, 가공된 헥수로닐 2-O-설포트랜스퍼라제 효소의 활성 부위내 NCS의 결합을 가능하도록 하는 돌연변이된 아미노산 서열 모티프의 3차원 모델을 나타낸다.
도 20은 본 발명의 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소와 함게 설포 그룹 수용체로서 사용될 수 있는 헤파로산-계 다당류의 비-제한적 예를 나타내고, 여기서 다수의 글루코사민 잔기의 6-O 위치는 설포 그룹을 수용할 수 있다.
도 21a, 도 21b, 및 도 21c는 전반적인 서열 동일성과 상관없이 보존된 아미노산 서열 모티프를 나타내는, EC 2.8.2.- 내 15개의 야생형 글루코사미닐 6-O 설포트랜스퍼라제 효소의 다중 서열 정렬을 나타낸다.
도 22a, 도 22b, 및 도 22c는 제안된 반응 메카니즘, 전이 상태, 및 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소, 3'-포스포아데노신 5'-포스포설페이트와 헤파로산-계 다당류내 보존된 잔기 사이의 설포전달 반응의 결과로서 형성된 생성물을 나타낸다.
도 23은 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소의 결정 구조위에 겹쳐진, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소의 활성 부위내 PNS의 결합을 가능하도록 하는 돌연변이된 아미노산 서열 모티프의 3차원 모델을 나타낸다.
도 24는 각각의 나타낸 서열 사이의 아미노산 잔기 차이의 위치 및 동일성을 나타내는, 서열 번호: 104, 서열 번호: 106, 및 서열 번호: 108의 아미노산 서열을 포함하는 폴리펩타이드의 서열 정렬을 나타낸다.
도 25는 본 발명의 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소와 함께 설포 그룹 수용체로서 사용되어, 화학식 I의 구조를 포함하는 N,2O,3O,6O-HS 생성물을 형성할 수 있는 헤파로산-계 다당류의 비-제한적 예를 나타낸다.
도 26a, 도 26b, 및 도 26c는 전반적인 서열 동일성과 상관없이 나타낸 보존된 아미노산 서열 모티프를 나타내는, EC 2.8.2.23 내 15개의 야생형 글루코사미닐 3-O 설포트랜스퍼라제 효소에 대한 다중 서열 정렬을 나타낸다.
도 27은 천연의 글루코사미닐 3-O 설포트랜스퍼라제 효소 위에 겹쳐진, 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소의 활성 부위내 PNS의 결합을 가능하도록 하는 돌연변이된 아미노산 서열 모티프의 3차원 구조를 나타낸다.
도 28은 각각의 나타낸 서열 사이에 아미노산 잔기 차이의 위치 및 동일성을 나타내는, 서열 번호: 147, 서열 번호: 149, 및 서열 번호: 151 의 아미노산 서열을 포함하는 폴리펩타이드의 서열 정렬을 나타낸다.
도 29는 시판 표준물과 비교하여, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소를 사용하여 합성된 N-황산화된 다당류 생성물의 오버레이드(overlaid) SAX-HPLC 크로마토그램 시리즈를 나타낸다.
도 30a 및 도 30b는 서열 번호: 63 및 서열 번호: 65 각각의 아미노산 서열을 갖는 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소를 사용하여 합성된 2-O 황산화된 다당류 생성물의 LCMS 크로마토그램을 나타낸다.
도 31a, 도 31b, 및 도 31c는 서열 번호 104, 서열 번호: 106, 및 서열 번호: 108 각각의 아미노산 서열을 갖는 가공된 글루코사미닐 6-O 설포트랜스퍼라제를 사용하여 합성된 6-O 황산화된 다당류 생성물의 LCMS 크로마토그램을 나타낸다.
도 32a 및 도 32b는 이당류 및 다당류 표준의 시리즈와 비교하여, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소를 사용하여 합성된 황산화된 다당류 생성물의 6개의 LCMS 크로마토그램의 시리즈를 나타낸다.
도 33은 핵 자기 공명(NMR) 연구를 위한 목적한 양성자의 중수소 표지화(labeling)를 위한 반응식을 나타낸다.
도 34는 PNS 또는 NCS와의 반응시, 본 발명의 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소에 의해 형성된 황산화된 다당류 생성물에 대한 1H-NMR 스펙트럼을 나타낸다.
도 35는 도 34로부터의 1H-NMR 스펙트럼의 3.5ppm 내지 4.5ppm 영역의 확대된 개관을 나타낸다.
도 36은 상업 표준과 비교하여, 화학적으로 N-황산화된 다당류 생성물의 SAX-HPLC 크로마토그램을 나타낸다.
도 37은 상업 표준과 비교하여, 설포 수용체 다당류로서 실시예 8의 화학적으로 N-황산화된 다당류 생성물을 사용하여 제조된 효소적으로 2-O 황산화된 다당류 생성물의 SAX-HPLC 크로마토그램을 나타낸다.
도 38은 상업 표준과 비교하여, 설포 수용체 다당류로서 실시예 8의 화학적으로 N-황산화된 다당류 생성물을 사용하고 반응 혼합물 속에 포함된 C5-헥수로닐 에피머라제와 함께 제조된 효소적으로 2-O 황산화된 다당류 생성물의 SAX-HPLC 크로마토그램을 나타낸다.
도 39는 상업 표준과 비교하여, 설포 그룹 수용체로서 실시예 9의 2-O 황산화된 다당류 생성물을 사용하여 제조된 효소적으로 6-O 황산화된 다당류 생성물의 SAX-HPLC 크로마토그램을 나타낸다.
[정의]
용어 "활성 부위"는 촉매작용이 일어나고, 하나 이상의 기질 결합 부위를 포함할 수 있는 촉매 단백질내 부위를 지칭한다. 활성 부위는 특수한 폴리펩타이드와 특이적으로 반응하고, 이의 활성을 조절하는 화합물의 확인시 유의적인 유용성이 있다. 천연의 리간드 또는 기질과 이의 상응하는 수용체 또는 효소의 활성 부위의 회합(association)은 많은 생물학적 작용 메카니즘을 기반으로 한다. 유사하게, 많은 화합물은 수용체의 활성 부위 및 효소의 회합을 통해 이의 생물학적 효과를 발휘한다. 이러한 회합은 활성 부위 모두 또는 임의의 부분으로 일어날 수 있다. 이러한 회합의 이해는 3'-포스포아데노신 5'-포스포설페이트 대신에 아릴 설페이트 화합물에 결합하여 이와 반응할 수 있는 설포트랜스퍼라제내 가공된 활성 부위의 설계를 이끈다.
용어, "아미노산"은 중심 탄소 원자(알파-탄소 원자)가 수소 원자, 카복실산 그룹(이의 탄소 원자는 본원에서 "카복실 탄소 원자"로서 지칭된다), 아미노 그룹(이의 질소 원자는 본원에서 "아미노 질소 원자"로서 지칭된다), 및 측쇄 그룹, R에 연결된 구조를 갖는 분자를 지칭한다. 펩타이드, 폴리펩타이드, 또는 단백질내로 혼입되는 경우, 아미노산은 하나의 아미노산을 다른 것에 연결하는 탈수 반응 에서 이의 아미노 및 카복실산 그룹의 하나 이상의 원자를 상실한다. 그 결과, 단백질내로 혼입되는 경우, 아미노산은 "아미노산 잔기"로 지칭된다. 천연적으로 존재하는 단백질의 경우에, 아미노산 잔기의 R 그룹은, 단백질 내 하나 이상의 아미노산 잔기가 유도체화되어 생물학적 시스템 내 단백질내로 혼입될 수 있다고 해도(예컨대, 글리코실화에 의해 및/또는 2개의 인접하지 않은 시스테인 아미노산 잔기의 산화를 통한 시스테인의 형성에 의해, 흔히 단백질 등의 폴딩된 구조를 안정화하는데 중요한 역활을 하는 이황화물 공유 결합을 생성함), 이로부터 단백질이 합성되는 20개의 아미노산을 구별한다. 또한, 알파-탄소 원자가 4개의 상이한 그룹(탄소 원자에 결합된 2개의 수소 원자를 갖는, 글리신을 제외하고는, 단백질을 합성하기 위해 생물학적 시스템에 의해 사용된 20개 아미노산을 사용하는 경우에서와 같이)을 갖는 경우, 각각의 아미노산의 2개의 상이한 거울상이성체 형태는 D 및 L로 지정된 각각의 아미노산의 2개의 상이한 거울상 이성체 형이 존재한다. 포유동물에서, L-아미노산 만이 천연적으로 존재하는 폴리펩타이드내로 혼입된다. 본 발명의 이용된 가공된 효소는 하나 이상의 D- 및 L-아미노산을 혼입할 수 있거나, D- 또는 L-아미노산 잔기 단독으로 포함될 수 있다.
비-천연적으로 존재하는 아미노산은 또한 본 발명의 임의의 가공된 효소, 특히 아릴 설페이트-의존성 활성을 갖는 가공된 설포트랜스퍼라제 효소내로 혼입될 수 있다. 이러한 아미노산의 비-제한적 예는 알파-아미노 이소부티르산, 4-아미노 부티르산, L-아미노 부티르산, 6-아미노 헥산산 acid, 2-아미노 이소부티르산, 3-아미노 프로피온산, 오르니틴, 노르루이신, 노르발린, 하이드록시프롤린, 사르코신, 시투룰린, 시스테산, t-부틸 글리신, t-부틸 알라닌, 페닐글리신, 사이클로헥실 알라닌, 베타-알라닌, 플루오로-아미노산, 디자이너(designer) 아미노산(예컨대, 베타-메틸 아미노산, 알파-메틸 아미노산, 알파-메틸 아미노산) 및 일반적으로 아미노산 유사체를 포함한다.
용어, "및/또는"은, 실체의 목록의 맥락에서 사용된 경우, 단일로 또는 함께 존재하는 실체를 지칭한다. 따라서, 예를 들어, 어구 "A, B, C, 및/또는 D"는 개별적으로 A, B, C, 및 D를 포함하지만, 또한 A, B, C, 및 D의 임의의 및 모든 조합 및 소 조합을 포함한다.
용어, "아릴 설페이트" 또는 "아릴 설페이트 화합물"은 방향족 환에 직접 결합된 수소 원자 중 하나 이상이 설페이트 작용 그룹에 의해 대체된 방향족 환으로부터 유도된 임의의 화합물, 작용 그룹, 또는 치환체를 지칭한다. 전형적으로, 설페이트 작용 그룹은 설페이트 에스테르 연결을 통해 아릴 설페이트 화합물의 방향족 모이어티에 공유결합으로 연결된다. 본 발명의 임의의 가공된 효소와 함께 기질로서 사용될 수 있는 아릴 설페이트 화합물의 비-제한적 예는 PNS, 4-메틸움벨리페릴 설페이트, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 2NapS, 및 NCS를 포함하나, 이에 한정되지 않는다.
용어, "아릴 설페이트-의존성 설포트랜스퍼라제"는 설포 공여체로서 아릴 설페이트 화합물과 함께 생물학적 또는 촉매 활성을 지닌 가공된 설포트랜스퍼라제의 총괄적인 그룹을 지칭한다. 설포트랜스퍼라제의 생물학적 활성이 의존적일 수 있는 아릴 설페이트 화합물의 비-제한적 예는 PNS 및 NCS를 포함한다. 본원에 기술된 바와 같이, 설포 그룹 공여체로서 아릴 설페이트 화합물과 함께 생물학적 활성을 갖는 가공된 설포트랜스퍼라제는 설포 그룹 수용체로서, 다당류, 특히 헤파로산-계 다당류와 함께 생물학적 활성을 지닐 수 있다. "아릴-설페이트-의존성 설포트랜스퍼라제"는 또한 임의의 아릴 설페이트-의존성 설포트랜스퍼라제, 예를 들면, 본원에 개시된 서열로부터 유도된 돌연변이체를 암호화하는 핵산 및 폴리펩타이드 둘 다를 포함한다.
본 발명의 임의의 방법에 따라 사용되거나 생성되고, 달리 나타내지 않는 한, 임의의 다당류 출발 물질, 중간체, 및/또는 생성물과 관련하여 용어 "평균 분자량"은 다양한 정도의 중합화, 기능화, 및 분자량, 예를 들면, "수-평균 분자량", "질량-평균 분자량", "중량-평균 분자량", "Z-(원심분리) 평균 분자량" 또는 "점도 평균 분자량"을 갖는 중합체의 혼합물의 몰 질량 분포 또는 몰 질량 평균을 지칭한다.
용어, "중량-평균 분자량"은 수학식
Figure pct00011
(여기서 Ni는 분자량 Mi의 다당류의 수이다)을 사용하여, 샘플 내 다당류의 몰 분률 분포를 사용하여 계산된, 혼합물 속의 다당류의 평균 분자량을 보고하는 방법을 지칭한다.
용어 "수-평균 분자량"은 수학식
Figure pct00012
(여기서 Ni는 분자량 Mi의 다당류의 수이다)을 사용하여, 샘플 속 다당류의 수로 나눈 샘플 속의 다당류 모두의 총 중량을 나누어 계산한, 혼합물 속의 다당류의 평균 몰 중량을 보고하는 방법을 지칭한다. 따라서, 중량-평균 분자량, Mw는 동일한 혼합물 속의 다른 다당류보다 더 큰 샘플 내 다당류에 상응하는 보다 높은 값에 대해 필수적으로 왜곡되며, 샘플이 단순분산되고, Mw가 Mn과 동일한 경우를 제외하고는, 수-평균 분자량, Mn보다 항성 더 클 것이다. 샘플 내 다당류의 특수한 샘플이 실제 중량의 큰 분산을 가지는 경우, Mw는 Mn보다 훨씬 더 클 것이다. 역으로, 샘플 내 다당류의 중량 분산이 협소하므로, Mw는 Mn에 도달한다.
용어 "상대적인 분자량" 또는 "상대적인 몰 질량"(Mr)은, 1 원자 질량 단위(amu) 또는 1 달톤(Da)과 같이, 분자의 평균 질량을 원자 질량 상수로 나누어 가장 광범위하게 측정된, 단위가 없는 양으로서의 혼합물 속의 다당류의 평균 분자량을 보고하는 다른 방법을 지칭한다. 다당류와 관련하여, Mr은 샘플 속의 다당류의 상이한 쇄 길이, 작용화, 및/또는 중량 분포를 고려하지 않으며, 대신 작은 분자와 유사한 방식으로 샘플내 다당류의 실제 평균 질량을 단순히 나타낸다.
용어, "생물학적 활성" 또는 "촉매 활성"은 특수한 생성물 또는 생성물들을 생성하기 위해 특수한 기질 또는 기질들의 특이적인 인식에 의해 특수한 화학 반응을 촉매하는 효소의 능력을 지칭한다. 일부 구현예에서, 본 발명의 가공된 효소는 기질로서 아릴 설페이트 화합물, 특히 PNS 또는 NCS와 결합하여 반응하는데 의존성인 생물학적 또는 촉매 활성을 지닌다. 또한, 일부 가공된 효소는 MUS, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 및 2NapS를 포함하나, 이에 한정되지 않는 PNS 외에 하나 이상의 대안의 아릴 설페이트 화합물과 함께 잡다한 촉매 활성을 가질 수 있다.
용어, "암호화 서열"은 단백질의 아미노산 서열을 암호화하는, 핵산, 예를 드련, 유전자의 부위를 지칭한다.
용어, "코돈-최적화된"은 암호화된 단백질이 목적한 유기체내에서 효율적으로 발현되도록 단백질을 암호화하는 폴리뉴클레오타이드의 코돈내에서 특수한 유기체에서 우선적으로 사용된 것으로의 변화를 지칭한다. 대부분의 아미노산이 몇가지 코돈으로 나타내어진다는 점에서 유전 코드가 변성된다고 해도, 특수한 유기체에 의한 코돈 사용은 비-무작위적이고 특수한 코돈 삼중자(triplet)를 향해 편향된다는 것이 잘 알려져 있다. 본 발명의 일부 구현예에서, 가공된 효소를 암호화하는 폴리뉴클레오타이드는 발현을 위해 선택된 숙주 유기체로부터 최적의 생성을 위해 코돈 최적화될 수 있다.
용어 "에 상응하는", "에 대한 참고", 또는 "에 대해"는, 주어진 아미노산 또는 폴리뉴클레오타이드 서열의 번호매김(numbering)의 맥락에서 사용된 경우, 주어진 아미노산 또는 폴리뉴클레오타이드 서열을 참고 서열과 비교할 때 구체적인 참고 서열의 잔기의 번호매김을 지칭한다. 다시 말해서, 주어진 중합체의 잔기 번호 또는 잔기 위치는 주어진 아미노산 또는 폴리뉴클레오타이드 서열의 실제 숫자 위치에 의해서보다는 참고 서열에 대해 지정된다.
용어 "결실"은 참고 폴리펩타이드로부터 하나 이상의 아미노산의 제거에 의한 폴리펩타이드의 변형을 지칭한다. 결실은 하나 이상의 아미노산의 제거를 포함할 수 있고, 이의 전체 결과는 참고 폴리펩타이드의 촉매 활성을 보유하는 것이다. 결실은 폴리펩타이드의 내부 부위 및/또는 말단 부위에 대해 지시될 수 있다. 또한, 결실은 연속된 분절을 포함할 수 있거나 이들은 불연속적일 수 있다.
용어, "이당류 단위"는 선형 다당류를 포함하는, 많은 다당류내 가장 작은 반복된 골격 단위를 지칭하고, 여기서 가장작은 반복 단위는 2개의 당 단기로 이루어진다. 헤파로산-계 다당류와 관련하여, 이당류 단위는 헥수론산 잔기 및 글루코사민 잔기로 이루어지고, 이들 중 어느 하나는 작용화될 수 있고 여기서 헥수론산 잔기는 글루쿠론산 또는 이두론산일 수 있다. 헤파로산-계 다당류 내 각각의 이당류 단위는 이의 골격 구조에의해 및 존재하는 설포 그룹의 수 및 위치에 의해 기술될 수 있다. 또한, 동일한 다당류내, 및/또는 다당류의 동일한 샘플 내 동일한 구조를 갖는 이당류 단위의 상대적인 풍부성은 본원에 기술된 임의의 설포트랜스퍼라제와의 반응의 결과로서 특수한 위치에서 황산화의 양을 측정하기 위해 특성화될 수 있다.
용어, "단편" 또는 "분절(segment)"은 아미노- 또는 카복시-말단 결실을 갖는 폴리펩타이드를 지칭하지만, 여기서 나머지 아미노산 서열은 참고 서열에 상응하는 위치와 동일하다. 단편은 적어도 50개 아미노산 이상 더 길 수 있고, 70%, 80%, 90%, 95%, 98%, 및 99% 이하의 효소의 아미노산 서열을 포함한다.
용어, "작용 부위" 또는 "작용 도메인"은 일반적으로 단백질에서 기능을 부여하는 단백질내 임의의 부위를 지칭한다. 대표적인 예는 활성 부위(즉, 촉매가 일어나는 경우 촉매 단백질내 부위) 및 리간드 결합 부위를 포함한다. 리간드 결합 부위는 금속 결합 부위, 보조-인자 결합 부위(co-factor binding site), 항원 결합 부위, 기질 채널(channel) 및 터널(tunnel), 및 기질 결합 도메인을 포함하나, 이에 한정되지 않는다. 효소에서, 기질 결합 도메인인 리간드 결합 부위는 또한 활성 부위일 수 있다. 기능성 부위는 또한 다수의 작용 부위의 복합체일 수 있으며, 여기서 복합체를 포함하는 하나 이상의 부위의 부재는 기능의 상실을 야기한다. 비-제한적인 예로서, 특수한 설포트랜스퍼라제 효소의 활성 부위는 다수의 결합 부위 또는 클레프트(cleft), 예를 들면, 설포 공여체에 대한 하나의 부위 및 설포 수용체에 대한 하나의 부위를 포함할 수 있다.
용어 "유전자", "유전자 서열", 및 "유전자 분절"은 기능성 단백질, 폴리펩타이드, 또는 펩타이드를 암호화하는 핵산 단위의 기능성 단위를 지칭한다. 당해 분야의 기술자에 의해 이해될 수 있는 바와 같이, 이러한 기능성 용어는 게놈 서열 및 cDNA 서열 둘 다를 포함한다. 용어 "유전자", "유전자 서열", 및 "유전자 분절"은 또한 가공된 효소 유전자 생성물, 단백질, 또는 다당류를 암호화하는 본원에 기시된 폴리뉴클레오타이드 서열과 실질적으로 동일한 임의의 DNA 서열을 지칭하며 관련된 대조군 서열의 임의의 조합을 포함할 수 있다. 용어는 또한 RNA, 또는 이러한 DNA 서열에 대해 상보성인, 안티센스 서열을 지칭한다. 본원에 사용된 바와 같은, 용어 "DNA 분절"은 재조합 벡터의 단리되어 유리된 단리된 DNA 분자, 예를 들면, 그러나 이에 한정되지 않는 플라스미드, 코스미드, 파아지, 및 바이러스를 포함한다.
용어, "글리코스아미노글리칸"은 반복 이당류 단위로 이루어진 긴, 선형 다당류를 지칭한다. 글리코스아미노글리칸(GAG)의 예는 콘드로이틴, 더마탄, 헤파로산, 하이알루론산, 및 케라탄을 포함한다. GAG는 일반적으로 질량, 길이, 이당류 단위 구조 및 작용화, 황산화도와 관련하여 일반적으로 이종성이다.
용어, "헤파로산"은 반복된 [β(1,4)GlcA-α(1,4)GlcNAc]n 이당류 단위를 갖는 특수한 GAG를 지칭하며, 여기서 GlcA는 글루쿠론산이고 GlcNAc는 N-아세틸 글루코사민이다.
용어 "헤파로산-계 다당류"는 헤파로산과 동일한 골격 구조를 갖는 다당류를 지칭하며, 여기서 이당류 단위는 1→4 글리코시드적으로 연결된 헥수론산 및 글루코사민 잔기를 포함한다. 헥수론산 잔기는 헤파로산에서와 같은 글루쿠론산, 또는 이두론산일 수 있고, 2-O 위치에서 설포 그룹을 임의로 가질 수 있다. 글루코사민 잔기는 헤파로산에서와 같이 N-아세틸화되거나, N-황산화되거나, 또는 N-비치환될 수 있고, N-, 3-O, 또는 6-O 위치에서 임의로 황산화될 수 있다. 본원에 사용된 바와 같이, 글루코사민 잔기와 관련하여, 용어 "N-비치환된"은 "N-탈아세틸화된" 글루코사민 잔기와 동일하며, 글루코사미닐 N-설포트랜스퍼라제를 사용하여 화학적으로, 또는 효소적으로 설포 그룹을 수용할 수 있는 아민 작용 그룹을 지칭한다. 본 발명에 따르면, 헤파로산-계 다당류는 출발 물질로서 이용될 수 있고/있거나, 중간체로서 형성될 수 있고/있거나, 설포 그룹 수용체로서 작용할 수 있고/있거나 본원에 기술된 임의의 방법에 따라 생성물로서 합성될 수 있다.
용어 "삽입"은 참고 폴리펩타이드에 대한 하나 이상의 아미노산의 첨가에 의한 폴리펩타이드에 대한 변형을 지칭한다. 삽입은 폴리펩타이드의 내부 부위내에, 또는 폴리펩타이드의 C- 또는 N-말단에 대해 이루어질 수 있다. 삽입은 당해 분야에 공지되고 하기 기술된 바와 같은 융합 단백질을 포함할 수 있다. 삽입은 아미노산의 연속된 분절 또는 참고 폴리펩타이드내 아미노산 중 하나 이상에 의해 분리된 다수의 삽입을 포함할 수 있다.
천연적으로 존재하는 서열로부터 유래된 핵산과 관련하여 본원에 사용된 바와 같은 용어, "단리된 핵산"은 천연적으로 존재하는 뉴클레오타이드 서열을 포함하고 표준 재조합 DNA 기술에 의해 조작될 수 있지만 이것이 유래된 유기체의 천연적으로 존재하는 게놈내 이의 5' 및 3' 말단에서 바로 연속적인 뉴클레오타이드 서열에 공유결합으로 연결되지 않은 리보핵산 또는 데옥시리보핵산을 의미한다. 합성 핵산과 관련하여 본원에 사용된 바와 같은, 용어 "단리된 핵산"은 천연적으로 존재하지 않고 표준 재조합 DNA 기술에 의해 조작될 수 있는 뉴클레오타이드 서열을 포함하는 리보핵산 또는 데옥시리보핵산을 의미한다. 단리된 핵산은 예를 들어, 폴리머라제 쇄 반응(PCR), 시험관내 해독, 다른 핵산에 대한 연결(예컨대, 클로닝 또는 발현 벡터), 다른 핵산으로부터의 제한(예컨대, 클로닝 또는 발현 벡터), 세포의 형질전환, 하이브리드화 스크리닝 검정 등에 사용될 수 있는 경우 표준 재조합 DNA 기술에 의해 조작될 수 있다.
용어, "천연적으로 존재하는" 또는 "야생형"은 천연에서 발견된 효소의 형태를 지칭한다. 예를 들면, 천연적으로 존재하는 또는 야생형 폴리펩타이드 또는 폴리뉴클레오타이드 서열은 천연의 공급원으로부터 단리될 수 있고 사람 조작에 의해 의도한 대로 변형되지 않은 유기체내에 존재하는 서열이다. 야생형 폴리펩타이드 또는 폴리뉴클레오타이드 서열은 또한 시험관내에서 합성, 증폭, 및/또는 발현될 수 있고, 생체내에서 생산된 효소와 동일한 서열 및 생물학적 활성을 갖는 재조합 단백질 또는 핵산을 지칭할 수 있다. 천연적으로 존재하는 또는 야생형 설포트랜스퍼라제 효소와는 대조적으로, 본 발명의 방법에 따라 이용된 가공된 설포트랜스퍼라제 효소는 유일한 아미노산 및 핵산 서열을 가지고, 3'-포스포아데노신 5'-포스포설페이트대신에 설포 그룹 공여체로서 아릴 설페이트 화합물과 함께 생물학적 활성을 가지며, 천연에서 발견될 수 없다.
용어 "올리고사카라이드"는 각각의 분자 내에 동일한 수, 전형적으로 3 내지 9개의 당 잔기를 함유하는 사카라이드 중합체를 지칭한다.
용어 "동일성 퍼센트"는 2개 이상의 핵산 또는 아미노산 서열 사이에 유사성의 정량적 척도를 지칭한다. 비-제한적인 예로서, 동일성 퍼센트는 본 발명의 2개 이상의 가공된 효소 사이, 2개 이상의 천연적으로 존재하는 효소 사이, 또는 하나 이상의 가공된 효소와 하나 이상의 천연적으로 존재하는 효소 사이에서 평가될 수 있다. 동일성 퍼센트는 2개 이상의 전체 길이의 서열, 2개 이상의 트렁케이트된(truncated) 서열, 또는 전체 길이의 서열 및 트렁케이트된 서열의 조합에 대해 평가될 수 있다.
용어, "다당류"는 글리코시드 결합에 의해 함께 결합되고 구조내에서 직쇄로부터 고도로 측쇄된 3차원 구조까지의 범위에 이를 수 있는 반복 단위, 전형적으로 단당류 또는 이달류 단위로 형성된 중합체성 탄수화물 구조를 지칭한다. 당해 분야에 사용된 바와 같은, 용어 "다당류"가 분자당 10개 이상의 당 잔기를 갖는 사카라이드 중합체를 지칭할 수 있지만, "다당류"는 본 출원 내에서 하나 이상의 당 잔기를 갖는 사카라이드 중합체, 예를 들면, 당해 분야에서 "올리고사카라이드"로 정의될 수 있는 3 내지 9개의 당 잔기를 갖는 사카라이드 중합체를 기술하기 위해 사용된다. 본 발명에 따르면, 용어 "다당류"는 또한 GAG 및 GAG-계 화합물, 예를 들면, 콘드로이틴, 더마탄, 헤파로산, 하이알루론산, 및 케라탄 화합물을 기술하기 위해 사용된다.
용어 "단백질", "유전자 생성물", "폴리펩타이드" 및 "펩타이드"는 아미노산 잔기의 하나 이상의 쇄로 이루어진 생체분자를 기술하기 위해 상호교환적으로 사용될 수 있다. 또한, 다수의 폴리펩타이드 소단위(예컨대, 이량체, 삼량체 또는 사량체)를 포함하는 단백질 뿐만 아니라 다른 비-단백질성 촉매 분자가 본원에 사용된 바와 같은 "단백질"의 의미내에 포함되는 것으로 이해될 것이다. 유사하게, "단백질 단편", 즉, 단백질의 아미노산 잔기 모두보다 더 적게 포함하는 아미노산 잔기의 스트레치(stretch)다 또한 본 발명의 영역내에 있으며 본원에서 "단백질"로서 지칭될 수 있다. 또한, "단백질 도메인"은 용어 "단백질"내에 포함된다. "단백질 도메인"은 소수성 및 극성 외부를 지닌 이의 자체의 특징적인 구형 기하학을 갖는 이의 자체의 반-독립적인 폴딩된 영역을 포함하는 단백질의 부위를 나타낸다.
예를 들면, 세포, 핵산, 또는 폴리펩타이드에 대한 참고로 사용되는 경우 용어 "재조합"은 천연에서 달리 존재하지 않을 수 있는 방식으로 개질된 물질을 지칭한다. 비-제한적 예는 다른 것들 중에서도, 세포의 천연(비-재조합) 형태내에서 발견되지 않거나 상이한 수준에서 또한 발현된 천연의 유전자를 발현하는 유전자를 발현하는 재조합 세포를 포함한다.
용어, "참고 서열"은 서열 비교를 위한 기초로서 사용된 개시되거나 정의된 서열을 지칭한다. 참고 서열은 보다 큰 서열의 서브세트, 예를 들면, 전체 길이의 유전자 또는 폴리펩타이드 서열의 분절일 수 있다. 일반적으로, 참고 서열은 전체 길이의 서열의 적어도 일부, 전형적으로 적어도 20개 아미노산, 또는 핵산 또는 폴리펩타이드의 전체 길이 서열을 지칭한다.
용어, "사카라이드"는 탄소, 수소, 및 산소를 포함하는 화학적 화합물에 대한 광범위한 용어인, 당으로 또한 공지된 탄수화물을 지칭하며, 여기서 수소 원자의 수는 산소 원자의 수의 필수적으로 2배이다. 흔히, 반복 단위의 수는 사카라이드에서 변할 수 있다. 따라서, 이당류, 올리고사카라이드, 및 다당류는 설포 그룹 수용체로서 본 발명의 가공된 설포트랜스퍼라제 효소에 의해 인식된 사카라이드 단위를 포함한 쇄의 모든 예이다.
본원에 기술된 임의의 방법에 따라 출발 물질로서 이용되고/되거나, 중간체로서 형성되고/되거나, 설포 그룹 수용체로서 작용하고/하거나, 생성물로서 합성된 다당류와 관련하여, 용어, "실질적으로 등가인"은 선행 기술에서 특성화된 다당류 샘플에서 발견된 것과 동일한 다당류 샘플의 하나 이상의 특성을 지칭한다. 이러한 특성은 화학 구조, 황산화 빈도 및 위치, 이당류 단위 조성, 분자량 프로파일, 및/또는 항응고 활성을 포함하나, 이에 한정되지 않는다. 2개의 다당류 샘플이 상이할 수 있는 추가의 특성을 갖는 경우에서도, 이러한 차이는 이의 실질적인 등가성에 유의적으로 영향을 미치지 않는다. 비-제한적인 예로서, 본 발명의 방법에 따라 가공된 글루코사미닐 3-O 설포트랜스퍼라제를 사용하여 합성된 항응고제 N,2O,3O,6O-HS 생성물은 화학 구조, 분자량 프로파일, 및/또는 항응고 활성과 관련하여 미국 약전(United States Pharmacopeia)(USP) 참고 표준(CAS-No:-9041-08-1)과 실질적으로 등가일 수 있지만, 천연의 공급원으로부터 단리되고 동일한 샘플 속에서 비-미량의 다른 GAG를 함유할 수 있는 USP 참고 표준보다 상이한 순도로 생산될 수 있다.
단백질 제조와 관련하여, 용어 "실질적으로 순수한"은 다른 의도적으로 포함된 화합물의 중량을 제외하고는, 목적한 단백질의 적어도 60%(무수 중량당)를 함유하는 제제를 지칭한다. 특히, 제제는 다른 의도적으로 포함된 화합물의 중량을 제외하고는, 목적한 무수 중량 단백질의 적어도 75%, 보다 특히 적어도 90%, 및 가장 특히 적어도 99%이다. 순도는 임의의 적절한 방법, 예컨대, 컬럼 크로마토그래피, 겔 전기영동, 또는 고-성능 액체 크로마토그래피(HPLC) 분석에 의해 측정할 수 있다. 제제가 의도적으로 2개 이상의 상이한 본 발명의 단백질을 포함하는 경우, "실질적으로 순수한" 제제는 본 발명의 단백질의 총 무수 중량이 다른 의도적으로 포함된 화합물의 중량을 제외하고는, 총 무수 중량의 적어도 60%인 제제를 의미한다. 특히, 본 발명의 2개 이상의 단백질을 함유하는 이러한 제제의 경우, 본 발명의 단백질의 총 중량은 다른 의도적으로 포함된 화합물의 중량을 제외하고는, 제제의 총 무수 중량의 적어도 75%, 보다 특히 적어도 90%, 및 가장 특히 적어도 99%일 수 있다.
용어, "설포" 또는 "설푸릴"은 아릴 설페이트 화합물로부터 제거될 수 있고/있거나 공여체 화합물로부터 수용체 화합물로 전달될 수 있는 화학식 SO3H-를 갖는 작용 그룹, 치환체, 또는 모이어티를 지칭한다. 일부 구현예에서, 본 발명의 가공된 설포트랜스퍼라제는 아릴 설페이트 화합물로부터 다당류, 특히 헤파로산 및/또는 헤파로산-계 다당류로 설포 그룹의 전달을 촉매한다.
용어, "설포트랜스퍼라제"는 설포 공여체 화합물로부터 설포 수용체 화합물로 설포 그룹의 전달을 촉매하는데 사용된 생체내 또는 시험관내 공정에서의 임의의 효소를 지칭한다. "설포트랜스퍼라제"는 생체내에서 설포전달 반응을 촉매하는 효소를 기술하거나 시험관내에서 설포전달 반응을 촉매하는 본 발명의 가공된 효소를 기술하기 위해 상호교환적으로 사용될 수 있다.
용어, "형질전환"은 외인성 핵산을 세포 내로 도입하는 임의의 방법, 예를 들면, 그러나 이에 한정되지 않는, 형질전환, 형질감염, 전기천공, 미세주사, 네이크드 핵산(naked nucleic acid)의 직접적인 주입, 입자-매개된 전달, 바이러스-매개된 형질유도 또는 핵산을 상기 핵산의 일시적인 또는 안정한 발현 또는 상기 핵산의 상기 숙주 세포 또는 이의 후손의 게놈내로의 통합을 야기하는 숙주 세포내로 핵산을 전달하는 임의의 다른 수단을 지칭한다.
[발명의 상세한 설명]
본 발명은 기질로서 아릴 설페이트 화합물을 인식하고, 이에 결합하며, 이와 반응하도록 구성된 가공된 효소를 기술한다. 생체내에서 세균 및 진균 효소에 대한 일반적인 기질인, 많은 설페이트-함유 화합물, 예를 들면, 설파타제 및 설포트랜스퍼라제가 시험관내 동일한 반응에 대한 기질로서 사용하기에 흔히 비현실적이므로, 본 발명의 효소는 특히 유용하다. 아릴 설페이트 화합물은 흔하고, 저렴하고, 안정하며, 실험실적 세팅에서 함께 작업하기에 비교적 용이하지만, 이는 생체내에서 매우 적은 효소와 반응할 수 있다. 특히, 진핵세포 설포트랜스퍼라제는 설포 그룹 공여체로서 아릴 설페이트 화합물에 결합하거나 이와 반응할 수 없으며, 대신 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트와만 반응할 수 있다. 그 결과, 3'-포스포아데노신 5'-포스포설페이트에 대한 설포트랜스퍼라제의 거의 공통적인 의존도는 황산화된 생성물, 특히 황산화된 다당류 생성물의 대규모 화학효소적 또는 효소적 시험관내 합성에 대한 대체불가능한 장애물이 되어 왔다.
하기 논의된, 본 발명의 가공된 효소는 3'-포스포아데노신 5'-포스포설페이트를 전적으로 인식하고, 이에 결합하며, 이와 반응하는 천연의 설포트랜스퍼라제 효소의 돌연변이체이지만 대신에 가공되어 기질로서 아릴 설페이트 화합물에 결합하고 이와 반응한다. 본 발명의 구현예에서, 많은 가공된 효소는 설파타제 활성을 지니며, 여기서 효소는 아릴 설페이트 화합물로부터 설포 그룹의 가수분해를 촉매한다. 특수한 이론에 제한되지 않고, 설파타제의 반응 메카니즘은 보존된 신호 서열 및 해독후 변형된 아미노산을 지니는, 공지된 천연의 설파타제에 대해 유일한 것으로 여겨진다. 천연 효소 및 본 발명의 가공된 효소 둘 다의 설파타제 활성은 하기에 추가로 상세히 기술되어 있다.
본 발명의 다른 구현예에서, 수개의 가공된 효소는 설포트랜스퍼라제 활성을 지니며, 여기서 효소는 아릴 설페이트 화합물로부터 설포 그룹 수용체로 설포 그룹의 전달을 촉매한다. 다른 구현예에서, 설포 그룹 수용체는 다당류, 특히, 헤파로산-계 다당류이다. 특수한 이론에 제한되지 않고, 설포 그룹 수용체로서 다당류를 인식하지만, 또한 설포 공여체로서 아릴 설페이트 화합물에 결합하여 이와 반응하는 설포트랜스퍼라제 효소는 천연적으로 관찰되거나 이미 기술되지 않은 것으로 여겨진다. 당해 분야의 기술자는 본 발명의 가공된 아릴 설페이트-의존성 설포트랜스퍼라제 효소가 설포 전달을 촉매하기 위하여 아릴 설페이트 화합물에 결합하여 이와 반응할 수 없는 시험관내 및 생체내 반응 메카니즘보다 수개의 장점을 기짐을 인식할 것이다.
참고가 예시적인 구현예에 대해 이루어지고 특수한 언어가 이를 기술하지 위해 사용되지만, 본 발명을 제한하는 것으로 의도되지 않음이 이해되어야 한다. 본원에 기술된 방법의 추가의 변형 뿐만 아니라, 관련 분야에서 및 본 개시내용을 소유한 기술자에게서 일어날 수 있는 본 발명의 원리의 추가의 변형은 본 발명의 영역내에 있는 것으로 고려되어야 한다. 또한, 달리 정의하지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어는 특수한 본 발명의 구현예가 속한 당해 분야의 통상의 기술자에 의해 일반적으로 이해되는 바와 동일한 의미를 갖는다. 사용된 전문용어는 구현예만을 기술할 목적이며, 이와 같이 정의되지 않는 한, 제한하는 것으로 해석되지 않는다. 제목은 편의로만 제공되며 어떠한 방식으로도 본 발명을 제한하는 것으로 고려되지 않아야 한다. 또한, 명세서 및 청구범위 전체에서, 제공된 화학식 또는 명칭은 모든 광학 이성체 및 입체이성체 뿐만 아니라 이러한 이성체 및 혼합물이 존재하는 라세미 혼합물(racemic mixture)을 포함할 것이다.
아릴 설페이트-의존성 설파타제
본 발명의 구현예에서, 본원에 개시된 수개의 가공된 효소는 설파타제 활성을 가지고, 아릴 설페이트 화합물내 설페이트 에스테르를 가수분해할 수 있다 (참조: Recksiek, et al., (1998) J. Biol. Chem. 273 (11):6096-6103, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 수용액 속에서 아릴 설페이트 화합물과 결합시, 설파타제 활성을 갖는 가공된 효소는 아릴 설페이트 화합물의 가수분해를 촉매하여 방향족 화합물 및 설페이트 이온을 생산할 수 있다. 아릴 설페이트 화합물의 비-제한적 예는 p-니트로페닐 설페이트 (PNS), 4-메틸움벨리페릴 설페이트, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 2-나프틸 설페이트 (2NapS), 및 4-니트로카테콜 설페이트(NCS)를 포함한다. 비-제한적인 예로서 및 도 1에 나타낸 바와 같이, 아릴 설페이트 화합물이 PNS인 경우, 생성물은 p-니트로페놀 및 설페이트 이온이다. p-니트로페놀보다 더 높은 pH에서 수행된 반응에서, 방향족 생성물은 p-니트로페놀레이트 이온이다.
임의의 특수한 이론에 제한되지 않고, 본 발명의 가공된 효소에 의해 촉매된 설페이트 에스테르의 가수분해는 효소의 활성 부위내 아릴 설페이트 화합물의 결합시 일어날 수 있다. 도 2에 나타낸 바와 같이, 활성 부위 히스티딘 잔기의 이미다졸 환 내 기본 질소 원자의 단독 쌍은 PNS내에서 황 원자의 친핵성 공격을 개시하여, 인접한 C-O 결합의 가수분해 및 설포히스티딘 중간체의 형성을 유발한다. 제2 단게에서, 설포히스티딘 중간체 자체는 활성 부위내 물 분자에 의해 친핵적으로 공격받아 히스티딘 측쇄로부터 설포 그룹의 방출을 유발하고 효소를 이의 전-반응 상태로 회복시킬 수 있다.
설페이트 에스테르를 가수분해하기 위해 활성 부위내 히스티딘 잔기를 이용하는 반응 메카니즘을 통한 진행은 다른 공지된 설파타제에 대해 본 발명의 가공된 효소에 대한 유일한 지위(unique niche)를 생성한다. 천연적으로, 설파타제는 원핵세포 및 진핵세포 종 둘 다에 걸쳐 순차적으로, 구조적으로, 및 기계적으로 고도로 보존되고, 세포 발달 및 해독, 황 스캐빈징(sulfur scavenging), 화합물의 분해, 및 삼투보호(osmoprotection)와 같은 기능을 갖는 효소의 부류(EC 3.1.5.6)를 포함한다. 천연의 설파타제 중에서 이러한 유사성은 컨센서스(consensus) 서열 모티프를 함유하는 고도로 보존된 N-말단 서열 영역 뿐만 아니라, 유일한, 해독후 변형된 활성-부위 알데하이드 잔기, 천연의 설파타제 활성에 대해 필수적인 α-포르밀글리신을 포함한다 (참조: Hanson, S.R., et al., (2004) Agnew. Chem. Int. Ed. 43:5736-5763, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 또한, 천연의 설파타제는 일부 진핵세포 설파타제에 대해 약 800개 이하의 아미노산 잔기를 포함하는, 500개 이상의 아미노산 잔기를 흔히 포함하는 전형적으로 큰 단백질이다.
특수한 이론에 제한되지 않고, 모든 공지된 천연의 가수분해성 설파타제는, 둘 다 N-말단 서열 영역에서 발견된, 설파타제 특징 서열(특징 sequence) I 및 II로서 이미 확인된 2개의 고도로 상동성인 아미노산 모티프를 함유하는 것으로 여겨진다 (참조: Hanson, S.R., et al., 상기). 특징 서열 I은 아미노산 C/S-X-P-S/X-R-X-X-X-L/X-T/X-G/X-R/X를 포함하는 반면에, 특징 서열 II는 아미노산 G-Y/V-X-S/T-X-X-X-G-K-X-X-H를 포함한다. 특징 서열 둘 다는 천연의 설파타제 효소 활성에서 중요한 역할을 한다. 특징 서열 I은 α-포르밀글리신 잔기를 함유하기 위한 활성 부위의 해독후 변형을 지시하는데 필수적이고(하기에 추가로 상세히 기술됨) 특징 서열-II는 α-포르밀글리신-함유 활성 부위내에서 설페이트 에스테르 촉매작용을 최적화하는데 중요한 중요한 결합 접촉을 함유한다.
특히, 활성 부위내에서 α-포르밀글리신의 존재는 지금까지 모든 특성화된 원핵세포 및 진핵세포 설파타제에서 발견된, 천연의 설파타제내에서 가장 핵심적인 특징이다 (참조 Uhlhorn-Dierls, G., et al., (1998) Agnew. Chem. 37:2453, 및 Uhlhorn-Dierls, G., et al., (1998) Agnew. Chem. 110:2591, 이들 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). α-포르밀글리신 잔기는 활성 부위내에 시스테인(가장 일반적임) 또는 세린 잔기로부터 형성되며, 이의 변형은 특징 서열-I에 의해 지시되는 것으로 측정되었다. 특징 서열-I내에서, 펜타펩타이드 서열 모티프 C/S-X-P-S/X-R은 α-포르밀글리신의 형성을 지시할 뿐 아니라 촉매작용 동안 활성 부위내에서 α-포르밀글리신 잔기를 안정화시키는 것으로 확인되었다.
수개의 천연의 설파타제의 결정 구조를 기반으로, 촉매작용을 위해 α-포르밀글리신 잔기를 주로 이용하는 2개의 반응 메카니즘이 제안되었다. 도 3a에 나타낸 제1 메카니즘이 제안되었으며 여기서 이의 알데하이드 형태의 α-포르밀글리신 잔기는 기질내 설페이트 그룹 산소 원자 중 하나에 의해 친핵적으로 공격받아 설페이트 디에스테르를 형성한다. 알코올 접합체는 이후 친핵체, 예를 들면, 활성화된 물 분자의 작용을 통해 방출되어 설페이트 헤미아세탈을 형성한다. 설페이트 헤미아세탈내 친핵성 중심의 알코올에 의한 후속적인 공격은 활성 부위로부터 설페이트의 방출을 유발하여, 추가의 촉매작용을 위한 효소를 재생시킨다. 도 3b에 나타낸, 제2 메카니즘인, 이의 수화된 형태의 α-포르밀글리신은 SN2 반응을 통해 설페이트 원자를 친핵적으로 공격하여 설페이트 헤미아세탈을 형성하고, 궁극적으로 도 3a에서의 메카니즘과 유사하게, 활성 부위로부터 설페이트 그룹을 방출한다. 물의 후속적인 첨가는 α-포르밀글리신 알데하이드를 재수화시켜 수화된 α-포르밀글리신 잔기를 재형성시킨다.
그러나, 및 다른 구현예에서, 본 발명의 가공된 효소는 존재하는 특징 서열 I, 특징 서열 II, 및/또는 임의의 α-포르밀글리신 잔기없이 합성될 수 있다. 다른 구현예에서, 특징 서열 I, 특징 서열 II, 및/또는 임의의 α-포르밀글리신 잔기를 함유하지 않고, 설파타제 활성을 갖는 것으로 밝혀진 효소는 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 또는 서열 번호: 151로 이루어진 그룹으로부터 선택될 수 있다. 다른 구현예에서, 설파타제 활성을 갖는 가공된 효소는 하기 "핵산 및 폴리펩타이드 제조" 단락에서 정의된 바와 같이, 설파타제 활성을 갖는 임의의 상기 폴리펩타이드의 아미노산 서열과 실질적으로 동일하거나, 생물학적으로 등가인 아미노산 서열을 포함할 수 있다.
따라서, 다른 구현예에서, 본 발명은 아릴 설페이트 화합물을 제공하는 단계; 아릴 설페이트 화합물 및 다당류, 바람직하게는 헤파로산-계 다당류와 결합하도록 구성된 활성 부위를 갖는 가공된 효소를 제공하는 단계; 아릴 설페이트 화합물 및 가공된 효소를 반응 혼합물내로 합하는 단계; 및 가공된 효소를 사용하여 아릴 설페이트 화합물의 가수분해를 촉매하는 단계를 포함하는, 아릴 설페이트 화합물을 효소적으로 가수분해하기 위한 방법을 제공한다. 다른 구현예에서, 아릴 설페이트 화합물은 PNS, 4-메틸움벨리페릴 설페이트, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 2NapS, 및 NCS로 이루어진 그룹으로부터 선택된다. 다른 구현예에서, 아릴 설페이트 화합물은 PNS이다. 다른 구현예에서, 아릴 설페이트 화합물은 NCS이다. 다른 구현예에서, 아릴 설페이트 화합물은 2NapS이다. 다른 구현예에서, 아릴 설페이트 화합물의 가수분해는 아릴 설페이트 화합물내 황 원자의 친핵성 공격을 포함하는 메카니즘에 의해 진행되어, 인접한 C-O 결합의 가수분해 및 설포히스티딘 중간체의 형성을 유발한다. 다른 구현예에서, 친핵성 공격은 히스티딘 잔기에 의해 개시된다.
아릴 설페이트-의존성 설포트랜스퍼라제
다른 구현예에서, 및 상술된 바와 같이, 본 발명의 수개의 가공된 효소는 설포 그룹 공여체로서 아릴 설페이트 화합물과 함께 설포트랜스퍼라제 활성을 갖는다. 다른 구현예에서, 설포 그룹 공여체는 다당류, 바람직하게는 헤파로산-계 다당류이다. 각각의 설포전달 반응에서, 아릴 설페이트 화합물은 설포 그룹 공여체로서 관여하지만, 다당류는 설포 그룹 수용체로서 관여한다. 설포 그룹 수용체로서 다당류를 인식하지만, 설포 그룹 공여체로서 아릴 설페이트 화합물에 결합하여 이와 반응하는 설포트랜스퍼라제 효소는 천연에서 관찰되거나 앞서 기술되지 않았다.
하나의 특수한 다당류인, 헤파로산은 생체내에서, 특히 진핵세포 유기체내에서 다수의 황산화된 다당류의 합성시 출발 물질이다. 전형적으로, 헤파로산은 골지체(Golgi apparatus)내에서 유기체에 의해 글리코사미노글리칸(GAG)으로서 합성되며, [β(1,4)GlcA-α(1,4)GlcNAc]n 이당류 단위의 반복된 공-중합체이며, 여기서 GlcA는 글루쿠론산이고 GlcNAc는 N-아세틸 글루코사민이다. 헤파로산 GAG는 이후 특히 하나 이상의 헤파란 설페이트(HS)-설포트랜스퍼라제 효소에 의해 변형되어, 작용화된 헤파로산-계 다당류 생성물, 특히 HS를 형성한다. 헤파로산에 대한 이러한 변형은 글루코사민의 N-탈아세틸화 및 N-황산화, 이두론산을 형성하기 위한 글루쿠론산의 C5-에피머화, 이두론산 및/또는 글루쿠론산의 2-O-황산화 뿐만 아니라 글루코사민 잔기의 6-O-황산화 및 3-O-황산화를 포함한다. 생체내에서 헤파로산 및 헤파로산-계 다당류의 N-아세틸화 및 N-황산화, 2-O-황산화, 6-O-황산화, 및 3-O-황산화를 촉매하는 천연의 설포트랜스퍼라제는 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트를 전적으로 인식하여 이와 결합한다. 특수한 이론에 제한되지 않고, 4개의 HS 설포트랜스퍼라제 효소 중 어느 것도 설포 그룹 공여체로서 어떠한 아릴 설페이트 화합물과도 활성이 아니다.
4개의 천연의 HS 설포트랜스퍼라제 효소 각각은 일반적으로 3'-포스포아데노신 5'-포스포설페이트로부터 설포 그룹의 헤파로산-계 다당류로의 직접적인 전달을 단일 단계로 촉매한다. HS 설포트랜스퍼라제 효소에 의해 촉매된 대표적인 설포전달 반응 메카니즘의 예는 도 4a, 도 4b, 및 도 4c에 나타나 있으며, 이는 총칭적으로 제안된 메카니즘, 전이 상태, 및 사람 글루코사미닐 3-O 설포트랜스퍼라제 효소, 3'-포스포아데노신 5'-포스포설페이트와 헤파로산-계 다당류 사이에서 형성된 생성물을 나타낸다. 특히, 43번 위치에서 글루탐산 잔기는 헤파로산-계 다당류내 N-, 6-O 황산화된 설포글루코사민 잔기의 3-O 위치로부터 양성자를 추출하여, 친핵성 공격 및 3'-포스포아데노신 5'-포스포설페이트로부터 설포 그룹의 제거를 가능하도록 하는 반면, His-45 및 Asp-48은 황산화된 다당류 생성물이 활성 부위로부터 방출되기 전에 배위되어 효소의 전이 상태를 안정화시킨다.
그러나, 3'-포스포아데노신 5'-포스포설페이트가 진핵 세포내에서 전적인 설포 공여체이라고 해도, 이는 짧은 반감기를 가지며 설포전달 반응 동안 경쟁적 억제제로서 작용하는, 아데노신 3',5'-디포스페이트로 용이하게 분해될 수 있다. 동물은 아데노신 3',5'-디포스페이트를 대사하여 경쟁적 결합을 방지하고 필요한 경우 각각의 설포전달 반응을 위해 3'-포스포아데노신 5'-포스포설페이트를 보충할 수 있으므로, 3'-포스포아데노신 5'-포스포설페이트를 효율적으로 이용할 수 있다. 다른 한편, 제한된 수의 세균 시스템에서 설포 공여체로서 이용될 수 있는, 아릴 설페이트 화합물(참조 Malojcic, G., et al., 상기됨)은 생체내에서 HS 및 다른 헤파로산-계 다당류를 합성하는데 포함되는 것을 포함하는, 진핵 세포내에서 임의의 공지된 천연의 설포트랜스퍼라제 효소와 반응할 수 없다. 특수한 이론에 제한되지 않고, 진핵세포 설포트랜스퍼라제의 활성 부위내에서 3'-포스포아데노신 5'-포스포설페이트에 대한 결합 포켓은 결합을 촉진하고/하거나 아릴 설페이트 화합물이 활성 부위로 전적으로 도입되는 것으로부터 입체적으로 방해되기에 충분히 높은 아릴 설페이트 화합물에 대한 친화성을 가지지 않는다.
헤파란 설페이트 및 다른 헤파로산-계 다당류는 생체내에서 다양한 중요한 생물학적 공정에서 중요한 역할, 예를 들면, 바이러스 감염의 보조, 혈액 응고의 조절 및 배아 발달, 종양 성장의 억제, 및 특이적인 조절 단백질과의 상호작용에 의한 시험 대상체의 제어를 담당한다. 역활에 따라, 헤파로산 다당류는 특수한 생물학적 공정에 포함된 특이적인 단백질(들)에 의해 인식된 하나 이상의 독특한 패턴 또는 모티프를 포함한다. 특히, 항응고 활성을 갖는 헤파란 설페이트 다당류 뿐만 아니라 시험관내에서 이러한 다당류를 합성하기 위한 경로는 약제 산업에서 매우 흥미있는 주제이다.
본 개시내용은 하기에 추가로 상세히 기술된, 가공된 설포트랜스퍼라제를 포함하며, 이는 설포 그룹 공여체로서 아릴 설페이트 화합물 및 설포 그룹 수용체로서 헤파로산-계 다당류와 함께 활성을 갖는다. 가공된 설포트랜스퍼라제 효소 각각은 상응하는 천연의 HS 설포트랜스퍼라제: 글루코사미닐 N-설포트랜스퍼라제, 헥수로닐 2-O 설포트랜스퍼라제, 글루코사미닐 6-O 설포트랜스퍼라제, 및 글루코사미닐 3-O 설포트랜스퍼라제의 돌연변이체인 것으로 설계된다. 각각의 예에서, 가공된 설포트랜스퍼라제 효소는 설포 그룹 공여체로서 하나 이상의 아릴 설페이트 화합물(3'-포스포아데노신 5'-포스포설페이트보다는 오히려)과 함께 활성을 가지지만, 설포 그룹 수용체로서 특수한 헤파로산-계 다당류에 대해 천연의 HS-설포트랜스퍼라제 효소의 친화성을 보유한다. 비-제한적인 예로서, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 설포 그룹 공여체로서 아릴 설페이트 화합물 및 설포 그룹 수용체로서 N-황산화된 헤타로산과 함께 설포트랜스퍼라제 활성을 가질 수 있다. 각각의 가공된 설포트랜스퍼라제 효소, 예를 들어, 이의 서열, 구조, 및 생물학적 활성은 하기에 추가로 상세히 기술되어 있다. 가공된 설포트랜스퍼라제 효소 및 아릴 설페이트 화합물을 사용하여 시험관내에서 황산화된 헤파로산-계 다당류를 합성하는 방법은 또한 하기에 기술되어 있다. 본 발명의 일부 구현예에서, 항응고 활성을 갖는 헤파란 설페이트 다당류는 시험관내에서 합성될 수 있다.
가공된(Engineered) 글루코사미닐 N-설포트랜스퍼라제
천연에서, HS 글루코사미닐 N-설포트랜스퍼라제는 이중의 N-데아세틸라제 및 N-설포트랜스퍼라제 활성을 가지며, 여기서 동일한 효소는 우선 헤파로산내 글루코사민 잔기로부터 N-아세틸 그룹의 제거를 촉매한 다음, 3'-포스포아데노신 5'-포스포설페이트로부터 설포 그룹의 제1 단계에서 N-탈아세틸화된 동일한 글루코사민 잔기로의 전달을 촉매한다. 효소의 이중의 N-데아세틸라제 및 N-설포트랜스퍼라제 활성은 2개의 별개의 구조적 도메인-N-데아세틸라제 도메인 및 N-설포트랜스퍼라제 도메인을 통해 달성된다. 그러나, 도메인 중 하나의 활성은 다른 도메인의 활성에 대해 사전에 필요하지 않으며, N-데아세틸라제 또는 N-설포트랜스퍼라제 활성을 포함하는 재조합체 단일-도메인 효소가 발현 및 정제될 수 있다. 유사하게, 및 본 발명의 구현예에서, 글루코사미닐 N-설포트랜스퍼라제 활성을 지닌 가공된 효소는 N-데아세틸라제 도메인을 추가로 포함하지 않고, 단일의 N-설포트랜스퍼라제 도메인으로서 발현 및 정제될 수 있다.
3'-포스포아데노신 5'-포스포설페이트를 이용하는 N-설포트랜스퍼라제 활성을 지닌 천연적으로 존재하는 효소는 EC 2.8.2.8 효소 부류의 구성원이다. 일반적으로, N-데아세틸라제 도메인 EC 2.8.2.8 효소는 헤파로산 내 N-아세틸 글루코사민 잔기 중 하나 이상을 탈아세틸화하여 N-탈아세틸화된 헤파로산을 형성할 것이며, 이는 이후 효소의 N-설포트랜스퍼라제 도메인에 의해 설포 그룹 수용체로 인식될 수 있다. 그러나, EC 2.8.2.8 효소의 N-설포트랜스퍼라제 도메인은 하기 화학식 II의 구조를 포함하는 하나 이상의 이당류 단위를 포함하는 헤파로산-계 다당류를 지닌 설포트랜스퍼라제 활성을 갖는 것으로 밝혀졌다:
[화학식 II]
Figure pct00013
상기 화학식 II에서, n은 정수이고 R은 수소 또는 설포 그룹으로 이루어진 그룹으로부터 선택된다. 또한, 효소와 반응하는 다당류의 부위가 화학식 II의 구조를 포함한다고 해도, 다당류내 다른 글루코사민 잔기는 N-황산화, N-아세틸화, 3-O 황산화, 및/또는 6-O 황산화될 수 있고, 헥수로닐 잔기는 글루쿠론산 또는 이두론산일 수 있으며, 이들 중 어느 하나는 2-O 황산화될 수 있다. 전형적으로, 화학식 II의 구조를 포함하는 N-탈아세틸화된 헤파로산 및 다른 헤파로산-계 다당류는 적어도 4개의 이당류 단위, 또는 적어도 총 8개의 당 잔기를 포함한다. N-탈아세틸화된 헤파로산이 설포 그룹 수용체로서 이용된 설포전달 반응은 문헌: Sheng, J., et al., (2011) J. Biol. Chem. 286 (22):19768-76, as well as Gesteira, T.F., et al., (2013) PLoS One 8 (8):e70880에 논의되어 있고, 이의 개시내용은 이의 전문이 참고로 포함된다.
화학식 II의 구조를 포함하는 3'-포스포아데노신 5'-포스포설페이트 및 헤파로산-계 다당류의 성공적인 결합시, 글루코사미닐 N-설포트랜스퍼라제 활성을 지닌 천연의 EC 2.8.2.8 효소는 설포 그룹의 비치환된 글루코사민으로의 전달을 촉매하여 하기 화학식 III의 구조를 포함하는 N-황산화된 헤파로산 생성물을 형성한다:
[화학식 III]
Figure pct00014
상기 화학식 III에서, n은 정수이고 R은 수소 원자 또는 설포 그룹으로 이루어진 그룹으로부터 선택된다.
다른 구현예에서, 임의의 가공된 아릴 설페이트-의존성 글루코사미닐 N-설포트랜스퍼라제 효소와 반응하는 헤파로산-계 다당류내 반복된 이당류 단위 각각은 화학식 II의 구조를 포함한다. 추가의 구현예에서, 글루코사미닐 잔기의 6-O 위치 및 글루쿠론산 잔기의 2-O 위치에서 R 그룹 둘 다는 다당류내 이당류 단위 중 하나 이상, 예를 들면, 모두에서 수소 원자이다. 다른 구현예에서, 다당류내 일부 위치에서, 글루코사민 잔기의 적어도 일부는, N-아세틸화된 중합체내 글루코사미닐 잔기가 본 발명의 가공된 설포트랜스퍼라제와 함께 설포 그룹 수용체로서 직접 관여할 수 없다고 해도, 도 5에 나타낸 바와 같이, 여전히 N-아세틸화되어 있다. 그러나, 다당류내 N-아세틸화된 잔기의 존재는 가공된 설포트랜스퍼라제가 동일한 다당류내에서 비-아세틸화된 잔기에 대해 갖는 결합 친화성에 영향을 미치지 않는다. 다른 구현예에서, 헤파로산-계 다당류의 구조와 상관없이, 화학식 II의 구조를 포함하는 이당류 단위는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소 및 아릴 설페이트 화합물과 함께 설포 수용체로서 이용되어 화학식 III의 구조를 포함하는 N-황산화된 생성물을 생성할 수 있다.
다른 구현예에서, 화학식 II의 구조를 포함하는 헤파로산-계 다당류 내에 다수의 이당류 단위가 존재하는 경우, 임의의 이당류 단위내 글루코사민 잔기는 N-황산화될 수 있다. 유사하게, 및 다른 구현예에서, 화학식 II의 구조를 갖는 다수의 이당류 단위를 포함하는 다당류 내에서, 다수의 글루코사민 잔기, 예를 들면, 다당류내 이용가능한 글루코사민 잔기 이하는 N-황산화될 수 있다.
야생형 EC 2.8.2.8 효소의 N-설포트랜스퍼라제 도메인은 이의 서열에서 크게 변할 수 있지만, 궁극적으로 여전히 정확하게 동일한 기능, 즉, N-탈아세틸화된 헤파로산내 치환되지 않은 글루코사민 잔기의 N-황산화를 촉매하는 기능을 가질 수 있는 대략 300 내지 350개의 아미노산 잔기를 포함한다. 특수한 이론에 제한되지 않고, 각각의 야생형 EC 2.8.2.8 효소는 모든 종에 걸쳐 동일하거나 고도로 보존된 다수의 아미노산 서열 모티프 및 제2 구조가 존재하므로 동일한 화학 반응을 촉매할 수 있다.
또한, 수개의 보존된 아미노산 서열 모티프는 3'-포스포아데노신 5'-포스포설페이트 및/또는 다당류의 결합에 직접 포함되거나, 화학 반응 자체에 관여한다. 천연 효소 의 N-설포트랜스퍼라제 도메인 사이의 보존된 아미노산 서열 모티프의 동일성은 활성 부위내 아미노산 잔기가 EC 2.8.2.8 효소 부류내 다른 천연의 설포트랜스퍼라제의 N-설포트랜스퍼라제 도메인의 아미노산 서열을 따라 확인된 공지된 결정 구조(PDB 코드: 1NST)를 갖는 사람 EC 2.8.2.8의 N-설포트랜스퍼라제 도메인의 아미노산 서열을 비교함으로써 입증될 수 있다. 수개의 원핵세포 유기체 및 사람 효소의 수개의 동형을 포함하는, 15개 효소의 N-설포트랜스퍼라제 도메인의 다중 서열 정렬은 사람 N-설포트랜스퍼라제 효소(UniProtKB-수탁 번호 P52848)에 대한 동일성 퍼센트와 함께, 도 6a, 도 6b, 및 도 6c에 나타나 있다. 도 6a, 도 6b, 및 도 6c에 나타난 바와 같이, 서열은 랫트 N-설포트랜스퍼라제 도메인에 대해 P52848 참고 서열(entry sp|Q02353|NDST1_RAT)과 98.4% 서열 동일성으로부터 초파리 N-설포트랜스퍼라제 도메인에 대해 55.6% 서열 동일성(entry sp|Q9V3L1|NDST_DROME) 까지의 범위이다. 당해 분야의 기술자는 다중 서열 정렬이 명확성의 경우 15개 서열에 한정되었으며, 확인되고 고도로 보존된 활성 부위 및.또는 결합 영역을 또한 갖는 다른 야생형 EC 2.8.2.8 효소의 N-설포트랜스퍼라제 도메인을 암호화하는 수백개의 아미노산 서열이 존재함을 인식할 수 있다.
도 6a, 도 6b, 및 도 6c내에서, 특수한 위치에서 검정색 배경과 함께 백색으로 나타낸 아미노산은 모든 서열에 걸쳐 100% 동일하다. 아미노산이 동일하거나 화학적으로 또는 구조적으로 유사함을 의미하는, 특수한 위치에서 고도로 보존된 아미노산은 검정색 윤곽으로 둘러싸여 있다. 고도로 보존된 영역 내에서, 서열의 대부분에 존재하는 컨센서스 아미노산은 굵은 글씨체이다. 동일하지 않거나 고도로 보존된 특수한 위치에서의 아미노산은 전형적으로 가변성이다. 서열내 한 주기는 고도로 보존되거나 동일한 영역 사이에 추가의 잔기를 갖는 다른 서열(들)과의 서열 정렬을 촉진하기 위해 서열내로 삽입된 갭을 나타낸다. 최종적으로, 서열의 상기 각각의 블록은 정렬내 아미노산의 동일성을 기반으로 참고로서 야생형 사람 N-설포트랜스퍼라제 효소의 구조를 사용하여, 모든 서열에 걸쳐 보존된 제2 구조를 나타내는 일련의 화살표 및 코일이다. 화살표에 인접한 β 기호는 β-시이트(β-sheet)를 지칭하는 반면, α 기호 또는 η 기호에 인접한 코일은 나선의 제2 구조를 지칭한다.
도 6a, 도 6b, 및 도 6c의 15개의 정렬된 서열 내에서, 사람 N-설포트랜스퍼라제 도메인의 결정 구조를 기반으로, 활성 부위를 포함하는 하나 이상의 아미노산을 포함하는 몇가지 보존된 아미노산 모티프가 존재한다. 도 6a, 도 6b, 및 도 6c내 아미노산 잔기의 번호매김을 기반으로, 이러한 보존된 아미노산 서열 모티프는 잔기 40-46(Q-K-T-G-T-T-A); 잔기 66-69(T-F-E-E); 잔기 101-105(F-E-K-S-A); 잔기 139-143(S-W-Y-Q-H); 및 잔기 255-262(C-L-G-K/R-S-K-G-R)를 포함한다. 추가의 구현예에서, 보존된 아미노산 서열 모티프 Q-K-T-G-T-T-A를 포함하는 EC 2.8.2.8내 야생형 설포트랜스퍼라제 효소의 일부 동형은 잔기 40 내지 49로부터의 확장된 보존된 아미노산 서열 모티프, Q-K-T-G-T-T-A-L-Y-L을 추가로 포함한다.
특수한 이론에 제한되지 않고, 이러한 잔기는 화학 반응을 촉진시키거나 이에 관여하거나, 활성 부위내 3'-포스포아데노신 5'-포스포설페이트 또는 다당류의 결합을 가능하게 하는 것으로 여겨진다. 특히 및 도 7a, 도 7b, 및 도 7c에 타나낸 바와 같이, 143번 위치(N-데아세틸라제 도메인을 또한 포함하는 전체 길이의 천연의 설포트랜스퍼라제 효소의 아미노산 서열 내 716번 위치에 상응)는 다당류내 치환되지 않은 글루코사미닐 잔기의 아민 작용 그룹내 2개의 양성자 중 하나를 추출하는 위치내에 존재하여, 질소 원자가 3'-포스포아데노신 5'-포스포설페이트의 친핵성 공격을 개시하여 설푸릴 그룹을 제거하는 것을 가능하도록 한다. 또한, 41번 및 260번 위치에서 라이신 잔기는 또한 공통적으로 보존되어 있으며, 설푸릴 모이어티와 함께 조직화되어, 활성 부위내 3'-포스포아데노신 5'-포스포설페이트의 결합을 구동할 뿐 아니라 반응 과정 동안에 전이 상태를 안정화시키는 것으로 고려된다(참조: Gesteira, T.F., et al., 상기됨, 및 Sueyoshi, T., et al., (1998) FEBS Letters 433:211-214, 이들 문헌에 개시된 내용은 본 문서에 참조로서 통합된다).
그러나, 상술한 바와 같이, EC 2.8.2.8 내 천연의 설포트랜스퍼라제 효소는, 천연의 설포트랜스퍼라제의 활성 부위가 결합을 촉진시키고/시키거나 아릴 설페이트 화합물이 활성 부위로 도입하는 것으로부터 입체적으로 방해받도록 충분히 높은 친화성을 가지지 않으므로, 아릴 설페이트 화합물로부터의 설페이트 그룹의 다당류로의 전달을 촉매할 수 없다. 결과적으로, 및 다른 구현예에서, EC 2.8.2.8 효소는 이의 아미노산 서열 내 수개의 위치에서 돌연변이되어 활성 부위내 아릴 설페이트 화합물의 결합을 가능하게 하고/하거나 아릴 설페이트 화합물을 최적으로 위치시켜 설페이트 그룹의 다당류로의 전달이 일어날 수 있도록 할 수 있다.
따라서, 및 다른 구현예에서, 본 발명의 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 도 6a, 도 6b, 및 도 6c에 나타낸 아미노산 서열을 갖는 효소를 포함하는 EC 2.8.2.8 내 임의의 천연 효소 의 N-설포트랜스퍼라제 도메인에 대해 돌연변이된 단일의 N-설포트랜스퍼라제 도메인을 포함할 수 있다. 다른 구현예에서, 본 발명의 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 EC 2.8.2.8의 임의의 천연 효소 의 N-데아세틸라제 도메인의 동일하거나 돌연변이된 아미노산 서열을 갖는 N-데아세틸라제 도메인을 추가로 포함할 수 있다.
다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소의 아미노산 서열로 가공된 돌연변이는 아릴 설페이트 화합물이 설포 그룹 공여체로서 효소와 결합하고 이와 반응하는 생물학적 활성을 촉진시킨다. 다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 설포 그룹 공여체로서 아릴 설페이트 화합물에 결합하여 이와 반응하지만, 이는 설포 그룹 수용체로서 N-탈아세틸화된 헤파로산을 포함하나, 이에 한정되지 않는, 화학식 II의 구조를 갖는 이당류 단위를 포함하는 헤파로산-계 다당류와 함께 천연의 EC 2.8.2.8 효소의 생물학적 활성을 보유한다. 특수한 이론에 제한되지 않고, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소의 아미노산 서열내로 삽입된 돌연변이로 인하여, 이의 설포트랜스퍼라제 활성은 3'-포스포아데노신 5'-포스포설페이트가 아릴 설페이트 화합물로 치환된 것을 제외하고는, 상기 도 7a 내지 도 7c에 기술된 바와 유사한 메카니즘을 사용하여 아릴 설페이트 화합물로부터 설포 그룹의 설포 수용체 다당류로의 직접적인 전달을 포함할 수 있는 것으로 여겨진다. 그렇지 않으면, 돌연변이는 아릴 설페이트 화합물의 가수분해 및 설포히스티딘 중간체의 형성을 포함하는 2-단계 공정에 이어, N-황산화된 생성물을 형성시키기 위한 N-탈아세틸화된 헤파로산 내 N-비치환된 글루코사민에 의한 설포히스티딘 중간체의 친핵성 공격에 의해 설포트랜스퍼라제 활성을 유발할 수 있는 것으로 여겨진다. 어느 하나의 메카니즘에 의해, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 하기 실시예에 기술된 바와 같이, 아릴 설페이트 화합물로부터 헤파로산-계 다당류로의 설포 전달을 달성할 수 있는 것으로 여겨진다.
다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 상술하고 도 6a, 도 6b, 및 도 6c내 천연 효소 의 N-설포트랜스퍼라제 도메인내에서 발견된 보존된 아미노산 서열 모티프에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소의 아미노산 서열 내에 존재하는 각각의 돌연변이된 아미노산 서열 모티프는 EDC 2.8.2.8 내 천연 효소 의 N-설포트랜스퍼라제 도메인내 상응하는 보존된 아미노산 서열 모티프에 대해 적어도 하나의 아미노산 돌연변이를 포함한다. 다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 하나의 돌연변이된 아미노산 서열 모티프를 포함한다. 다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 2개의 돌연변이된 아미노산 서열 모티프를 포함한다. 다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 3개의 돌연변이된 아미노산 서열 모티프를 포함한다. 다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 4개의 돌연변이된 아미노산 서열 모티프를 포함한다. 다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 5개의 돌연변이된 아미노산 서열 모티프를 포함한다. 다른 구현예에서, EC 2.8.2.8내 임의의 천연의 글루코사미닐 N-설포트랜스퍼라제 효소의 N-설포트랜스퍼라제 도메인에 대해 적어도 하나의 돌연변이된 아미노산 서열 모티프를 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 및 서열 번호: 25로 이루어진 그룹으로부터 선택된 아미노산 서열을 가질 수 있다.
다른 구현예에서, 3D 분자 가시화 시스템(예를 들면, 비-제한적 예로서, 개방-공급원 소프트웨어, PyMOL) 내 사람 N-데아세틸라제/N-설포트랜스퍼라제 효소(PDB code: 1NST)의 N-설포트랜스퍼라제 도메인의 결정 구조의 고찰 시, 관련 서열, 예를 들면, 사람 N-설포트랜스퍼라제 도메인에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 함유하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소의 구조는 도 8 내지 11에 나타낸 바와 같이 비교를 위해 모델링될 수 있다. 하나의 비-제한적 예에서, 도 8은 서열 번호: 13의 아미노산 서열을 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소로 덮힌 사람 N-설포트랜스퍼라제 도메인의 활성 부위의 확대된 도면을 나타내며, 여기서 가공된 효소의 구조는 사람 N-설포트랜스퍼라제 도메인 아미노산 서열에 대한 돌연변이의 제조시 계산된다. 3'-포스포아데노신 5'-포스포설페이트가 설포 공여체이고, 사람 N-설포트랜스퍼라제 도메인과 함께 공-결정화된 설포전달 반응의 생성물인, 아데노신 3',5'-디포스페이트가 또한 활성 부위내에 나타나 있다. PNS는 또한 이러한 용액이 가능한 경우, 다당류 결합 부위(나타내지 않음)에 인접한 효소 활성 부위 내 리간드의 최적화된 위치 및 배향을 계산하도록 설계된 분자 역학(MD) 모의의 컨센서스 용액(consensus solution)을 사용하여 가공된 효소 활성 부위로 모델링된다.
도 8에 나타낸 바와 같이, 도 6a, 도 6b, 및 도 6c에 나타낸 사람 N-설포트랜스퍼라제 도메인(UniProtKB-수탁 번호 P52848)의 서열에 대해, 서열 번호: 13 내에 수개의 돌연변이가 존재하지만, 각각의 단백질 골격은 서로 거의 동일한 위치내에 존재함으로써, 활성 부위의 1 대 1 비교가 가능하다. 서열 번호: 13의 서열을 포함하는 가공된 효소의 구조 내에서, MD 시뮬레이션(simulation)으로부터의 컨센서스 용액은 PNS내 설페이트 모이어티가 EC 2.8.2.8 내에 또한 공통적으로 보존된, 천연의 아미노산 잔기, 트레오닌에 대해 돌연변이된, 히스티딘 잔기, His-45에 인접하게 결합하는 것을 선호함을 나타낸다. 다른 한편, 사람 N-설포트랜스퍼라제 도메인 내에서, 아데노신 3',5'-디포스페이트는 상술한 보존된 His-143 근처에 위치한다. 3'-포스포아데노신 5'-포스포설페이트 기질내에 포함될 수 있는 설포 그룹이 나타나 있지 않지만, 당해 분야의 기술자는 3'-포스포아데노신 5'-포스포설페이트가 존재하는 경우, 설페이트 그룹은 His-143에 대해 바로 근접한 위치내에서 배향되고 PNS내에서 설페이트 그룹과 부분적으로 오버래핑될 수 있음을 인식할 수 있다. 특수한 이론에 제한되지 않고, 설페이트 그룹의 거의 오버래핑되는 위치는 염기로서 His-143을 사용함으로써 설포 그룹 전달을 촉진시키는 가공된 효소의 능력을 고려하여 다당류 내에서 글루코사미닐 잔기로부터 양성자를 제거하는 것으로 여겨진다.
그러나, 설페이트 그룹이 활성 부위내 거의 동일한 위치에서 결합할 수 있지만, 아릴 설페이트 화합물은 다당류에 설포 그룹 전달을 촉진시키기 위해 천연의 EC 2.8.2.8 효소와 함께 이용될 수 없다. 상술한 바와 같이, 천연 효소 의 활성 부위내 아미노산 잔기는 진화되어 3'-포스포아데노신 5'-포스포설페이트에 대한 강한 결합 친화성을 지니며, 효소는 아릴 설페이트 화합물이 결합 및 설포트랜스퍼라제 활성을 유발하기에 충분한 친화성을 가지지 않는 경향이 있는 것으로 여겨진다. 결과적으로, 다른 돌연변이가 가공된 효소 내에 존재하여 활성 부위내에서 아릴 설페이트 화합물의 결합을 유발시켜야만 한다. 도 9는 서열 번호: 13의 아미노산 서열을 포함하는 가공된 효소내 PNS를 둘러싸는 다른 돌연변이, 예를 들면, Trp-106, His-69, 및 His-40을 나타낸다. PNS 탄소 원자는 PNS와 Trp-106와 His-69 사이를 가시적으로 차별화시키는 것을 돕기 귀해 백색으로 나타나 있으며, 이는 PNS 내에서 방향족 모이어티와 π-π 스태킹 결합 접촉(stacking binding contact)을 제공하도록 위치한다. 또한, His-69 및 His-40 내 ε2 질소 원자는 설푸릴 그룹과 직접 배위된다. 천연 효소 서열로부터 보유된 라이신 잔기, Lys-41(명확성을 위해 나타내지 않음) 및 Lys-103은 전달 동안 설페이트 그룹과 배위하는 위치내에 존재하여 전이 상태를 안정화시킨다. 특히, 3'-포스포아데노신 5'-포스포설페이트내 설페이트 그룹과 또한 배위하는, 천연의 아미노산 잔기, Lys-260은 가공된 효소 서열 내에서 발린 잔기로 돌연변이된다. 특수한 이론에 제한되지 않고, PNS와의 반응에 필수적인, His-45는 260번 위치에서 라이신 잔기와 전하 반발을 나타낼 수 있고, 발린 잔기에 대한 돌연변이는 전하 반발을 제거하면서 결합 부위내에서 일부 입체적 부피(steric bulk)를 보유한다. 그럼에도 불구하고 Lys-103은, 특히 설푸릴 그룹이 도 9에 나타낸 바와 같이, His-45와 관련되거나 이에 결합된 경우, 설푸릴 그룹과 배위하도록 위치한다.
다른 비-제한적 예에서, 도 10은 서열 번호: 5의 아미노산 서열을 포함하는, 상이한 가공된 글루코사미닐 N-설포트랜스퍼라제 효소와 겹쳐진 사람 N-설포트랜스퍼라제 도메인(UniProtKB-수탁 번호 P52848)의 활성 부위의 확대된 도면을 나타낸다. PNS는 상술한 바와 같이 가공된 효소 활성 부위로 모델링된다. 서열 번호: 13의 아미노산 서열을 포함하는 가공된 효소를 사용하므로, 서열 번호: 5의 아미노산 서열을 포함하는 가공된 효소의 단백질 골격은 또한 사람 효소의 N-설포트랜스퍼라제 도메인과 거의 동일한 구조를 갖는다. 그러나, MD 시뮬레이션으로부터의 컨센서스 용액은 PNS내 설페이트 모이어티가 수개의 EC 2.8.2.8 효소의 N-설포트랜스퍼라제 도메인의 활성 부위에서 보존된 천연의 루이신 잔기로부터 돌연변이된, 상이한 히스티딘 돌연변이(His-49)에 인접하게 결합하는 것을 선호함을 나타낸다. 결과적으로, PNS와 결합 접촉을 형성한 서열 번호: 13내 돌연변이는 서열 번호: 5 내에 필수적으로 존재하지 않는다. 도 11에 나타내고 서열 번호: 13과 유사한 바와 같이, PNS, Trp-45 및 His-67의 방향족 모이어티를 둘러싸는 π-π 스태킹 결합 접촉을 형성하는 서열 번호; 5내에 존재하는 2개의 돌연변이가 존재한다. PNS와 배위되는 측쇄를 포함하는 다른 돌연변이는 Ser-69(PNS의 니트로 작용 그룹과 배위됨) 및 His-260(설페이트 모이어티와 배위됨)을 포함한다. 서열 번호: 13과 유사하게, 260번 위치에서 천연의 라이신 잔기가 돌연변이되므로, 천연의 Lys-103 잔기를 서열 번호: 5 내에서 이용하여 PNS 내에서 설페이트 모이어티와 배위시킨다.
당해 분야의 기술자는 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 15, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 및 서열 번호: 25에 기술된 것을 포함하나, 이에 한정되지 않는 임의의 다른 아미노산 서열의 가공된 글루코사미닐 N-설포트랜스퍼라제 효소가 서열 번호: 5 및 서열 번호: 13의 아미노산 서열을 갖는 사람 N-설포트랜스퍼라제 도메인 및 가공된 글루코사미닐 N-설포트랜스퍼라제 효소와 유사한 구조를 나타내는 경향이 있음을 인식할 수 있다. 특수한 이론에 한정되지 않고, 설페이트 그룹이 니트로 그룹에 대해 파라 보다는, 니트로 그룹에 대해 방향족 환 상에서 오르토로 위치한다는 것을 제외하고는, 2개의 아릴 설페이트 화합물의 구조가 매우 유사하므로, NCS는 임의의 가공된 글루코사미닐 N-설포트랜스퍼라제 효소의 활성 부위내에서 PNS와 유사한 위치로 결합할 수 있는 것으로 또한 여겨진다.
또한, 본 발명의 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 상술한 돌연변이중 하나 이상 뿐만 아니라 기질의 결합, 설포전달 반응, 또는 단백질 발현 동안 효소의 안정성을 촉진하는 다른 돌연변이를 포함하는 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 EC 2.8.2.8내 보존된 아미노산 서열 Q-K-T-G-T-T-A-L-Y-L로부터 돌연변이된, 돌연변이된 아미노산 서열 모티프, X1-K-T-G-A-W/F-A/L-L-X2-H를 포함할 수 있고, 여기서 X1은 글루타민, 세린, 및 알라닌으로 이루어진 그룹으로부터 선택되고; X2는 타이로신, 트레오닌, 및 히스티딘으로 이루어진 그룹으로부터 선택된다. 돌연변이된 아미노산 서열 모티프 X1-K-T-G-A-W/F-A/L-L-X2-H를 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 서열 번호: 5(상술됨) 뿐만 아니라, 서열 번호: 7, 서열 번호: 15; 서열 번호: 18, 서열 번호: 20, 서열 번호: 21, 및 서열 번호: 25를 포함하나, 이에 한정되지 않는다. 추가의 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 보존된 아미노산 서열 T-F-E-E로부터 돌연변이된 돌연변이된 아미노산 서열 모티프, T-X3-X4-S를 추가로 포함할 수 있고, 여기서 X3은 히스티딘 및 글리신으로 이루어진 그룹으로부터 선택된 EC 2.8.2.8 내 천연의 설포트랜스퍼라제 효소에 대한 돌연변이이고; X4는 글리신, 히스티딘, 및 세린으로 이루어진 그룹으로부터 선택된 EC 2.8.2.8 내 천연의 설포트랜스퍼라제 효소에 대한 돌연변이이고; 여기서 X3 및 X4 중 적어도 하나는 히스티딘 잔기이다. 심지어 일부 추가의 구현예에서, X1은 글루타민이고, X2는 타이로신이고, X3은 히스티딘이고, X4는 글리신이고, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 돌연변이된 아미노산 서열 모티프, C-L-G-K/R-S-H-G-R을 추가로 포함한다. 다른 심지어 추가의 구현예에서, X1은 세린이고, X2는 트레오닌이고, X3은 글리신이고, X4는 히스티딘이고, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 돌연변이된 아미노산 서열 모티프, C-H-G-K/R-R-W-G-R을 추가로 포함한다. 여전히 다른 심지어 추가의 구현예에서, X1은 알라닌이고, X2는 히스티딘이고, X3은 히스티딘이고, X4는 세린이고, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 돌연변이된 아미노산 서열 모티프, C-A-H-K/R-G-L-G-R을 추가로 포함한다.
다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 보존된 아미노산 서열 Q-K-T-G-T-T-A로부터 돌연변이된 돌연변이된 아미노산 서열 모티프, H-X5-T-G-X6-H-A를 포함할 수 있고, 여기서 X5는 라이신 및 글리신으로 이루어진 그룹으로부터 선택되고; X6은 글리신 및 발린으로 이루어진 그룹으로부터 선택된, EC 2.8.2.8 내 천연의 설포트랜스퍼라제 효소에 대한 돌연변이이다. 돌연변이된 아미노산 서열 모티프 H-X5-T-G-X6-H-A를 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 서열 번호: 13(상술됨) 뿐만 아니라, 서열 번호: 9, 서열 번호: 11; 서열 번호: 19, 서열 번호: 22, 서열 번호: 23, 및 서열 번호: 24를 포함하나, 이에 한정되지 않는다. 추가의 구현예에서, X5는 글리신이고 X6은 글리신이다. 일부 심지어 추가의 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 돌연변이된 아미노산 서열 모티프, C-G-G-K/R-H-L-G-R을 추가로 포함한다. 다른 심지어 추가의 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 돌연변이된 아미노산 서열 모티프, F-E-H-S-G를 추가로 포함한다.
다른 구현예에서, 돌연변이된 아미노산 서열 모티프, H-X5-T-G-X6-H-A를 포함하는 임의의 가공된 글루코사미닐 N-설포트랜스퍼라제 효소 내에서, X5는 라이신 및 글리신으로 이루어진 그룹으로부터 선택되고; X6은 글리신 및 발린으로 이루어진 그룹으로부터 선택된, EC 2.8.2.8 내 천연의 설포트랜스퍼라제 효소에 대한 돌연변이이다. 추가의 구현예에서, X5는 라이신이 되도록 선택되고, X6은 발린이 되도록 선택되며, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 돌연변이된 아미노산 서열 모티프, T-G-N-H를 추가로 포함한다.
추가로, 설포 그룹 공여체(하기 예 3 참조)로서 아릴 설페이트 화합물과 함께 활성이 되는 것으로 실험적으로 측정된, 6개의 가공된 글루코사미닐 N-설포트랜스퍼라제 효소의 아미노산 서열(서열 번호: 5, 서열 번호: 7 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15)을 다수의 서열 정렬로 사람 글루코사미닐 N-데아세틸라제/N-설포트랜스퍼라제 효소(entry sp|P52848|NDST1_HUMAN)의 N-설포트랜스퍼라제 도메인의 아미노산 서열과 비교하여 각각의 효소 중에서 돌연변이 사이에 관계가 존재하는지의 여부를 측정한다. 가공된 효소의 아미노산 서열내 주기는 사람 N-설포트랜스퍼라제 도메인을 지닌 특수한 위치에서 동일성을 나타낸다. 도 12에 나타낸 바와 같이, 서열 정렬은 6개의 설포트랜스퍼라제 서열내 아미노산 잔기의 90% 이상이 동일하지만, 다수의 아미노산이 선택될 수 있는 수개의 위치가 존재함을 입증한다. 특수한 이론에 제한되지 않고, 이러한 효소는 EC 2.8.2.8을 포함하는 N-데아세틸라제/N-설포트랜스퍼라제 효소의 N-설포트랜스퍼라제 도메인으로서 서로 유사한 관계를 갖는다. 그 결과, 및 다른 구현예에서, 다수의 아미노산이 정의된 위치에서 선택될 수 있는 아미노산 서열을 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 서열 번호: 18 및 서열 번호: 19에 개시되어 있다. 아미노산의 동일성이 가능한 잔기의 선택으로부터 선택될 수 있는 위치는 용어 "Xaa", "Xn", 또는 "위치 n"으로 나타내고, 여기서 n은 잔기 위치를 지칭한다.
다른 구현예에서, 서열 번호: 18 또는 서열 번호: 19의 아미노산 서열을 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소내에서, 41번 위치에서의 아미노산 잔기는 라이신이고, 44번 위치에서 아미노산 잔기는 알라닌이고, 45번 위치에서 아미노산 잔기는 방향족 아미노산 잔기, 바람직하게는 타이로신 또는 페닐알라닌이고, 49번 위치에서 아미노산 잔기는 히스티딘이다. 다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소가 41 내지 49번 위치로부터의 상기 잔기를 포함하는 경우, 67번 위치에서 아미노산 잔기는 글리신 또는 히스티딘이고, 68번 위치에서 아미노산 잔기는 글리신, 히스티딘, 및 세린으로 이루어진 그룹으로부터 선택되고, 69번 위치에서 아미노산 잔기는 세린이다.
다른 구현예에서, 서열 번호: 18 또는 서열 번호: 19의 아미노산 서열을 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소내에서, 40번 위치에서 아미노산 잔기는 히스티딘이고 45번 위치에서 아미노산 잔기는 히스티딘이다. 추가의 구현예에서, 41번 위치에서 아미노산 잔기는 글리신이고 44번 위치에서 아미노산 잔기는 글리신이다. 다른 추가의 구현예에서, 41번 위치에서 아미노산 잔기는 라이신이고 44번 위치에서 아미노산 잔기는 발린이다. 심지어 추가의 구현예에서, 67번 위치에서 아미노산 잔기는 글리신이고 69번 위치에서 아미노산 잔기는 히스티딘이다. 여전히 추가의 구현예에서, 106번 위치에서 아미노산 잔기는 트립토판이다. 심지어 여전히 추가의 구현예에서, 260번 위치에서 아미노산 잔기는 발린이다.
다른 구현예에서, 서열 번호: 18 또는 서열 번호: 19의 아미노산 서열을 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소내에서, 아미노산 서열은, 임의의 이러한 돌연변이가 효소의 글루코사미닐 N-설포트랜스퍼라제 및/또는 아릴 설페이트-의존성 활성을 제거하지 않는 한, "Xn" 또는 "Xaa"로 규정되지 않는 위치에서 하나 이상의 돌연변이를 임의로 포함할 수 있다. 다른 구현예에서, "Xn" 또는 "Xaa"로 규정되지 않는 위치에서 아릴 설페이트-의존성 활성을 제거하지 않는 이러한 돌연변이는 치환, 결실, 및/또는 첨가를 포함할 수 있다.
따라서, 다른 구현예에서, 본 발명의 임의의 방법에 따라 이용된 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 및 서열 번호: 25로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있다. 다른 구현예에서, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 또는 서열 번호: 25의 아미노산 서열을 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 임의의 아릴 설페이트 화합물과 반응할 수 있다. 추가의 구현예에서, 아릴 설페이트 화합물은 PNS, MUS, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 2NapS, 및 NCS로 이루어진 그룹으로부터 선택된다. 일부 심지어 추가의 구현예에서, 아릴 설페이트 화합물은 PNS이다. 다른 심지어 추가의 구현예에서, 아릴 설페이트 화합물은 NCS이다.
가공된 헥수로닐 2-O 설포트랜스퍼라제
천연적으로, HS 헥수로닐 2-O 설포트랜스퍼라제는 설포 그룹 수용체로서 N-황산화된 헤파로산-계 다당류를 인식하고, 이에 결합하고, 이와 반응한다. 일반적으로, 대부분의 글루코사미닐 잔기는 N-황산화되어 있고, 설포 그룹은 헥수론산 잔기, 일반적으로 글루쿠론산 또는 이두론산의 2-O-위치로 전달된다. 상술한 야생형 글루코사미닐 N-설포트랜스퍼라제를 사용하는 바와 같이, 야생형 헥수로닐 2-O-설포트랜스퍼라제는 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트와 반응시 설포 그룹을 다당류에 전달한다. 그러나, 야생형 헥수로닐 2-O 설포트랜스퍼라제는 EC 2.8.2.- 효소 부류의 구성원이다. 야생형 HS 헥수로닐 2-O 설포트랜스퍼라제 효소에 의해 인식된 헤파로산-계 다당류는 2개의 명백한 구조적 모티프 중 적어도 하나를 전형적으로 포함한다. 제1의 비-제한 예에서, 천연의 헥수로닐 2-O-설포트랜스퍼라제 효소는 하기 화학식 IV의 구조를 갖는 다당류를 인식하고, 이에 결합하며, 이와 반응할 수 있다:
[화학식 IV]
Figure pct00015
다른 비-제한적 예에서, 천연의 HS 헥수로닐 2-O-설포트랜스퍼라제 효소는 하기 화학식 V의 구조를 갖는 다당류를 인식하여, 이에 결합하고 이와 반응할 수 있다:
[화학식 V]
Figure pct00016
예 둘 다에서, 헥수론산 잔기(화학식 IV의 글루쿠론산, 화학식 V의 이두론산)는 3-O 및 6-O 위치에서 달리 치환되지 않은 N-황산화된 글루코사민 잔기에 의해 하나의 측면에서 플랭킹(flanking)된다. 야생형 HS 헥수로닐 2-O 설포트랜스퍼라제 효소, 및 화학식 IV 또는 화학식 V의 구조를 포함하는 다당류를 지닌 이의 생물학적 활성은 문헌: Rong, J., et al., (2001) Biochemistry 40 (18):5548-5555에 기술되어 있으며, 이의 개시내용은 이의 전문이 참고로 포함된다.
상술한 바와 같이, 효소와 반응하는 헤파로산-계 다당류의 부위가 화학식 IV 또는 화학식 V의 구조를 포함하지만, 다당류내 다른 글루코사민 잔기가 N-황산화, N-아세틸화, 3-O 황산화, 및/또는 6-O 황산화될 수 있고, 헥수로닐 잔기는 이들 각각이 2-O 황산화될 수 있는 글루쿠론산 또는 이두론산일 수 있다. 유사하게, 헤파로산-계 다당류는 동일한 다당류 내에서 화학식 IV의 구조 및/또는 화학식 V의 구조를 포함하는 하나 이상의 구조적 모티프를 포함할 수 있고, 이들 중 임의의 것은 동일한 효소에 의해 2-O 황산화될 수 있다. 전형적으로, 화학식 IV 및/또는 화학식 V의 구조를 포함하는 N-황산화된 헤파로산-계 다당류는 적어도 8개의 단당류 잔기를 포함한다. 다른 구현예에서, 본 발명의 가공된 헥수로닐 2-O 설포트랜스퍼라제는 헤파로산-계 다당류, 특히 설포 수용체로서, EC 2.8.2.- 내 야생형 헥수로닐 2-O 설포트랜스퍼라제로서 화학식 IV 및 화학식 V의 구조를 포함하는 것과 동일한 생물학적 활성을 갖는다.
화학식 IV 또는 화학식 V의 구조를 포함하는 헤파로산-계 다당류내 헥수론산 잔기의 입체화학은 글루쿠로닐 C5-에피머라제의 존재에 의해 제어될 수 있고, 이는 헥수론산 잔기의 C5-위치의 입체화학을 가역적으로 전환시킨다. 그러나, 화학식 IV 또는 화학식 V의 구조를 포함하는 다당류 내 헥수로닐 간지가 2-O 황산화되면, 헥수론산 잔기는 더 이상 에피머화되지 않을 수 있다. 일반적으로, 생체내에서 헥수로닐 2-O 설포트랜스퍼라제와 반응할 수 있는 N-황산화된 다당류는 N-설포글루코사민 및 글루쿠론산의 이당류 단위로서 거의 전적으로 합성된다. 이러한 글루쿠론산 잔기 중 하나 이상은 헥수로닐 2-O 설포트랜스퍼라제 효소와 반응하기 전에 이두론산 잔기로 흔히 에미퍼화되어 2-O 황산화된 이두론산 잔기를 형성한다. 그러나, 및 특수한 이론에 제한되지 않고, 야생형 헥수로닐 2-O 설포트랜스퍼라제 효소는 일반적으로 화학식 V의 구조를 포함하는 헤파로산-계 다당류와의 결합 및 반응에 대해 선호도를 가지며, 생체내에서 생산된 대부분의 N,2O-HS 다당류는 일반적으로 2-O 황산화된 이두론산을 포함하는 것으로 여겨진다.
3'-포스포아데노신 5'-포스포설페이트 및 화학식 IV의 구조를 갖는 헤파로산-계 다당류와 성공적인 결합시, 헥수로닐 2-O 설포트랜스퍼라제 활성을 갖는 천연 효소 는 글루쿠론산 잔기의 2-O 위치로 설포 그룹의 전달을 촉매하여 하기 화학식 VI의 구조를 포함하는 N,2O-HS 생성물을 형성한다:
[화학식 VI]
Figure pct00017
3'-포스포아데노신 5'-포스포설페이트 및 화학식 V의 구조를 포함하는 헤파로산-계 다당류의 성공적인 결합시, 헥수로닐 2-O 설포트랜스퍼라제 활성을 갖는 천연 효소 는 이두론산 잔기의 2-O 위치로 설포 그룹의 전달을 촉매하여, 하기 화학식 VII의 구조를 포함하는 N,2O-HS 생성물을 형성할 수 있다:
[화학식 VII]
Figure pct00018
다른 구현예에서, 2-O 황산화되기 위하여, 글루쿠론산 또는 이두론산 잔기는 화학식 IV 및 화학식 V에 나타낸 바와 같이, 2개의 N-황산화된 글루코사민 잔기에 인접하여야만 한다. 하나의 이러한 다당류의 비-제한적 예는 도 13에 나타나 있다. 도 13에서, 다당류 40 내 헥수로닐 잔기 10은 각각 N-황산화, N-아세틸화, 또는 비치환된 글루코사미닐 잔기 20, 21, 및 22에 의해 플랭킹된다. 다른 구현예에서, 다당류 40과 가공된 헥수로닐 2-O-설포트랜스퍼라제의 반응시, 2개의 N-황산화된 글루코사민 잔기 20에 의해 플랭킹된 헥수로닐 잔기 10 만이 2-O 황산화되어, 궁극적으로 생성물 다당류 41 내에 2-O 황산화된 헥수로닐 잔기 110을 형성한다.
다른 비-제한적 예에서, 화학식 IV 및 화학식 V의 구조를 포함하는 헤파로산-계 다당류의 부위는 각각의 도 14, 도 15, 및 도 16에서 다당류 50에 의해 나타낸다. 도 14, 도 15, 및 도 16에서, 헥수로닐 잔기 10 및 에피머화된 헥수로닐 잔기 30은 다당류 50 내에서 3개의 N-설포글루코사미닐 잔기 20 사이에서 교호한다. 헥수로닐 잔기 10 및 30은 의자 구조(chair conformation)로 나타나지만, 당해 분야의 기술자는 보다 긴 올리고- 또는 다당류 내 이러한 단당류 잔기가 수개의 상이한 구조, 예를 들면, 의자, 반-의자(half-chair), 보트(boat), 스큐(skew), 및 스큐 보트 구조(skew boat conformation)를 채택할 수 있고 이러한 추가의 구조가 명확성을 위해 빠져 있음을 인식할 것이다.
다른 구현예에서, 다당류 50과 가공된 아릴 설페이트-의존성 헥수로닐 2-O 설포트랜스퍼라제 효소의 반응시, 효소는 헥수로닐 잔기 10으로의 설포 그룹 전달을 촉매하여 생성물 다당류 51 내에서 황산화된 헥수로닐 잔기 110을 형성하거나(도 14), 에피머화된 헥수로닐 잔기 30으로의 설포 그룹 전달을 촉매하여 생성물 다당류 52 내에서 황산화된 헥수로닐 잔기 130을 형성하거나(도 15), 또는 헥수로닐 잔기 10 및 에피머화된 헥수로닐 잔기 30 둘 다로의 설포 그룹 전달을 촉매하여 생성물 다당류 53 내에서 황산화된 헥수로닐 잔기 110 및 황산화된 에피머화된 헥수로닐 잔기 130을 각각 형성한다(도 16).
EC 2.8.2.- 내에서 천연의 헥수로닐 2-O 설포트랜스퍼라제는 일반적으로 일부 경우에 이의 서열에 있어 크게 다양하지만, 여전히 궁극적으로 정확하게 동일한 기능, 즉, 3'-포스포아데노신 5'-포스포설페이트로부터 헤파로산-계 다당류, 특히 화학식 IV 및/또는 화학식 V의 구조를 포함하는 것 내 헥수로닐 잔기의 2-O 위치로 설포 그룹의 전달을 촉매하는 기능을 갖는 대략 325 내지 375개의 아미노산 잔기를 포함한다. 특수한 이론에 제한되지 않고, 모든 종에 걸쳐 동일하거나 고도로 보존된 다수의 아미노산 서열 모티프 및 제2 구조가 존재하므로 EC 2.8.2.- 내 각각의 천연의 헥수로닐 2-O-설포트랜스퍼라제가 동일한 화학 반응을 촉매할 수 있는 것으로 여겨진다.
또한, 수개의 보존된 아미노산 서열 모티프는 3'-포스포아데노신 5'-포스포설페이트 및/또는 다당류의 결합에 직접 포함되거나, 화학 반응 자체에 관여하는 것으로 여겨진다. 천연의 헥수로닐 2-O 설포트랜스퍼라제 효소 사이의 동일성은 활성 부위내 아미노산 잔기가 EC 2.8.2.- 내 다른 헥수로닐 2-O-설포트랜스퍼라제의 아미노산 서열을 따라 확인된, 공지된 결정 구조(PDB-코드: 3F5F 및 4NDZ)를 갖는, 닭(chicken) 헥수로닐 2-O 설포트랜스퍼라제의 아미노산 서열을 비교함으로써 입증될 수 있다. 닭, 사람, 및 다른 진핵 HS 헥수로닐 2-O 설포트랜스퍼라제 효소를 포함하는 12개의 효소의 다수의 서열 정렬은 닭 헥수로닐 2-O 설포트랜스퍼라제 참고 서열(UniProtKB-수탁 번호 Q76KB1)에 대한 동일성 퍼센트와 함께, 도 17a, 도 17b, 도 17c, 및 도 17d에 나타나 있다. 도 17a, 도 17b, 도 17c, 및 도 17d에 나타낸 바와 같이, 서열은 방울뱀(timber rattlesnake) 헥수로닐 2-O 설포트랜스퍼라제에 대한 Q76KB1 참고 서열(entry tr|T1DMV2|T1DMV2_CROHD)과 94.9% 서열 동일성으로부터 갈색 귀 진드기(brown ear tick) 헥수로닐 2-O 설포트랜스퍼라제에 대한 56.3% 서열 동일성(entry tr|A0A131Z2T4| A0A131Z2T4_RHIAP)까지를 갖는 범위이다. 사람 효소(entry sp|Q7LGA3|HS2ST_HUMAN)는 Q76KB1 참고 서열과 94.1% 서열 동일성을 갖는다. 당해 분야의 기술자는 다수의 서열 정렬이 명확성을 위해 12개의 서열로 한정되었고, 확인되고 고도로 보존된 활성 부위 및/또는 결합 영역을 또한 갖는 천연의 HS 헥수로닐 2-O 설포트랜스퍼라제 효소를 암호화하는 수백개의 아미노산 서열이 존재함을 인식할 수 있다.
도 17a, 도 17b, 도 17c, 및 도 17d 내에서, 특수한 위치에서 검정색 배경과 함께 흰색으로 나타낸 아미노산은 모든 서열에 걸쳐 100% 동일하다. 아미노산이 동일하거나, 화학적으로 또는 구조적으로 유사함을 의미하는, 고도로 보존된 아미노산은 특수한 위치에서 검정색 윤곽으로 둘러싸여 있다. 고도로 보존된 영역 내에서, 서열의 대부분을 나타내는 컨센서스 아미노산은 굵은 글씨체이다. 동일하거나 고도로 보존되지 않은 특수한 위치에서 아미노산은 전형적으로 가변성이다. 서열내 주기는 고도로 보존된 또는 동일한 영역 사이에 추가의 잔기를 갖는 다른 서열(들)과의 서열 정렬을 촉진하기 위하여 서열내로 삽입된 갭을 나타낸다. 최종적으로, 서열의 상기 각각의 블록은 정렬내 아미노산의 동일성을 기반으로 참고로서 천연의 닭 HS 헥수로닐 2-O-설포트랜스퍼라제 효소를 사용하여, 모든 서열에 걸쳐 보존된 제2 구조를 나타내는 일련의 화살표 및 코일이다. 화살표에 인접한 β 기호는 β-시트를 지칭하지만, α 기호 또는 η 기호에 인접한 코일은 나선 제2 구조를 지칭한다.
도 17a, 도 17b, 도 17c, 및 도 17d에서 12개의 정렬된 서열내에는, 상술한 닭 HS 헥수로닐 2-O-설포트랜스퍼라제 효소의 결정 구조를 기반으로, 활성 부위를 포함하는 하나 이상의 아미노산을 포함하는 수개의 보존된 아미노산 모티프가 존재한다. 도 17a, 도 17b, 도 17c, 및 도 17d 내 아미노산 잔기의 번호매김을 기반으로, 이러한 모티프는 잔기 12-19(R-V-P-K-T-A/G-S-T), 잔기 40-44(N-T-S/T-K-N), 잔기 71-74(Y-H-G-H), 잔기 108-115(F-L-R-F/H-G-D-D/N-F/Y), 잔기 121-125(R-R-K/R-Q-G), 및 잔기 217-222(S-H-L-R-K/R-T)를 포함한다. 특수한 이론에 제한되지 않고, 이러한 잔기는 화학 반응을 촉진시키거나 이에 관여하거나, 활성 부위내에서 3'-포스포아데노신 5'-포스포설페이트 또는 다당류의 결합을 가능하게 하는 것으로 여겨진다. 특수한 및 도 18a, 도 18b, 및 도 18c에 나타낸 바와 같이, 74번 위치에서 히스티딘 잔기는 다당류내 이두론산 잔기의 2-O 위치로부터 양성자를 추출하여, 친핵성 공격 및 3'-포스포아데노신 5'-포스포설페이트로부터 설포 그룹의 제거를 가능하도록 하지만, 15번 위치에서 라이신 잔기는 3'-포스포아데노신 5'-포스포설페이트의 포스페이트 모이어티와 조화되어 N,2O-HS 생성물이 활성 부위로부터 방출되기 전에 효소의 전이 부위를 안정화시킨다.
그러나, 상술한 바와 같이, EC 2.8.2.- 내 천연의 헥수로닐 2-O 설포트랜스퍼라제 효소는 아릴 설페이트 화합물로부터 다당류로 설페이트 그룹의 전달을 촉매할 수 없다. 천연의 글루코사미닐 N-설포트랜스퍼라제를 사용하는 바와 같이, 천연의 설포트랜스퍼라제의 활성 부위내에서 3'-포스포아데노신 5'-포스포설페이트에 대한 결합 포켓은 결합을 촉진시키고/시키거나 아릴 설페이트 화합물이 활성 부위로 도입되는 것으로부터 입체적으로 방해되도록 하기에 충분이 높은 친화성을 가지지 않는다. 결과적으로, 및 다른 구현예에서, EC 2.8.2.- 내 야생형 헥수로닐 2-O 설포트랜스퍼라제 효소는 이의 아미노산 서열 내 수개의 위치에서 돌연변이되어 활성 부위내 아릴 설페이트 화합물의 결합을 가능하도록 할 수 있고/있거나 아릴 설페이트 화합물을 최적으로 위치시켜 다당류에 대한 설페이트 그룹의 전달이 일어날 수 있도록 할 수 있다.
따라서, 및 다른 구현예에서, 본 발명의 가공된 헥수로닐 2-O-설포트랜스퍼라제 효소는 EC 2.8.2.- 내 천연의 헥수로닐 2-O-설포트랜스퍼라제 효소, 예를 들면, 도 17a, 도 17b, 도 17c, 및 도 17d에 나타낸 아미노산 서열을 갖는 효소의 돌연변이체일 수 있다.
다른 구현예에서, 가공된 헥수로닐 2-O-설포트랜스퍼라제이 아미노산 서열내로 가공된 돌연변이는 아릴 설페이트 화합물이 설포 그룹 공여체로서 효소와 결합하여 이와 반응할 수 있는 생물학적 활성을 촉진한다. 다른 구현예에서, 가공된 헥수로닐 2-O-설포트랜스퍼라제는 설포 그룹 공여체로서 아릴 설페이트 화합물과 결합하여 이와 반응할 수 있지만, 이는 N-황산화된 헤파로산-계 다당류, 특히 설포 그룹 수용체로서 화학식 IV 및/또는 화학식 V의 구조를 포함하는 것과 천연의 헥수로닐 2-O-설포트랜스퍼라제 효소의 생물학적 활성을 보유할 수 있다. 특수한 이론에 제한되지 않고, 가공된 헥수로닐 2-O-설포트랜스퍼라제 효소의 아미노산 서열내로 삽입된 돌연변이는 3'-포스포아데노신 5'-포스포설페이트가 아릴 설페이트 화합물로 치환되는 것을 제외하고는, 상기 도 18a 내지 도 18c에 기술된 바와 유사한 메카니즘을 사용하여 아릴 설페이트 화합물로부터 헤파로산-계 다당류로 설푸릴 그룹의 직접적인 전달을 포함할 수 있다. 또한, 돌연변이는 아릴 설페이트 화합물의 가수분해 및 설포히스티딘 중간체의 형성을 포함하는 2-단계 공정에 이은, 헥수론산 잔기의 2-O 위치에서 산소 원자에 의한 설포히스티딘 중간체의 친핵성 공격으로 N,2O-HS 생성물을 형성함을 포함하는 설포트랜스퍼라제 활성을 유발시킬 수 있다. 어느 하나의 메카니즘에 의해서도, 가공된 헥수로닐 2-O-설포트랜스퍼라제 효소는 하기 실시예에 기술된 바와 같이, 아릴 설페이트 화합물로부터 헤파로산-계 다당류로의 설포 전달을 달성할 수 있다.
다른 구현예에서, 가공된 헥수로닐 2-O-설포트랜스퍼라제 효소는 상술한 바와 같이 및 도 17a, 도 17b, 도 17c, 및 도 17d에서 다수의 서열 정렬에 나타낸 바와 같이, EC 2.8.2.- 내 천연의 헥수로닐 2-O-설포트랜스퍼라제 효소에서 발견된 보존된 아미노산 서열 모티프에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 효소의 아미노산 서열 내에 존재하는 각각의 돌연변이된 아미노산 서열 모티프는 천연의 헥수로닐 2-O 설포트랜스퍼라제 효소내 상응하는 보존된 아미노산 서열 모티프에 대해 적어도 하나의 아미노산 돌연변이를 포함한다. 다른 구현예에서, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 하나의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 2개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 3개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 4개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 5개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 6개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, EC 2.8.2.- 내 임의의 야생형 헥수로닐 2-O 설포트랜스퍼라제 효소에 대해 적어도 하나의 돌연변이된 아미노산 서열 모티프를 포함하는 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 서열 번호: 63, 서열 번호: 65, 서열 번호: 68, 및 서열 번호: 69로 이루어진 그룹으로부터 선택된 아미노산 서열을 가질 수 있다.
다른 구현예에서, 3D 분자 가시화 시스템(예를 들면, 비-제한적인 예로서, 개방-공급원 소프트웨어 PyMOL)내에서 닭 헥수로닐 2-O 설포트랜스퍼라제(PDB-코드:-3F5F)의 고찰 시, 관련된 서열, 예를 들면, 닭 헥수로닐 2-O 설포트랜스퍼라제 아미노산 서열에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 함유하는 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소의 서열은 도 19에 나타낸 바와 같은 비교를 위해 모델링될 수 있다. 도 19는 가공된 효소의 구조가 닭 헥수로닐 2-O 설포트랜스퍼라제 아미노산 서열에 대한 돌연변이의 제조시 계산되는, 서열 번호: 63 및 서열 번호; 65의 아미노산 서열을 포함하는 2개의 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소와 겹쳐진 닭 헥수로닐 2-O-설포트랜스퍼라제 효소의 활성 부위의 확대된 도면을 나타낸다. 3'-포스포아데노신 5'-포스포설페이트가 설포 공여체인 설포 전달 반응의 생성물이고, 닭 헥수로닐 2-O 설포트랜스퍼라제와 함께 공-결정화된, 아데노신 3',5'-디포스페이트는 활성 부위 내에 또한 나타나 있다. 천연의 기질인, 3'-포스포아데노신 5'-포스포설페이트 내에 존재할 수 있는 설페이트 그룹은 5'-포스페이트 기능성 그룹에 모델링되어 반응을 개시하기 전에 활성 부위내에서 이의 근접한 위치를 나타낸다. NCS는 또한 이러한 용액이 가능한 경우, 다당류 결합 부위(나타내지 않음)에 인접한 효소 활성 부위내 리간드의 최적화된 위치 및 배향을 계산하기 위해 설계된 분자 역학(MD)의 컨센서스 용액을 사용하여, 가공된 효소의 활성 부위내로 모델링된다. 수소 원자는 나타나 있지 않다.
도 19에 나타낸 바와 같이, 닭 헥수로닐 2-O 설포트랜스퍼라제에 대해 서열 번호: 63 및 서열 번호: 65에 대해 이루어진 수개의 돌연변이가 존재하지만, 각각의 단백질 골격은 서로에 대해 거의 동일한 위치에 존재하여 활성 부위의 1 대 1 비교를 가능하도록 한다. 2개의 활성 부위와 비교시, 3'-포스포아데노신 5'-포스포설페이트는 골격내에 및 라이신 잔기(도 17a에서 Q76KB1 서열의 15번 위치)에 위치하지만, 상기 MD 모의로부터 집중적인 용액은 가공된 효소내 NCS 결합이 활성 부위의 반대 측면에서 선호됨을 나타낸다. 그러나, NCS의 결합은 라이신 잔기에 의해서 뿐만 아니라, 거의 α-나선(도 17b에서 Q76KB1 서열의 108번 위치)에 위치한 페닐알라닌 잔기에 의해 천연 효소 내에서 부분적으로 입체적으로 장애될 수 있다. 특수한 이론에 제한되지 않고, 서열 번호: 63의 아미노산 서열을 포함하는 가공된 효소의 활성 부위내 NCS으 결합은 라이신 잔기의 히스티딘 잔기로의 돌연변이에 의해 촉진되며, 이는 활성 부위내에 추가의 공간을 생성하고 NCS내 방향족 환에 대한 π-π 스태킹 파트너를 제공하는 것으로 제공하는 것으로 여겨진다. 또한 특수한 이론에 제한되지 않고, 서열 번호: 65의 아미노산 서열을 포함하는 가공된 효소의 활성 부위내 NCS의 결합은 프롤린 잔기(도 17a에서 Q76KB1의 14번 위치)의 히스티딘 잔기로의 인접한 돌연변이와 함께 라이신의 아르기닌 잔기로의 돌연변이에 의해 촉진된다. 아르기닌 측쇄의 증가된 수의 구조적 자유도는 NCS의 도입을 촉진하지만 전달 반응 동안 전이 상태를 안정화시키기 위해 극성 접촉을 제공하는 위치에 여전히 존재할 수 있으나, 인접한 히스티딘은 NCS에 대해 다른 결합 접촉을 제공한다.
주목된 다른 돌연변이는 서열 번호: 63 및 서열 번호: 65 둘 다에서 221번 위치에서 발견된 돌연변이인, 아르기닌 잔기(도 17c에서 Q76KB1의 220번 위치)로부터 히스티딘 잔기로의 돌연변이를 포함한다. 특수한 이론에 제한되지 않고, 돌연변이된 히스티딘 잔기는 NCS로부터 설페이트 그룹의 제거를 촉진시키기에 선호되는 위치에 존재한다. 닭 헥수로닐 2-O-설포트랜스퍼라제 효소로부터의 다른 나타낸 돌연변이, 특히 서열 번호: 65 에 나타낸 돌연변이(His-20, Ser-114, Lys-116, Met-122)는 NCS(His-20)내 설페이트 모이어티와 직접적인 접촉을 제공하여, 다른 돌연변이된 잔기(His-221과 조화된 Ser-114)와 조화시키거나, NCS(Met-122) 근처의 소수성 환경을 증가시킴으로써, 활성 부위내 NCS의 결합을 유사하게 유발시킬 수 있다.
당해 분야의 기술자는 서열 번호: 68 및 서열 번호: 69에 개시된 것을 포함하나, 이에 한정되지 않는 임의의 다른 아미노산 서열의 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소가 닭 헥수로닐 2-O 설포트랜스퍼라제 뿐만 아니라, 서열 번호: 63 및 서열 번호: 65의 아미노산 서열을 갖는 가공된 헥수로닐 2-O-설포트랜스퍼라제에 대해 유사한 구조를 나타내는 경향이 있을 수 있음을 인식할 수 있다. 특수한 이론에 제한되지 않고, 설페이트 그룹이 PNS내에서 니트로 그룹에 대해 파라보다는, NCS내 니트로 그룹에 대해 방향족 환 상에서 오르토로 위치하는 것을 제외하고는, 2개의 아릴 설페이트 화합물의 구조가 매우 유사하므로, PNS는 임의의 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소 의 활성 부위내에서 NCS로서 유사한 위치로 결합할 수 있는 것으로 여겨진다.
따라서, 다른 구현예에서, 본 발명의 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 서열 번호: 63, 서열 번호: 65, 서열 번호: 68, 및 서열 번호: 69로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있다. 다른 구현예에서, 서열 번호: 63, 서열 번호: 65, 서열 번호: 68, 또는 서열 번호: 69의 아미노산 서열을 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 임의의 아릴 설페이트 그룹과 반응할 수 있다. 추가의 구현예에서, 아릴 설페이트 화합물은 PNS, MUS, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 2-나프틸 설페이트, 및 NCS로 이루어진 그룹으로부터 선택된다. 일부 심지어 추가의 구현예에서, 아릴 설페이트 화합물은 PNS이다. 다른 심지어 추가의 구현예에서, 아릴 설페이트 화합물은 NCS이다.
다른 구현예에서, 임의의 천연의 또는 가공된 헥수로닐 2-O-설포트랜스퍼라제 효소, 특히 서열 번호: 63, 서열 번호: 65, 서열 번호: 68, 또는 서열 번호: 69의 아미노산 서열을 포함하는 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소를 포함하는 반응 혼합물 내에서, 반응 혼합물은 글루쿠로닐 C5-에피머라제를 추가로 포함함으로써 N,2O-HS 생성물의 형성을 촉매한다. 일부 구현예에서, N,2O-HS 생성물은 화학식 VI의 구조를 포함할 수 있다. 다른 구현예에서, N,2O-HS 생성물은 화학식 VII의 구조를 포함할 수 있다. 다른 구현예에서, 글루쿠로닐 C5-에피머라제는 서열 번호: 67의 아미노산 서열을 포함할 수 있다. 다른 구현예에서, 글루쿠로닐 C5-에피머라제는 서열 번호: 67의 34 내지 617번 잔기를 포함할 수 있다.
가공된 글루코사미닐 6-O 설포트랜스퍼라제
천연적으로, HS 글루코사미닐 6-O 설포트랜스퍼라제는 설포 그룹 수용체로서 N-, 2-O 황산화된 헤파로산-계 다당류를 인식하고, 이와 결합하고, 이와 반응한다. 또한, 인접한 헥수론산 잔기는 글루쿠론산 또는 이두론산일 수 있고, 임의로 2-O 황산화될 수 있다. 전형적으로, 6-O 설포 그룹을 수용하는 글루코사민 잔기의 비-환원 말단에서 헥수론산은 2-O 황산화된 이두론산이고, 많은 예에서, 글루코사민 잔기 자체는 또한 N-황산화된다. 천연의 글루코사미닐 N-설포트랜스퍼라제 및 헥수로닐 2-O 설포트랜스퍼라제와 유사하게, 야생형 글루코사미닐 6-O 설포트랜스퍼라제 효소는 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트와의 반응시 설포 그룹을 다당류에 전달한다. 야생형 헥수로닐 2-O 설포트랜스퍼라제를 사용하는 바와 같이, 야생형 글루코사미닐 6-O 설포트랜스퍼라제 효소는 또한 EC-2.8.2.- 효소 부류의 구성원이다. 비-제한된 예에서, EC 2.8.2.- 내 글루코사미닐 6-O 설포트랜스퍼라제 효소는 하기 화학식 VIII의 구조를 포함하는 헤파로산-계 다당류를 인식하고, 이에 결합하고, 이와 반응한다:
[화학식 VIII]
Figure pct00019
상기 화학식 VIII에서, 6-O 설포 그룹을 수용하는 글루코사민 잔기는 N-황산화되고 이의 비-환원 말단에서 2-O 황산화된 이두론산 잔기에 인접하며, X는 상기 화학식 VIII에 나타낸 임의의 헥수로닐 잔기를 포함한다. N-, 2-O 황산화된 헤파로산-계 다당류, 예를 들면, 그러나 이에 한정되지 않는, 화학식 VIII의 구조를 포함하는 것과 함께 생물학적 활성을 갖는 EC 2.8.2.- 내 글루코사미닐 6-O 설포트랜스퍼라제 효소는 문헌: Xu, Y., et al., (2017) ACS Chem. Biol. 12 (1):73-82 및 Holmborn, K., et al., (2004) J.-Biol. Chem. 279, (41):42355-42358에 기술되어 있고, 이의 개시내용은 이의 전문이 참고로 포함된다.
상술한 바와 같이, 글루코사미닐 6-O 설포트랜스퍼라제 효소와 반응하는 헤파로산-계 다당류의 부위가 화학식 VIII의 구조를 포함할 수 있지만, 다당류내 다른 글루코사민 잔기는 N-황산화, N-아세틸화, 3-O 황산화, 및/또는 6-O 황산화될 수 있고, 헥수로닐 잔기는 글루쿠론산 또는 이두론산일 수 있으며, 이들 중 하나는 2-O 황산화될 수 있다. 상기 다른 가공된 설포트랜스퍼라제 효소와 유사하게, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 설포 그룹을 동일한 다당류 분자 내 다수의 글루코사민 잔기로 전달하며, 동일한 다당류 분자에 다수의 글루코사민 잔기는 동일한 폴리펩타이드에 의해 6-O 황산화될 수 있다. 전형적으로, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소, 예를 들면, 화학식 VIII의 구조를 포함하는 것과 반응할 수 있는 헤파로산-계 다당류는 적어도 3개의 단당류 잔기를 포함할 수 있다. 다른 구현예에서, 본 발명의 가공된 글루코사미닐 6-O 설포트랜스퍼라제는 헤파로산-계 설포 수용체 다당류, 특히 EC 2.8.2.- 내 야생형 글루코사미닐 6-O 설포트랜스퍼라제로서 화학식 VIII의 구조를 포함하는 헤파로산-계 다당류와 함께 동일한 생물학적 활성을 가질 수 있다.
3'-포스포아데노신 5'-포스포설페이트 및 화학식 VIII의 구조를 포함하는 헤파로산-계 다당류의 성공적인 결합시, 야생형 글루코사미닐 6-O 설포트랜스퍼라제 효소는 글루코사민 잔기의 6-O 위치로 설포 그룹의 전달을 촉매하여 하기 화학식 IX의 구조를 포함하는 N,2O,6O-HS 생성물을 형성할 수 있다:
[화학식 IX]
Figure pct00020
상기 화학식 IX에서, X는 하기 화학식 IX로 나타낸 임의의 헥수로닐 잔기를 포함한다.
다른 구현예에서, 본 발명의 가공된 글루코사미닐 6-O 설포트랜스퍼라제는 본원에 기술된 임의의 헤파로산-계 다당류, 예를 들면, 가공된 글루코사미닐 N-설포트랜스퍼라제, 가공된 헥수로닐 2-O 설포트랜스퍼라제, 및 가공된 글루코사미닐 3-O 설포트랜스퍼라제(하기에 추가로 상세히 기술됨)에 의해 설포 그룹 수용체로서 인식된 헤파로산-계 다당류에 결합하여 이와 반응할 수 있다. 다른 구현예에서, 본 발명의 가공된 글루코사미닐 6-O 설포트랜스퍼라제는 화학식 VIII의 구조를 포함하는 헤파로산-계 다당류에 결합하여 이와 반응함으로써 화학식 IX의 구조를 포함하는 N,2O,6O-HS 생성물을 형성할 수 있다. 설포 그룹 수용체로서 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소와 반응할 수 있는 하나의 이러한 헤파로산-계 다당류의 비-제한적 예는 도 20에 나타나 있다. 도 20은 아세틸 그룹 211 또는 설페이트 그룹 212로 N-치환될 수 있는 3개의 N-치환된 글루코사민 잔기 210을 포함하는 다당류 240을 나타낸다. 다당류 240 내에서, 설포 수용체로서 작용할 수 있는 N-치환된 글루코사민 잔기 210은 2개의 헥수로닐 잔기로 플랭킹된다. 헥수로닐 잔기는 화학식 VIII내 작용 그룹 "X"로 나타낸 임의의 잔기, 특히 글루쿠로닐 잔기 220 및 인두로닐 잔기 230을 포함할 수 있다. 글루쿠로닐 잔기 220 또는 인두로닐 잔기 230은 2-O 위치에서 설페이트 그룹 231에 의해 추가로 치환될 수 있다. 다당류 240과 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소 및 설포 그룹 공여체의 반응시, 임의의 글루코사민 잔기 210의 6-O 위치 213은 황산화되어, 궁극적으로 생성물 다당류 241 내에 6-O 황산화된 글루코사민 잔기 310을 형성한다.
EC 2.8.2. 내 천연의 글루코사미닐 6-O-설포트랜스퍼라제 효소는 일반적으로 일부 경우에 이의 서열 내에서 크게 변할 수 있는 대략 300 내지 700개의 아미노산 잔기를 포함하며, 여전히 궁극적으로 정확히 동일한 기능, 즉, 3'-포스포아데노신 5'-포스포설페이트로부터 N,2O-HS 다당류, 특히, 화학식 VIII의 구조를 포함하는 것의 글루코사민 잔기의 6-O 위치로 설푸릴 그룹의 전달을 촉매하는 기능을 갖는다. 특수한 이론에 제한되지 않고, 모든 종에 걸쳐 동일하거나 고도로 보존된 다수의 아미노산 서열 모티프 및 제2 구조가 존재하므로, EC 2.8.2.- 내 각각의 천연의 글루코사미닐 6-O-설포트랜스퍼라제는 동일한 화학 반응을 촉매할 수 있는 것으로 여겨진다.
또한, 수개의 보존된 아미노산 서열 모티프가 3'-포스포아데노신 5'-포스포설페이트 및/또는 다당류의 결합에 직접 포함되거나, 화학 반응 자체에 관여하는 것으로 여겨진다. 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소 사이의 동일성은 활성 부위내 아미노산 잔기가 EC 2.8.2.- 내 다른 천연의 글루코사미닐 6-O 설포트랜스퍼라제의 아미노산 서열을 따라 확인된 공지?? 결정 구조(PDB 코드 5T03, 5T05 및 5T0A)를 갖는, 제브라피쉬 글루코사미닐 6-O 설포트랜스퍼라제 동형 3-B 효소의 아미노산 서열을 비교함으로써 입증될 수 있다. 15개 효소의 다수의 서열 정렬은 마우스 글루코사미닐 6-O-설포트랜스퍼라제(동형 1) 참고 서열(UniProtKB-수탁 번호 Q9QYK5)에 대한 각각의 서열의 동일성 퍼센트를 따라, 도 21a, 도 21b, 및 도 21c에 나타나 있다. 도 21a, 도 21b, 및 도 21c에 나타낸 바와 같이, 서열은 Q9QYK5 참고 서열(entry O60243|H6ST1_HUMAN)과 97.3% 동일성으로부터 53.7% 동일성(entry A0A3P8W3M9| A0A3P8W3M9_CYSNE)까지를 갖는 범위이다. 비교를 위해. 제브라피쉬 글루코사미닐 6-O 설포트랜스퍼라제 동형 3-B 효소(entry A0MGZ7|H6S3B_DANRE)는 Q9QYK5 참고 서열과 60.4% 서열 동일성을 갖는다. 당해 분야의 기술자는 다수의 서열 정렬이 명확성을 위해 15개 서열로 한정되며, 확인되고 고도로 보존된 활성 부위 및/또는 결합 영역을 또한 갖는 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소를 암호화하는 수백개의 아미노산 서열이 존재함을 인식할 수 있다.
도 21a, 도 21b, 및 도 21c 내에서, 특수한 위치에서 검정색 배경에 백색으로 나타낸 아미노산은 모든 서열에 걸쳐 100% 동일하다. 특수한 위치에서 동일하거나 화학적으로 또는 구조적으로 유사함을 의미하는, 고도로 보존된 아미노산은 검정색 윤곽으로 둘러사여 있다. 고도로 보존된 영역내에서, 서열의 대부분에 존재하는 컨센서스 아미노산은 굵은 글씨체이다. 동일하지 않거나 고도로 보존된 특수한 위치에서의 아미노산은 전형적으로 가변성이다. 서열내 한 주기는 고도로 보존되거나 동일한 영역 사이에 추가의 잔기를 갖는 다른 서열(들)과의 서열 정렬을 촉진하기 위해 서열내로 삽입된 갭을 나타낸다. 최종적으로, 서열의 상기 각각의 블록은 정렬내 아미노산의 동일성을 기반으로 참고로서 천연의 제브라피쉬 글루코사미닐 6-O 설포트랜스퍼라제 효소의 구조를 사용하여, 모든 서열에 걸쳐 보존된 제2 구조를 나타내는 일련의 화살표 및 코일이다. 화살표에 인접한 β 기호는 β-시이트를 지칭하는 반면, α 기호에 인접한 코일은 나선의 제2 구조를 지칭한다. 도 21a, 도 21b, 및 도 21c에 나타낸 각각의 15개의 정렬된 서열은 이의 천연의 완전한 길이의 서열에 대해 트렁케이트됨으로써 본 발명의 가공된 효소, 특히 서열 번호: 104, 서열 번호: 106, 및 서열 번호: 108의 아미노산 서열을 갖는 것과 일치한다. 특히, 도 21a, 도 21b, 및 도 21c에 나타낸 잔기는 마우스 글루코사미닐 6-O 설포트랜스퍼라제 효소에 대한 Q9QYK5의 잔기 67 내지 377과 함께 정렬되어 있다.
도 21a, 도 21b, 및 도 21c에서 15개의 정렬된 서열 내에는 상술한 제브라피쉬, 글루코사미닐 6-O-설포트랜스퍼라제 효소(entry A0MGZ7|H6S3B_DANRE)의 결정 구조를 기반으로, 활성 부위를 포함하는 하나 이상의 아미노산을 포함하는 수개의 보존된 아미노산 서열 모티프가 존재한다. 도 21a, 도 21b, 및 도 21c내 아미노산 잔기의 번호매김을 기반으로 하여, 이러한 보존된 아미노산 서열 모티프는 아미노산 잔기 29 내지 34번(Q-K-T-G-G-T); 81 내지 86번(C-G-L-H-A-D); 127 내지 139번(S-E-W-R/K-H-V-Q-R-G-A-T-W-K); 178 내지 184번(N-L-A-N-N-R-Q); 및 227 내지 231번(L-T-E-F/Y-Q)을 포함한다. 특히, 및 도 22a, 도 22b, 및 도 22c에 나타낸 바와 같이, C-G-L-H-A-D 보존된 아미노산 서열 모티프내 히스티딘 잔기는 N-설포글루코사민 잔기의 6'-하이드록실 그룹으로부터 수소 원자를 추출하는 위치로 존재함으로써, 음으로 하전된 산소 원자가 이후 3'-포스포아데노신 5'-포스포설페이트의 친핵성 공격을 개시하여 설페이트 그룹을 제거하도록 한다. 또한, Q-K-T-G-G-T 보존된 아미노산 서열 모티프 내에서 공통적으로 보존된 라이신 잔기는 3'-포스포아데노신 5'-포스포설페이트내 5' 포스페이트와 조화되지만, 131번 및 138번 위치에서 공통적으로 보존된 히스티딘 및 트립토판 잔기는 N-설포글루코사민 잔기와 조화된다 (참조 Xu, Y., et al., 상기됨).
그러나, 상술한 바와 같이, EC 2.8.2.- 내 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소는 아릴 설페이트 화합물로부터 다당류로의 설페이트 그룹의 전달을 촉매할 수 없다. 특수한 이론에 제한되지 않고, 및 상술한 천연의 글루코사미닐 N-설포트랜스퍼라제 및 헥수로닐 2-O 설포트랜스퍼라제를 사용하는 바와 같이, 천연의 글루코사미닐 6-O 설포트랜스퍼라제의 활성 부위내 3'-포스포아데노신 5'-포스포설페이트에 대한 결합 포켓은 아릴 설페이트 화합물이 결합을 촉진하고 아릴 설페이트 화합물이 활성 부위로 도입하는 것으로부터 입체적으로 방해되기에 충분히 높은 친화성을 갖지 않는 것으로 여겨진다. 결과적으로, 및 다른 구현예에서, EC 2.8.2.- 내 야생형 글루코사미닐 6-O-설포트랜스퍼라제 효소는 이의 아미노산 서열 내 수개의 위치에서 돌연변이되어 활성 부위내에서 아릴 설페이트 화합물의 결합을 가능하도록 하고/하거나 아릴 설페이트 화합물을 최적으로 위치시켜 다당류에 대한 설페이트 그룹의 전달이 일어나도록 한다.
따라서, 및 다른 구현예에서, 본 발명의 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 EC 2.8.2.- 내 천연의 글루코사미닐 6-O-설포트랜스퍼라제 효소, 예를 들면, 도 21a, 도 21b, 및 도 21c에 나타낸 아미노산 서열을 갖는 효소의 돌연변이체일 수 있다.
다른 구현예에서, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소의 아미노산 서열내로 가공된 돌연변이는 아릴 설페이트 화합물이 설포 그룹 공여체로서 효소에 결합하여 이와 반응하는 생물학적 활성을 촉진시킨다. 다른 구현예에서, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소가 설포 그룹 공여체로서 아릴 설페이트 화합물에 결합하여 이와 반응한다고 해도, 이는 N,2O-HS 다당류, 예를 들면, 설포 그룹 수용체로서 화학식 VIII의 구조를 포함하는 것과 함께 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소의 생물학적 활성을 보유할 수 있다. 특수한 이론에 제한되지 않고, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소의 아미노산 서열내로 삽입된 돌연변이로 인하여, 이의 설포트랜스퍼라제 활성은, 3'-포스포아데노신 5'-포스포설페이트가 아릴 설페이트 화합물로 치환된 것을 제외하고는, 도 22a 내지 도 22c에 기술된 바와 유사한 메카니즘을 사용하여, 아릴 설페이트 화합물로부터 헤파로산-계 다당류로 설푸릴 그룹의 직접적인 전달을 포함할 수 있다. 그렇지 않으면, 돌연변이는 설포트랜스퍼라제 활성을 유발함으로써 아릴 설페이트 화합물의 가수분해 및 설포히스티딘 중간체의 형성을 포함하는 2-단계 공정에 이은, 글루코사민 잔기의 6-O 위치에서 산소 원자에 의한 설포히스티딘 중간체의 친핵성 공격에 의해 6-O 황산화된 HS 생성물을 형성시킴을 포함하는 것으로 여겨진다. 다른 구현예에서, 설포전달 메카니즘의 6-O 황산화된 HS 생성물은 N,2O,6O-HS 생성물이다. 본 발명의 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 하기 실시예에 기술된 바와 같이, 아릴 설페이트 화합물로부터 헤파로산-계 다당류로의 설포 그룹 전달을 달성할 수 있다.
다른 구현예에서, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 상술되고 도 21a, 도 21b, 및 도 21c에서 다수의 서열 정렬에서 나타낸 바와 같이 EC 2.8.2.- 내 천연의 글루코사미닐 6-O-설포트랜스퍼라제 효소에서 발견된 보존된 아미노산 서열 모티프에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 효소의 아미노산 서열 내에 존재하는 각각의 돌연변이된 아미노산 서열 모티프는 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소내 상응하는 보존된 아미노산 서열 모티프에 대해 적어도 하나의 아미노산 돌연변이를 포함한다. 다른 구현예에서, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 하나의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 2개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 3개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 4개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 5개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 EC 2.8.2.- 내 임의의 야생형 HS 글루코사미닐 6-O-설포트랜스퍼라제 효소에 대해 적어도 하나의 돌연변이된 아미노산 서열 모티프를 포함하며, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 및 서열 번호: 122로 이루어진 그룹으로부터 선택된 아미노산 서열을 가질 수 있다.
다른 구현예에서, 3D 분자 가시화 시스템(예를 들면, 비-제한적 예로서, 개방-공급원 소프트웨어, PyMOL) 내 제브라피쉬 글루코사미닐 6-O-설포트랜스퍼라제 효소(UniProtKB 수탁 번호: A0MGZ7)의 임의의 결정 구조의 고찰 시, 관련 서열, 예를 들면, 임의의 제브라피쉬 글루코사미닐 6-O 설포트랜스퍼라제 구조에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 함유하는 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소의 구조는 도 23에 나타낸 바와 같이 비교를 위해 모델링될 수 있다. 도 23은 서열 번호: 108의 아미노산 서열을 포함하는 본 발명의 가공된 효소 중 하나를 지닌 제브라피쉬 글루코사미닐 6-O 설포트랜스퍼라제 효소(PDB 코드: 5TO3)의 활성 부위의 확대된 도면을 나타내며, 여기서 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소의 구조는 제브라피쉬 글루코사미닐 6-O 설포트랜스퍼라제 아미노산 서열에 대해 돌연변이의 제조시 계산된다. 3'-포스포아데노신 5'-포스포설페이트가 설포 공여체이고, 제브라피쉬 글루코사미닐 6-O 설포트랜스퍼라제와 함께 공-결정화된 설포전달 반응의 생성물인, 아데노신 3',5'-디포스페이트가 또한 활성 부위내에 나타나 있다. PNS는 또한 이러한 용액이 가능한 경우, 다당류 결합 부위(나타내지 않음)에 인접한 효소 활성 부위 내 리간드의 최적화된 위치 및 배향을 계산하도록 설계된 분자 역학(MD) 모의의 컨센서스 용액을 사용하여, 가공된 효소 활성 부위로 모델링된다. 수소 원자는 명확성을 위해 나타내지 않는다.
도 23에 나타낸 바와 같이, 제브라피쉬 글루코사미닐 6-O 설포트랜스퍼라제 효소에 대해 서열 번호: 108에 이루어진 수개의 돌연변이가 존재하지만, 각각의 단백질 골격은 서로에 대해 거의 동일한 위치내에 존재함으로써 활성 부위의 1 대 1 비교가 가능하도록 한다. 그러나, 2개의 활성 부위를 비교하는 경우, 아데노신 3',5'-디포스페이트 생성물은 상기 MD 시뮬레이션으로부터 집중된 용액에 의해 측정된 것으로서, PNS 분자와 같이 중심 α-나선의 반대 측면에 위치한다. 특수한 이론에 제한되지 않고, 제브리피쉬 효소내 3'-포스포아데노신 5'-포스포설페이트와 동일하거나 유사한 위치에서 PNS를 향산 충분한 친화성이 존재하지 않으므로, 집중된 MD 시뮬레이션 용액은 PNS를 α-나선의 반대 측면에 위치시킨다. 상기 문헌: Xu, Y., et al.에 기술된 바와 같이, 전체 길이의 아미노산 서열의 158번 위치에서 보존된 히스티딘은 N-설포글루코사민의 6' 하이드록실 그룹으로부터 양성자를 추출하는 촉매적 히스티딘이며, 이는 후속적으로 3'-포스포아데노신 5'-포스포설페이트와 반응하여 설포 그룹 전달을 개시할 수 있다. 여전히, 3'-포스포아데노신 5'-포스포설페이트 및 PNS에 대한 결합 포켓에서의 명백한 차이에도 불구하고, 서열 번호: 104, 서열 번호: 106, 및 서열 번호: 108의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소 모두는 하기 실시예에 기술된 바와 같이, 아릴 설페이트 화합물로부터 헤파로산-계 다당류내 하나 이상의 글루코사민 잔기의 6-O 위치로 설포 그룹 전달을 달성하였다.
그 결과, 및 특수한 이론에 제한되지 않고, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소의 활성 부위내에 존재하는 하나 이상의 돌연변이는 설포 수용체 HS 다당류로 전달될 수 있는 위치에서 아릴 설페이트 화합물의 설페이트 모이어티의 결합을 보조할 수 있다. 도 23에 나타낸 바와 같이, 가공된 효소는 서열 번호: 108의 아미노산 서열을 가지고, 아릴 설페이트 화합물은 PNS이다. 그러나, 헤파로산-계 다당류는 나타내지 않는다. 비-제한된 예에서, 서열 번호: 108의 31번 위치로 가공된 히스티딘 잔기는 상기 문헌: Malojcic, et al에 기술된 메카니즘과 유사하게, 핑-퐁 메카니즘(ping-pong mechanism)을 사용하여 PNS로부터 설페이트 그룹의 제거를 촉진하는 위치에 존재할 수 있다. 또한, 서열 번호: 108의 133번 위치로 가공된 히스티딘 잔기는 서열 번호: 108의 132번 위치(도 21b에서 각각의 서열내 131번 위치에 상응)에서 보존된 히스티딘을 따라 설페이트 모이어티와 추가로 조화될 수 있다. 서열 번호: 22의 137 내지 139번 위치에서 G-A-N(도 21b에서의 서열의 136 내지 138번 위치에서 보존된 A-T-W 모티프에 상응)에 대한 돌연변이는 설페이트가 서열 번호: 108의 31번 위치에서 가공된 히스티딘에 의해 추출될 수 있는 위치에서 PNS의 결합을 방지할 수 있는 입체적 부피를 제거한다. A-T-W를 함유하는 루프내 G-A-N에 대한 돌연변이는 루프가 PNS로부터 제거되도록 하며, 이는 또한 PNS를 추가로 보조하여 이의 결합 포켓에 이르도록 할 수 있다. 최종적으로, 상술한 전체 길이의 제브라피쉬 글루코사미닐 6-O 설포트랜스퍼라네내 His-158에 상응하는 천연의 히스티딘에 바로 인접한 서열 번호: 108의 84번 위치로 가공된 세린 잔기는 추가의 수소-결합 접촉을 생성하여 설포 수용체 다당류와 함께 제브라피쉬 효소의 천연의 활성을 보유하는데 있어서 가공된 효소를 보조할 수 있다.
당해 분야의 기술자는 임의의 다른 아미노산 서열의 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소, 예를 들면, 그러나 이에 한정되지 않는, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 및 서열 번호: 122에 의해 개시된 것이 특히 활성 부위내에서 유사한 구조적 모티프를 나타낼 수 있음을 인식할 수 있다. 특수한 이론에 제한되지 않고, 설페이트 그룹이 니트로 그룹에 대해 파라보다는, 니트로 그룹에 대해 방향족 환 상에서 오르토로 위치하는 것을 제외하고는, 2개의 아릴 설페이트 화합물의 구조가 매우 유사하기 때문에, NCS는 임의의 가공된 효소의 활성 부위내에서 PNS와 유사한 위치로 결합할 수 있는 것으로 여겨진다.
다른 구현예에서, 본 발명의 방법에 따라 이용될 수 있는 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 하나 이상의 돌연변이된 아미노산 서열 모티프를 포함할 수 있으며, 이는 야생형 효소 및/또는 모델링된 가공된 효소, 예를 들면, 그러나 이에 한정되지 않는, 도 23에 나타낸 효소의 공지된 구조(들)을 지닌 도 21a, 도 21b, 및 도 21c의 다수의 서열 정렬에 나타낸 보존된 아미노산 서열 모티프를 비교함으로써 부분적으로 측정할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소내에 포함될 수 있는 돌연변이된 아미노산 서열 모티프는 (a)-G-H-T-G-G-T; (b)-C-G-X1-X2-A-D(여기서, X1은 트레오닌 및 세린으로 이루어진 그룹으로부터 선택되고, X2는 아스파라긴, 아르기닌, 및 히스티딘으로 이루어진 그룹으로부터 선택된다); (c) X3-X4-W-R-H-X5-Q-R-G-G-X6-N-K(여기서, X3은 세린 및 글리신으로 이루어진 그룹으로부터 선택되고, X4는 글리신 및 히스티딘으로 이루어진 그룹으로부터 선택되고, X5는 히스티딘 및 트레오닌으로 이루어진 그룹으로부터 선택되고, X6은 알라닌 및 트레오닌으로 이루어진 그룹으로부터 선택된다); 및 (d) N-L-X7-N-N-R-Q(여기서, X7은 알라닌 및 글리신으로 이루어진 그룹으로부터 선택된다)로 이루어진 그룹, 예를 들면 이의 임의의 조합으로부터 선택될 수 있다. 각각의 돌연변이된 아미노산 서열 모티프는 상기 도 21a, 도 21b, 및 도 21c에 나타낸 보존된 아미노산 모티프에 상응하고, 서열 모티프 (a)는 보존된 아미노산 서열 모티프, Q-K-T-G-G-T에 상응하고; 돌연변이된 아미노산 서열 모티프 (b)는 보존된 아미노산 서열 모티프, C-G-L-H-A-D에 상응하고; 돌연변이된 아미노산 서열 모티프 (c)는 보존된 아미노산 서열 모티프, S-E-W-(R/K)-H-V-Q-R-G-A-T-W-K에 상응하고; 돌연변이된 아미노산 서열 모티프 (d)는 보존된 아미노산 서열 모티프, N-L-A-N-N-R-Q에 상응한다. 다른 구현예에서, 상술된 적어도 하나의 돌연변이된 아미노산 서열 모티프를 포함하는 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 및 서열 번호: 122로 이루어진 그룹으로부터 선택될 수 있다.
다른 구현예에서 및 하나의 비-제한된 실시예에서, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 동일한 아미노산 서열 내에 돌연변이된 아미노산 서열 모티프 (b) 및 (c)를 포함할 수 있다. 돌연변이된 아미노산 서열 모티프 (b) 및 (c)를 포함하는 가공된 효소는 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 또는 서열 번호: 122의 아미노산 서열을 포함하는 효소를 포함하나, 이에 한정되지 않는다. 다른 구현예에서, 돌연변이된 아미노산 서열 모티프 (b) 및 (c)를 포함하는 각각의 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 도 23에 나타낸 바와 같이, 서열 번호: 108과 유사한 활성 부위를 갖는다. 다른 이론에 제한되지 않고, 돌연변이된 아미노산 서열 모티프 (b) 및 (c)에 포함된 수개의 돌연변이는 다음을 포함하나, 이에 한정되지 않는 하나 이상의 기능을 갖는 것으로 여겨진다: 결합 포켓의 크기를 감소시킴에 의한 활성 부위에 대한 아릴 설페이트 화합물의 친화성의 증가, 포켓의 소수성의 증가, 극성 또는 수소 결합 접촉의 제거 또는 생성, 및/또는 아릴 설페이트 화합물의 방향족 모이어티와π-π 상호작용의 생성; 화학 반응 동안 효소의 전이 상태의 안정화; 및/또는 화학 반응 자체에서의 관여.
다른 구현예에서, 돌연변이된 아미노산 서열 모티프 (b) 및 (c)를 포함하는 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소내에서, X4는 글리신이고 X5는 히스티딘이다. 다른 구현예에서, X4는 히스티딘이고 X5는 트레오닌니다.
다른 구현예에서, 돌연변이된 아미노산 서열 모티프 (b) 및 (c)를 포함하는 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소 내에서, X3은 세린이고, X6은 알라닌이고, X7은 글리신이다. 다른 구현예에서, X3은 글리신이고, X6은 트레오닌이고, X7은 알라닌이다.
또한, 설포 그룹 공여체(하기 예 5 참조)로서 아릴 설페이트 화합물과 함께 활성 설포트랜스퍼라제인 것으로 실험적으로 측정된, 3개의 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소의 아미노산 서열(서열 번호: 104, 서열 번호: 106, 및 서열 번호: 108)을 다중 서열 정렬에서 마우스 글루코사미닐 6-O-설포트랜스퍼라제 효소(entry Q9QYK5|H6ST1_MOUSE)의 아미노산 서열과 비교하여 각각의 효소내 돌연변이 사이에 관계가 존재하는지의 여부를 측정할 수 있다. 가공된 효소의 아미노산 서열내 주기는 마우스 글루코사미닐 6-O-설포트랜스퍼라제 효소를 지닌 특수한 위치에서 동일성을 나타낸다. 도 24에 나타낸 바와 같이, 서열 정렬은 3개의 설포트랜스퍼라제 서열내 아미노산 잔기의 90% 이상이 동일하지만, 다수의 아미노산이 선택될 수 있는 수개의 위치가 존재함을 입증한다. 특수한 이론에 제한되지 않고, 이러한 효소는 서로 EC 2.8.2.-를 포함하는 글루코사미닐 6-O-설포트랜스퍼라제 효소와 유사한 관계를 갖는다. 그 결과, 및 다른 구현예에서, 다수의 아미노산이 정의된 위치에서 선택될 수 있는 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 서열 번호: 112 및 서열 번호: 113으로 개시되어 있다. 아미노산의 동일성이 가능한 잔기의 선택으로부터 선택될 수 있는 위치는 용어 "Xaa", "Xn", 또는 "위치 n"으로 나타내며, 여기서 n은 잔기 위치를 지칭한다.
다른 구현예에서, 서열 번호: 112 내에서, 명칭 "Xaa"를 갖는 잔기는 서열 번호: 104, 서열 번호: 106, 및 서열 번호: 108의 아미노산 서열 내 특수한 위치에서 동일성의 결여가 있는 공지된 예를 나타낸다. 다른 구현예에서, 아미노산 서열, 서열 번호: 113은 또한 서열 번호: 104, 서열 번호: 106, 및 서열 번호: 108의 아미노산 서열내 특수한 위치에서 동일성의 결여가 존재하는 공지된 예를 나타내지만, 서열 번호: 113은 비-제한적인 예로서, 마우스, 사람, 및 돼지 글루코사미닐 6-O 설포트랜스퍼라제 효소를 포함하는 EC 2.8.2.- 내 수개의 천연의 전체 길이의 글루코사미닐 6-O 설포트랜스퍼라제 효소의 N-말단 잔기 1-66, 및 C-말단 잔기 378-411를 추가로 포함한다. 대조적으로, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 및 서열 번호: 112 내 아미노산 잔기는 비-제한적인 예로서, 마우스, 사람, 및 돼지 글루코사미닐 6-O 설포트랜스퍼라제 효소를 포함하는, EC 2.8.2.- 내 수개의 전체 길이의 글루코사미닐 6-O 설포트랜스퍼라제 효소의 잔기 67-377에 상응한다. 단백질 발현을 촉진시키기 위해, N-말단 메티오닌 잔기를 마우스, 사람, 및 돼지 글루코사미닐 6-O 설포트랜스퍼라제 효소의 잔기 67-377에 대해 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 및 서열 번호: 112 아미노산 서열 각각에 가하였다.
다른 구현예에서, 수득되는 효소가 설포 그룹 공여체로서 아릴 설페이트 화합물과 반응시 이의 글루코사미닐 6-O 설포트랜스퍼라제 활성을 유지하는 한, 임의의 선택이, 아미노산 서열 서열 번호: 112 또는 서열 번호: 113에 의해 정의된, Xaa 잔기에 대해 이루어질 수 있다.
다른 구현예에서, 서열 번호: 112의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소내에서, 129번 위치에서의 아미노산 잔기는 글리신이고, 133번 위치에서 아미노산 잔기는 히스티딘이다. 다른 구현예에서, 서열 번호: 112의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소내에서, 129번 위치에서 아미노산 잔기는 히스티딘이고 133번 위치에서 아미노산 잔기는 트레오닌이다. 다른 구현예에서, 서열 번호: 113의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소내에서, 194번 위치에서 아미노산 잔기는 글리신이고 198번 위치에서 아미노산 잔기는 히스티딘이다. 다른 구현예에서, 서열 번호: 113의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소내에서, 194번 위치에서 아미노산 잔기는 히스티딘이고 198번 위치에서 아미노산 잔기는 트레오닌이다.
다른 구현예에서, 서열 번호: 112의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소내에서, 128번 위치에서 아미노산 잔기는 세린이고 138번 위치에서 아미노산 잔기는 알라닌이고, 181번 위치에서 아미노산 잔기는 글리신이다. 다른 구현예에서, 서열 번호: 112의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소내에서, 128번 위치에서 아미노산 잔기는 글리신이고 138번 위치에서 아미노산 잔기는 트레오닌이고, 181번 위치에서 아미노산 잔기는 알라닌이다. 다른 구현예에서, 서열 번호: 113의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소내에서, 193번 위치에서 아미노산 잔기는 세린이고 203번 위치에서 아미노산 잔기는 알라닌이고, 246번 위치에서 아미노산 잔기는 글리신이다.
다른 구현예에서, 서열 번호: 113의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소내에서, 193번 위치에서 아미노산 잔기는 글리신이고, 203번 위치에서 아미노산 잔기는 트레오닌이고, 246번 위치에서 아미노산 잔기는 알라닌이다.
다른 구현예에서, 서열 번호: 112 또는 서열 번호: 113의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소내에서, 아미노산 서열은, 임의의 이러한 돌연변이가 효소의 글루코사미닐 6-O 설포트랜스퍼라제 및/또는 아릴 설페이트-의존성 활성을 제거하지 않는 한, "Xn" 또는 "Xaa"로 규정되지 않은 잔기 위치에서 하나 이상의 돌연변이를 임의로 포함할 수 있다. 다른 구현예에서, "Xn" 또는 "Xaa"로 규정되지 않은 위치에서 아릴 설페이트-의존성 활성을 제거하지 않는 이러한 돌연변이는 치환, 결실, 및/또는 첨가를 포함할 수 있다.
따라서, 다른 구현예에서, 본 발명의 임의의 방법에 따라 이용된 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 및 서열 번호: 122로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 서열 번호: 104, 서열 번호: 106., 서열 번호: 108, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122의 아미노산 서열을 포함한다. 추가의 구현예에서, 아릴 설페이트 화합물은 PNS, 4-메틸움벨리페릴 설페이트, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 2NapS, 및 NCS로 이루어진 그룹으로부터 선택된다. 일부의 심지어 추가의 구현예에서, 아릴 설페이트 화합물은 PNS이다. 다른 심지어 추가의 구현예에서, 아릴 설페이트 화합물은 NCS이다.
가공된 글루코사미닐 3-O 설포트랜스퍼라제
천연적으로, HS 글루코사미닐 3-O 설포트랜스퍼라제는 설포 그룹 수용체로서 N,2O-HS 및 N,2O,6O-HS 헤파로산-계 다당류를 인식하고, 이에 결합하고, 이와 반응한다. 일반적으로, 3-O 위치에서 설포 그룹을 수용하는 글루코사민 잔기는 N-황산화되고, 임으로 또한 6-O 황산화된다. 또한, 인접한 헥수론산 잔기는 글루쿠론산 또는 이두론산일 수 있고, 이들 중 하나는 임의로 2-O 황산화될 수 있다. 흔히, 3-O 황산화된 글루코사민 잔기는 이의 비-환원 말단에서 글루쿠론산에 및 이의 환원 말단에서 2-O 황산화된 이두론산에 인접해 있다. 상술한 각각의 야생형 설포트랜스퍼라제와 유사하게, 천연적으로 존재하는 글루코사미닐 3-O 설포트랜스퍼라제는 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트와의 반응시 설포 그룹을 헤파로산-계 다당류에 전달한다. 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트를 이용하는 야생형 글루코사미닐 3-O 설포트랜스퍼라제 효소는 EC-2.8.2.23 효소 부류의 구성원이다. 비-제한적 예에서, EC 2.8.2.23 내 천연의 글루코사미닐 3-O 설포트랜스퍼라제 효소는 하기 화학식 X의 구조를 포함하는 N,2O,6O-HS 다당류을 인식하고, 이에 결합하고, 이와 반응한다;
[화학식 X]
Figure pct00021
상기 화학식 X에서, 중심 글루코사민 잔기는 N-황산화되고 이의 비-환원 말단에서 글루쿠론산에 및 이의 환원 말단에서 2-O 황산화된 이두론산 잔기에 인접해 있고, X는 임의로 설페이트 그룹 또는 아세틸 그룹일 수 있고, Y는 임의로 설페이트 그룹 또는 하이드록실 그룹일 수 있다.
상술한 바와 같이, 글루코사미닐 3-O 설포트랜스퍼라제 효소와 반응하는 헤파로산-계 다당류는 화학식 VIII의 구조를 포함할 수 있지만, 다당류내 다른 글루코사민 잔기는 N-황산화, N-아세틸화, 3-O 황산화, 및/또는 6-O 황산화될 수 있고, 헥수로닐 잔기는 글루쿠론산 또는 이두론산일 수 있으며, 이들 각각은 2-O 황산화될 수 있다. 상기 다른 가공된 설포트랜스퍼라제 효소와 유사하게, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 동일한 다당류 분자내에서 설포 그룹을 다수의 글루코사민 잔기에 전달할 수 있고, 다당류 분자내 다수의 글루코사민 잔기는 동일한 폴리펩타이드에 의해 3-O 황산화될 수 있다. 전형적으로, 설포 그룹 수용체로서 천연의 글루코사미닐 3-O 설포트랜스퍼라제와 반응할 수 있는 헤파로산-계 다당류는 전형적으로 화학식 X에 나타낸 바와 같이, 적어도 5개의 단당류 잔기를 포함한다. 다른 구현예에서, 화학식 X의 구조를 포함하고, 설포 그룹 수용체로서 천연의 글루코사미닐 3-O 설포트랜스퍼라제와 반응할 수 있는 헤파로산-계 다당류는 적어도 32개의 단당류 잔기를 포함할 수 있다. 다른 구현예에서, 본 발명의 가공된 글루코사미닐 3-O 설포트랜스퍼라제는 설포 수용체로서 헤파로산-계 다당류, 특히, EC 2.8.2.23.내 야생형 글루코사미닐 3-O 설포트랜스퍼라제 효소로서, 화학식 X의 구조를 포함하는 다당류와 동일한 생물학적 활성을 가질 수 있다.
3'-포스포아데노신 5'-포스포설페이트 및 화학식 X의 구조를 포함하는 헤파로산-계 다당류의 성공적인 결합시, 야생형 글루코사미닐 3-O 설포트랜스퍼라제 효소는 중심 글루코사민 잔기의 3-O 위치로 설포 그룹의 전달을 촉진하여, 하기 화학식 I의 구조를 포함하는 N,2O,3O,6O-HS 생성물을 형성할 수 있다:
[화학식 I]
Figure pct00022
상기 화학식 I에서, X는 설포 그룹 또는 아세테이트 그룹이고 Y는 설포 그룹 또는 하이드록실 그룹이다. EC 2.8.2.23 내 야생형 글루코사미닐 3-O-설포트랜스퍼라제 효소는 설포 그룹 수용체로서 화학식 X의 구조를 포함하는 N,2O,6O-HS 다당류와 함게 생물학적 활성을 가지며, 화학식 I의 구조를 포함하는 N,2O,3O,6O-HS 생성물을 형성하고, 문헌: Xu, D., et al., (2008) Nat. Chem. Biol. 4(3): 200-202 및 Edavettal, S.C., et al., (2004) J.-Biol. Chem. 24(11): 25789-25797에 기술되어 있으며, 이의 개시내용은 이의 전문이 참고로 포함된다. 또한, 화학식 I의 구조를 포함하는 N,2O,3O,6O-HS 생성물은 흔히 항응고 활성을 갖는다. 가공된 글루코사미닐 3-O 설포트랜스퍼라제를 사용하여 항응고 N,2O,3O,6O-HS 생성물을 형성하는 방법은 하기에 추가로 상세히 기술되어 있다.
설포 그룹 수용체로서 본 발명의 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소와 반응할 수 있는 하나의 헤파로산-계 다당류의 비-제한적 예는 도 25에 나타나 있다. 도 25는 각각의 N-위치에 N-설포 그룹 411 및 각각의 6-O 위치에 O-설포 그룹 412를 포함하는 3개의 글루코사민 잔기 410을 포함하는 다당류 440을 나타낸다. 다당류 440 내에서, 설포 수용체로서 작용할 수 있는 글루코사민 잔기 410는 2개의 헥수론산 잔기에 의해 플랭킹되어야 한다. 헥수론산 잔기는 화학식 X에서 작용 그룹 "X"로 나타낸 임의의 잔기를 포함할 수 있고, 도 25에서 글루쿠론산 잔기 420 및 이두론산 잔기 430으로 나타낸다. 어느 헥수론산 잔기도 2-O 위치에서 설포 그룹 431에 의해 추가로 치환될 수 있다. 다당류 440과 HS 글루코사미닐 3-O-설포트랜스퍼라제 효소 및 설포 그룹 공여체의 반응시, 임의의 글루코사미닐 잔기 410의 3-O 위치 413은 황산화될 수 있다. 도 25에 나타낸 바와 같이, 중심 글루코사민 잔기 410은 설포 그룹을 수용하여, 궁극적으로 황산화된 생성물 다당류 441 내에서 3-O 황산화된 글루코사미닐 잔기 510을 형성한다. 또한, 나타낸 바와 같이, 황산화된 생성물 다당류 441은 화학식 I의 구조를 포함한다.
EC 2.8.2.23 내 천연의 글루코사미닐 3-O-설포트랜스퍼라제 효소는 일반적으로 일부 경우에 이의 서열내에서 크게 변할 수 있지만, 여전히 궁극적으로, 정확하게 동일한 기능, 즉, 3'-포스포아데노신 5'-포스포설페이트로부터 N,2O-HS 또는 N,2O,6O-HS 다당류, 특히 화학식 X의 구조를 포함하는 것 내의 N-설포글루코사민 잔기로 설푸릴 그룹의 전달을 촉매하는 기능을 가질 수 있는, 대략 300 내지 325개의 아미노산 잔기를 포함한다. 특수한 이론에 제한되지 않고, EC 2.8.2.23 효소 부류내 각각의 천연의 글루코사미닐 3-O 설포트랜스퍼라제는, 모든 종에 걸쳐 동일하거나 고도로 보존된 다수의 아미노산 서열 모티프 및 제2 구조가 존재하므로, 동일한 화학 반응을 촉매할 수 있다.
또한, 수개의 보존된 아미노산 서열 모티프는 3'-포스포아데노신 5'-포스포설페이트 및/또는 다당류의 결합에 직접 포함되거나, 화학 반응 자체에 관여하는 것으로 여겨진다. 천연의 글루코사미닐 3-O 설포트랜스퍼라제 효소 사이의 동일성은 EX 2.8.2.23 내 다른 글루코사미닐 3-O 설포트랜스퍼라제의 아미노산 서열을 따라, 활성 부위내 아미노산 잔기가 확인된 공지된 결정 구조(각각 PDB 코드 3UAN 및 1ZRH)를 갖는 마우스 또는 사람 글루코사미닐 3-O 설포트랜스퍼라제 효소의 동형 1의 아미노산 서열을 비교함으로써 입증할 수 있다. 또한, 마우스 및 사람 글루코사미닐 3-O 설포트랜스퍼라제 구조의 직접적인 비교는 효소 둘 다가 거의 동일한 활성 부위를 가지며 2개의 효소가 서로 단지 83% 서열 동일성을 가지지만, 전체적으로 폴딩되어 있음을 나타낸다.
마우스 및 사람 효소를 포함하는, EC 2.8.2.23 내 15개 효소의 다중 서열 정렬은 사람 글루코사미닐 3-O 설포트랜스퍼라제(동형 1) 참고 서열(UniProtKB-수탁 번호 O14792)에 대한 각각의 서열의 동일성 퍼센트와 함께, 도 26a, 도 26b, 및 도 26c에 나타낸다. 도 26a, 도 26b, 및 도 26c에 나타낸 바와 같이, 서열은 레서스 원숭이(rhesus monkey) HS 글루코사미닐 3-O 설포트랜스퍼라제에 대한 O14792 참고 서열(entry tr|H9ZG39|H9ZG39_MACMU)에 대해 98% 동일성으로부터, 사람 글루코사미닐 3-O 설포트랜스퍼라제의 동형 5에 대해 53% 동일성(entry sp|Q8IZT8|HS3S5_HUMAN)의 범위이다. 당해 분야의 기술자는 다중 서열 정렬이 명확성을 위해 15개 서열로 한정되었고, 확인되고 고도로 보존된 활성 부위 및/또는 결합 영역을 또한 갖는 천연의 글루코사미닐 3-O 설포트랜스퍼라제 효소를 암호화하는 수백개의 아미노산 서열이 존재함을 인식할 수 있다.
도 26a, 도 26b, 및 도 26c 내에서, 특수한 위치에서 검정색 배경과 함께 백색으로 나타낸 아미노산은 모든 서열에 걸쳐 100% 동일하다. 아미노산이 특수한 위치에서 동일하거나 구조적으로 유사함을 의미하는, 고도로 보존된 아미노산은 검정색 윤곽으로 둘러싸여 있다. 고도로 보존된 영역 내에서, 서열의 대부분에 존재하는 컨센서스 아미노산은 굵은 글씨체이다. 동일하지 않거나 고도로 보존된 특수한 위치에서의 아미노산은 전형적으로 가변성이다. 서열내 한 주기는 고도로 보존되거나 동일한 영역 사이에 추가의 잔기를 갖는 다른 서열(들)과의 서열 정렬을 촉진하기 위해 서열내로 삽입된 갭을 나타낸다. 최종적으로, 서열의 상기 각각의 블록은 정렬내 아미노산의 동일성을 기반으로 참고로서 천연의 설포트랜스퍼라제 효소의 구조를 사용하여, 모든 서열에 걸쳐 보존된 제2 구조를 나타내는 일련의 화살표 및 코일이다. 화살표에 인접한 β 기호는 β-시이트를 지칭하는 반면, α 기호 또는 η 기호에 인접한 코일은 나선의 제2 구조를 지칭한다.
도 26a, 도 26b, 및 도 26c의 15개의 정렬된 서열 내에서, 상술된 마우스(entry sp|O35310|HS3S1_MOUSE) 및 사람 글루코사미닐 3-O 설포트랜스퍼라제(entry sp|O14792|HS3S1_HUMAN) 효소의 결정 구조를 기반으로, 활성 부위를 포함하는 하나 이상의 아미노산을 포함하는 수개의 보존된 아미노산 서열 모티프가 존재한다. 도 26a, 도 26b, 및 도 26c내 아미노산 잔기의 번호매김을 기반으로 하여, 이러한 모티프는 잔기 16-27번(잔기 18-23로부터 G-V-R-K-G-G 포함), 잔기 43-48번(E-V/I-H-F-F-D), 잔기 78-81번(P-A/G-Y-F), 잔기 112-117번(S-D-Y-T-Q-V 포함), 및 잔기 145-147번(Y-K-A)을 포함한다. 이러한 잔기는 화학 반응을 촉진시키거나 이에 관여하거나, 활성 부위내에서 3'-포스포아데노신 5'-포스포설페이트 또는 다당류의 결합을 가능하게 하는 것으로 여겨진다. 특히, 상술한 바와 같이, 및 도 4a, 도 4b, 및 도 4c에 나타낸 바와 같이, 잔기 43-48번 내에서, 43번 위치의 글루탐산 잔기는 다당류내 N-설포글루코사민 잔기의 3-O 위치로부터 양성자를 추출하여, 친핵성 공격 및 3'-포스포아데노신 5'-포스포설페이트로부터 설포 그룹의 제거를 가능하게 하지만, His-45 및 Asp-48은 조화되어 설푸릴화된 다당류 생성물이 활성 부위로부터 방출되기 전에 효소의 전이 상태를 안정화시킨다.
그러나, 상술한 바와 같이, EC 2.8.2.23 내 천연의 글루코사미닐 3-O 설포트랜스퍼라제 효소는 아릴 설페이트 화합물로부터 다당류로 설페이트 그룹의 전달을 촉매할 수 없다. 특수한 이론에 제한되지 않고, 상술한 천연의 글루코사미닐 N-설포트랜스퍼라제, 헥수로닐 2-O 설포트랜스퍼라제, 및 글루코사미닐 6-O 설포트랜스퍼라제를 사용하는 바와 같이, 천연의 설포트랜스퍼라제내 3'-포스포아데노신 5'-포스포설페이트에 대한 결합 포켓은 아릴 설페이트 화합물이 결합을 촉진시키고/시키거나 아릴 설페이트 화합물이 활성 부위로 도입되는 것으로부터 입체적으로 장애되기에 충분히 높은 친화성을 가지지 않는 것으로 여겨진다. 결과적으로, 및 다른 구현예에서, EC-2.8.2.23 내 야생형 글루코사미닐 3-O-설포트랜스퍼라제 효소는 이의 아미노산 서열내 수개의 위치에서 돌연변이되어 활성 부위내에서 아릴 설페이트 화합물의 결합을 가능하도록 하고/하거나 아릴 설페이트 화합물을 최적으로 위치시켜 다당류로의 설페이트 그룹의 전달이 발생할 수 있도록 할 수 있다.
따라서, 및 다른 구현예에서, 본 발명의 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 EC 2.8.2.23 내 천연의 글루코사미닐 3-O-설포트랜스퍼라제 효소, 예를 들면, 도 26a, 도 26b, 및 도 26c에 나타낸 아미노산 서열을 갖는 효소의 돌연변이체일 수 있다.
다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소의 아미노산 서열 내로 가공된 돌연변이는 아릴 설페이트 화합물이 설포 그룹 공여체로서 효소에 결함하여 이와 반응할 수 있는 생물학적 활성을 촉진시킨다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 설포 그룹 공여체로서 아릴 설페이트 화합물과 결합하여 이와 반응할 수 있지만, 이는 헤파로산-계 다당류, 예를 들면, 설포 그룹 수용체로서 화학식 X의 구조를 포함하는 것과 함께 천연의 글루코사미닐 3-O 설포트랜스퍼라제 효소의 생물학적 활성을 보유할 수 있다. 특수한 이론에 제한되지 않고, 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소의 아미노산 서열내로 삽입된 돌연변이로 인하여, 3'-포스포아데노신 5'-포스포설페이트가 아릴 설페이트 화합물로 치환된 것을 제외하고는, 이의 설포트랜스퍼라제 활성은 상기 도 4a 내지 도 4c에 기술된 바와 유사한 메카니즘을 사용하여, 아릴 설페이트 화합물로부터 헤파로산-계 다앙류로 설푸릴 그룹의 직접적인 전달을 포함할 수 있다. 그렇지 않으면, 돌연변이는 설포트랜스퍼라제 활성을 유발시켜 아릴 설페이트 화합물의 가수분해 및 설포히스티딘 중간체의 형성을 포함하는 2-단계 공정에 이은, 글루코사민 잔기의 3-O 위치에서 산소 원자에 의한 설포히스티딘 중간체의 친핵성 공격에 의해 3-O 황산화된 HS 생성물을 형성하는 것을 포함할 수 있는 것으로 여겨진다. 다른 구현예에서, 설포전달 메카니즘의 3-O-황산화된 생성물은 N,2O,3O,6O-HS 생성물이다. 본 발명의 가공된 효소는 하기 실시예에 기술된 바와 같이, 아릴 설페이트 화합물로부터 헤파로산-계 다당류로의 설포 그룹 전달을 달성할 수 있다.
다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 상술하고 도 26a, 도 26b, 및 도 26c내 다중 서열 정렬에 나타낸 바와 같이, EC 2.8.2.23 내 천연의 글루코사미닐 3-O-설포트랜스퍼라제 효소에서 발견된 보존된 아미노산 서열 모티프에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 효소의 아미노산 서열 내에 존재하는 각각의 돌연변이된 아미노산 서열 모티프는 천연의 글루코사미닐 3-O 설포트랜스퍼라제 효소내 상응하는 보존된 아미노산 서열 모티프에 대해 적어도 하나의 아미노산 돌연변이를 포함한다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 하나의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 2개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 3개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 4개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 5개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, EC-2.8.2.23 내 임의의 야생형 글루코사미닐 3-O 설포트랜스퍼라제 효소에 대해 적어도 하나의 돌연변이된 아미노산 서열 모티프를 포함하는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160으로 이루어진 그룹으로부터 선택된 아미노산 서열을 가질 수 있다.
다른 구현예에서, 3D 분자 가시화 시스템(예를 들면, 비-제한적 예로서, 개방-공급원 소프트웨어, PyMOL) 내 마우스글루코사미닐 3-O 설포트랜스퍼라제의 결정 구조의 고찰 시, 관련 서열의 구조, 예를 들면, 마우스 글루코사미닐 3-O 설포트랜스퍼라제(UniProtKB 수탁 번호 O35310)에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 함유하는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소의 구조는 도 27에 나타낸 바와 같이 비교를 위해 모델링될 수 있다. 도 27은 서열 번호: 147, 서열 번호: 149, 및 서열 번호: 151의 아미노산 서열을 포함하는, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소를 지닌 마우스 글루코사미닐 3-O 설포트랜스퍼라제 효소(PDB 코드: 3UAN)의 활성 부위의 확대된 도면을 나타낸다. 3'-포스포아데노신 5'-포스포설페이트가 설포 공여체이고, 마우스 글루코사미닐 3-O 설포트랜스퍼라제와 함께 공-결정화된 설포전달 반응의 생성물인, 아데노신 3',5'-디포스페이트가 또한 활성 부위내에 나타나 있다. PNS는 또한 이러한 용액이 가능한 경우, 다당류 결합 부위(나타내지 않음)에 인접한 효소 활성 부위 내 리간드의 최적화된 위치 및 배향을 계산하도록 설계된 분자 역학(MD) 시뮬레이션의 컨센서스 용액을 사용하여 가공된 효소 활성 부위로 모델링된다. 수소 원자는 명확성을 위해 나타내지 않는다.
도 27에 나타낸 바와 같이, 천연의 마우스 글루코사미닐 3-O-설포트랜스퍼라제에 대해 서열 번호: 147, 서열 번호: 149, 및 서열 번호: 151 에 대해 이루어진 수개의 돌연변이가 존재하지만, 각각의 단백질 골격은 서로 거의 동일한 위치에 존재함으로써, 활성 부위의 1 대 1 비교가 가능하도록 한다. 그러나, 2개의 활성 부위를 비교하는 경우, 천연의 설포전달 반응로부터의 아데노신 3',5'-디포스페이트 생성물은 라이신 잔기에 인접한 반면, 상기 MD 모의로부터의 집중된 용액은 가공된 효소내 PNS 결합이 활성 부위의 반대 측면에서 선호됨을 나타낸다. 특수한 이론에 제한되지 않고, 집중된 DM 시뮬레이션 용액은, 3'-포스포아데노신 5'-포스포설페이트와 동일하거나 유사한 위치에서 PNS를 향해 충분한 친화성이 존재하지 않으므로, 활성 부위의 반대 측면에 PNS를 위치시키는 것으로 여겨진다. 여전히, 3'-포스포아데노신 5'-포스포설페이트 및 PNS에 대한 결합 포켓에서의 명백한 차이에도 불구하고, 서열 번호: 147, 서열 번호: 149, 및 서열 번호: 151의 아미노산 서열을 포함하는 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소 모두는 하기 실시예에 기술된 바와 같이, 아릴 설페이트 화합물로부터 헤파로산-계 다당류내 하나 이상의 위치의 3-O 위치로 설포 전달을 달성하였다.
또한, 마우스 글루코사미닐 3-O 설포트랜스퍼라제의 20번 위치에 상응하고, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소내에 존재하는 경우, 도 26a, 도 26b, 및 도 26c에 나타낸 다른 글루코사미닐 3-O 설포트랜스퍼라제 효소 모두에서 보존된 아르기닌 잔기는 도 27에 나타낸 위치에서의 결합으로부터 PNS를 차단하는 것으로 여겨진다. 따라서, 및 다른 구현예에서, PNS에 결합하는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 활성 부위 아르기닌 잔기의 글리신 잔기로의 돌연변이를 포함하고, 이는 결합 포켓내에서 PNS가 결합하기 위한 모든 입체적 장애를 제거한다. 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 및 서열 번호: 157에 대한 아미노선 서열에서 나타낸 바와 같이, 아르기닌 대 글리신 돌연변이는 21번 위치에 존재한다. 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160에 대한 아미노산 서열에서 나타낸 바와 같이, 아르기닌 대 글리신 돌연변이는 99번 위치에 존재한다.
유사하게, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 및 서열 번호: 157의 아미노산 서열내 22번 위치에 상응하는 가공된 효소 각각에서 다음의 아미노산 잔기는 히스티딘 잔기로 돌연변이된다. 특수한 이론에 제한되지 않고, 보존된 라이신 잔기(도 26a내 아미노산 서열 각각에서 21번 위치에 상응함)로부터 히스티딘 잔기에 대한 돌연변이는 상기 문헌: Malojcic, et al.에 기술된 바와 같은 유사한 메카니즘을 사용하여, PNS로부터 설페이트 그룹의 제거를 촉진한다. 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160에 대한 아미노산 서열에서 나타난 바와 같이, 라이신 대 히스티딘 잔기는 100번 위치에 있다.
당해 분야의 기술자는 임의의 다른 아미노산 서열, 예를 들면, 그러나 이에 한정되지 않는, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160에 개시된 것의 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소가 특히 활성 부위내에서 서열 번호: 147, 서열 번호: 149, 및 서열 번호: 151의 아미노산 서열을 갖는 가공된 효소와 유사한 구조적 모티프를 나타낼 수 있음을 인식할 수 있다. 특수한 이론에 제한되지 않고, 설페이트 그룹이 니트로 그룹에 대해 파라보다는, 니트로 그룹에 대해 방향족 한에서 오르토로 위치한다는 것을 제외하고는, 2개의 아릴 설페이트 화합물의 구조가 매우 유사하므로, NCS는 임의의 가공된 효소의 활성 부위내 PNS와 유사한 위치로 결합할 수 있는 것으로 여겨진다.
다른 구현예에서, 본 발명의 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소는 하나 이상의 돌연변이된 아미노산 서열 모티프를 포함할 수 있으며, 이는 도 26a, 도 26b, 및 도 26c의 다수의 서열 정렬에 나타낸 보존된 아미노산 서열 모티프를 야생형 효소 및/또는 모델링된 가공된 효소, 예를 들면, 도 27에 나타낸 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소의 공지된 구조(들)와 비교함으로써 부분적으로 측정할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소 내에 포함될 수 있는 돌연변이된 아미노산 서열 모티프는 (a)-G-V-G-H-G-G; (b)-H-S-Y-F; (c) S-X1-X2-T-H-X3(여기서, X1은 알라닌 및 루이신으로 이루어진 그룹으로부터 선택되고; X2는 타이로신 및 글리신으로 이루어진 그룹으로부터 선택되고, X3은 메티오닌 및 루이신으로 이루어진 그룹으로부터 선택된다); 및 (d) Y-X4-G(여기서, X4는 발린 및 트레오닌으로 이루어진 그룹으로부터 선택된다)로 이루어진 그룹; 예를 들면 이의 임의의 조합으로부터 선택될 수 있다. 각각의 돌연변이된 아미노산 서열 모티프는 상기 도 26a, 도 26b, 및 도 26c에 나타낸 보존된 아미노산 모티프에 상응하고; 돌연변이된 아미노산 서열 모티프 G-V-G-H-G-G는 보존된 아미노산 서열 모티프 G-V-R-K-G-G에 상응하고; 돌연변이된 아미노산 서열 모티프 H-S-Y-F는 보존된 아미노산 서열 모티프 P-A/G-Y-F에 상응하고; 돌연변이된 아미노산 서열 모티프 S-X1-X2-T-H-X3은 보존된 아미노산 서열 모티프 S-D-Y-T-Q-V에 상응하고; 돌연변이된 아미노산 서열 모티프 Y-X4-G는 보존된 아미노산 서열 모티프 Y-K-A에 상응한다. 다른 구현예에서, 각각의 상기 돌연변이된 아미노산 서열 모티프를 포함하는 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소는 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160으로 이루어진 그룹으로부터 선택될 수 있다.
다른 구현예에서, 각각의 돌연변이된 아미노산 서열 모티프는 EC 2.8.2.23 내 천연의 글루코사미닐 3-O-설포트랜스퍼라제 효소에서 발견된 보존된 아미노산에 대해 이루어진 적어도 하나의 돌연변이를 포함할 수 있다. 다른 구현예에서, 돌연변이된 아미노산 서열 모티프 (a)는 보존된 아미노산 서열 모티프, G-V-R-K-G-G에 대해 R-K 대 G-H 돌연변이를 함유한다. 다른 구현예에서, 돌연변이된 아미노산 서열 모티프 (b)는 보존된 아미노산 서열 모티프, P-A/G-Y-F에 대해 P-A/G 대 H-S 돌연변이를 함유한다. 다른 구현예에서, X1, X2, 및 X3 위치에서 이루어진 잠재적인 돌연변이 외에, 돌연변이된 아미노산 서열 모티프 (c)는 보존된 아미노산 서열 모티프, S-D-Y-T-Q-V에 대해 Q-대-H 돌연변이를 포함한다. 다른 구현예에서, X4 위치에서의 돌연변이 외에, 돌연변이된 아미노산 서열 모티프 (d)는 보존된 아미노산 서열 모티프, Y-K-A에 대해 A 대 G 돌연변이를 포함한다.
다른 구현예에서, X1은 알라닌이고, X2는 타이로신이고; X3은 메티오닌이고, X4는 발린 또는 트레오닌이다. 다른 구현예에서, X1은 루이신이고, X2는 글리신이고; X3은 루이신이고, X4는 트레오닌이다. 다른 이론에 제한되지 않고, 돌연변이된 아미노산 서열 모티프 (b), (c), 및 (d)에 포함된 돌연변이 중 하나 이상은 화학 반응 동안 효소의 전이 상태를 안정화시키거나, 예를 들면, 결합 포켓의 크기를 감소시키고/시키거나, 포켓의 소수성을 증가시키고/시키거나, 아릴 설페이트 화합물의 방향족 모이어티와의 π-π 상호작용을 생성함으로써 활성 부위에 대한 아릴 설페이트 화합물의 친화성을 증가시키는데 역활을 담당하는 것으로 여겨진다.
또한, 설포 그룹 공여체(하기 예 6 참조)로서 아릴 설페이트 화합물과 활성인 것으로 실험적으로 측정된, 3개의 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소의 아미노산 서열(서열 번호: 147, 서열 번호: 149, 및 서열 번호: 151)은 다중 서열 정렬에서 사람 글루코사미닐 3-O 설포트랜스퍼라제 효소(entry sp|O14792|HS3S1_HUMAN)의 제1 동형의 아미노산 서열과 비교하여 각각의 효소 중 돌연변이 사이에 관계가 존재하는지의 여부를 측정할 수 있다. 가공된 효소의 아미노산 서열내 주기는 사람 글루코사미닐 3-O-설포트랜스퍼라제 효소를 지닌 특수한 위치에서 동일성을 나탄내다. 도 28에 나타낸 바와 같이, 서열 정렬은 3개의 설포트랜스퍼라제 서열내 아미노산 잔기의 90% 이상이 동일하지만, 다수의 아미노산이 선택도리 수 있는 수개의 위치가 존재함을 입증한다. 그 결과, 및 다른 구현예에서, 다수의 아미노산이 정의된 위치에서 선택될 수 있는 아미노산 서열을 포함하는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 서열 번호: 154로 개시되어 있다. 아미노산의 동일선이 가능한 잔기의 선택으로부터 선택될 수 있는 위치는 용어 "Xaa", "Xn", 또는 "위치 n"으로 나타내며, 여기서 n은 잔기 위치를 지칭한다.
다른 구현예에서, 서열 번호: 154의 아미노산 서열을 포함하는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소 내에서, 114번 위치에서 아미노산 잔기는 알라닌이도, 118번 위치에서 아미노산 잔기는 메티오닌이다. 추가의 구현예에서, 147번 위치에서 아미노산 잔기는 발린 및 트레오닌으로 이루어진 그룹으로부터 선택된다.
다른 구현예에서, 서열 번호: 154의 아미노산 서열을 포함하는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소 내에서, 114번 위치에서 아미노산 잔기는 루이신이고, 118번 위치에서 아미노산 잔기는 루이신이고, 121번 위치에서 아미노산 잔기는 발린이다. 추가의 구현예에서, 115번 위치에서 아미노산 잔기는 글리신이다. 심지어 추가의 구현예에서, 147번 위치에서 아미노산 잔기는 트레오닌이다.
다른 구현예에서, 서열 번호: 154의 아미노산 서열을 포함하는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소내에서, 아미노산 서열은, 임의의 이러한 돌연변이가 글루코사미닐 3-O 설포트랜스퍼라제 및/또는 효소의 아릴 설페이트-의존성 활성을 제거하지 않는 한, "Xn" 또는 "Xaa"로 규정되지 않은 잔기 위치에서 하나 이상의 돌연변이를 임의로 포함할 수 있다. 다른 구현예에서, "Xn" 또는 "Xaa"로 규정되지 않은 위치에서 아릴 설페이트-의존성 활성을 제거하지 않는 이러한 돌연변이는 치환, 결실, 및/또는 첨가를 포함할 수 있다.
따라서, 다른 구현예에서, 본 발명의 임의의 방법에 따라 이용된 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소는 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160으로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있다. 다른 구현예에서, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160의 아미노산 서열을 포함하는 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소는 임의의 아릴 설페이트 화합물과 반응할 수 있다. 추가의 구현예에서, 아릴 설페이트 화합물은 PNS, 4-메틸움벨리페릴 설페이트, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 2NapS, 및 NCS로 이루어진 그룹으로부터 선택된다. 일부 심지어 추가의 구현예에서, 아릴 설페이트 화합물은 PNS이다. 다른 심지어 추가의 구현예에서, 아릴 설페이트 화합물은 NCS이다.
황산화된 다당류의 시험관내 합성
본 발명의 구현예에서, 상술된 임의의 가공된 설포트랜스퍼라제 효소를 이용하여 황산화된 헤파로산-계 다당류를 합성할 수 있다. 일반적으로, 황산화는 헤파로산-계 다당류 및 아릴 설페이트 화합물을 가공된 설포트랜스퍼라제 효소로 처리하여 황산화된 생성물을 형성시킴으로써 달성할 수 있다. 상술한 바와 같이 및 특수한 이론에 제한되지 않고, 설포 그룹 수용체로서 헤파로산-계 다당류를 인식하지만, 또한 설포 공여체로서 아릴 설페이트 화합물과 결합하여 이와 반응하는 설포트랜스퍼라제 효소는 천연적으로 또는 앞서 기술된 바와 같이 관찰되지 않았던 것으로 여겨진다.
황산화된 헤파로산-계 다당류(이후 "HS-다당류")와 관련하여, 산업, 상업, 또는 약제 용도로 이용된 HS 다당류는, 다당류가 생체내에서 생산되는, 동물 공급원, 특히 돼지 및 소로부터 단리함으로써 다량으로 수득할 수 있다(참조: Xu, Y., et al., (2011) Science 334 (6055): 498-501). 항응고제 HS 다당류의 2007 및 2008년 전세계적인 오염 사고는 동물 공급원으로부터 이를 수득하는데 있어서 유일하게 의존하는 시설에 관한 주목을 나타내었다. 결과적으로, 동물-공급된 생성물을 보완하거나 대체하기에 충분히 다량으로 시험관내에서 항응고제 HS 다당류를 합성하기 위한 합성 경로를 개발하기 위한 압력이 존재하였다. 이러한 압력은 유일하게, 2019년에, 특히 중국에서, 전세계적인 돼지 집단을 사멸시킨 아프리카 돼지 플루 유행병(African swine flu epidemic)에 의해 심지어 추가로 강화되었다.
시험관내에서 황산화된 다당류를 합성하기 위하여, 2개의 반응 도식이 역사적으로 존재하였다: 전체적인 화학적 합성 및 화학효소적 합성. 반응식 유형 둘 다는 일부 예에서 균질한 정제된 생성물을 이끌었지만, 전체적으로 합성 경로는 황산화된 다당류, 특히 항응고제 HS 다당류를 산업적 규모로 생산하는데 부적절하였다. 실제로, 전체적인 화학적 합성을 사용한 이러한 다당류의 생성이 60개로 많은 단계로서 역사적으로 요구되었고 매우 낮은 수율을 생성하였다 (참조 Balagurunathan, K., et al., (eds.) (2015) Glycosaminoglycans: Chemistry and Biology, Methods in Molecular Biology, vol. 1229, DOI 10.1007/978-1-4939-1714-3_2, ⓒ Springer Science + Business Media New York).
한편, 화학효소적 합성 경로는 일반적으로 훨씬 적은 단계를 이용하며 생성된 항응고제 생성물의 규모를 수밀리그램 양으로 증가시킨다 (참조 U.S. Pat. No. 8,771,995 및 9,951,149, 이들 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 수득가능한 생성물의 양에 있어서의 개선은 반응 용기 속에서 재조합체 HS 설포트랜스퍼라제와 3'-포스포아데노신 5'-포스포설페이트를 합하는 능력에 기여하으로써 설포 그룹의 헤파로산-계 다당류로의 전달을 촉매할 수 있다. 여전히, 이러한 점에 대한 화학효소적 방법은, 이의 개시내용이 이의 전문으로 참고로 포함된, 미국 특허 5,541,095, 5,817,487, 5,834,282, 6,861,254, 8,771,995, 9,951,149, 및 미국 특허 공보 2009/0035787, 2013/0296540, 및 2016/0122446에 기술된 바와 같이, 이의 활성을 위한 야생형 설포트랜스퍼라제의 3'-포스포아데노신 5'-포스포설페이트에 대한 의존성으로 인하여 항응고제 HS 다당류를 그램- 또는 대규모 양으로 합성하는 것이 적합하지 않다. pH 8.0에서 3'-포스포아데노신 5'-포스포설페이트의 반감기가 단지 약 20시간이므로, 3'-포스포아데노신 5'-포스포설페이트는 효소적으로 황산화된 생성물, 예를 들면, 항응고제 HS 다당류의 대규모 생성에 장애가 되는 매우 고가의 불안정한 분자이다.
또한, 아데노신 3',5'-디포스페이트에 의한 생성물 억제는 또한 황산화된 생성물의 대규모 합성에 대한 제안 요인이 되어 왔다. 아데노신 3',5'-디포스페이트에 의한 생성물 억제의 매우 부정적인 영향은 아데노신 3',5'-디포스페이트를 3'-포스포아데노신 5'-포스포설페이트로 전환시키는 3'-포스포아데노신 5'-포스포설페이트 재생 시스템을 사용함으로써 어느 정도 감소시킬 수 있다 (참조 U.S. Pat. No. 6,255,088, 상기됨, 및 Burkhart, et al. (2000) J. Org. Chem. 65: 5565-5574). 그러나, 3'-포스포아데노신 5'-포스포설페이트 재생 시스템에도 불구하고, 3'-포스포아데노신 5'-포스포설페이트를 공급하여 천연의 설포트랜스퍼라제와의 반응을 개시하기 위한 절대적인 필요성은 그럼에도 불구하고 산업적인, 생산 등급 규모에서 황산화된 생성물, 예를 들면, 항응고제 HS 다당류를 합성하는데 대처할 수 없는 높은 비용 장벽을 생성한다.
활성을 유도시키기 위하여, 설포 공여체로서 3'-포스포아데노신 5'-포스포설페이트를 필요로 하는 황산화된 다당류의 공지된 화학효소적 합성과는 대조적으로, 본 발명의 방법은, 본 발명의 설포트랜스퍼라제 각각이 설포 공여체로서 천연의 HS 설포트랜스퍼라제와 반응하지 않는, 아릴 설페이트 화합물을 인식하여, 이에 결합하고, 이와 반응하도록 가공되므로, 3'-포스포아데노신 5'-포스포설페이트를 모두 함께 사용할 필요성을 제거한다. 특수한 이론에 제한되지 않고, 본 발명의 가공된 설포트랜스퍼라제는 설포 그룹 공여체로서 아릴 설페이트 화합물 뿐만 아니라, 설포 그룹 수용체로서, 다당류, 특히 헤파로산-계 다당류와 결합할 수 있는 유일하게 공지된 설포트랜스퍼라제이다.
따라서, 다른 구현예에서, 본 발명은 HS 다당류를 합성하기 위한 방법 및 키트(kit)를 제공한다. 일반적으로 본 발명의 가공된 설포트랜스퍼라제를 사용하여 헤파로산-계 다당류를 황산화하는 방법은 다음의 단계를 포함한다: (a) 아릴 설페이트 화합물을 제공하는 단계; (b) 상술된 임의의 가공된 설포트랜스퍼라제 효소를 제공하는 단계로서, 여기서 가공된 설포트랜스퍼라제 효소는 설포 그룹 공여체로서 아릴 설페이트 화합물과 함께 생물학적 활성을 갖는 단계; (c) 헤파로산-계 다당류를 제공하는 단계; (d) 아릴 설페이트 화합물, 설포트랜스퍼라제 효소, 및 헤파로산-계 다당류를 반응 혼합물내로 합하는 단계; 및 (e) 설포트랜스퍼라제 효소를 사용하여, 아릴 설페이트 화합물로부터 헤파로산-계 다당류로 설포 그룹을 전달함으로써, 황산화된 다당류 생성물을 형성시키는 단계. 다른 구현예에서, 아릴 설페이트 화합물은 PNS, 4-메틸움벨리페릴 설페이트, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 2NapS, 및 NCS로 이루어진 그룹으로부터 선택될 수 있다. 본 발명에 따르면, 아릴 설페이트 화합물은 PNS일 수 있다. 본 발명에 따르면, 아릴 설페이트 화합물은 NCS일 수 있다.
다른 구현예에서, 가공된 설포트랜스퍼라제 효소가 글루코사미닐 N-설포트랜스퍼라제 효소인 경우, 헤파로산-계 다당류는 화학식 II의 구조를 포함하는 하나 이상의 이당류를 포함하는 N-탈아세틸화된 헤파로산 다당류일 수 있고, 가공된 설포트랜스퍼라제는 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 및 서열 번호: 25로 이루어진 그룹으로부터 선택된 아미노산 서열을 가질 수 있다. 다른 구현예에서, N-황산화된 HS 다당류는 화학식 III의 구조를 갖는 하나 이상의 이당류 단위를 포함한다.
다른 구현예에서, N-탈아세틸화된 헤파로산 및/또는 화학식 II의 구조를 갖는 이당류 단위를 포함하는 다른 헤파로산-계 다당류는 상업적으로 수득할 수 있다. 다른 구현예에서, 본 발명의 가공된 글루코사미닐 N-설포트랜스퍼라제와 반응시키기 위한 헤파로산-계 다당류는 천연의 공급원으로부터 헤파로산을 단리하고 이를 화학적으로 변형시켜 하나 이상의 글루코사민 잔기를 N-탈아세틸화하고 조성물내 다당류의 분자량을 제어함으로써 수득할 수 있다. 특히, 헤파로산은 대사산물 및 다른 외인성 물질에 의해 세포 도입을 조절하는 캡슐로서 세균내에서 발견될 수 있다. 이러한 세균은 파스퇴렐라 물토시다(Pasteurella multocida) 및 에스케리키아 콜라이(이. 콜라이)를 포함하나, 이에 한정되지 않는다. 일부 구현예에서, 헤파로산은 이콜라이, 특히, 이. 콜라이의 K5 균주로부터, 다양한 분자량을 갖는 다당류 분자의 다분산성 혼합물로서 추출 및 정제될 수 있다. 이. 콜라이의 K5 균주로부터 헤파로산을 단리하는 과정은 문헌: Wang, Z., et al., (2010) Biotechnol. Bioeng. 107 (6):964-973에 논의되고 기술되어 있으며, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다 (참조: also DeAngelis, P.L. (2015) Expert Opinion on Drug Delivery 12 (3):349-352; Ly, M., et al., (2010) Anal. Bioanal. Chem. 399:737-745; 및 Zhang, C., et al., (2012) Metabolic Engineering 14:521-527, 이들 문헌에 개시된 내용은 본 문서에 참조로서 통합된다).
다른 구현예에서, 헤파로산 조성물 중 일부 또는 모두는 이를 염기, 특히 수산화리튬 또는 수산화나트륨으로 처리함으로써 N-탈아세틸화시킬 수 있다 (참조: Wang, Z., et al., (2011) Appl. Microbiol. Biotechnol. 91 (1):91-99, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다; 참조: PCT publication PCT/US2012/026081, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 다른 구현예에서, 염기는 수산화나트륨이다. 목적한 N-탈아세틸화 정도, 헤파로산의 농도, 및 염기의 농도에 따라, 당해 분야의 기술자는 상기 문헌: Wang, et al., (2011)에 기술된 과정에 따라 헤파로산과 염기를 오래 항온처리하는 방법을 측정할 수 있다.
다른 구현예에서, N-탈아세틸화된 헤파로산은 하기에 추가로 상세히 설명된, 미국 약전(United States Pharmacopeia)(USP)에 나타난 벤치마크 중 하나 이상을 충족하는 항응고제 HS 다당류를 합성하는데 유용한 분자량 및 N-아세틸 함량으로 수득될 수 있다. 다른 구현예에서, 헤파로산은 목적한 양의 N-아세틸화된 글루코사민 잔기가 N-탈아세틸화된 생성물 내에 잔존할 때가지 염기, 바람직하게는 수산화나트륨과 함께 항온처리될 수 있다. 다른 구현예에서, N-아세틸 글루코사민 잔기는 N-탈아세틸화된 헤파로산 내에 60% 미만, 예를 들면, 30%, 20%, 18%, 16%, 14%, 12%, 또는 10% 미만, 5% 미만까지, 및 바람직하게는 12% 내지 18%의 글루코사민 잔기를 포함할 수 있다. 다른 구현예에서, N-아세틸 글루코사민은 N-탈아세틸화된 헤파로산 내에 약 15%의 글루코사민 잔기를 포함할 수 있다.
추가로, 및 특수한 이론에 제한되지 않고, 글루코사민 잔기를 탈-아세틸화하는 것 외에, 헤파로산과 염기 사이의 반응은 동시에 헤파로산 다당류를 해중합(depolymerizing)시키고 이의 분자량을 감소시킬 수 있으며, 이는 궁극적으로 N-탈아세틸화된 헤파로산의 중량-평균 분자량 (
Figure pct00023
)을 감소시킬 수 있다. 전형적으로, 세균, 예를 들면, 그러나 이에 한정되지 않는 이. 콜라이로부터 단리된 헤파로산 다당류는 약 3,000 Da 내지 약 150,000 Da 범위의 분자량을 가질 수 있고, 단리된 헤파로산의 조성물은 약 25,000 Da 내지 약 50,000 Da의 범위의
Figure pct00024
를 가질 수 있다 (참조: Ly, M., et al. 및 Wang, et al., (2011), 상기됨). 다른 구현예에서, 상업적 공급원으로부터 수득되거나 세균, 예를 들면, 그러나 이에 한정되지 않는 이. 콜라이로부터 단리된 헤파로산 조성물은 염기, 바람직하게는 수산화나트륨으로 N-탈아세틸화된 헤파로산의
Figure pct00025
가 표적 또는 목적한 수준으로 감소되기에 충분한 시간 동안 처리할 수 있다. 다른 구현예에서, N-탈아세틸화된 헤파로산은 적어도 1,000 Da, 예를 들면, 적어도 2,000 Da, 4,000 Da, 6,000 Da, 7,000 Da, 8,000 Da, 8,500 Da, 9,000 Da, 9,500 Da, 10,000 Da, 10,500 Da, 11,000 Da, 11,500 Da, 12,000 Da, 12,500 Da, 13,000 Da, 13,500 Da, 14,000 Da, 15,000 Da, 16,000 Da, 또는 18,000 Da, 적어도 20,000 Da 까지의
Figure pct00026
를 가질 수 있다. 다른 구현예에서, N-탈아세틸화된 헤파로산은 20,000 Da 미만, 예를 들면, 18,000 Da, 16,000 Da, 15,000 Da, 14,000 Da, 13,500 Da, 13,000 Da, 12,500 Da, 12,000 Da, 11,500 Da, 11,000 Da, 10,500 Da, 10,000 Da, 9,500 Da, 9,000 Da, 8,500 Da, 8,000 Da, 7,000 Da, 6,000 Da, 또는 4,000 Da, 2,000 Da 미만 까지의
Figure pct00027
를 가질 수 있다. 다른 구현예에서, N-탈아세틸화된 헤파로산은 1,000 Da와 20,000 Da 사이 및 이를 포함하는 상기 나타낸 임의의 범위, 및 바람직하게는 9,000 Da과 12,500 Da 사이 및 이를 포함하는 임의의 범위에서
Figure pct00028
를 가질 수 있다.
이러한 분자량 특성 및 N-아세틸 함량을 갖는 N-탈아세틸화된 헤파로산의 제조는 상기 문헌: Wang, et al., (2011)에 상세히 기술되어 있다. 다른 구현예에서, 헤파로산과 염기, 바람직하게는 수산화나트륨을 반응시켜 9,000 Da 및 12,500 Da의 범위의
Figure pct00029
, 뿐만 아니라, 12% 내지 18%의 범위의 N-아세틸 글루코사민 함량을 갖는 N-탈아세틸화된 헤파로산 생성물을 형성하기에 충분한 시간은 헤파로산 출발 물질의 분자량 특성 및 농도, 및 반응을 수행하는데 사용된 염기의 농도에 따라, 적어도 1시간, 예를 들면, 적어도 2, 4, 6, 8, 10, 12, 또는 18 시간, 및 적어도 24 시간 이하일 수 있다.
다른 구현예에서, 가공된 설포트랜스퍼라제 효소가 헥수로닐 2-O 설포트랜스퍼라제 효소인 경우, 헤파로산-계 다당류는 화학식 IV 및 화학식 V를 포함하는 하나 이상의 구조적 모티프를 포함하는 N-황산화된 HS 다당류일 수 있고, 가공된 설포트랜스퍼라제는 서열 번호: 65, 서열 번호: 66, 서열 번호: 67, 및 서열 번호: 69로 이루어진 그룹으로부터 선택된 아미노산 서열을 가질 수 있다. 다른 구현예에서, 방법은 글루쿠로닐 C5-에피머라제, 바람직하게는 서열 번호: 67의 아미노산 서열, 및 보다 바람직하게는 서열 번호: 67의 잔기 34-617을 포함하는 글루쿠로닐 C5-에피머라제를 제공하는 단계 및 글루쿠로닐 C5-에피머라제를 반응 혼합물과 합하는 단계를 추가로 포함할 수 있다. 다른 구현예에서, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소와 반응시키기 위한 헤파로산-계 다당류는 상업적으로 수득할 수 있다. 다른 구현예에서, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소를 반응시키기 위한 헤파로산-계 다당류는 가공된 또는 천연의 글루코사미닐 N-설포트랜스퍼라제 효소의 황산화된 HS 다당류 생성물일 수 있다. 다른 구현예에서, 황산화된 다당류 생성물은 화학식 VI 및/또는 화학식 VII의 구조를 포함하는 N,2O-HS 다당류이다.
다른 구현예에서, 가공된 헥수로닐 2-O 설포트랜스퍼라제에 대한 설포 그룹 수용체로서 이용된 N-황산화된 HS 다당류는 N-탈아세틸화된 헤파로산을 화학적으로 N-황산화함으로써 수득할 수 있다. 다른 구현예에서, N-탈아세틸화된 헤파로산은 삼산화황 및/또는 하나 이상의 삼산화황 함유 화합물 또는 부가물을 포함하는 조성물에 의해 화학적으로 황산화시킬 수 있다. 삼산화황을 사용한 다당류내 글루코사민 잔기의 화학적 N-황산화는 당해 분야에 일반적으로 공지되어 있다 (참조: Lloyd, A.G., et al., (1971) Biochem. Pharmacol. 20 (3):637-648; Nadkarni, V.D., et al., (1996) Carbohydrate Research 290:87-96; Kuberan, B., et al., (2003) J. Biol. Chem. 278 (52):52613-52621; Zhang, Z., et al., (2008) J. Am. Chem. Soc. 130 (39):12998-13007; 및 Wang, et al., (2011), 상기됨; 참조: U.S. Pat. No. 6,991,183 및 U.S. Pat. Pub. 2008/020789, 이들 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 삼산화황 복합체는 일반적으로 수산화나트륨과는 달리, 탈중합화를 유발하지 않고 다당류의 선택된 N-황산화를 가능하도록 하기에 충분히 온화한 염기이다 (참조 Gilbert, E.E., (1962) Chem. Rev. 62 (6):549-589). 삼산화황 함유 복합체의 비-제한적 예는 이산화황-피리딘, 이산화황-디옥산, 이산화황-트리메틸아민, 이산화황-트리에틸아민, 이산화황-디메틸아닐린, 이산화황-티옥산, 이산화황-비스(2-클로로에틸)에테르, 이산화황-2-메틸피리딘, 이산화황-퀴놀린, 또는 이산화황-디메틸포름아미드를 포함한다.
다른 구현예에서, 가공된 설포트랜스퍼라제 효소가 글루코사미닐 6-O 설포트랜스퍼라제 효소인 경우, 헤파로산-계 다당류는 화학식 VIII의 구조를 포함하는 하나 이상의 구조적 모티프를 포함하는 N,2O-HS 다당류일 수 있고, 가공된 설포트랜스퍼라제는 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 및 서열 번호: 122로 이루어진 그룹으로부터 선택된 아미노산 서열을 가질 수 있다. 다른 구현예에서, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소와 반응시키기 위한 헤파로산-계 다당류는 상업적으로 수득할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소에 대한 헤파로산-계 다당류는 가공된 또는 천연의 헥수로닐 2-O 설포트랜스퍼라제 효소의 황산화된 N,2O-HS 다당류 생성물일 수 있다. 다른 구현예에서, 황산화된 다당류 생성물은 화학식 IX의 구조를 포함하는 N,2O,6O-HS 다당류이다.
다른 구현예에서, 가공된 설포트랜스퍼라제 효소가 글루코사미닐 3-O 설포트랜스퍼라제 효소인 경우, 헤파로산-계 다당류는 화학식 X의 구조를 포함하는 하나 이상의 구조적 모티프를 포함하는 N,2O,6O-HS 다당류일 수 있고, 가공된 설포트랜스퍼라제는 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 서열 번호: 160로 이루어진 그룹으로부터 선택된 아미노산 서열을 가질 수 있다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소와 반응시키기 위한 헤파로산-계 다당류는 상업적으로 수득할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소에 대한 헤파로산-계 다당류는 가공된 또는 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소의 황산화된 N,2O,6O-HS 다당류 생성물일 수 있다. 다른 구현예에서, 황산화된 다당류 생성물은 화학식 I의 구조를 포함하는 N,2O,3O,6O-HS 다당류이다.
상술한 바와 같이, 화학식 I의 구조를 포함하는 N,2O,3O,6O-HS 다당류는 항응고 활성을 가질 수 있다 (참조: Desai, U.R., et al., (1998) J. Biol. Chem. 273 (13):7478-7487). 항응고제 N,2O,3O,6O-HS 다당류의 의학적 용도는 수십년 동안 잘 문서화되었다. N,2O,3O,6O-HS 다당류의 항응고 활성 중 일부는 혈액-응고 캐스캐이드에서 활성인 2개의 단백질인 인자 IIa(트롬빈) 및/또는 인자 Xa의 불활성화를 포함하나, 이에 한정되지 않는다. 특히, N,2O,3O,6O-HS 다당류가 항트롬빈(AT)에 결합하는 경우, 이는 다당류, AT와 트롬빈 또는 인자 Xa 사이에 3원(ternary) 복합체의 형성을 가능하게 하는 효소내 구조적 변화를 유발한다 (참조: Li, W., et al., (2004) Nat. Struct. Mol. Biol. 11 (9):857-862, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). AT와 결합시키고 이의 구조적 변화를 유도하기 위하여, N,2O,3O,6O-HS 다당류는 전형적으로, 화학식 I의 구조와 등가인, 특이적인 5개-잔기 AT-인식 서열을 포함한다.
항응고는 AT-인식 서열 만으로 이루어진 올리고사카라이드와 항트롬빈의 결합에 의해 유도될 수 있지만, N,2O,3O,6O-HS 다당류가 5개 이상의 당 잔기를 포함하는 경우, 혈액 응고의 향상된 억제가 전형적으로 존재한다 (참조: Grey, E., et al., (2008) Thromb. Haemost. 99:807-818, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 그레이 등(Grey, et al)에 의해 보고된 바와 같이, N,2O,3O,6O-HS 다당류가 AT-인식 서열의 한쪽 측면에서 적어도 13개의 당 잔기를 포함함으로써 AT에 또한 결합되면서, 다당류가 트롬빈에 결합하도록 하는 "브릿지(bridge)"로서 작용하는 경우, 제2의 결합 상호작용이 N,2O,3O,6O-HS 다당류와 트롬빈 사이에서 형성될 수 있다. 그 결과, 항응고제 N,2O,3O,6O-HS 다당류는 전형적으로 N,2O,3O,6O-HS 다당류, AT와 트롬빈 사이에 3원 복합체를 잠재적으로 형성시키기 위하여, 최도 18개의 당 잔기를 필요로 한다. 그러나, 및 특수한 이론에 제한되지 않고, 특수한 다당류 분자내 AT-인식 서열의 분포는 무작위적이므로, 18개 내지 31개의 당 잔기 사이의 일부 N,2O,3O,6O-HS 다당류는 한쪽 측면이 13개의 인접한 당 잔기를 가지지 않는 분자의 중심을 향해 AT-인식 서열을 이론적으로 포함할 수 있는 것으로 여겨진다. 결과적으로, 항응고제 N,2O,3O,6O-HS 다당류는 전형적으로 적어도 32개의 당 잔기를 포함함으로써, AT-인식 서열이 분자내에 있는 경우에 상관없이, AT-인식 서열에 인접한 13개의 잔기 "브릿지"가 형성될 수 있도록 하여야만 한다. 그 결과, 일부 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소의 N,2O,3O,6O-HS 다당류 생성물은 적어도 5개의 당 잔기, 바람직하게는 적어도 18개의 당 잔기, 및 보다 바람직하게는 적어도 32개의 당 잔기일 수 있다.
다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소의 항응고제 N,2O,3O,6O-HS 생성물은 생성물 순도, 특히 다른 황산화된 다당류, 예를 들면, 그러나 이에 한정되지 않는, 콘드로이틴 설페이트로부터의 순도와 관련하여 약제 UF-HS 조성물에 대한 USP에 의해 결정된 벤치마크 요건을 만족시킬 수 있다. 특히, 과-황산화된 콘드로이틴 설페이트(OSCS)는 2007년 및 2008년에 전세계적으로 수백명의 사망을 유발시킨 약제학적 UF-HS 조성물내 오염원인 것으로 측정되었다. 다른 구현예에서, 및 특수한 이론에 제한되지 않고, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소를 사용하여 제조된 항응고제 N,2O,3O,6O-HS 생성물은, 출발 물질로서 사용하는 헤파로산-계 다당류가 동물 공급원으로부터 단리된 항응고제 N,2O,3O,6O-HS 다당류 속에 고유하게 존재하는 동일한 다당류 오염물 없이 제공되고/되거나 제조될 수 있으므로, 콘드로이틴 설페이트, 특히 OSCS로부터 실질적으로 유리되도록 형성될 수 있다.
USP는 이에 의해 모든 약제학적 조성물이 측정되는 항응고제 N,2O,3O,6O-HS에 대한 참고 표준(Chemical Abstracts Service (CAS) No:-9041-08-1)을 정의하였다. USP에 부합하는 항응고제 N,2O,3O,6O-HS 조성물의 분자량 특성은 다음의 벤치마크 모두를 만족시켜야 한다: (1) 24,000 Da 이상의 분자량을 갖는 조성물 내 다당류의 비율은 20% 이하이고; (2) 조성물 자체의
Figure pct00030
는 15,000 Da 내지 19,000 Da이고; (3) 16,000 Da 내지 24,000 Da의 분자량을 갖는 조성물내 다량류의 수에 대해 8,000 Da 내지 16,000 Da의 분자량을 갖는 조성물내 다당류의 수의 비는 1.0:1이다 (참조: Mulloy, B., et al., (2014) Anal. Bioanal. Chem. 406:4815-4823, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 또한, USP에 부합하는 항응고제 N,2O,3O,6O-HS 조성물의 항응고 활성은 다음의 벤치마크 모두를 만족시켜야 한다: 밀리그램당 180-국제 단위(IU mg-1)의 항-IIa 활성; 180-IU-mg-1 이상의 항-Xa 활성; 및 0.9:1 내지 1.1:1의 범위의 항-Xa 대 항-IIa 활성의 비. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소에 의해 제조된 항응고제 N,2O,3O,6O-HS 생성물은 임의의 또는 이상의 상기 항응고 활성 및 약제학적 UF-HS 조성물에 대한 미국 약전(USP)에 의해 측정된 분자량 요건을 만족시킬 수 있다.
특히 항응고제 N,2O,3O,6O-HS 생성물의 분자량 특성과 관련하여, 이는 설포 그룹 수용체로서 이용된 헤파로산-계 다당류의 분자량 특성의 제어를 기반으로 제어될 수 있다. 헤파로산-계 다당류의 분자량을 제어하기 위해 가장 제어가능한 기회는 상술한 바와 같은, N-탈아세틸화 및 탈중합 헤파로산에 의한다. 따라서, 다른 구현예에서, 일련의 설포트랜스퍼라제 반응을 수행하여 항응고제 N,2O,3O,6O-HS 생성물의 분자량을 제어할 수 있다. 다른 구현예에서, 일련의 설포트랜스퍼라제 반응을 다음의 단계에 따라 수행할 수 있다: (a) N-탈아세틸화된 헤파로산으로부터 N-황산화된 헤파로산 생성물을 글루코사미닐 N-설포트랜스퍼라제를 사용하여 형성시키는 단계; (b) 헥수로닐 2-O 설포트랜스퍼라제 및 단계 (a)의 N-황산화된 헤파로산 생성물을 사용하여 N,2O-HS 다당류 생성물을 형성시키는 단계; (c) 글루코사미닐 6-O 설포트랜스퍼라제 및 단계 (b)의 N,2O-HS 다당류 생성물을 사용하여 N,2O,6O-HS 다당류 생성물을 형성시키는 단계; 및 (d) 글루코사미닐 3-O 설포트랜스퍼라제 및 단계 (c)의 N,2O,6O-HS 다당류 생성물을 사용하여 항응고제 N,2O,3O,6O-HS 다당류 생성물을 형성시키는 단계. 다른 구현예에서, 설포트랜스퍼라제 모두는 가공된 설포트랜스퍼라제이고, 각각의 반응에서 설포 공여체는 아릴 설페이트 화합물, 바람직하게는 PNS 또는 NCS이다. 다른 구현예에서, N-탈아세틸화된 헤파로산은 상기 문헌: Wang, et al., (2011)에 기술된 바와 같이, 9,000-Da 내지 12,500 Da의
Figure pct00031
뿐만 아니라 12% 내지 18%의 범위의 N-아세틸 글루코사민 함량을 갖는다. 대안적으로, 및 다른 구현예에서, 헥수로닐 2-O 설포트랜스퍼라제에 대한 설포 그룹 수용체로서 이용된 N-황산화된 헤파로산 생성물은 상술한 바와 같이 N-탈아세틸화된 헤파로산으로부터 화학적으로 황산화될 수 있다.
따라서, 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소에 의해 제조된 항응고제 N,2O,3O,6O-HS 생성물은 적어도 1,000 Da, 예를 들면, 적어도 2,000 Da, 3,000 Da, 4,000 Da, 5,000 Da, 6,000 Da, 7,000 Da, 8,000 Da, 9,000 Da, 10,000 Da, 11,000 Da, 12,000 Da, 13,000 Da, 14,000 Da, 15,000 Da, 16,000 Da, 17,000 Da, 18,000 Da, 19,000 Da, 20,000 Da, 21,000 Da, 22,000 Da, 23,000 Da, 또는 24,000 Da, 적어도 50,000 Da 까지의
Figure pct00032
를 가질 수 있다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소에 의해 제조된 항응고제 N,2O,3O,6O-HS 생성물은 50,000 Da 미만, 예를 들면, 24,000 Da, 23,000 Da, 22,000 Da, 21,000 Da, 20,000 Da, 19,000 Da, 18,000 Da, 17,000 Da, 16,000 Da, 15,000 Da, 14,000 Da, 13,000 Da, 12,000 Da, 11,000 Da, 10,000 Da, 9,000 Da, 8,000 Da, 7,000 Da, 6,000 Da, 5,000 Da, 4,000 Da, 또는 3,000 Da, 2,000 Da 미만 까지의
Figure pct00033
를 가질 수 있다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소에 의해 제조된 항응고제 N,2O,3O,6O-HS 생성물은 1,000 Da 내지 50,000 Da 사이 및 이를 포함하는 임의의 범위, 및 바람직하게는 약 15,000-Da 내지 약 19,000 Da 사이 및 이를 포함하는 상기 나열된 임의의 범위의
Figure pct00034
를 가질 수 있다.
유사하게, 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소에 의해 제조된 항응고제 N,2O,3O,6O-HS 생성물은, N,2O,3O,6O-HS 생성물내 N,2O,3O,6O-HS 다당류의 50% 미만, 예를 들면, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10%, 5%, 3%, 또는 2% 미만, 1% 미만 아래가 24,000 Da 이상의 분자량을 갖도록 하는 크기 분포를 가질 수 있다. 다른 구현예에서, N,2O,3O,6O-HS 생성물내 N,2O,3O,6O-HS 다당류의 20% 이하는 24,000 Da 이상의 분자량을 갖는다. 다른 구현예에서, N,2O,3O,6O-HS 생성물내 N,2O,3O,6O-HS 다당류의 20% 이하가 24,000 Da 이상의 분자량을 가지는 경우, 항응고제 N,2O,3O,6O-HS 생성물은 1,000 Da 내지 24,000 Da 및 이를 포함하는 상기 나타낸 임의의 범위, 및 바람직하게는 15,000-Da 내지 약 19,000 Da 사이 및 이를 포함하는 임의의 범위의
Figure pct00035
를 가질 수 있다.
다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소에 의해 제조된 항응고제 N,2O,3O,6O-HS 생성물은 16,000 Da 내지 24,000 Da 사이의 분자량을 갖는 조성물내 다당류의 수에 대해 8,000 Da 내지 16,000 Da 사이의 분자량을 갖는 조성물내 다당류의 수의 비가 0.5:1, 예를 들면, 0.75:1, 0.9:1, 1.0:1, 1.1:1, 1.3:1, 또는 1.5:1 이상, 2.0:1 이상, 및 바람직하게는 1.0:1 이상이도록 하는 크기 분포를 가질 수 있다. 다른 구현예에서, 16,000 Da 내지 24,000 Da 사이의 분자량을 갖는 조성물내 다당류의 수에 대해 8,000 Da 내지 16,000 Da 사이의 분자량을 갖는 조성물내 다당류의 수의 비가 1.0:1 미만인 N,2O,3O,6O-HS 생성물은 또한 1,000 Da 내지 24,000 Da 사이 및 이를 포함하는 상기 나타낸 임의의 범위, 및 바람직하게는 15,000 Da 내지 약 19,000 Da 사이 및 이를 포함하는 상기 나타낸 임의의 범위의
Figure pct00036
를 가질 수 있고, 여기서 N,2O,3O,6O-HS 생성물 내 N,2O,3O,6O-HS 다당류의 20% 이하는 24,000 Da 이상의 분자량을 갖는다.
다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소에 의해 제조된 항응고제 N,2O,3O,6O-HS 생성물은 적어도 약 1 IU mg-1, 예를 들면, 적어도 약 50 IU mg-1, 적어도 75 IU mg-1, 100 IU mg-1, 150 IU mg-1, 200 IU mg-1, 또는 500 IU-mg-1, 적어도 약 1,000-IU-mg-1 이하의 항-Xa 활성을 가질 수 있다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소에 의해 제조된 항응고제 N,2O,3O,6O-HS 생성물은 적어도 약 1 IU mg-1, 예를 들면, 적어도 약 50 IU-mg-1, 적어도 75 IU mg-1, 100 IU mg-1, 150 IU mg-1, 200 IU mg-1, 또는 500 IU-mg-1, 적어도 약 1,000-IU-mg-1 이하의 항-IIa 활성을 가질 수 있다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소에 의해 제조된 항응고제 N,2O,3O,6O-HS 생성물은 적어도 0.5:1, 예를 들면, 적어도 0.75:1, 0.9:1, 1:1, 1.1:1, 1.3:1, 1.5:1, 2.0:1, 3.0:1, 4.0:1, 5.0:1, 6.0:1, 7.0:1, 8.0:1, 9.0:1, 10.0:1, 20:1, 40:1, 60:1, 또는 80:1, 적어도 100:1 이하의 항-Xa 활성 대 항-의 비를 가질 수 있다. 그러나, 32개 당 잔기 이상이고 AT 및 트롬빈과의 3원 복합체를 형성할 수 있는 항응고제 N,2O,3O,6O-HS 다당류는 일반적으로 1:1에 근접한, 대략 0.9:1 내지 1.1:1인 항-Xa 활성 대 항-IIa 활성의 비를 가질 수 있다 (참조: Keire, D.A., et al., (2011) Anal. Bioanal. Chem. 399:581-591, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다).
가공된 아릴 설페이트-의존성 효소의 제조
일반적으로, 개시된 핵산 및 아미노산 서열에 의해 암호화된 가공된 효소는 하기 기술된 바와 같은 것을 포함하는, 당해 분야에 공지된 임의의 미생물학적 기술을 사용하여 발현 및 정제할 수 있다. 각각의 정제된 효소의 아릴 설페이트-의존성 활성은 분광광도계적으로 또는 형광성으로 및/도는 질량 분광법(MS) 또는 핵 자기 공명(NMR) 분광기를 사용하여 측정함으로써 출발 물질 및/또는 황산화된 다당류 생성물을 특성화할 수 있다. 이러한 방법은 실시예 단락에서 하기에 기술되어 있다.
본 발명의 가공된 유전자 생성물, 단백질 및 폴리펩타이드는 개시된 DNA 또는 펩타이드 서열에 대해 삽입, 결실, 또는 돌연변이를 함유하고, 아릴 설페이트 화합물이 기질인 반응을 촉매하는 효소를 또한 암호화하는 유사체를 포함할 수 있다. 다른 구현예에서, 각각의 유사체는 설포전달 반응을 유사하게 촉매하며 여기서 아릴 설페이트 화합물은 설포 공여체로서 이용된다. 유사체는 본원에 개시된 바와 같이 뉴클레오타이드 또는 아미노산 서열로부터 유도될 수 있거나, 이는 가상 환경에서(in silico) 또는 새로이(de novo) 컴퓨터 모델링 기술을 사용하여 설계할 수 있다. 당해 분야의 기술자는 아직 개시되지 않거나 발견되지 않은 다른 유사체가 본 발명의 상이한 설페이트-의존성 효소를 설계 및/또는 작제하는데 사용될 수 있음을 인식할 것이다. 유전자 생성물, 단백질, 또는 폴리펩타이드가 본원에 개시된 바와 같은 가공된 효소의 모든 또는 실질적으로 모든 핵산 또는 아미노산 서열을 포함하도록 할 필요는 없다. 이러한 서열은 본원에서 "분절(segment)"로 지칭된다. 또한, 본원에 논의되고 개시된 유전자 생성물, 단백질, 및 폴리펩타이드는 또한 본원에 개시된 서열의 전체 길이의 서열 또는 생물학적으로 기능성인 분절을 포함하는 융합체 또는 재조합체 가공된 효소를 포함할 수 있다. 이러한 단백질을 제조하는 방법은 당해 분야에 공지되어 있다.
본원에 개시된 핵산 및 아미노산 서열 외에, 본 발명의 임의의 방법은 개시된 아미노산 서열(서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 66, 서열 번호: 68, 서열 번호: 69, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160)과 실질적으로 동일하거나, 개시된 뉴클레오타이드 서열(서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 또는 서열 번호: 152)과 실질적으로 동일한 뉴클레오타이드 서열을 포함하는 핵산으로부터 발현된 아미노산 서열을 포함하는 가공된 효소에 의해 실시될 수 있다. 당해 분야의 기술자는 뉴클레오타이드 서열 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 또는 서열 번호: 152를 기반으로 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 66, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160의 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 적절한 뉴클레오타이드 서열을 측정할 수 있다.
당해 분야에 사용된 바와 같은, "실질적으로 동일한' 서열은 하나 이상의 결실, 치환, 또는 첨가에 의해 특수한 참고 서열과 상이하며, 이의 전체 효과는 참고 서열에 의해 암호화된 가공된 폴리펩타이드의 생물학적 활성 중 적어도 일부를 유지하는 서열을 지칭한다. 즉, 가공된 설포트랜스퍼라제 효소의 생물학적 활성은 아릴 설페이트 화합물로부터 설포 그룹 수용체로 작용하는 다당류로 설포 그룹의 전달을 포함한다. 다른 구현예에서, 다당류는 헤파로산-계 및/또는 HS 다당류이다. 따라서, 본 발명의 가공된 효소를 기술하기 위해 사용된 것으로서, "실질적인 동일성"은 가공된 효소의 특수한 유전자 생성물, 폴리펩타이드 또는 아미노산 서열, 또는 가공된 효소를 암호화하는 유전자 또는 핵산 서열과의 동일성을 지칭할 수 있다. 이러한 서열은 생물학적 활성이 일부 정도로 변경, 향상, 또는 감소되어 있지만, 개시된 참고 핵산 서열에 의해 암호화된 개시된 참고 아미노산 서열 또는 폴리펩타이드의 원래의 생물학적 활성의 적어도 일부를 보유하는 개시된 서열들 또는 서열의 돌연변이를 포함할 수 있다.
대안적으로, DNA 유사체 서열은 (a) DNA 유사체 서열이 임의의 개시된 핵산 서열의 암호화 영역으로부터 유래되거나; (b) DNA 유사체 서열이 엄격한 조건(stringent condition) 하에서 (a)의 DNA 서열을 하이브리드화시킬 수 있고 생물학적으로 활성인 유전자 생성물을 암호화하거나; (c) DNA 서열이 (a) 및/또는 (b)에서 정의된 DNA 유사체 서열에 대한 대안의 유전 코드의 결과로서 변성된 경우, 본원에 개시된 특이적인 DNA 서열과 실질적으로 동일하다. 실질적으로 동일한 유사체 단백질은 천연의 단백질의 상응하는 서열에 대해 약 60% 이상 동일하다. 보다 적은 동일성 정도 그러나 비교가능한 생물학적 활성, 즉, 아릴 설페이트 화합물로부터 다당류, 특히 헤파로산-계 또는 HS 다당류로 설포 그룹을 전달하는 활성을 갖는 서열이 또한 실질적으로 동일한 것으로 고려된다. 핵산 서열의 실질적인 동일성을 측정하는데 있어서, 실질적으로 동일한 아미노산 서열을 암호화할 수 있는 모든 대상 핵산 서열은 생물학적으로 기능성 등가물을 생성하기 위한 코돈 서열 또는 아미노산 치환내에 차이와 상관없이, 참고 핵산 서열과 실질적으로 동일한 것으로 고려된다.
생물학적 수준에서, 동일성은 즉, 유전자 계열의 주어진 계열 구성원내에서 동일한 상대적 위치에 동일한 아미노산이다. 상동성 및 유사성은 일반적으로 보다 광범위한 용로로서 고려된다. 예를 들면, 생화학적으로 유사한 아미노산, 예를 들어, 루이신 및 이소루이신 또는 글루탐산/아스파르트산은 대안적으로 동일한 위치에 존재할 수 있으며-이는 동일하지는 않지만, 생화학적으로 "유사"하다. 본원에 개시된 바와 같이, 이는 보존적 차이 또는 보존적 치환으로서 지칭된다. 이는 DNA 수준에서 보존적 돌연변이와는 상이하며, 이는 암호화된 아미노산내 변화, 예컨대, 이들 둘 다 세린을 암호화하는, TCC 대 TCA로의 변화를 만들지 않고 뉴클레오타이드 서열을 변화시킨다.
일부 구현예에서, 유전자 및 유전자 생성물은 이의 각각의 서열내에서 가공된 효소 또는 이의 상응하는 단백질을 암호화하는 유전자의 "것으로서 필수적인" 서열을 포함한다. 가공된 효소를 암호화하는 유전자의 것으로서 필수적인 서열은 개시된 핵산 서열의 일부와 실질적으로 동일하거나 실질적으로 유사하고 개시된 단백질 또는 유전자의 것과 동일하지 않은 소수의 염기 또는 아미노산(DNA 또는 단백질에 상관없이)을 함유하는 서열을 지칭한다. 생물학적 기능 등가성은 당해 분야에서 잘 이해되어 있고 하기에 상세히 추가로 논의되어 있다. 뉴클레오타이드 서열이 개시된 유전자의 뉴클레오타이드 서열과 동일한 핵산 잔기의 약 75% 내지 약 85%, 또는 특히 약 86% 내지 약 90%, 또는 보다 특히 90% 이상, 또는 심지어 보다 특히 약 91% 내지 약 95% 이상, 또는 여전히 보다 특히 약 96% 내지 약 99%를 갖는 경우 "필수적으로 동일"하다. 유사하게, 개시된 폴리펩타이드 서열의 아미노산 서열에 대해 동일하거나 기능적으로 등가이거나 생물학적으로 기능적으로 등가인 아미노산의 약 80%, 또는 90%, 또는 특히 90 내지 95%, 또는 보다 특히 96% 이상, 또는 심지어 보다 특히 95 내지 98%, 또는 여전히 보다 특히 99% 이상을 갖는 서열은 "필수적으로 동일한" 서열일 것이다.
또한, 기능적으로 등가인 코돈을 포함하는 대안의 핵산 서열이 또한 본 발명에 의해 고려된다. 기능적으로 등가인 코돈은 동일한 아미노산을 암호화하는 코돈, 예를 들면, 세린의 경우 ACG 및 AGU 코돈을 지칭한다. 따라서, 하기 표 1의 기능적으로 등가인 코돈의 상기 개시된 임의의 뉴클레오타이드 서열의 서열 예로의 치환은 궁극적으로 아릴 설페이트 화합물과의 결합 및 반응성에 의존하는 생물학적으로 기능성인 등가의 효소를 암호화함으로서 설포 전달을 촉매한다. 따라서, 본 발명은 이러한 치환을 포함하지만 편의상 이의 전체가 본원에 나타나 있지 않은 아미노산 및 핵산 서열을 포함한다.
당해 분야의 기술자는 아미노산 및 핵산 서열이 추가의 잔기, 예를 들면, 추가의 N- 또는 C-말단 아미노산 또는 5' 또는 3' 핵산 서열을 포함할 수 있고, 서열이 설포 공여체로서 아릴 설페이트 화합물과의 결합 및 반응성과 관련하여 이의 생물학적 활성을 보유하는 한, 아직 여전히 필수적으로 본원에 개시된 서열 중 하나에 나타낸 바와 같다. 말단 서열의 첨가는 예를 들면, 암호화 영역의 5' 또는 3' 부위 중 어느 하나를 플랭킹하는 다양한 비-암호화 서열을 포함할 수 있거나, 다양한 내부 서열, 또는 유전자내에서 발생하는 것으로 알려진, 인트론을 포함할 수 있는 핵산 서열에 특히 적용된다.
Figure pct00037
상기 논의된 바와 같이, 변형 및 변화, 예를 들면, 보존적 및 비-보존적 돌연변이, 결실, 및 첨가는 유사하거나 달리 목적한 특성을 갖는 분자를 여전히 구성하면서, 임의의 개시된 가공된 효소의 서열내에서 이루어질 수 있다. 예를 들면, 특정의 아미노산이 특수한 구조 또는 화합물, 특히 아릴 설페이트 화합물 및/또는 설포 수용체 다당류와의 상호작용 능력의 주목할만한 손실없이 단백질 구조내 다른 아미노산에 대해 치환될 수 있다. 이는 이의 환경내에서 다른 구조 또는 화합물을 인식하고, 이와 결합하며 이와 반응하는 단백질의 능력이 서열 자체가 아닌, 단백질의 생물학적 기능적 활성을 규정하기 때문에 발생할 수 있다. 결과적으로, 특정의 아미노산 서열 치환이 단백질의 서열내에서 이루어져서 동등한, 향상된, 또는 감소된 특성을 지닌 단백질을 수득할 수 있다. 상호작용성 활성의 주목할만한 손실없이 발생할 수 있는 이러한 아미노산 치환의 하나의 비-제한적 예는 단백질의 폴딩 및 용해도에 영향을 미치지 않는 외부 도메인내 또는 단백질의 표면애 치환을 포함한다. 유사하게, 아미노산은, 이의 기질을 인식하여 이에 결합하는 단백질의 능력이 유해하게 영향받지 않는 한, 단백질의 말단에 잠재적으로 첨가될 수 있다. 당해 분야의 기술자는 수개의 다른 방법 및/또는 전략을 사용하여 이의 활성에 영향을 미치지 않고 소소의 서열을 변경시킬 수 있음을 인식할 수 있다.
결과적으로, 변형된 효소가 모 효소의 생물학적 활성을 보유하는 모 효소의 구조 또는 서열에 대한 돌연변이, 결실, 첨가, 또는 다른 변경은 모 효소에 대해 생물학적으로 기능적으로 등가이도록 정의될 수 있다. 따라서, 가공된 아릴 설페이트-의존성 효소와 관련하여, 생물학적으로 기능적으로 등가인 효소는 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 66, 서열 번호: 68, 서열 번호: 69, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160에 개시된 아미노산 서열의 임의의 치환 또는 변경을 포함할 수 있고, 여기서 수득되는 변형된 효소는 아릴 설페이트 화합물, 특히 PNS 또는 NCS와 상호작용하여 다당류, 특히 헤파로산-계 및/또는 HS 다당류에 대한 설포 전달을 촉매하는데 의존적이다. 특히, 이러한 치환 또는 변경은, 효소의 비-효소적으로 활성인 영역이 또한 고려되지만, 하기 기술된 바와 같은, 단백질의 임의의 부위내 아미노산 서열내 보존적 돌연변이로부터 생성될 수 있다. 결과적으로, 가공된 효소는, 이러한 뉴클레오타이드 서열이 편의를 위해 이의 전체로서 본원에 나타나 있지 않지만, 생물학적으로 기능성인 등가의 효소를 암호화하는 뉴클레오타이드 서열을 갖는 임의의 핵산으로부터 발현될 수 있다.
대안적으로, 재조합 DNA 기술을 사용하여 생물학적으로 기능적으로 등가의 단백질 또는 펩타이드를 생성할 수 있으며 여기서 단백질 구조내 변화는 변형되는 아미노산의 특성에 대한 고려를 기반으로 가공될 수 있다. 비례적으로 설계된 변화를 부위-지시된 돌연변이유발 기술의 적용을 통해 도입하여, 예를 들면, 특정의 돌연번이가 효소의 아릴 설페이트-의존성 촉매 활성 및/또는 효소의 활성 부위내 설포 공여체 또는 수용체의 결합에 긍정적으로 또는 부정적으로 영향을 미치는지의 여부를 시험할 수 있다.
아미노산 치환, 예를 들어, 본원에 기술된 임의의 가공된 효소를 변형하는데 사용될 수 있는 것은 일반적으로 아미노산 측쇄 치환체의 상대적인 유사성, 예를 들면, 이의 소수성, 친수성, 전하, 크기 등을 기반으로 한다. 당해 분야의 기술자는 특정의 아미노산 사이의 유사성, 예를 들면, 아미노산 측쇄 치환체의 크기, 형태 및 유형에 친숙하다. 비제한적 예는 예를 들면, 알라닌, 라이신 및 히스티딘이 모드 양으로 하전된 잔기이고; 알라닌, 글리신 및 세린이 모두 유사한 크기이며; 페닐알라닌, 트립토판 및 타이로신이 모드 일반적으로 유사한 형태를 가지는 관계를 포함한다. 결과적으로, 다음의 그룹-아르기닌, 라이신 및 히스티딘; 알라닌, 글리신 및 세린; 및 페닐알라닌, 트립토판 및 타이로신을 포함하는 아미노산은 동일한 그룹내 다른 아미노산에 대해 생물학적으로 기능성 등가물로서 본원에 정의되어 있다. 다른 생물학적으로 기능적으로 등가인 변화는 당해 분야의 기술자에게 친숙할 것이다.
생물학적으로 기능성인 등가물을 평가하기 위한 하나의 이러한 방법은 아미노산 각각의 수치 지수(hydropathic index)를 평가하고 고려하는 것이다. 20개의 일반적인 아미노산 각각은 이의 소수성 및 전하 특성을 기반으로 수치 지수가 지정되어 있으며, 이는 이소루이신(+4.5); 발린(+4.2); 루이신(+3.8); 페닐알라닌(+2.8); 시스테인(+2.5); 메티오닌(+1.9); 알라닌(+1.8); 글리신(-0.4); 트레오닌(-0.7); 세린(-0.8); 트립토판(-0.9); 타이로신(-1.3); 프롤린(-1.6); 히스티딘(-3.2); 글루탐산(-3.5); 글루타민(-3.5); 아스파르트산(-3.5); 아스파라긴(-3.5); 라이신(-3.9); 및 아르기닌(-4.5)이다.
아미노산 잔기의 수치 지수(hydrophathic index)와 단백질의 생물학적 기능 사이의 관계는 일반적으로 당해 분야에서 이해되어 있다(Kyte, J., et al., (1982) J. Mol. Biol. 157 (1):105-132.). 특정의 아미노산은 유사한 수치 지수 또는 점수를 가지는 다른 아미노산에 대해 치환될 수 있지만, 여전히 유사한 생물학적 활성을 보유하는 것으로 알려져 있다. 수치 지수를 기반으로 변화를 만들 때, 이의 수치 지수가 원래의 값의 ±2 이내인 아미노산의 치환이 치환이 생물학적으로 기능적으로 등가인지의 여부를 측정하기 위한 바람직한 척도이지만, 원래의 값의 ±1 이내인 이러한 치환이 특히 바람직하고, 원래의 값의 ±0.5 이내인 것이 심지어 보다 특히 바람직하다.
유사하게, 유사 아미노산의 치환이 친수성을 기반으로 이루어질 수 있음은 당해 분야에 또한 이해되어 있다. 이의 개시내용이 이의 전문이 참고로 포함된, 미국 특허 제4,554,101호는, 이의 인접한 아미노산의 친수성에 의해 지배되는 것으로서, 단백질의 가장 큰 국소 평균 친수성이 이의 면역원성, 항원성, 및 단백질의다른 생물학적 특성과 관련되어 있음을 기술하고 있다. 아미노산이 유사한 친수성 값을 가진 다른 것에 대해 치환될 수 있고 여전히 생물학적으로 등가인 단백질을 수득할 수 있음은 이해된다. 미국 특허 4,554,101에 보고된 바와 같이, 다음의 친수성 값이 아미노산 잔기에 지정되었다: 아르기닌(+3.0); 라이신(+3.0); 아스파르트산(+3.0±1); 글루탐산(+3.0±1); 세린(+0.3); 아스파라긴(+0.2); 글루타민(+0.2); 글리신(0); 트레오닌(-0.4); 프롤린(-0.5±1); 알라닌(-0.5); 히스티딘(-0.5); 시스테인(-1.0); 메티오닌(-1.3); 발린(-1.5); 루이신(-1.8); 이소루이신(-1.8); 타이로신(-2.3); 페닐알라닌(-2.5); 트립토판(-3.4).
아미노산의 수치 지수를 기반으로 돌연변이를 제공하는 경우에서와 같이, 유사한 변화를 친수성과 관련하여 이룰 수 있다. 따라서, 이의 친수성 값이 원래의 값의 ±2 이내인 아미노산의 치환이 치환이 생물학적으로 기능적으로 등가인지의 여부를 측정하기 위한 바람직한 척도이지만, 원래의 값의 ±1 이내인 이러한 치환이 특히 바람직하고, 원래의 값의 ±0.5 이내인 것이 심지어 보다 특히 바람직하다.
다른 구현예에서, 본 발명의 가공된 효소를 암호화하는 단리된 핵산, 또는 이의 기능적 단편이 제공된다. 일부 구현예에서, 가공된 효소는 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 66, 서열 번호: 68, 서열 번호: 69, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160으로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함한다. 다른 구현예에서, 본 발명은 본 발명의 가공된 효소의 기능성 단편, 또는 보존적 치환이 상기 나열된 임의의 가공된 효소의 아미노산 서열내 특수한 잔기에 대해 이루어진 이의 돌연변이체를 암호화하는 단리된 핵산을 제공한다.
또한, 본 발명의 임의의 가공된 효소를 발현하는데 사용된 단리된 핵산은 다양한 적용시 사용하기 위해 다른 핵산에 결합시킬 수 있다. 따라서, 예를 들면, 단리된 핵산을 당해 분야에 일반적으로 공지되고 하기 실시예에 기술된 바와 같이, 클로닝 또는 발현 벡터내로 연결시킬 수 있다. 또한, 핵산은 다른 폴리펩타이드를 암호화하는 서열에 대해 프레임내(in-frame)에서 결합됨으로써 당해 분야에 일반적으로 공지된 바와 같은, 융합 단백질을 형성할 수 있다. 융합 단백질은 목적한 기능, 예를 들면, 용해도, 정제, 또는 면역검출을 갖는 다른 단백질 또는 펩타이드와 동일한 발현 단위내에서 정렬된 가공된 효소에 대한 암호화 영역을 포함할 수 있다. 따라서, 다른 구현예에서, 본 발명의 가공된 효소를 암호화하는, 임의의 상술한 핵산을 포함하는 클로닝, 발현 및 융합 벡터가 또한 제공된다.
또한, 본 발명의 핵산 분절은, 암호화 서열 자체의 길이와 상관없이, 다른 DNA 서열, 예를 들면, 프로모터, 인핸서(enhancer), 폴리아데닐화 신호, 추가의 제한 효소 부위, 다수의 클로닝 부위, 다른 암호화 분절 등과 조합됨으로써, 이의 전체 길이가 현저히 변할 수 있도록 할 수 있다. 당해 분야의 기술자는 거의 임의의 길이의 핵산 단편이 의도된 재조합 DNA 프로토콜내에서 제조 및 사용 용이성에 의해 전형적으로 제한되는 총 길이로 사용될 수 있음을 인식할 것이다.
특히, 유전자 또는 DNA 분절의 암호화 부위가 프로모터의 제어하에 위치하는 재조합 벡터가 특히 유용하다. 일부 구현예에서, 암호화 DNA 분절은 세균, 바이러스, 진핵세포, 또는 포유동물 세포로부터 단리된 프로모터와 연합될 수 있다. 발현을 위해 선택된 세포 유형에 대해 특이적인 프로모터가 흔히 가장 효과적이다. 단백질 발현을 위한 프로모터 및 세포형 조합의 사용은 일반적으로 분자 생물학 분야의 기술자에게 공지되어 있다 (참조: 예컨대, Sambrook et al. (2012) Molecular Cloning: A Laboratory Manual, Fourth Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 사용된 프로모터는 구성적 또는 유도성일 수 있고 적절한 조건 하에 사용되어 도입된 DNA 분절의 고-수준 발현을 지시할 수 있고, 예를 들면, 재조합 단백질 또는 펩타이드의 대규모 생성에 유리하다. 고-수준 발현에 흔히 효과적인 적절한 프로모터 시스템은 박시니아 바이러스 프로모터, 바쿨로바이러스 프로모터, 및 Ptac 프로모터를 포함하나, 이에 한정되지 않는다.
따라서, 일부 구현예에서, 본 발명에 적합한 생물학적으로 활성인, 가공된 효소를 암호화하는 뉴클레오타이드 서열을 포함하는 발현 벡터를 이용할 수 있다. 하나의 예에서, 발현 벡터는 아릴 설페이트-의존성 유전자 생성물을 암호화하는 임의의 뉴클레오타이드 서열을 포함할 수 있다. 추가의 구현예에서, 발현 벡터는 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 또는 서열 번호: 152의 뉴클레오타이드 서열을 포함하는 핵산을 포함한다. 다른 추가의 구현예에서, 발현 벡터는 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 66, 서열 번호: 68, 서열 번호: 69, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 임의의 뉴클레오타이드 서열을 포함하는 핵산을 포함한다. 심지어 추가의 구현예에서, 본 발명의 가공된 효소를 암호화하는 임의의 핵산 서열은 효소를 생산하는데 사용된 발현 숙주를 기반으로 코돈-최적화될 수 있다. 재조합 벡터의 제조 및 코돈 최적화는 당해 분야의 기술자에게 잘 공지되어 있고 많은 참고문헌, 예를 들면, Sambrook et al. (2012) Molecular Cloning: A Laboratory Manual, Fourth Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor,-N.Y에 기술되어 있다.
당해 분야의 기술자는 발현될 DNA 암호화 서열, 이러한 경우에, 가공된 유전자 생성물을 암호화하는 것은 벡터내에서 프로모터에 인접하게 및 이의 제어 하에 위치함을 인식할 수 있다. 당해 분야에 공지된 바와 같이, 프로모터는 전사가 개시되는 지점(즉, 전사 출발 부위)의 상부로 약 100개 뉴클레오타이드내 DNA 분자의 영역내에 있다. 이러한 영역은 전형적으로 상이한 유전자내 유사한 상대적인 위치에 있는 DNA 서열 성분의 수개의 유형을 함유한다. 이러한 프로코어의 제어하에서 암호화 서열을 가져오기 위해, 선택된 프로모터(즉, 이의 3')의 "하부"로 약 1 내지 약 50개의 뉴클레오타이드가 발현되도록 유전자의 생성물의 전사 판독 프레임의 전사 개시 부위의 5' 말단에 일반적으로 위치시킴이 당해 분야에 이해되어 있다.
원래의 삽입된 DNA내에 함유되지 않는 경우, 벡터의 전사 단위내로 적절한 폴리아데닐화 부위(예컨대, 5'-AATAAA-3')를 혼힙시키는 것이 또한 요구될 수 있다. 전형적으로, 폴리-A 첨가 부위는 전사 말단 앞 위치에서 암호화 서열의 "하부"로 약 30 내지 2000개 뉴클레오타이드에 위치한다.
별개의 전사 조절 서열 성분의 다른 유형은 인핸서이다. 인핸서는 특수한 암호화 영역 또는 유전자의 시간 특이성, 위치 및 발현 수준을 내포한다. 인핸서의 주요 기능은 이러한 인핸서에 결합하는 하나 이상의 전사 인자를 함유하는 세포내 암호화 서열의 전사 수준을 증가시키는 것이다. 인핸서는 프로모터가 존재하는 한, 전사 개시 부위로부터 다양한 거리에 위치하는 경우 기능할 수 있다.
임의로, 본 발명의 발현 벡터는 인핸서-프로모터에 작동적으로 연결된 폴리뉴클레오타이드를 포함한다. 본원에 사용된 바와 같이, 어구, "인핸서-프로모터"는 인핸서 및 프로모터 성분 둘 다를 함유하는 복합체 단위를 의미한다. 예를 들면, 발현 벡터는 진핵세포 프로모터인 인핸서-프로모터에 작동적으로 연결된 폴리뉴클레오타이드를 포함하고 발현 벡터는 카복시-말단 아미노산의 3' 및 암호화된 폴리펩타이드의 전사 단위내에 위치한 폴리아데닐화 신호를 추가로 포함한다. 본원에 사용된 바와 같이, 어구, "작동적으로 연결된"은 인핸서-프로모터가 이러한 암호화된 서열의 전사가 이러한 인핸서-프로모터에 의해 제어되고 조절되도록 하는 방식으로 암호화 서열에 연결되어 있음을 의미한다. 인핸서-프로모터를 암호화 서열에 작동적으로 연결시키기 위한 기술은 당해 분야에 잘 공지되어 있고; 목적한 암호화 서열에 대해 정밀한 배향 및 위치는 특히, 인핸서-프로모터의 특이적인 특성에 의존적이다.
본 발명의 벡터 작제물에 사용된 인핸서-프로모터는 형질감염될 세포내 발현을 구동하는 임의의 인핸서-프로모터일 수 있다. 잘 공지된 특성을 지닌 인핸서-프로모터를 사용함으로써, 유전자 생성물 발현의 수준 및 양식을 최적화시킬 수 있다.
본 발명의 가공된 효소는 본 발명의 핵산이 내부로 도입됨으로써 이에 의해 암호화된 단백질 또는 펩타이드의 핵산 및/또는 발현의 클론성 증식을 유발하도록, 원핵세포 또는 진핵 세포인, 세포들 또는 세포주내에서 발현시킬 수 있다. 이러한 세포 또는 세포주는 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 또는 서열 번호: 152의 서열에 개시된 것을 포함하는, 핵산을 증식 및 생산하는데 유용하다. 이러한 세포 또는 세포주는 또한 가공된 효소 자체, 예를 들면, 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 66, 서열 번호: 68, 서열 번호: 69, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160에 의해 기술된 것을 생산하는데 유용하다. 본원에 사용된 바와 같이, 용어 "형질전환된 세포"는 본 발명의 임의의 핵산이 형질전환, 형질감염, 형질도입, 감염, 또는 다른 수단에 의해 애부로 도입된, 임의의 세포, 또는 임의의 세포의 후대세포를 포함하는 것으로 의도된다. 적절한 벡터를 생산하고, 이러한 벡터로 세포를 형질감염시키고, 형질전환체를 확인하는 방법은 당해 분야에 잘 공지되어 있다 (참조: 예컨대, Sambrook et al. (2012) Molecular Cloning: A Laboratory Manual, Fourth Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.).
형질전환된 세포를 생산하기 위한 원핵 세포는 세균 속(bacterial genera) 에스케리키아(예컨대, 이. 콜라이), 슈도모나스(Pseudomonas)(예컨대, 피. 아에루기노사(P. aeruginosa)), 및 바실러스(Bacillus)(예컨대, 비, 서브틸리스(B. subtilus), 비. 스테아로써모필루스(B. stearothermophilus)) 뿐만 아니라, 당해 분야에 잘 공지되고 흔히 사용된 많은 다른 것의 구성원을 포함한다. 원핵 세포는 단백질 또는 펩타이드(예컨대, 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 66, 서열 번호: 68, 서열 번호: 69, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160의 아미노산 서열을 포함하는 가공된 효소, 이의 이러한 서열의 단편, 또는 이러한 서열을 포함하는 융합 단백질)를 대량 생산하는데 특히 유용하다. 세균 세포(예컨대, 이. 콜라이)는 예를 들면, T7 RNA 폴리머라제/프로모터 시스템, 박테리오파아지 λ 조절 서열, 또는 M13 파아지 조절 성분을 지닌 플라스미드를 포함하는 다양한 발현 벡터 시스템을 지닌 플라스미드를 포함하는 다양한 발현 벡터 시스템과 함께 사용될 수 있다. 세균 숙주는 또한 예를 들면, 단백질 A, lacZ, trpE, 말토즈-결합 단백질(MBP), 작은 유비퀴틴-관련 개질제(SUMO), 폴리-His 태그(tag), 또는 글루타티온-S-트랜스퍼라제(GST) 융합 단백질을 생성하는 융합 단백질 벡터(ventor)로 형질전환될 수 있다. 이들 모두 뿐만 아니라, 많은 다른 원핵세포 발현 시스템은 당해 분야에 잘 공지되어 있고, 상업적으로 광범위하게 이용가능하다(예컨대, GST 융합의 경우 pGEX-27(Amrad, USA)).
본 발명의 일부 구현예에서, 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 또는 서열 번호: 152 로 나타낸 핵산 서열을 포함하는 발현 벡터는 또한 임의의 가공된 효소와의 융합 단백질을 암호화하는 유전자 또는 핵산 서열을 포함할 수 있다. 추가의 구현예에서, 발현 벡터는 말토즈 결합 단백질을 암호화하는, malE 유전자를 추가로 포함할 수 있다. 이러한 발현 벡터로부터 단백질 발현의 유도시, 발현된 유전자 생성물은 말토즈 결합 단백질 및 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 66, 서열 번호: 68, 서열 번호: 69, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160에 나타낸 아미노산 서열을 포함하는 가공된 효소를 포함하는 융합 단백질을 포함한다. 다른 추가의 구현예에서, 임의의 상기 가공된 효소를 암호화하는 임의의 상기 핵산을 포함하는 발현 벡터는 SUMO 개질제, 예를 들면, 비-제한적 예에서, SUMO-1을 암호화하는 유전자를 추가로 포함할 수 있다.
다른 구현예에서, 본 발명에 따른 발현 벡터는 폴리-His 태그를 암호화하는 핵산 서열을 추가로 포함할 수 있다. 이러한 발현 벡터로부터 단백질 발현의 유도시, 발현된 유전자 생성물은 폴리-His 태그를 포함하는 태그 및 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 66, 서열 번호: 68, 서열 번호: 69, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160에 나타낸 아미노산 서열을 포함하는 가공된 효소를 포함하는 융합 단백질을 포함한다. 추가의 구현예에서, 발현 벡터는 이로부터 폴리-His 태그, MBP, 또는 SUMO를 임의의 가공된 효소와 함께 포함하는 융합 단백질이 발현될 수 있는, 폴리-His 태그 및 malE 유전자 또는 SUMO 유전자를 암호화하는 핵산 서열 둘 다를 포함할 수 있다.
형질전환된 세포를 생산하는데 유용한 진핵 세포 및 세포주는 포유동물 세포(예컨대, 내피 세포, 비만 세포, COS 세포, CHO 세포, 섬유아세포, 하이브리도마, 난모세포, 배아 줄기 세포), 곤중 세포주(예컨대, 드로소필리 슈나이더(Drosophila Schneider) 세포), 효모, 및 진균을 포함한다. 이러한 세포의 비-제한적 예는 COS-7 세포, CHO, 세포, 쥐 1차 심장 미세혈관 내피 세포(CME), 쥐 비만 세포주 C57.1, 사람 제대 혈관의 1차 내피 세포(primary endothelial cells of umbilical vein)(HUVEC), F9 배아 암종 세포, 랫트 지방 패드 내피 세포(rat fat pad endothelial cell)(RFPEC), 및 L 세포(예컨대, 쥐 LTA tk- 세포)를 포함하나, 이에 한정되지 않는다.
벡터는 당해 분야에 잘 공지된 다양한 방법, 예를 들면, 그러나 이에 한정되지 않는, 인산칼슘 형질감염, 인산스트론튬 형질감염, DEAE 덱스트란 형질감염, 전기천공, 지질감염, 미세주사, 미세-비드 상의 발리스틱 삽입(ballistic insertion), 원형질체 융합에 의해 또는, 바이러스 또는 파아지 벡터의 경우, 재조합 바이러스 또는 파아지를 사용한 형질감염에 의해 수용체 또는 "숙주" 세포내로 도입될 수 있다.
일부 구현예에서, 본 발명은 생물학적 활성에 대해 아릴 설페이트 화합물과의 반응시 가공된 효소 의존성의 실질적으로 순수한 제제를 제공한다. 추가의 구현예에서, 정제된 가공된 효소는 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 66, 서열 번호: 68, 서열 번호: 69, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160으로서 개시된 아미노산 서열을 포함할 수 있다.
다른 구현예에서, 본 발명은 보존적 또는 비-보존적 치환이 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 66, 서열 번호: 68, 서열 번호: 69, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160에 개시된 아미노산 서열 내 특정 잔기에 대해 이루어진 가공된 효소 변이체를 제공한다. 보존적 또는 비-보존적 치환은 활성 부위들 둘러싸거나 촉매작용에 포함된 잔기를 포함하는, 아미노산 서열내 임의의 지점에서 이루어질 수 있으며, 단, 효소는 측정가능한 촉매 활성; 즉, 아릴 설페이트 화합물로부터 다당류, 특히 헤파로산-계 및/또는 HS-다당류로 설포 그룹의 전달을 보유한다. 다른 구현예에서, 아릴 설페이트 화합물은 PNS이다. 여전히 다른 구현예에서, 아릴 설페이트 화합물은 NCS이다.
다른 구현예에서, 가공된 설포트랜스퍼라제 효소는 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 66, 서열 번호: 68, 서열 번호: 69, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160으로 개시된 아미노산 서열에 대해 적어도 50%, 예를 들면, 적어도 60%, 70%, 80%, 85%, 90% 또는 95% 내지 적어도 99%의 아미노산 서열 동일성을 가지지만, 아릴 설페이트 화합물로부터, 다당류, 특히 헤파로산-계 및/또는 HS 다당류로 설포 그룹의 전달의 이의 촉매 활성을 유지한다. 이러한 서열은 당해 분야의 통상의 기술자에 의해 통상적으로 생산될 수 있고, 설포트랜스퍼라제 활성은 본원에 기술된 것과 같은 통상의 방법으로 시험할 수 있다.
또한, 및 다른 구현예에서, 본원에 기술된 임의의 방법에 따라 이용된 임의의 가공된 설포트랜스퍼라제의 아미노산 서열(들)은, 설포트랜스퍼라제가 아릴 설페이트-의존성 활성을 가지는 한, 설포 공여체로서 3'-포스포아데노신 5'-포스포설페이트를 사용하여 동일한 반응을 촉매하는 야생형 설포트랜스퍼라제에 대해 동일성 퍼센트로서 특징화될 수 있다. 예를 들면, 및 다른 구현예에서, 본 발명의 임으의 방법에 따라 이용될 수 있는 가공된 아릴 설페이트-의존성 글루코사미닐 N-설포트랜스퍼라제는 이의 생물학적 기능적 단편을 포함하는, EC 2.8.2.8의 아미노산 서열과 적어도 50%, 예를 들면, 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 내지 적어도 97% 이하의 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다. 추가의 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제는 야생형 사람 글루코사미닐 N-데아세틸라제/N-설포트랜스퍼라제 효소(entry sp|P52848|NDST_1_사람, 상기 도 도 6a, 도 6b, 및 도 6c)의 N-설포트랜스퍼라제 도메인의 아미노산 서열과 적어도 50%, 예를 들면, 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 내지 적어도 97% 서열 동일성을 포함할 수 있다.
다른 구현예에서, 본 발명의 임의의 방법에 따라 이용될 수 있는 가공된 아릴 설페이트-의존성 헥수로닐 2-O 설포트랜스퍼라제는 EC 2.8.2.- 효소 부류내 임의의 야생형 헥수로닐 2-O 설포트랜스퍼라제 효소와 적어도 50%, 예를 들면, 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 내지 적어도 97% 이하의 서열 동일성을 갖는 아미노산 서열, 예를 들면, 이의 생물학적으로 기능성인 단편을 포함한다. 추가의 구현예에서, 가공된 헥수로닐 2-O 설포트랜스퍼라제는 야생형 닭 헥수로닐 2-O 설포트랜스퍼라제 효소(entry sp|Q76KB1|HS2ST_CHICK, 상기 도 17a, 도 17b, 도 17c, 및 도 17d에서)의 아미노산 서열과 적어도 50%, 예를 들면, 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 내지 적어도 97% 이하의 서열 동일성을 포함할 수 있다.
다른 구현예에서, 본 발명의 임의의 방법에 따라 이용될 수 있는 가공된 아릴 설페이트-의존성 글루코사미닐 6-O 설포트랜스퍼라제는 EC 2.8.2.- 내 임의의 야생형 글루코사미닐 6-O 설포트랜스퍼라제 효소의 아미노산 서열과 적어도 50%, 예를 들면, 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 내지 적어도 97% 이하의 서열 동일성을 갖는 아미노산 서열, 예를 들면, 이의 생물학적 기능성 단편을 포함할 수 있다. 추가의 구현예에서, 가공된 글루코사미닐 6-O 설포트랜스퍼라제는 마우스 글루코사미닐 6-O-설포트랜스퍼라제 (UniProtKB-수탁 번호 Q9QYK5)의 제1 동형의 아미노산 서열과 적어도 50%, 예를 들면, 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 적어도 97% 이하의 서열 동일성을 포함할 수 있다. 추가의 구현예에서, 가공된 글루코사미닐 6-O 설포트랜스퍼라제는 마우스 글루코사미닐 6-O 설포트랜스퍼라제(entry Q9QYK5|H6ST1_MOUSE, 상기 도 21a, 도 21b, 및 도 21c에서)의 제1 동형의 아미노산 서열의 잔기 67 내지 377번과 적어도 50%, 예를 들면, 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 적어도 97% 이하의 서열 동일성을 포함할 수 있다.
다른 구현예에서, 본 발명의 임의의 방법에 따라 이용될 수 있는 가공된 아릴 설페이트-의존성 글루코사미닐 3-O 설포트랜스퍼라제는 EC-2.8.2.23 효소 부류내 임의의 야생형 효소의 아미노산 서열과 적어도 50%, 예를 들면, 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 적어도 97% 이하의 서열 동일성을 갖는 아미노산 서열, 예를 들면, 이의 생물학적 기능성 단편을 포함할 수 있다. 추가의 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제는 야생형 사람 글루코사미닐 3-O-설포트랜스퍼라제(entry O14792|HS3S1_HUMAN, 상기 도 26a, 도 26b, 및 도 26c에서)의 제1 동형의 아미노산 서열의 잔기 48 내지 311과 적어도 50%, 예를 들면, 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 적어도 97% 이하의 서열 동일성을 포함할 수 있다.
실질적으로 순수한 가공된 효소는 다양한 적용에서 사용하기 위해 다른 폴리펩타이드 서열과 결합될 수 있다. 따라서, 예를 들면, 가공된 효소는 하나 이상의 추가의 폴리펩타이드에 결합하여 당해 분야에 일반적으로 공지된 바와 같이, 융합 단백질을 형성할 수 있다. 추가의 폴리펩타이드는 가공된 효소의 N-말단, C-말단 또는 말단 둘 다에 결합될 수 있다. 이러한 융합 단백질은 추가의 폴리펩타이드 서열이 용이하게 확인되거나(예컨대, 항원 결정인자를 제공함으로써), 용이하게 정제되거나(예컨대, 친화성 정제를 위한 리간드를 제공함으로써), 용액 속의 가공된 효소의 용해도를 향상시키는 경우 특히 유용할 수 있다.
다른 구현예에서, 실질적으로 순수한 단백질은 가공된 효소의 아미노산 서열의 부위 또는 단편 만을 포함할 수 있다. 일부 예에서, 특히 최소의 단편이 효소의 용해도 또는 반응성을 향상시키는 경우, 아릴 설페이트-의존성 활성을 보유하는 최소의 단편을 사용하는 것이 바람직할 수 있다. 따라서, 일부 구현예에서, 본 발명의 방법은 임의의 길이의 실질적으로 순수한 가공된 설포트랜스퍼라제, 예를 들면, 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 서열 번호: 25, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 66, 서열 번호: 68, 서열 번호: 69, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 110, 서열 번호: 111, 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 서열 번호: 122, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 서열 번호: 151, 서열 번호: 153, 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160에 의해 기술된 전체 길이 형태, 예를 들면, 이의 최소의 기능적 단편의 실질적으로 순수한 가공된 설포트랜스퍼라제를 사용하여 실시할 수 있다. 추가로, 이러한 단백질은 또한 상술한 바와 같은 보존적 또는 비-보존적 치환 변이체를 포함할 수 있다.
가공된 효소는 이의 단백질 서열에 의해 나타난 특성을 기반으로 임의의 다양한 방법에 의해 실질적으로 정제될 수 있다. 전형적으로, 가공된 효소, 이의 융합 단백질, 또는 단편은 상술한 바와 같은 발현 벡터로 형질전환되거나 형질감염된 세포로부터 정제될 수 있다. 곤충, 효모, 진핵 세포, 또는 원핵 세포 발현 시스템을 사용할 수 있고, 당해 분야에 잘 공지되어 있다. 단백질 또는 단편이 골지체, 소포체, 또는 이러한 세포의 다른 막-함유 구조로부터 유래된 미소체내에 국재화된 경우, 단백질은 적절한 세포 분획으로부터 정제될 수 있다. 대안적으로, 단백질이 이러한 구조내에 국재화되지 않거나, 재조합 세포(예컨대, 원핵 세포)내에 봉입체(inclusion body) 속에 응집되는 경우, 단백질은 표준 수단에 의해 전체 분해된 세포로부터 또는 가용화된 봉입체로부터 정제될 수 있다.
정제는 표준 단백질 정제 과정, 예를 들면, 그러나 이에 한정되지 않는, 친화성 크로마토그래피, 겔-여과 크로마토그래피, 이온-교환 크로마토그래피, 고-성능 액체 크로마토그래피(RP-HPLC, 이온-교환 HPLC, 크기-배제 HPLC), 고-성능 크로마토포커싱 크로마토그래피(high-performance chromatofocusing chromatography), 소수성 상호작용 크로마토그래피, 면역침전, 또는 면역친화성 정제를 사용하여 달성할 수 있다. 겔 전기영동(예컨대, PAGE, SDS-PAGE)을 또한 사용하여 이의 분자량, 전하 특성 및 소수성을 기반으로 단백질 또는 펩타이드를 단리할 수 있다.
가공된 효소, 또는 이의 단편은 또한 다른 펩타이드, 예를 들면, 항원성 결정인자, 폴리-히스티딘 태그(예컨대, QIAexpress 벡터, QIAGEN Corp., 캘리포니아주 채쓰워쓰 소재), 또는 보다 큰 단백질(예컨대, pGEX-27 벡터를 사용한 GST(Amrad, USA), Green Lantern 벡터를 사용하는 녹색 형광성 단백질 (GlBCO/BRL. 메사츄세츠주 게이터스버그 소재), pMAL 벡터를 사용하는 말토즈 결합 단백질(New England Biolabs, 메사츄세츠주 입스위치 소재), 또는 SUMO 단백질에 융합된 목적한 서열을 포함하는 융합 단백질을 생성시킴으로써 편리하게 정제할 수 있다. 융합 단백질은 원핵 또는 진핵 세포로부터 발현 및 회수할 수 있고 융합 벡터 서열을 기반으로 임의의 표준 방법에 의해 정제할 수 있다. 예를 들면, 융합 단백질은 융합의 비-아릴 설페이트-의존성 효소 부위에 대한 항체를 사용한 면역친화성 또는 면역침전에 의해 또는, 폴리-His 태그의 경우에, 니켈 컬럼에 대한 친화성 결합에 의해 정제할 수 있다. 이후에, 목적한 가공된 효소 단백질 또는 단편을 융합 단백질로부터 융합 단백질의 효소적 절단에 의해 추가로 정제할 수 있다. 단백질의 정제를 위한 이러한 융합 작제물의 제조 및 사용 방법은 당해 분야에 잘 공지되어 있고 이러한 목적을 위해 현재 상업적으로 이용가능하다.
또한, 일부 구현예에서, 임의의 가공된 효소를 암호화하는 단리된 핵산을 사용하여 숙주 세포를 형질전환시킬 수 있다. 수득되는 단백질은 이후에 잘 공지된 방법, 예를 들면, 그러나 이에 한정되지 않는, 하기 실시예에 기술된 것으로 실질적으로 정제할 수 있다. 대안적으로, 단리된 핵산은 세포-유리된 시험관내 해독 시스템에서 이용할 수 있다. 이러한 시스템은 또한 당해 분야에 잘 공지되어 있다.
본 발명의 특수한 구현예가 기술되었지만, 본 발명은 본 개시내용의 취지 및 영역내에서 추가로 변형될 수 있다. 당해 분야의 기술자는 단지 통상의 실험, 구체적인 과정에 대한 다수의 등가물, 본원에 기술된 구현예, 청구범위, 및 실시예를 사용하여 인식하거나, 확인할 수 있다. 따라서, 이러한 등가물은 본 발명의 영역내에 있는 것으로 고려되며, 따라서, 본 출원은 이의 일반적인 원리를 사용한 본 발명의 임의의 변화, 사용 또는 개조를 포함하는 것으로 의도된다. 또한, 본 발명은 본 개시내용으로부터 이러한 이탈을 본 발명이 속하고 첨부된 청구범위내에 속하는 당해 분야에 공지되거나 통상의 실시내에 있는 것으로 포함하는 것으로 의도된다.
명확성을 위해, 별도의 구현예의 문맥에 기술된, 본 발명의 특정 특징은 또한 단일 구현예에서 함께 제공될 수 있음이 인정된다. 역으로, 간략성을 위해, 단일 구현예의 문맥에서 기술된 본 발명의 다양한 특징은 또한 별도로 또는 임의의 적합한 소-조합으로 또는 본 발명의 임의의 다른 기술된 구현예에서 적합한 것으로서 제공될 수 있다. 다양한 구현예의 문맥에서 기술된 특정의 특징은 구현예가 이러한 요소없이 작동되지 않는 한, 이러한 구현예의 필수적인 특징으로 고려되지 않아야 한다.
본 명세서에 언급된 모든 참고문헌, 특허, 및 특허원의 내용은 본원에 참고로 포함되며, 이러한 참고문헌이 본 발명에 대한 선행 기술로 이용가능함을 인정하는 것으로 고려되지 않아야 한다. 본 명세서에 포함된 공보 및 특허원 모두는 본 발명이 속한 당해 분야의 통상의 기술 수준의 지표이며, 각각의 개개 공보 또는 특허원이 구체적으로 나타내어지고 참고로 개별적으로 나타내어진 경우와 동일한 정도로 포함된다.
본 발명은 또한 다음의 작업 및 예측 실시예에 의해 추가로 나타내어지며, 이들 중 어느 것도 본 발명을 제한하는 것으로 고려되지 않아야 한다. 또한, 단락 제목이 사용된 정도까지, 이들은 필수적으로 제한하는 것으로 고려되지 않아야 한다. 구조적 또는 예측적인 것으로 달리 나타낸 실시예를 기술하기 위한 과거시제의 임의의 사용은 구성 또는 예측 실시예가 실제로 수행되었음을 반영하기 위한 것이 아니다.
실시예
다음의 작업 및 예측 실시예는 현재 가장 잘 알려진 본 발명의 구현예를 나타낸다. 그러나, 다음은 본 발명의 원리 적용을 단지 예시하거나 설명하는 것임이 이해되어야 한다. 다수의 변형 및 대안의 조성물, 방법, 및 시스템은 본 발명의 취지 및 영역으로부터 벗어나지 않고 당해 분야의 기술자에 의해 고안될 수 있다. 따라서, 본 발명이 위에서 상세히 기술되었지만, 다음의 실시예를 본 발명의 가장 실제적이고 바람직한 구현예인 것으로 현재 고려되는 것과 관련하여 추가로 상세히 제공한다.
실시예 1: 가공된 아릴 설페이트-의존성 효소의 클로닝, 발현, 및 정제
연구는 본 개시내용의 구현예에 따라서 본 발명에 따른 유전자가 가공된 아릴 설페이트-의존성 효소, 특히 설포트랜스퍼라제 활성을 갖는 효소를 과발현할 수 있는 숙주 세포내로 형질전환될 수 있는지를 측정하기 위해 수행되었다. 발현 후, 각각의 아릴 설페이트-의존성 효소를 숙주 세포로부터 단리하고 정제하였다.
일반적으로, 임의의 서열의 유전자를 암호화하는 DNA를 당해 분야에 일반적으로 공지된 방법, 예를 들면, 그러나 이에 한정되지 않는, 올리고뉴클레오타이드 합성 및 어닐링(annealing)에 의해 새로이 합성할 수 있다. 대안적으로, DNA는 상업적으로 합성, 및 ThermoFisher Scientific, GenScript, DNA 2.0, 또는 OriGene을 포함하나, 이에 한정되지 않는, 주어진 서열의 유전자를 정기적으로 합성하는 수개의 실험실 중 임의의 하나로부터 구입할 수 있다. 당해 분야의 기술자는 동일한 서비스를 제공하는 수개의 회사가 존재하며, 상기 제공된 목록은 단지 이의 작은 샘플임을 인식할 수 있다. 목적한 유전자는 독립적으로 합성하고 후속적으로 통상의 분자 생물학 기술을 사용하여 세균 또는 다른 발현 벡터내로 삽입시킬 수 있거나, 유전자를 발현 벡터 자체를 포함하는 DNA를 사용하여 동시에 합성할 수 있다. 목적한 유전자와 유사하게, 적합한 발현 벡터를 또한 합성하거나 상업적으로 구입할 수 있다. 흔히, 세균 발현 벡터는 숙주 세포에 대해 선택적 항생제 내성을 부여하는 유전자 뿐만 아니라, 세포가 이소프로필 β-D-1-티오갈락토피라노시드(IPTG)의 첨가에 반응하여 목적한 단백질을 과발현하도록 하는 유전자를 포함한다. IPTG를 사용하여 단백질 발현을 유도함에 의한 목적한 단백질의 세균 생산은 당해 분야에 널리 알려져 있다.
상술한 바와 같이, 발현 벡터는 추가의 공지된 단백질과 동시 발현되어 단백질 폴딩(folding) 및 용해도를 보조하는 융합 단백질의 생성을 가능하도록 하는 유전자를 또한 포함할 수 있다. 일반적으로 생산되고 당해 분야에 잘 공지된 융합 단백질의 비-제한적인 예는 MBP, SUMO, 또는 녹색 형광성 단백질과의 융합물을 포함한다. 특히, MBP 융합 단백질은 MBP가 일부 친화성 크로마토그래피에 사용된 아밀로스-계 수지에 대해 높은 친화성을 지니므로 보다 용이한 정제를 촉진하지만, SUMO 융합 단백질은 정지상(stationary phase)으로서 Ni2+-계 수지를 지닌 컬럼 상에서 친화성 정제를 가능하게 하는 폴리-히스티딘 태그를 포함할 수 있다. 흔히, 목적한 단백질과 MBP 및/또는 SUMO 사이의 융합 단백질은 흔히 2개의 단백질을 연결시키는 아미노산 연결 서열을 포함할 수 있다. MBP 융합 단백질을 생산하기 위해 구입할 수 있는 상업적인 발현 벡터의 비-제한적인 예는 pMAL-c5E™ 및 pMAL-c5X™ 벡터를 포함하며, 이는 New England Biolabs로부터 구입할 수 있다. 유사하게, 및 다른 비-제한적인 예에서, 상업적인 발현 벡터, 예를 들면, LifeSensors, Inc로부터 이용가능한 pE-SUMOpro AMP 벡터를 또한 구입하여 SUMO 융합 단백질을 생산할 수 있다. 융합 단백질이 생산되어 정제되면, 프로테아제를 이용하여 융합된 단백질 및, 절단이 활성에 필수적인 경우, 효소로부터 임의의 관련된 연결 서열을 절단시킬 수 있다.
또한, 발현 벡터는 목적한 단백질의 N- 또는 C-말단에서 합성될 수 있는 폴리-히스티딘 태그를 암호화하는 DNA를 또한 포함할 수 있다. MBP 융합과 같이, 폴리-히스티딘 태그를 포함하는 단백질은, 이러한 태그가 많은 정제 컬럼에서 이용되는 Ni2+ 수지에 대해 높은 친화성을 가지므로 효소 정제를 단순화시킨다. 추가로, 폴리-히스티딘 태그가 효소의 최적의 활성에 필수적인 경우 이를 정제 후 임의로 절단할 수 있다. C-말단 폴리-히스티딘 태그를 암호화하는 발현 벡터의 비-제한적인 예는 Novagen으로부터 이용가능한 pET21b 벡터이다. 폴리-히스티딘 태그를 암호화하는 발현 벡터의 다른 비-제한적 예는 pE-SUMO 벡터이며, 이는 SUMO 단백질의 N-말단에서 폴리-히스티딘 태그를 암호화한다.
본 실시예에서, 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 또는 서열 번호: 151의 아미노산 서열 각각을 포함하는 가공된 아릴 설페이트-의존성 효소를 암호화하는, 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 또는 서열 번호: 152의 뉴클레오타이드 서열을 포함하는 이중-가닥 DNA 단편을 Integrated DNA Technologies' (IDT) gBlocks® 유전자 단편 합성 서비스(Gene Fragments synthesis service)를 사용하여 합성하였다. 폴리머라제 쇄 반응(PCR)을 개시하여, 발현 벡터내로의 삽입을 촉진시키는 적절한 제한 효소 인식 서열을 포함하는 정방향(forward) 및 역방향(reverse) 프라이머를 사용하여, 각각의 이중-가닥 DNA 단편의 카피를 생성하였다. 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 또는 서열 번호: 151의 아미노산 서열 각각을 포함하는 가공된 효소를 암호화하는 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 124, 서열 번호: 126, 서열 번호: 128, 서열 번호: 130, 서열 번호: 132, 서열 번호: 134, 서열 번호: 136, 서열 번호: 138, 서열 번호: 140, 서열 번호: 142, 서열 번호: 144, 서열 번호: 146, 서열 번호: 148, 서열 번호: 150, 또는 서열 번호: 152의 뉴클레오타이드 서열을 포함하는 유전자는 NdeI 및 BamHI 제한 효소 인식 서열을 함유하였으며 pMAL-c5x 발현 벡터 내로 NEB에 의해 제공된 신속한 연결 키트(quick ligation kit)를 사용하여 연결시켰다. 이후에, 발현 벡터를 적격(competent) DH5-α 이. 콜라이 세포내로 형질전환시켰다. 단일의 클론을 100 μL/mL 암피실린이 들어있는 LB 배지 속에서 항온처리하였다. 형질전환된 숙주 세포내 각각의 유전자 및 발현 벡터의 뉴클레오타이드 서열을 시판되는 DNA 서열분석(GeneWiz)으로 확인하였다.
단백질 발현이 확인된 DNA 작제물을 적격 BL21(DE3) 이. 콜라이 세포내로 형질전환시킴에 의해 또한 달성되었지만, 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 또는 서열 번호: 151 의 아미노산 서열을 포함하는 가공된 효소의 단백질 발현은, 확인된 DNA 작제물을 적격 SHuffle® T7 Express lysY 이. 콜라이 세포내로 형질전환시켜 달성하였다. 어느 하나의 작제물로부터, 수득되는 콜로니를 사용하여 LB 배지 속에서 250 mL 배양물을 접종하고, 이를 32℃에서 대략 0.4 내지 0.6의 600 nM(OD 600)의 광학 밀도가 관찰될 때까지 진탕 및 항온처리하였다. 발현은 100 μM IPTG를 각각의 배양물에 18℃에서 첨가함으로써 유도시켰다.
18℃에서 밤새 항온처리하는 경우, 발현된 세포를 3,620 g에서 원심분리하고 펠렛을 10 mL의 재현탁 완충제(25 mM 트리스-HCl, pH 7.5; 0.15-M-NaCl; 0.2 mg/mL 라이소자임; 10 μg/ml DNase-I; 5 mM MgCl2; 및 0.1% (w/v) 트리톤-X 100) 속에 재현탁시켜 수거하였다. 재현탁된 세포를 빙상에서 각각 10초의 3회 펄스 동안 분해하고, 후속적으로 0.45-μm 주사기 여과기를 통과시켰다. 수득되는 상층액을 25 mM 트리스-HCl, pH 7.5 및 0.15-M-NaCl을 포함하는 Dextrin Sepharose® 수지(GE Biosciences)를 포함하는 5-mL 스핀 컬럼(spin column)(G-biosciences)내로 로딩하였다. 목적한 효소를 25 mM 트리스-HCl, pH 7.5; 0.15-M-NaCl; 및 40 mM 말토즈를 포함하는 용출 완충제 속에 가하여 컬럼으로부터 용출시켰다.
다른 한편, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 또는 서열 번호: 108의 아미노산 서열 각각을 포함하는 가공된 효소를 암호화하는 서열 번호: 26, 서열 번호: 28, 서열 번호: 30, 서열 번호: 32, 서열 번호: 34, 서열 번호: 36, 서열 번호: 38, 서열 번호: 40, 서열 번호: 42, 서열 번호: 44, 서열 번호: 46, 서열 번호: 48, 서열 번호: 50, 서열 번호: 52, 서열 번호: 54, 서열 번호: 56, 서열 번호: 58, 서열 번호: 60, 서열 번호: 62, 서열 번호: 64, 서열 번호: 71, 서열 번호: 73, 서열 번호: 75, 서열 번호: 77, 서열 번호: 79, 서열 번호: 81, 서열 번호: 83, 서열 번호: 85, 서열 번호: 87, 서열 번호: 89, 서열 번호: 91, 서열 번호: 93, 서열 번호: 95, 서열 번호: 97, 서열 번호: 99, 서열 번호: 101, 서열 번호: 103, 서열 번호: 105, 서열 번호: 107, 또는 서열 번호: 109의 뉴클레오타이드 서열을 포함하는 유전자는 BsaI 및 XbaI 제한 효소 인식 서열을 함유하였으며, pE-SUMO 벡터(LifeSensors, Inc.) 내로 연결시켰다. 이후에, 발현 벡터를 적격 BL21-DE3 이. 콜라이 세포내로 형질전환시켰다. 단일 콜로니를 100 μL/mL 암피실린이 들어있는 테리픽 브로쓰(Terrific Broth) 속에서 항온처리하였다. 각각의 유전자의 뉴클레오타이드 서열 및 형질전환된 숙주 세포내 발현 벡터를 시판되는 DNA 서열분석(GeneWiz)으로 확인하였다.
서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 또는 서열 번호: 108 의 아미노산 서열을 포함하는 가공된 효소의 단백질 발현은 암피실린이 들어있는 테리픽 브로쓰 속의 500 mL 배양물을 접종하고 35℃에서 대략 0.6 내지 0.8의 OD 600에 도달할 때까지 진탕하여 항온처리시켰다. 단백질 발현은 0.2 mM IPTG를 18℃에서 첨가하여 유도시켰다. 이후에, 배양물을 18℃에서 밤새 항온처리하고, 후속적으로 분해하고 상술한 바와 동일한 과정을 사용하여 여과하였다. 가공된 효소를 25 mM 트리스-HCl, pH 7.5, 0.15-M-NaCl, 5 mM MgCl2, 및 30 mM 이미다졸을 포함하는 결합 완충제 속에 현탁된 HisPur Ni-NTA 수지(Thermofisher)를 포함하는 5 mL 스핀 컬럼(G-biosciences) 속에서 후속적으로 정제하였다. 목적한 효소는 25 mM 트리스-HCl, pH 7.5, 0.15-M-NaCl, 5 mM MgCl2, 및 300 mM 이미다졸을 포함하는 용출 완충제를 첨가함으로써 컬럼으로부터 용출하였다.
실시예 2: 아릴 설페이트-의존성 설파타제 활성의 확인
일반적으로, 아릴 설페이트-의존성 효소의 설파타제 활성은, 많은 아릴 설페이트 화합물의 데설푸릴화된 방향족 생성물, 예를 들면, 그러나 이에 한정되지 않는 PNS, MUS, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1 나프틸 설페이트, 2NapS, 및 NCS 각각이 근자외선 또는 가시 스펙트럼에서 광 또는 형광성을 흡수하는 능력을 가지므로, 용이하게 측정될 수 있다. 데설푸릴화된 방향족 생성물에 의한 흡수 또는 형광성은 분광광도계 또는 형광계를 각각 사용하여 검출할 수 있다. 당해 분야의 기술자는 특수한 아릴 설페이트 화합물 및 이의 데설푸릴화된 방향족 생성물(들)의 스펙트럼 특성을 기반으로 반응의 진행을 모니터하는데 사용하기 위한 장치를 용이하게 결정할 수 있다.
하나의 비-제한적인 실시예에서, PNS가 기질로서 이용된 반응은 설페이트 에스테르 연결의 가수분해시 생성물로서 p-니트로페놀을 생산한다. pH가 p-니트로페놀의 pKa(약 7.15)보다 더 큰 반응 혼합물은, 음으로 하전된 p-니트로페놀레이트 이온이 중성으로 하전된 p-니트로페놀보다 우세하므로, 황색으로 변한다. 전형적으로, p-니트로페놀레이트 이온을 함유하는 용액에 의한 가시 광의 최대 흡수는 약 405 nm의 파장에서 관찰될 수 있다. 결과적으로, 동일한 완충제 조건에서 PNS 만을 함유하는 음성 대조군보다 더 큰 반응 조건 하에서 흡광도 값은, 효소가 활성임을 나타낸다. 유사하게, p-니트로페놀레이트 이온이 특수한 아릴 설페이트-의존성 효소의 촉매작용의 결과로 보다 더 생산되면서, 시간의 함수로서 반응 혼합물의 흡광도는 약 405 nm에서 측정되어 반응 속도 및 다른 역학적 정보를 측정할 수 있다. 다른 비-제한적 예로서, NCS, 4-니트로카테콜의 데설푸릴화된 생성물의 생산은, 설페이트 에스테르 연결의 가수분해 시, 약 515 nm의 파장에서 가시광의 흡수를 관찰함에 의해, 4-니트로카테콜의 pKa(약 7.17)보다 큰 pH를 갖는 반응물 속에서 측정될 수 있다.
다른 제한적인 예로서, 2NapS의 데설푸릴화된 생성물은 보다 낮은 파장에서 방사선에 의해 여기되는 반응시 용액 속에서 형광을 낼 수 있다. 용액의 pH에 따라서, 데설루릴화된 생성물은 2-나프톨 또는 2-나프톨레이트 이온(pKa = 9.5)이다. 용액 속에서 단일의 2-나프틸 종의 존재를 보증하기 위하여, 완료된 반응물을 지닌 조성물을 산 또는 염기로 전형적으로 퀀칭(quenching)시켜 대략 355 nM의 최대 방출을 갖는, 2-나프톨, 또는 약 410 nm의 최대 방출을 갖는 2-나프톨레이트 이온에 대한 평형을 구동시킨다. 어느 하나의 예에서, 데설푸릴화도니 생성물은 대략 320 nm의 파장에서 여기된다
따라서, 연구를 본 개시내용의 구현예에 따라 수행하여 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 서열 번호: 65, 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 서열 번호: 108, 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 또는 서열 번호: 151의 아미노산 서열을 포함하는 정제된 효소의 설파타제 활성을 측정하였다. PNS, NCS, 및 2NapS를 사용한 비-정체 상 설파타제 활성은 용출 완충제 속에 50 μM 효소 및 5 mM의 기질을 함유하는 100-μL 반응물 속에서 모니터링하였다. PNS를 함유하는 반응물 속에서, p-니트로페놀레이트의 생산 결과로서 반응 혼합물의 흡광도는 401 nm에서 측정하였다. NCS를 함유하는 반응물 속에서, 4-니트로카테콜의 생산 결과로서 반은 혼합물의 흡광도는 515 nm에서 측정하였다. 2NapS를 함유하는 반응 혼합물을 0.1M NaOH를 가하여 퀀칭시켜 2-나프톨레이트 이온에 대한 반응의 결과로서 생산된 모든 2-나프톨을 전환시켰다. 활성 실험의 세트 모두를 Spectramax M2 미세플레이트 판독기(Microplate Reader)(Molecular Dynamics)를 사용하여 수행하였다. 추가로, 음성 대조군 반응 조건을 각각의 실험에 대해 설정하였으며, 이는 용출 완충제(상기 참고) 속에 아릴 설페이트 화합물을 함유하나, 효소는 존재하지 않았다. 가공된 효소에 대한 활성 실험을 수개의 데이타 세트에서 수행하였다. 모든 미가공 데이타를 표준화하고 모든 다른 구성성분을 가하나 효소를 가하지 않는 대조군보다 신호에 있어서의 증가 퍼센트로서 평가하였고, 결과는 하기 표 2 내지 10에 기록하였다. 특히, 천연의 글루코사미닐 N-설포트랜스퍼라제의 돌연변이체인 효소의 결과는 표 2, 표 3, 및 표 4에 기록하고, 천연의 헥수로닐 2-O-설포트랜스퍼라제의 돌연변이체인 효소의 결과는 표 5 및 표 6에 기록하며, 천연의 글루코사미닐 6-O-설포트랜스퍼라제의 돌연변이체인 효소의 결과는 표 7 및 표 8에 기록하고, 천연의 글루코사미닐 3-O-설포트랜스퍼라제의 돌연변이체인 효소의 결과는 표 9 및 표 10에 기록한다.
PNS (Abs401) (-) 대조군 % increase
서열 번호: 1 0.078 0.055 42%
서열 번호: 3 0.1095 0.055 99%
서열 번호: 5 0.0965 0.055 75%
서열 번호: 7 0.0925 0.055 68%
서열 번호: 9 0.107 0.079 35%
서열 번호: 11 0.128 0.079 62%
서열 번호: 15 0.083 0.059 42%
NCS (Abs515) (-) 대조군 % increase
서열 번호: 3 0.0545 0.041 33%
서열 번호: 5 0.0545 0.041 33%
서열 번호: 7 0.057 0.041 39%
서열 번호: 9 0.168 0.083 102%
서열 번호: 11 0.213 0.083 157%
서열 번호: 13 0.201 0.083 143%
2NapS (λem,410) (-) 대조군 % increase
서열 번호: 3 2.974 x 106 1.804 x 106 65%
서열 번호: 5 3.188 x 106 1.804 x 106 76%
서열 번호: 9 2.972 x 106 1.804 x 106 65%
서열 번호: 11 2.965 x 106 1.804 x 106 64%
NCS (Abs515) (-) 대조군 % increase
서열 번호: 27 0.064 0.046 39%
서열 번호: 29 0.063 0.046 37%
서열 번호: 33 0.072 0.046 56%
서열 번호: 45 0.085 0.046 85%
서열 번호: 53 0.082 0.046 78%
서열 번호: 63 0.069 0.046 50%
서열 번호: 65 0.065 0.046 41%
PNS (Abs401) (-) 대조군 % increase
서열 번호: 27 0.103 0.073 41%
서열 번호: 33 0.077 0.046 67%
서열 번호: 35 0.076 0.046 65%
서열 번호: 37 0.089 0.046 93%
서열 번호: 39 0.076 0.046 65%
서열 번호: 41 0.084 0.046 82%
서열 번호: 45 0.124 0.080 55%
서열 번호: 47 0.194 0.095 105%
서열 번호: 51 0.210 0.095 121%
서열 번호: 53 0.120 0.080 50%
서열 번호: 55 0.067 0.046 45%
서열 번호: 57 0.072 0.046 57%
서열 번호: 59 0.073 0.046 59%
서열 번호: 61 0.068 0.046 48%
서열 번호: 63 0.105 0.073 44%
서열 번호: 65 0.105 0.080 31%
PNS (Abs401) (-) 대조군 % increase
서열 번호: 70 0.1340 0.114 18%
서열 번호: 72 0.0740 0.065 14%
서열 번호: 74 0.1150 0.103 12%
서열 번호: 76 0.0990 0.075 32%
서열 번호: 78 0.1020 0.075 36%
서열 번호: 80 0.1010 0.075 35%
서열 번호: 82 0.1160 0.103 13%
서열 번호: 86 0.0950 0.075 27%
서열 번호: 88 0.1070 0.075 43%
서열 번호: 90 0.1290 0.106 22%
서열 번호: 92 0.0910 0.08 14%
서열 번호: 94 0.0980 0.08 23%
서열 번호: 106 0.0810 0.068 19%
서열 번호: 108 0.0840 0.068 23%
NCS (Abs515) (-) 대조군 % increase
서열 번호: 70 0.097 0.077 27%
서열 번호: 74 0.079 0.072 9%
서열 번호: 76 0.06 0.044 36%
서열 번호: 78 0.056 0.044 27%
서열 번호: 80 0.057 0.044 30%
서열 번호: 82 0.08 0.072 10%
서열 번호: 84 0.064 0.056 14%
서열 번호: 86 0.06 0.049 22%
서열 번호: 88 0.067 0.049 37%
서열 번호: 90 0.087 0.072 20%
서열 번호: 92 0.058 0.05 16%
서열 번호: 94 0.061 0.05 22%
서열 번호: 96 0.093 0.077 22%
서열 번호: 98 0.092 0.077 20%
서열 번호: 100 0.049 0.044 11%
서열 번호: 102 0.053 0.047 12%
서열 번호: 104 0.054 0.044 23%
서열 번호: 106 0.064 0.056 15%
PNS (Abs401) (-) 대조군 % increase
서열 번호: 123 0.0730 +/- .00283 0.0545 34%
서열 번호: 127 0.0745 +/- .00354 0.0544 37%
서열 번호: 129 0.0730 +/- .00141 0.0545 34%
서열 번호: 133 0.0730 +/- 0.0 0.0544 34%
서열 번호: 135 0.1000 +/- .00566 0.0658 52%
서열 번호: 137 0.1060 +/- .00141 0.0658 61%
서열 번호: 141 0.0860 +/- .00283 0.0589 46%
서열 번호: 143 0.1030 +/- 0.0 0.0792 30%
서열 번호: 147 0.0865 +/- .00071 0.0588 47%
서열 번호: 149 0.0890 +/- 0.0 0.0589 51%
서열 번호: 151 0.0900 +/- 0.0 0.0588 53%
NCS (Abs515) (-) 대조군 % increase
서열 번호: 123 0.0505 +/- .00354 0.0391 29%
서열 번호: 125 0.0505 +/- .00495 0.0391 29%
서열 번호: 131 0.0560 +/- .00141 0.0409 37%
서열 번호: 135 0.0735 +/- .01768 0.0420 75%
서열 번호: 137 0.0560 +/- .00283 0.0421 61%
서열 번호: 139 0.1550 +/- .00265 0.0829 87%
서열 번호: 141 0.0560 +/- .00141 0.0409 37%
서열 번호: 143 0.1520 +/- .00954 0.0831 83%
서열 번호: 145 0.1850 +/- .001 0.0830 123%
서열 번호: 149 0.0565 +/- .00212 0.0409 38%
서열 번호: 151 0.0585 +/- .00212 0.0409 43%
상기 표에서 관찰할 수 있는 바와 같이, 효소 중 일부는 PNS와 활성이며, 일부는 NCS와 활성이고, 많은 것이 PNS 및 NCS 둘 다와 활성이다. 일반적으로 아릴 설페이트 화합물과 활성인 효소를 함유하는 반응 혼합물은 음성 대조군보다 대략 1.1 내지 2.5배 더 높은 흡광도를 입증하였다.
실시예 3: 가공된 아릴 설페이트-의존성 글루코사미닐 N- 설포트랜스퍼라제 효소의 N- 황산화된 다당류 생성물의 질량 분광법적 특성화
연구를 본 개시내용의 구현예에 따라 수행하여 이의 설포전달 반응의 결과로서 형성된 N-황산화된 다당류 생성물의 존재를 질량 분광법(MS)으로 검출함으로써, 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 또는 서열 번호: 15의 아미노산 서열을 포함하는 효소의 글루코사미닐 N-설포트랜스퍼라제 활성을 확인하였다. 각각의 가공된 효소를 실시예 1의 과정에 따라 정제하였다. 설포트랜스퍼라제 활성을 50 μM의 효소를 함유하는 100 μL의 반응물 속에서 모니터링하였다. 각각의 정제된 단백질 용액에, 20 mg의 아릴 설페이트 화합물(PNS 또는 NCS 중 어느 하나)를 2 mL의 반응 완충제(50 mM MES pH 7.0, 2 mM CaCl2) 속에 용해하고, 단백질 용액에 가하고, 37℃에서 10분 동안 항온처리하였다. 2.5 mL의 N-탈아세틸화된 헤파로산의 2 mg/mL 용액을 단백질/공여체 용액에 가하고 37℃에서 밤새 항온처리하였다. N-탈아세틸화된 헤파로산을 문헌: Balagurunathan, K. et al (eds.) (2015), Glycosaminoglycans: Chemistry and Biology, Methods in Molecular Biology, vol. 1229, DOI 10.1007/978-1-4939-1714-3_2, ⓒSpringer Science+Business Media, New York, pp. 11-19 (section 3.1)에 기술된 프로토콜에 따라 합성하였다. N-황산화된 생성물을 정제하기 위하여, 항온처리된 반응 혼합물을 다음날 5,000 x g에서 10분 동안 원심분리하였다. 여과기를 2 mL의 물로 1회 세척하고, 다시 원심분리하였다. 여액을 1K MWCO 투석 막에 가하고, 2일 동안 Milli-Q water 속에서, 1 h, 2 h, 8 h, 16 h, 32 h 째에 물을 교환하면서 투석한 다음, 동결건조시켰다.
각각의 반응물로부터 동결건조된 N-황산화된 생성물을 헤파로산-계 다당류의 β-제거 절단을 촉매하는, 서열 번호: 161, 서열 번호: 162, 및 서열 번호: 163의 아미노산 서열을 포함하는 3개의 탄소-산소 분해물의 혼합물로 후속적으로 분해하였다. 이러한 분해물은 다른 화학 및 생물학 회사 중에서 New England Biolabs로부터 이용가능하다. 1 μL의 각각의 분해물을 50 μg의 동결건조된 황산화된 다당류 생성물 및 제공된 분해 완충제와 함께 항온처리하고, 24시간에 걸쳐 각각의 리아제를 사용하여 New England Biolabs에 의해 제공된 포장된 설명서에 따라 항온처리하였다. 분해 후, 리아제 효소를 100℃로 5분 동안 가열하여 불활성화시켰다. 샘플을 14,000 rpm에서 30분 동안 원심분리한 후 강력한 이온 교환, 고 성능 액체 크로마토그래피(SAX) 분석에 도입하였다. SAX 분석은 Dionex Ultimate 3000 LC 시스템 인터페이스에서 수행하였다. 분리는 5.0 m 입자 크기를 지닌 4.6250 mm Waters Spherisorb 분석 컬럼에서 45℃에서 수행하였다. 이동상 용액 A는 2.5 mM 인산나트륨, pH 3.5이지만, 이동 상 용액 B는 2.5 mM 인산나트륨, pH 3.5, 및 1.2 M 과염소산나트륨이었다. 각각의 샘플을 컬럼에 로딩한 후, 이동 상 용액을 컬럼에 98% 이동상 용액 A 및 2% 이동상 용액 B의 비로 5분 동안 1.4 mL/min의 유동 속도에서 적용시켰다. 5분 후, 증가하는 이동상 용액 B의 선형 구배를 이동상 용액 A 대 이동상 용액 B의 비가 50:50이 될 때까지 적용하였다.
SAX 분석을 사용하여, 8개의 시험한 효소 중 6개는 설포트랜스퍼라제로서 활성인 것으로 측정되었다. 그러나, 설포트랜스퍼라제 각각은 PNS 및 NCS 둘 다와 필수적으로 활성이지 않았다. 서열 번호: 5, 서열 번호: 7, 및 서열 번호: 13의 아미노산 서열을 가진 효소는 NCS와만 활성을 가졌고, 서열 번호: 15의 아미노산 서열을 가진 효소는 PNS와만 활성을 가졌다. 서열 번호: 9 및 서열 번호: 11의 아미노산 서열을 가진 효소는 아릴 설페이트 화합물 둘 다와 활성을 가졌다.
N-황산화된 생성물의 존재를 나타내는 SAX 분석으로부터의 대표적인 크로마토그램을 도 29에 나타낸 반응의 결과로서 생산하였다. N-탈아세틸화된 헤파로산 출발 물질 및 서열 번호: 13에 의해 생산된 N-황산화된 생성물을 서열 번호: 161, 서열 번호: 162, 및 서열 번호: 163의 아미노산 서열을 갖는 리아제를 사용하여 상술한 분해 과정에 따라 분해하였다. Iduron, Ltd로부터 상업적으로 이용가능한 2개의 이당류 표준(HD005 및 HD013)을 SAX를 사용하여 또한 분석하였다. HD013 이당류는 비치환된 글루코사민 잔기 및 환원된 헥수론산을 포함하였다. HD005 이당류는, 글루코사민 잔기가 N-황산화된 것을 제외하고는 HD013과 동일하다. 오버레이된(overlaid) 크로마토그램 모두를 표준화함으로써 각각의 크로마토그램에서 가장 우세한 피크에 1.0의 표준화된 상대적인 형광성 값을 지정한다.
도 29에 나타낸 바와 같이, HD013 이당류(* 기호로 나타냄)에 대한 가장 우세한 피크는 거의 즉시 용출되나, HD005 이당류(** 기호로 나타냄)에 대한 가장 우세한 피크는 대략 17분 후 용출된다. 이는, 양으로 하전된 종(HD013과 같은)이 전형적으로 컬럼에 결합하지 않는 반면, 음으로 하전된 종(HD005와 같은)은 컬럼에 결합하므로, SAX 조건 하에서 예측된다. 유사하게 비-황산화된, N-탈아세틸화된 헤파로산은 HD013과 거의 동일한 시간에 가장 우세하게 용출된다. 유사하게, 반응 동안 생산된 동결건조된 샘플은 HD005와 거의 동일한 시간에 피크를 나타내며, 이는 샘플이 N-황산화된 생성물을 함유함을 나타낸다. 각각의 크로마토그램 내, 특히 합성된 출발 물질 및 생성물내에서 다른 피크는 각각의 예에서 다당류를 정제하는 단독 기준으로서 스핀-여과 컬럼의 사용을 기반으로 한 샘플 순도의 결여를 나타낸다. 당해 분야의 기술자는 보다 정제된 생성물이 요구되는 경우 이용될 수 있는 수개의 다른 분리 기술이 존재함을 인식할 수 있다. 또한, 크로마토그램에서 형광성 신호의 기본선의 상향 이동은 증가하는 양의 염이 이동상을 통해 컬럼에 도입되는 경우 알려진 현상이다.
실시예 4: 가공된 아릴 설페이트-의존성 헥수로닐 2 -O 설포트랜스퍼라제 효소의 2- O 황산화된 다당류 생성물의 질량 분광법적 특성화
설포 수용체 다당류가 시판되는 헤파란 설페이트이고 여기서 2-O 설페이트 그룹은 화학적 수단(생성물-DSH001/2, Galen Laboratory Supplies로부터 이용가능)에 의해 선택적으로 제거되고 황산화된 생성물을 함유하는 분해된 샘플 각각의 분석은 질량 분광법을 사용하여 수행하는 것을 제외하고는, 연구를 본 개시내용의 구현예에 따라 수행하여, 이의 설포전달 반응의 결과로서 형성된 2-O 황산화된 다당류 생성물의 존재를 실시예 3에서와 유사한 과정을 사용하여 검출함으로써, 서열 번호: 27, 서열 번호: 29, 서열 번호: 31, 서열 번호: 33, 서열 번호: 35, 서열 번호: 37, 서열 번호: 39, 서열 번호: 41, 서열 번호: 43, 서열 번호: 45, 서열 번호: 47, 서열 번호: 49, 서열 번호: 51, 서열 번호: 53, 서열 번호: 55, 서열 번호: 57, 서열 번호: 59, 서열 번호: 61, 서열 번호: 63, 또는 서열 번호: 65의 아미노산 서열을 포함하는 효소의 헥수로닐 2-O 설포트랜스퍼라제 활성을 확인하였다.
실시예 3에서 상술된 과정에 따라 서열 번호: 161, 서열 번호: 162, 및 서열 번호: 163 의 아미노산 서열을 갖는 탄소-산소 리아제를 사용하여 2-O 황산화된 생성물을 분해함으로써 수득한 이당류를 Shimadzu LCMS-8050 Triple Quadrupole 액체 크로마토그래피 질량 분광기로 정량화하였다. 100-ng의 각각의 분해된 샘플을 10-mM 중탄산암노늄(pH 10) 속에 희석시켰다. 이당류를 Thermo Hypercarb HPLC 컬럼(100x2.1 mm, 5 μm)에서 분리하였다. 이동 상은 10 mM 중탄산암모늄(pH 10)으로 이루어졌고, 이당류는 0% 내지 20%의 아세토니트릴 구배로 2.5분 동안 용출시키고, 다음 2.5분 동안 20%에서 유지시키고, 다음 주사 전 0%에서 2분 평형시켰으며; 유동 속도는 0.2 mL/min이었고, 총 작동 시간은 7.1 분이었다.
LCMS로부터 추출된 이온 크로마토그램은 서열 번호: 63 또는 서열 번호: 65의 아미노산 서열을 갖는 가공된 효소를 지닌 반응물로부터 수득된 2-O 황산화된 생성물에 상응하는, 도 30a 및 도 3b에 나타낸다. 피크를 일련의 8개의 이당류 표준물의 크로마토그램 뿐만 아니라, 100 ng의 시판되는 UF-HS 다당류(CAS 코드: 9041-08-1, Millipore Sigma로부터 이용가능)로부터의 크로마토그램과 비교하였고, 이를 또한 리아제 혼합물을 사용하여 분해하였다. 8개의 참고 이당류 표준(D0A0, D0S0, D0A6, D2A0, D0S6, D2S0, D2A6, D2S6)은 N-, 2-O 및 6-O 위치에서 다양하게 황산화되는 이당류를 나타낸다. 특히, 이당류 D2S0는 2-O 위치에서 황산화된 헥수로닐 잔기 및 N-황산화된 글루코사민 잔기를 갖는 이당류를 나타낸다. 이당류 표준(나타내지 않음), 분해된 시판 황산화된 다당류(나타내지 않음), 및 서열 번호: 63 또는 서열 번호: 65의 아미노산 서열을 갖는 황산화된 다당류 생성물로부터의 스펙트럼으로부터의 보유 시간 및 피크 영역을 하기 표 11에 수집한다. 각각의 개개 이당류의 이온화는 상이하므로, EIC 크로마토그램에서 현재의 퍼센트는 이의 실제 풍부성을 나타내지 않을 수 있다. 그러나, 이온화 효율은 샘플 간에 각각의 이당류에 대해 동일하다. 따라서, 샘플 간에 동일한 이당류의 피크 영역 퍼센트를 비교하는 것은 여전히 달성될 수 있는 것으로 여겨진다.
Figure pct00038
가공된 효소의 설포트랜스퍼라제 활성을 반응 전 이미 탈황산화된 설포 수용체 다당류 내에서 헥수론산 잔기의 2-O 위치에서 재-황산화에 의해 확인하였다. 이는 가공된 효소 및 NCS 둘다의 반응으로부터 단리된 생성물 내에서 D2SO 이당류의 존재로 나타내어진다. 특수한 이론에 제한되지 않고, 가공된 효소의 활성은, 헥수론산 잔기가 N-황산화되어 있지만 6-O 황산화되지 않은 글루코사민 잔기에 인접한 다당류의 부위와 반응시 의존성인 것으로도 여겨진다. 이는 단리된 황산화된 다당류 생성물내에서 검출된 D2S6(2-O 황산화된 헥수론산 잔기 및 N,6-황산화된 글루코사민 잔기) 및 D2A6(2-O 황산화된 헥수론산 잔기 및 6-O 황산화된 N-아세틸 글루코사민 잔기) 이당류의 결여로 나타내어진다. 이는 EC 2.8.2.- 내에서 야생형 헥수로닐 2-O 설포트랜스퍼라제에 대해 유사한 반응성이며, 이는 화학식 IV 또는 화학식 V의 구조를 포함하는 N-황산화된 헤파로산과 반응하는 것으로 여겨진다.
실시예 5: 가공된 아릴 설페이트-의존성 글루코사미닐 6 -O 설포트랜스퍼라제 효소의 6- O 황산화된 다당류 생성물의 질량 분광법적 특성화
설포 수용체 다당류를 시판되는 UF-HS(CAS 코드: 9041-08-1, Millipore Sigma로부터 이용가능)를 문헌: Kariya, Y., et al., (2000) J. Biol. Chem. 275 (34):25949-25958)에 의해 제공된 과정에 따라 화학적으로 6-O 탈황산화시켜 제조하는 것을 제외하고는, 연구를 본 개시내용의 구현예에 따라 수행하여 실시예 4에서와 같은 유사한 LCMS 과정을 사용하여, 이의 설포전달 반응의 결과로서 6-O 황산화된 다당류 생성물의 존재를 검출함으로써 서열 번호: 70, 서열 번호: 72, 서열 번호: 74, 서열 번호: 76, 서열 번호: 78, 서열 번호: 80, 서열 번호: 82, 서열 번호: 84, 서열 번호: 86, 서열 번호: 88, 서열 번호: 90, 서열 번호: 92, 서열 번호: 94, 서열 번호: 96, 서열 번호: 98, 서열 번호: 100, 서열 번호: 102, 서열 번호: 104, 서열 번호: 106, 또는 서열 번호: 108의 아미노산 서열을 포함하는 효소의 글루코사미닐 6-O 설포트랜스퍼라제 활성을 확인하였다.
서열 번호: 104, 서열 번호: 106, 또는 서열 번호: 108의 아미노산 서열을 갖는 가공된 효소와의 반응으로부터 수득한 6-O 황산화된 생성물에 상응하는 추출된 이온 크로마토그램을 도 31a, 도 31b, 및 도 31c 각각에 나타낸다. 서열 번호: 104 및 서열 번호: 106의 서열을 갖는 효소는 NCS가 설포 그룹 공여체인 경우 활성이었지만, 서열 번호: 108의 서열을 갖는 효소는 PNS가 설포 그룹 공여체인 경우 활성이었다. 지정된 피크는 8개의 참고 이당류 표준의 측정된 보유 시간을 기반으로 하였다. 8개의 참고 이당류 표준(D0A0, D0S0, D0A6, D2A0, D0S6, D2S0, D2A6, 및 D2S6)은 N-, 2-O, 및 6-O 위치에서 다양하게 황산화된 이당류를 나타낸다. DOA6, D0S6, D2A6, 및 D2S6은 6-O 황산화된 글루코사민 잔기를 포함한다. S6은 N,6-황산화된 글루코사민 잔기를 나타내지만, A6은 6-O 황산화된 N-아세틸 글루코사민 잔기를 나타낸다. 각각의 크로마토그램은 2-O 위치에서 각각 비황산화되거나 황산화된 헥수론산 잔기에 인접한, N,6-황산화된 글루코사민 잔기의 합성과 관련된, 2개의 통합가능한 피크, D0S6 및 D2S6을 나타낸다. 모든 표지된 이당류의 피크 면적%는 하기 표 12에 있다. 각각의 개개 이당류의 이온화는 필수적으로 D0A0 및 D2S6의 경우 상이하므로, EIC 크로마토그램의 현재의 피크는 이의 실제 풍부성을 나타내지 않을 수 있다. 그러나, 이온화 효능은 샘플 간에 각각의 이당류에 대해 동일하다. 따라서, 샘플 간에 동일한 이당류의 피크 영역을 비교하는 것은 여전히 달성될 수 있는 것으로 여겨진다.
Figure pct00039
가공된 효소의 설포트랜스퍼라제 활성을 상기 문헌: Kariya, Y., et al에 따른 과정에 의해 탈황산화된 글루코사민 잔기의 6-O 위치에서 재-황산화함으로써 확인하였다. 이는 각각의 효소를 사용한 반응물로부터 단리된 생성물내 D0S6 및 D2S6 이당류의 존재에 의해 나타내어진다. 각각의 가공된 효소 중에서, D0S6 및 D2S6 이당류의 피크 영역 퍼센트를 비교하는 것을 기반으로, 서열 번호: 108의 아미노산 서열을 가진 글루코사미닐 6-O 설포트랜스퍼라제가 가장 활성인 것으로 여겨진다. 그러나, D0A6 및 D2A6 다당류가 임의의 특수한 이론에 제한되지 않고, 가공된 효소에 의해 생산된 임의의 6-O 황산화된 생성물에서 관찰되지 않지만, 그럼에도 불구하고, 이러한 효소는 특히 효소 및/또는 다당류의 농도를 증가시킴으로써, 상이한 반응 조건에서 설포 그룹을 N-아세틸 글루코사민 잔기로 전달할 수 있는 것으로 여겨지며 여기서 N-아세틸 글루코사민 잔기의 존재는 EC 2.8.2.- 내 천연의 야생형 글루코사미닐 6-O 설포트랜스퍼라제의 반응성을 기반으로, 반응 전에 확인된다.
실시예 6: 가공된 아릴 설페이트-의존성 글루코사미닐 3 -O 설포트랜스퍼라제 효소의 3- O 황산화된 다당류 생성물의 질량 분광법적 특성화
설포 수용체 다당류가 시판되는 UF-HS(CAS 코드: 9041-08-1, Millipore Sigma로부터 이용가능)인 것을 제외하고는, 연구를 본 개시내용의 구현예에 따라 수행하여, 실시예 4에서와 같은 유사한 LCMS 과정을 사용하는 반응을 사용하여, 이의 설포전달 반응의 결과로서, 3-O 황산화된 다당류 생성물의 존재를 검출함에 의해 서열 번호: 123, 서열 번호: 125, 서열 번호: 127, 서열 번호: 129, 서열 번호: 131, 서열 번호: 133, 서열 번호: 135, 서열 번호: 137, 서열 번호: 139, 서열 번호: 141, 서열 번호: 143, 서열 번호: 145, 서열 번호: 147, 서열 번호: 149, 또는 서열 번호: 151의 아미노산 서열을 포함하는 효소의 글루코사미닐 3-O 설포트랜스퍼라제 활성을 확인하였다. 변형되지 않은 UF-HS이 ~3.5%(w/w)의 3-O-황산화된 글루코사민 잔기를 함유한다고 해도, 글루코사민 잔기의 약 ~60%는 N,6-황산화되고, 화학식 X에서와 같이 2-O 황산화된 헥수론산 잔기에 인접한다. 결과적으로, 이러한 N,6-황산화된 글루코사민 잔기는 여전히 3-O 황산화될 수 있다.
추출된 이온 크로마토그램은 일련의 10개의 참고 표준 및, 리아제 혼합물을 사용하여 또한 분해시킨, 100 ng의 시판 다당류의 크로마토그램과 함께, 도 32a 및 도 32b에 나타낸다. 10개의 참고 표준(D0A0, D0S0, D0A6, D2A0, D0S6, D2S0, D2A6, D2S6, D0A6G0S3, 및 D0A6G0S9)은 N-, 2-O, 3-O, 및 6-O 위치에서 다양하게 황산화된 이당류 또는 사당류를 나타낸다(도 32a, 상단). 명확성을 위해, 3-O 황산화된 글루코사민 잔기(D0A6G0S3) 및 (D0A6G0S9)을 나타내는 참고 피크는 분해된 시판 다당류 스펙트럼에 나타낸다(도 32a, 중앙). 서열 번호: 147(PNS, 도-32b, 중앙), 서열 번호: 149(PNS, 도 32b, 하단)(NCS, 도 32a, 하단), 및 서열 번호: 151(NCS, 도 32a, 상단)의 아미노산 서열을 포함하는 효소와의 반응으로부터 분해된 황산화된 다당류 생성물을 나타내는 4개의 질량 스펙트럼을 하기 시판 다당류 스펙트럼에서 나타낸다. 모든 표지된 이당류 및 사당류의 피크 영역%는 하기 표 13에 있다. 각각의 개개 이당류의 이온화는, 특히 D0A0 및 D2S6의 경우 상이하므로, EIC 크로마토그램에서 현재의 퍼센트는 이의 실제 풍부성을 나타내지 않을 수 있다. 그러나, 이온화 효능은 샘플간에 각각의 이당류 또는 사당류에 대해 동일하다. 따라서, 샘플 간에 동일한 이당류의 피크 영역 퍼센트를 비교하는 것은 여전히 달성할 수 있는 것으로 여겨진다.
Figure pct00040
각각의 가공된 효소의 설포트랜스퍼라제 활성을 시판되는 HF-HS 샘플에 대해 D0A6G0S3(헥수론산-6-O-황산화된 N-아세틸 글루코사민-글루쿠론산-N,3,6-황산화된 글루코사민) 및 D0A6G0S9(헥수론산-6-O-황산화된 N-아세틸 글루코사민-글루쿠론산-N,3-황산화된 글루코사민) 사당류의 풍부성에 있어서의 증가에 의해 확인하였다. 그러나, 서열 번호: 149 PNS 샘플에서 이당류의 총 풍부성은 다른 샘플보다 훨씬 저 적었다. 후속적인 시도는 주입 용적 10배 이상을 사용하여 실험을 재-작동하는 것, 및 샘플을 리아제 혼합물로 재-분해하는 것을 포함하였다. 그럼에도 불구하고, D2S6 이당류만이 발견될 수 있었으며, 이는 초기 단리된 서열 번호: 149 PNS 황산화된 다당류 샘플의 풍부성이 극도로 낮고/낮거나 다당류가 리아제 분해를 견뎌서, 생성물이, 1시간 보다 긴 보유 시간으로 컬럼으로부터 잠재적으로 용출되도록 함을 나타낸다.
그럼에도 불구하고, NMR 연구(하기 실시예 7에서 나타냄)는 PNS가 아릴 설페이트 화합물인 경우 서열 번호: 149의 아미노산 서열을 포함하는 효소를 사용한 3-O 설포트랜스퍼라제 활성을 나타내었다. 또한, 서열 번호: 149의 아미노산 서열을 갖는 효소는 NCS가 아릴 설페이트 화합물인 경우 설포트랜스퍼라제 활성과 같이 활성인 것으로 측정되었다. 따라서, LCMS 실험 동안 서열 번호: 149 PNS 황산화된 다당류 샘플에 대해 관찰된 결과는 실험 목적으로 생산된 샘플로부터 생성되며, 효소 자체의 활성으로부터 생성되지 않는 것으로 여겨진다. 또한, 3-O 황산화의 보다 높은 풍부성이 시판되는 UF-HS 표준에 대해, 서열 번호: 147, 서열 번호: 149, 및 서열 번호: 151로부터의 다른 황산화된 다당류 생성물 모두에서 발견되었다.
실시예 7: 핵 자기 공명을 사용한 가공된 글루코사미닐 3 -O 설포트랜스퍼라제의 설포트랜스퍼라제 활성의 확인
연구를 본 개시내용의 구현예에 따라 수행하여 서열 번호: 147, 서열 번호: 149, 및 서열 번호: 151의 아미노산 서열을 갖는 가공된 효소의 3-O 설포트랜스퍼라제 활성, 특히 설포 그룹 공여체로서 PNS를 지닌 서열 번호: 149의 아미노산 서열을 갖는 효소의 활성을 확인하였다. 각각의 효소를 실시예 1의 과정에 따라 정제하였다. 각각의 정제된 단백질 용액에, 2 mL의 반응 완충제(50 mM MES pH 7.0, 2 mM CaCl2) 속에 용해된 20 mg의 아릴 설페이트 화합물(PNS 또는 NCS)을 단백질 용액에 가하고 37℃에서 10분 동안 항온처리하였다. 2.5 mL의 실시예 6에서 이용된 시판되는 UF-HS 다당류의 2 mg/mL 용액을 단백질/공여체 용액에 가하고 37℃에서 밤새 항온처리하였다.
각각의 반응물을 5,000 x g에서 10분 동안 원심분리하고, 예비-습윤시킨 30K MWCO Amicon-15 여과기에 적용시키고 5,000 xg에서 10분 동안 원심분리하였다. 여과기를 2 mL의 물로 1회 세척하고, 다시 원심분리하였다. 여액을 1K MWCO 투석 막에 가하고, 2일 동안 Milli-Q water 속에서,1 h, 2 h, 8 h, 16 h, 32-h 째에 물을 교환시키면서 투석한 다음, 동결건조시켰다. 건조된, 백색 분말을 400 μL D2O 속에 재현탁시키고, 동결건조시켜 교환가능한 양성자를 제거한 다음, 600 μL D2O 속에 재현탁시키고 NMR 튜브(Wilmad, 0.38 mm x 7")에 전달하였다. 설포전달이 일어나는지를 측정하기 위해, 1H-NMR 스펙트럼을, 물을 억제하면서, Bruker 600 MHz NMR, 32 스캔에서 수득하였다. 전체적인 반응식은 도 33에 나타낸다. 도 33내에서, 임의의 글루코사민 잔기의 3-O 위치는 글루코사미닐 3-O 설포트랜스퍼라제 효소에 의해 황산화될 수 있다. 황산화된 3-O 위치를 중심 다당류 내에서 원으로 표시한다. 중수소 교환시 공명을 나타내는 능력을 가진 교환가능한 양성자는 하단 다당류에서 굵은 글씨체로 나타낸다. 조 혼합물 피크를 설포 수용체 다당류 및 관련된 3-O 황산화된 생성물에 대한 문헌-참고한 스펙트럼으로 통합하였다.
도 34에서 오버레인(overlain) 스펙트럼에 나타낸 바와 같이, 시판되는 HF-HS에 존재하는 2-O 황산화된 이두론산의 C2 탄소에서 양성자에 상응하는 5.15 ppm에서의 날카로운 피크는 서열 번호: 147, 서열 번호: 149, 및 서열 번호: 151의 아미노산 서열을 포함하는 효소와의 반응시 사라진다. 목적한 양성자는 스펙트럼 위에 나타낸 다당류내에 원으로 표시되어 있다. PNS 및/또는 NCS와의 반응시 서열 번호: 147, 서열 번호: 149, 또는 서열 번호: 151의 아미노산 서열을 포함하는 효소에 의해 합성된 3-O 황산화된 생성물에 대한 1H NMR 스펙트럼을 모두 나타낸다. 각각의 생성물 스펙트럼에서, IdoA2S 피크는 대략 5.0 내지 5.05 ppm 사이에서 이동한다. 유사한 이전이 천연의 사람 설포트랜스퍼라제 효소를 동일한 다당류 기질 및 3'-포스포아데노신 5'-포스포설페이트와 함께 항온처리하는 경우 나타난다(데이타는 나타내지 않음).
도 35에 나타낸 바와 같이, 4.5와 3.5 사이의 영역은 글루코사민 잔기의 3-O 위치에 대한 설페이트 그룹의 첨가에 대한 반응시 유사하게 이동하는 수개의 피크를 나타내며, 이들 모두는 야생형 사람 글루코사미닐 3-O 설포트랜스퍼라제 효소를 동일한 시판되는 UF-HS 기질 및 3'-포스포아데노신 5'-포스포설페이트와 함께 항온처리시 관찰된 동일한 이동과 관련된다. 이동하는 피크는 굽어진 화살표로 나타내며, 서열 번호: 147, 서열 번호: 149, 또는 서열 번호: 151의 아미노산 서열을 갖는 효소에 의해 생산된 3-O 황산화된 다당류로부터의 피크의 위치는 직선 화살포로 나타낸다. 최대 이동은 GlcNS3S6S의 H3에 대해, 3.7-ppm으로부터 4.2 ppm으로 발생한다. 이는 새로이 첨가된 3-O 설페이트 그룹에 가장 근접하여 생성된다. 또한, Ido2S의 H3 양성자 및 GlcNS3S6S의 H5 양성자 둘 다는 4.07 ppm에서 피크를 향해 수렴하며, 이는 2개의 오버래핑 피크를 나타낸다. GlcNS3S6S의 H4는 3.7 ppm 영역으로부터 3.8 ppm 영역으로 적당히 다운필드(downfield) 이동하며, 참고에 따라서, GlcNS6S로부터 H3 & H4와 같은 많은 피크 및 GlcA로부터 H3, H4, 및 H5가 3.7 ppm 영역으로부터 3.6 ppm 영역으로 이동한다.
실시예 8: 본 발명의 가공된 설포트랜스퍼라제와 함께 사용하기 위한 N- 황산화된 헤파로산의 화학적 합성
연구를 본 개시내용의 구현예에 따라 수행하여 본 발명의 임의의 가공된 아릴 설페이트-의존성 설포트랜스퍼라제, 특히 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소를 사용하여 설포 수용체 다당류로서 사용하기 위한 N-황산화된 헤파로산을 화학적으로 합성하였다. N-탈아세틸화된 헤파로산은 상기 문헌: Balagurunathan, K. et al.에 기술된 프로토콜에 따라 제조하였다. 특히, DEAE 수지로부터 용출된 헤파로산을 아세트산나트륨으로 포화시킨 에탄올 속에서 -30℃에서 밤새 침전시킨 후, 물속에 재현탁시키고, 1,000 Da 분자량 컷-오프(cut-off)(MWCO)를 갖는 셀룰로즈 투석 막 내에서 투석하였다.
헤파로산을 N-탈아세틸화시키기 위해, 충분한 수산화나트륨 펠렛(~4.0 g)을 용해하여 수중 투석된 헤파로산의 40 mL 분취량 속의 2.5 M 용액을 제조하였다. 용액을 55℃에서 16시간 동안, 100 rpm에서 진탕시키면서 항온처리하였다. 이후에, 샘플 속의 수산화나트륨을 용액이 ~7.0의 pH에 도달할 때까지 아세트산으로 중화시킨 다음, 물 속에서 밤새 1,000 MWCO 투석 막내에서 투석시켰다.
N-탈아세틸화된 헤파로산의 후속적인 N-황산화는 100 mg의 탄산나트륨 및 100 mg의 삼산화황-트리에틸아민 복합체를 가하고, 조성물을 48℃에서 모든 고체가 용해될 때까지 항온처리함으로써 달성하였다. 이후에, 용액의 pH를 아세트산을 사용하여 ~9.5로 재조정하였다. 48℃에서 밤새 100 rpm에서 진탕하면서 항온처리한 후, 추가로 100 mg의 탄산나트륨 및 100 mg의 삼산화황-트리에틸아민 복합체를 가한 후, 아세트산을 사용하여 pH를 ~9.5로 후속적으로 재조절하였다. 용액을 48℃에서 추가로 24시간 동안 항온처리하였다. 황산화된 다당류 용액을 아세트산을 사용하여 pH ~7.0으로 중화시키고, 물 속에서 밤새 1,000 MWCO 투석 막내에서 투석하였다. 이후에, 투석된 N-황산화된 헤파로산을 추가의 사용 전에 동결건조시켰다. 이후에, N-황산화된 헤파로산을 Zenix SEC-100 컬럼에 로딩하고 이를 0.1 M 아세트산암모늄, pH 9.0을 사용하여 등용매적으로 용출시킴으로써 추가로 정제하였다.
정제된 헤파로산-계 다당류의 작용화는 이를 서열 번호: 161, 서열 번호: 162, 및 서열 번호: 163의 아미노산 서열을 포함하는 3개의 탄소-산소 리아제의 혼합물로 분해하고, 분해된 샘플을 SAX를 사용하여, 상술한 유사한 과정으로 분석함으로써 특성화하였다. 양성 대조군으로서, N-황산화된 글루코사민 잔기를 함유하는, 실시예 3의 시판 HD005 이당류를 또한 분석하였다. 샘플 둘 다의 대표적인 크로마토그램을 도 36에 나타낸다. 크로마토그램 둘 다에서, 강력한 피크가 약 16.5분에서 나타나며, 이는 합성된 샘플이 N-황산화된 글루코사민 잔기를 함유함을 나타낸다.
실시예 9: N,2O-HS 다당류 생성물의 제조
연구를 본 개시내용의 구현예에 따라 수행함으로써, 설포 수용체로서 가공된 헥수로닐 2-O 설포트랜스퍼라제 및 실시예 8에서 합성된 N-황산화된 헤파로산을 사용하여, 화학식 VI 또는 화학식 VII의 구조를 포함하는 N,2O-HS 다당류 생성물을 합성하였다. 원뿔 바닥 원심분리 튜브에서, 80 mM 분취량의 NCS를 50 mM MES pH 7.0, 2 mM CaCl2 속에 용해하였다. 각각의 용액에, 2-mg의 서열 번호: 63의 서열을 갖는 효소를, 280 nm에서 효소 샘플의 흡광도를 기준으로, 가하였다(약 4 mL). 실시예 8에서 합성된 동결건조된 N-황산화된 헤파로산 5 mg을 1 mL의 물 속에 재현탁시키고 효소 및 NCS를 함유하는 반응 혼합물에 가하였다. 이후에, 전체 반응 혼합물을 34℃에서 30 rpm에서 진탕시키면서 48시간 동안 항온처리하였다. 2 mg의 서열 번호: 67의 아미노산 서열을 포함하는 C5-헥수로닐 에피머라제를 또한 항온처리 전에 반응 혼합물에 가하는 것을 제외하고는, 2개 세트의 반응물을 동일한 과정을 사용하여 제조하였다.
반응물 세트 둘 다로부터의 다당류 생성물은 우선 반응 용기를 비등하는 물 속에 10분 동안 위치시키고 고속에서 원심분리하여 펠렛을 형성시킴으로써 반응 혼합물로부터 단백질을 침전시켜 정제하였다. 다당류 생성물을 함유하는 상층액을 펠렛으로부터 경사분리하고 1,000 MWCO 투석 막내에서 밤새 물 속에서 투석하였다. 이후에, 투석된 생성물을 추가의 사용을 위해 동결건조시켰다.
다당류 생성물을 특성화하기 위하여, 동결건조된 샘플을 400 μL의 물 속에 재현탁시키고, Q-Sepharose Fast Flow Column(GE Biosciences)을 사용하여 정제하였다. 샘플을 컬럼으로부터 20 mM 아세트산나트륨 완충제, pH 5.0 속에서 0 내지 2M NaCl 범위의 구배를 사용하여 용출시켰다. 이후에, 정제된 다당류를 분해하고 2-O 황산화된 우론산의 이당류 및 N-황산화된 글루코사민을 함유하는, 시판 다당류, HD002(Iduron)와 함께, 상기 실시예 3에서의 과정에 따라 SAX로 분석하였다. 에피머라제 효소의 부재 또는 이를 포함하는 반응물의 대표적인 크로마토그램을 도 37 및 도 38에 각각 나타낸다. 도 37에서, HD002 이당류에 대한 크로마토그램은 약 21.1분에서 단일의, 날카로운 피크를 가지며, 이는 반응 생성물 속의 거의 동일한 시간에서 날카로운 피크와 관련되어 있고, 이는 화학식 VI의 구조를 포함하는 N,2O-HS 생성물이 반응의 결과로서 형성된 시간을 나타낸다. 도 38에서, HD002 이당류는 다른 이당류 표준과, 도 37에서 HD002 표준의 용출 시간과 상응하는, 20.5분에서 용출하는 HD002에 상응하는 이당류를 함유하는 혼합물내에 제공되었다. 에피머화된 반응 생성물은 HD002 표준과 거의 동일한 용출 시간에서 날카로운 피크를 가지고 있으며, 이는 화학식 VII의 구조를 포함하는 N,2O-HS 생성물이 반응의 결과로서 형성되었음을 나타내다.
실시예 10: N,2O,6O-HS 생성물의 제조
에피머화된 N,2O-HS 생성물을 설포 수용체 다당류로서 사용하고, 서열 번호: 104의 아미노산 서열을 갖는 가공된 글루코사미닐 6-O 설포트랜스퍼라제를 효소로서 사용한 것을 제외하고는, 실시예 9의 연구를 본 개시내용의 구현예에 따라 수행하여 실시예 9의 과정을 사용하여, 화학식 IX의 구조를 포함하는 N,2O,6O-HS 생성물을 합성하였다.
황산화된 다당류 생성물 및 시판되는 이당류의 혼합물의 대표적인 크로마토그램을 도 39에 나타낸다. 시판되는 혼합물의 크로마토그램은 약 23.7분에서 피크를 나타내며, 2-O 황산화된 우론산의 이당류 및 N-, 6-O 황산화된 글루코사민으로 이루어진, 이당류 HD001(Iduron)에 상응하지만, 반응 생성물은 23.4분에서 유사한 피크를 나타내고, 이는 N,2O,6O-HS 생성물이 반응의 결과로 형성되었음을 나타낸다. N,2O,6O-HS 생성물 내에 존재하는 다른 피크는 분해되지 않은 다당류(2.5 min), 치환되지 않은 우론산 및 N-아세틸화된 글루코사민(5.5 min), 및 치환되지 않은 우론산과 N-, 6-O 황산화된 글루코사민을 포함한다.
실시예 11: N,2O,3O,6O-HS 생성물의 제조
실시예 10의 화학적으로 합성된 N-, 2-O, 6-O 황산화된 다당류를 설포 수용체 다당류로서 사용하고, 서열 번호: 147, 서열 번호: 149, 또는 서열 번호: 151의 아미노산 서열을 갖는 가공된 3-O 설포트랜스퍼라제 효소를 설포트랜스퍼라제로서 사용하는 것을 제외하고는, 연구를 본 개시내용의 구현예에 따라 수행함으로써, 화학식 I의 구조를 포함하고 N-, 6-O, 3-O 황산화된 글루코사민 및 2-O 황산화된 헥수론산 잔기를 갖는 황산화된 다당류 생성물을 실시예 9의 과정을 사용하여 합성하였다. N-, 6-O, 3-O 황산화된 글루코사민 잔기를 포함하는 분해된 시판 테트라사카라이드와 비교시, 황산화된 다당류 생성물이 반응의 결과로서 3-O 황산화되는 것으로 측정될 것임이 예측된다.
실시예 12: N,2O,3O,6O-HS 생성물의 항응고 활성의 확인
연구를 본 개시내용의 구현예에 따라 수행하여 항트롬빈에 대한 결합 친화성을 갖는 것으로 예측된, 본원에 기술된 임의의 글루코사미닐 3-O 설포트랜스퍼라제 효소를 사용하여, N,2O,3O,6O-HS 생성물이 실시예 6 또는 실시예 7의 과정에 따라 생산되는지의 여부를 측정하였다 (참조: Meneghetti, G., et al. (2017) Org. Biomol. Chem. 15:6792-6799). 대조군 반응물은 항트롬빈 활성을 갖는 것으로 알려진 시판되는 N,2O,3O,6O-HS 생성물, 예를 들면, USP 참고 표준(CAS-No: 9041-08-1)을 함유한다. 사람 항트롬빈(AT)(1 mg/mL)을 상이한 기질과 함께 염료, 예를 들면, SyproOrange™ 염료(Invitrogen)의 존재하에서 항온처리한다. 염료를 물(1-단위-Sypro:50 단위의 물(v/v)) 속에 희석시키고 3.5 μL의 희석된 염료를 PBS 완충제 중 혼합물 반응물에 가한다. SyproOrange™ 염료는 300 nm 또는 470 nm의 여기 파장을 가지며 소수성 잔기에 결합하는 경우 570 nm에서 방출한다. 25 μg의 N,2O,3O,6O-HS 생성물을 각각의 반응 혼합물 속에 포함시킨다. 반응물을 31℃에서 2분 동안 항온처리한 후, 0.5℃ 단계로 32 내지 85℃의 단계별 온도 구배에 적용시켰다. 각각의 온도 단계 사이에, 5초의 항온처리 기간을 취하여 샘플 평형화를 보증할 수 있다. 반응은 실시간 PCR 시스템을 사용하여 전개할 수 있다. USP 참고 표준 뿐만 아니라 합성된 N,2O,3O,6O-HS 생성물을 지닌 대조군 반응의 용융 곡선은 염료 및 AT 만을 지닌 표준보다 더 높은 온도로 이동할 것임이 예측되며, 이는 N,2O,3O,6O-HS 생성물이 화학식 I의 구조를 포함하는 적어도 하나의 AT-인식 서열을 함유하므로 AT가 N,2O,3O,6O-HS 생성물에 결합할 수 있음을 나타낸다.
실시예 13: 다른 EC-2.8.2.8 효소의 가공된 아릴 설페이트-의존성 돌연변이체의 측정
연구를 본 개시내용의 구현예에 따라 수행하여 추가의 아릴 설페이트-의존성 글루코사미닐 N-설포트랜스퍼라제 효소를 가공하였다. 상술한 바와 같이, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 또는 서열 번호: 15 의 아미노산 서열을 갖는 아릴 설페이트-의존성 글루코사미닐 N-설포트랜스퍼라제 효소를 효소 부류 EC 2.8.2.8의 구성원인, 사람 글루코사미닐 N-데아세틸라제/N-설포트랜스퍼라제 효소(참고: entry sp|P52848|NDST_1_사람, 상기 도 6a, 도 6b, 및 도 6c)의 N-설포트랜스퍼라제 도메인의 돌연변이체가 되도록 가공하였다. 다른 글루코사미닐 N-데아세틸라제/N-설포트랜스퍼라제 효소 중 하나 이상의 N-설포트랜스퍼라제 도메인의 아미노산 서열 뿐만 아니라 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 및/또는 서열 번호: 15의 아미노산 서열을 갖는 아릴 설페이트-의존성 글루코사미닐 N-설포트랜스퍼라제 효소의 아미노산 서열을 포함하는 다중 서열 정렬을 생성하고 분석함으로써, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소내 아미노산 서열에서의 돌연변이가 동일한 정렬 내에서 야생형 EC -2.8.2.8 효소의 아미노산 서열에 대해 관찰될 수 있다. 사람 글루코사미닐 N-데아세틸라제/N-설포트랜스퍼라제 효소가 아닌 야생형 2.8.2.8 효소의 N-설포트랜스퍼라제 도메인의 아미노산 서열의 선택시, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 및/또는 서열 번호: 15 의 아미노산 서열내에 존재하는 돌연변이는 야생형 서열내로 가공되어 아릴 설페이트-의존성 설포트랜스퍼라제 활성을 가질 수 있는 추가의 돌연변이체를 형성할 수 있다.
비-제한적인 예로서, 돼지 글루코사미닐 N-데아세틸라제/N-설포트랜스퍼라제 효소(entry-tr|M3V841|M3V841_PIG, 상기 도 6a, 도 6b, 및 도 6c에서 서열 정렬에 나타낸 바와 같음)의 N-설포트랜스퍼라제 도메인을 암호화하는 아미노산 서열을 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 및 서열 번호: 15의 아미노산 서열과 함께 정렬한다. 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 및 서열 번호: 15에 나타낸 아미노산 돌연변이를 돼지 N-데아세틸라제/N-설포트랜스퍼라제 효소의 N-설포트랜스퍼라제 도메인의 아미노산 서열내 이의 등가의 위치내로 가공하여, 돌연변이체 아미노산 서열 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 또는 서열 번호: 25를 각각 생성시킨다. 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 또는 서열 번호: 25의 아미노산 서열 각각을 포함하는 효소를 하기 실시예 14 및 실시예 15에서 이용할 것이다. 그러나, 당해 분야의 기술자는 동일한 과정을 적용하여 EC 2..2.8 효소 부류내 임의의 다른 글루코사미닐 야생형 N-데아세틸라제/N-설포트랜스퍼라제 효소와 관련하여, N-설포트랜스퍼라제 도메인의 돌연변이체, 또는 전체 효소를 생성할 수 있고, 이들이 명확성을 위해 빠져있음을 인식할 수 있다.
실시예 14: 가공된 아릴 설페이트-의존성 EC 2.8.2.8 돌연변이체의 발현 및 정제
연구를 본 개시내용의 구현예에 따라 수행하여 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 또는 서열 번호: 25의 아미노산 서열 각각을 갖는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소가 숙주 세포내로 형질전환될 수 있고, 이러한 아미노산 서열 각각을 포함하는 효소가 상기 실시예 1의 과정에 따라 후속적으로 발현, 분리, 및 정제될 수 있는지를 측정한다. 목적한 발현 숙주를 기반으로, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 또는 서열 번호: 25의 아미노산 서열을 갖는 효소를 암호화하는 코돈-최적화된 뉴클레오타이드 서열을 측정한다. 이러한 유전자의 합성 또는 적합한 발현 벡터내에 삽입시, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 및 서열 번호: 25의 아미노산 서열 각각을 암호화하는 유전자는 숙주 세포내로 형질전환되고, 이러한 서열을 함유하는 효소는 아릴 설페이트-의존성 글루코사미닐 N-설포트랜스퍼라제 활성을 측정하기에 충분한 양 및 순도로 후속적으로 발현, 단리, 및 정제될 것임이 예측된다.
실시예 15: EC 2.8.2.8 돌연변이체의 설포트랜스퍼라제 활성
연구를 본 개시내용의 구현예에 따라 수행하여, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 또는 서열 번호: 25의 서열 각각을 포함하는 돌연변이체 효소가 활성 설포트랜스퍼라제인지를 실시예 3의 과정을 사용하여 측정한다. SAX 연구는 N-탈아세틸화된 헤파로산 및 아릴 설페이트 화합물을 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 또는 서열 번호: 25의 서열 각각을 포함하는 가공된 효소 각각과 반응시킨 결과로서 형성된 N-황산화된 다당류 생성물의 존재를 확인할 것임이 예측된다.
실시예 16: EC 2.8.2.- 내 다른 헥수로닐 2 -O 설포트랜스퍼라제 효소의 가공된 아릴 설페이트-의존성 돌연변이체의 측정
연구를 본 개시내용의 구현예에 따라 수행하여 추가의 아릴 설페이트-의존성 헥수로닐 2-O 설포트랜스퍼라제 효소를 가공한다. 상술한 바와 같이, 서열 번호: 63 및 서열 번호: 65의 아미노산 서열을 가진 아릴 설페이트-의존성 헥수로닐 2-O 설포트랜스퍼라제 효소는 효소 부류 EC 2.8.2.-의 구성원인, 닭 HS 헥수로닐 2-O 설포트랜스퍼라제 효소(참고: entry sp|Q76KB1|HS2ST_CHICK, 상기 도 17a, 도 17c, 도 17c, 및 도 17d에서)의 돌연변이가 되도록 가공되었다. EC 2.8.2.- 내 다른 HS 헥수로닐 2-O 설포트랜스퍼라제 효소 중 하나 이상의 아미노산 서열 뿐만 아니라 서열 번호: 63 및/또는 서열 번호: 65의 아미노산 서열을 갖는 아릴 설페이트-의존성 HS 헥수로닐 2-O 설포트랜스퍼라제 효소의 아미노산 서열을 포함하는 다중 서열 정렬을 생성 및 분석함으로써, 가공된 HS 헥수로닐 2-O-설포트랜스퍼라제 효소내 아미노산 서열에서의 돌연변이를 동일한 정렬에서 야생형 HS 헥수로닐 2-O-설포트랜스퍼라제 효소의 아미노산 서열에 대해 관찰할 수 있다. 닭 HS 헥수로닐 2-O 설포트랜스퍼라제 효소가 아닌 야생형 HS 헥수로닐 2-O 설포트랜스퍼라제 효소의 아미노산 서열의 선택시, 서열 번호: 63 및/또는 서열 번호: 65의 아미노산 서열 내에 존재하는 돌연변이를 야생형 서열로 가공하여 아릴 설페이트-의존성 설포트랜스퍼라제 활성을 가질 수 있는 추가의 돌연변이체를 형성시킬 수 있다.
비-제한적인 예로서, 사람 HS 헥수로닐 2-O 설포트랜스퍼라제 효소를 암호화하는 아미노산 서열(entry sp|Q7LGA3|HS2ST_사람, 상기 도 17a, 도 17b, 도 17c, 및 도 17d의 서열 정렬에 나타낸 바와 같음)을 서열 번호: 63 및 서열 번호: 65의 아미노산 서열과 정렬한다. 서열 번호: 63 및 서열 번호: 65에 나타난 아미노산 돌연변이를 사람 HS 헥수로닐 2-O 설포트랜스퍼라제 효소의 아미노산 서열내 이의 등가 위치로 가공하여, 돌연변이체 아미노산 서열 서열 번호: 68 또는 서열 번호: 69 각각을 생성시킨다. 서열 번호: 68 또는 서열 번호: 69의 아미노산 서열 각각을 포함하는 효소는 하기 실시예 17 및 실시예 18에서 이용될 수 있다. 그러나, 당해 분야의 기술자는 동일한 과정을 적용하여 EC 2.8.2.- 효소 부류내 임의의 다른 HS 헥수로닐 2-O 설포트랜스퍼라제 효소와 관련하여 아릴 설페이트-의존성 돌연변이체를 생성할 수 있고 이들이 명확성을 위해 빠져있음을 인식할 수 있다.
실시예 17: EC 2.8.2.- 헥수로닐 2 -O 설포트랜스퍼라제 활성을 갖는 돌연변이체의 발현 및 정제
연구를 본 개시내용의 구현예에 따라 수행하여 서열 번호: 68 또는 서열 번호: 69의 아미노산 서열 각각을 갖는 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소를 암호화하는 유전자가 숙주 세포내로 형질전환될 수 있고, 각각이 이러한 아미노산 서열을 포함하는 효소가 상기 실시에 1의 과정에 따라 후속적으로 발현, 단리, 및 정제될 수 있는지를 측정한다. 목적한 발현 숙주를 기반으로, 서열 번호: 68 또는 서열 번호: 69의 아미노산 서열을 갖는 효소를 암호화하는 코돈-최적화된 뉴클레오타이드 서열을 측정한다. 적합한 발현 벡터내 이러한 유전자의 합성 또는 삽입시, 서열 번호: 68 및 서열 번호: 69 각각의 아미노산 서열 각각을 암호화하는 유전자는 숙주 세포내로 형질전환될 것이고, 이러한 서열을 함유하는 효소는 아릴 설페이트-의존성 헥수로닐 2-O 설포트랜스퍼라제 활성을 측정하기에 충분한 양 및 순도로 후속적으로 발현, 단리, 및 정제될 것임이 예측된다.
실시예 18: EC 2.8.2.- 돌연변이체의 헥수로닐 2 -O 설포트랜스퍼라제 활성
연구를 본 개시내용의 구현예에 따라 수행하여, 서열 번호: 68 또는 서열 번호: 69의 서열 각각을 포함하는 돌연변이체 효소가 활성의 설포트랜스퍼라제인지를 실시예 4의 과정을 사용하여 측정한다. MS 연구는 N-황산화된 헤파로산-계 다당류 및 아릴 설페이트 화합물과 서열 번호: 68 및 서열 번호: 69의 서열 각각을 포함하는 각각의 가공된 효소의 반응의 결과로서 형성된 N,2O-HS 생성물의 존재를 확인할 것이다. 또는, 효소 둘 다는 화학식 IV 또는 화학식 V 중 하나 또는 둘 다를 포함하는 헤파로산-계 다당류와 반응성일 것으로 예측된다.
실시예 19: EC 2.8.2.- 내 다른 글루코사미닐 6 -O 설포트랜스퍼라제 효소의 가공된 아릴 설페이트-의존성 돌연변이체의 측정
연구를 본 개시내용의 구현예에 따라 수행하여 추가의 아릴 설페이트-의존성 글루코사미닐 6-O 설포트랜스퍼라제 효소를 가공한다. 상술된 바와 같이, 서열 번호: 104, 서열 번호: 106, 또는 서열 번호: 108 의 아미노산 서열을 갖는 아릴 설페이트-의존성 글루코사미닐 6-O 설포트랜스퍼라제 효소를 가공하여 효소 부류 EC 2.8.2.-의 구성원인, 마우스 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소(참고: entry Q9QYK5|H6ST1_MOUSE, 상기 도 21a, 도 21b, 및 도 21c에서)의 동형-1의 돌연변이체가 되도록 한다. EC 2.8.2.- 내 다른 HS 글루코사미닐 6-O-설포트랜스퍼라제 효소 중 하나 이상의 아미노산 서열 뿐만 아니라, 서열 번호: 104, 서열 번호: 106, 및/또는 서열 번호: 108의 아미노산 서열을 갖는 아릴 설페이트-의존성 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소의 아미노산 서열 둘 다를 포함하는 다중 서열 정렬을 생성 및 분석함으로써, 가공된 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소 내 아미노산 서열내에서 돌연변이를 동일한 정렬내 야생형 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소의 아미노산 서열에 대해 관찰할 수 있다. 마우스 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소가 아닌 야생형 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소의 아미노산의 선택시, 서열 번호: 104, 서열 번호: 106, 및/또는 서열 번호: 108 의 아미노산 서열 내에 존재하는 돌연변이를 야생형 서열내로 가공하여 아릴 설페이트-의존성 설포트랜스퍼라제 활성을 가질 수 있는 추가의 돌연변이체를 형성할 수 있다.
비-제한적인 예로서, 돼지 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소(entry I3LAM6|I3LAM6_PIG, 상기 도 21a, 도 21b, 및 도 21c에 나타낸 바와 같음)의 아미노산 서열을 서열 번호: 104, 서열 번호: 106, 및 서열 번호: 108의 아미노산 서열과 정렬한다. 서열 번호: 104, 서열 번호: 106, 및 서열 번호: 108에 존재하는 아미노산 돌연변이를 돼지 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소의 아미노산 서열내 이의 등가의 위치내로 가공하여, 돌연변이체 아미노산 서열을 생성한다. 상기 도 21a, 도 21b, 및 도 21c에 나타낸 바와 같이, 돼지 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소의 잔기 67-377에 상응하는 생성된 돌연변이체 아미노산 서열을 서열 번호: 114, 서열 번호: 115, 및 서열 번호: 116 각각으로 개시한다. 돼지 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소에 대한 전체 길이의 아미노산 서열에 상응하는 생성된 돌연변이체 아미노산 서열(상기 도 21a, 도 21b, 및 도 21c에 나타내지 않음)은 서열 번호: 117, 서열 번호: 118, 및 서열 번호: 119 각각으로 개시된다.
다른 비-제한적인 예에서, 마우스 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소(entry Q9QYK4|H6HS3_MOUSE, 상기 도 21a, 도 21b, 및 도 21c에서 서열 정렬로 나타낸 트렁케이트된(truncated) 서열)의 동형 3을 암호화하는 전체 길이의 아미노산 서열을 서열 번호: 104, 서열 번호: 106, 및 서열 번호: 108의 아미노산 서열과 정렬한다. 서열 번호: 104, 서열 번호: 106, 및 서열 번호: 108에 나타난 아미노산 돌연변이를 마우스 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소의 동형 3의 아미노산 서열내 이의 등가 위치내로 가공함으로써, 돌연변이체 아미노산 서열을 생성한다. 생성된 전체 길이의 아미노산 서열은 서열 번호: 120, 서열 번호: 121, 및 서열 번호: 122로서 각각 개시되어 있다. 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 또는 서열 번호: 122의 아미노산 서열 각각을 포함하는 효소는 하기 실시예 20 및 실시예 21에서 이용될 것이다. 그러나, 당해 분야의 기술자는 동일한 과정을 적용하여 EC 2.8.2.- 효소 부류내 임의의 다른 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소와 관련하여 아릴 설페이트-의존성 돌연변이체를 생성할 수 있고, 이들이 명확성을 위해 빠져 있음을 인식할 수 있다.
실시예 20: EC 2.8.2.- 글루코사미닐 6 -O 설포트랜스퍼라제 활성을 갖는 돌연변이체의 발현 및 정제
연구를 본 개시내용의 구현예에 따라 수행하여 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 또는 서열 번호: 122의 아미노산 서열 각각을 갖는 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소가 숙주 세포내로 형질전환될 수 있고, 이러한 아미노산 서열 각각을 포함하는 효소가 상기 실시예 1의 과정에 따라 후속적으로 발현, 분리, 및 정제될 수 있는지를 측정한다. 목적한 발현 숙주를 기반으로, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 또는 서열 번호: 122의 아미노산 서열을 갖는 효소를 암호화하는 코돈-최적화된 뉴클레오타이드 서열을 측정한다. 이러한 유전자의 합성 또는 적합한 발현 벡터내에 삽입시, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 및 서열 번호: 122의 아미노산 서열 각각을 암호화하는 유전자는 숙주 세포내로 형질전환되고, 이러한 서열을 함유하는 효소는 아릴 설페이트-의존성 글루코사미닐 6-O 설포트랜스퍼라제 활성을 측정하기에 충분한 양 및 순도로 후속적으로 발현, 단리, 및 정제될 것임이 예측된다.
실시예 21: EC 2.8.2.- 돌연변이체의 글루코사미닐 6 -O 설포트랜스퍼라제 활성
연구를 수행하여 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 또는 서열 번호: 122의 서열 각각을 포함하는 돌연변이체 효소가 활성 설포트랜스퍼라제인지를 실시예 5의 과정을 사용하여 측정한다. MS 연구는 N,2O-HS 다당류 및 아릴 설페이트 화합물과 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 및 서열 번호: 122의 서열 각각을 포함하는 각각의 가공된 효소의 반응의 결과로서 형성된 N,2O,6O-HS 생성물의 존재를 확인할 것으로 예측된다.
실시예 22: EC 2.8.2.23 내 다른 글루코사미닐 3 -O 설포트랜스퍼라제 효소의 가공된 아릴 설페이트-의존성 돌연변이체의 측정
연구를 본 개시내용의 구현예에 따라 수행하여 추가의 아릴 설페이트-의존성 글루코사미닐 3-O 설포트랜스퍼라제 효소를 가공한다. 상술된 바와 같이, 서열 번호: 147, 서열 번호: 149, 또는 서열 번호: 151의 아미노산 서열을 갖는 아릴 설페이트-의존성 글루코사미닐 3-O 설포트랜스퍼라제 효소를 가공하여 효소 부류 EC 2.8.2.23의 구성원인, 사람 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소(참고: entry sp|O14792|HS3S1_HUMAN, 상기 도 26a, 도 26b, 및 도 26c에서)의 동형-1의 돌연변이체가 되로록 한다. EC 2.8.2.23 내 다른 HS 글루코사미닐 3-O-설포트랜스퍼라제 효소 중 하나 이상의 아미노산 서열 뿐만 아니라, 서열 번호: 147, 서열 번호: 149, 및/또는 서열 번호: 151의 아미노산 서열을 갖는 아릴 설페이트-의존성 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소의 아미노산 서열 둘 다를 포함하는 다중 서열 정렬을 생성 및 분석함으로써, 가공된 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소 내 아미노산 서열내에서 돌연변이를 동일한 정렬내 야생형 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소의 아미노산 서열에 대해 관찰할 수 있다. 사람 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소가 아닌 야생형 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소의 아미노산의 선택시, 서열 번호: 147, 서열 번호: 149, 및/또는 서열 번호: 151의 아미노산 서열 내에 존재하는 돌연변이를 야생형 서열내로 가공하여 아릴 설페이트-의존성 설포트랜스퍼라제 활성을 가질 수 있는 추가의 돌연변이체를 형성할 수 있다.
비-제한적인 예로서, 돼지 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소(entry tr|I3LHH5| I3LHH5_PIG, 상기 도 26a, 도 26b, 및 도 26c에 나타낸 바와 같음)의 동형 1을 암호화하는 아미노산 서열을 서열 번호: 147, 서열 번호: 149, 및 서열 번호: 151의 아미노산 서열과 정렬한다. 서열 번호: 147, 서열 번호: 149, 및 서열 번호: 151에 존재하는 아미노산 돌연변이를 돼지 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소의 아미노산 서열내 이의 등가의 위치내로 가공하여, 돌연변이체 아미노산 서열 서열 번호: 155, 서열 번호: 156, 또는 서열 번호: 157 각각을 생성한다.
다른 비-제한적인 예에서, 마우스 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소(상기 도 26a, 도 26b, 및 도 26c에 나타나 있지 않음)의 동형 5를 암호화하는 전체 길이의 아미노산 서열을 서열 번호: 147, 서열 번호: 149, 및 서열 번호: 151의 아미노산 서열과 정렬한다. 서열 번호: 147, 서열 번호: 149, 및 서열 번호: 151에 나타난 아미노산 돌연변이를 마우스 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소의 동형 5의 아미노산 서열내 이의 등가 위치내로 가공함으로써, 돌연변이체 아미노산 서열을 생성한다. 생성된 전체 길이의 아미노산 서열은 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160으로서 각각 개시되어 있다.
서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160의 아미노산 서열 각각을 포함하는 효소는 하기 실시예 23 및 실시예 24에서 이용될 것이다. 그러나, 당해 분야의 기술자는 동일한 과정을 적용하여 EC 2.8.2.23 효소 부류내 임의의 다른 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소와 관련하여 아릴 설페이트-의존성 돌연변이체를 생성할 수 있고, 이들이 명확성을 위해 빠져 있음을 인식할 수 있다.
실시예 23: 글루코사미닐 3 -O 설포트랜스퍼라제 활성을 갖는 EC 2.8.2.23 돌연변이체의 발현 및 정제
연구를 본 개시내용의 구현예에 따라 수행하여 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160의 아미노산 서열 각각을 갖는 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소가 숙주 세포내로 형질전환될 수 있고, 이러한 아미노산 서열 각각을 포함하는 효소가 상기 실시예 1의 과정에 따라 후속적으로 발현, 분리, 및 정제될 수 있는지를 측정한다. 목적한 발현 숙주를 기반으로, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160의 아미노산 서열을 갖는 효소를 암호화하는 코돈-최적화된 뉴클레오타이드 서열을 측정한다. 이러한 유전자의 합성 또는 적합한 발현 벡터내에 삽입시, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160의 아미노산 서열 각각을 암호화하는 유전자는 숙주 세포내로 형질전환되고, 이러한 서열을 함유하는 효소는 아릴 설페이트-의존성 글루코사미닐 3-O 설포트랜스퍼라제 활성을 측정하기에 충분한 양 및 순도로 후속적으로 발현, 단리, 및 정제될 것임이 예측된다.
실시예 24: EC 2.8.2.23 돌연변이체의 글루코사미닐 3 -O 설포트랜스퍼라제 활성
연구를 수행하여 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 또는 서열 번호: 160의 서열 각각을 포함하는 돌연변이체 효소가 활성 설포트랜스퍼라제인지를 실시예 6 및/또는 실시예 7의 과정을 사용하여 측정한다. MS 및/또는 NMR 연구는 N,2O-HS 다당류 및 아릴 설페이트 화합물과 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160의 서열 각각을 포함하는 가공된 효소 각각의 반응의 결과로서 형성된 N,2O,3O,6O-HS 생성물의 존재를 확인할 것으로 예측된다.
SEQUENCE LISTING <110> OPTIMVIA, LLC <120> ENGINEERED ARYL SULFATE-DEPENDENT ENZYMES <130> IP20214023US <150> US 62/792,440 <151> 2019-01-15 <150> US 62/797,466 <151> 2019-01-28 <150> US 62/808,074 <151> 2019-02-20 <150> US 62/853,261 <151> 2019-05-28 <160> 163 <170> KopatentIn 2.0 <210> 1 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl N-sulfotransferase mutant_sulfatase 1 <400> 1 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro His Lys Thr Gly His Thr Ala Leu Tyr 35 40 45 Leu Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Thr Thr Gly Glu Ser Ile Gly Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Ala His Gly Gly Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Leu 245 250 255 Gly Lys Ser Lys Gly Arg Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 2 <211> 927 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl N-sulfotransferase mutant_sulfatase 1 <400> 2 atgagcgaag agaaggaccc tttgtggcag gacccgtgcg aagataagcg ccacaaagac 60 atctggtcga aagaaaagac gtgcgaccgt ttccctaaac ttttaattat cggtccgcat 120 aagacagggc atacagcact ttatttattt ttggggatgc acccggattt gtcctcgaac 180 tatccctcgt ctacgaccgg ggagagcatt ggcttcttca atggacacaa ctatcataag 240 ggaattgact ggtatatgga attcttccct atccccagca atactacctc agatttctac 300 ttcgaagcgc acggggggta ttttgatagc gaggtcgccc cacgtcgcgc tgccgcattg 360 cttcccaagg caaaggtgct tactattttg attaaccctg cagaccgtgc ttactcctgg 420 tatcaacacc aacgtgcgca cgatgatcct gtggcgttga aatacacatt tcacgaagta 480 attactgcgg gatctgatgc gtctagcaaa ttgcgtgcct tacagaaccg ctgccttgtt 540 ccaggttggt acgccacgca cattgagcgt tggctgtctg cgtatcacgc taaccagatt 600 cttgtattag acggaaaatt gctgcgtaca gagcccgcta aggtgatgga tatggtgcaa 660 aagttccttg gtgtaacgaa caccattgat tatcataaaa cgttggcttt tgaccctaaa 720 aagggatttt ggtgccagtt acttgaagga gggaagacaa agtgtctggg gaagagcaaa 780 gggcgtaaat acccagaaat ggatttagat agtcgcgcat tccttaaaga ttactatcgc 840 gatcataaca tcgaattatc gaagctttta tacaaaatgg gccagacatt gccaacgtgg 900 ctgcgtgaag acttgcagaa cacacgc 927 <210> 3 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl N-sulfotransferase mutant_sulfatase 2 <400> 3 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro Gln Lys Thr Gly Ala Trp Ala Leu Tyr 35 40 45 His Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Ser His Ala Arg Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Met Ser Ala Asn Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Leu 245 250 255 His Lys Arg Ala Gly Arg Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 4 <211> 927 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl N-sulfotransferase mutant_sulfatase 2 <400> 4 atgagcgaag agaaggaccc tttgtggcag gacccgtgcg aggacaagcg ccacaaggac 60 atttggagta aggaaaagac atgcgaccgc ttcccgaaat tattgattat tggtccgcag 120 aaaactgggg catgggcatt gtaccacttc ttaggtatgc acccagactt atcgtctaac 180 tatccatcct ccgaaagtca tgctcgcatc caattcttca acggtcataa ctatcataag 240 ggtattgact ggtacatgga gtttttcccc atccccagta ataccactag tgacttttac 300 tttgagatgt cggcaaacta ctttgacagc gaggttgctc cgcgtcgtgc ggcagcgctt 360 ctgccgaaag ccaaggtatt aactattttg atcaacccag cagatcgtgc gtatagttgg 420 taccagcacc aacgcgccca tgatgatcct gtcgctctta agtacacctt ccatgaagta 480 attacggcgg gcagcgatgc ttcgtctaaa cttcgtgcgt tgcagaatcg ctgcctggtt 540 cccgggtggt acgcgaccca cattgagcgc tggctttccg catatcatgc caatcaaatc 600 ttggtattgg acggaaagct tctgcgcacc gagcctgcga aagtgatgga catggtacag 660 aagttcttag gagttacaaa tacgatcgat tatcacaaga cccttgcttt tgaccctaaa 720 aaaggattct ggtgccaact tttggaggga ggtaagacta agtgccttca taaacgcgca 780 gggcgcaaat atcccgagat ggacttagat tcacgcgcgt tccttaaaga ttactatcgt 840 gatcataata tcgagttaag caaacttctg tataagatgg gacagacact gcctacatgg 900 ctgcgtgaag acttgcagaa cacacgc 927 <210> 5 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 1 <400> 5 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro Gln Lys Thr Gly Ala Trp Ala Leu Tyr 35 40 45 His Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr His Gly Ser Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Lys Ser Ala Asn Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Leu 245 250 255 Gly Lys Ser His Gly Arg Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 6 <211> 927 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 1 <400> 6 atgagcgaag agaaggaccc tttgtggcag gacccgtgcg aggacaaacg ccacaaagac 60 atttggtcga aggagaaaac ctgtgaccgc ttccctaagt tgcttattat tggtccgcaa 120 aagaccggcg cctgggcgct ttaccatttc ctgggtatgc atcccgatct tagttccaac 180 tacccgtcga gtgaaacaca tggcagtatc caattcttta atggacataa ctaccataag 240 ggcatcgact ggtatatgga atttttcccc attccctcaa ataccacttc tgacttttat 300 ttcgagaaat cagcgaatta ttttgacagt gaggtagcgc ctcgccgcgc agcagcattg 360 ttgcccaaag caaaagtgct gactattctt atcaatccag ctgaccgcgc atattcttgg 420 tatcagcacc agcgcgccca cgacgacccg gtggcgctga aatacacatt ccatgaagtg 480 attactgctg gaagcgatgc gtcgtctaag ttgcgtgctc tgcagaaccg ctgtttggta 540 cctggctggt atgctacgca cattgaacgt tggctgtccg catatcacgc gaaccagatc 600 ctggttttag atggtaaatt acttcgcacg gagccagcta aagtcatgga catggtacaa 660 aagttcctgg gggtaacgaa taccattgat tatcataaga ctttggcttt cgaccccaag 720 aagggatttt ggtgccagtt attggagggg ggcaagacga agtgcttagg caaatcgcat 780 gggcgcaagt acccggagat ggatttggac tcacgcgcct ttcttaagga ctactaccgc 840 gaccacaaca ttgaattgag taaattatta tacaaaatgg ggcaaactct tccgacttgg 900 ttgcgtgaag acttgcagaa cacacgc 927 <210> 7 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 2 <400> 7 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro Ser Lys Thr Gly Ala Phe Leu Leu Thr 35 40 45 His Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Gly His Ser Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Thr Ser Ser Asn Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys His 245 250 255 Gly Lys Arg Trp Gly Arg Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 8 <211> 927 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 2 <400> 8 atgagcgaag agaaggaccc tttgtggcag gacccgtgcg aggacaaacg ccataaggac 60 atctggtcga aagagaagac ttgtgaccgt tttccaaaat tacttattat cggtccttca 120 aagaccggcg ctttcctttt aacccacttt ttggggatgc atccagacct tagttcaaat 180 tacccttcgt ctgagactgg gcattccatt caattcttca acgggcacaa ttatcacaag 240 ggtattgact ggtacatgga atttttcccg attccgagca atacaacttc cgatttttac 300 tttgaaacct catccaatta ttttgattcc gaagtcgctc cacgccgcgc cgctgctttg 360 ttgccaaaag ctaaggtttt gactattctg atcaacccgg ctgaccgcgc ctattcatgg 420 taccaacacc agcgtgctca tgatgaccca gtggctttga agtatacgtt ccatgaggtc 480 attacagcgg gcagcgacgc aagctccaaa cttcgcgcat tgcaaaaccg ctgccttgtg 540 cccggttggt acgcgacaca cattgaacgc tggctgtccg cttaccacgc caaccaaatt 600 ttagttttag atgggaaatt acttcgtacc gaacctgcca aggtcatgga catggtgcag 660 aaatttttgg gagtcactaa cactatcgac taccacaaaa cattggcatt cgatccaaaa 720 aaggggtttt ggtgccagct tttagaaggg ggcaagacga agtgtcacgg gaagcgttgg 780 gggcgtaagt atccagagat ggatcttgat agccgcgctt tcttaaaaga ttattaccgt 840 gaccacaaca ttgagcttag caaactgctt tacaagatgg gtcagacact tccgacatgg 900 ctgcgtgaag acttgcagaa cacacgc 927 <210> 9 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 3 <400> 9 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro His Gly Thr Gly Gly His Ala Leu Tyr 35 40 45 Leu Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Gly Glu Glu Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Lys Ser Ala Asn Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln Ala Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Gly 245 250 255 Gly Lys His Leu Gly Arg Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 10 <211> 927 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 3 <400> 10 atgagcgaag agaaggaccc tttgtggcag gacccgtgcg aagataagcg tcacaaggac 60 atctggtcaa aagagaaaac ttgcgaccgc tttccgaaat tgttaattat tggaccacat 120 ggcaccgggg gtcacgcact ttacttattc ttgggaatgc acccagatct gagctccaac 180 taccccagct ctgaaaccgg cgaagaaatc caatttttca acgggcacaa ttatcataaa 240 ggcattgatt ggtatatgga attcttcccc atcccgtcta atactaccag cgatttctat 300 tttgaaaaaa gtgcgaacta cttcgactcg gaggtggcac cccgtcgtgc tgcggcctta 360 ctgccaaagg ccaaggtttt aaccatcttg attaatccgg ctgaccgtgc ttattcctgg 420 taccaggctc aacgcgcaca tgacgacccc gttgcgctta aatatacatt ccacgaggtc 480 attactgcgg gctctgatgc ttcttcgaaa cttcgtgcgc tgcaaaatcg ttgtttagtg 540 ccgggttggt acgccacgca catcgagcgt tggcttagtg cctaccatgc gaatcaaatc 600 cttgtcttgg atgggaagct tttgcgtact gaaccggcca aggtcatgga catggtccag 660 aagtttctgg gtgttaccaa cactattgat taccataaga ctttagcctt cgatccgaag 720 aaaggcttct ggtgtcaatt acttgagggt ggtaagacca agtgcggagg aaaacatctt 780 gggcgcaaat accccgaaat ggacttagat agccgtgcct ttctgaaaga ttactaccgc 840 gaccataata tcgagcttag caaattattg tacaaaatgg gccaaacctt gccgacgtgg 900 ctgcgtgaag acttgcagaa cacacgc 927 <210> 11 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 4 <400> 11 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro His Gly Thr Gly Gly His Ala Leu Tyr 35 40 45 Leu Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Phe Leu Ser Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu His Ser Gly Asn Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Arg Ala Tyr Val Trp Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Leu 245 250 255 Gly Lys Ser Leu Gly Ser Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 12 <211> 927 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 4 <400> 12 atgagcgaag agaaggaccc tttgtggcag gacccgtgcg aagataagcg ccacaaggac 60 atctggagca aggagaaaac ttgcgaccgc tttccaaagt tgctgattat tgggcctcac 120 ggcacgggcg gccacgcgct gtacctgttt cttggcatgc acccggacct ttccagcaat 180 tatcctagta gtgagacatt tttgagtatc caatttttta acggacataa ctatcacaaa 240 ggtatcgatt ggtacatgga attcttccca attccgtcta atacgacatc tgacttttat 300 ttcgagcatt cggggaatta ctttgattcc gaggtagccc cacgccgtgc cgccgctctt 360 ttgcccaagg cgaaagtctt gactattctt attaatcccg cagaccgtgc ctaccgcgcg 420 tatgtatggc aacgcgcaca cgatgaccca gtcgcattga aatatacatt ccatgaggtg 480 attaccgcgg gtagtgacgc ttctagcaag ttacgtgctc ttcagaatcg ctgccttgtc 540 ccaggttggt atgccacaca catcgaacgt tggctgtccg cctaccatgc taatcagatt 600 cttgtgctgg atggtaaatt gttgcgtaca gagcctgcca aagttatgga tatggtgcaa 660 aaatttttgg gtgttacgaa tactattgat taccataaga cacttgcatt tgacccgaaa 720 aaaggtttct ggtgccaatt gttggagggt ggcaagacta agtgcttagg taagagtctt 780 ggttcgaagt accccgaaat ggatttagac tcgcgcgctt tcttgaagga ctattatcgt 840 gaccacaata tcgaactttc taaactttta tataagatgg gccaaacact tcccacgtgg 900 ctgcgtgaag acttgcagaa cacacgc 927 <210> 13 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 5 <400> 13 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro His Lys Thr Gly Val His Ala Leu Tyr 35 40 45 Leu Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Gly Asn His Ile Gly Phe Phe Gly Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Lys Ser Ala Trp Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Leu 245 250 255 Gly Lys Ser Val Gly Arg Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 14 <211> 927 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 5 <400> 14 atgagcgaag agaaggaccc tttgtggcag gacccgtgcg aagataagcg tcataaagac 60 atttggagta aagagaagac ttgtgatcgt ttccccaagt tactgatcat cggcccacat 120 aagacaggag tacatgcatt gtacttgttt ttgggaatgc atccggacct gtcttcaaat 180 taccccagtt cagagacagg caatcacatc ggcttcttcg gaggacataa ctaccacaaa 240 ggcatcgatt ggtacatgga attctttcct atcccctcta atactacctc agatttttac 300 ttcgagaaaa gtgcttggta ctttgactcc gaagttgctc ctcgtcgcgc agcagcatta 360 cttccaaagg cgaaagttct gactattttg atcaaccctg cggatcgcgc ctacagctgg 420 tatcaacacc agcgcgccca cgatgatcct gtcgcattga aatacacctt tcatgaagtt 480 atcaccgctg gctccgatgc gtctagcaaa ttgcgtgcat tacagaatcg ttgccttgtg 540 ccaggatggt acgctaccca tattgagcgc tggctgagtg catatcacgc gaatcagatt 600 ctggtgttag atggaaagct gctgcgtact gaaccggcca aagtaatgga catggttcaa 660 aagttcctgg gggtgacgaa cacaattgat taccataaga ctcttgcatt tgatcctaag 720 aaaggctttt ggtgtcaact tttagagggg gggaagacca agtgcttagg gaagagcgtg 780 ggacgcaagt accccgaaat ggacttagat agccgtgctt tcttgaagga ttattatcgc 840 gaccacaaca ttgaactttc taaactgtta tacaagatgg gccagacact gccgacctgg 900 ctgcgtgaag acttgcagaa cacacgc 927 <210> 15 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 6 <400> 15 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro Ala Lys Thr Gly Ala Trp Leu Leu His 35 40 45 His Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr His Ser Ser Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Thr Ser Ala Asn Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Ala 245 250 255 His Lys Gly Leu Gly Arg Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 16 <211> 927 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 6 <400> 16 atgagcgaag agaaggaccc tttgtggcag gacccgtgcg aagataagcg tcacaaggat 60 atttggtcca aagaaaagac ctgcgatcgc tttcccaagc tgttaatcat cggcccggcc 120 aaaacaggcg cctggctttt gcatcatttc ctgggcatgc atcccgactt gtcgagtaac 180 tatccgtcgt ccgaaactca ctcctctatt caattcttca atgggcataa ttatcacaag 240 ggtatcgact ggtacatgga gttctttcca atccctagta atacaaccag tgatttttat 300 tttgagacta gcgctaacta ctttgattca gaggtggcac cgcgtcgtgc ggcggcgctg 360 ttgccgaagg cgaaagtttt aactatcttg atcaatccgg cagatcgtgc gtacagctgg 420 taccaacatc aacgtgctca cgatgacccg gtggccctga aatatacctt ccacgaggtc 480 attacagccg gaagtgacgc ttccagtaaa ttgcgcgcgt tacaaaatcg ttgtctggtc 540 cctgggtggt acgcaacgca cattgaacgc tggttatcgg cataccacgc aaatcagatc 600 cttgtgcttg acggaaagtt attgcgtact gaaccggcca aggtgatgga tatggtacag 660 aaattccttg gcgtcaccaa tacgatcgac tatcacaaga cgcttgcctt cgaccccaag 720 aaggggtttt ggtgccaact tttagagggt ggtaagacaa agtgtgctca taaggggtta 780 ggccgcaagt accctgaaat ggatctggac tcgcgcgctt ttttgaaaga ctattatcgc 840 gatcacaata ttgagttgag caagttgctg tataaaatgg gacagacact gccgacctgg 900 ctgcgtgaag acttgcagaa cacacgc 927 <210> 17 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl N-sulfotransferase mutant_variable <220> <221> MISC_FEATURE <222> (40)..(40) <223> Xaa is glutamine, histidine, serine, or alanine <220> <221> MISC_FEATURE <222> (41)..(41) <223> Xaa is lysine or glycine <220> <221> MISC_FEATURE <222> (44)..(44) <223> Xaa is alanine, histidine, glycine, or valine <220> <221> MISC_FEATURE <222> (45)..(45) <223> Xaa is threonine, tryptophan, histidine, or phenylalanine <220> <221> MISC_FEATURE <222> (46)..(46) <223> Xaa is alanine or leucine <220> <221> MISC_FEATURE <222> (48)..(48) <223> Xaa is tyrosine, threonine, or histidine <220> <221> MISC_FEATURE <222> (49)..(49) <223> Xaa is leucine or histidine <220> <221> MISC_FEATURE <222> (65)..(65) <223> Xaa is glutamic acid or threonine <220> <221> MISC_FEATURE <222> (66)..(66) <223> Xaa is threonine or serine <220> <221> MISC_FEATURE <222> (67)..(67) <223> Xaa is phenylalanine, glycine, or histidine <220> <221> MISC_FEATURE <222> (68)..(68) <223> Xaa is glutamic acid, histidine, alanine, leucine, glycine, asparagine, or serine <220> <221> MISC_FEATURE <222> (69)..(69) <223> Xaa is glutamic acid, serine, arginine, or histidine <220> <221> MISC_FEATURE <222> (71)..(71) <223> Xaa is glutamine or glycine <220> <221> MISC_FEATURE <222> (74)..(74) <223> Xaa is asparagine or glycine <220> <221> MISC_FEATURE <222> (103)..(103) <223> Xaa is lysine, alanine, methionine, histidine, or threonine <220> <221> MISC_FEATURE <222> (104)..(104) <223> Xaa is serine or histidine <220> <221> MISC_FEATURE <222> (105)..(105) <223> Xaa is alanine, serine, or glycine <220> <221> MISC_FEATURE <222> (106)..(106) <223> Xaa is asparagine, glycine, or tryptophan <220> <221> MISC_FEATURE <222> (139)..(139) <223> Xaa is serine or arginine <220> <221> MISC_FEATURE <222> (140)..(140) <223> Xaa is tryptophan or alanine <220> <221> MISC_FEATURE <222> (142)..(142) <223> Xaa is glutamine or valine <220> <221> MISC_FEATURE <222> (143)..(143) <223> Xaa is histidine, alanine, or tryptophan <220> <221> MISC_FEATURE <222> (256)..(256) <223> Xaa is leucine, histidine, glycine, or alanine <220> <221> MISC_FEATURE <222> (257)..(257) <223> Xaa is glycine or histidine <220> <221> MISC_FEATURE <222> (259)..(259) <223> Xaa is serine, arginine, histidine, or glycine <220> <221> MISC_FEATURE <222> (260)..(260) <223> Xaa is lysine, alanine, histidine, tryptophan, or leucine <220> <221> MISC_FEATURE <222> (262)..(262) <223> Xaa is arginine or serine <400> 17 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro Xaa Xaa Thr Gly Xaa Xaa Xaa Leu Xaa 35 40 45 Xaa Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Xaa Xaa Xaa Xaa Xaa Ile Xaa Phe Phe Xaa Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Xaa Xaa Xaa Xaa Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Xaa Xaa Tyr Xaa Xaa Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Xaa 245 250 255 Xaa Lys Xaa Xaa Gly Xaa Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 18 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 7 <220> <221> MISC_FEATURE <222> (40)..(40) <223> Xaa is glutamine, serine, or alanine <220> <221> MISC_FEATURE <222> (45)..(45) <223> Xaa is tryptophan or phenyalanine <220> <221> MISC_FEATURE <222> (46)..(46) <223> Xaa is alanine or leucine <220> <221> MISC_FEATURE <222> (48)..(48) <223> Xaa is tyrosine, threonine, or histidine <220> <221> MISC_FEATURE <222> (67)..(67) <223> Xaa is histidine or glycine <220> <221> MISC_FEATURE <222> (68)..(68) <223> Xaa is glycine, histidine, or serine <220> <221> MISC_FEATURE <222> (103)..(103) <223> Xaa is lysine or threonine <220> <221> MISC_FEATURE <222> (105)..(105) <223> Xaa is alanine or serine <220> <221> MISC_FEATURE <222> (256)..(256) <223> Xaa is leucine, histidine, or alanine <220> <221> MISC_FEATURE <222> (257)..(257) <223> Xaa is glycine or histidine <220> <221> MISC_FEATURE <222> (259)..(259) <223> Xaa is serine, arginine, or glycine <220> <221> MISC_FEATURE <222> (260)..(260) <223> Xaa is histidine, tryptophan, or leucine <400> 18 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro Xaa Lys Thr Gly Ala Xaa Xaa Leu Xaa 35 40 45 His Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Xaa Xaa Ser Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Xaa Ser Xaa Asn Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Xaa 245 250 255 Xaa Lys Xaa Xaa Gly Arg Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 19 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 8 <220> <221> MISC_FEATURE <222> (41)..(41) <223> Xaa is glycine or lysine <220> <221> MISC_FEATURE <222> (44)..(44) <223> Xaa is glycine or valine <220> <221> MISC_FEATURE <222> (67)..(67) <223> Xaa is glycine or phenylalanine <220> <221> MISC_FEATURE <222> (68)..(68) <223> Xaa is glutamic acid, leucine, or asparagine <220> <221> MISC_FEATURE <222> (69)..(69) <223> Xaa is glutamic acid, serine, or histidine <220> <221> MISC_FEATURE <222> (71)..(71) <223> Xaa is glutamine or glycine <220> <221> MISC_FEATURE <222> (74)..(74) <223> Xaa is asparagine or glycine <220> <221> MISC_FEATURE <222> (103)..(103) <223> Xaa is lysine or histidine <220> <221> MISC_FEATURE <222> (105)..(105) <223> Xaa is alanine or glycine <220> <221> MISC_FEATURE <222> (106)..(106) <223> Xaa is asparagine or tryptophan <220> <221> MISC_FEATURE <222> (139)..(139) <223> Xaa is serine or arginine <220> <221> MISC_FEATURE <222> (140)..(140) <223> Xaa is tryptophan or alanine <220> <221> MISC_FEATURE <222> (142)..(142) <223> Xaa is glutamine or valine <220> <221> MISC_FEATURE <222> (143)..(143) <223> Xaa is histidine, alanine, or tryptophan <220> <221> MISC_FEATURE <222> (256)..(256) <223> Xaa is leucine or glycine <220> <221> MISC_FEATURE <222> (259)..(259) <223> Xaa is serine or histidine <220> <221> MISC_FEATURE <222> (260)..(260) <223> Xaa is leucine or valine <220> <221> MISC_FEATURE <222> (262)..(262) <223> Xaa is arginine or serine <400> 19 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro His Xaa Thr Gly Xaa His Ala Leu Tyr 35 40 45 Leu Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Xaa Xaa Xaa Ile Xaa Phe Phe Xaa Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Xaa Ser Xaa Xaa Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Xaa Xaa Tyr Xaa Xaa Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Xaa 245 250 255 Gly Lys Xaa Xaa Gly Xaa Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 20 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 9 <400> 20 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro Gln Lys Thr Gly Ala Trp Ala Leu Tyr 35 40 45 His Phe Leu Gly Leu His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr His Gly Ser Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Asp Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Lys Ser Ala Asn Tyr Phe Asp Ser Asp Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Ala Ala Leu Arg Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Pro Asp Ala Ser Leu Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Leu Glu Arg Trp Leu 180 185 190 Gly Ala Phe His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Arg Val Met Asp Thr Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Leu 245 250 255 Gly Arg Ser His Gly Arg Lys Tyr Pro Asp Met Asp Pro Asp Ser Arg 260 265 270 Ala Phe Leu Arg Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Glu 290 295 300 Leu Gln Asn Thr Arg 305 <210> 21 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 10 <400> 21 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro Ser Lys Thr Gly Ala Phe Leu Leu Thr 35 40 45 His Phe Leu Gly Leu His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Gly His Ser Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Asp Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Thr Ser Ser Asn Tyr Phe Asp Ser Asp Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Ala Ala Leu Arg Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Pro Asp Ala Ser Leu Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Leu Glu Arg Trp Leu 180 185 190 Gly Ala Phe His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Arg Val Met Asp Thr Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys His 245 250 255 Gly Arg Arg Trp Gly Arg Lys Tyr Pro Asp Met Asp Pro Asp Ser Arg 260 265 270 Ala Phe Leu Arg Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Glu 290 295 300 Leu Gln Asn Thr Arg 305 <210> 22 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 11 <400> 22 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro His His Thr Gly Gly His Ala Leu Tyr 35 40 45 Leu Phe Leu Gly Leu His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Gly Glu Glu Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Asp Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Lys Ser Ala Asn Tyr Phe Asp Ser Asp Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln Ala Gln 130 135 140 Arg Ala His Asp Asp Pro Ala Ala Leu Arg Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Pro Asp Ala Ser Leu Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Leu Glu Arg Trp Leu 180 185 190 Gly Ala Phe His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Arg Val Met Asp Thr Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Gly 245 250 255 Gly Arg His Leu Gly Arg Lys Tyr Pro Asp Met Asp Pro Asp Ser Arg 260 265 270 Ala Phe Leu Arg Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Glu 290 295 300 Leu Gln Asn Thr Arg 305 <210> 23 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 12 <400> 23 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro His Gly Thr Gly Gly His Ala Leu Tyr 35 40 45 Leu Phe Leu Gly Leu His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Phe Leu Ser Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Asp Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu His Ser Gly Asn Tyr Phe Asp Ser Asp Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Arg Ala Tyr Val Trp Gln 130 135 140 Arg Ala His Asp Asp Pro Ala Ala Leu Arg Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Pro Asp Ala Ser Leu Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Leu Glu Arg Trp Leu 180 185 190 Gly Ala Phe His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Arg Val Met Asp Thr Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Leu 245 250 255 Gly Arg Ser Leu Gly Ser Lys Tyr Pro Asp Met Asp Pro Asp Ser Arg 260 265 270 Ala Phe Leu Arg Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Glu 290 295 300 Leu Gln Asn Thr Arg 305 <210> 24 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 13 <400> 24 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro His Lys Thr Gly Val His Ala Leu Tyr 35 40 45 Leu Phe Leu Gly Leu His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Gly Asn His Ile Gly Phe Phe Gly Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Asp Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Lys Ser Ala Trp Tyr Phe Asp Ser Asp Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Ala Ala Leu Arg Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Pro Asp Ala Ser Leu Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Leu Glu Arg Trp Leu 180 185 190 Gly Ala Phe His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Arg Val Met Asp Thr Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Leu 245 250 255 Gly Arg Ser Val Gly Arg Lys Tyr Pro Asp Met Asp Pro Asp Ser Arg 260 265 270 Ala Phe Leu Arg Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Glu 290 295 300 Leu Gln Asn Thr Arg 305 <210> 25 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl N-sulfotransferase mutant_sulfotransferase 14 <400> 25 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro Ala Lys Thr Gly Ala Trp Leu Leu His 35 40 45 His Phe Leu Gly Leu His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr His Ser Ser Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Asp Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Thr Ser Ala Asn Tyr Phe Asp Ser Asp Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Ala Ala Leu Arg Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Pro Asp Ala Ser Leu Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Leu Glu Arg Trp Leu 180 185 190 Gly Ala Phe His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Arg Val Met Asp Thr Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Ala 245 250 255 His Arg Gly Leu Gly Arg Lys Tyr Pro Asp Met Asp Pro Asp Ser Arg 260 265 270 Ala Phe Leu Arg Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Glu 290 295 300 Leu Gln Asn Thr Arg 305 <210> 26 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 1 <400> 26 atggatgagg aagacgacgt cgtgattatt tataaccatg tacataagac tgccagccat 60 tcattcacga atatcgcgta cgatctttgc gctaaaaacc gttatcatgt tttacatatt 120 aataccacca aaaacaatcc ggtgatgtca ttgcaggatc aggtgcgttt cgtaaagaat 180 gtcacctcat ggaaagagat gaagccaggg ttttatcatg ggcacgttag ttatttggat 240 tttgctaagt ttggtgtaaa gaagaagccc atctacatca atgtcattcg tgatcccatt 300 gaacgcttgg tctcctatta ctactttttg cgctttggcg acgactaccg ccccggatta 360 cgccgccgca agcaggggga caagaaaact tttgacgaat gcgtcgctgc cggtggtagc 420 gactgcgccc cggagaaatt atggcttcaa attccctttt tctgcggcca ttcttcggaa 480 tgctggaacg taggtagtcg ctgggctctt gaacaggcaa aatataatct tatcaacgaa 540 tactttcttg tcggagttac cgaggagttg gaggacttta ttatgcttct ggaggctgcg 600 ctgccgcgtt tttttcgtgg tgcgaccgag ctgtatcgta caggtaaaaa aagtcatctt 660 cgtaaaacga cggaaaagaa gctgccaact aaggaaacaa tcgcgaaact gcaacagagt 720 gaaatctgga aaatggaaaa tgaattctat gagtttgccc tggagcaatt ccaattcgtt 780 cgcgcccatg ccgtacgtga gaaggacggc gaattatata tccttgcaca aaacttcttc 840 tatgagaaga tctatcctaa gtctaactaa 870 <210> 27 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 1 <400> 27 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn His Val His Lys 1 5 10 15 Thr Ala Ser His Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Asn Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly His Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Phe Leu Arg Phe 100 105 110 Gly Asp Asp Tyr Arg Pro Gly Leu Arg Arg Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu Arg Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 28 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 2 <400> 28 atggatgagg aagacgacgt cgtgattatt tataaccgtg taccgaccac tgcccatacg 60 tcattcacga atatcgcgta cgatctttgc gctaaaaacc gttatcatgt tttacatatt 120 aataccacca aaaacaatcc ggtgatgtca ttgcaggatc aggtgcgttt cgtaaagaat 180 gtcacctcat ggaaagagat gaagccaggg ttttatcatg ggcacgttag ttatttggat 240 tttgctaagt ttggtgtaaa gaagaagccc atctacatca atgtcattcg tgatcccatt 300 gaacgcttgg tctcctatta ctaccatttg cgctttggcg acgactaccg ccccggatta 360 cgccgccgca agcaggggga caagaaaact tttgacgaat gcgtcgctgc cggtggtagc 420 gactgcgccc cggagaaatt atggcttcaa attccctttt tctgcggcca ttcttcggaa 480 tgctggaacg taggtagtcg ctgggctctt gaacaggcaa aatataatct tatcaacgaa 540 tactttcttg tcggagttac cgaggagttg gaggacttta ttatgcttct ggaggctgcg 600 ctgccgcgtt tttttcgtgg tgcgaccgag ctgtatcgta caggtaaaaa aagtcatctt 660 cgtaaaacga cggaaaagaa gctgccaact aaggaaacaa tcgcgaaact gcaacagagt 720 gaaatctgga aaatggaaaa tgaattctat gagtttgccc tggagcaatt ccaattcgtt 780 cgcgcccatg ccgtacgtga gaaggacggc gaattatata tccttgcaca aaacttcttc 840 tatgagaaga tctatcctaa gtctaactaa 870 <210> 29 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 2 <400> 29 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val Pro Thr 1 5 10 15 Thr Ala His Thr Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Asn Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly His Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr His Leu Arg Phe 100 105 110 Gly Asp Asp Tyr Arg Pro Gly Leu Arg Arg Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu Arg Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 30 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 3 <400> 30 atggatgagg aagacgacgt cgtgattatt tataaccgtg tacataccac tgccagcacg 60 tcattcacga atatcgcgta cgatctttgc gctaaaaacc gttatcatgt tttacatatt 120 aataccacca aaaacaatcc ggtgatgtca ttgcaggatc aggtgcgttt cgtaaagaat 180 gtcacctcat ggaaagagat gaagccaggg ttttatcatg ggcacgttag ttatttggat 240 tttgctaagt ttggtgtaaa gaagaagccc atctacatca atgtcattcg tgatcccatt 300 gaacgcttgg tctcctatta ctactttttg cgctttggcg acgactaccg ccccggatta 360 cgccgccgca agcaggggga caagaaaact tttgacgaat gcgtcgctgc cggtggtagc 420 gactgcgccc cggagaaatt atggcttcaa attccctttt tctgcggcca ttcttcggaa 480 tgctggaacg taggtagtcg ctgggctctt gaacaggcaa aatataatct tatcaacgaa 540 tactttcttg tcggagttac cgaggagttg gaggacttta ttatgcttct ggaggctgcg 600 ctgccgcgtt tttttcgtgg tgcgaccgag ctgtatcgta caggtaaaaa aagtcatctt 660 cgtaaaacga cggaaaagaa gctgccaact aaggaaacaa tcgcgaaact gcaacagagt 720 gaaatctgga aaatggaaaa tgaattctat gagtttgccc tggagcaatt ccaattcgtt 780 cgcgcccatg ccgtacgtga gaaggacggc gaattatata tccttgcaca aaacttcttc 840 tatgagaaga tctatcctaa gtctaactaa 870 <210> 31 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 3 <400> 31 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val His Thr 1 5 10 15 Thr Ala Ser Thr Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Asn Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly His Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Phe Leu Arg Phe 100 105 110 Gly Asp Asp Tyr Arg Pro Gly Leu Arg Arg Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu Arg Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 32 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 4 <400> 32 atggatgagg aagacgacgt cgtgattatt tataaccgtg taccgaccac tgcccataac 60 tcattcacga atatcgcgta cgatctttgc gctaaaaacc gttatcatgt tttacatatt 120 aataccacca aaaacaatcc ggtgatgtca ttgcaggatc aggtgcgttt cgtaaagaat 180 gtcacctcat ggaaagagat gaagccaggg ttttatcatg ggcacgttag ttatttggat 240 tttgctaagt ttggtgtaaa gaagaagccc atctacatca atgtcattcg tgatcccatt 300 gaacgcttgg tctcctatta ctaccatttg cgctttggcg acgactaccg ccccggatta 360 cgccgccgca agcaggggga caagaaaact tttgacgaat gcgtcgctgc cggtggtagc 420 gactgcgccc cggagaaatt atggcttcaa attccctttt tctgcggcca ttcttcggaa 480 tgctggaacg taggtagtcg ctgggctctt gaacaggcaa aatataatct tatcaacgaa 540 tactttcttg tcggagttac cgaggagttg gaggacttta ttatgcttct ggaggctgcg 600 ctgccgcgtt tttttcgtgg tgcgaccgag ctgtatcgta caggtaaaaa aagtcatctt 660 cgtaaaacga cggaaaagaa gctgccaact aaggaaacaa tcgcgaaact gcaacagagt 720 gaaatctgga aaatggaaaa tgaattctat gagtttgccc tggagcaatt ccaattcgtt 780 cgcgcccatg ccgtacgtga gaaggacggc gaattatata tccttgcaca aaacttcttc 840 tatgagaaga tctatcctaa gtctaactaa 870 <210> 33 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 4 <400> 33 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val Pro Thr 1 5 10 15 Thr Ala His Asn Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Asn Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly His Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr His Leu Arg Phe 100 105 110 Gly Asp Asp Tyr Arg Pro Gly Leu Arg Arg Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu Arg Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 34 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 5 <400> 34 atggatgagg aagacgacgt cgtgattatt tataaccgtg taccgaacac tgccagcacg 60 tcattcacga atatcgcgta cgatctttgc gctaaaaacc gttatcatgt tttacatatt 120 aataccacca aaaacaatcc ggtgatgtca ttgcaggatc aggtgcgttt cgtaaagaat 180 gtcacctcat ggaaagagat gaagccaggg ttttatcatg ggcacgttag ttatttggat 240 tttgctaagt ttggtgtaaa gaagaagccc atctacatca atgtcattcg tgatcccatt 300 gaacgcttgg tccattatta ctaccatttg cgctttggcg acgactaccg ccccggatta 360 cgccgccgca agcaggggga caagaaaact tttgacgaat gcgtcgctgc cggtggtagc 420 gactgcgccc cggagaaatt atggcttcaa attccctttt tctgcggcca ttcttcggaa 480 tgctggaacg taggtagtcg ctgggctctt gaacaggcaa aatataatct tatcaacgaa 540 tactttcttg tcggagttac cgaggagttg gaggacttta ttatgcttct ggaggctgcg 600 ctgccgcgtt tttttcgtgg tgcgaccgag ctgtatcgta caggtaaaaa aagtcatctt 660 cgtaaaacga cggaaaagaa gctgccaact aaggaaacaa tcgcgaaact gcaacagagt 720 gaaatctgga aaatggaaaa tgaattctat gagtttgccc tggagcaatt ccaattcgtt 780 cgcgcccatg ccgtacgtga gaaggacggc gaattatata tccttgcaca aaacttcttc 840 tatgagaaga tctatcctaa gtctaactaa 870 <210> 35 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 5 <400> 35 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val Pro Asn 1 5 10 15 Thr Ala Ser Thr Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Asn Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly His Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val His Tyr Tyr Tyr His Leu Arg Phe 100 105 110 Gly Asp Asp Tyr Arg Pro Gly Leu Arg Arg Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu Arg Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 36 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 6 <400> 36 atggatgagg aagacgacgt cgtaatcatc tacaaccgcg tcccgcacac agccagccac 60 tccttcacca atattgcgta tgatctgtgc gctaagaacc gttaccatgt gttgcacatt 120 accactacga agcgtaaccc cgtaatgtca cttcaagatc aagttcgctt cgttaagaac 180 gtgacatctt ggaaggagat gaagccagga ttctatcatg gggaagttag ctacttggac 240 tttgccaagt tcggtgtaaa gaaaaaacca atctacatca atgttattcg tgatcccatc 300 gaacgcttag tgtcttacta ttatgccctt cgctttggag gcgaccgtcg cccggggctt 360 cgtatgcgca agcaagggga caagaagacc ttcgacgagt gtgtagccgc gggtgggtct 420 gactgtgcgc cggaaaagtt atggttacaa attccatttt tctgtggtca ctcgtcagag 480 tgctggaatg ttggttcgcg ctgggcgctg gagcaagcga aatataactt gattaatgaa 540 tactttttag taggggtgac agaggagttg gaggacttta ttatgcttct tgaggctgcg 600 ttacctcgct ttttccgcgg tgcgactgag ttgtatcgta ccggtaaaaa atctcatctg 660 cataaaacaa ctgaaaagaa gctgccaacg aaagagacga ttgctaaact tcagcagagt 720 gagatctgga aaatggaaaa tgagttctac gagtttgcct tggagcaatt ccaattcgtg 780 cgtgcccatg ccgttcgtga aaaggatggt gaattataca tcttggcaca gaatttcttc 840 tatgagaaaa tttatcctaa gtctaactaa 870 <210> 37 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 6 <400> 37 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val Pro His 1 5 10 15 Thr Ala Ser His Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Thr Thr Thr Lys Arg Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly Glu Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Ala Leu Arg Phe 100 105 110 Gly Gly Asp Arg Arg Pro Gly Leu Arg Met Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 38 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 7 <400> 38 atggatgagg aagacgacgt cgtaatcatc tacaaccgcg tcccgcacac agccgagcac 60 tccttcacca atattgcgta tgatctgtgc gctaagaacc gttaccatgt gttgcacatt 120 accactacga agcgtaaccc cgtaatgtca cttcaagatc aagttcgctt cgttaagaac 180 gtgacatctt ggaaggagat gaagccagga ttctatcatg gggaagttag ctacttggac 240 tttgccaagt tcggtgtaaa gaaaaaacca atctacatca atgttattcg tgatcccatc 300 gaacgcttag tgtcttacta ttatgccctt cgctttggag gcgaccgtcg cccggggctt 360 cgtatgcgca agcaagggga caagaagacc ttcgacgagt gtgtagccgc gggtgggtct 420 gactgtgcgc cggaaaagtt atggttacaa attccatttt tctgtggtca ctcgtcagag 480 tgctggaatg ttggttcgcg ctgggcgctg gagcaagcga aatataactt gattaatgaa 540 tactttttag taggggtgac agaggagttg gaggacttta ttatgcttct tgaggctgcg 600 ttacctcgct ttttccgcgg tgcgactgag ttgtatcgta ccggtaaaaa atctcatctg 660 cataaaacaa ctgaaaagaa gctgccaacg aaagagacga ttgctaaact tcagcagagt 720 gagatctgga aaatggaaaa tgagttctac gagtttgcct tggagcaatt ccaattcgtg 780 cgtgcccatg ccgttcgtga aaaggatggt gaattataca tcttggcaca gaatttcttc 840 tatgagaaaa tttatcctaa gtctaactaa 870 <210> 39 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 7 <400> 39 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val Pro His 1 5 10 15 Thr Ala Glu His Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Thr Thr Thr Lys Arg Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly Glu Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Ala Leu Arg Phe 100 105 110 Gly Gly Asp Arg Arg Pro Gly Leu Arg Met Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 40 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 8 <400> 40 atggatgagg aagacgacgt cgtgatcatc tacaaccgtg ttcctcacac ggcttcgcac 60 tctttcacga atatcgctta cgacttatgt gccaagaatc gttatcatgt gttacacatc 120 actaccacca aaaacaaccc cgtcatgtcg ttacaggacc aagtgcgttt cgtgaaaaac 180 gttacatcct ggaaggagat gaaacccggt ttctatcatg gaatggtctc ttacctggat 240 tttgctaaat ttggtgtgaa aaaaaaaccc atttatatta acgtcatccg cgatccaatc 300 gagcgtttgg tttcttatta ttatgcctta cgtttcggga gtgatcgccg tcccggattg 360 cgtatgcgta aacagggaga caagaaaact ttcgatgaat gtgttgccgc cggaggttcc 420 gactgtgcac cggaaaaact gtggcttcag atccctttct tttgtggtca cagttcagaa 480 tgttggaacg tcgggtcacg ttgggcgctt gaacaggcca agtacaatct tatcaacgag 540 tattttctgg taggggtgac tgaagagctg gaggacttta ttatgcttct tgaagcggca 600 ttgccacgct tttttcgtgg cgcgactgaa ttatatcgta caggaaagaa atcgcacttg 660 cacaagacta cagaaaaaaa actgcctact aaggagacga ttgctaagtt gcaacaatca 720 gaaatttgga agatggaaaa cgaattctac gagttcgcat tagaacagtt tcaattcgta 780 cgcgctcacg ctgtgcgtga gaaagacggg gaactgtaca ttttggccca aaattttttc 840 tatgagaaaa tttatcctaa gtctaactaa 870 <210> 41 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 8 <400> 41 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val Pro His 1 5 10 15 Thr Ala Ser His Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Thr Thr Thr Lys Asn Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly Met Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Ala Leu Arg Phe 100 105 110 Gly Ser Asp Arg Arg Pro Gly Leu Arg Met Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 42 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 9 <400> 42 atggatgagg aagacgacgt cgtaattatc tacaatcgcg tgccacacac ggcatcccat 60 tcattcacca acattgcgta cgatttgtgt gcaaaaaacc gttatcatgt cttacacatc 120 aacactacaa aaaacaatcc cgtaatgagt ctgcaagatc aggtccgttt tgtcaaaaat 180 gtaacctcgt ggaaggagat gaagccgggc ttctatcacg ggatggtcag ctaccttgac 240 tttgctaaat ttggggtaaa gaaaaaacct atctatatca atgtgattcg tgatcctatc 300 gaacgccttg taagttatta ctacgctctt cgtttcgggg cagatcgccg tcccggactt 360 cgcatgcgca agcaggggga taagaagaca tttgacgagt gcgtcgcggc gggtggatct 420 gattgtgccc ctgagaaact gtggttgcaa attccattct tttgtgggca cagcagtgag 480 tgctggaatg tgggatctcg ttgggctctg gaacaggcca agtacaacct tattaatgag 540 tacttcttag taggagtcac ggaagagctt gaagacttca ttatgttact ggaagcagcc 600 ttgcctcgtt ttttccgcgg tgcaacggag ctgtaccgca cagggaaaaa atcccatctt 660 cataagacca cagagaaaaa actgccgacg aaggagacga ttgcgaaact gcaacaaagt 720 gaaatctgga agatggagaa tgaattttat gagtttgctt tggagcaatt tcaattcgtc 780 cgtgcgcatg cggtccgtga aaaggacggt gaattgtata tcttggctca aaactttttc 840 tatgagaaaa tttatcctaa gtctaactaa 870 <210> 43 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 9 <400> 43 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val Pro His 1 5 10 15 Thr Ala Ser His Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Asn Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly Met Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Ala Leu Arg Phe 100 105 110 Gly Ala Asp Arg Arg Pro Gly Leu Arg Met Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 44 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 10 <400> 44 atggatgagg aagacgacgt cgtaatcatc tacaaccgcg tcccgcacac agccagccac 60 tccttcacca atattgcgta tgatctgtgc gctaagaacc gttaccatgt gttgcacatt 120 accactacga agcgtaaccc cgtaatgtca cttcaagatc aagttcgctt cgttaagaac 180 gtgacatctt ggaaggagat gaagccagga ttctatcatg gggaagttag ctacttggac 240 tttgccaagt tcggtgtaaa gaaaaaacca atctacatca atgttattcg tgatcccatc 300 gaacgcttag tgtcttacta ttatgccctt cgctttggag ccgaccgtcg cccggggctt 360 cgtatgcgca agcaagggga caagaagacc ttcgacgagt gtgtagccgc gggtgggtct 420 gactgtgcgc cggaaaagtt atggttacaa attccatttt tctgtggtca ctcgtcagag 480 tgctggaatg ttggttcgcg ctgggcgctg gagcaagcga aatataactt gattaatgaa 540 tactttttag taggggtgac agaggagttg gaggacttta ttatgcttct tgaggctgcg 600 ttacctcgct ttttccgcgg tgcgactgag ttgtatcgta ccggtaaaaa atctcatctg 660 cataaaacaa ctgaaaagaa gctgccaacg aaagagacga ttgctaaact tcagcagagt 720 gagatctgga aaatggaaaa tgagttctac gagtttgcct tggagcaatt ccaattcgtg 780 cgtgcccatg ccgttcgtga aaaggatggt gaattataca tcttggcaca gaatttcttc 840 tatgagaaaa tttatcctaa gtctaactaa 870 <210> 45 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 10 <400> 45 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val Pro His 1 5 10 15 Thr Ala Ser His Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Thr Thr Thr Lys Arg Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly Glu Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Ala Leu Arg Phe 100 105 110 Gly Ala Asp Arg Arg Pro Gly Leu Arg Met Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 46 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 11 <400> 46 atggatgagg aagacgacgt cgtaattatc tacaatcgcg taccgcatac tgcaagccac 60 agctttacta acatcgccta tgatttgtgt gcgaagaacc gctatcatgt actgcatatt 120 acgacgacca agaataatcc tgtaatgtcc ttacaggacc aagttcgctt cgttaaaaac 180 gtaacttcgt ggaaagagat gaagccaggg ttttaccacg gaatggtcag ctacttagat 240 ttcgcaaagt tcggtgtgaa gaaaaagccc atctatatca atgtcatccg cgaccctatc 300 gaacgtctgg tatcttacta ttatgcgctt cgcttcggcg gtgatcgccg tcctggttta 360 cgtatgcgta agcaaggaga taagaaaacc ttcgacgaat gtgtcgcggc cgggggcagt 420 gactgtgccc cggagaagtt atggttacag atcccatttt tttgtggaca cagttccgaa 480 tgttggaacg tgggtagtcg ttgggcatta gagcaagcca agtacaactt aatcaatgaa 540 tatttcttgg taggtgtaac tgaggagctg gaagacttta ttatgttact tgaagctgcg 600 ctgccccgtt tctttcgtgg tgcgacggag ttataccgta cagggaagaa gagccactta 660 cataagacaa ctgagaaaaa gttacccacg aaagaaacaa tcgctaaatt acaacaaagt 720 gagatttgga agatggaaaa cgaattttat gagttcgcat tagaacagtt tcaattcgtg 780 cgtgcgcatg cggtccgcga gaaggacggt gaactttaca ttcttgcaca gaacttcttc 840 tatgagaaaa tttatcctaa gtctaactaa 870 <210> 47 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 11 <400> 47 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val Pro His 1 5 10 15 Thr Ala Ser His Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Thr Thr Thr Lys Asn Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly Met Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Ala Leu Arg Phe 100 105 110 Gly Gly Asp Arg Arg Pro Gly Leu Arg Met Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 48 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 12 <400> 48 atggatgagg aagacgacgt cgtaattatc tacaaccgcg tccatcgtac tgcgtctcac 60 agctttacta acattgccta cgacttatgc gcaaagaatc gttaccacgt tttgcatatc 120 aacacgacca agggtaatcc ggtaatgtca ttgcaagatc aggtgcgttt cgtaaaaaac 180 gtcacgagct ggaaagaaat gaagccggga ttttaccacg ggacagtcag ctaccttgat 240 tttgcaaaat tcggagtcaa aaaaaaaccc atttacatta acgtgatccg cgatccaatt 300 gaacgtcttg tctcgtacta ttatttctta cgtttcggga acgacctgcg tccgggtttg 360 cgtcgtcgca aacaaggaga caagaagaca tttgacgaat gtgtagcagc agggggctct 420 gactgcgccc cggaaaaatt gtggttacag atcccgttct tttgtggaca tagttccgag 480 tgctggaatg taggctcccg ttgggcgtta gaacaggcaa aatacaatct gattaacgag 540 tactttttag taggcgtgac cgaggagtta gaagatttta ttatgctgtt agaggcggcg 600 ctgccgcgtt ttttccgtgg agccacggaa ttgtatcgta ccggaaagaa atctcacctt 660 cacaagacta cagaaaaaaa attaccaact aaagagacaa tcgcaaagtt gcagcagtcg 720 gagatctgga agatggaaaa tgagttttat gaattcgcat tagaacagtt ccaattcgtt 780 cgtgcgcacg cagtacgcga aaaggacggg gagctttaca tcctggctca gaattttttc 840 tatgagaaaa tttatcctaa gtctaactaa 870 <210> 49 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 12 <400> 49 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val His Arg 1 5 10 15 Thr Ala Ser His Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Gly Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly Thr Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Phe Leu Arg Phe 100 105 110 Gly Asn Asp Leu Arg Pro Gly Leu Arg Arg Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 50 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 13 <400> 50 atggatgagg aagacgacgt cgtaattatc tacaaccgcg tccatcgtac tgcgtctcac 60 agctttacta acattgccta cgacttatgc gcaaagaatc gttaccacgt tttgcatatc 120 aacacgacca agggtaatcc ggtaatgtca ttgcaagatc aggtgcgttt cgtaaaaaac 180 gtcacgagct ggaaagaaat gaagccggga ttttaccacg ggccagtcag ctaccttgat 240 tttgcaaaat tcggagtcaa aaaaaaaccc atttacatta acgtgatccg cgatccaatt 300 gaacgtcttg tctcgtacta ttatttctta cgtttcggga gcgacctgcg tccgggtttg 360 cgtcagcgca aacaaggaga caagaagaca tttgacgaat gtgtagcagc agggggctct 420 gactgcgccc cggaaaaatt gtggttacag atcccgttct tttgtggaca tagttccgag 480 tgctggaatg taggctcccg ttgggcgtta gaacaggcaa aatacaatct gattaacgag 540 tactttttag taggcgtgac cgaggagtta gaagatttta ttatgctgtt agaggcggcg 600 ctgccgcgtt ttttccgtgg agccacggaa ttgtatcgta ccggaaagaa atctcacctt 660 cacaagacta cagaaaaaaa attaccaact aaagagacaa tcgcaaagtt gcagcagtcg 720 gagatctgga agatggaaaa tgagttttat gaattcgcat tagaacagtt ccaattcgtt 780 cgtgcgcacg cagtacgcga aaaggacggg gagctttaca tcctggctca gaattttttc 840 tatgagaaaa tttatcctaa gtctaactaa 870 <210> 51 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 13 <400> 51 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val His Arg 1 5 10 15 Thr Ala Ser His Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Gly Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly Pro Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Phe Leu Arg Phe 100 105 110 Gly Ser Asp Leu Arg Pro Gly Leu Arg Gln Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 52 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 14 <400> 52 atggatgagg aagacgacgt cgtgattatc tataaccgcg tgcatcgtac ggcttcacat 60 tcgttcacaa atattgcgta cgacctttgt gctaagaatc gctatcacgt cttacacatc 120 aacaccacca aaggcaatcc tgtcatgtct cttcaagatc aagtacgttt cgtgaagaac 180 gtgacatcat ggaaggagat gaagccgggg ttctaccatg ggccggtaag ttacttggat 240 ttcgctaaat ttggggttaa aaaaaagcct atctacatta atgttattcg tgaccctatc 300 gaacgtttgg tttcctatta ttacttcctt cgctttggaa atgatcgccg tcctggtttg 360 cgtcaacgca agcagggcga taaaaaaaca tttgacgaat gcgtagctgc cggcggctcc 420 gactgtgcgc cagaaaagct gtggttacag atcccatttt tctgtggaca ctcctcggag 480 tgttggaacg tggggtcgcg ttgggcatta gaacaggcca aatacaattt aatcaacgaa 540 tatttcctgg ttggcgtcac ggaggaactg gaagatttca ttatgctttt agaagctgcg 600 ttaccacgct tctttcgcgg cgctaccgag ttataccgta ccggaaagaa gtctcatctg 660 cacaagacga cggaaaagaa gcttcccact aaagaaacta ttgctaaatt acagcagagt 720 gaaatctgga aaatggaaaa tgagttctac gagttcgcgt tggaacagtt tcaattcgtt 780 cgtgcccatg ccgttcgcga aaaggatggc gaattgtata ttcttgccca gaacttcttc 840 tatgagaaaa tttatcctaa gtctaactaa 870 <210> 53 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 14 <400> 53 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val His Arg 1 5 10 15 Thr Ala Ser His Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Gly Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly Pro Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Phe Leu Arg Phe 100 105 110 Gly Asn Asp Arg Arg Pro Gly Leu Arg Gln Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 54 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 15 <400> 54 atggatgagg aagacgacgt cgtgattatt tataaccgtg tgcctcacac tgcttcgacc 60 tcatttacaa acattgctta cgatctttgt gctaagaatc gttaccacgt cctgcatatt 120 aacacgacaa aaaataaccc tgtaatgtct cttcaagatc aagtccgctt cgtgaaaaat 180 gtgacgagtt ggaaagaaat gaagccggga ttttatcacg ggcccgtgtc ataccttgac 240 ttcgctaaat ttggggttaa gaaaaaacct atctatatca atgtgatccg tgatcccatc 300 gaacgccttg tttcatatta ttatgcatta cgttttggtt cagattatcg cccaggcctt 360 cgcatgcgta agcaagggga caagaagaca ttcgatgagt gcgttgcggc ggggggatca 420 gattgtgcac cagagaagct gtggttgcaa atcccgttct tctgcggaca cagctccgaa 480 tgttggaatg tcgggtcacg ttgggcgctt gaacaggcta agtacaatct gattaacgag 540 tactttttag tcggtgttac ggaggagttg gaagacttca ttatgctgct ggaggctgcg 600 ctgccccgct tcttccgcgg cgccaccgag ttgtaccgta caggaaagaa gtcccattta 660 cacaagcata ctgagaaaaa gttgcccact aaggaaacca ttgctaagtt gcaacagtcg 720 gaaatttgga aaatggagaa cgagttctac gaatttgcat tagaacagtt ccaatttgtt 780 cgtgcccatg ccgtacgtga gaaggacggc gaattatata tccttgcaca aaacttcttc 840 tatgagaaga tctatcctaa gtctaactaa 870 <210> 55 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 15 <400> 55 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val Pro His 1 5 10 15 Thr Ala Ser Thr Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Asn Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly Pro Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Ala Leu Arg Phe 100 105 110 Gly Ser Asp Tyr Arg Pro Gly Leu Arg Met Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys His Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 56 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 16 <400> 56 atggatgagg aagacgacgt cgtgattatt tataaccgtg tgcctcacac tgcttcgacc 60 tcatttacaa acattgctta cgatctttgt gctaagaatc gttaccacgt cctgcatatt 120 aacacgacaa aaaataaccc tgtaatgtct cttcaagatc aagtccgctt cgtgaaaaat 180 gtgacgagtt ggaaagaaat gaagccggga ttttatcacg ggaacgtgtc ataccttgac 240 ttcgctaaat ttggggttaa gaaaaaacct atctatatca atgtgatccg tgatcccatc 300 gaacgccttg tttcatatta ttatgcatta cgttttggtt cagattatcg cccaggcctt 360 cgcatgcgta agcaagggga caagaagaca ttcgatgagt gcgttgcggc ggggggatca 420 gattgtgcac cagagaagct gtggttgcaa atcccgttct tctgcggaca cagctccgaa 480 tgttggaatg tcgggtcacg ttgggcgctt gaacaggcta agtacaatct gattaacgag 540 tactttttag tcggtgttac ggaggagttg gaagacttca ttatgctgct ggaggctgcg 600 ctgccccgct tcttccgcgg cgccaccgag ttgtaccgta caggaaagaa gtcccattta 660 cacaagcata ctgagaaaaa gttgcccact aaggaaacca ttgctaagtt gcaacagtcg 720 gaaatttgga aaatggagaa cgagttctac gaatttgcat tagaacagtt ccaatttgtt 780 cgtgcccatg ccgtacgtga gaaggacggc gaattatata tccttgcaca aaacttcttc 840 tatgagaaga tctatcctaa gtctaactaa 870 <210> 57 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 16 <400> 57 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val Pro His 1 5 10 15 Thr Ala Ser Thr Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Asn Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly Asn Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Ala Leu Arg Phe 100 105 110 Gly Ser Asp Tyr Arg Pro Gly Leu Arg Met Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys His Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 58 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 17 <400> 58 atggatgagg aagacgacgt cgtgattatt tataaccatg ttcataagac tgcttcgcat 60 tcattcacta acatcgctta tgatttatgt gcaaagaacc gttatcacgt tcttcacatc 120 accacgacaa agggtaatcc ggtaatgtca ctgcaggacc aggttcgttt cgtcaaaaat 180 gtaacttcgt ggaaagagat gaagccgggg ttctaccacg gccccgtgtc ttatcttgac 240 ttcgcgaaat tcggagttaa aaaaaaacca atctacatca acgtgatccg cgatcctatc 300 gaacgtcttg tatcttatta ctatttttta cgcttcgggg atgactaccg ccctgggctt 360 cgtcgtcgca agcagggcga caagaaaacg ttcgacgagt gcgtcgccgc cggaggctcg 420 gactgtgctc cggagaaatt gtggttgcag attccctttt tctgtggaca ctcgtctgag 480 tgctggaacg taggatcacg ctgggcatta gaacaagcga agtataactt gattaacgag 540 tatttcctgg tcggcgtaac tgaagaactg gaggatttca ttatgcttct ggaagccgcg 600 ctgccccgtt ttttccgtgg ggccactgag ctttaccgca caggaaagaa gtctcacctt 660 cgtaaaacga ctgagaaaaa gcttcccacc aaggagacta tcgcaaaact tcaacaatca 720 gaaatttgga agatggaaaa tgagttctac gagttcgcct tggaacagtt ccagttcgtc 780 cgtgcccatg ccgtacgtga gaaggacggc gaattatata tccttgcaca aaacttcttc 840 tatgagaaga tctatcctaa gtctaactaa 870 <210> 59 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 17 <400> 59 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn His Val His Lys 1 5 10 15 Thr Ala Ser His Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Thr Thr Thr Lys Gly Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly Pro Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Phe Leu Arg Phe 100 105 110 Gly Asp Asp Tyr Arg Pro Gly Leu Arg Arg Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu Arg Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 60 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 18 <400> 60 atggatgagg aagacgacgt cgtgattatt tataaccatg ttcataagac tgcttcgcat 60 tcattcacta acatcgctta tgatttatgt gcaaagaacc gttatcacgt tcttcacatc 120 accacgacaa agaataatcc ggtaatgtca ctgcaggacc aggttcgttt cgtcaaaaat 180 gtaacttcgt ggaaagagat gaagccgggg ttctaccacg gccccgtgtc ttatcttgac 240 ttcgcgaaat tcggagttaa aaaaaaacca atctacatca acgtgatccg cgatcctatc 300 gaacgtcttg tatcttatta ctatttttta cgcttcgggg atgactaccg ccctgggctt 360 cgtcgtcgca agcagggcga caagaaaacg ttcgacgagt gcgtcgccgc cggaggctcg 420 gactgtgctc cggagaaatt gtggttgcag attccctttt tctgtggaca ctcgtctgag 480 tgctggaacg taggatcacg ctgggcatta gaacaagcga agtataactt gattaacgag 540 tatttcctgg tcggcgtaac tgaagaactg gaggatttca ttatgcttct ggaagccgcg 600 ctgccccgtt ttttccgtgg ggccactgag ctttaccgca caggaaagaa gtctcacctt 660 cgtaaaacga ctgagaaaaa gcttcccacc aaggagacta tcgcaaaact tcaacaatca 720 gaaatttgga agatggaaaa tgagttctac gagttcgcct tggaacagtt ccagttcgtc 780 cgtgcccatg ccgtacgtga gaaggacggc gaattatata tccttgcaca aaacttcttc 840 tatgagaaga tctatcctaa gtctaactaa 870 <210> 61 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfatase 18 <400> 61 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn His Val His Lys 1 5 10 15 Thr Ala Ser His Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Thr Thr Thr Lys Asn Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly Pro Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Phe Leu Arg Phe 100 105 110 Gly Asp Asp Tyr Arg Pro Gly Leu Arg Arg Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu Arg Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 62 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_ sulfotransferase 1 <400> 62 atggatgagg aagacgacgt cgtgattatt tataaccgtg taccgcatac tgccagcacg 60 tcattcacga atatcgcgta cgatctttgc gctaaaaacc gttatcatgt tttacatatt 120 aataccacca aaaacaatcc ggtgatgtca ttgcaggatc aggtgcgttt cgtaaagaat 180 gtcacctcat ggaaagagat gaagccaggg ttttatcatg ggcacgttag ttatttggat 240 tttgctaagt ttggtgtaaa gaagaagccc atctacatca atgtcattcg tgatcccatt 300 gaacgcttgg tctcctatta ctaccatttg cgctttggcg acgactaccg ccccggatta 360 cgccgccgca agcaggggga caagaaaact tttgacgaat gcgtcgctgc cggtggtagc 420 gactgcgccc cggagaaatt atggcttcaa attccctttt tctgcggcca ttcttcggaa 480 tgctggaacg taggtagtcg ctgggctctt gaacaggcaa aatataatct tatcaacgaa 540 tactttcttg tcggagttac cgaggagttg gaggacttta ttatgcttct ggaggctgcg 600 ctgccgcgtt tttttcgtgg tgcgaccgag ctgtatcgta caggtaaaaa aagtcatctt 660 cataaaacga cggaaaagaa gctgccaact aaggaaacaa tcgcgaaact gcaacagagt 720 gaaatctgga aaatggaaaa tgaattctat gagtttgccc tggagcaatt ccaattcgtt 780 cgcgcccatg ccgtacgtga gaaggacggc gaattatata tccttgcaca aaacttcttc 840 tatgagaaga tctatcctaa gtctaactaa 870 <210> 63 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfotransferase 1 <400> 63 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val Pro His 1 5 10 15 Thr Ala Ser Thr Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Asn Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly His Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr His Leu Arg Phe 100 105 110 Gly Asp Asp Tyr Arg Pro Gly Leu Arg Arg Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 64 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered hexuronyl 2-O sulfotransferase mutant_ sulfotransferase 2 <400> 64 atggatgagg aagacgacgt cgtaattatt tacaatcgtg tacaccgtac agcctcgcat 60 tcttttacta acattgctta tgatctgtgc gcaaaaaacc gttaccacgt gttgcacatc 120 aatactacta agggtaatcc cgttatgagc ctgcaagacc aggtgcgctt tgttaagaat 180 gttacctcct ggaaagagat gaaacctggc ttctatcacg gacctgtatc ctacttggac 240 ttcgctaaat ttggcgtaaa gaaaaaacct atttacatca atgtgatccg tgaccctatc 300 gaacgtctgg tatcgtatta ttatttcctg cgcttcggat cggataagcg tccaggtttg 360 cgcatgcgta agcaggggga taaaaaaacg tttgacgaat gcgtggcggc tggtgggagc 420 gactgtgcgc cggaaaagtt atggttgcaa atcccgtttt tctgtgggca tagctctgaa 480 tgttggaatg ttggctcgcg ctgggcgctt gagcaagcta aatacaacct gatcaatgag 540 tacttcttag tcggagtaac tgaggaatta gaggacttca ttatgttgct tgaggctgct 600 ttaccacgct tcttccgcgg tgcgacagaa ttgtaccgca ccggaaaaaa gagccactta 660 cacaagacca cagaaaagaa attaccgacc aaagaaacta tcgccaagtt acaacaaagt 720 gagatttgga aaatggaaaa cgaattctat gaattcgcgt tggaacaatt tcaattcgtg 780 cgtgctcacg cagtacgcga gaaggacggg gagctttata ttttggccca aaactttttc 840 tatgagaaaa tttatcctaa gtctaactaa 870 <210> 65 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfotransferase 2 <400> 65 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val His Arg 1 5 10 15 Thr Ala Ser His Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Gly Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly Pro Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Phe Leu Arg Phe 100 105 110 Gly Ser Asp Lys Arg Pro Gly Leu Arg Met Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 66 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_variable <220> <221> MISC_FEATURE <222> (13)..(13) <223> Xaa is arginine or histidine <220> <221> MISC_FEATURE <222> (15)..(15) <223> Xaa is histidine or proline <220> <221> MISC_FEATURE <222> (16)..(16) <223> Xaa is lysine, histidine, threonine, arginine, or asparagine <220> <221> MISC_FEATURE <222> (19)..(19) <223> Xaa is histidine, glutamic acid, or serine <220> <221> MISC_FEATURE <222> (20)..(20) <223> Xaa is histidine, threonine, or asparagine <220> <221> MISC_FEATURE <222> (41)..(41) <223> Xaa is threonine or asparagine <220> <221> MISC_FEATURE <222> (45)..(45) <223> Xaa is arginine, glycine, or asparagine <220> <221> MISC_FEATURE <222> (75)..(75) <223> Xaa is histidine, glutamic acid, methionine, proline, threonine, or asparagine <220> <221> MISC_FEATURE <222> (105)..(105) <223> Xaa is histidine or serine <220> <221> MISC_FEATURE <222> (109)..(109) <223> Xaa is histidine, alanine, or phenylalanine <220> <221> MISC_FEATURE <222> (114)..(114) <223> Xaa is aspartic acid, glycine, serine, alanine, or asparagine <220> <221> MISC_FEATURE <222> (116)..(116) <223> Xaa is tyrosine, arginine, or leucine <220> <221> MISC_FEATURE <222> (122)..(122) <223> Xaa is methionine, arginine, or glutamine <220> <221> MISC_FEATURE <222> (221)..(221) <223> Xaa is arginine or histidine <220> <221> MISC_FEATURE <222> (223)..(223) <223> Xaa is threonine or histidine <400> 66 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Xaa Val Xaa Xaa 1 5 10 15 Thr Ala Xaa Xaa Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Xaa Thr Thr Lys Xaa Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly Xaa Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Xaa Tyr Tyr Tyr Xaa Leu Arg Phe 100 105 110 Gly Xaa Asp Xaa Arg Pro Gly Leu Arg Xaa Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu Xaa Lys Xaa Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 67 <211> 617 <212> PRT <213> homo sapiens <400> 67 Met Arg Cys Leu Ala Ala Arg Val Asn Tyr Lys Thr Leu Ile Ile Ile 1 5 10 15 Cys Ala Leu Phe Thr Leu Val Thr Val Leu Leu Trp Asn Lys Cys Ser 20 25 30 Ser Asp Lys Ala Ile Gln Phe Pro Arg Arg Ser Ser Ser Gly Phe Arg 35 40 45 Val Asp Gly Phe Glu Lys Arg Ala Ala Ala Ser Glu Ser Asn Asn Tyr 50 55 60 Met Asn His Val Ala Lys Gln Gln Ser Glu Glu Ala Phe Pro Gln Glu 65 70 75 80 Gln Gln Lys Ala Pro Pro Val Val Gly Gly Phe Asn Ser Asn Val Gly 85 90 95 Ser Lys Val Leu Gly Leu Lys Tyr Glu Glu Ile Asp Cys Leu Ile Asn 100 105 110 Asp Glu His Thr Ile Lys Gly Arg Arg Glu Gly Asn Glu Val Phe Leu 115 120 125 Pro Phe Thr Trp Val Glu Lys Tyr Phe Asp Val Tyr Gly Lys Val Val 130 135 140 Gln Tyr Asp Gly Tyr Asp Arg Phe Glu Phe Ser His Ser Tyr Ser Lys 145 150 155 160 Val Tyr Ala Gln Arg Ala Pro Tyr His Pro Asp Gly Val Phe Met Ser 165 170 175 Phe Glu Gly Tyr Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile Ser 180 185 190 Gly Val Glu Gly Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly Tyr 195 200 205 Phe Tyr Pro Ile Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser Lys 210 215 220 Asn Leu Thr Glu Lys Pro Pro His Ile Glu Val Tyr Glu Thr Ala Glu 225 230 235 240 Asp Arg Asp Lys Asn Lys Pro Asn Asp Trp Thr Val Pro Lys Gly Cys 245 250 255 Phe Met Ala Asn Val Ala Asp Lys Ser Arg Phe Thr Asn Val Lys Gln 260 265 270 Phe Ile Ala Pro Glu Thr Ser Glu Gly Val Ser Leu Gln Leu Gly Asn 275 280 285 Thr Lys Asp Phe Ile Ile Ser Phe Asp Leu Lys Phe Leu Thr Asn Gly 290 295 300 Ser Val Ser Val Val Leu Glu Thr Thr Glu Lys Asn Gln Leu Phe Thr 305 310 315 320 Ile His Tyr Val Ser Asn Ala Gln Leu Ile Ala Phe Lys Glu Arg Asp 325 330 335 Ile Tyr Tyr Gly Ile Gly Pro Arg Thr Ser Trp Ser Thr Val Thr Arg 340 345 350 Asp Leu Val Thr Asp Leu Arg Lys Gly Val Gly Leu Ser Asn Thr Lys 355 360 365 Ala Val Lys Pro Thr Lys Ile Met Pro Lys Lys Val Val Arg Leu Ile 370 375 380 Ala Lys Gly Lys Gly Phe Leu Asp Asn Ile Thr Ile Ser Thr Thr Ala 385 390 395 400 His Met Ala Ala Phe Phe Ala Ala Ser Asp Trp Leu Val Arg Asn Gln 405 410 415 Asp Glu Lys Gly Gly Trp Pro Ile Met Val Thr Arg Lys Leu Gly Glu 420 425 430 Gly Phe Lys Ser Leu Glu Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly 435 440 445 Gln Ala Ile Ser Thr Leu Val Arg Ala Tyr Leu Leu Thr Lys Asp His 450 455 460 Ile Phe Leu Asn Ser Ala Leu Arg Ala Thr Ala Pro Tyr Lys Phe Leu 465 470 475 480 Ser Glu Gln His Gly Val Lys Ala Val Phe Met Asn Lys His Asp Trp 485 490 495 Tyr Glu Glu Tyr Pro Thr Thr Pro Ser Ser Phe Val Leu Asn Gly Phe 500 505 510 Met Tyr Ser Leu Ile Gly Leu Tyr Asp Leu Lys Glu Thr Ala Gly Glu 515 520 525 Lys Leu Gly Lys Glu Ala Arg Ser Leu Tyr Glu Arg Gly Met Glu Ser 530 535 540 Leu Lys Ala Met Leu Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr 545 550 555 560 Asp Leu Arg His Phe Met Leu Gly Ile Ala Pro Asn Leu Ala Arg Trp 565 570 575 Asp Tyr His Thr Thr His Ile Asn Gln Leu Gln Leu Leu Ser Thr Ile 580 585 590 Asp Glu Ser Pro Val Phe Lys Glu Phe Val Lys Arg Trp Lys Ser Tyr 595 600 605 Leu Lys Gly Ser Arg Ala Lys His Asn 610 615 <210> 68 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfotransferase 3 <400> 68 Met Asp Glu Glu Glu Asp Met Val Ile Ile Tyr Asn Arg Val Pro His 1 5 10 15 Thr Ala Ser Thr Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Lys Tyr His Val Leu His Ile Asn Thr Thr Lys Asn Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Ile Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly His Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr His Leu Arg Phe 100 105 110 Gly Asp Asp Tyr Arg Pro Gly Leu Arg Arg Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Glu Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Met Asp Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Gln Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Asp Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Ile Arg Ala His Ala Val Arg Glu Lys Asp Gly Asp Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 69 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Engineered hexuronyl 2-O sulfotransferase mutant_sulfotransferase 4 <400> 69 Met Asp Glu Glu Glu Asp Met Val Ile Ile Tyr Asn Arg Val His Arg 1 5 10 15 Thr Ala Ser His Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Lys Tyr His Val Leu His Ile Asn Thr Thr Lys Gly Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Ile Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly Pro Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Phe Leu Arg Phe 100 105 110 Gly Ser Asp Lys Arg Pro Gly Leu Arg Met Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Glu Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Met Asp Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Gln Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Asp Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Ile Arg Ala His Ala Val Arg Glu Lys Asp Gly Asp Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 70 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 1 <400> 70 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gln Lys Thr 20 25 30 His Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Leu His Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu His Leu Pro Val His Arg Tyr Leu Ser 115 120 125 Glu Trp Arg His Val Gln Arg Gly Ala Thr Trp Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Ala Trp Phe Gly Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Val Lys Ser 245 250 255 Ser Arg Ala Ser Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 71 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 1 <400> 71 atgaagtact attttccggt ccgcgaattg gagcgctctc tgcgtttcga catgaaaggg 60 gatgacgtta ttgtattttt gcatatccag aagacgcacg ggacaacatt tggacgccat 120 ttagtgcaga acgtccgctt ggaagtacca tgcgattgtc gcccaggtca gaaaaaatgc 180 acatgttatc gcccaaaccg tcgtgaaact tggctgttca gccgcttttc taccggatgg 240 tcatgcggcc ttcatgcaga ctggacggaa ttgaccaatt gtgtcccagg agtcttggac 300 cgtcgtgacc cggcgggctt gcgtagccct cgtaaattct attatattac tttgttacac 360 ttacctgttc accgctactt gtccgagtgg cgtcatgtcc agcgcggtgc aacatggaaa 420 acctccctgc acatgtgtga cggtcgtacc ccgacaccgg aggaattacc tccgtgctac 480 gagggaaccg attggagtgg ttgcaccctt caagagttca tggactgtcc gtacaattta 540 gctaacaacc gccaagtccg tatgcttgct gacttaagtc tggtcggttg ttacaacctg 600 agctttattc ccgaatcgaa acgtgctcaa ctgcttctgg agtctgccaa aaagaatctg 660 cgtggaatgg ccttcttcgg cttggcttgg ttcggtcgca agacgcaata tttatttgaa 720 cgcaccttta acttgaaatt tatccgcccg ttcatgcagg taaagagtag tcgtgctagt 780 ggcgttgagg ttgacgagga tacgattcgt catatcgaag aattgaatga cttagacatg 840 cagctgtatg actacgccaa agacctgttc cagcagcgct accagtacaa acgtcagttg 900 gagcgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 72 <211> 295 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 2 <400> 72 Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr Gly 1 5 10 15 Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu Val 20 25 30 Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg Pro 35 40 45 Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp Ser 50 55 60 Cys Gly Thr Asn Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro Gly 65 70 75 80 Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys Phe 85 90 95 Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser Ala 100 105 110 Trp Arg His His Gln Arg Gly Gly Ser Asn Lys Thr Ser Leu His Met 115 120 125 Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr Glu 130 135 140 Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys Pro 145 150 155 160 Tyr Asn Leu Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu Ser 165 170 175 Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg Ala 180 185 190 Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala Phe 195 200 205 Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu Arg 210 215 220 Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser Thr 225 230 235 240 Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile Glu 245 250 255 Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp Leu 260 265 270 Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu Gln 275 280 285 Arg Leu Arg Asn Arg Glu Glu 290 295 <210> 73 <211> 888 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 2 <400> 73 atgaaaggcg acgacgtcat tgtattcctg catattggtc atacaggcgg aactacgttc 60 ggacgtcact tagttcaaaa tgtgcgtctg gaggtaccct gtgattgtcg tccaggacag 120 aaaaagtgca cttgttaccg ccctaatcgc cgtgagacgt ggctgttttc tcgttttagc 180 acaggctgga gttgcggcac gaacgccgac tggaccgagc ttacgaattg cgtaccaggt 240 gttttagatc gtcgtgatcc tgccggactt cgctccccgc gtaagtttta ctacatcacg 300 ttgcttcgcg acccagttag ccgctatttg agcgcttggc gtcaccatca acgcgggggc 360 tccaacaaga cttctttgca catgtgcgac gggcgcacgc cgacaccaga agaacttccg 420 ccgtgttatg aagggacgga ctggtctggt tgtacccttc aagagttcat ggattgcccg 480 tacaatctgg gcaataatcg tcaagtacgc atgttagcag accttagcct tgtagggtgc 540 tacaatttga gctttatccc tgagagtaaa cgtgctcagc ttttattaga gtccgccaaa 600 aagaatttac gtggtatggc atttttcgga ttgaccgagt tccagcgcaa aacccaatac 660 ttattcgaac gcacgtttaa cttgaaattc attcgtcctt tcatgcaata taattctacc 720 cgcgcggggg gcgtagaggt ggatgaggat acgatccgcc atatcgagga gcttaacgat 780 ttggacatgc agttatacga ctacgcgaaa gacttatttc aacaacgcta tcagtacaag 840 cgtcagcttg aacgccgcga gcagcgttta cgcaatcgtg aggaataa 888 <210> 74 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 3 <400> 74 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Ser His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Thr Arg Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser 115 120 125 Ala Trp Arg His His Gln Arg Gly Gly Thr Asn Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 75 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 3 <400> 75 atgaagtact attttccggt ccgcgaattg gagcgcagcc ttcgcttcga catgaaaggt 60 gatgatgtca tcgtattcct tcacatttca cacacaggcg gtactacttt cgggcgtcat 120 cttgtccaga atgttcgctt agaggtacca tgcgattgtc gtcccggaca aaagaaatgt 180 acttgctatc gtccgaaccg ccgtgaaaca tggcttttca gccgtttctc caccggatgg 240 tcatgtggca ctcgcgcaga ttggacggaa ctgacaaatt gcgttccagg cgttttggac 300 cgtcgtgacc cggccggtct tcgttcgcct cgtaagtttt attatatcac ccttttgcgc 360 gatcccgtgt cgcgttatct gagtgcttgg cgccaccacc aacgtggtgg taccaacaag 420 acatcactgc acatgtgtga tggtcgtact ccaacgcccg aagagctgcc cccttgctat 480 gaaggtacag attggtcggg gtgtactctt caggagttca tggactgtcc ctataatctg 540 gctaataatc gccaggtgcg tatgctggca gaccttagtc tggtcggttg ttacaacctg 600 agtttcatcc ccgaaagtaa gcgtgcacaa ctgcttttgg aaagcgccaa aaagaacctt 660 cgcggaatgg cttttttcgg tttgaccgaa tttcagcgca agactcagta cctgtttgag 720 cgtacattca acttaaagtt tattcgtccg tttatgcaat acaattccac acgcgcagga 780 ggtgtagagg ttgacgaaga cacaatccgt cacattgaag aattaaatga cttagatatg 840 cagctttacg attatgctaa agacctgttc cagcaacgtt atcagtacaa acgtcaactt 900 gaacgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 76 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 4 <400> 76 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Ala His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Thr Arg Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser 115 120 125 His Trp Arg His Met Gln Arg Gly Ala Asn Asn Ser Thr Gly Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 77 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 4 <400> 77 atgaagtact attttccggt ccgcgaattg gagcgctcct tacgtttcga tatgaaaggc 60 gacgacgtca ttgtttttct tcacattgct catacgggag gtacgacctt tggacgccat 120 ttagtgcaaa atgtccgttt agaggtaccc tgtgattgcc gtccaggtca aaagaaatgt 180 acgtgctatc gtcctaatcg tcgtgagact tggcttttta gccgtttctc cactggatgg 240 tcctgcggaa ctcgtgcgga ttggactgag ttaactaatt gtgtaccggg ggtgttggac 300 cgtcgtgacc ctgccggcct gcgtagtccg cgcaaatttt attacattac gttgcttcgc 360 gaccctgtga gccgctacct gtcccattgg cgtcacatgc aacgtggcgc aaacaactct 420 acaggcttgc acatgtgcga cggtcgtact ccaacgcctg aagaattgcc accatgttac 480 gagggcactg actggagtgg ctgcacttta caggaattta tggattgccc ctataatctg 540 ggtaataatc gtcaggtgcg tatgctggcg gatctgtcgt tggtaggatg ttacaacctt 600 tcgtttatcc ctgaatcaaa acgcgcgcag cttttacttg agtcggcgaa aaagaattta 660 cgcggtatgg ccttttttgg gcttaccgag ttccagcgca agacacagta tttgtttgag 720 cgcacgttca acttaaaatt tattcgcccc tttatgcaat acaattctac acgcgccggt 780 ggagtggagg ttgatgagga tacgatccgc cacatcgagg aactgaatga cctggacatg 840 caattatacg attatgcgaa agatcttttt cagcaacgct accaatacaa acgccaactt 900 gaacgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 78 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 5 <400> 78 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Thr Gln Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser 115 120 125 Ala Trp Arg His His Gln Arg Gly Gly Thr Asn Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 79 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 5 <400> 79 atgaagtact attttccggt ccgcgaattg gagcgctcct tacgtttcga catgaaaggc 60 gacgatgtaa tcgtgttcct tcatattggg cacaccgggg gcaccacatt tggccgccat 120 ctggtccaaa acgtccgttt agaggttccg tgtgactgcc gtcccggtca gaaaaaatgc 180 acctgctatc gccctaaccg ccgtgaaacc tggttgttct ctcgcttttc tactggctgg 240 tcgtgcggga cccaggctga ctggaccgag ttgacaaatt gcgtgcccgg tgttcttgat 300 cgtcgcgacc ctgcaggctt acgttcacca cgtaagtttt actacatcac gcttcttcgt 360 gatcccgtca gccgctatct tagtgcatgg cgtcatcacc aacgtggggg tactaacaaa 420 acttcattgc acatgtgcga cgggcgcacc cctacgccag aagaacttcc cccatgttat 480 gaagggacag attggagtgg ctgcaccctt caggagttta tggactgtcc gtataattta 540 gcaaataacc gtcaagtgcg tatgttagcg gatcttagtc tggtggggtg ttacaatttg 600 tcctttatcc ctgagagtaa gcgtgcccag ttgttgttgg agagtgcgaa gaaaaacttg 660 cgtgggatgg cgttcttcgg tctgactgaa tttcaacgta aaacgcagta tttgttcgaa 720 cgcactttca atttaaagtt tatccgtccc tttatgcagt acaatagcac gcgtgcaggc 780 ggcgtagaag tggatgagga caccattcgc catatcgaag aattaaacga tctggacatg 840 cagttatacg actatgctaa ggacttgttt cagcagcgct accaatataa acgccaactt 900 gaacgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 80 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 6 <400> 80 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Ser His Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser 115 120 125 Ala Trp Arg His His Gln Arg Gly Pro Ala Asn Thr Thr Gly Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 81 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 6 <400> 81 atgaagtact attttccggt ccgcgaattg gagcgctcac ttcgcttcga catgaaggga 60 gacgatgtaa tcgtcttcct tcacatcggg catacaggcg ggacgacttt cgggcgtcat 120 ttggtacaaa acgtacgttt agaggttccc tgtgattgcc gccctggaca aaagaaatgt 180 acctgctacc gcccgaaccg tcgtgaaaca tggttgttta gtcgcttctc gactggatgg 240 tcgtgcggct cccatgctga ttggacggag cttaccaatt gtgtgccagg tgtattagac 300 cgtcgtgacc cagcagggct gcgtagccca cgcaaattct attatattac attgcttcgc 360 gaccccgtgt cacgttatct gagcgcctgg cgtcaccatc aacgtggtcc tgcaaacacg 420 actggacttc acatgtgtga tggccgtacc cccacacccg aagagctgcc accgtgttac 480 gagggcacgg actggtctgg ctgtactctg caagaattta tggactgccc ctataattta 540 gctaacaacc gccaagtccg tatgctggct gacctgagct tggttggttg ctataatctt 600 agttttatcc cagaaagtaa acgcgcacaa ctgttattag aatctgcaaa gaaaaactta 660 cgcgggatgg cattttttgg cttgaccgaa tttcaacgca agacacaata ccttttcgaa 720 cgcaccttta atcttaaatt catccgtccc ttcatgcagt acaatagtac tcgtgcgggg 780 ggtgtcgaag tcgacgaaga tacgattcgc cacatcgaag aactgaacga cctggacatg 840 caattatacg attatgctaa agacttattt caacaacgtt accaatacaa gcgtcaactt 900 gaacgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 82 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 7 <400> 82 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Thr Arg Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser 115 120 125 Ala Trp Arg His His Gln Arg Gly Gly Thr Asn Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 83 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 7 <400> 83 atgaagtact attttccggt ccgcgaattg gagcgtagct tacgcttcga catgaaaggt 60 gacgatgtga ttgtcttcct gcacatcggt cataccgggg gtacaacgtt cggtcgccac 120 ttagtccaaa atgttcgctt ggaggttcct tgcgattgtc gtccagggca gaagaaatgt 180 acatgttacc gtcccaaccg tcgtgagact tggttattta gtcgcttttc gactggctgg 240 tcctgcggca cgcgcgcaga ttggactgaa ctgacaaatt gtgtaccagg agtgttggat 300 cgtcgtgatc ccgccggatt acgctctccg cgtaagttct attacattac tttgctgcgc 360 gatccagtgt cacgctattt gtcggcatgg cgtcatcacc agcgtggcgg tacgaacaag 420 acgtccttgc acatgtgtga tggacgcact cccaccccgg aggagctgcc cccatgctac 480 gaagggactg attggagtgg gtgtacatta caggaattta tggactgccc gtacaacctt 540 gccaataacc gccaagtacg catgctggca gatttgagcc tggtcggttg ctataacctt 600 tcttttatcc cagaatctaa gcgtgctcaa cttttattgg agagtgcgaa gaagaattta 660 cgcggaatgg ccttttttgg cctgacagaa ttccaacgca aaacccaata tttattcgag 720 cgcacgttta acttgaagtt cattcgtcct ttcatgcaat ataatagcac acgtgccggg 780 ggagtcgagg tcgacgaaga tactattcgt catattgaag agctgaatga tcttgacatg 840 caactttacg attacgccaa ggatttgttt caacagcgct accaatacaa gcgtcaactt 900 gaacgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 84 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 8 <400> 84 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Ser His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Thr Asn Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser 115 120 125 Ala Trp Arg His His Gln Arg Gly Gly Gly Asn Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 85 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 8 <400> 85 atgaagtact attttccggt ccgcgaattg gagcgctcat tgcgtttcga tatgaagggc 60 gacgacgtga tcgtgttttt acacatctcc cacactggag gcaccacttt tggccgtcat 120 ttggttcaga atgtacgtct ggaggtacca tgtgactgtc gtcctggaca aaaaaaatgc 180 acttgttatc gcccgaaccg tcgtgaaact tggctgttct ctcgcttttc aaccggatgg 240 tcgtgtggga caaatgcgga ctggacagag cttacaaatt gtgttcccgg cgtgttggac 300 cgtcgcgatc ctgcgggatt gcgttcgccg cgcaagttct actacattac cttactgcgc 360 gatccggtat cccgttacct gtcagcctgg cgccatcacc agcgtggcgg cggaaataaa 420 acgtcgttac acatgtgcga tggtcgtacg ccaacacccg aggaattgcc tccatgttat 480 gagggcacgg actggtccgg ctgcacactt caagagttta tggactgccc atataattta 540 gcaaataatc gccaagttcg catgttggct gacttgagcc ttgtcggctg ttacaattta 600 tcattcattc ccgaatcgaa gcgtgctcag ctgctgcttg aaagtgcaaa gaaaaatttg 660 cgtggcatgg cgttttttgg tttaacggaa tttcaacgta aaacacaata tttgttcgag 720 cgtacgttta accttaaatt catccgcccc ttcatgcagt ataattcaac acgcgctggt 780 ggagtggagg ttgatgaaga cacaattcgt catattgagg agcttaacga cttagatatg 840 cagttgtatg attacgcaaa ggatttattc caacagcgtt atcagtacaa gcgtcagctt 900 gaacgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 86 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 9 <400> 86 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu Gly Ile Ala His Thr 20 25 30 Gly Gly Ala Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Gly 65 70 75 80 Ser Cys Gly Ala Asn Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser 115 120 125 Met Trp Arg His His Gln Arg Gly Ala Thr His Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 87 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 9 <400> 87 atgaagtact attttccggt ccgcgaattg gagcgctcat tgcgttttga tatgaaagga 60 gacgacgtca tcgtattttt gggcattgcc catacgggag gcgcgacatt cggacgccac 120 ctggtccaaa acgttcgcct ggaagttccc tgtgactgtc gcccaggtca gaagaagtgt 180 acgtgctatc gccccaaccg ccgtgagacg tggctttttt cgcgtttctc cactggtggc 240 tcctgtgggg caaatgccga ctggactgag ttgacaaatt gcgtgccagg tgttctggat 300 cgccgcgacc ccgccggact tcgctcacca cgtaagtttt attacatcac tttgttgcgc 360 gacccagtgt cccgttacct gtctatgtgg cgtcaccatc agcgtggtgc gacacataaa 420 acgtcgctgc acatgtgcga tggacgcacg ccgactccag aggagttgcc tccatgctac 480 gagggcacgg attggagcgg ctgcactttg caagagttta tggattgccc ttataatttg 540 gcgaacaacc gtcaagtgcg tatgttagct gatttgagtt tagttggctg ctacaatctt 600 tcctttattc ccgaatcaaa acgcgctcag ctgctgttgg agagtgcgaa gaagaacctt 660 cgcgggatgg cattttttgg ccttacagag tttcaacgca agactcagta tttgtttgag 720 cgtacgttca atttgaaatt catccgtcct tttatgcagt ataatagcac ccgcgccggc 780 ggcgttgaag tagatgagga cactattcgt cacattgaag agcttaatga tctggacatg 840 cagttatatg actatgcaaa agatttattt caacagcgct atcagtacaa acgtcaactt 900 gaacgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 88 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 10 <400> 88 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Thr Arg Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser 115 120 125 Ala Trp Arg His His Gln Arg Gly Ala Ser Asn Ser Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 89 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 10 <400> 89 atgaagtact attttccggt ccgcgaatta gagcgctcat tgcgttttga catgaagggg 60 gatgacgtta ttgtgttcct tcatatcggc cacacaggcg ggactacgtt cggtcgccat 120 cttgtgcaga atgtccgttt ggaggtacct tgtgactgcc gtccggggca gaaaaaatgt 180 acctgctatc gcccaaatcg ccgtgaaacg tggttattct ctcgttttag tactggatgg 240 tcgtgtggaa cccgcgctga ctggacagag cttacaaact gcgtaccagg cgtgctggac 300 cgccgtgacc ctgcgggtct tcgtagtccc cgcaagttct attatattac tcttcttcgt 360 gatccagtaa gccgttatct gagtgcttgg cgccatcacc aacgcggtgc ttcaaattcc 420 acaagccttc acatgtgcga tgggcgtact ccgaccccgg aagagcttcc gccctgttac 480 gaaggtacag attggtccgg ttgtacgctg caggaattta tggactgtcc atacaactta 540 ggcaacaatc gccaggtacg catgcttgcg gatctgagtc tggtcggttg ctacaacttg 600 tcttttatcc cagaatctaa acgcgcccaa ttactgttag aaagtgcgaa gaagaacctt 660 cgtggcatgg ccttctttgg acttacggag ttccagcgta agactcaata cctgttcgag 720 cgtacattta atcttaaatt cattcgtcca ttcatgcaat ataattctac gcgcgcaggc 780 ggcgtggagg tcgatgaaga tacgatccgt catatcgagg aactgaatga tctggacatg 840 cagttatatg actacgcgaa agaccttttc caacagcgct accaatacaa gcgtcaatta 900 gagcgccgtg agcagcgttt acgcaatcgt gaggaataa 939 <210> 90 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 11 <400> 90 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gln Lys Thr 20 25 30 His Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Leu His Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu His His Pro Val His Arg Tyr Leu Ser 115 120 125 Glu Trp Arg His Val Gln Arg Gly Ala Thr Trp Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Ala Trp Phe Gly Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Val Lys Ser 245 250 255 Ser Arg Ala Ser Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 91 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 11 <400> 91 atgaagtact attttccggt ccgcgaattg gagcgctcat tgcgttttga tatgaaaggt 60 gacgacgtaa ttgtgtttct tcatattcag aagacccatg gcacaacatt tggtcgccat 120 cttgtgcaaa atgtgcgttt agaggtgccg tgtgactgcc gtccaggtca aaagaaatgc 180 acctgctatc gtccaaatcg tcgcgaaacg tggcttttct cccgtttcag cacgggttgg 240 tcctgcggct tacatgcgga ctggactgaa ctgacaaact gtgtgccagg agtgcttgat 300 cgccgcgatc cagcggggct tcgctcgccg cgcaagtttt actatatcac ccttctgcac 360 catccggtac accgctattt gagcgagtgg cgtcacgtcc agcgcggggc aacgtggaag 420 accagtttac acatgtgcga cggacgtacc cctacacccg aagagcttcc gccatgctat 480 gaagggacgg attggagtgg ctgtacgtta caggagttca tggattgtcc ctataatctg 540 gccaataatc gtcaagtgcg tatgttagcc gacctttcac tggttggttg ctataactta 600 tcattcattc cggagtctaa acgcgctcag cttttgcttg aatctgccaa aaagaatctt 660 cgtgggatgg ctttctttgg tttagcctgg tttgggcgca aaactcaata cttattcgag 720 cgtactttta atttgaaatt tattcgtccc tttatgcaag ttaagagtag ccgtgcatct 780 ggagtagagg tagacgaaga cactattcgt cacatcgagg agcttaatga tttggatatg 840 cagctgtacg attatgctaa agacttgttc caacagcgtt atcagtataa gcgtcagctt 900 gaacgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 92 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 12 <400> 92 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gln Lys Thr 20 25 30 His Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Leu His Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu His His Pro Val His Arg Tyr Leu Ser 115 120 125 Glu Trp Arg His Val Gln Arg Gly Ala Thr Trp Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Gly Trp Phe Gly Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Val Lys Ser 245 250 255 Asn Arg Ala Ser Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 93 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 12 <400> 93 atgaagtact attttccggt ccgcgaattg gagcgctcat tgcgtttcga catgaaaggt 60 gatgacgtaa tcgtatttct gcatatccaa aagacacatg gcacaacttt tggacgccat 120 ctggtccaga acgtccgtct ggaggttccg tgtgactgtc gtcccggtca aaagaaatgc 180 acatgctacc gtccaaatcg ccgtgagaca tggctttttt cccgctttag cacgggctgg 240 agctgcggct tacatgctga ctggaccgag cttactaact gtgtccccgg ggtccttgac 300 cgccgtgatc ctgctgggtt gcgctcacct cgcaaatttt attatatcac cttattgcac 360 catccagttc accgttactt gtcggaatgg cgtcacgtcc agcgtggagc gacttggaaa 420 acgtctcttc acatgtgtga tggccgtaca cccacgcccg aagagcttcc gccatgctat 480 gaaggcactg attggtcagg gtgcaccctt caagaattca tggattgccc atacaactta 540 gccaacaatc gccaggttcg tatgttagcg gatttgtcgt tagtaggttg ctacaatctg 600 tcttttattc ccgaatcgaa gcgcgctcaa ctgttgttag agtccgcgaa gaaaaatttg 660 cgtggtatgg cgttttttgg cttgggatgg tttgggcgta agactcagta tcttttcgaa 720 cgtactttta atcttaagtt tattcgcccc ttcatgcaag ttaagtcaaa ccgcgcctca 780 ggcgtagagg tagatgaaga cacgattcgt cacatcgaag agcttaatga cttagatatg 840 caactttatg actatgccaa agatttattt cagcagcgtt accaatacaa acgtcagctt 900 gaacgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 94 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 13 <400> 94 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gln Lys Thr 20 25 30 His Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Leu His Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu His Lys Pro Val His Arg Tyr Leu Ser 115 120 125 Glu Trp Arg His Val Gln Arg Gly Ala Thr Trp Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Gly Trp Phe Gly Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Val Lys Ser 245 250 255 Ser Arg Ala Ser Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 95 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 13 <400> 95 atgaagtact attttccggt ccgcgaattg gagcgctcat tgcgttttga tatgaagggt 60 gatgatgtta ttgtttttct gcacatccaa aagacacacg ggacaacctt cggacgccac 120 ttggtgcaga acgttcgcct ggaagtacca tgcgattgtc gtcccgggca aaagaaatgc 180 acctgttacc gtcccaatcg tcgtgagacg tggttattta gccgtttttc caccgggtgg 240 agctgtggac ttcacgcaga ctggacagag ttaaccaact gtgtacccgg tgttttggac 300 cgccgcgacc cagcggggct gcgttctcca cgtaaattct actatattac acttctgcat 360 aagcccgtac accgttatct gagtgaatgg cgtcacgtcc agcgcggggc gacctggaag 420 acgagcctgc acatgtgcga tggtcgtacg cccactcctg aagaattacc tccctgttat 480 gagggaactg actggtcagg gtgtacatta caggagttta tggactgtcc ctataatctt 540 gctaataatc gtcaagttcg catgcttgct gacttatcat tggtggggtg ctataattta 600 tcgttcattc ctgaaagcaa acgcgcccaa ttgcttcttg agtcggctaa gaagaactta 660 cgcggtatgg ctttctttgg tttgggctgg tttggacgta aaactcaata tttgttcgag 720 cgtaccttta acttaaagtt tatccgccct tttatgcagg ttaaatccag ccgcgcatcg 780 ggagtagaag tcgatgagga tacgattcgc catatcgaag aattgaacga tctggacatg 840 caactttatg actacgctaa agatttattc caacaacgct atcagtataa acgccagctt 900 gaacgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 96 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 14 <400> 96 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gln Lys Thr 20 25 30 His Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Leu His Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu His Asp Pro Val His Arg Tyr Leu Ser 115 120 125 Glu Trp Arg His Val Gln Arg Gly Ala Thr Trp Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Gly Arg Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Val Thr Asn Ser 245 250 255 Ser Arg Ala Ser Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 97 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 14 <400> 97 atgaagtact attttccggt ccgcgaattg gagcgctcat tgcgtttcga tatgaaaggg 60 gatgatgtta ttgtgttcct gcatattcaa aaaacgcatg gcactacatt tggtcgtcat 120 ttagttcaga atgtgcgttt agaagtgccg tgtgactgtc gccctgggca gaaaaagtgc 180 acctgttacc gccctaatcg ccgtgagacg tggttgttca gtcgcttctc tactggctgg 240 tcgtgcggcc ttcatgccga ctggactgag cttacaaatt gcgttccagg tgtattagat 300 cgccgcgatc ccgctgggct gcgctcccca cgcaagtttt attatatcac tcttttacac 360 gatccagttc atcgttatct ttcagaatgg cgccacgtgc aacgcggggc gacgtggaaa 420 acgtctcttc acatgtgcga cggtcgcact cccacgcctg aagaattgcc gccctgctat 480 gaaggaacag attggagcgg ttgcacgtta caagaattca tggattgccc ctataactta 540 gctaacaacc gtcaagtacg tatgcttgcc gacctgtccc ttgtagggtg ctacaatttg 600 tcctttattc ccgagtcaaa gcgcgctcaa cttttgttgg aaagtgcaaa aaaaaacctg 660 cgtggaatgg ctttcttcgg actgggtcgt tttcaacgta agacgcagta tttattcgag 720 cgcacgttca atttgaaatt catccgcccg tttatggtca ctaattcatc ccgcgcgagc 780 ggggtcgagg tggacgagga tactatccgc catatcgaag agcttaacga cttggatatg 840 cagttgtacg attatgccaa agatcttttt caacagcgct accaatacaa gcgtcagctt 900 gaacgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 98 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 15 <400> 98 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Ala His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Gly 65 70 75 80 Ser Cys Gly Ala Ala Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser 115 120 125 Met Trp Arg His His Gln Arg Gly Ala Thr His Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 99 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 15 <400> 99 atgaagtact attttccggt ccgcgaattg gagcgctcat tgcgttttga tatgaagggg 60 gatgacgtga tcgtttttct tcatattgct catactggtg gcacgacatt cggtcgccat 120 ttggtccaga acgtccgtct tgaggtgcca tgcgattgcc gtcctggcca gaagaagtgc 180 acgtgttatc gtccgaaccg ccgtgagact tggttgttta gtcgcttttc aactggcggt 240 tcgtgcggcg ccgcagcgga ttggacagaa ttaaccaatt gtgtacccgg tgttttagat 300 cgtcgcgatc cagcgggatt acgttcgccc cgtaagttct attatattac tctgttacgc 360 gatccagtct cacgctatct gtcgatgtgg cgccatcatc aacgtggggc tactcataag 420 acttcgttac acatgtgtga cggccgtact ccgaccccgg aagaacttcc accctgctac 480 gaaggcaccg actggtctgg atgtacgctg caggaattta tggattgtcc gtacaacttg 540 gctaacaacc gtcaagtgcg tatgttggct gatctttcat tagtcggatg ctacaacttg 600 tcgttcatcc cagaaagcaa acgtgcacag cttctgcttg agtccgccaa gaaaaatttg 660 cgtggtatgg ccttctttgg attgacagag ttccagcgca aaacgcagta tcttttcgag 720 cgtaccttca acctgaaatt tatccgcccg ttcatgcaat acaattccac tcgcgcaggg 780 ggtgttgaag tagacgagga tacgattcgt catatcgagg aattgaatga cctggatatg 840 cagctgtatg actacgcgaa agatttgttc cagcagcgct accagtacaa acgtcagctt 900 gaacgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 100 <211> 295 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 16 <400> 100 Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr Gly 1 5 10 15 Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu Val 20 25 30 Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg Pro 35 40 45 Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp Ser 50 55 60 Cys Gly Thr Arg Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro Gly 65 70 75 80 Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys Phe 85 90 95 Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser Ala 100 105 110 Trp Arg His His Gln Arg Gly Ala Thr Gly Lys Thr Ser Leu His Met 115 120 125 Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr Glu 130 135 140 Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys Pro 145 150 155 160 Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu Ser 165 170 175 Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg Ala 180 185 190 Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala Phe 195 200 205 Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu Arg 210 215 220 Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser Thr 225 230 235 240 Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile Glu 245 250 255 Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp Leu 260 265 270 Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu Gln 275 280 285 Arg Leu Arg Asn Arg Glu Glu 290 295 <210> 101 <211> 888 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 16 <400> 101 atgaaaggtg atgatgtgat cgtttttttg catatcgggc acacaggggg gactaccttc 60 gggcgtcatc tggtgcagaa cgtacgcctt gaggtaccat gtgattgtcg ccccgggcaa 120 aaaaagtgca cttgttatcg ccctaaccgt cgtgaaactt ggttattttc ccgcttttcg 180 acagggtgga gttgtggtac acgcgctgac tggacagagt tgaccaactg cgtcccaggg 240 gtacttgacc gtcgtgaccc tgctggactg cgcagcccac gtaagttcta ctacattacg 300 ttactgcgtg atcctgtatc acgttacctg tctgcctggc gccatcacca gcgcggagcg 360 acagggaaga catctctgca catgtgtgac ggacgtactc cgacgccaga agagttaccc 420 ccgtgctatg aaggtactga ttggtcgggg tgcaccctgc aagaattcat ggactgcccg 480 tacaacctgg ctaacaaccg tcaagtgcgt atgttagcgg acctgagttt ggtgggatgc 540 tacaatctga gctttatccc tgagtctaag cgcgcacagt tactgcttga atcggcgaaa 600 aagaatctgc gtggcatggc gttcttcggg ctgacggaat ttcagcgtaa aacacaatac 660 ctttttgagc gcacgtttaa cttgaagttt attcgcccgt ttatgcagta caactccacc 720 cgcgcagggg gcgtcgaggt cgatgaagat acaattcgcc atattgagga gttgaacgat 780 cttgatatgc aattatacga ttacgctaaa gacttgtttc aacagcgcta tcaatacaaa 840 cgtcagttgg aacgccgcga gcagcgttta cgcaatcgtg aggaataa 888 <210> 102 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 17 <400> 102 Met Arg Tyr Asn Phe Ser Arg Gly Asp Leu Leu Arg Lys Val Asp Phe 1 5 10 15 Asp Ile Lys Gly Asp Asp Leu Ile Val Phe Leu His Ile Gln Lys Thr 20 25 30 His Gly Thr Gln Phe Gly Arg His Leu Val Arg Asn Ile Gln Leu Glu 35 40 45 Gln Pro Cys Glu Cys Arg Val Gly Gln Lys Lys Cys Thr Cys His Arg 50 55 60 Pro Gly Lys Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Leu His Ala Asp Trp Thr Glu Leu Thr Ser Cys Val Pro 85 90 95 Ala Val Val Asp Gly Lys Arg Asp Ala Arg Leu Arg Pro Ser Arg Asn 100 105 110 Phe His Tyr Ile Thr Ile Leu Arg Asp Pro Val His Arg Tyr Leu His 115 120 125 Glu Trp Arg His Val Gln Arg Gly Ala Thr Trp Lys Ala Ser Leu His 130 135 140 Val Cys Asp Gly Arg Pro Pro Thr Ser Glu Glu Leu Pro Ser Cys Tyr 145 150 155 160 Thr Gly Asp Asp Trp Ser Gly Cys Pro Leu Lys Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ser Asp Leu 180 185 190 Thr Leu Val Gly Cys Tyr Asn Leu Ser Val Met Pro Glu Lys Gln Arg 195 200 205 Asn Lys Val Leu Leu Glu Ser Ala Lys Ser Asn Leu Lys His Met Ala 210 215 220 Phe Phe Gly Leu Gly Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Lys Thr Phe Asn Met Asn Phe Ile Ser Pro Phe Thr Gln Thr Asn Thr 245 250 255 Ser Arg Ala Ser Ser Val Glu Ile Asn Glu Glu Ile Gln Lys Arg Ile 260 265 270 Glu Gly Leu Asn Phe Leu Asp Met Glu Leu Tyr Ser Tyr Ala Lys Asp 275 280 285 Leu Phe Leu Gln Arg Tyr Gln Phe Met Arg Gln Lys Glu His Gln Asp 290 295 300 Ala Arg Arg Lys Arg Gln Glu Gln 305 310 <210> 103 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfatase 17 <400> 103 atgcgctata acttcagtcg tggggacctt ttacgtaaag tggatttcga tatcaaagga 60 gacgatctta ttgtgttctt acatattcaa aaaacacatg gcacgcagtt cgggcgtcac 120 ttagtccgta acatccagct tgaacagccg tgtgagtgcc gtgtgggaca aaaaaaatgc 180 acttgccacc gcccaggaaa acgcgagacc tggctgtttt cgcgcttttc tactggttgg 240 tcttgcggat tacatgctga ttggacagag ttgacgtcat gcgttccggc agttgtagat 300 ggaaaacgcg atgctcgcct gcgcccgtcg cgtaatttcc attacattac gatcctgcgt 360 gatccagttc accgttacct tcatgagtgg cgccatgtac agcgcggtgc tacgtggaag 420 gcatcgttgc acgtatgtga tggccgtccc ccaacatcgg aggagctgcc ctcatgttat 480 actggcgatg actggtctgg ctgccccctg aaggagttta tggattgtcc ctacaacctg 540 gccaataacc gtcaggttcg tatgttgtca gatttaacat tagtaggttg ttacaatctg 600 tcagtaatgc cagaaaagca acgtaataag gtgctgctgg aaagtgctaa gtcaaactta 660 aagcacatgg ccttctttgg ccttggagaa tttcagcgta aaacacaata cttgtttgag 720 aagacgttta atatgaactt tatctccccc tttacgcaga ctaacacctc ccgtgcttca 780 tctgtagaaa tcaatgagga aattcaaaag cgcattgagg gattgaactt tttagatatg 840 gagttatatt cttacgcaaa ggatttgttc ttgcagcgtt atcaatttat gcgtcaaaaa 900 gaacatcaag acgcacgtcg taagcgtcag gagcagtaa 939 <210> 104 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfotransferase 1 <400> 104 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Thr Asn Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Gly 115 120 125 Gly Trp Arg His His Gln Arg Gly Gly Thr Asn Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 105 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfotransferase 1 <400> 105 atgaagtact attttccggt ccgcgaattg gagcgctcac tgcgttttga tatgaagggt 60 gacgatgtga ttgtattcct tcatattggg catacaggcg ggacgacttt tggacgtcat 120 ttagtccaga acgttcgtct ggaggtaccc tgtgattgcc gcccgggtca aaaaaaatgc 180 acgtgttacc gcccaaatcg ccgtgagacc tggttgttct ctcgcttttc cacaggctgg 240 tcttgcggaa ctaacgccga ctggacagag cttaccaact gtgtcccagg ggtattggac 300 cgccgtgatc cagctgggtt gcgctcgcca cgtaaatttt actatattac cctgctgcgc 360 gatcctgtct cccgctacct ggggggctgg cgccaccatc agcgtggcgg cacaaataaa 420 acatcgttgc acatgtgtga tgggcgcacg ccaacacccg aagagcttcc cccgtgctat 480 gagggaacgg actggagtgg atgtacttta caggaattta tggactgtcc ctacaatttg 540 gcaaacaatc gtcaagtccg catgcttgcg gatcttagtt tggtcggctg ttacaacttg 600 agctttattc ccgaaagtaa gcgcgcacaa cttttattag agagtgccaa gaagaacttg 660 cgtggaatgg cattctttgg attgaccgaa tttcagcgta aaacgcagta tttgtttgaa 720 cgtacattca acctgaaatt tatccgcccg tttatgcagt ataacagtac gcgcgcgggg 780 ggcgtggaag tggacgagga cacgattcgc cacattgagg aattgaatga ccttgatatg 840 caattgtacg actacgccaa agatcttttc cagcaacgtt atcaatacaa gcgccagctt 900 gaacgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 106 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfotransferase 2 <400> 106 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Thr Arg Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser 115 120 125 His Trp Arg His Thr Gln Arg Gly Gly Ala Asn Lys Thr Gly Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 107 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfotransferase 2 <400> 107 atgaagtact attttccggt ccgcgaattg gagcgctcat tgcgtttcga tatgaagggt 60 gatgatgtca tcgtcttcct tcacattggt cacactggtg gaaccacctt tggacgtcat 120 cttgtgcaaa acgtacgttt agaggtccct tgcgattgtc gtccgggtca aaaaaaatgt 180 acttgctatc gtcctaatcg tcgtgaaacg tggcttttca gtcgttttag tacggggtgg 240 tcatgcggta cccgcgcaga ctggacggag ttaaccaact gcgtacctgg ggtgttggat 300 cgccgcgatc cggcaggttt acgctcccca cgtaaattct attatattac cctgttacgt 360 gacccagtca gtcgctattt gtctcactgg cgtcacacac aacgtggcgg cgcgaacaag 420 accggactgc acatgtgtga cgggcgtact cctacaccag aggaattacc cccatgctat 480 gagggaactg actggtcggg atgtacactg caggagttca tggactgccc atacaatctg 540 gggaataatc gccaagtccg tatgttggcg gatttaagcc ttgtcggatg ctataatttg 600 tcattcattc cagaatcaaa acgcgcgcaa cttcttcttg agtcagccaa gaaaaatttg 660 cgcggaatgg catttttcgg gttgacagaa tttcagcgca aaacacaata tctgttcgag 720 cgcacattca atttaaaatt tattcgtcct ttcatgcaat acaactctac acgtgcagga 780 ggagtcgaag tggacgagga cacaattcgc cacatcgagg aattaaatga tctggatatg 840 cagttgtatg actatgcaaa agatctgttt cagcaacgct atcaatacaa gcgtcagttg 900 gaacgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 108 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfotransferase 3 <400> 108 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Ser His Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser 115 120 125 Gly Trp Arg His His Gln Arg Gly Gly Ala Asn Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 109 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 6-O sulfotransferase mutant_sulfotransferase 3 <400> 109 atgaagtact attttccggt ccgcgaattg gagcgctcat tgcgtttcga catgaaagga 60 gacgacgtca ttgtattttt acatattggc cacaccggtg gcacgacttt tggccgtcac 120 ttagtccaaa acgtacgctt agaggtgcct tgcgactgtc gtccagggca aaagaaatgc 180 acctgctatc gccccaaccg ccgtgaaaca tggttgttta gtcgctttag taccggttgg 240 agctgtggct ctcatgctga ttggactgaa ctgacgaatt gtgtccccgg agtattggat 300 cgccgtgatc ctgctggttt acgctcacct cgcaaattct attatattac gttacttcgt 360 gatcccgtta gccgttatct tagtgggtgg cgtcaccatc aacgcggagg ggctaataag 420 acgagcctgc acatgtgtga cggacgtacg ccaacccccg aggaactgcc gccctgttac 480 gaggggacgg actggtctgg ctgtacatta caagagttta tggattgccc atataacctg 540 ggtaacaatc gccaagtccg tatgttggcg gatctttcgc tggtgggatg ttataattta 600 agttttatcc cggagagcaa gcgtgcacag ttgctgcttg aatcagcgaa gaagaacctt 660 cgcggaatgg catttttcgg tttaacggag tttcaacgta agactcagta ccttttcgag 720 cgtaccttca acttgaaatt tatccgtccc ttcatgcagt acaactccac ccgcgctggt 780 ggagttgaag tcgacgagga taccatccgc cacattgaag aacttaatga cttagatatg 840 caattgtacg actatgctaa ggacttattc cagcaacgtt atcagtacaa acgccaattg 900 gaacgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 110 <211> 295 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_variable 1 <220> <221> MISC_FEATURE <222> (11)..(11) <223> Xaa is glycine or histidine <220> <221> MISC_FEATURE <222> (13)..(13) <223> Xaa is glycine, alanine, serine, or glutamine <220> <221> MISC_FEATURE <222> (14)..(14) <223> Xaa is histidine or lysine <220> <221> MISC_FEATURE <222> (16)..(16) <223> Xaa is histidine or glycine <220> <221> MISC_FEATURE <222> (18)..(18) <223> Xaa is alanine or threonine <220> <221> MISC_FEATURE <222> (63)..(63) <223> Xaa is glycine or tryptophan <220> <221> MISC_FEATURE <222> (67)..(67) <223> Xaa is threonine, serine, leucine, or alanine <220> <221> MISC_FEATURE <222> (68)..(68) <223> Xaa is asparagine, arginine, glutamine, histidine, or alanine <220> <221> MISC_FEATURE <222> (103)..(103) <223> Xaa is histidine or arginine <220> <221> MISC_FEATURE <222> (104)..(104) <223> Xaa is histidine, lysine, leucine, or aspartic acid <220> <221> MISC_FEATURE <222> (107)..(107) <223> Xaa is histidine or serine <220> <221> MISC_FEATURE <222> (111)..(111) <223> Xaa is glycine or serine <220> <221> MISC_FEATURE <222> (112)..(112) <223> Xaa is alanine, histidine, glutamic acid, methionine, or glycine <220> <221> MISC_FEATURE <222> (116)..(116) <223> Xaa is histidine, methionine, valine, or threonine <220> <221> MISC_FEATURE <222> (120)..(120) <223> Xaa is glycine, alanine, or proline <220> <221> MISC_FEATURE <222> (121)..(121) <223> Xaa is serine, threonine, asparagine, or alanine <220> <221> MISC_FEATURE <222> (122)..(122) <223> Xaa is asparagine, tryptophan, histidine, or glycine <220> <221> MISC_FEATURE <222> (123)..(123) <223> Xaa is serine, lysine, or threonine <220> <221> MISC_FEATURE <222> (125)..(125) <223> Xaa is glycine or serine <220> <221> MISC_FEATURE <222> (164)..(164) <223> Xaa is glycine or alanine <220> <221> MISC_FEATURE <222> (212)..(212) <223> Xaa is alanine, glycine, or threonine <220> <221> MISC_FEATURE <222> (213)..(213) <223> Xaa is valine, arginine, or glutamic acid <220> <221> MISC_FEATURE <222> (215)..(215) <223> Xaa is glycine or glutamine <220> <221> MISC_FEATURE <222> (236)..(236) <223> Xaa is valine or glutamine <220> <221> MISC_FEATURE <222> (237)..(237) <223> Xaa is valine, threonine, or tyrosine <220> <221> MISC_FEATURE <222> (238)..(238) <223> Xaa is lysine or asparagine <220> <221> MISC_FEATURE <222> (240)..(240) <223> Xaa is serine, asparagine, or threonine <220> <221> MISC_FEATURE <222> (243)..(243) <223> Xaa is serine or glycine <400> 110 Met Lys Gly Asp Asp Val Ile Val Phe Leu Xaa Ile Xaa Xaa Thr Xaa 1 5 10 15 Gly Xaa Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu Val 20 25 30 Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg Pro 35 40 45 Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Xaa Ser 50 55 60 Cys Gly Xaa Xaa Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro Gly 65 70 75 80 Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys Phe 85 90 95 Tyr Tyr Ile Thr Leu Leu Xaa Xaa Pro Val Xaa Arg Tyr Leu Xaa Xaa 100 105 110 Trp Arg His Xaa Gln Arg Gly Xaa Xaa Xaa Xaa Thr Xaa Leu His Met 115 120 125 Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr Glu 130 135 140 Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys Pro 145 150 155 160 Tyr Asn Leu Xaa Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu Ser 165 170 175 Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg Ala 180 185 190 Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala Phe 195 200 205 Phe Gly Leu Xaa Xaa Phe Xaa Arg Lys Thr Gln Tyr Leu Phe Glu Arg 210 215 220 Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Xaa Xaa Xaa Ser Xaa 225 230 235 240 Arg Ala Xaa Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile Glu 245 250 255 Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp Leu 260 265 270 Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu Gln 275 280 285 Arg Leu Arg Asn Arg Glu Glu 290 295 <210> 111 <211> 411 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_variable 2 <220> <221> MISC_FEATURE <222> (93)..(93) <223> Xaa is glycine or histidine <220> <221> MISC_FEATURE <222> (95)..(95) <223> Xaa is glycine, serine, alanine, or glutamine <220> <221> MISC_FEATURE <222> (96)..(96) <223> Xaa is histidine or lysine <220> <221> MISC_FEATURE <222> (98)..(98) <223> Xaa is histidine or glycine <220> <221> MISC_FEATURE <222> (100)..(100) <223> Xaa is alanine or threonine <220> <221> MISC_FEATURE <222> (145)..(145) <223> Xaa is glycine or tryptophan <220> <221> MISC_FEATURE <222> (149)..(149) <223> Xaa is threonine, serine, leucine, or alanine <220> <221> MISC_FEATURE <222> (150)..(150) <223> Xaa is asparagine, arginine, glutamine, histidine, or alanine <220> <221> MISC_FEATURE <222> (185)..(185) <223> Xaa is histidine or arginine <220> <221> MISC_FEATURE <222> (186)..(186) <223> Xaa is histidine, lysine, leucine, or aspartic acid <220> <221> MISC_FEATURE <222> (189)..(189) <223> Xaa is histidine or serine <220> <221> MISC_FEATURE <222> (193)..(193) <223> Xaa is glycine or serine <220> <221> MISC_FEATURE <222> (194)..(194) <223> Xaa is alanine, histidine, glutamic acid, methionine, or glycine <220> <221> MISC_FEATURE <222> (198)..(198) <223> Xaa is histidine, methionine, valine, or threonine <220> <221> MISC_FEATURE <222> (202)..(202) <223> Xaa is glycine, alanine, pr proline <220> <221> MISC_FEATURE <222> (203)..(203) <223> Xaa is serine, threonine, asparagine, or alanine <220> <221> MISC_FEATURE <222> (204)..(204) <223> Xaa is asparagine, tryptophan, histidine, or glycine <220> <221> MISC_FEATURE <222> (205)..(205) <223> Xaa is serine, lysine, or threonine <220> <221> MISC_FEATURE <222> (207)..(207) <223> Xaa is glycine or serine <220> <221> MISC_FEATURE <222> (246)..(246) <223> Xaa is glycine or alanine <220> <221> MISC_FEATURE <222> (294)..(294) <223> Xaa is alanine, glycine, or threonine <220> <221> MISC_FEATURE <222> (295)..(295) <223> Xaa is tryptophan, arginine, or glutamic acid <220> <221> MISC_FEATURE <222> (297)..(297) <223> Xaa is glycine or glutamine <220> <221> MISC_FEATURE <222> (318)..(318) <223> Xaa is valine or glutamine <220> <221> MISC_FEATURE <222> (319)..(319) <223> Xaa is valine, threonine, or tyrosine <220> <221> MISC_FEATURE <222> (320)..(320) <223> Xaa is lysine or asparagine <220> <221> MISC_FEATURE <222> (322)..(322) <223> Xaa is serine, asparagine, or threonine <220> <221> MISC_FEATURE <222> (325)..(325) <223> Xaa is serine or glycine <400> 111 Met Arg Arg Arg Arg Ala Gly Gly Arg Thr Met Val Glu Arg Ala Ser 1 5 10 15 Lys Phe Val Leu Val Val Ala Gly Ser Ala Cys Phe Met Leu Ile Leu 20 25 30 Tyr Gln Tyr Ala Gly Pro Gly Leu Ser Leu Gly Ala Pro Gly Gly Arg 35 40 45 Val Pro Pro Asp Asp Leu Asp Leu Phe Pro Thr Pro Asp Pro His Tyr 50 55 60 Glu Lys Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg 65 70 75 80 Phe Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu Xaa Ile Xaa Xaa 85 90 95 Thr Xaa Gly Xaa Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu 100 105 110 Glu Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr 115 120 125 Arg Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly 130 135 140 Xaa Ser Cys Gly Xaa Xaa Ala Asp Trp Thr Glu Leu Thr Asn Cys Val 145 150 155 160 Pro Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg 165 170 175 Lys Phe Tyr Tyr Ile Thr Leu Leu Xaa Xaa Pro Val Xaa Arg Tyr Leu 180 185 190 Xaa Xaa Trp Arg His Xaa Gln Arg Gly Xaa Xaa Xaa Xaa Thr Xaa Leu 195 200 205 His Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys 210 215 220 Tyr Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp 225 230 235 240 Cys Pro Tyr Asn Leu Xaa Asn Asn Arg Gln Val Arg Met Leu Ala Asp 245 250 255 Leu Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys 260 265 270 Arg Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met 275 280 285 Ala Phe Phe Gly Leu Xaa Xaa Phe Xaa Arg Lys Thr Gln Tyr Leu Phe 290 295 300 Glu Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Xaa Xaa Xaa 305 310 315 320 Ser Xaa Arg Ala Xaa Gly Val Glu Val Asp Glu Asp Thr Ile Arg His 325 330 335 Ile Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys 340 345 350 Asp Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg 355 360 365 Glu Gln Arg Leu Arg Asn Arg Glu Glu Arg Leu Leu His Arg Ser Lys 370 375 380 Glu Ala Leu Pro Arg Glu Asp Pro Glu Glu Pro Gly Arg Val Pro Thr 385 390 395 400 Glu Asp Tyr Met Ser His Ile Ile Glu Lys Trp 405 410 <210> 112 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfotransferase 4 <220> <221> MISC_FEATURE <222> (84)..(84) <223> Xaa is threonine or serine <220> <221> MISC_FEATURE <222> (85)..(85) <223> Xaa is asparagine, arginine, or histidine <220> <221> MISC_FEATURE <222> (128)..(128) <223> Xaa is glycine or serine <220> <221> MISC_FEATURE <222> (129)..(129) <223> Xaa is glycine or histidine <220> <221> MISC_FEATURE <222> (133)..(133) <223> Xaa is histidine or threonine <220> <221> MISC_FEATURE <222> (138)..(138) <223> Xaa is alanine or threonine <220> <221> MISC_FEATURE <222> (142)..(142) <223> Xaa is glycine or serine <220> <221> MISC_FEATURE <222> (181)..(181) <223> Xaa is glycine or alanine <400> 112 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Xaa Xaa Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Xaa 115 120 125 Xaa Trp Arg His Xaa Gln Arg Gly Gly Xaa Asn Lys Thr Xaa Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Xaa Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 113 <211> 411 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfotransferase 5 <220> <221> MISC_FEATURE <222> (149)..(149) <223> Xaa is threonine or serine <220> <221> MISC_FEATURE <222> (150)..(150) <223> Xaa is asparagine, arginine, or histidine <220> <221> MISC_FEATURE <222> (193)..(193) <223> Xaa is glycine or serine <220> <221> MISC_FEATURE <222> (194)..(194) <223> Xaa is glycine or histidine <220> <221> MISC_FEATURE <222> (198)..(198) <223> Xaa is histidine or threonine <220> <221> MISC_FEATURE <222> (203)..(203) <223> Xaa is alanine or threonine <220> <221> MISC_FEATURE <222> (207)..(207) <223> Xaa is glycine or serine <220> <221> MISC_FEATURE <222> (246)..(246) <223> Xaa is glycine or alanine <400> 113 Met Arg Arg Arg Arg Ala Gly Gly Arg Thr Met Val Glu Arg Ala Ser 1 5 10 15 Lys Phe Val Leu Val Val Ala Gly Ser Ala Cys Phe Met Leu Ile Leu 20 25 30 Tyr Gln Tyr Ala Gly Pro Gly Leu Ser Leu Gly Ala Pro Gly Gly Arg 35 40 45 Val Pro Pro Asp Asp Leu Asp Leu Phe Pro Thr Pro Asp Pro His Tyr 50 55 60 Glu Lys Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg 65 70 75 80 Phe Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His 85 90 95 Thr Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu 100 105 110 Glu Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr 115 120 125 Arg Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly 130 135 140 Trp Ser Cys Gly Xaa Xaa Ala Asp Trp Thr Glu Leu Thr Asn Cys Val 145 150 155 160 Pro Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg 165 170 175 Lys Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu 180 185 190 Xaa Xaa Trp Arg His Xaa Gln Arg Gly Gly Xaa Asn Lys Thr Xaa Leu 195 200 205 His Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys 210 215 220 Tyr Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp 225 230 235 240 Cys Pro Tyr Asn Leu Xaa Asn Asn Arg Gln Val Arg Met Leu Ala Asp 245 250 255 Leu Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys 260 265 270 Arg Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met 275 280 285 Ala Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe 290 295 300 Glu Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn 305 310 315 320 Ser Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His 325 330 335 Ile Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys 340 345 350 Asp Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg 355 360 365 Glu Gln Arg Leu Arg Asn Arg Glu Glu Arg Leu Leu His Arg Ser Lys 370 375 380 Glu Ala Leu Pro Arg Glu Asp Pro Glu Glu Pro Gly Arg Val Pro Thr 385 390 395 400 Glu Asp Tyr Met Ser His Ile Ile Glu Lys Trp 405 410 <210> 114 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfotransferase 6 <400> 114 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu His Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Thr Asn Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Ala Leu Arg Thr Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Gly 115 120 125 Gly Trp Arg His His Gln Arg Gly Gly Thr Asn Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Gly Lys Arg 195 200 205 Ser Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Gly Glu Asp Thr Ile Arg Arg Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Arg Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Gln 290 295 300 Gln Arg Leu Arg Ser Arg Glu Glu 305 310 <210> 115 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfotransferase 7 <400> 115 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu His Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Thr Arg Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Ala Leu Arg Thr Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser 115 120 125 His Trp Arg His Thr Gln Arg Gly Gly Ala Asn Lys Thr Gly Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Gly Lys Arg 195 200 205 Ser Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Gly Glu Asp Thr Ile Arg Arg Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Arg Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Gln 290 295 300 Gln Arg Leu Arg Ser Arg Glu Glu 305 310 <210> 116 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfotransferase 8 <400> 116 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu His Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Ser His Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Ala Leu Arg Thr Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser 115 120 125 Gly Trp Arg His His Gln Arg Gly Gly Ala Asn Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Gly Lys Arg 195 200 205 Ser Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Gly Glu Asp Thr Ile Arg Arg Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Arg Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Gln 290 295 300 Gln Arg Leu Arg Ser Arg Glu Glu 305 310 <210> 117 <211> 411 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfotransferase 9 <400> 117 Met Arg Arg Arg Arg Ala Gly Ser Arg Thr Met Val Glu Arg Ala Ser 1 5 10 15 Lys Phe Val Leu Val Val Ala Gly Ser Ala Cys Phe Met Leu Ile Leu 20 25 30 Tyr Gln Tyr Ala Gly Pro Gly Leu Ser Leu Gly Ala Pro Gly Gly Arg 35 40 45 Ala Pro Pro Asp Asp Leu Asp Leu Phe Pro Thr Pro Asp Pro His Tyr 50 55 60 Glu Lys Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu His 65 70 75 80 Phe Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His 85 90 95 Thr Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu 100 105 110 Glu Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr 115 120 125 Arg Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly 130 135 140 Trp Ser Cys Gly Thr Asn Ala Asp Trp Thr Glu Leu Thr Asn Cys Val 145 150 155 160 Pro Gly Val Leu Asp Arg Arg Asp Pro Ala Ala Leu Arg Thr Pro Arg 165 170 175 Lys Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu 180 185 190 Gly Gly Trp Arg His His Gln Arg Gly Gly Thr Asn Lys Thr Ser Leu 195 200 205 His Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys 210 215 220 Tyr Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp 225 230 235 240 Cys Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp 245 250 255 Leu Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Gly Lys 260 265 270 Arg Ser Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met 275 280 285 Ala Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe 290 295 300 Glu Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn 305 310 315 320 Ser Thr Arg Ala Gly Gly Val Glu Val Gly Glu Asp Thr Ile Arg Arg 325 330 335 Ile Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Arg 340 345 350 Asp Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg 355 360 365 Gln Gln Arg Leu Arg Ser Arg Glu Glu Arg Leu Leu His Arg Ala Lys 370 375 380 Glu Ala Pro Pro Arg Gly Asp Thr Glu Glu Pro Gly Arg Val Pro Thr 385 390 395 400 Glu Asp Tyr Met Ser His Ile Ile Glu Lys Trp 405 410 <210> 118 <211> 411 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfotransferase 10 <400> 118 Met Arg Arg Arg Arg Ala Gly Ser Arg Thr Met Val Glu Arg Ala Ser 1 5 10 15 Lys Phe Val Leu Val Val Ala Gly Ser Ala Cys Phe Met Leu Ile Leu 20 25 30 Tyr Gln Tyr Ala Gly Pro Gly Leu Ser Leu Gly Ala Pro Gly Gly Arg 35 40 45 Ala Pro Pro Asp Asp Leu Asp Leu Phe Pro Thr Pro Asp Pro His Tyr 50 55 60 Glu Lys Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu His 65 70 75 80 Phe Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His 85 90 95 Thr Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu 100 105 110 Glu Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr 115 120 125 Arg Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly 130 135 140 Trp Ser Cys Gly Thr Arg Ala Asp Trp Thr Glu Leu Thr Asn Cys Val 145 150 155 160 Pro Gly Val Leu Asp Arg Arg Asp Pro Ala Ala Leu Arg Thr Pro Arg 165 170 175 Lys Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu 180 185 190 Ser His Trp Arg His Thr Gln Arg Gly Gly Ala Asn Lys Thr Gly Leu 195 200 205 His Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys 210 215 220 Tyr Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp 225 230 235 240 Cys Pro Tyr Asn Leu Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp 245 250 255 Leu Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Gly Lys 260 265 270 Arg Ser Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met 275 280 285 Ala Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe 290 295 300 Glu Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn 305 310 315 320 Ser Thr Arg Ala Gly Gly Val Glu Val Gly Glu Asp Thr Ile Arg Arg 325 330 335 Ile Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Arg 340 345 350 Asp Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg 355 360 365 Gln Gln Arg Leu Arg Ser Arg Glu Glu Arg Leu Leu His Arg Ala Lys 370 375 380 Glu Ala Pro Pro Arg Gly Asp Thr Glu Glu Pro Gly Arg Val Pro Thr 385 390 395 400 Glu Asp Tyr Met Ser His Ile Ile Glu Lys Trp 405 410 <210> 119 <211> 411 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfotransferase 11 <400> 119 Met Arg Arg Arg Arg Ala Gly Ser Arg Thr Met Val Glu Arg Ala Ser 1 5 10 15 Lys Phe Val Leu Val Val Ala Gly Ser Ala Cys Phe Met Leu Ile Leu 20 25 30 Tyr Gln Tyr Ala Gly Pro Gly Leu Ser Leu Gly Ala Pro Gly Gly Arg 35 40 45 Ala Pro Pro Asp Asp Leu Asp Leu Phe Pro Thr Pro Asp Pro His Tyr 50 55 60 Glu Lys Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu His 65 70 75 80 Phe Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His 85 90 95 Thr Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu 100 105 110 Glu Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr 115 120 125 Arg Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly 130 135 140 Trp Ser Cys Gly Ser His Ala Asp Trp Thr Glu Leu Thr Asn Cys Val 145 150 155 160 Pro Gly Val Leu Asp Arg Arg Asp Pro Ala Ala Leu Arg Thr Pro Arg 165 170 175 Lys Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu 180 185 190 Ser Gly Trp Arg His His Gln Arg Gly Gly Ala Asn Lys Thr Ser Leu 195 200 205 His Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys 210 215 220 Tyr Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp 225 230 235 240 Cys Pro Tyr Asn Leu Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp 245 250 255 Leu Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Gly Lys 260 265 270 Arg Ser Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met 275 280 285 Ala Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe 290 295 300 Glu Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn 305 310 315 320 Ser Thr Arg Ala Gly Gly Val Glu Val Gly Glu Asp Thr Ile Arg Arg 325 330 335 Ile Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Arg 340 345 350 Asp Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg 355 360 365 Gln Gln Arg Leu Arg Ser Arg Glu Glu Arg Leu Leu His Arg Ala Lys 370 375 380 Glu Ala Pro Pro Arg Gly Asp Thr Glu Glu Pro Gly Arg Val Pro Thr 385 390 395 400 Glu Asp Tyr Met Ser His Ile Ile Glu Lys Trp 405 410 <210> 120 <211> 470 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfotransferase 12 <400> 120 Met Asp Glu Arg Phe Asn Lys Trp Leu Leu Thr Pro Val Leu Thr Leu 1 5 10 15 Leu Phe Val Val Ile Met Tyr Gln Tyr Val Ser Pro Ser Cys Thr Ser 20 25 30 Ser Cys Thr Asn Phe Gly Glu Gln Leu Arg Ser Gly Glu Ala Arg Pro 35 40 45 Pro Ala Val Pro Ser Pro Ala Arg Arg Ala Gln Ala Pro Leu Asp Glu 50 55 60 Trp Glu Arg Arg Pro Gln Leu Pro Pro Pro Pro Arg Gly Pro Pro Glu 65 70 75 80 Gly Ser Arg Gly Val Ala Ala Pro Glu Asp Glu Asp Glu Asp Pro Gly 85 90 95 Asp Pro Glu Glu Glu Glu Glu Glu Glu Glu Glu Glu Pro Asp Pro Glu 100 105 110 Ala Pro Glu Asn Gly Ser Leu Pro Arg Phe Val Pro Arg Phe Asn Phe 115 120 125 Thr Leu Lys Asp Leu Thr Arg Phe Val Asp Phe Asn Ile Lys Gly Arg 130 135 140 Asp Val Ile Val Phe Leu His Ile Gly His Thr Gly Gly Thr Thr Phe 145 150 155 160 Gly Arg His Leu Val Lys Asn Ile Arg Leu Glu Gln Pro Cys Ser Cys 165 170 175 Lys Ala Gly Gln Lys Lys Cys Thr Cys His Arg Pro Gly Lys Lys Glu 180 185 190 Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp Ser Cys Gly Thr Asn 195 200 205 Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro Ala Ile Met Glu Lys 210 215 220 Lys Asp Cys Pro Arg Asn His Ser His Thr Arg Asn Phe Tyr Tyr Ile 225 230 235 240 Thr Met Leu Arg Asp Pro Val Ser Arg Tyr Leu Gly Gly Trp Lys His 245 250 255 His Gln Arg Gly Gly Thr Asn Lys Thr Ser Leu His Met Cys Asp Gly 260 265 270 Arg Ser Pro Thr Pro Asp Glu Leu Pro Thr Cys Tyr Pro Gly Asp Asp 275 280 285 Trp Ser Gly Val Ser Leu Arg Glu Phe Met Asp Cys Ser Tyr Asn Leu 290 295 300 Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu Ser Leu Val Gly 305 310 315 320 Cys Tyr Asn Leu Thr Phe Met Asn Glu Ser Glu Arg Asn Thr Ile Leu 325 330 335 Leu Gln Ser Ala Lys Asn Asn Leu Lys Asn Met Ala Phe Phe Gly Leu 340 345 350 Thr Glu Phe Gln Arg Lys Thr Gln Phe Leu Phe Glu Arg Thr Phe Asn 355 360 365 Leu Lys Phe Ile Ser Pro Phe Thr Gln Val Asn Ile Thr Arg Ala Ser 370 375 380 Asn Val Asp Ile Asn Asp Gly Ala Arg Gln His Ile Glu Glu Leu Asn 385 390 395 400 Phe Leu Asp Met Gln Leu Tyr Glu Tyr Ala Lys Asp Leu Phe Gln Gln 405 410 415 Arg Tyr His His Thr Lys Gln Leu Glu His Gln Arg Asp Arg Gln Lys 420 425 430 Arg Arg Glu Glu Arg Arg Leu Gln Arg Glu His Arg Ala His Arg Trp 435 440 445 Pro Lys Glu Asp Arg Ala Met Glu Gly Thr Val Thr Glu Asp Tyr Asn 450 455 460 Ser Gln Val Val Arg Trp 465 470 <210> 121 <211> 470 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfotransferase 13 <400> 121 Met Asp Glu Arg Phe Asn Lys Trp Leu Leu Thr Pro Val Leu Thr Leu 1 5 10 15 Leu Phe Val Val Ile Met Tyr Gln Tyr Val Ser Pro Ser Cys Thr Ser 20 25 30 Ser Cys Thr Asn Phe Gly Glu Gln Leu Arg Ser Gly Glu Ala Arg Pro 35 40 45 Pro Ala Val Pro Ser Pro Ala Arg Arg Ala Gln Ala Pro Leu Asp Glu 50 55 60 Trp Glu Arg Arg Pro Gln Leu Pro Pro Pro Pro Arg Gly Pro Pro Glu 65 70 75 80 Gly Ser Arg Gly Val Ala Ala Pro Glu Asp Glu Asp Glu Asp Pro Gly 85 90 95 Asp Pro Glu Glu Glu Glu Glu Glu Glu Glu Glu Glu Pro Asp Pro Glu 100 105 110 Ala Pro Glu Asn Gly Ser Leu Pro Arg Phe Val Pro Arg Phe Asn Phe 115 120 125 Thr Leu Lys Asp Leu Thr Arg Phe Val Asp Phe Asn Ile Lys Gly Arg 130 135 140 Asp Val Ile Val Phe Leu His Ile Gly His Thr Gly Gly Thr Thr Phe 145 150 155 160 Gly Arg His Leu Val Lys Asn Ile Arg Leu Glu Gln Pro Cys Ser Cys 165 170 175 Lys Ala Gly Gln Lys Lys Cys Thr Cys His Arg Pro Gly Lys Lys Glu 180 185 190 Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp Ser Cys Gly Thr Arg 195 200 205 Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro Ala Ile Met Glu Lys 210 215 220 Lys Asp Cys Pro Arg Asn His Ser His Thr Arg Asn Phe Tyr Tyr Ile 225 230 235 240 Thr Met Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser His Trp Lys His 245 250 255 Thr Gln Arg Gly Gly Ala Asn Lys Thr Gly Leu His Met Cys Asp Gly 260 265 270 Arg Ser Pro Thr Pro Asp Glu Leu Pro Thr Cys Tyr Pro Gly Asp Asp 275 280 285 Trp Ser Gly Val Ser Leu Arg Glu Phe Met Asp Cys Ser Tyr Asn Leu 290 295 300 Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu Ser Leu Val Gly 305 310 315 320 Cys Tyr Asn Leu Thr Phe Met Asn Glu Ser Glu Arg Asn Thr Ile Leu 325 330 335 Leu Gln Ser Ala Lys Asn Asn Leu Lys Asn Met Ala Phe Phe Gly Leu 340 345 350 Thr Glu Phe Gln Arg Lys Thr Gln Phe Leu Phe Glu Arg Thr Phe Asn 355 360 365 Leu Lys Phe Ile Ser Pro Phe Thr Gln Phe Asn Ile Thr Arg Ala Ser 370 375 380 Asn Val Asp Ile Asn Asp Gly Ala Arg Gln His Ile Glu Glu Leu Asn 385 390 395 400 Phe Leu Asp Met Gln Leu Tyr Glu Tyr Ala Lys Asp Leu Phe Gln Gln 405 410 415 Arg Tyr His His Thr Lys Gln Leu Glu His Gln Arg Asp Arg Gln Lys 420 425 430 Arg Arg Glu Glu Arg Arg Leu Gln Arg Glu His Arg Ala His Arg Trp 435 440 445 Pro Lys Glu Asp Arg Ala Met Glu Gly Thr Val Thr Glu Asp Tyr Asn 450 455 460 Ser Gln Val Val Arg Trp 465 470 <210> 122 <211> 470 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 6-O sulfotransferase mutant_sulfotransferase 14 <400> 122 Met Asp Glu Arg Phe Asn Lys Trp Leu Leu Thr Pro Val Leu Thr Leu 1 5 10 15 Leu Phe Val Val Ile Met Tyr Gln Tyr Val Ser Pro Ser Cys Thr Ser 20 25 30 Ser Cys Thr Asn Phe Gly Glu Gln Leu Arg Ser Gly Glu Ala Arg Pro 35 40 45 Pro Ala Val Pro Ser Pro Ala Arg Arg Ala Gln Ala Pro Leu Asp Glu 50 55 60 Trp Glu Arg Arg Pro Gln Leu Pro Pro Pro Pro Arg Gly Pro Pro Glu 65 70 75 80 Gly Ser Arg Gly Val Ala Ala Pro Glu Asp Glu Asp Glu Asp Pro Gly 85 90 95 Asp Pro Glu Glu Glu Glu Glu Glu Glu Glu Glu Glu Pro Asp Pro Glu 100 105 110 Ala Pro Glu Asn Gly Ser Leu Pro Arg Phe Val Pro Arg Phe Asn Phe 115 120 125 Thr Leu Lys Asp Leu Thr Arg Phe Val Asp Phe Asn Ile Lys Gly Arg 130 135 140 Asp Val Ile Val Phe Leu His Ile Gly His Thr Gly Gly Thr Thr Phe 145 150 155 160 Gly Arg His Leu Val Lys Asn Ile Arg Leu Glu Gln Pro Cys Ser Cys 165 170 175 Lys Ala Gly Gln Lys Lys Cys Thr Cys His Arg Pro Gly Lys Lys Glu 180 185 190 Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp Ser Cys Gly Ser His 195 200 205 Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro Ala Ile Met Glu Lys 210 215 220 Lys Asp Cys Pro Arg Asn His Ser His Thr Arg Asn Phe Tyr Tyr Ile 225 230 235 240 Thr Met Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser Gly Trp Lys His 245 250 255 His Gln Arg Gly Gly Ala Asn Lys Thr Ser Leu His Met Cys Asp Gly 260 265 270 Arg Ser Pro Thr Pro Asp Glu Leu Pro Thr Cys Tyr Pro Gly Asp Asp 275 280 285 Trp Ser Gly Val Ser Leu Arg Glu Phe Met Asp Cys Ser Tyr Asn Leu 290 295 300 Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu Ser Leu Val Gly 305 310 315 320 Cys Tyr Asn Leu Thr Phe Met Asn Glu Ser Glu Arg Asn Thr Ile Leu 325 330 335 Leu Gln Ser Ala Lys Asn Asn Leu Lys Asn Met Ala Phe Phe Gly Leu 340 345 350 Thr Glu Phe Gln Arg Lys Thr Gln Phe Leu Phe Glu Arg Thr Phe Asn 355 360 365 Leu Lys Phe Ile Ser Pro Phe Thr Gln Phe Asn Ile Thr Arg Ala Ser 370 375 380 Asn Val Asp Ile Asn Asp Gly Ala Arg Gln His Ile Glu Glu Leu Asn 385 390 395 400 Phe Leu Asp Met Gln Leu Tyr Glu Tyr Ala Lys Asp Leu Phe Gln Gln 405 410 415 Arg Tyr His His Thr Lys Gln Leu Glu His Gln Arg Asp Arg Gln Lys 420 425 430 Arg Arg Glu Glu Arg Arg Leu Gln Arg Glu His Arg Ala His Arg Trp 435 440 445 Pro Lys Glu Asp Arg Ala Met Glu Gly Thr Val Thr Glu Asp Tyr Asn 450 455 460 Ser Gln Val Val Arg Trp 465 470 <210> 123 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 1 <400> 123 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Ala 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Ala Tyr Thr His Met Leu Tyr Asn His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Met Val Met Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 124 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 1 <400> 124 atgggaactg cgtcgaacgg cagtacgcaa cagttaccgc aaaccatcat tattggcgtg 60 ggtcacgggg ggacccgtgc acttctggaa atgttgagtc tgcaccctga cgtggccgct 120 gcagagaacg aagtccactt cttcgattgg gaggagcatt atagtcaagg cttggggtgg 180 tatcttaccc agatgccttt cagctccccc catcagctta ccgttgaaaa gactcatgcc 240 tattttacat cgcccaaagt tcctgaacgt attcatagca tgaaccccac aattcgttta 300 cttttgatcc tgcgtgatcc aagcgagcgc gttttatcgg catacacgca catgttatat 360 aatcatttgc agaagcacaa accttaccca ccaattgagg acttattgat gcgtgatggt 420 cgcttaaatt tagatatggt aatgctgaat cgttcccttt atcacgcaca catgttaaac 480 tggctgcgct tcttcccgtt gggtcatatc catattgtcg atggggatcg cttaattcgc 540 gacccatttc cggagatcca aaaggttgag cgtttcttaa aactgtcgcc tcaaatcaac 600 gcgtcaaact tttacttcaa caagacgaaa ggtttctatt gcctgcgtga tagcggtaag 660 gaccgctgct tgcatgaatc taaagggcgt gctcatccac aagttgatcc taaattactt 720 gataagctgc atgaatactt ccatgaacct aacaaaaagt tcttcaaact tgtcggccgc 780 acatttgatt ggcat 795 <210> 125 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 2 <400> 125 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Ala 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Ala Tyr Thr His Leu Leu Tyr Asn His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Arg Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 126 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 2 <400> 126 atgggaactg cgtcgaacgg cagtacgcaa cagttacccc agacaattat tattggcgta 60 gggcacggag gtactcgcgc cttattggag atgctgtcct tacatccaga cgtggcagcg 120 gctgaaaacg aggtacattt ctttgactgg gaagaacact actcacaggg actgggatgg 180 tacctgaccc aaatgccctt cagttcaccg catcagttga cagtagagaa gacacatgca 240 tattttacgt cgccaaaagt cccggaacgt attcattcga tgaatcccac gattcgtctg 300 ttgttaatct tgcgtgaccc tagtgagcgt gttctttctg cgtacactca cttgctgtat 360 aaccatttac agaaacacaa gccatatccg ccgattgaag atctgttgat gcgtgacggg 420 cgtcttaacc tggactatcg tggcctgaac cgctctttat accacgcgca catgttgaat 480 tggcttcgct tcttcccctt gggacatatt catattgtgg atggagatcg cttaatccgt 540 gatccattcc cggaaattca gaaggttgag cgtttcctga agttgtctcc acaaattaat 600 gcaagcaact tttactttaa taaaaccaag ggcttctact gtttgcgcga tagcggaaaa 660 gaccgctgcc tgcatgagtc caaaggacgt gcacatcccc aagtcgatcc aaagttgctt 720 gacaaattac acgagtattt ccatgaaccg aataaaaagt tttttaagtt ggtcggccgc 780 acatttgatt ggcat 795 <210> 127 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 3 <400> 127 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Ala 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Ala Tyr Thr His Leu Leu Tyr Asn His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Val Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 128 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 3 <400> 128 atgggaactg cgtcgaacgg cagtacgcaa caattgccac agacaattat cattggcgtt 60 ggtcatgggg ggacgcgcgc tctgctggaa atgttgtccc ttcacccaga tgtggccgct 120 gcggagaacg aagttcactt cttcgactgg gaagaacact atagccaagg gttggggtgg 180 tacctgaccc aaatgccgtt cagtagtcct catcaattga ccgttgagaa aactcacgct 240 tactttacct cgcccaaggt acccgagcgc atccacagca tgaaccccac tatccgcctg 300 ctgcttattt tgcgtgaccc ttcagagcgc gttttaagcg cgtatactca tcttctttat 360 aaccaccttc agaagcacaa gccttatcct ccgattgaag atttgttgat gcgcgatggc 420 cgcttgaact tagactatgt cgggcttaac cgttctcttt accatgccca catgcttaac 480 tggctgcgct tttttccgct tggacacatc cacatcgtcg acggggaccg cttgattcgt 540 gacccctttc ccgagattca aaaggttgaa cgtttcttaa agctttcacc tcaaatcaat 600 gcgtccaact tttattttaa caagactaaa ggcttctact gcttacgcga ctcaggaaaa 660 gatcgctgct tacatgaatc gaaggggcgt gcccatccac aagttgatcc taaattattg 720 gataagctgc acgaatactt ccatgagcca aataagaaat tctttaagtt agtcggccgc 780 acatttgatt ggcat 795 <210> 129 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 4 <400> 129 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Leu 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Trp Tyr Thr His Ala Leu Tyr Ala His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Thr Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 130 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 4 <400> 130 atgggaactg cgtcgaacgg cagtacgcaa caattgcctc agactatcat cattggggta 60 ggacacggag gtacacgtgc attgcttgag atgttaagtc ttcatcccga tgttgctgca 120 gctgaaaatg aagtacactt tttcgactgg gaagagcact acagtcaggg actgggttgg 180 tatctgacgc agatgccttt ttcaagcccc catcagttga ccgtagaaaa gactcatctt 240 tacttcacct ccccgaaggt ccccgaacgt attcattcca tgaacccaac catccgttta 300 cttttgatcc ttcgtgatcc cagtgagcgc gtccttagtt ggtacactca tgccctgtac 360 gctcatttac agaaacacaa accatacccg ccgattgagg accttttaat gcgcgatggg 420 cgtcttaatc ttgattatac aggcctgaat cgttctcttt accacgcaca catgttaaat 480 tggctgcgtt tctttccact tggacacatc catatcgtgg atggtgaccg cttaatccgc 540 gatcctttcc cggagattca gaaagttgaa cgcttcctta aactgtcacc gcagatcaat 600 gcctcgaatt tctacttcaa taagactaag ggcttctact gcttgcgcga ctctggcaag 660 gatcgttgct tacacgaatc taaggggcgt gctcatccac aggtcgaccc aaagttgctt 720 gacaaattgc acgaatattt tcacgagcca aataaaaagt tctttaagct ggtcggccgc 780 acatttgatt ggcat 795 <210> 131 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 5 <400> 131 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Leu 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Leu Tyr Thr His Ala Leu Tyr Asn His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Thr Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 132 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 5 <400> 132 atgggaactg cgtcgaacgg cagtacgcaa caattaccac aaacaatcat catcggggta 60 gggcatggtg gaactcgtgc tttgcttgag atgctttcac tgcatcccga cgtggctgca 120 gcggagaatg aagtgcattt cttcgattgg gaagaacatt atagccaggg ccttgggtgg 180 tatctgaccc agatgccatt cagttctccc catcagctga ccgtcgaaaa gacccatttg 240 tattttactt cgcctaaagt tcccgaacgt atccacagca tgaacccgac gattcgttta 300 ctgctgattc tgcgtgaccc gtcagagcgt gtccttagtt tatatacgca cgctttgtat 360 aaccacttac aaaaacataa accataccca cccattgaag acttattaat gcgcgacgga 420 cgtctgaact tagactacac ggggctgaat cgttcattgt atcatgccca catgcttaac 480 tggttgcgtt tttttccatt gggacacatc catattgttg acggagatcg tctgatccgc 540 gacccttttc ccgagattca aaaagtcgaa cgttttttga aattatcgcc acaaattaac 600 gcctctaatt tttacttcaa caagactaaa ggtttttatt gtttacgtga tagtggtaag 660 gaccgctgtc ttcatgaatc aaagggacgc gcacatcccc aagtagatcc aaaacttctg 720 gataagttac acgagtattt ccatgagcct aacaagaaat tttttaagct tgtcggccgc 780 acatttgatt ggcat 795 <210> 133 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 6 <400> 133 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Thr 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Leu Tyr Thr His Ala Leu Tyr Met His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Ala Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 134 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 6 <400> 134 atgggaactg cgtcgaacgg cagtacgcaa caattacctc agaccattat tattggtgtc 60 ggccatggag gaacgcgtgc tctgctggag atgctttcgc ttcaccccga cgtggcggct 120 gccgagaatg aggtacactt ttttgattgg gaagagcatt actcacaagg tttgggctgg 180 taccttactc agatgccctt ttcgtcaccg catcaactga cggtggagaa gacccacact 240 tacttcacca gtccaaaagt ccctgaacgc atccatagca tgaatcctac aattcgtctt 300 cttttgatcc ttcgcgatcc atctgagcgt gtgttatcct tatataccca cgcgctttac 360 atgcaccttc agaagcacaa gccctatccc ccaattgagg acttgctgat gcgcgatggc 420 cgtcttaatt tggattatgc aggactgaat cgttccctgt accacgccca catgctgaac 480 tggttgcgct tctttccact tggccacatc catattgtcg acggggatcg tctgattcgt 540 gatccgttcc cagaaatcca gaaggtagaa cgcttcctga aattgagccc acagattaac 600 gcgtcgaatt tttactttaa caaaaccaaa ggattctatt gtcttcgtga cagtggaaaa 660 gatcgctgct tacacgaatc gaaaggccgt gctcatcccc aagttgatcc gaagcttctt 720 gataagttgc acgagtactt ccacgaaccg aacaagaagt ttttcaagct ggtcggccgc 780 acatttgatt ggcat 795 <210> 135 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 7 <400> 135 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Ser 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Val Tyr Thr His Ala Leu Tyr Met His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Met Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 136 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 7 <400> 136 atgggaactg cgtcgaacgg cagtacgcaa cagcttcccc agacgatcat tatcggagtc 60 ggtcatggtg ggacccgcgc attactggag atgttgtcgc ttcaccctga cgtggcggcg 120 gctgaaaatg aggtgcattt ttttgactgg gaagagcatt acagtcaggg tttaggttgg 180 tacttaacgc agatgccatt ctcgtctccc catcagttga ctgtcgagaa gactcactcc 240 tattttacaa gcccgaaggt tccagaacgc atccattcta tgaacccaac cattcgttta 300 cttcttattt tgcgtgaccc ctctgagcgt gtccttagtg tttacactca cgcgctgtat 360 atgcaccttc agaaacacaa gccttatccg ccaattgaag atctgttgat gcgcgatggc 420 cgtcttaatt tggactacat gggtttaaat cgtagcttat atcatgcgca catgttgaat 480 tggttgcgct tcttccctct tggtcatatt cacattgtag acggtgatcg tttaattcgc 540 gatccgttcc ccgaaatcca aaaggtagaa cgtttcttga agctttcacc acagatcaac 600 gcgtcgaatt tttacttcaa caagacaaag ggcttctact gcttgcgcga ctcaggaaaa 660 gaccgttgtt tacacgagtc taaaggccgt gctcaccctc aagtagaccc taagcttttg 720 gacaaacttc acgagtactt tcatgaacca aataaaaagt tcttcaaatt ggtcggccgc 780 acatttgatt ggcat 795 <210> 137 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 8 <400> 137 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Thr 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Val Tyr Thr His Ala Leu Tyr Met His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Met Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 138 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 8 <400> 138 atgggaactg cgtcgaacgg cagtacgcaa cagttgcccc aaactatcat cattggagtc 60 gggcatggtg gaacacgcgc tctgttggaa atgctgtcct tgcaccccga cgttgccgct 120 gcagaaaatg aagtgcactt tttcgattgg gaggaacact actcccaggg tttgggctgg 180 tatcttacac agatgccgtt cagctctcca catcagttga cagtggagaa aacgcacaca 240 tattttacat caccaaaggt cccggagcgt attcattcga tgaatccaac catccgtctt 300 ctgctgatcc ttcgcgatcc cagtgagcgc gtactgtccg tttacaccca tgccttgtat 360 atgcacttac agaaacacaa accctatcct ccaatcgaag accttctgat gcgcgatggt 420 cgccttaatc ttgactatat ggggctgaat cgttctctgt accatgcaca catgttgaac 480 tggcttcgct tttttccgtt gggccatatt catattgtgg atggcgaccg tttgattcgt 540 gacccgttcc cagagatcca aaaggttgaa cgctttttaa aattatcgcc acaaattaat 600 gcatcgaact tctactttaa taagacgaag ggattttact gtttacgtga ttctggcaaa 660 gatcgttgtc tgcatgaatc taaagggcgt gctcatccgc aggtggaccc aaaactgtta 720 gataagttac acgagtattt tcatgagcct aacaagaaat tctttaagtt ggtcggccgc 780 acatttgatt ggcat 795 <210> 139 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 9 <400> 139 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Thr 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Phe Tyr Thr His Ala Leu Tyr Met His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Lys Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 140 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 9 <400> 140 atgggaactg cgtcgaacgg cagtacgcaa caactgccgc aaactatcat catcggggtg 60 ggtcatggag gtactcgtgc attattagaa atgcttagct tgcatcctga cgtggctgcg 120 gcggaaaacg aggtgcattt tttcgattgg gaggaacatt attctcaggg cttgggatgg 180 taccttactc aaatgccatt tagtagtccg caccagctga cagtagaaaa gacacatacg 240 tacttcacca gtccgaaagt ccccgagcgt attcattcaa tgaacccgac tatccgctta 300 ctgttgattc tgcgcgaccc gtcagaacgt gtattatcat tttatactca cgcgttatat 360 atgcatcttc aaaagcacaa accgtaccca cctatcgagg acctgctgat gcgtgatgga 420 cgcctgaatc tggactataa gggcttaaat cgctctttat atcatgcgca catgctgaat 480 tggcttcgtt tctttccgtt gggacatatt cacatcgtcg acggcgaccg cttgattcgt 540 gacccgttcc ccgaaatcca gaaagttgag cgtttcttga agctgtcacc tcagattaat 600 gccagcaatt tttactttaa taagaccaag gggttctatt gccttcgcga ctccggtaaa 660 gaccgctgct tacacgagtc gaaagggcgt gcccatccac aggtcgaccc taagctgctt 720 gacaagttac acgaatactt ccatgagcca aacaaaaagt tcttcaaact tgtcggccgc 780 acatttgatt ggcat 795 <210> 141 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 10 <400> 141 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Ser 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Leu Ala Thr His Leu Leu Tyr Val His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Thr Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 142 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 10 <400> 142 atgggaactg cgtcgaacgg cagtacgcaa caattaccgc aaactattat cattggtgta 60 ggacatggtg ggacgcgcgc gcttcttgaa atgttatcgc tgcaccctga tgtcgctgcc 120 gctgagaatg aagtacactt tttcgattgg gaggaacatt attcccaggg gttagggtgg 180 tatcttacac aaatgccttt tagctccccg caccaactga ccgtggaaaa aacccacagt 240 tattttactt cgccaaaagt acccgaacgt atccactcta tgaatccgac tatccgtttg 300 ttgttaatcc tgcgtgaccc ctcggaacgt gtactttcat tagctacaca tttgttatat 360 gttcatctgc agaagcacaa accgtatccc cctatcgaag atcttcttat gcgtgatggg 420 cgcttgaatc tggactacac tggacttaac cgtagcttgt atcatgccca catgttaaac 480 tggcttcgct tttttccttt aggccatatt catatcgttg atggcgaccg tcttattcgt 540 gatccatttc cggaaattca aaaagtggag cgtttcctga aactgagtcc acaaatcaat 600 gcctcaaact tctactttaa taaaaccaag gggttttatt gtcttcgcga cagcggcaaa 660 gatcgctgtc ttcacgagtc aaaaggtcgc gcgcacccgc aagtcgaccc taaattactt 720 gacaagctgc acgagtattt tcacgaaccc aacaagaaat tctttaaatt agtcggccgc 780 acatttgatt ggcat 795 <210> 143 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 11 <400> 143 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Ser 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Leu Gly Thr His Met Leu Tyr Val His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Val Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 144 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 11 <400> 144 atgggaactg cgtcgaacgg cagtacgcaa caattaccac agaccattat catcggggtc 60 gggcatgggg gtacacgtgc tttattagaa atgttgtcac ttcacccgga cgtagcagct 120 gcggagaatg aggtccactt tttcgactgg gaggagcatt actctcaagg cttggggtgg 180 tacttgactc aaatgccctt ctcttcgccc catcaattaa cagtcgaaaa gacccactcg 240 tacttcactt cccccaaggt tcccgaacgt attcattcca tgaaccctac cattcgcctt 300 ttgttaatcc tgcgcgatcc gtcggaacgt gtgctttcgt tgggcacaca catgctttac 360 gtccatttac agaagcacaa gccatacccg ccgatcgaag acttgctgat gcgcgacggg 420 cgtctgaatt tggactatgt aggcttgaac cgctcattat atcatgccca catgctgaac 480 tggttgcgtt tctttccatt gggtcacatc catatcgtgg atggtgaccg tttgatccgc 540 gatccattcc ctgagatcca gaaagtcgaa cgctttttaa aattgtcccc tcaaattaat 600 gctagtaact tctacttcaa caaaacaaag gggttttatt gtctgcgtga cagcggtaag 660 gatcgttgtt tgcacgaatc gaagggtcgc gcgcaccctc aagtcgatcc taaattgttg 720 gataaactgc acgaatactt ccacgaaccg aacaaaaaat ttttcaaact tgtcggccgc 780 acatttgatt ggcat 795 <210> 145 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 12 <400> 145 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Ser 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Leu Tyr Thr His Ala Leu Tyr Val His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Thr Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 146 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 3-O sulfotransferase mutant_sulfatase 12 <400> 146 atgggaactg cgtcgaacgg cagtacgcaa caactgcccc aaacgattat tattggcgtt 60 ggtcatgggg ggacccgtgc tttactggaa atgttatcac ttcaccccga tgtggctgct 120 gccgaaaacg aggtgcattt ctttgactgg gaagaacatt acagccaggg attgggatgg 180 tatcttacac aaatgccatt cagcagccct catcagttga cggtggagaa gacgcactct 240 tactttactt ctccgaaggt tccagagcgc attcactcga tgaaccctac gatccgtttg 300 ttacttattt tgcgcgaccc ctctgagcgc gttctgtctc tttatacaca tgcgttatat 360 gtgcatttac aaaagcataa gccctaccca ccaatcgagg atttactgat gcgcgatggt 420 cgcttgaatt tggactatac cggtttaaat cgctcgttgt accatgccca catgttgaac 480 tggcttcgtt ttttcccttt aggtcacatt cacattgtag atggggatcg cttgatccgt 540 gatcctttcc ctgagattca gaaagtagaa cgtttcttaa aattatcacc ccaaattaat 600 gcttctaatt tttacttcaa caagactaaa gggttctact gtcttcgcga tagtggtaaa 660 gatcgttgct tgcacgaatc caaaggacgc gcacatccac aggtagatcc aaaattgctt 720 gataagttgc acgaatactt ccacgaaccc aacaaaaaat tctttaagtt agtcggccgc 780 acatttgatt ggcat 795 <210> 147 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfotransferase 1 <400> 147 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Ser 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Ala Tyr Thr His Met Leu Tyr Asn His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Val Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 148 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 3-O sulfotransferase mutant_sulfotransferase 1 <400> 148 atgggaactg cgtcgaacgg cagtacgcaa caacttccgc agactatcat cattggcgta 60 ggacatggtg gaactcgtgc tctgttggag atgttatcac ttcaccccga cgtcgcagcg 120 gctgagaatg aagttcactt tttcgattgg gaagagcatt attcgcaggg gttaggttgg 180 tatcttaccc aaatgccttt ttcgagtccc catcagttaa cagtagagaa gacccattct 240 tactttacat caccaaaagt gcctgagcgc atccattcga tgaatccgac tatccgcctt 300 ttactgatct tacgcgatcc atcagaacgc gttctttcgg catataccca catgctttat 360 aaccatttgc agaaacacaa gccatatccc cctattgagg atttattaat gcgcgatgga 420 cgcttgaacc tggattatgt aggattaaat cgctctcttt atcacgccca tatgttaaac 480 tggcttcgct tttttccgct tgggcatatc cacatcgttg atggagaccg tttaattcgt 540 gacccgtttc ctgagatcca gaaggtcgaa cgcttcctga aattaagtcc tcagattaat 600 gcgagcaatt tctatttcaa caagacgaaa ggattctact gcctgcgcga ctccggtaag 660 gatcgctgcc tgcacgagtc aaaagggcgc gcgcaccctc aggtcgaccc aaagctgtta 720 gataaattgc atgagtattt ccacgaacct aataagaagt tcttcaaact tgtcggccgc 780 acatttgatt ggcat 795 <210> 149 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfotransferase 2 <400> 149 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Ser 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Ala Tyr Thr His Met Leu Tyr Asn His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Thr Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 150 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 3-O sulfotransferase mutant_sulfotransferase 2 <400> 150 atgggaactg cgtcgaacgg cagtacgcaa cagttgccgc agacaatcat tattggcgtc 60 ggacatggcg gaacccgtgc tcttttggaa atgctgagtc tgcaccctga cgtggcagcg 120 gcggagaatg aggttcactt ctttgattgg gaggaacatt attcgcaggg gttgggatgg 180 tatctgacgc aaatgccgtt ctccagtcca caccagttga ccgttgaaaa gacgcatagt 240 tattttacga gtcccaaagt acctgagcgt attcatagta tgaacccgac catccgtctg 300 ttgttgatcc ttcgcgatcc cagcgaacgc gtcttatcag cgtatactca catgctgtac 360 aaccaccttc aaaaacataa gccgtaccct cccatcgagg atcttttaat gcgtgatggt 420 cgtcttaacc ttgattacac aggtttgaac cgcagtttgt atcacgctca catgttgaat 480 tggttgcgct tctttcccct tggtcatatc catattgttg acggggaccg tctgatccgc 540 gacccgttcc cagagattca gaaagtggaa cgtttcctga aattatcccc acagatcaac 600 gcgagtaact tctattttaa caagacgaaa ggtttctatt gcttacgtga tagtgggaag 660 gaccgctgcc tgcacgagag caaaggacgt gctcatcctc aagttgaccc caagttattg 720 gataaactgc acgagtattt tcacgagcct aataaaaagt tctttaagtt agtcggccgc 780 acatttgatt ggcat 795 <210> 151 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfotransferase 3 <400> 151 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Ser 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Leu Gly Thr His Leu Leu Tyr Val His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Thr Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 152 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered glucosaminyl 3-O sulfotransferase mutant_sulfotransferase 3 <400> 152 atgggaactg cgtcgaacgg cagtacgcaa caacttccac aaactatcat tattggcgtg 60 ggtcacggtg ggactcgcgc tttacttgaa atgttgagct tacatccgga tgttgccgca 120 gctgaaaacg aggtccattt ctttgactgg gaggaacact attcccaggg tttggggtgg 180 tatctgacgc agatgccttt ctcgtctcct caccaactta cggttgagaa aactcattca 240 tatttcacgt cccctaaagt accagaacgt atccactcaa tgaacccaac aattcgttta 300 ttgttgattt tgcgcgaccc gtcggaacgt gtgttgtcgt taggtacgca cttgctttac 360 gttcatttgc aaaagcataa accgtatcca ccgattgagg accttttgat gcgtgacgga 420 cgtttgaatt tggactatac gggcctgaat cgctcgctgt atcacgccca catgttgaac 480 tggctgcgct tcttccccct tggtcatatc cacatcgtag atggggaccg tctgatccgt 540 gaccctttcc cggaaatcca gaaagtggag cgtttcctga agttatctcc acaaatcaac 600 gcgagcaatt tttactttaa caagactaaa gggttctact gtttacgtga ttctggcaaa 660 gaccgttgcc ttcatgaaag taaaggccgc gctcaccctc aagtcgaccc caaattatta 720 gataagttgc acgagtactt ccatgaacct aataagaagt tcttcaaact tgtcggccgc 780 acatttgatt ggcat 795 <210> 153 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_variable <220> <221> MISC_FEATURE <222> (80)..(80) <223> Xaa is alanine, leucine, threonine, or serine <220> <221> MISC_FEATURE <222> (114)..(114) <223> Xaa is alanine, tryptophan, leucine, valine, or phenylalanine <220> <221> MISC_FEATURE <222> (115)..(115) <223> Xaa is tyrosine, alanine, or glycine <220> <221> MISC_FEATURE <222> (118)..(118) <223> Xaa is methionine, leucine, or alanine <220> <221> MISC_FEATURE <222> (121)..(121) <223> Xaa is asparagine, alanine, methionine, or valine <220> <221> MISC_FEATURE <222> (146)..(146) <223> Xaa is tyrosine or methionine <220> <221> MISC_FEATURE <222> (147)..(147) <223> Xaa is lysine, valine, arginine, threonine, alanine, or methionine <220> <221> MISC_FEATURE <222> (148)..(148) <223> Xaa is methionine or glycine <400> 153 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Xaa 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Xaa Xaa Thr His Xaa Leu Tyr Xaa His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Xaa Xaa Xaa Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 154 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfotransferase 4 <220> <221> MISC_FEATURE <222> (114)..(114) <223> Xaa is alanine or leucine <220> <221> MISC_FEATURE <222> (115)..(115) <223> Xaa is tyrosine or glycine <220> <221> MISC_FEATURE <222> (118)..(118) <223> Xaa is methionine or leucine <220> <221> MISC_FEATURE <222> (121)..(121) <223> Xaa is asparagine or valine <220> <221> MISC_FEATURE <222> (147)..(147) <223> Xaa is valine or threonine <400> 154 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Ser 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Xaa Xaa Thr His Xaa Leu Tyr Xaa His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Xaa Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 155 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfotransferase 5 <400> 155 Met Gly Val Ala Pro Asn Gly Ser Ala Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser His Gly Leu Gly Trp Tyr Leu Ser Gln 50 55 60 Met Pro Phe Ser Trp Pro His Gln Leu Thr Val Glu Lys Thr His Ser 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Val Tyr Ser Met Asn Pro 85 90 95 Ser Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Leu Gly Thr His Leu Phe Tyr Val His Met Gln Lys His Lys Pro 115 120 125 Tyr Pro Ser Ile Glu Glu Phe Leu Val Arg Asp Gly Arg Leu Asn Val 130 135 140 Asp Tyr Thr Gly Leu Asn Arg Ser Leu Tyr His Val His Met Gln Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Arg His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Arg Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asn Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Glu 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 156 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfotransferase 6 <400> 156 Met Gly Val Ala Pro Asn Gly Ser Ala Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser His Gly Leu Gly Trp Tyr Leu Ser Gln 50 55 60 Met Pro Phe Ser Trp Pro His Gln Leu Thr Val Glu Lys Thr His Ser 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Val Tyr Ser Met Asn Pro 85 90 95 Ser Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Ala Tyr Thr His Met Phe Tyr Asn His Met Gln Lys His Lys Pro 115 120 125 Tyr Pro Ser Ile Glu Glu Phe Leu Val Arg Asp Gly Arg Leu Asn Val 130 135 140 Asp Tyr Thr Gly Leu Asn Arg Ser Leu Tyr His Val His Met Gln Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Arg His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Arg Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asn Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Glu 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 157 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfotransferase 7 <400> 157 Met Gly Val Ala Pro Asn Gly Ser Ala Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Arg Lys Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser His Gly Leu Gly Trp Tyr Leu Ser Gln 50 55 60 Met Pro Phe Ser Trp Pro His Gln Leu Thr Val Glu Lys Thr Pro Ala 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Val Tyr Ser Met Asn Pro 85 90 95 Ser Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Asp Tyr Thr Gln Val Phe Tyr Asn His Met Gln Lys His Lys Pro 115 120 125 Tyr Pro Ser Ile Glu Glu Phe Leu Val Arg Asp Gly Arg Leu Asn Val 130 135 140 Asp Tyr Lys Ala Leu Asn Arg Ser Leu Tyr His Val His Met Gln Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Arg His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Arg Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asn Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Glu 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 158 <211> 346 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfotransferase 8 <400> 158 Met Leu Phe Lys Gln Gln Val Trp Leu Arg Gln Lys Leu Leu Val Leu 1 5 10 15 Gly Ser Leu Ala Val Gly Ser Leu Leu Tyr Leu Val Ala Arg Val Gly 20 25 30 Ser Leu Asp Arg Leu Gln Pro Ile Cys Pro Val Glu Ser Arg Phe Gly 35 40 45 Gly Ala His Asn Gln Ala Glu Leu Pro Leu Arg Ala Leu Gln Phe Lys 50 55 60 Arg Gly Leu Leu His Glu Phe Arg Lys Gly Asn Ser Ser Lys Glu Gln 65 70 75 80 Val His Leu His Asp Leu Val Gln Gln Leu Pro Lys Ala Ile Ile Ile 85 90 95 Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu Asn Leu 100 105 110 His Pro Ala Val Val Lys Ala Ser Gln Glu Ile His Phe Phe Asp Asn 115 120 125 Asp Glu Asn Tyr Ala Lys Gly Ile Glu Trp Tyr Arg Lys Lys Met Pro 130 135 140 Phe Ser Tyr Pro Gln Gln Ile Thr Ile Glu Lys Ser His Ser Tyr Phe 145 150 155 160 Ile Thr Glu Glu Val Pro Glu Arg Ile Tyr Lys Met Asn Ser Ser Ile 165 170 175 Lys Leu Leu Ile Ile Val Arg Glu Pro Thr Thr Arg Ala Ile Ser Ala 180 185 190 Tyr Thr His Met Leu Glu Gly Lys Glu Arg Lys Asn Lys Thr Tyr Tyr 195 200 205 Lys Phe Glu Lys Leu Ala Ile Asp Pro Asn Thr Cys Glu Val Asn Thr 210 215 220 Lys Tyr Val Gly Val Arg Thr Ser Ile Tyr Thr Lys His Leu Glu Arg 225 230 235 240 Trp Leu Lys Tyr Phe Pro Ile Glu Gln Phe His Ile Val Asp Gly Asp 245 250 255 Arg Leu Ile Thr Glu Pro Leu Pro Glu Leu Gln Leu Val Glu Lys Phe 260 265 270 Leu Asn Leu Pro Pro Arg Ile Ser Gln Tyr Asn Leu Tyr Phe Asn Ala 275 280 285 Thr Arg Gly Phe Tyr Cys Leu Arg Phe Asn Ile Ile Phe Asn Lys Cys 290 295 300 Leu Ala Gly Ser Lys Gly Arg Ile His Pro Glu Val Asp Pro Ser Val 305 310 315 320 Ile Thr Lys Leu Arg Lys Phe Phe His Pro Phe Asn Gln Lys Phe Tyr 325 330 335 Gln Ile Thr Gly Arg Thr Leu Asn Trp Pro 340 345 <210> 159 <211> 346 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfotransferase 9 <400> 159 Met Leu Phe Lys Gln Gln Val Trp Leu Arg Gln Lys Leu Leu Val Leu 1 5 10 15 Gly Ser Leu Ala Val Gly Ser Leu Leu Tyr Leu Val Ala Arg Val Gly 20 25 30 Ser Leu Asp Arg Leu Gln Pro Ile Cys Pro Val Glu Ser Arg Phe Gly 35 40 45 Gly Ala His Asn Gln Ala Glu Leu Pro Leu Arg Ala Leu Gln Phe Lys 50 55 60 Arg Gly Leu Leu His Glu Phe Arg Lys Gly Asn Ser Ser Lys Glu Gln 65 70 75 80 Val His Leu His Asp Leu Val Gln Gln Leu Pro Lys Ala Ile Ile Ile 85 90 95 Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu Asn Leu 100 105 110 His Pro Ala Val Val Lys Ala Ser Gln Glu Ile His Phe Phe Asp Asn 115 120 125 Asp Glu Asn Tyr Ala Lys Gly Ile Glu Trp Tyr Arg Lys Lys Met Pro 130 135 140 Phe Ser Tyr Pro Gln Gln Ile Thr Ile Glu Lys Ser His Ser Tyr Phe 145 150 155 160 Ile Thr Glu Glu Val Pro Glu Arg Ile Tyr Lys Met Asn Ser Ser Ile 165 170 175 Lys Leu Leu Ile Ile Val Arg Glu Pro Thr Thr Arg Ala Ile Ser Ala 180 185 190 Tyr Thr His Met Leu Glu Gly Lys Glu Arg Lys Asn Lys Thr Tyr Tyr 195 200 205 Lys Phe Glu Lys Leu Ala Ile Asp Pro Asn Thr Cys Glu Val Asn Thr 210 215 220 Lys Tyr Thr Gly Val Arg Thr Ser Ile Tyr Thr Lys His Leu Glu Arg 225 230 235 240 Trp Leu Lys Tyr Phe Pro Ile Glu Gln Phe His Ile Val Asp Gly Asp 245 250 255 Arg Leu Ile Thr Glu Pro Leu Pro Glu Leu Gln Leu Val Glu Lys Phe 260 265 270 Leu Asn Leu Pro Pro Arg Ile Ser Gln Tyr Asn Leu Tyr Phe Asn Ala 275 280 285 Thr Arg Gly Phe Tyr Cys Leu Arg Phe Asn Ile Ile Phe Asn Lys Cys 290 295 300 Leu Ala Gly Ser Lys Gly Arg Ile His Pro Glu Val Asp Pro Ser Val 305 310 315 320 Ile Thr Lys Leu Arg Lys Phe Phe His Pro Phe Asn Gln Lys Phe Tyr 325 330 335 Gln Ile Thr Gly Arg Thr Leu Asn Trp Pro 340 345 <210> 160 <211> 346 <212> PRT <213> Artificial Sequence <220> <223> Engineered glucosaminyl 3-O sulfotransferase mutant_sulfotransferase 10 <400> 160 Met Leu Phe Lys Gln Gln Val Trp Leu Arg Gln Lys Leu Leu Val Leu 1 5 10 15 Gly Ser Leu Ala Val Gly Ser Leu Leu Tyr Leu Val Ala Arg Val Gly 20 25 30 Ser Leu Asp Arg Leu Gln Pro Ile Cys Pro Val Glu Ser Arg Phe Gly 35 40 45 Gly Ala His Asn Gln Ala Glu Leu Pro Leu Arg Ala Leu Gln Phe Lys 50 55 60 Arg Gly Leu Leu His Glu Phe Arg Lys Gly Asn Ser Ser Lys Glu Gln 65 70 75 80 Val His Leu His Asp Leu Val Gln Gln Leu Pro Lys Ala Ile Ile Ile 85 90 95 Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu Asn Leu 100 105 110 His Pro Ala Val Val Lys Ala Ser Gln Glu Ile His Phe Phe Asp Asn 115 120 125 Asp Glu Asn Tyr Ala Lys Gly Ile Glu Trp Tyr Arg Lys Lys Met Pro 130 135 140 Phe Ser Tyr Pro Gln Gln Ile Thr Ile Glu Lys Ser His Ser Tyr Phe 145 150 155 160 Ile Thr Glu Glu Val Pro Glu Arg Ile Tyr Lys Met Asn Ser Ser Ile 165 170 175 Lys Leu Leu Ile Ile Val Arg Glu Pro Thr Thr Arg Ala Ile Ser Leu 180 185 190 Gly Thr His Leu Leu Glu Val Lys Glu Arg Lys Asn Lys Thr Tyr Tyr 195 200 205 Lys Phe Glu Lys Leu Ala Ile Asp Pro Asn Thr Cys Glu Val Asn Thr 210 215 220 Lys Tyr Thr Gly Val Arg Thr Ser Ile Tyr Thr Lys His Leu Glu Arg 225 230 235 240 Trp Leu Lys Tyr Phe Pro Ile Glu Gln Phe His Ile Val Asp Gly Asp 245 250 255 Arg Leu Ile Thr Glu Pro Leu Pro Glu Leu Gln Leu Val Glu Lys Phe 260 265 270 Leu Asn Leu Pro Pro Arg Ile Ser Gln Tyr Asn Leu Tyr Phe Asn Ala 275 280 285 Thr Arg Gly Phe Tyr Cys Leu Arg Phe Asn Ile Ile Phe Asn Lys Cys 290 295 300 Leu Ala Gly Ser Lys Gly Arg Ile His Pro Glu Val Asp Pro Ser Val 305 310 315 320 Ile Thr Lys Leu Arg Lys Phe Phe His Pro Phe Asn Gln Lys Phe Tyr 325 330 335 Gln Ile Thr Gly Arg Thr Leu Asn Trp Pro 340 345 <210> 161 <211> 394 <212> PRT <213> Bacteroides eggerthii <220> <221> SIGNAL <222> (1)..(22) <223> Signal Sequence <400> 161 Met Lys Lys Asn Ile Phe Ile Ile Cys Met Ala Met Ala Ala Gly Cys 1 5 10 15 Ile Thr Thr Leu Thr Ala Gln Val Lys Asn Ala Glu Thr Leu Val Pro 20 25 30 Leu Thr Lys Arg Val Asn Val Gln Ala Asp Thr Ala Arg Leu Asp Gln 35 40 45 Ile Ile Asp Gly Cys Trp Val Ala Val Gly Thr Asn Lys Lys His Ala 50 55 60 Ile Gln Arg Asp Phe Thr Arg Leu Phe Ala Gly Lys Pro Ser Tyr Arg 65 70 75 80 Phe Glu Leu Arg Lys Glu Asp Asn Thr Leu Glu Gly Tyr Gly Lys Gly 85 90 95 Glu Thr Lys Gly Arg Ala Glu Phe Ser Tyr Cys Tyr Ala Thr Ser Ala 100 105 110 Asp Phe Lys Gly Leu Pro Ala Asp Ala Tyr Arg Lys Ala Gln Ile Thr 115 120 125 Lys Thr Val Tyr His His Gly Lys Gly Ile Cys Pro Gln Gly Val Ser 130 135 140 Arg Asp Tyr Glu Phe Ser Val Tyr Ile Pro Ser Ala Leu Asp Ser Asn 145 150 155 160 Val Ser Thr Ile Phe Ala Gln Trp His Gly Met Pro Asp Arg Thr Leu 165 170 175 Val Gln Thr Pro Glu Gly Glu Val Lys Lys Leu Thr Val Asp Glu Phe 180 185 190 Leu Glu Leu Asp Lys Thr Thr Ile Phe Lys Lys Asn Thr Gly His Glu 195 200 205 Lys Val Ala Lys Leu Asp Lys Gln Gly Asn Pro Val Lys Asp Lys Lys 210 215 220 Gly Asn Pro Val Tyr Lys Ala Gly Lys Lys Asn Gly Trp Leu Val Glu 225 230 235 240 Gln Gly Gly Tyr Pro Pro Leu Ala Phe Gly Phe Ser Gly Gly Trp Phe 245 250 255 Tyr Ile Lys Ala Asn Ser Asp Arg Arg Trp Leu Thr Asp Lys Thr Asp 260 265 270 Arg Cys Asn Ala Ser Pro Glu Lys Thr Pro Val Met Lys Pro Val Thr 275 280 285 Ser Lys Tyr Lys Ser Ser Thr Ile Ala Tyr Lys Met Pro Phe Ala Asp 290 295 300 Phe Pro Lys Asp Cys Trp Val Thr Phe Arg Val His Ile Asp Trp Thr 305 310 315 320 Thr Tyr Gly Lys Glu Ala Glu Asn Ile Val Lys Pro Gly Lys Leu Asp 325 330 335 Val Gln Met Glu Tyr Thr Asp Lys Lys Lys Thr Val Lys Glu His Ile 340 345 350 Val Asn Asn Glu Val Ile Gln Ile Gly Arg Asn Asp Asp Asp Gly Tyr 355 360 365 Tyr Phe Lys Phe Gly Ile Tyr Arg Val Gly Asn Ser Thr Val Pro Val 370 375 380 Cys Tyr Asn Leu Ala Gly Tyr Lys Glu Glu 385 390 <210> 162 <211> 773 <212> PRT <213> Bacteroides eggerthii <220> <221> SIGNAL <222> (1)..(22) <223> Signal Sequence <400> 162 Met Lys Lys Ser Ile Leu Phe Ile Thr Ser Leu Phe Leu Cys Ile Phe 1 5 10 15 Cys Leu Lys Ser Asn Ala Gln Gln Ser Arg Thr Glu Val Thr Trp Glu 20 25 30 Lys Met Glu Asp Val Thr Val Pro Ile Pro Pro Gln Val His Pro Arg 35 40 45 Leu Tyr Val Arg Ser Ala Asp Leu Pro Asp Leu Lys Lys Arg Met Asn 50 55 60 His Pro His Val Lys Glu Val Leu Ala Thr Leu Asn Lys Leu Gly Lys 65 70 75 80 Asp Arg Thr Pro Glu Glu Glu Ala Lys Val Lys Asp Arg Gly Phe Arg 85 90 95 Tyr Tyr Phe Glu Met Arg Gly Val Thr Ser Arg Val Gln Val Gln Ala 100 105 110 Leu Glu Tyr Leu Val Tyr Gly Asp Lys Lys Gln Ala Arg Arg Ala Ile 115 120 125 Thr Ala Met Leu Asp Thr Leu Gln Asn Val Asn Tyr Gly Thr Gln Gly 130 135 140 Asp Leu Ser Arg Ala Ser Gly Val Met Leu Thr Cys Gly Ala Met Val 145 150 155 160 Tyr Asp Trp Cys Tyr Asp Gln Met Lys Glu Ser Glu Lys Lys Ala Tyr 165 170 175 Val Glu Ser Phe Ile Arg Ile Ala Lys Thr Met Glu Cys Gly Tyr Pro 180 185 190 Pro Arg Asn Asn Glu Pro Ile Ala Gly His Ser Ser Glu Trp Met Ile 195 200 205 Leu Arg Asp Met Leu Ser Ala Gly Ile Ala Ile Tyr Asp Glu Tyr Pro 210 215 220 Asp Met Tyr Asn Tyr Val Ile Lys Met Met Phe Lys Asp Tyr Leu Pro 225 230 235 240 Val Arg Asn Tyr Ile Tyr Ser Gly His Asn Tyr His Gln Gly Thr Ser 245 250 255 Tyr Val Asn Val Arg Phe Ser Asn Asp Leu Phe Ser Leu Trp Ile Leu 260 265 270 Gln Arg Met Gly Ala Gly Ala Ile Tyr Asn Pro Ala Gln Gln Phe Val 275 280 285 Leu Tyr Asp Phe Leu Tyr Arg Arg Arg Pro Asp Gly Gln Val Met Pro 290 295 300 Ala Gly Asp Thr Asn Pro Ile Arg Lys Asn Thr Pro Ser Tyr Ser Leu 305 310 315 320 Pro Ala Met Leu Ala Ser Ser Phe Tyr Lys Asp Ser Tyr Leu Ala Tyr 325 330 335 Glu Tyr Glu Arg Lys Pro Asn Ile Glu Arg His Cys Leu Ile Phe Asp 340 345 350 Ile Leu Trp Arg Asp Leu Asp Leu Lys Ala Lys Ala Pro Asp Asp Leu 355 360 365 Pro Leu Thr Arg Tyr Ser Gly Ser Pro Phe Gly Trp Met Ile Ala Arg 370 375 380 Thr Ala Trp Asp Glu Asn Ser Val Ile Ala Glu Met Lys Ile Asn Glu 385 390 395 400 Gln Phe Val Gly Asn His Gln His Leu Asp Gly Gly Ser Phe Gln Leu 405 410 415 Tyr Tyr Lys Gly Pro Leu Ala Ile Asp Ala Gly Ala Tyr Gln Gly Ser 420 425 430 Ser Gly Gly Tyr Asn Ser Pro His Asn Lys Asn Phe Phe Lys Arg Thr 435 440 445 Ile Ala His Asn Ser Leu Leu Val Tyr Asn Pro Asp Glu Lys Phe Ala 450 455 460 Cys Trp Asn Tyr Gly Gly Gly Gly Lys Thr Glu Phe Ala Ala Asn Asp 465 470 475 480 Gly Gly Gln Arg Met Pro Gly Asp Arg Trp Glu Thr Cys Arg Ser Phe 485 490 495 Lys Gln Leu Met Ser Lys Asp Tyr Thr Thr Gly Lys Ala Leu Ala His 500 505 510 Gly Phe Gly Pro Asp Ala Cys Lys Pro Asp Tyr Ser Tyr Leu Lys Gly 515 520 525 Asp Ile Thr Gln Ala Tyr Thr Asp Lys Val Lys Glu Ala Lys Arg Ser 530 535 540 Phe Val Phe Leu Asn Leu His Ser Thr Glu Val Pro Gly Ala Leu Ile 545 550 555 560 Val Phe Asp Lys Val Val Ser Ser Asp Pro Gln Phe Lys Lys Phe Trp 565 570 575 Leu Leu His Ser Ile Glu Glu Pro Val Ile Glu Gly Asp Arg Phe Ile 580 585 590 Ile Arg Arg Thr Lys Asn Gly Asp Thr Gly Met Leu Gln Asn Gln Val 595 600 605 Leu Leu Pro Glu Ala Gly Asn Ala Gln Ile Glu Lys Val Gly Gly Lys 610 615 620 Gly Lys Glu Phe Trp Val Phe Gly Thr Asn Tyr Pro Asn Asp Ala Leu 625 630 635 640 Pro Asn Arg Pro Asp Asp Ala Asn Glu Arg Gly Ala Trp Arg Val Glu 645 650 655 Val Ser Pro Ala Val Pro Ala Ala Glu Asn Tyr Phe Leu Asn Val Ile 660 665 670 Gln Val Ala Asp Asn Thr Cys Lys Arg Met Asn Asp Val Lys Arg Ile 675 680 685 Asp Ala Gly Lys Val Val Gly Val Gln Ile Ala Asp Arg Ile Val Thr 690 695 700 Phe Ser Lys Asn Ser Leu Pro Leu Ser Gly Lys Ile Asp Met Lys Val 705 710 715 720 Asp Gly Asn Thr Ser Met Lys Phe Val Ile Thr Asp Leu Ile Pro Gly 725 730 735 Thr Trp Gln Ile Lys Lys Asp Gly Lys Val Tyr Ile Pro Ala Met Glu 740 745 750 Val Arg Ser Asp Asp Gly Ile Leu Ser Phe Glu Gly Thr Ala Gly His 755 760 765 Tyr Glu Phe Leu Arg 770 <210> 163 <211> 666 <212> PRT <213> Bacteroides eggerthii <220> <221> SIGNAL <222> (1)..(21) <223> Signal Sequence <400> 163 Met Lys Ile Met Lys Phe Ile Leu Ser Val Phe Leu Leu Thr Ile Ala 1 5 10 15 Ile Ile Ala Asp Ala Gln Gln Leu Arg Lys Glu Ala Phe Asp Leu Leu 20 25 30 Asn Leu Asp Tyr Pro Gly Leu Glu Lys Val Lys Thr Ala Cys Ser Arg 35 40 45 Gln Gln Trp Glu Glu Ala Ala Gln Glu Leu Leu Ala Tyr Tyr Arg Asn 50 55 60 Arg Thr Asp Ile Ala His Pro Asp Ile Asp Leu Lys Asn Leu Ala Ile 65 70 75 80 Ser Lys Glu Glu Gln Lys Trp Ala Asp Asp Ala Met Asp His Thr Phe 85 90 95 Phe Val His Lys Gly Tyr Gln Pro Ser Tyr Asn Tyr Gly Lys Asp Ile 100 105 110 Asn Trp Glu Tyr Trp Pro Val Lys Asp Asn Glu Leu Arg Trp Gln Leu 115 120 125 His Arg His Lys Trp Phe Thr Pro Met Gly Lys Ala Tyr Arg Ile Ser 130 135 140 Gly Asp Glu Lys Tyr Ala Lys Glu Trp Ala Phe Gln Tyr Ile Asp Trp 145 150 155 160 Ile Lys Lys Asn Pro Leu Val Lys Met Glu Lys Glu Asn Phe Glu Leu 165 170 175 Val Ser Ala Gly Glu Val Lys Glu Asp Ala Asp Asn Val His Phe Ala 180 185 190 Trp Arg Gln Leu Glu Val Ser Asn Arg Leu Gln Asp Gln Thr Cys Gln 195 200 205 Phe Leu Leu Phe Cys Pro Ala Glu Ala Phe Thr Pro Glu Phe Leu Thr 210 215 220 Glu Phe Leu Val Asn Tyr His Arg His Gly Ala Tyr Leu Phe Lys Asn 225 230 235 240 Tyr Ser Ala Glu Gly Asn His Leu Leu Phe Glu Ala Gln Arg Met Val 245 250 255 Tyr Ala Gly Val Phe Phe Pro Glu Phe Lys Asp Ala Ala Thr Trp Arg 260 265 270 Glu Ser Gly Ile Asn Ile Leu Asn Arg Glu Ile Lys Lys Gln Val Tyr 275 280 285 Asp Asp Gly Gly Gln Tyr Glu Leu Asp Pro His Tyr His Leu Ala Ala 290 295 300 Ile Asn Ile Phe Cys Lys Ala Leu Arg Met Ala Asp Cys Asn Gly Phe 305 310 315 320 Arg Asn Glu Phe Pro Ala Glu Tyr Leu Asp Thr Val Lys Lys Met Ile 325 330 335 Glu Phe Tyr Thr Asn Ile Cys Phe Pro Asp Tyr Thr Asn Pro Cys Phe 340 345 350 Ser Asp Ala Lys Leu Gly Asp Tyr Lys Ser Glu Leu Ala Asn Tyr Arg 355 360 365 Asp Trp Val Thr Leu Phe Pro Asp Ser Glu Trp Ile Arg Tyr Tyr Ala 370 375 380 Thr Glu Gly Arg Glu Gly Ala Pro Leu Pro Tyr Leu Ser His Gly Ser 385 390 395 400 Leu Ala Ser Gly Phe Phe Thr Phe Arg Ser Gly Trp Lys Lys Asp Ala 405 410 415 Ala Val Val Val Val Lys Ala Gly Pro Lys Gly Glu Trp His Cys Gln 420 425 430 Pro Asp Asn Gly Thr Phe Glu Phe Trp Phe Asn Gly Lys Asn Leu Phe 435 440 445 Pro Asp Ser Gly Ala Tyr Val Tyr Ala Gly Ser Asp Glu Val Met Lys 450 455 460 Leu Arg Asn Trp Phe Arg Gln Thr Arg Val His Asn Thr Leu Thr Leu 465 470 475 480 Asp Gly Arg Asn Phe Glu Thr Thr Gln Ser Val Thr Lys Leu Trp Gln 485 490 495 Pro Glu Gly Arg Glu Gln Ile Leu Val Thr Glu Asn Pro Ser Tyr Gln 500 505 510 Gly Leu Lys His Arg Arg Thr Val Phe Phe Val Glu Gln Thr Tyr Tyr 515 520 525 Val Ile Val Asp Glu Ala Val Gly Asp Ala Lys Gly Thr Val Asn Leu 530 535 540 Asn Tyr His Phe Cys Glu Gly Thr Val Asn Val Asp Val Lys Lys Asn 545 550 555 560 Met Ala Thr Thr Ala Tyr Ala Gly Pro Ser Asn Val Lys Leu Gln Cys 565 570 575 Phe Pro Glu Lys Lys Ala Ser Leu Lys Lys Glu Glu Gly Trp Arg Ser 580 585 590 Ile Ala Tyr Arg Gln Arg Val Pro Arg Thr Ser Leu Ser Phe Asp Ile 595 600 605 His Lys Asp Asp Ala Glu Ala Val Arg Tyr Ile Thr Val Ile Tyr Pro 610 615 620 Val Lys Asp Ala Ala Ser Tyr Pro Val Leu Lys Ala Lys Phe Leu Asn 625 630 635 640 Lys Asp Phe Asp Glu Lys Gly Val Lys Val Glu Val Ser Val Asn Gly 645 650 655 Val Ala Arg Gln Leu Met Ser Gln Leu Lys 660 665

Claims (49)

  1. 아릴 설페이트 화합물로부터 헤파로산-계 다당류로 설포 그룹을 촉매적으로 전달하는 생물학적 활성을 갖는 가공된(engineered), 생물학적으로 활성인 설포트랜스퍼라제 효소로서,
    여기서 아릴 설페이트 화합물은 바람직하게는 p-니트로페닐 설페이트, 4-메틸움벨리페릴 설페이트, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 2-나프틸 설페이트, 및 4-니트로카테콜 설페이트로부터 선택되고, 보다 바람직하게는 p-니트로페닐 설페이트 또는 4-니트로카테콜 설페이트이고;
    여기서 설포트랜스퍼라제 효소의 생물학적 활성은 글루코사미닐 N-설포트랜스퍼라제 활성, 헥수로닐 2-O 설포트랜스퍼라제 활성, 글루코사미닐 6-O 설포트랜스퍼라제 활성, 및 글루코사미닐 3-O 설포트랜스퍼라제 활성으로 이루어진 그룹으로부터 선택되는, 가공된, 생물학적으로 활성인 설포트랜스퍼라제 효소.
  2. 제1항에 있어서,
    설포트랜스퍼라제 효소가 바람직하게는 하기 화학식 II의 구조를 포함하는 헤파로산-계 다당류와 함께, 글루코사미닐 N-설포트랜스퍼라제 생물학적 활성을 갖는, 설포트랜스퍼라제 효소:
    [화학식 II]
    Figure pct00041

    상기 화학식 II에서,
    n은 정수이고, R은 수소 원자 또는 설포 그룹, 바람직하게는 수소 원자임.
  3. 제2항에 있어서,
    설포트랜스퍼라제 효소가 효소 부류(Enzyme Class)(EC) 2.8.2.8 내 천연의 글루코사미닐 N-설포트랜스퍼라제 효소 중 어느 하나의 아미노산 서열과 적어도 80% 서열 동일성(sequence identity)을 갖는 아미노산 서열을 포함하는, 설포트랜스퍼라제 효소.
  4. 제3항에 있어서,
    설포트랜스퍼라제 효소가 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 및 서열 번호: 15로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는, 설포트랜스퍼라제 효소.
  5. 제3항에 있어서,
    설포트랜스퍼라제 효소가 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 및 서열 번호: 25로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는, 설포트랜스퍼라제 효소.
  6. 제1항에 있어서,
    설포트랜스퍼라제 효소가 바람직하게는 하기 화학식 V의 구조를 포함하는 헤파로산-계 다당류와 함께, 헥수로닐 2-O 설포트랜스퍼라제 생물학적 활성을 갖는, 설포트랜스퍼라제 효소:
    [화학식 V]
    Figure pct00042
  7. 제6항에 있어서,
    설포트랜스퍼라제 효소가 EC 2.8.2.- 내 천연의 헥수로닐 2-O 설포트랜스퍼라제 효소 중 어느 하나의 아미노산 서열과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는, 설포트랜스퍼라제 효소.
  8. 제7항에 있어서,
    설포트랜스퍼라제 효소가 서열 번호: 63, 및 서열 번호: 65로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는, 설포트랜스퍼라제 효소.
  9. 제7항에 있어서,
    설포트랜스퍼라제 효소가 서열 번호: 68, 및 서열 번호: 69로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는, 설포트랜스퍼라제 효소.
  10. 제1항에 있어서,
    설포트랜스퍼라제 효소가 바람직하게는 하기 화학식 VIII의 구조를 포함하는 헤파로산-계 다당류와 함께, 글루코사미닐 6-O 설포트랜스퍼라제 생물학적 활성을 갖는 설포트랜스퍼라제 효소:
    [화학식 VIII]
    Figure pct00043

    상기 화학식 VIII에서,
    X는 상기 화학식 VIII 내 임의의 헥수론산 잔기로부터 선택될 수 있다.
  11. 제10항에 있어서,
    설포트랜스퍼라제 효소가 EC 2.8.2.- 내 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소 중 어느 하나의 아미노산 서열과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는, 설포트랜스퍼라제 효소.
  12. 제11항에 있어서,
    설포트랜스퍼라제 효소가 서열 번호: 104, 서열 번호: 106, 및 서열 번호: 108로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는, 설포트랜스퍼라제 효소.
  13. 제11항에 있어서,
    설포트랜스퍼라제 효소가 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 및 서열 번호: 122로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는, 설포트랜스퍼라제 효소.
  14. 제1항에 있어서,
    설포트랜스퍼라제 효소가 바람직하게는 하기 화학식 X의 구조를 포함하는 헤파로산-계 다당류와 함께, 글루코사미닐 3-O 설포트랜스퍼라제 생물학적 활성을 갖는, 설포트랜스퍼라제 효소:
    [화학식 X]
    Figure pct00044

    상기 화학식 X에서,
    X는 설포 그룹 또는 아세테이트 그룹 중 어느 하나이고, Y는 설포 그룹 또는 하이드록실 그룹이다.
  15. 제14항에 있어서,
    설포트랜스퍼라제 효소가 EC 2.8.2.23 내 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소 중 어느 하나의 아미노산 서열과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는, 설포트랜스퍼라제 효소.
  16. 제15항에 있어서,
    설포트랜스퍼라제 효소가 서열 번호: 147, 서열 번호: 149, 및 서열 번호: 151로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는, 설포트랜스퍼라제 효소.
  17. 제15항에 있어서,
    설포트랜스퍼라제 효소가 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160으로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는, 설포트랜스퍼라제 효소.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서,
    아릴 설페이트 화합물이 p-니트로페닐 설페이트인, 설포트랜스퍼라제 효소.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서,
    아릴 설페이트 화합물이 4-니트로카테콜 설페이트인, 설포트랜스퍼라제 효소.
  20. 제1항 내지 제19항 중 어느 한 항에 따른 설포트랜스퍼라제 효소 중 어느 하나를 암호화하는 뉴클레오타이드 서열을 포함하는, 단리된 핵산 분자.
  21. 제20항에 있어서,
    단리된 핵산 분자가 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 62, 서열 번호: 64, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 148, 서열 번호: 150, 및 서열 번호: 152로 이루어진 그룹으로부터 선택된 뉴클레오타이드 서열을 포함하는, 단리된 핵산 분자.
  22. 제20항에 따른 임의의 단리된 핵산 분자를 포함하는 벡터.
  23. 제22항에 있어서,
    벡터가 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 62, 서열 번호: 64, 서열 번호: 105, 서열 번호: 107, 서열 번호: 109, 서열 번호: 148, 서열 번호: 150, 및 서열 번호: 152로 이루어진 그룹으로부터 선택된 뉴클레오타이드 서열을 포함하는, 벡터.
  24. 제22항 또는 제23항에 있어서,
    벡터가 에스케리키아 콜라이(Escherichia coli)(이. 콜라이(E. coli))로부터의 malE 유전자를 추가로 포함하는 벡터.
  25. 제22항 또는 제23항에 있어서,
    벡터가 작은 유비퀴틴-관련 개질제(small ubiquitin-related modifier)(SUMO) 단백질을 암호화하는 유전자, 바람직하게는 SUMO1 유전자를 추가로 포함하는 벡터.
  26. 제22항 내지 제25항 중 어느 한 항에 따른 벡터를 포함하는 단리된 숙주 세포.
  27. 제26항에 있어서,
    단리된 숙주 세포가 세균 세포, 효모 세포, 곤충 세포, 및 포유동물 세포로 이루어진 그룹으로부터 선택되고, 바람직하게는 이. 콜라이 숙주 세포인 단리된 숙주 세포.
  28. 설포 그룹을 헤파로산-계 다당류에 효소적으로 전달하여 황산화된 다당류 생성물을 형성시키는 방법으로서, 당해 방법이:
    p-니트로페닐 설페이트, 4-메틸움벨리페릴 설페이트, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 2-나프틸 설페이트, 및 4-니트로카테콜 설페이트로 이루어진 그룹으로부터 선택된 아릴 설페이트 화합물을 제공하는 단계;
    제1항 내지 제19항 중 어느 한 항에 따른 가공된 설포트랜스퍼라제 효소 중 어느 하나를 제공하는 단계,
    헤파로산-계 다당류를 제공하는 단계;
    아릴 설페이트 화합물, 설포트랜스퍼라제 효소, 및 헤파로산-계 다당류를 반응 혼합물내로 조합하는 단계; 및
    설포트랜스퍼라제 효소를 사용하여, 아릴 설페이트 화합물로부터 헤파로산-계 다당류로 설포 그룹을 전달함으로써, 황산화된 다당류 생성물을 형성시키는 단계를 포함하는 방법.
  29. 제28항에 있어서,
    설포트랜스퍼라제 효소가 글루코사미닐-N-설포트랜스퍼라제 효소이고, 헤파로산-계 다당류가 화학식 II의 구조를 포함하는 방법.
  30. 제29항에 있어서,
    설포트랜스퍼라제 효소가 EC 2.8.2.8 내 임의의 천연의 글루코사미닐-N-설포트랜스퍼라제 효소의 아미노산 서열과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 방법.
  31. 제30항에 있어서,
    설포트랜스퍼라제 효소가 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 및 서열 번호: 15로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는 방법.
  32. 제30항에 있어서,
    설포트랜스퍼라제 효소가 서열 번호: 18, 서열 번호: 19, 서열 번호: 20, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 및 서열 번호: 25로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는 방법.
  33. 제28항에 있어서,
    설포트랜스퍼라제 효소가 헥수로닐-2-O 설포트랜스퍼라제 효소이고, 헤파로산-계 다당류가 화학식 IV 및/또는 화학식 V의 구조를 포함하는 방법.
  34. 제33항에 있어서,
    설포트랜스퍼라제 효소가 EC 2.8.2.- 내 천연의 헥사루로닐 2-O 설포트랜스퍼라제 효소 중 어느 하나의 아미노산 서열과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 방법.
  35. 제34항에 있어서,
    설포트랜스퍼라제 효소가 서열 번호: 63, 및 서열 번호: 65로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는 방법.
  36. 제34항에 있어서,
    설포트랜스퍼라제 효소가 서열 번호: 68, 및 서열 번호: 69로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는 방법.
  37. 제33항 내지 제36항 중 어느 한 항에 있어서,
    방법이 글루쿠로닐 C5-에피머라제, 바람직하게는 서열 번호: 67의 아미노산 서열을 포함하는 글루쿠로닐 C5-에피머라제, 및 바람직하게는 서열 번호: 67의 아미노산 잔기 34-617을 포함하는 글루쿠로닐 C5-에피머라제를 제공하는 단계를 추가로 포함하는 방법.
  38. 제28항에 있어서,
    설포트랜스퍼라제 효소가 글루코사미닐 6-O 설포트랜스퍼라제 효소이고, 헤파로산-계 다당류가 화학식 VIII의 구조를 포함하는 방법.
  39. 제38항에 있어서,
    설포트랜스퍼라제 효소가 EC 2.8.2.- 내 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소 중 어느 하나의 아미노산 서열과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 방법.
  40. 제39항에 있어서,
    설포트랜스퍼라제 효소가 서열 번호: 104, 서열 번호: 106, 및 서열 번호: 108로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는 방법.
  41. 제39항에 있어서,
    설포트랜스퍼라제 효소가 서열 번호: 112, 서열 번호: 113, 서열 번호: 114, 서열 번호: 115, 서열 번호: 116, 서열 번호: 117, 서열 번호: 118, 서열 번호: 119, 서열 번호: 120, 서열 번호: 121, 및 서열 번호: 122로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는 방법.
  42. 제28항에 있어서,
    설포트랜스퍼라제 효소가 글루코사미닐-3-O 설포트랜스퍼라제 효소이고, 헤파로산-계 다당류가 화학식 X의 구조를 포함하는 방법.
  43. 제42항에 있어서,
    설포트랜스퍼라제 효소가 EC 2.8.2.23 내 천연의 글루코사미닐 3-O 설포트랜스퍼라제 효소 중 어느 하나의 아미노산 서열과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 방법.
  44. 제43항에 있어서,
    설포트랜스퍼라제 효소가 서열 번호: 147, 서열 번호: 149, 및 서열 번호: 151로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는 방법.
  45. 제43항에 있어서,
    설포트랜스퍼라제 효소가 서열 번호: 154, 서열 번호: 155, 서열 번호: 156, 서열 번호: 157, 서열 번호: 158, 서열 번호: 159, 및 서열 번호: 160으로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는 방법.
  46. 제42항 내지 제45항 중 어느 한 항에 있어서,
    황산화된 다당류 생성물이 하기 화학식 I의 구조를 포함하는 방법:
    [화학식 I]
    Figure pct00045

    상기 화학식 I에서,
    X는 설포 그룹 또는 아세테이트 그룹 중 어느 하나이고 Y는 설포 그룹 또는 하이드록실 그룹임.
  47. 제46항에 있어서,
    황산화된 다당류 생성물이 항응고 활성을 갖는 방법.
  48. 제28항 내지 제47항 중 어느 한 항에 있어서,
    아릴 설페이트 화합물이 p-니트로페닐 설페이트인 방법.
  49. 제28항 내지 제47항 중 어느 한 항에 있어서,
    아릴 설페이트 화합물이 4-니트로카테콜 설페이트인 방법.
KR1020217025890A 2019-01-15 2020-01-15 엔지니어링된 아릴 설페이트-의존 효소 KR20210126019A (ko)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201962792440P 2019-01-15 2019-01-15
US62/792,440 2019-01-15
US201962797466P 2019-01-28 2019-01-28
US62/797,466 2019-01-28
US201962808074P 2019-02-20 2019-02-20
US62/808,074 2019-02-20
US201962853261P 2019-05-28 2019-05-28
US62/853,261 2019-05-28
PCT/US2020/013677 WO2020150350A1 (en) 2019-01-15 2020-01-15 Engineered aryl sulfate-dependent enzymes

Publications (1)

Publication Number Publication Date
KR20210126019A true KR20210126019A (ko) 2021-10-19

Family

ID=69529057

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217025890A KR20210126019A (ko) 2019-01-15 2020-01-15 엔지니어링된 아릴 설페이트-의존 효소

Country Status (10)

Country Link
US (9) US11572549B2 (ko)
EP (1) EP3911737A1 (ko)
JP (1) JP2022523638A (ko)
KR (1) KR20210126019A (ko)
CN (1) CN113646427A (ko)
AU (1) AU2020209822A1 (ko)
BR (1) BR112021013890A2 (ko)
CA (1) CA3126805A1 (ko)
MX (1) MX2021008479A (ko)
WO (1) WO2020150350A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112022000255A8 (pt) * 2019-07-09 2022-03-22 Optimvia Llc Métodos para sintetizar polissacarídeos anticoagulantes
EP4182452A4 (en) 2020-07-14 2024-07-31 Optimvia Llc METHOD FOR THE SYNTHESIS OF NON-ANTICOAGULATING HEPARAN SULFATE
CN114763570B (zh) * 2021-09-10 2024-02-27 江南大学 制备不同分子量肝素的磺酸化修饰体系构建及其应用

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4554101A (en) 1981-01-09 1985-11-19 New York Blood Center, Inc. Identification and preparation of epitopes on antigens and allergens on the basis of hydrophilicity
US5541095A (en) 1992-06-16 1996-07-30 University Of Massachusetts Medical Center Glycosaminoglycan specific sulfotransferases
JP3818676B2 (ja) 1994-07-22 2006-09-06 生化学工業株式会社 ヘパラン硫酸6−o−硫酸基転移酵素
US5919673A (en) 1995-03-22 1999-07-06 The Scripps Research Institute One-pot enzymatic sulfation process using 3'-phosphoadenosine-5'-phosphosulfate and recycled phosphorylated adenosine intermediates
JP3672359B2 (ja) 1995-07-24 2005-07-20 生化学工業株式会社 ヘパラン硫酸 2−o−硫酸基転移酵素
JP3964982B2 (ja) 1997-06-19 2007-08-22 生化学工業株式会社 ヘパラン硫酸6−o硫酸基転移酵素のポリペプチド及びそれをコードするdna
US6861254B1 (en) 1997-10-24 2005-03-01 Massachusetts Institute Of Technology Heparan sulfate D-glucosaminyl 3-O-sulfotransferases, and uses therefor
US8088604B2 (en) 1998-04-02 2012-01-03 The Board Of Regents Of The University Of Oklahoma Production of defined monodisperse heparosan polymers and unnatural polymers with polysaccharide synthases
US7307159B2 (en) 2001-05-08 2007-12-11 The Board Of Regents Of The University Of Oklahoma Heparin/heparosan synthase from P. multocida and methods of making and using same
US20060188966A1 (en) 1998-04-02 2006-08-24 Deangelis Paul L Natural, chimeric and hybrid glycosaminoglycan polymers and methods of making and using same
MXPA00012586A (es) 1998-06-16 2004-05-21 Univ Oklahoma Glicosulfopeptidos y metodos de sintesis y uso de los mismos.
US6255088B1 (en) 1999-05-11 2001-07-03 The Scripps Research Institute Enzymatic sulfation of biomolecules
DE10002005A1 (de) 2000-01-19 2001-08-09 Bosch Gmbh Robert Zerstäubungsdüse
ITMI20010397A1 (it) 2001-02-27 2002-08-27 Giorgio Zoppetti Derivati altamente n,o-solfatati del polisaccaride k5 e loro preparazione
CA2441984A1 (en) 2001-03-28 2002-10-10 Massachusetts Institute Of Technology Methods of 6-o-sulfating polysaccharides and 6-o-sulfated polysaccharide preparations
US8580290B2 (en) 2001-05-08 2013-11-12 The Board Of Regents Of The University Of Oklahoma Heparosan-based biomaterials and coatings and methods of production and use thereof
AU2003247808A1 (en) 2002-07-05 2004-01-23 Anders Malmstrom Purified and isolated heparan sulfate 3-o-sulfotransferase isoform 5 nucleic acids and polypeptides and therapeutic and screening methods using same
US20040147469A1 (en) 2002-11-01 2004-07-29 Case Western Reserve University Methods of inhibiting glial scar formation
WO2004050673A2 (en) 2002-11-27 2004-06-17 Massachusetts Institute Of Technology Methods for synthesizing polysaccharides
US7655445B2 (en) * 2003-11-12 2010-02-02 Massachusetts Institute Of Technology Methods for synthesis of sulfated saccharides
WO2006023487A2 (en) 2004-08-16 2006-03-02 Massachusetts Institute Of Technology Rapid two-step synthesis of anti-coagulants
WO2006083328A2 (en) 2004-09-15 2006-08-10 Massachusetts Institute Of Technology Biologically active surfaces and methods of their use
US20070020243A1 (en) 2005-01-12 2007-01-25 Massachusetts Institute Of Technology Methods and compositions related to modulating the extracellular stem cell environment
WO2006124801A2 (en) 2005-05-12 2006-11-23 The University Of North Carolina At Chapel Hill Enzymatic synthesis of sulfated polysaccharides
BRPI0612687B1 (pt) 2005-07-05 2019-05-14 Huawei Technologies Co., Ltd. Método de autenticação em subsistema multimídia ip
WO2009014715A2 (en) 2007-07-23 2009-01-29 The University Of North Carolina At Chapel Hill Enzymatic synthesis of sulfated polysaccharides without iduronic acid residues
JP2011526925A (ja) 2008-07-01 2011-10-20 ザカロン ファーマシューティカルズ,インク. ヘパラン硫酸阻害剤
CN101724086B (zh) 2009-11-25 2012-09-26 深圳海王药业有限公司 低聚凤梨参糖胺聚糖及其制备方法
WO2012088416A2 (en) 2010-12-23 2012-06-28 The University Of North Carolina At Chapel Hill Chemoenzymatic synthesis of structurally homogeneous ultra-low molecular weight heparins
TW201309305A (zh) 2011-02-22 2013-03-01 Rensselaer Polytech Inst 用於製造生物工程肝素之單一步驟肝素前體之n-去乙醯化作用及解聚合作用
US8815529B2 (en) 2011-05-23 2014-08-26 Research & Diagnostics Systems, Inc. Sulfotransferase assay
ES2661575T3 (es) 2012-03-30 2018-04-02 The Board Of Regents Of The University Of Oklahoma Producción de polímeros de heparosano de peso molecular alto y métodos de producción y uso de los mismos
US20140349962A1 (en) 2013-05-24 2014-11-27 Massachusetts Institute Of Technology Rapid two-step synthesis of anti-coagulants
US9951149B2 (en) 2013-06-17 2018-04-24 The University Of North Carolina At Chapel Hill Reversible heparin molecules and methods of making and using the same
EP3183355B1 (en) 2014-08-22 2019-11-06 CysBio ApS Biological process for the production of a sulfated phenolic compound
ES2869525T3 (es) 2015-12-28 2021-10-25 Ajinomoto Kk Método para producir heparán sulfato que presenta una actividad anticoagulante
WO2017144671A1 (en) 2016-02-24 2017-08-31 Danmarks Tekniske Universitet Improved biological processes for the production of aryl sulfates
TWI769176B (zh) 2016-09-07 2022-07-01 瑞瑟勒綜合技術協會 生合成肝素
EP3572522A4 (en) 2017-01-19 2020-10-28 Ajinomoto Co., Inc. PROCESS FOR THE PRODUCTION OF A HEPAROSANE COMPOUND CONTAINING A RESIDUE OF ISOMERIZED HEXULONIC ACID
CN116622006A (zh) 2017-03-10 2023-08-22 北卡罗来纳大学查珀尔希尔分校 短效的基于肝素的抗凝血剂化合物和方法
EP3679147B1 (en) 2017-09-05 2024-08-21 Ajinomoto Co., Inc. 2-o-sulfation enzyme mutant and 3-o-sulfation enzyme mutant, and method for using same

Also Published As

Publication number Publication date
EP3911737A1 (en) 2021-11-24
US20210363505A1 (en) 2021-11-25
US20230029317A1 (en) 2023-01-26
US20220042062A1 (en) 2022-02-10
US11708567B2 (en) 2023-07-25
US20230051957A1 (en) 2023-02-16
JP2022523638A (ja) 2022-04-26
US11572550B2 (en) 2023-02-07
CA3126805A1 (en) 2020-07-23
US20210363504A1 (en) 2021-11-25
US20220340888A9 (en) 2022-10-27
US20240093166A1 (en) 2024-03-21
MX2021008479A (es) 2021-10-13
WO2020150350A1 (en) 2020-07-23
BR112021013890A2 (pt) 2021-09-21
US11767518B2 (en) 2023-09-26
CN113646427A (zh) 2021-11-12
US20240002819A1 (en) 2024-01-04
AU2020209822A1 (en) 2021-09-09
US11572549B2 (en) 2023-02-07
US11473068B2 (en) 2022-10-18
US11773382B2 (en) 2023-10-03
US11692180B2 (en) 2023-07-04
US20230092183A1 (en) 2023-03-23
US20210363503A1 (en) 2021-11-25

Similar Documents

Publication Publication Date Title
JP6670235B2 (ja) 可逆的ヘパリン分子、その製法及びその使用方法
US11708567B2 (en) Engineered aryl sulfate-dependent enzymes
WO2006124801A2 (en) Enzymatic synthesis of sulfated polysaccharides
US11629364B2 (en) Methods for synthesizing anticoagulant polysaccharides
EP2655421A2 (en) Chemoenzymatic synthesis of structurally homogeneous ultra-low molecular weight heparins
CN108531470B (zh) 一种硫酸岩藻多糖裂解酶tflfm及其制备方法和应用
JP2009060888A (ja) ヒアルロン酸加水分解酵素及び該酵素を用いた低分子化ヒアルロン酸の製造方法
US11708593B2 (en) Engineered aryl sulfate-dependent enzymes
US20240076634A1 (en) Engineered aryl sulfate-dependent enzymes
US20230151339A1 (en) Engineered aryl sulfate-dependent enzymes
KR20220032086A (ko) 항응고제 다당류의 합성 방법
WO2022015794A1 (en) Methods for synthesizing non-anticoagulant heparan sulfate
TW202020147A (zh) 使用腸桿菌科(Enterobacteriaceae)之細菌使醇和胺經酶催化性磺醯化之方法

Legal Events

Date Code Title Description
A201 Request for examination