KR20220032086A - 항응고제 다당류의 합성 방법 - Google Patents

항응고제 다당류의 합성 방법 Download PDF

Info

Publication number
KR20220032086A
KR20220032086A KR1020227004294A KR20227004294A KR20220032086A KR 20220032086 A KR20220032086 A KR 20220032086A KR 1020227004294 A KR1020227004294 A KR 1020227004294A KR 20227004294 A KR20227004294 A KR 20227004294A KR 20220032086 A KR20220032086 A KR 20220032086A
Authority
KR
South Korea
Prior art keywords
product
seq
sulfotransferase
enzyme
glucosaminyl
Prior art date
Application number
KR1020227004294A
Other languages
English (en)
Inventor
타시스 페레이라 게스테이라
대니얼 에이치. 라지네스
Original Assignee
옵팀비아, 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 옵팀비아, 엘엘씨 filed Critical 옵팀비아, 엘엘씨
Priority claimed from PCT/US2020/041404 external-priority patent/WO2021007429A1/en
Publication of KR20220032086A publication Critical patent/KR20220032086A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08BPOLYSACCHARIDES; DERIVATIVES THEREOF
    • C08B37/00Preparation of polysaccharides not provided for in groups C08B1/00 - C08B35/00; Derivatives thereof
    • C08B37/0003General processes for their isolation or fractionation, e.g. purification or extraction from biomass
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08BPOLYSACCHARIDES; DERIVATIVES THEREOF
    • C08B37/00Preparation of polysaccharides not provided for in groups C08B1/00 - C08B35/00; Derivatives thereof
    • C08B37/006Heteroglycans, i.e. polysaccharides having more than one sugar residue in the main chain in either alternating or less regular sequence; Gellans; Succinoglycans; Arabinogalactans; Tragacanth or gum tragacanth or traganth from Astragalus; Gum Karaya from Sterculia urens; Gum Ghatti from Anogeissus latifolia; Derivatives thereof
    • C08B37/0063Glycosaminoglycans or mucopolysaccharides, e.g. keratan sulfate; Derivatives thereof, e.g. fucoidan
    • C08B37/0069Chondroitin-4-sulfate, i.e. chondroitin sulfate A; Dermatan sulfate, i.e. chondroitin sulfate B or beta-heparin; Chondroitin-6-sulfate, i.e. chondroitin sulfate C; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08BPOLYSACCHARIDES; DERIVATIVES THEREOF
    • C08B37/00Preparation of polysaccharides not provided for in groups C08B1/00 - C08B35/00; Derivatives thereof
    • C08B37/006Heteroglycans, i.e. polysaccharides having more than one sugar residue in the main chain in either alternating or less regular sequence; Gellans; Succinoglycans; Arabinogalactans; Tragacanth or gum tragacanth or traganth from Astragalus; Gum Karaya from Sterculia urens; Gum Ghatti from Anogeissus latifolia; Derivatives thereof
    • C08B37/0063Glycosaminoglycans or mucopolysaccharides, e.g. keratan sulfate; Derivatives thereof, e.g. fucoidan
    • C08B37/0075Heparin; Heparan sulfate; Derivatives thereof, e.g. heparosan; Purification or extraction methods thereof
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08JWORKING-UP; GENERAL PROCESSES OF COMPOUNDING; AFTER-TREATMENT NOT COVERED BY SUBCLASSES C08B, C08C, C08F, C08G or C08H
    • C08J11/00Recovery or working-up of waste materials
    • C08J11/04Recovery or working-up of waste materials of polymers
    • C08J11/10Recovery or working-up of waste materials of polymers by chemically breaking down the molecular chains of polymers or breaking of crosslinks, e.g. devulcanisation
    • C08J11/105Recovery or working-up of waste materials of polymers by chemically breaking down the molecular chains of polymers or breaking of crosslinks, e.g. devulcanisation by treatment with enzymes
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08LCOMPOSITIONS OF MACROMOLECULAR COMPOUNDS
    • C08L5/00Compositions of polysaccharides or of their derivatives not provided for in groups C08L1/00 or C08L3/00
    • C08L5/10Heparin; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/13Transferases (2.) transferring sulfur containing groups (2.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y208/00Transferases transferring sulfur-containing groups (2.8)
    • C12Y208/02Sulfotransferases (2.8.2)
    • C12Y208/02008[Heparan sulfate]-glucosamine N-sulfotransferase (2.8.2.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y208/00Transferases transferring sulfur-containing groups (2.8)
    • C12Y208/02Sulfotransferases (2.8.2)
    • C12Y208/02023[Heparan sulfate]-glucosamine 3-sulfotransferase 1 (2.8.2.23)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y501/00Racemaces and epimerases (5.1)
    • C12Y501/03Racemaces and epimerases (5.1) acting on carbohydrates and derivatives (5.1.3)
    • C12Y501/03017Heparosan-N-sulfate-glucuronate 5-epimerase (5.1.3.17)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02WCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
    • Y02W30/00Technologies for solid waste management
    • Y02W30/50Reuse, recycling or recovery technologies
    • Y02W30/62Plastics recycling; Rubber recycling

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Polymers & Plastics (AREA)
  • Materials Engineering (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Sustainable Development (AREA)
  • Dermatology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Polysaccharides And Polysaccharide Derivatives (AREA)

Abstract

본 발명은, 다당류 설포 그룹 수용체로 설포 그룹 전달을 촉진하기 위하여로, 천연 기질, 3'-포스포아데노신 5'-포스포설페이트 대신에, 아릴 설페이트 화합물과 반응하도록 형성된, 몇몇 비-천연적으로 생성된, 가공된 설포트랜스퍼라제 효소를 사용하는 항응고제 다당류의 제조 방법을 포함한다. 적절한 아릴 설페이트 화합물은 p-니트로페닐 설페이트 또는 4-니트로카테콜 설페이트를 포함하나, 이에 제한되지는 않는다. 본 발명의 방법에 의해 생성된 항응고제 다당류는 N-, 3-O--, 6-O-설페이트화된 글루코사민 잔기 및 2-O 설페이트화된 헥수론산 잔기를 포함하며, 시판되는 항응고제 다당류와 비교하여 비교가능한(comparable) 항응고 활성을 가지며, 감소된 분자량을 가지는 트렁케이트된(truncated) 항응고제 다당류를 형성하도록 사용될 수 있다.

Description

항응고제 다당류의 합성 방법
[발명의 분야]
본 발명은 설포 그룹 공여체(sulfo group donor)로서, 아릴 설페이트 화합물과 반응하도록 형성된 가공된 비-천연의 설포트랜스퍼라제 효소를 사용하는 항응고제 다당류의 합성 방법에 관한 것이다.
[서열목록의 참조]
본 출원은 전자문서 형태의 서열목록과 함께 출원된다. 서열목록은 2020년 7월 9일 생성된 "OPT-002X PCT_Sequence_disclosure.txt"의 명칭의 파일로 제공되면, 크기는 175,283 byte이다. 서열목록의 전자문서 형태의 정보는 본 문서에 참조로서 통합된다.
항응고제 다당류는 혈액 응고를 방지하는 임상 세팅(clinical setting)에서 약물로서 일반적으로 처방되는 화합물의 부류이다. 전형적으로, 이러한 화합물은 동물, 예를 들면, 돼지 및 소의 장기 기관(internal organ)으로부터 단리 및 정제된다. 그러나, 최근에 전세계적인 공급망의 붕괴로 인하여(미국에서만 2007년도에 오염된 화합물의 결과로 200명 이상의 사람들이 사망하였다) 또는 전세계 공급업자와의 지정학적 긴장상태로 인하여, 시험관 내(in vitro)에서 항응고제 다당류를 합성하기 위한 최근의 압박이 시도되어 왔다.
동물 내에서, 설페이트화된(sulfated) 다당류, 예를 들어, 항응고제 활성을 지닌 설페이트화된 다당류는 설포 그룹 공여기(donor)로부터 다당류로의, "설포 그룹"으로 또한 불리는, 설페이트 작용 그룹의 촉매적 전달에 의해 합성되며, 이는 설포 그룹 수용기(acceptor)로서 작용한다. 각각의 설포 그룹은 설포트랜스퍼라제 효소에 의해 촉매되며, 흔히 다수의 설포트랜스퍼라제 효소에 의해 촉매되어 궁극적으로 각각의 설페이트화된 다당류 생성물에 도달하는 흔히 다수의 설포전달 반응이 존재한다. 설포트랜스퍼라제는 천연적으로 거의 편재되어 있으며, 이들은 거의 모든 유형의 유기체, 예를 들면, 세균, 효모, 및 사람을 포함하는 동물내에 존재한다. 유사하게, 설포트랜스퍼라제 효소는 스테로이드, 다당류, 단백질, 제노바이오틱스(xenobiotics), 및 다른 분자의 많은 유형을 포함하는, 광범위한 설포 그룹 수용체의 황산화(sulfation)에 중요한 역할을 한다.
특히 다당류와 관련하여, 더마탄, 케라탄, 헤파로산, 및 콘드로이틴을 포함하는, 설포 그룹 수용체로서 이용될 수 있는 수개의 다당류가 존재한다. 일반적으로, 항응고제 활성을 갖는 설페이트화된 다당류는 헤파로산을 기반으로 하며, 이는 1→4 글리코시드적으로 연결된 글루쿠론산 및 N-아세티로하된 글루코사민 잔기의 반복하는 이량체를 포함한다. 천연에서, 헤파로산-기반 다당류는 N-아세틸 그룹의 제거, 글루쿠론산 잔기의 입체화학의 역위(inversion), 및 설포 그룹을 다당류내 다수의 위치로 전달하는 4개의 상이한 설포트랜스퍼라제 효소와의 반응시 항응고제 활성을 획득한다.
설포 그룹 수용기의 세트 만큼 광범위하고 방대할 수 있으므로, 설포트랜스퍼라제 효소에 의해 촉매된 반응에 대해 설포 그룹 공여체로서 사용된 분자의 수는 상대적으로 적다. 가장 전형적으로, 3'-포스포아데노신 5'-포스포설페이트는 설포 그룹 공여기로서 활용되며, 다당류가 설포 그룹 수용기인 반응에서, 3'-포스포아데노신 5'-포스포설페이트는 유일하게 알려진 설포 그룹 공여기이다. 그러나, 3'-포스포아데노신 5'-포스포설페이트는 극도로 짧은 반감기를 가지고 설포트랜스퍼라제의 생물학적 활성을 활성적으로 억제하는, 아데노신 3',5'-디포스페이트로 용이하게 분해될 수 있기 때문에, 설포 그룹 공여기로서 사용하여 시험관 내에서, 특히 대규모 합성에서 설페이트화된 다당류의 효소적 합성을 촉매하기 위한 설포 그룹으로서 사용하기에는 흔히 적합하지 않다. 대조적으로, 생체내(in vivo) 시스템은, 아데노신 3',5'-디포스페이트가 3'-포스포아데노신 5'-포스포설페이트로 다시 전환되거나 설포트랜스퍼라제 활성을 억제하지 않는 더 많은 화합물로 분해될 수 있으므로, 3'-포스포아데노신 5'-포스포설페이트와 전적으로 및 효율적으로 반응하도록 발달시켜 왔다. 그 결과, 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트를 전적으로 이용하는 설포트랜스퍼라제 효소의 천연의 활성은 항응고제 다당류의 시험관내 합성에 대해 급격한 장벽을 나타낸다.
다른 한편, 아릴 설페이트 화합물, 예를 들어, p-니트로페닐 설페이트(PNS) 및 4-메틸움벨리페릴 설페이트(MUS)는 특정의 작은 분자 생성물을 합성하기 위한 설포트랜스퍼라제를 지닌 설포 공여체로서 제한된 상황에서 유용할 수 있는 저렴하고, 광범위하게 이용가능한 화합물로서 확인되었다 (참조: Malojcic, G., et al. (2008) Proc. Nat. Acad. Sci. 105 (49):19217-19222 및 Kaysser, L., et al., (2010) J. Biol. Chem. 285 (17):12684-12694, 이들 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). Malojcic에 기술된 바와 같이, 이러한 아릴 설페이트 설포트랜스퍼라제는 2-단계 메카니즘을 겪으며, 여기서 효소는 아릴 설페이트 화합물로부터 설포 그룹을 먼저 제거하여 설포히스티딘 중간체를 형성하며 여기서 설포 그룹은 활성 부위 내에서 아미노산 측쇄, 전형적으로, 히스티딘 잔기와 공유결합으로 결합된다. 효소의 설페이트-결합된 형태는 이후에 설포 그룹 수용기를 인식하여 이와 결합함으로써 설포 그룹 전달을 완료할 수 있다.
아직까지는, 소수의 세균 설포트랜스퍼라제 만이 아릴 설페이트 화합물과 설포 그룹 공여기로서 반응하는 것으로 밝혀졌으며, 다당류와 설포 그룹 수용기로서 반응하는 진핵세포 설포트랜스퍼라제는 아릴 설페이트 화합물이 설포 그룹 공여기로서 사용되는 경우 생물학적 활성이 없는 것으로 입증되었다. 대신에, 이러한 설포트랜스퍼라제는 상술한 바와 같이, 설포 공여기로서 3'-포스포아데노신 5'-포스포설페이트와 전적으로 반응한다. 그 결과, 설포트랜스퍼라제가 설페이트화된 다당류의 시험관 내 합성에서 사용되는 경우, 설포트랜스퍼라제는 아릴 설페이트 화합물로부터의 설포 그룹을 다당류로 직접 전달하는 것을 촉매할 수 없다. 대신에, 아릴 설페이트 화합물은 3'-포스포아데노신 5'-포스포설페이트를 지닌 시스템을 재생시키도록 간접적으로만 사용될 수 있다 (참조: U.S. Pat. No. 6,255,088, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다).
결과적으로, 설포 그룹 공여기로서 3'-포스포아데노신 5'-포스포설페이트를 활용하지 않고, 시험관 내에서 설페이트화된 다당류, 특히 항응고제 활성을 갖는 것을 합성하는 용이한 방법을 개발할 필요성이 존재한다. 특히, 설포 그룹 공여체로서 아릴 설페이트 화합물과 반응하고 설포 그룹 수용체로서 다당류와 반응할 수 있는 설포트랜스퍼라제 효소의 개발이 임상 세팅에서 사용될 수 있는 설페이트화된 다당류, 특히 항응고제 다당류의 대규모 합성의 개발을 향한 큰 진보를 나타낼 수 있다.
본 발명은 설포 그룹 공여기로서 아릴 설페이트 화합물로부터의 설포 그룹을 전달하는 것을 촉매하여 설포 그룹 수용기로서 다당류와 반응하도록 가공된, 비-천연적으로 존재하는 설포트랜스퍼라제 효소를 사용하여 시험관 내에서 설페이트화된 다당류를 생산하는 방법을 제공한다. 본 발명에 따라서, 다당류는 항응고제 활성을 지닌 설페이트화된 다당류를 형성하기 위해 활용될 수 있는 헤파로산-기반의 다당류일 수 있다. 본 발명에 따라서, 본원에 기술된 방법에 의해 합성된 항응고제 다당류는 혈액 응고를 방지하기 위한 임상 세팅에서 처방되고 투여될 수 있다.
본 발명의 양태에서, 설페이트화된 다당류는 (a) 다당류를 제공하는 단계; (b) 아릴 설페이트 화합물을 제공하는 단계; (c) 아릴 설페이트 화합물을 설포 그룹 공여기, 및 다당류를 설포 그룹 수용기로서 인식하고, 이에 결합하여, 이와 반응하도록 구성된 가공된 설포트랜스퍼라제 효소를 제공하는 단계; (d) 가공된 설포트랜스퍼라제 효소와 다당류 및 아릴 설페이트 화합물을 조합함으로써 반응 혼합물을 형성시키는 단계; 및 (e) 아릴 설페이트 화합물로부터의 설포 그룹의 다당류로의 효소적 전달을, 가공된 설포트랜스퍼라제 효소를 사용하여 촉매함으로써, 설페이트화된 다당류 생성물을 형성시키는 단계를 포함하는 방법에 의해 효소적으로 합성될 수 있다. 본 발명에 따라서, 다당류는 헤파로산 [β(1,4)GlcA-α(1,4)GlcNAc]n(여기서 GlcA는 글루쿠론산이고 GlcNAc는 N-아세틸 글루코사민이다)으로부터 유도된 헤파로산-계 다당류일 수 있다. 헤파로산-계 다당류는 1→4 글리코시드적으로 연결된 헥수론산과 글루코사민 잔기의 반복되는 이량체를 포함하고, 여기서 각각의 헥수론산은 글루쿠론산(GlcA, 상기) 또는 이두론산(IdoA)이고, 각각의 글루코사민 잔기는 N-아세틸화, N-설페이트화, 또는 N-비치환될 수 있다. 글루코사민 잔기 중 적어도 하나가 N-비치환된 헤파로산-계 다당류는 또한 N-탈아세틸화 헤파로산으로 불릴 수 있다. 또한, 다양한 구현예에서, 임의의 GlcA 또는 IdoA 잔기는 가공된 설포트랜스퍼라제 효소와 반응하기 전에, 2-O 위치에서 설페이트화되고/되거나 임의의 글루코사민 잔기는 N-, 6-O, 또는 3-O 위치에서 설페이트화될 수 있다. 헥수론산 또는 글루코사민 잔기 내 임의의 상기 위치 내에서 적어도 하나의 설페이트 그룹을 함유하는 헤파로산-계 다당류는 또한 헤파란 설페이트(HS)로 불릴 수 있다.
본 발명에 따라서, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합에서 유용한, 제1의 설포전달 반응에서 형성된 설페이트화된 다당류 생성물은 다른 설포트랜스퍼라제 효소와의 후속적인 반응에서 설포 그룹 수용기로서 활용될 수 있고, 이는 제1의 설포전달 반응과 동일한 반응 혼합물 속에서, 또는 설페이트화된 다당류 생성물을 단리하고 이를 설포 그룹 공여기 및 설포트랜스퍼라제 효소와 조합한 후 별도의 반응 혼합물 속에서 수행될 수 있다. 다양한 구현예에서, 다수의 설포전달 반응은 단일의 헤파로산-계 다당류, 예를 들면, 적어도 2개, 적어도 3개, 또는 적어도 4개의 설포전달 반응에서 순차적으로 또는 동시에 수행될 수 있다. 헤파로산-계 다당류에서 다수의 설포전달 반응 각각은 적어도 2개, 적어도 3개, 또는 4개 이하의 설포트랜스퍼라제 효소에 의해 촉매될 수 있다. 다양한 구현예에서, 설포전달 반응 중 적어도 1개, 및 바람직하게는 모두는 아릴 설페이트 화합물을 설포 그룹로서 인식하고, 이와 결합하고, 반응하는 가공된 설포트랜스퍼라제 효소에 의해 촉매된다. 추가의 구현예에서, 설포전달 반응 중 적어도 1개, 및 바람직하게는 모두는 설페이트 공여기로서 아릴 설페이트 화합물 만을 함유하고 3'-포스포아데노신 5'-포스포설페이트를 함유하지 않는 반응 혼합물 속에서 수행된다.
본 발명의 다른 양태에서, 각각의 가공된 설포트랜스퍼라제 효소는 상응하는 야생형 설포트랜스퍼라제 효소의 활성 부위 내에서 이루어진 수개의 아미노산 돌연변이를 포함함으로써, 설포 그룹 공여기로서 3'-포스포아데노신 5'-포스포설페이트와의 반응으로부터 설포 그룹 공여기로서 아릴 설페이트 화합물과의 반응으로 효소의 생물학적 활성을 이동시킨다. 그러나, 다양한 구현예에서, 각각의 가공된 설포트랜스퍼라제는 이의 특수한 설포 수용기 다당류를 지닌 야생형의 생물학적 활성을 보유한다. 비-제한적인 예로서, 효소가 설포 그룹 공여기로서 3'-포스포아데노신 5'-포스포설페이트 및 설포 그룹 수용기로서 N-설페이트화된 HS와 반응하는 생물학적 활성을 갖는, 야생형 HS 헥수로닐 2-O 설포트랜스퍼라제는 다수의 아미노산 위치에서 돌연변이되어 설포 그룹 공여기로서 아릴 설페이트 화합물을 인식하여, 이와 결합하고 반응하지만, 여전히 설포 그룹 수용기로서 N-설페이트화된 HS와 반응하는 생물학적 활성을 갖는 가공된 설포트랜스퍼라제 효소를 생성한다. 이러한 가공된 아릴 설페이트-의존성 헥수로닐 2-O 설포트랜스퍼라제 효소, 및 다른 가공된 아릴 설페이트-의존성 효소는, 하기에 추가로 상세히 기술되어 있다.
본 발명의 다른 양태에서, N-, 2-O-, 3-O-, 6-O-설페이트화된 헤파란 설페이트(N,2,3,6-HS) 생성물이 합성될 수 있고, 이러한 방법은 다음의 단계를 포함한다: (a) N-탈아세틸화 헤파로산을 포함하는 출발 다당류 반응 혼합물을 제공하는 단계; (b) 출발 다당류 반응 혼합물을 설포 그룹 공여기 및 글루코사미닐 N-설포트랜스퍼라제 효소, 헥수로닐 2-O 설포트랜스퍼라제 효소, 및 글루코사미닐 6-O 설포트랜스퍼라제 효소로 이루어진 그룹으로부터 선택된 제1의 설포트랜스퍼라제 효소를 포함하는 반응 혼합물과 조합하여, 제1의 설페이트화된 다당류를 형성시키는 단계; (c) 제1의 설페이트화된 다당류를 설포 그룹 공여기 및 제2의 설포트랜스퍼라제 효소를 포함하는 반응 혼합물과 조합시켜, 제2의 설페이트화된 다당류를 형성시키는 단계로서, 여기서 제2의 설포트랜스퍼라제 효소는 단계 (b)에서 선택되지 않는 2개의 효소 중 하나인 단계; (d) 제2의 설페이트화된 다당류를 설포 그룹 공여기 및 제3의 설포트랜스퍼라제 효소를 포함하는 반응 혼합물과 조합시켜, 제3의 설페이트화된 다당류를 형성시키는 단계로서, 여기서 제3의 설포트랜스퍼라제 효소가 단계 (b) 또는 단계 (c)에서 선택되지 않은 효소인 단계; 및 (e) 제3의 설페이트화된 다당류를 설포 그룹 공여기 및 글루코사미닐 3-O 설포트랜스퍼라제 효소를 포함하는 반응 혼합물과 조합하여, N,2,3,6-HS 생성물을 형성하는 단계로서; 여기서 (i) 설포트랜스퍼라제 효소 중 적어도 하나는 설포 그룹 공여기로서 아릴 설페이트 화합물과 반응하여 설포전달 반응을 촉매하는 것에 의존성인 가공된 설포트랜스퍼라제 효소이고. (ii) 가공된 설포트랜스퍼라제 효소를 포함하는 반응 혼합물 속에서, 반응 혼합물이 설포 그룹 공여기로서 아릴 설페이트 화합물을 포함하는 단계. 다양한 구현예에서, 제1의 설포트랜스퍼라제 효소는 글루코사미닐 N-설포트랜스퍼라제 효소이고, 제2의 설포트랜스퍼라제 효소는 헥수로닐 2-O 설포트랜스퍼라제 효소이고, 제3의 설포트랜스퍼라제 효소는 글루코사미닐 6-O 설포트랜스퍼라제 효소이다.
본 발명의 다른 양태에서, N,2,3,6-HS 생성물을 합성하는 방법은 다음의 단계를 포함할 수 있다: (a) N-설페이트화된 헤파로산을 포함하는 출발 다당류 반응 혼합물을 제공하는 단계; (b) 다당류 반응 혼합물을 설포 그룹 공여기 및 헥수로닐 2-O 설포트랜스퍼라제 효소 및 글루코사미닐 6-O 설포트랜스퍼라제 효소로 이루어진 그룹으로부터 선택된 제1의 설포트랜스퍼라제 효소를 포함하는 반응 혼합물과 조합하여, 제1의 설페이트화된 다당류 생성물을 형성시키는 단계; (c) 제1의 설페이트화된 다당류 생성물을 설포 그룹 공여기 및 제2의 설포트랜스퍼라제 효소를 포함하는 반응 혼합물과 조합시켜, 제2의 설페이트화된 다당류 생성물을 형성시키는 단계로서, 여기서 제2의 설포트랜스퍼라제 효소가 단계 (b)에서 선택되지 않았던 효소인 단계; 및 (d) 제2의 설페이트화된 다당류 생성물을 설포 그룹 공여기 및 글루코사미닐 3-O 설포트랜스퍼라제 효소를 포함하는 반응 혼합물과 조합시켜, N,2,3,6-HS 생성물을 형성시키는 단계로서; 여기서 (i) 설포트랜스퍼라제 효소 중 적어도 하나가 설포 그룹 공여기로서 아릴 설페이트 화합물과 반응하여 설포전달 반응을 촉매하는데 의존성인 가공된 설포트랜스퍼라제 효소이고, (ii) 가공된 설포트랜스퍼라제 효소를 포함하는 반응 혼합물 속에서, 반응 혼합물이 설포 그룹 공여기로서 아릴 설페이트 화합물을 포함하는 단계. 다양한 구현예에서, 제1의 설포트랜스퍼라제 효소는 헥수로닐 2-O 설포트랜스퍼라제 효소이고, 제2의 설포트랜스퍼라제 효소는 글루코사미닐 6-O 설포트랜스퍼라제 효소이다.
다양한 구현예에서, N-설페이트화된 헤파로산을 포함하는 출발 다당류 반응 혼합물은 N-탈아세틸화 헤파로산, 설포 그룹 공여기, 및 글루코사미닐-N--설포트랜스퍼라제 효소를 반응 혼합물로 조합함으로써 제공될 수 있다. 다양한 구현예에서, 글루코사미닐-N-설포트랜스퍼라제 효소는 가공된 설포트랜스퍼라제이고, 이는 3'-포스포아데노신 5'-포스포설페이트의 부재하에서 설포 그룹 공여기로서 아릴 설페이트 화합물과 반응한다. 다양한 구현예에서, N-설페이트화된 헤파로산은 야생형 글루코사미닐 N-데아세틸라제/N-설포트랜스퍼라제 효소, 3'-포스포아데노신 5'-포스포설페이트, 및 헤파로산을 조합함으로써 제공될 수 있다.
다양한 구현예에서, 출발 다당류 반응 혼합물을 제공하는 단계는 다음의 단계를 포함하는 N-설페이트화된 헤파로산의 화학적 합성을 포함할 수 있다: (i) 헤파로산을 포함하는 전구체 다당류 조성물을 제공하는 단계; (ii) 전구체 다당류 조성물을 염기, 바람직하게는 수산화리튬 또는 수산화나트륨을 포함하는 반응 혼합물과, 헤파로산 내 N-아세틸화 글루코사민 잔기 중 적어도 하나를 N-탈아세틸화시키기에 충분한 시간 동안 조합시켜, N-탈아세틸화된 헤파로산 조성물을 형성시키는 단계; 및 (iii) N-탈아세틸화 헤파로산 조성물을 N-설페이트화제(sulfation agent)와 조합함으로써, N-설페이트화된 헤파로산을 형성시키는 단계.
다양한 구현예에서, 헤파로산을 포함하는 전구체 다당류 조성물을 제공하는 단계는 헤파로산을 세균 또는 진핵 세포 배양물, 바람직하게는 세균 세포 배양물로부터, 및 보다 바람직하게는 에스케리키아 콜라이(Escherichia coli)(이. 콜라이(E. coli))의 K5 균주 및 이. 콜라이의 BL21 균주로 이루어진 그룹으로부터 선택된 세균을 포함하는 세균 세포 배양물로부터 단리하는 소-단계(sub-stgep)를 추가로 포함할 수 있다. 헤파로산은 이. 콜라이로부터 중량-평균 분자량이 적어도 10,000 Da, 및 적어도 500,000 Da 이하인 다당류의 다분산 혼합물로서 단리할 수 있다. 다양한 구현예에서, 헤파로산 내 글루코사민 잔기의 적어도 90%는 N-아세틸화된다.
헤파로산을 염기, 예를 들면, 수산화리튬 또는 수산화나트륨으로 처리하는 것은 아세틸 그룹을 N-아세틸 글루코사민 잔기로부터 제거함으로써, 후속적으로 N-설페이트화될 수 있는 N-비치환 글루코사민 잔기를 형성한다. 다양한 구현예에서, 전구체 다당류는 염기와 N-아세틸화 글루코사민 잔기의 상대적인 수를 목적한 수준까지 감소시키기에 충분한 시간 동안 처리할 수 있다. 반응 시간은 전구체 다당류 조성물 내 헤파로산의 평균 분자량, 염기와의 반응 전 헤파로산의 N--아세틸 글루코사민 함량, N-탈아세틸화 헤파로산 조성물 내 목적한 N-아세틸 함량, 및 염기 자체의 농도 및 실체와 같은 인자에 의존할 수 있다. 다양한 구현예에서, 전구체 다당류 조성물 내 헤파로산을 N-탈아세틸화시키기에 충분한 시간은 N-탈아세틸화 헤파로산 조성물을 형성하기에 충분한 시간일 수 있고, 여기서 글루코사민 잔기의 60% 미만, 5% 미만 아래(down to less than 5%), 바람직하게는 12% 내지 18%의 범위, 및 보다 바람직하게는 15%는 N-아세틸화되어 남는다.
추가로, 전구체 다당류 조성물을 염기로 처리하여 N-아세틸화 글루코사민 잔기의 수를 감소시키는 것은 또한 헤파로산을 해중합(depolymerizing)시켜, N-탈아세틸화 헤파로산 조성물이 전구체 다당류 조성물에 대해 보다 낮은 평균 분자량을 갖도록 하는 효과를 가질 수 있다. 따라서, 다양한 구현예에서, 전구체 다당류 조성물은 목적한 평균 분자량을 갖는 N-탈아세틸화 헤파로산 조성물을 형성하기에 충분한 시간 동안 염기로 처리할 수 있다. 상기와 같이, 반응 시간은 전구체 다당류 조성물 내 헤파로산의 평균 분자량, 및 N-탈아세틸화 헤파로산 조성물 자체 내 다당류의 목적한 평균 분자량을 포함하는 수개의 인자에 의존할 수 있다. 다양한 구현예에서, 전구체 다당류 조성물 내에서 헤파로산을 N-탈아세틸화시키기에 충분한 시간은 중량-평균 분자량이 1,500 Da 내지 100,000 Da의 범위, 예를 들면, 적어도 9,000 Da, 및 12,500 Da 이하인 N-탈아세틸화 다당류 조성물을 형성시키기에 충분한 시간일 수 있다.
다양한 구현예에서, N-탈아세틸화 헤파로산이 형성되면, 수득되는 N-비치환 글루코사미닐 잔기는 이후 설포 그룹을 N-설페이트화제, 예를 들면, 가공된 또는 야생형 글루코사미닐 N-설포트랜스퍼라제 효소를 수용할 수 있다. 다양한 구현예에서, N-탈아세틸화 헤파로산 내 N-비치환 글루코사민 잔기 중 하나 이상은 화학적으로 N-설페이트화될 수 있다. 다양한 구현예에서, 화학적 N-설페이트화는 글루코사미닐 N-설포트랜스퍼라제 효소에 의해 촉매된 효소적 N-설페이트화를 보충 또는 대체할 수 있다. 화학적 N-설페이트화제의 비-제한적 예는 삼산화황-함유 화합물 또는 부가물, 특히 삼산화황-트리메틸아민 부가물을 포함하는 반응 혼합물을 포함할 수 있다.
다양한 구현예에서, 화학적 및/또는 효소적 N-설페이트화에 의해, N-탈아세틸화 헤파로산 내 글루코사미닐 잔기의 적어도 약 10%, 및 적어도 약 95% 이하는 임의의 2-O, 3-O, 또는 6-O 위치에서 후속적으로 설페이트화되기 전에 N-설페이트화제에 의해 N-설페이트화된다.
다양한 구현예에서, 본원에 기술된 임의의 방법에 따른 N,2,3,6-HS 생성물의 합성 동안에, 헤파로산-계 다당류의 3-O 설페이트화는 2-O 설페이트화 단계 후 촉매되어 N,2,3-HS 생성물을 형성한 다음, 6-O 설페이트화에 의해 N,2,3,6-HS 생성물을 형성함으로써 촉매될 수 있다. 추가로, 본원에 기술된 방법내 임의의 설포전달 반응 단계 내에서, 가공된 설포트랜스퍼라제 효소를 포함하지 않는 반응 혼합물은 3'-포스포아데노신 5'-포스포설페이트 및 설포 그룹 공여기로서 3'-포스포아데노신 5'-포스포설페이트와 함께 생물학적 활성을 지닌 야생형 HS 설포트랜스퍼라제를 포함할 수 있다. 다양한 구현예에서, 심지어 N,2,3,6-HS 생성물을 형성하기 위해 사용된 글루코사미닐 N-설포트랜스퍼라제 효소, 헥수로닐 2-O 설포트랜스퍼라제 효소, 및 글루코사미닐 6-O 설포트랜스퍼라제 효소 중 하나 이상이 야생형 HS 설포트랜스퍼라제 효소인 경우, 합성은 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소를 사용하고, 3'-포스포아데노신 5'-포스포설페이트의 부재하에서 설포 그룹 공여기로서 아릴 설페이트 화합물을 사용하여 완료된다. 다양한 구현예에서, N,2,3,6-HS 생성물의 합성시 모든 설포전달 단계에서 설포트랜스퍼라제는 가공된 설포트랜스퍼라제이고 여기서 각각의 단계 내 설포 그룹 공여기는 하나 이상의 아릴 설페이트 화합물로 이루어진다. 다양한 구현예에서, 설포전달 중 하나 이상에 대한 반응 혼합물은 단일 반응 용기, 또는 "포트(pot)" 내로 조합될 수 있다. 다른 구현예에서, 설포전달 반응 각간은 순차적으로, 별개의 반응 용기 속에서 수행될 수 있다.
다양한 구현예에서, 설포 공여기로서 활용될 수 있는 아릴 설페이트 화합물은 방향족 모이어티(moiety)에 촉매적으로 결합된, C-O 결합을 포함하는 설페이트 에스테르 연결에 의해 함께 결합된, 설포 그룹을 포함하는 오가노설페이트이다. 본 발명의 가공된 효소를 가진 적절한 기질인 아릴 설페이트 화합물의 비제한적인 예들은 p-니트로페닐 설페이트 (PNS), 4-메틸움벨리페릴 설페이트 (MUS), 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 2-나프틸 설페이트(2NapS), 및 4-니트로카테콜 설페이트(NCS)를 포함한다. 다양한 구현예에서, 본 발명의 방법에 따라 사용되는 가공된 효소는 PNS를 인식하여, 이에 결합하고, 이와 반응할 수 있다. 일부 구현예에서, PNS는 N,2,3,6-HS 생성물의 합성 동안 모든 설포전달 반응에서 아릴 설페이트 화합물로서 사용될 수 있다. 본 발명에 따라서, 본 발명의 임의의 방법에 따라서 활용된 가공된 효소는 NCS를 인식하고, 이와 결합하고, 반응할 수 있다. 일부 구현예에서, NCS는 N,2,3,6-HS 생성물의 합성 동안 모든 설포전달 반응에서 아릴 설페이트 화합물로서 사용될 수 있다. 본 발명에 따라서, 본 발명의 임의의 방법에 따라서 활용된 단일의 가공된 효소는 다수의 아릴 설페이트 화합물을 인식하고, 이와 결합하고, 반응할 수 있다.
다양한 구현예에서, 본원에 기술된 임의의 방법에 따라 N,2,3,6-HS 생성물의 합성시 활용된 가공된 설포트랜스퍼라제 효소 각각은 설포 그룹 공여기로서 동일한 아릴 설페이트 화합물과 반응하도록 선택될 수 있다. 다른 구현예에서, 가공된 설포트랜스퍼라제 효소 중 하나 이상은 N,2,3,6-HS 생성물의 동일한 합성에 활용된 다른 효소와는 상이한 아릴 설페이트 화합물과의 생물학적 활성을 가질 수 있다. 비-제한적인 예로서, 다수의 설포전달 반응이 단일의 반응 혼합물에서 발생하는 N,2,3,6-HS 생성물의 합성시, PNS 및 NCS 둘 다가 반응 혼합물 내에 포함될 수 있다.
다양한 구현예에서, 아릴 설페이트 화합물과 반응하는 임의의 가공된 효소에 의해 촉매된 설포전달 반응의 진행은 설포 그룹을 아릴 설페이트 화합물로부터 제거한 후 형성된 탈설페이트화된 방향족 화합물에 의한 형광성 및/또는 광의 흡수를 모니터링함으로써 부분적으로 측정할 수 있다. 예를 들면, 아릴 설페이트 화합물로서 PNS를 포함하는 설포전달 반응의 진행은 자외선-가시선(ultraviolet-visible)(UV-Vis) 분광광도법적 검정(spectrophotometric assay)을 사용하여 PNS로부터 설포 그룹을 다당류로 전달한 결과로서 p-니트로페놀의 생산을 추적함으로써, 반응 혼합물에 의해 405 nm에서 광의 흡수를 모니터링함으로써 평가할 수 있다. 유사하게, 아릴 설페이트 화합물로서 NCS를 포함하는 설포전달 반응의 진행은 UV-Vis 검정을 사용하여 NCS로부터의 설포 그룹을 다당류로 전달하는 결과로서 4-니트로카테콜의 생산을 추적함으로써, 반응 혼합물에 의해 515 nm에서 광의 흡수를 모니터링함으로써 평가할 수 있다. 당해 분야의 기술자는 UV-Vis 분광광도법적 검정 또는 형광성 분광 분석을 선택하여 특수한 아릴 설페이트 화합물, 예를 들면, 4-메틸움벨리페릴 설페이트, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 및 2-나프틸 설페이트의 실체 및 스펙트럼 특성을 기반으로, 반응의 진행을 모니터링할지의 여부를 용이하게 결정할 수 있다.
다양한 구현예에서, 본 발명의 임의의 방법을 실시하는 동안 출발 물질로서 사용되거나 생성물로서 형성된 헤파로산-계 다당류, 예를 들면, 그러나 이에 한정되지 않는, 전구체 다당류, 출발 다당류, 설페이트화된 다당류 생성물, 및/또는 항응고제 다당류를 포함하는 임의의 반응 혼합물 또는 조성물 내에서, 다당류는 다양한 쇄 길이, 분자량, N-아세틸화, 및/또는 N-, 2-O, 6-O, 또는 3-O 설페이트화를 갖는 다당류의 다분산 혼합물로서 존재할 수 있다. 대안적으로, 상술된 임의의 다당류는 동일한 쇄 길이, 분자량, N-아세틸화, 및/또는 N-, 2-O, 6-O, 또는 3-O 설페이트화를 갖는 다당류로 구성된 균질한 조성물로서 존재하거나 제공될 수 있다.
다양한 구현예에서, 본원에 기술된 임의의 설포전달 반응에서 설포 그룹 수용기로서 사용될 수 있는 헤파로산-계 다당류는 일반적으로 1,000 Da 초과, 예를 들면, 1,000,000 Da 초과의 임의의 분자량일 수 있다. 다양한 구현예에서, N-탈아세틸화 헤파로산 다당류를 포함하는 조성물 또는 혼합물은 바람직하게는 중량-평균 분자량이 적어도 9,000 Da, 및 12,500 Da 이하의 범위 내이다. 다양한 구현예에서, 상술된 임의의 방법의 임의의 반응의 설페이트화된 다당류 생성물은 설포 그룹 수용기로서 사용된 다당류의 분자량을 기반으로 하여, 모든 이용가능한N, 2-O, 3-O, 및/또는 6-O 위치로 단일의 설포 그룹의 첨가(약 80 Da), 및 설포 그룹들의 첨가까지와 관련된 분자량을 포함할 수 있다.
다양한 구현예에서, 본원에 기술된 N,2,3,6-HS 생성물을 합성하기 위한 임의의 방법에서, 가공된 설포트랜스퍼라제 효소 및 아릴 설페이트 화합물을 포함하는 임의의 반응 혼합물은 아릴 설페이트 화합물을 재생(repopulating)시키기 위한 하나 이상의 구성성분을 추가로 포함할 수 있다. 다양한 구현예에서, 아릴 설페이트 화합물을 재생시키기 위한 하나 이상의 구성성분은 아릴 설페이트 설포트랜스퍼라제(ASST) 효소 및 제2의 아릴 설페이트 화합물을 포함할 수 있다. 본 발명에 따라서, 가공된 설포트랜스퍼라제 효소는 제2의 아릴 설포 그룹 공여기로서 아릴 설페이트 화합물과의 활성을 최소로 가지거나 가지지 않는다. 임의의 세균으로부터의 ASST 효소가 활용될 수 있고, 세균으로부터 직접 단리될 수 있거나 시험관 내에서 발현 숙주로부터 재조합적으로 생성될 수 있다. 다양한 구현예에서, ASST 효소는 서열 번호: 55의 아미노산 서열을 포함하는, 이. 콜라이 균주 CFT073으로부터의 재조합 ASST일 수 있다.
하나의 비-제한적 예에서, N,2,6-HS 생성물, NCS, 및 서열 번호: 28의 아미노산 서열을 포함하는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소를 포함하는 반응 혼합물은 ASST 효소 및 PNS를 추가로 포함할 수 있고, 서열 번호: 28의 아미노산 서열을 함께 포함하는 가공된 효소는 활성이 아니다. 설포전달 반응의 생성물로서 형성되면, 4-니트로카테콜은 이후 PNS와 ASST 효소 사이의 반응을 위한 설포 그룹 수용기로서 작용함으로써, 아미노산 서열 서열 번호: 28을 포함하는 가공된 효소와의 후속적인 반응을 위한 NCS를 재형성시킬 수 있다. 대안적으로, N,2,3,6-HS 생성물을 형성하기 위한 설포전달 반응에 활용된 NCS는 아미노산 서열 서열 번호: 28을 포함하는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소, 4-니트로카테콜, PNS, 및 ASST 효소를 포함하는 반응 혼합물을 형성함으로써 반응계 내(in situ)에서 생성될 수 있다.
다양한 구현예에서, 본원에 기술된 임의의 방법에 활용된 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는, 이러한 효소가 아릴 설페이트 화합물로부터의 설포 그룹을 헤파로산-계 다당류, 바람직하게는 N-탈아세틸화 헤파로산의 N-비치환 글루코사민 잔기의 아민 작용 그룹으로 전달하는 것을 촉매하는 한 임의의 아미노산 서열을 포함할 수 있다. 추가의 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 효소 부류(EC) 2.8.2.8의 구성원인, HS 글루코사미닐 N-설포트랜스퍼라제 활성을 갖는 천연의 설포트랜스퍼라제의 돌연변이체일 수 있다. 본 발명에 따라서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소, 또는 단일의 N-설포트랜스퍼라제 도메인은 하나 이상의 천연의 EC 2.8.2.8 효소와 비교하여 수개의 아미노산 돌연변이를 포함함으로써, 3'-포스포아데노신 5'-포스포설페이트 대신에 설포 그룹 공여기로서 아릴 설페이트 화합물과 결합하여 이와 반응하는 활성 부위를 재구성할 수 있다.
본원에 기술된 임의의 방법에 따라 활용된 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 33, 서열 번호: 34, 서열 번호: 35, 서열 번호: 36, 서열 번호: 37, 서열 번호: 38, 서열 번호: 39, 및 서열 번호: 40으로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있고, 이들 각각은 EC 2.8.2.8. 내 천연의 글루코사미닐 N-설포트랜스퍼라제 효소의 N-설포트랜스퍼라제 도메인 내 고도로 보존된 영역에 대해 이루어진 수개의 아미노산 돌연변이를 함유한다. 다양한 구현예에서, 본원에 기술된 임의의 방법에 따라 활용된 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 또한 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 33, 서열 번호: 34, 서열 번호: 35, 서열 번호: 36, 서열 번호: 37, 서열 번호: 38, 서열 번호: 39, 및 서열 번호: 40로 이루어진 그룹으로부터 선택된 아미노산 서열로부터, 하나 이상의 아미노 잔기 차이 또는 돌연변이를 가진 아미노산 서열을 포함할 수 있고/있거나, 이의 생물학적 작용성 등가물일 수 있다. 이러한 잔기 차이의 비-제한적 예는 아미노산 삽입, 결실, 치환, 또는 이러한 변화의 임의의 조합을 포함한다.
다양한 구현예에서, 임의의 상술된 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 EC 2.8.2.8. 내에서 임의의 천연의 N-데아세틸라제/N-설포트랜스퍼라제 효소 내에 존재하는 N-데아세틸라제 도메인에 대해 동일하거나 돌연변이된 N-데아세틸라제 도메인을 추가로 포함할 수 있다. 다양한 구현예에서, 임의의 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 다른 도메인 또는 다른 단백질과의 융합체를 추가로 포함함으로써 가용성 또는 제2의 생화학적 반응을 촉진할 수 있다.
다양한 구현예에서, EC 2.8.2.8 내에서 임의의 천연의 글루코사미닐 N-설포트랜스퍼라제 효소를 활용하여 HS 생성물, 특히 N,2,3,6-HS 생성물의 합성 동안 N-설페이트화를 촉매할 수 있으며, 여기서 가공된 설포트랜스퍼라제 효소를 활용하여 다당류의 2-O, 6-O, 및/또는 3-O 설페이트화를 촉매한다. 천연의 글루코사미닐 N-설포트랜스퍼라제 효소는 N-데아세틸라제 도메인 및 N-설포트랜스퍼라제 도메인 둘 다, 단일의 N-설포트랜스퍼라제 도메인, 또는 이의 생물학적으로 활성인 단편을 포함할 수 있다. 천연의 글루코사미닐 N-설포트랜스퍼라제 효소를 포함하는 반응 혼합물은 또한 설포 그룹 공여기로서 3'-포스포아데노신 5'-포스포설페이트를 포함한다.
설포 그룹을 수용하지 않는 헤파로산-계 다당류 내 글루코사민 잔기는 N-, 3-O, 및/또는 6-O 설페이트화, N-아세틸화, 또는 N-비치환될 수 있고, 헥수론산 잔기는 GlcA 또는 IdoA를 포함할 수 있고, 이들 중 어느 것도 2-O 위치에서 설페이트화될 수 있다. 바람직하게는, 및 본 발명에 따라서, 헤파로산-계 다당류는 N-탈아세틸화 헤파로산이다. 다양한 구현예에서, N-비치환 글루코사민 잔기의 6-O 그룹은 N-설페이트화 반응 이전에 이미 설페이트화될 수 있다.
설포 그룹 수용기로서 천연의 또는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소와 반응할 수 있는 헤파로산-계 다당류 내 이당류 단위의 한가지 비-제한적 예는 하기 화학식 II의 구조를 포함할 수 있다:
[화학식 II]
Figure pct00001
화학식 II에서, n은 정수이고, R은 수소 원자 또는 설포 그룹으로 이루어진 그룹으로부터 선택된다. 다양한 구현예에서, 이당류내 R 그룹 둘 다는, 및 바람직하게는 모든 이당류는 수소 원자일 수 있다. 설포 수용기 다당류가 화학식 II의 구조를 포함하는 경우, 아릴 설페이트 화합물로부터 설포 그룹의 전달시, 설페이트화된 다당류 생성물은 하기 화학식 III의 구조를 포함한다:
[화학식 III]
Figure pct00002
화학식 III에서, n은 정수이고 R은 수소 원자 또는 설포 그룹으로 이루어진 그룹으로부터 선택된다. 다양한 구현예에서, 이당류 단위 내 R 그룹 둘 다는 수소 원자이다.
다양한 구현예에서, 본원에 기술된 임의의 방법에 활용된 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 이러한 효소가 아릴 설페이트 화합물로부터의 설포 그룹을 헤파로산-계 다당류, 특히 N-설페이트화된 HS 다당류 내 헥수론산 잔기의 2-O 위치로 전달하는 것을 촉매하는 한, 임의의 아미노산 서열을 포함할 수 있다. 추가의 구현예에서, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 효소 부류 EC 2.8.2.-.의 구성원인, HS 헥수로닐 2-O 설포트랜스퍼라제 활성을 갖는 천연의 설포트랜스퍼라제의 돌연변이체일 수 있다. 본 발명에 따라서, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 HS 헥수로닐 2-O 설포트랜스퍼라제 활성을 지닌 천연의 EC 2.8.2.-. 효소중 하나 이상에 대해 몇가지 아미노산 돌연변이를 포함함으로써, 3'-포스포아데노신 5'-포스포설페이트 대신에 설포 그룹 공여기로서 아릴 설페이트 화합물과 결합 및 반응하는 활성 부위를 재구성시킬 수 있다.
본 발명에 따라 사용되는 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 서열 번호: 14, 서열 번호: 16, 서열 번호: 41, 및 서열 번호: 42로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있고, 이들 각각은 EC 2.8.2.- 내 천연 HS 헥수로닐 2-O 설포트랜스퍼라제 효소 내에 고도로 보존된 영역에 대해 이루어진 몇가지 아미노산 돌연변이를 함유한다. 다양한 구현예에서, 본원에 기술된 임의의 방법에 따라 이용된 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 또한 서열 번호: 14, 서열 번호: 16, 서열 번호: 41, 및 서열 번호: 42로 이루어진 그룹으로부터 선택된 아미노산 서열로부터, 하나 이상의 아미노 잔기 차이 또는 돌연변이를 가진 아미노산 서열을 포함할 수 있고/있거나, 이의 생물학적 작용성 등가물일 수 있다. 이러한 잔기 차이의 비-제한적 예는 아미노산 삽입, 결실, 치환, 또는 이러한 변화의 임의의 조합을 포함한다.
다양한 구현예에서, EC 2.8.2.- 내 임의의 천연의 HS 헥수로닐 2-O 설포트랜스퍼라제 효소, 또는 이의 생물학적 활성 단편을 활용하여 HS 생성물, 특히 N,2,3,6-HS 생성물의 합성 동안 2-O 설페이트화를 촉매할 수 있고, 여기서 가공된 설포트랜스퍼라제 효소를 활용하여 다당류의 N-, 6-O, 및/또는 3-O 설페이트화를 촉매한다. 천연의 HS 헥수로닐 2-O 설포트랜스퍼라제 효소를 포함하는 반응 혼합물은 또한 설포 그룹 공여기로서 3'-포스포아데노신 5'-포스포설페이트를 포함한다.
다양한 구현예에서, 헥수로닐 2-O 설포트랜스퍼라제 효소로부터 설포 그룹을 수용할 수 있는 헥수론산 잔기는 글루쿠론산 또는 이두론산, 및 바람직하게는 이두론산일 수 있지만, 다당류 내 다른 헥수론산 잔기는 글루쿠론산 또는 이두론산일 수 있고, 이들 중 하나는 2-O 설페이트화될 수 있다. 설포 그룹을 수용하는 헥수론산 잔기에 인접한 글루코사민 잔기 둘 다는, 가공되거나 천연의 헥수로닐 2-O 설포트랜스퍼라제와 반응하기 전에 N-설페이트화될 수 있거나, 바람직하게는 N-설페이트화된다. 설포 그룹을 수용하는 헥수론산 잔기에 인접하지 않은 글루코사민 잔기는 임의로 N-, 3-O, 및/또는 6-O 설페이트화, N-아세틸화, 또는 N-비치환될 수 있다. 천연의 또는 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소와 설포 그룹 수용기로서 반응할 수 있는 헤파론산-계 다당류의 일부의 하나의 비-제한적 예는 하기 화학식 IV의 구조를 포함할 수 있다:
[화학식 IV]
Figure pct00003
헤파로산-계 다당류가 화학식 IV의 구조를 포함하는 경우, 2-O 황산화된 다당류 생성물은 하기 화학식 VI의 구조를 포함한다:
[화학식 VI]
Figure pct00004
다른 비-제한적 예에서, 헥수론산 잔기가 이두론산인 경우, 화학식 IV로 나타낸 바와 같은 글루쿠론산 보다는, 헤파로산-계 다당류는 하기 화학식 V의 구조를 포함한다:
[화학식 V]
Figure pct00005
헤파로산-계 다당류가 화학식 V의 구조를 포함하는 경우, 2-O 황산화된 다당류 생성물은 하기 화학식 VII의 구조를 포함한다:
[화학식 VII]
Figure pct00006
다양한 구현예에서, 글루쿠로닐 C5-에피머라제 효소는 가공된 또는 천연의 헥수로닐 2-O 설포트랜스퍼라제 이전에 또는 이와 동시에 화학식 IV 및/또는 화학식 V의 구조를 포함하는 헤파로산계 다당류와 조합될 수 있다. 몇몇 구현예에서, 글루쿠로닐 C5-에피머라제 효소는 서열 번호: 29의 아미노산 서열, 바람직하게는 서열 번호: 29의 34 내지 617번 잔기를 포함할 수 있다. 추가의 구현예에서, 서열 번호: 29의 아미노산 서열 또는 서열 번호: 29의 잔기 34 내지 617번을 포함하는 글루쿠로닐 C5-에피머라제 효소는 N-설페이트화된 헤파로산 및 가공된 또는 천연의 헥수로닐 2-O 설포트랜스퍼라제를 포함하는 반응 혼합물 내에 포함되어 2-O 설페이트화된 이두론산 및 N-설포 글루코사민의 하나 이상의 이당류 단위를 포함하는 N-설페이트화, 2-O 설페이트화된 HS(N,2-HS)를 형성할 수 있다.
다양한 구현예에서, 본원에 기술된 임의의 방법에 활용된 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는, 이러한 효소가 아릴 설페이트 화합물로부터의 설포 그룹을 헤파로산-계 다당류, 특히 화학식 VI 및/또는 화학식 VII의 구조를 포함하는 N,2-HS 다당류 내 글루코사민 잔기의 6-O 위치로 이전시키는 것을 촉매하는 한, 임의의 아미노산 서열을 포함할 수 있다. 추가의 구현예에서, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 효소 부류 EC 2.8.2.-의 구성원인, HS 글루코사미닐 6-O 설포트랜스퍼라제 활성을 갖는 천연의 설포트랜스퍼라제의 돌연변이체일 수 있다. 본 발명에 따라서, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 HS 글루코사미닐 6-O 설포트랜스퍼라제 활성을 지닌 천연의 EC 2.8.2.- 중 하나 이상에 대해 수개의 아미노산 돌연변이를 포함함으로써, 3'-포스포아데노신 5'-포스포설페이트 대신에 설포 그룹 공여기로서 아릴 설페이트 화합물과 결합하여 반응하는 활성 부위를 재구성할 수 있다.
본원에 기술된 임의의 방법에 따라 활용된 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 43, 서열 번호: 44, 서열 번호: 45, 서열 번호: 46, 서열 번호: 47, 서열 번호: 48, 서열 번호: 49, 서열 번호: 50, 서열 번호: 59, 서열 번호: 60, 및 서열 번호: 61로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있고, 이들 각각은 EC 2.8.2.- 내에서 천연의 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소 내 고도로 보존된 영역에 대해 이루어진 수개의 아미노산 돌연변이를 함유한다. 다양한 구현예에서, 가공된 글루코사미닐 6-O 설포트랜스퍼라제는 아미노산 서열 서열 번호: 20을 포함한다. 다양한 구현예에서, 본원에 기술된 임의의 방법에 따라 활용된 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 또한 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 43, 서열 번호: 44, 서열 번호: 45, 서열 번호: 46, 서열 번호: 47, 서열 번호: 48, 서열 번호: 49, 서열 번호: 50, 서열 번호: 59, 서열 번호: 60, 및 서열 번호: 61로 이루어진 그룹으로부터 선택된 아미노산 서열로부터의 하나 이상의 아미노 잔기 차이 또는 돌연변이를 포함할 수 있고/있거나 이의 생물학적 기능성 등가물이다. 이러한 잔기 차이의 비-제한적 예는 아미노산 삽입, 결실, 치환, 또는 이러한 변화의 임의의 조합을 포함한다.
다양한 구현예에서, EC 2.8.2.- 내에서 임의의 천연의 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소, 또는 이의 생물학적 활성 단편을 활용하여 HS 생성물, 특히 N,2,3,6-HS 생성물이 합성 동안에 6-O 설페이트화를 촉매할 수 있고, 여기서 가공된 설포트랜스퍼라제 효소는 다당류의 N-, 2-O, 및/또는 3-O 설페이트화를 촉매하는데 활용될 수 있다. 본 발명에 따라서, 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소를 포함하는 반응 혼합물은 또한 설포 그룹 공여기로서 3'-포스포아데노신 5'-포스포설페이트를 포함한다.
다양한 구현예에서, 글루코사미닐 6-O 설포트랜스퍼라제 효소로부터 설포 그룹을 수용하는 글루코사민 잔기는 효소와의 반응 이전에, N-비치환, N-설페이트화, 및/또는 3-O 설페이트화될 수 있다. 설포 수용기 다당류 내 임의의 다른 글루코사민 잔기는 임의로 N-, 3-O, 및/또는 6-O 설페이트화, N-아세틸화, 또는 N-비치환될 수 있다. 헤파로산-계 다당류 내 임의의 헥수론산 잔기는 이두론산 또는 글루쿠론산일 수 있고, 글루코사미닐 6-O 설포트랜스퍼라제 효소와 반응하기 이전에 임의로 2-O 설페이트화될 수 있다. 다양한 구현예에서, 6-O 위치에서 설포 그룹을 수용하는 글루코사민 잔기는 N-설페이트화되고, 글루코사민 잔기의 비-환원 및 환원 말단 중 하나 도는 둘 다에서 2-O 설페이트화된 이두론산 잔기에 인접한다. 천연의 또는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소와 반응할 수 있는 헤파로산-계 다당류의 부위의 하나의 비-제한적 예는 하기 화학식 VIII의 구조를 포함할 수 있다:
[화학식 VIII]
Figure pct00007
화학식 VIII에서, X는 상기 화학식 VIII에 나타낸 임의의 헥수론산 잔기를 포함한다.
헤파로산-계 다당류가 화학식 VIII의 구조를 포함하는 경우, 6-O-설페이트화된 다당류 생성물은 하기 화학식 IX의 구조를 포함한다:
[화학식 IX]
Figure pct00008
화학식 IX에서, X는 상기 화학식 IX에 나타낸 임의의 헥수론산 잔기를 포함한다.
다양한 구현예에서, 화학식 VIII의 구조를 포함하는 HS 다당류는 6-O 또는 3-O 설페이트화된 글루코사민 잔기를 포함하지 않는 N,2-HS 다당류일 수 있고, 이는 글루코사미닐 6-O 설포트랜스퍼라제와 반응시, N-설페이트화, 2-O 설페이트화, 6-O 설페이트화된 HS(N,2,6-HS) 생성물을 형성할 수 있다. 일부 구현예에서, 헥수로닐 2-O 설포트랜스퍼라제 반응의 생성물로서 생산된 N,2-HS 다당류는 별개의 반응 혼합물 내에서 글루코사미닐 6-O 설포트랜스퍼라제와 반응하기 이전에 단리 및 정제함으로써 2-O 설페이트화가 6-O 설페이트화 이전에 발생하도록 할 수 있다. 다른 구현예에서, 헥수론산 잔기의 2-O 설페이트화 및 글루코사민 잔기의 6-O 설페이트화는 동일한 반응 혼합물 내에서 일어날 수 있다.
다양한 구현예에서, 본원에 기술된 임의의 방법에서 활용된 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는, 이러한 효소가 아릴 설페이트 화합물로부터의 설포 그룹을 헤파로산-계 다당류, 특히 N,2-HS, N,2,6-HS 다당류, 및/또는 화학식 IX의 구조를 포함하는 HS 다당류 내 글루코사민 잔기의 3-O 위치로 전달하는 것을 촉매하는 한, 임의의 아미노산 서열을 포함할 수 있다. 추가의 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 HS 글루코사미닐 3-O 설포트랜스퍼라제 활성을 갖는 천연의 설포트랜스퍼라제의 돌연변이체일 수 있고, 이는 효소 부류 EC 2.8.2.23의 구성원이다. 본 발명에 따라서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 HS 글루코사미닐 3-O 설포트랜스퍼라제 활성을 지닌 천연의 EC 2.8.2.23 효소 중 하나 이상에 대해 수개의 아미노산 돌연변이를 포함함으로써, 3'-포스포아데노신 5'-포스포설페이트 대신에 설포 그룹 공여기로서 아릴 설페이트 화합물과 결합하여 반응하는 활성 부위를 재구성할 수 있다.
본원에 기술된 임의의 방법에 따라 활용된 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 51, 서열 번호: 52, 서열 번호: 53, 서열 번호: 54, 서열 번호: 56, 서열 번호: 27, 및 서열 번호: 28로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있고, 이들 각각은 EC 2.8.2.23 내 천연의 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소 내에 고도로 보존된 영역에 대해 이루어진 수개의 아미노산 돌연변이를 함유한다. 다양한 구현예에서, 본원에 기술된 임의의 방법에 따라 활용된 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 또한 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 51, 서열 번호: 52, 서열 번호: 53, 서열 번호: 54, 서열 번호: 56, 서열 번호: 27, 및 서열 번호: 28로 이루어진 그룹으로부터 선택된 아미노산 서열으로부터의 하나 이상의 아미노 잔기 차이 또는 돌연변이를 갖는 아미노산 서열을 포함할 수 있고/있거나 이의 생물학적 작용성 등가물이다. 이러한 잔기 차이의 비-제한적 예는 아미노산 삽입, 결실, 치환, 또는 이러한 변화의 임의의 조합을 포함한다. 다양한 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 서열 번호: 28의 아미노산 서열을 포함한다.
다양한 구현예에서, EC 2.8.2.23 내 임의의 천연의 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소, 또는 이의 생물학적 활성 단편을 활용하여 HS 생성물, 특히 N,2,3,6-HS 생성물의 합성 동안 3-O 설페이트화를 촉매할 수 있고, 여기서 가공된 설포트랜스퍼라제 효소는 다당류의 N-, 2-O, 및/또는 6-O 설페이트화를 촉매하는데 활용된다. 다양한 구현예에서, 천연의 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소를 포함하는 반응 혼합물는 또한 3'-포스포아데노신 5'-포스포설페이트를 포함한다. 다양한 구현예에서, 심지어 천연의 HS 설포트랜스퍼라제가 N-, 2-O, 또는 6-O 설페이트화 단계 중 하나 이상에서 활용되어 N,2,3,6-HS 생성물을 형성하는 경우, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소를 활용하여 HS 다당류의 3-O 설페이트화를 촉매할 수 있다.
다양한 구현예에서, 3-O 위치에서 설포 그룹을 수용할 수 있는 HS 다당류 내 글루코사민 잔기는 N-설페이트화되고, 또한 6-O 설포 그룹을 임의로 포함할 수 있다. 설포 수용기 다당류 내 임의의 다른 글루코사민 잔기는 임의로 N-, 3-O, 및/또는 6-O 설페이트화, N-아세틸화, 또는 N-비치환될 수 있다. 다양한 구현예에서, HS 다당류 내 글루코사민 잔기, 예를 들면, 3-O 설페이트화된 글루코사민 잔기 중 하나 이상은 N-설페이트화 및 6-O 설페이트화 둘 다일 수 있다. 본 발명에 따르면, 3-O 황산화된 글루코사민 잔기는 비-환원 말단에서 황산화되지 않은 글루쿠론산 잔기 및 환원 말단에서 임의로 2-O 황산화될 수 있는 이두론산 잔기에 인접한다. HS 다당류 내 임의의 헥수론산 잔기는 임의로 이두론산 또는 글루쿠론산일 수 있고, 임의로 2-O 황산화될 수 있다. 천연의 또는 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소와 함께 설포 그룹 수용체로서 반응할 수 있는 HS 다당류의 일부의 하나의 비-제한적 예는 하기 화학식 X의 구조를 포함할 수 있다:
[화학식 X]
Figure pct00009
여기서, X는 설포 그룹 또는 아세테이트 그룹이고 Y는 설포 그룹 또는 하이드록실 그룹이다. 본 발명에 따르면, X는 설포 그룹일 수 있고 Y는 설포 그룹일 수 있다. HS 다당류가 화학식 X의 구조를 포함하는 경우, 3-O 황산화된 다당류 생성물은 하기 화학식 I의 구조를 포함한다:
[화학식 I]
Figure pct00010
여기서, X는 설포 그룹 또는 아세테이트 그룹이고 Y는 설포 그룹 또는 하이드록실 그룹이다. 다양한 구현예에서, X는 설포 그룹일 수 있고 Y는 설포 그룹일 수 있다.
다양한 구현예에서, 본원에 기술된 임의의 방법에 의해 합성된 HS 생성물은 각각의 이당류 단위 내에 1, 2, 3, 또는 4개의 설포 그룹을 함유할 수 있고, 여기서 각각의 이당류 단위는 헥수론산 잔기(GlcA 또는 IdoA) 및 글루코사민 잔기를 포함한다. 비-제한적 예에서, 이당류 단위의 적어도 45%, 90% 이하, 및 바람직하게는 65% 내지 80% 범위는 N-설페이트화 및 6-O 설페이트화 둘 다인 글루코사민 잔기를 함유한다. 다양한 구현예에서, N-설페이트화 및 6-O 설페이트화 둘 다의 글루코사민 잔기의 적어도 1%, 적어도 8% 이하, 및 바람직하게는 4% 내지 5% 범위는 또한 3-O 설페이트화된다. 다른 비-제한적 예에서, 설페이트화된 다당류 생성물 내 이당류 단위의 적어도 1%, 30% 이하, 및 바람직하게는 3%는 2-O 설페이트화된 이두론산 및 N-설포글루코사민을 포함한다.
다양한 구현예에서, 화학식 I의 구조를 포함하고, 본 발명의 임의의 방법에 의해 생산된 N,2,3,6-HS 다당류는 항응고제 활성, 예를 들면, 그러나 이에 한정되지 않는 항트롬빈에 결합하여 이를 활성화시키는 능력을 가질 수 있다. 본 발명에 따라서, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합에 유용하게, N,2,3,6-HS 생성물은 실질적으로 CAS 번호: 9005-49-6 또는 CAS 번호: 9041-08-1에 기술된 임의의 항응고제 화합물과 실질적으로 등가이다.
다양한 구현예에서, 항트롬빈 활성화의 항응고제 효과는 특히, 밀리그램 당 활성의 국제 단위(IU mg-1)의 측면에서, 인자 IIa 및 인자 Xa의 이의 후속적인 효과의 함수로서 정량화될 수 있다. 다양한 구현예에서, 본 발명의 방법에 의해 제조된 항응고제 다당류는 적어도 약 1 IU mg-1, 및 약 500 IU mg-1 이하, 예를 들면, 적어도 180 IU mg-1의 항-인자 IIa(항-IIa) 활성을 가질 수 있다 다양한 구현예에서, 본 발명의 방법으로 제조된 항응고제 다당류는 적어도 약 1 IU mg-1, 및 약 500 IU mg-1 이하, 예를 들면, 적어도 180 IU mg-1의 항-인자 Xa(항-Xa) 활성을 가질 수 있다. 다양한 구현예에서, 본 발명의 임의의 방법으로 생산된 항응고제 다당류의 항응고제 활성은 적어도 0.5:1, 및 적어도 100:1 이하, 예를 들면 0.9:1 내지 1.1:1의 항-Xa 활성 대 항-IIa 활성의 비로 나타낼 수 있다.
다양한 구현예에서, N,2,3,6-HS 생성물 혼합물, 예를 들어, 상기 임의의 방법으로 생산된, 항응고제 활성을 포함하는 것은 설포 그룹 수용기로서 활용된 다당류의 중량 평균 분자량에 따라, 적어도 1,500 Da의 평균 분자량을 가질 수 있다. 다양한 구현예에서, 항응고제 N,2,3,6-HS 생성물 혼합물은 2,000 Da 내지 24,000 Da의 범위의 중량-평균 분자량을 가질 수 있다.
일반적으로, 설포 그룹 수용기로서 활용된 다당류의 평균 분자량, 특히 N-탈아세틸화 헤파로산의 평균 분자량은 본원에 기술된 임의의 방법으로 생산된 N,2,3,6-HS 생성물의 평균 분자량에 영향을 미칠 수 있다. 다양한 구현예에서, N-탈아세틸화 헤파로산 조성물이 적어도 9,000 Da, 및 12,500 Da 이하의 평균 분자량을 가질 때까지 헤파로산을 해중합하는 시간의 양을 조절함으로써, 수득되는 N,2,3,6-HS 생성물은 적어도 15,000 Da, 및 19,000 Da 이하의 중량-평균 분자량을 가질 수 있다. 다양한 구현예에서, N,2,3,6-HS 생성물 내 다당류 쇄의 20% 이하는 24,000 Da 초과의 분자량을 가질 수 있다. 다양한 구현예에서, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합에 유용하게, 8,000 Da 내지 16,000 Da의 분자량을 갖는 N,2,3,6-HS 생성물 내 다당류 쇄의 수는 16,000 Da 내지 24,000 Da의 분자량을 갖는 다당류 쇄의 수보다 더 클 수 있다.
다양한 구현예에서, 본원에 기술된 임의의 방법에 의해 생산된 항응고제 N,2,3,6-HS 생성물 혼합물은 (a) 항응고제 N,2,3,6-HS 생성물 혼합물의 중량-평균 분자량이 적어도 15,000 Da, 및 19,000 Da 이하이고; (b) 항응고제 N,2,3,6-HS 생성물 혼합물 내 다당류의 20% 이하가 24,000 Da 초과의 분자량을 갖고; (c) 8,000 Da 내지 16,000 Da의 분자량을 갖는 항응고제 N,2,3,6-HS 생성물 혼합물 내 다당류 쇄의 수가 16,000 Da 내지 24,000 Da의 분자량을 갖는 다당류 쇄의 수보다 더 크도록 하는 분자량 프로파일을 가질 수 있다. 다양한 구현예에서, 상술한 분자량 프로파일을 갖는 항응고제 N,2,3,6-HS 생성물 혼합물은 또한 적어도 0.9:1, 1.1:1 이하, 및 바람직하게는 1:1의 항-Xa 활성 대 항-IIa 활성의 비를 가질 수 있다. 다양한 구현예에서, 항응고제 N,2,3,6-HS 생성물 혼합물은 나트륨 염으로서 제조될 수 있다. 다양한 구현예에서, 항응고제 N,2,3,6-HS 생성물 혼합물은 미국 약전(United States Pharmacopeia)(USP) 참고 표준(CAS 번호: 9041-08-1)의 분자량 프로파일 및 항응고제 활성과 실질적으로 등가일 수 있다. 다양한 구현예에서, 콘드로이틴 설페이트 또는 더마탄 설페이트를 함유하지 않는 항응고제 N,2,3,6-HS 생성물 혼합물이 합성될 수 있다.
다양한 구현예에서, 설포 그룹 공여기로서 아릴 설페이트 화합물과의 생물학적 활성을 가진 가공된 설포트랜스퍼라제 효소는 상술한 임의의 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함하는 핵산으로부터 발현될 수 있다. 이러한 뉴클레오타이드 서열의 비-제한적 예는 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27을 포함한다. 당해 분야의 기술자는 상기 뉴클레오타이드 서열을 기반으로, 서열 번호: 33 내지 54 및 56 내지 61의 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 적절한 뉴클레오타이드 서열을 측정할 수 있다.
다양한 구현예에서, 상술한 임의의 가공된 설포트랜스퍼라제 효소를 암호화하는 임의의 뉴클레오타이드 서열을 포함하는 핵산은 발현 벡터를 보유하고 목적한 효소를 과발현하도록 구성된 생물학적 숙주 세포내로 삽입되도록 가공된 발현 벡터내로 삽입시킬 수 있다. 본 발명에 따라서, 발현 벡터내로 삽입된 핵산은 상술한 임의의 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함할 수 있다. 본 발명에 따라서, 발현 벡터내로 삽입된 핵산은 임의의 상술한 뉴클레오타이드 서열을 포함할 수 있다.
다양한 구현예에서, 발현 벡터는 본 발명의 가공된 설포트랜스퍼라제 효소의 생산을 보충하는 단백질 또는 숙주 인식 부위를 암호화하는 하나 이사의 핵산 서열 또는 유전자를 임의로 추가로 포함할 수 있다. 비-제한적 예는 프로모터 서열, 항생제 내성 유전자, 및 가공된 설포트랜스퍼라제 효소의 폴딩(folding) 및 안정성을 보조하는 융합 단백질을 암호화하는 유전자를 포함한다. 다양한 구현예에서, 발현 벡터는 에스케리키아 콜라이로부터의 malE 유전자를 추가로 포함할 수 있고, 이는 말토즈 결합 단백질(MBP)을 암호화한다. 예를 들면, 발현 벡터는 malE 유전자 및 임의의 뉴클레오타이드 서열, 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27, 또는 서열 번호: 33 내지 54 및 56 내지 61의 마미노산 서열을 갖는 폴리펩타이드를 암호화하는 임의의 뉴클레오타이드 서열을 포함할 수 있다. 이러한 벡터로부터의 단백질 발현은 MBP에 융합된 가공된 설포트랜스퍼라제 효소를 생성할 수 있다.
발현 벡터는 전형적으로 이로부터 효소가 과발현되어 추출될 수 있는 숙주 세포내로 형질전환된다. 다양한 구현예에서, 숙주 세포는 상술한 임의의 발현 벡터로 형질전환될 수 있고, 이의 비-제한적 예는 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27에 나타낸 바와 같은 핵산 서열, 또는 서열 번호: 33 내지 54 및 56 내지 61의 아미노산 서열을 갖는 효소를 암호화하는 임의의 서열을 포함하는 발현 벡터를 포함한다. 다양한 구현예에서, 형질전환된 숙주 세포는 세균, 효모, 곤충, 또는 포유동물 세포일 수 있다. 다양한 구현예에서, 숙주 세포는 세균 세포일 수 있다. 다양한 구현예에서, 세균 세포는 에스케리키아 콜라이(이. 콜라이)의 비-병원성 균주로부터 유래될 수 있다.
다양한 구현예에서, 상술한 임의의 방법 내 설포트랜스퍼라제 반응은 상술한 임의의 아미노산 서열의 적어도 기능성 단편을 포함하는 가공된 효소에 의해 수행될 수 있다. 다양한 구현예에서, 본 발명은 이의 기능성 단편을 포함하는, 상술한 임의의 아미노산 서열을 포함하는 가공된 설포트랜스퍼라제 효소의 실질적으로 순수한 단백질 정제를 제공한다.
본 발명의 다른 양태에서, HS 생성물, 특히 항응고제 N,2,3,6-HS 생성물이 상술한 임의의 방법에 의해 형성되면, 이는 더마탄 설페이트 및 콘드로이틴 설페이트로 이루어진 그룹으로부터 선택된 적어도 하나의 GAG를 포함함으로써, HS-GAG 혼합물을 형성하는 글리코사미노글리칸(GAG) 조성물과 조합될 수 있다. 예를 들면, 항응고제 N,2,3,6-HS 생성물은 HS-GAG 혼합물 내 다당류 쇄의 적어도 10%, 및 90% 이하를 포함할 수 있고, HS-GAG 혼합물 내 항응고제 N,2,3,6-HS 생성물의 항응고제 활성은 유지될 수 있다. 다양한 구현예에서, 설페이트 대 카복실 비는 항응고제 N,2,3,6-HS 생성물을 포함하는 이당류 단위내 카복실 그룹의 상대적인 풍부성과 비교하여 설포 그룹의 평균 상대적인 풍부성을 기술할 수 있다.
하나의 비-제한적인 예에서, HS-GAG 혼합물은 항응고제 N,2,3,6-HS 생성물을 포함하도록 형성될 수 있고: (a) 더마탄 설페이트는 HS-GAG 혼합물 내 다당류의 20%를 포함하고; HS-GAG 혼합물 내 항응고제 N,2,3,6-HS 생성물의 중량-평균 분자량은 7,000 Da 내지 8,000 Da의 범위 이내이고; (c) 항응고제 N,2,3,6-HS 생성물은 2.0:1 내지 2.2:1의 비의 설페이트 카복실 그룹 비를 포함한다. 추가의 구현예에서, HS-GAG 혼합물은 실질적으로 등가의 조성물, 중량-평균 분자량, 및/또는 설로덱사이드에 대해 항응고제 활성을 포함할 수 있다.
다른 비-제한적인 예에서, HS-GAG 혼합물은 항응고제 N,2,3,6-HS 생성물을 포함하도록 형성될 수 있고, (a) 더마탄 설페이트는 HS-GAG 혼합물 내 다당류의 적어도 10%, 15% 이하, 및 바람직하게는 12%를 포함하고; (b) 콘드로이틴 설페이트는 HS-GAG 혼합물 내 다당류의 적어도 3%, 5% 이하, 및 바람직하게는 4%를 포함하고; (c) HS-GAG 혼합물 내 다당류 모두의 중량-평균 분자량은 4,000 Da 내지 7,000 Da의 범위, 및 바람직하게는 5,000 Da 내지 6,000 Da이고; (d) 항응고제 N,2,3,6-HS 생성물은 2.0:1 내지 2.2:1의 범위의 설페이트 대 카복실 그룹 비를 포함한다. 추가의 구현예에서, HS-GAG 혼합물은 다나파로이드에 대해 실질적으로 등가의 조성물, 중량-평균 분자량, 및/또는 항응고제 활성을 포함할 수 있다.
본 발명의 다른 양태에서, 상술한 임의의 방법에 의해 생산된 임의의 HS 생성물은 하나 이상의 후속적인 공정에 의해 추가로 변형되어 HS 생성물을 해중합 및/또는 변형시킴으로써 제2의 생성물, 특히 저 분자량(LMW)-HS 생성물을 형성할 수 있으며, 이는 자체적으로 항응고제 활성을 가질 수 있다. 다양한 구현예에서, 항응고제 LMW-HS 생성물의 항-Xa, 항-IIa 활성, 및항-Xa 대 항-IIa 활성의 비는 상술한 바와 같이, 분획화되지 않은 항응고제 N,2,3,6-HS 생성물에 대해 유사하게 측정될 수 있다. 다양한 구현예에서, 항응고제 LMW-HS 생성물은 적어도 0.5:1, 적어도 100:1 이하의 항-Xa 대 항-IIa 활성의 비를 가질 수 있다. 다양한 구현예에서, 일부 항응고제 LMW-HS 생성물은 적어도 1.5:1, 및 적어도 10:1 이하의 항-Xa 대 항-IIa 활성의 비를 가질 수 있다. 다양한 구현예에서, 일부 항응고제 LMW-HS 생성물은 적어도 20:1, 및 적어도 100:1 이하의 항-Xa 대 항-IIa 활성의 비를 가질 수 있다. 이러한 항응고제 LMW-HS 생성물은 하기에 추가로 상세히 기술되어 있다.
다양한 구현예에서, 상술한 임의의 방법에 의해 생산된 N,2,3,6-HS 생성물은 N,2,3,6-HS 생성물로부터 생산된 LMW-HS 생성물에 대해 "분획화되지 않은" N,2,3,6-HS 생성물로서 지칭될 수 있다.
일반적으로, LMW-HS 생성물을 합성하기 위한 본 발명의 방법은 다음의 단계를 포함할 수 있다: (a) 상기 방법에 따라 N,2,3,6-HS 생성물을 합성하는 단계; (b) 하나 이상의 해중합제(depolymerization agent)를 제공하는 단계; 및 (c) N,2,3,6-HS 생성물을 하나 이상의 해중합제와 N,2,3,6-HS 생성물 내 다당류 중 적어도 일부를 해중합시키기에 충분한 시간 동안 처리함으로써, LMW-HS 생성물을 형성시키는 단계. 다양한 구현예에서, LMW-HS 생성물의 중량-평균 분자량은 적어도 2,000 Da, 및 12,000 Da 이하, 바람직하게는 3,000 Da 내지 8,000 Da의 범위 내이다.
다양한 구현예에서, 하나 이상의 해중합제는 분획화되지 않은 N,2,3,6-HS 생성물과 조합하여 N,2,3,6-HS 생성물을 화학적으로 및/또는 효소적으로 해중합시켜 LMW-HS 생성물을 형성할 수 있는, 하나 이상의 반응 혼합물 내에 하나 이상의 반응 구성성분에 의해 형성될 수 있고/있거나 이로 구성될 수 있다. 다양한 구현예에서, 해중합제의 선택은 어떠한 화학적 또는 효소적 해중합 공정이 발생할 수 있는지 뿐만 아니라 해중합의 결과로서 형성된 LMW-HS 생성물의 화학적 구조 및/또는 항응고제 활성을 측정할 수 있다. 이러한 해중합 공정은 다음을 포함할 수 있으나, 이에 한정되지 않는다: 이의 조합을 포함하는, 화학적 및/또는 효소적 β-제거 반응; 탈아민화 반응; 및 산화 반응. 다양한 구현예에서, 분획화되지 않은 N,2,3,6-HS 생성물은 해중합제의 임의의 조합으로 처리함으로써 LMW-HS 생성물을 형성할 수 있다.
다양한 구현예에서, 분획화되지 않은 N,2,3,6-HS 생성물을 하나 이상의 해중합제로 처리하는 시간의 양을 조절하여 목적한 분자량, 화학 구조, 및/또는 항응고제 활성을 지닌 LMW-HS 생성물을 형성할 수 있다. 본 발명에 따라서, 동일한 해중합제와 관련하여, 분획화되지 않은 N,2,3,6-HS 생성물이 해중합제로 처리되는 시간의 양을 변화시켜 유사한 화학 구조를 지니지만, 서로에 대해 상이한 분자량 및 항응고제 활성을 지닌 LMW-HS 생성물을 형성할 수 있다.
하나의 비-제한적인 예에서, 분획화되지 않은 N,2,3,6-HS 생성물은 효소적 β-제거 반응으로 해중합시켜 LMW-HS 생성물을 형성할 수 있다. 다양한 구현예에서, 해중합제는 적어도 하나의 탄소-산소 리아제 효소, 바람직하게는 서열 번호: 30, 서열 번호: 31, 및 서열 번호: 32로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는 적어도 하나의 탄소-산소 리아제 효소를 포함하는 탄소-산소 리아제 반응 혼합물을 포함할 수 있다. 다양한 구현예에서, 분획화되지 않은 N,2,3,6-HS 생성물을 탄소-산소 리아제 반응 혼합물로 분획화되지 않은 N,2,3,6-HS 생성물의 β-제거적 분해를 촉매하고 효소적으로-해중합된 LMW-HS 생성물을 형성하기에 충분한 시간 동안 처리할 수 있다. 다양한 구현예에서, 효소적으로 해중합된 LMW-HS 생성물의 중량-평균 분자량은 2,000 Da 내지 10,000 Da, 바람직하게는 5,500 Da 내지 7,500 Da의 범위, 및 더 바람직하게는 6,500 Da일 수 있다. 다양한 구현예에서, 효소적으로-해중합된 LMW-HS 생성물은 적어도 70 IU mg-1 및 120 IU mg-1 이하의 범위의 항응고제 활성, 특히 항-Xa 활성 및 1.5:1 내지 2.5:1의 범위의 항-Xa 활성 대 항-IIa 활성의 비를 가질 수 있다. 다양한 구현예에서, 효소적으로-해중합된 LMW-HS 생성물은 비-환원 말단에서 4,5-불포화된 우론산 잔기를 갖는 다당류를 포함할 수 있다. 다양한 구현예에서, 효소적으로-해중합된 LMW-HS 생성물은 틴자파린에 대해 실질적으로 등가의 화학 구조, 중량-평균 분자량, 및/또는 항응고제 활성을 가질 수 있다.
다른 비-제한적 예에서, 분획화되지 않은 N,2,3,6-HS 생성물은 화학적 β-제거 반응에 의해 해중합될 수 있다. 다양한 구현예에서, 화학적 β-제거 반응을 위한 해중합제는 염기, 바람직하게는 이의 임의의 조합을 포함하는, 수산화나트륨, 4급 수산화암모늄, 및 포스파젠 염기로 이루어진 그룹으로부터 선택된 염기를 포함할 수 있고, 분획화되지 않은 N,2,3,6-HS 생성물은 분획화되지 않은 N,2,3,6-HS 생성물의 β-제거적 절단을 유발하고 화학적으로 β-제거성인, LMW-HS 생성물을 형성하기에 충분한 시간 동안 염기로 처리할 수 있다.
다양한 구현예에서, 분획화되지 않은 N,2,3,6-HS 생성물을 해중합제로 처리하는 단계는 다음의 소-단계를 포함할 수 있다: (i) 분획화되지 않은 N,2,3,6-HS 생성물을 벤제토늄 염, 바람직하게는 벤제토늄 클로라이드와 반응시켜 벤제토늄 HS 염을 형성시키는 단계; 및 (ii) 벤제토늄 HS 염을 화학적으로 β-제거성의, LMW-HS 생성물을 형성하기에 충분한 시간 동안 염기를 포함하는 반응 혼합물와 조합시키는 단계. 다양한 구현예에서, 화학적으로 β-제거성의, LMW-HS 생성물의 중량-평균 분자량은 적어도 2,000 Da, 10,000 Da 이하, 바람직하게는 2,000 Da 내지 6,000 Da의 범위일 수 있다. 다양한 구현예에서, 화학적으로 β-제거성의, LMW-HS 생성물은 비-환원 말단에서 4,5-불포화된 우론산 잔기를 갖는 다당류를 포함할 수 있다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 하나 이상과의 조합시 유용한, 화학적으로 β-제거성의, LMW-HS 생성물은 80 IU mg-1으로부터 160 IU mg-1 이하의 범위의 항응고제 활성, 특히 항-Xa 활성, 2 IU mg-1으로부터 40 IU mg-1 이하의 범위의 항-IIa 활성, 및/또는 3.0:1 대 100:1의 범위의 항-Xa 활성 대 항-IIa 활성의 비를 가질 수 있다.
다양한 구현예에서, 벤제토늄 HS 염이 형성되면, 이를 염기로 화학적으로 β-제거성의, LMW-HS 생성물을 형성하기에 충분한 시간 동안 염기로 후속적으로 처리할 수 있다. 다양한 구현예에서, 염기는 4급 수산화암모늄, 바람직하게는 벤질 트리메틸수산화암모늄(Triton® B)일 수 있다. 다양한 구현예에서, 화학적으로 β-제거성의, LMW-HS 생성물의 중량-평균 분자량은 3,000 Da 내지 4,200 Da의 범위, 바람직하게는 3,600 Da일 수 있다. 다양한 구현예에서, 화학적으로 β-제거성의, LMW-HS 생성물의 항-Xa 활성은 적어도 80 IU mg-1 및 120 IU mg-1 이하의 범위일 수 있고/있거나, 항-IIa 활성은 적어도 5 IU mg-1 및 20 IU mg-1 이하의 범위일 수 있고/있거나 화학적으로 β-제거성의, LMW-HS 생성물의 항-Xa 활성 대 항-IIa 활성의 비는 8.0:1 내지 10.0:1일 수 있다. 다양한 구현예에서, LMW-HS 생성물은 베미파린에 대해 실질적으로 등가의 화학 구조, 중량-평균 분자량, 및/또는 항응고제 활성을 가질 수 있다.
다양한 구현예에서, 벤제토늄 HS 염은 대신에 염기와 반응시키기 전에 추가로 변형시킬 수 있다. 하나의 비-제한적 예에서, 벤제토늄 HS 염은 벤질 할라이드, 특히 벤질 클로라이드와의 반응시 HS의 벤질 에스테르 형태로 전환될 수 있다. 다양한 구현예에서, 벤질 에스테르로의 전환은 염소화된 용매, 예를 들면, 그러나 이에 한정되지 않는 메틸렌 클로라이드 및 클로로포름 내에서 일어날 수 있다.
다양한 구현예에서, 벤질 에스테르 HS가 형성되면, 이는 실질적으로 염기와 반응시켜 해중합을 개시할 수 있다. 다양한 구현예에서, 염기는 수산화나트륨일 수 있다. 다양한 구현예에서, 화학적으로 β-제거성의, LMW-HS 생성물은 비-환원 말단에서 4,5-불포화된 우론산 잔기 외에, 환원 말단에서 1,6-안하이드로만노스 또는 1,6-안하이드로글루코사민 잔기를 갖는 다당류를 포함할 수 있다. 다양한 구현예에서, 화학적으로 β-제거성의, LMW-HS 생성물의 중량-평균 분자량은 3,800 Da 내지 5,000 Da의 범위, 바람직하게는 4,500 Da일 수 있다. 다양한 구현예에서, 화학적으로 β-제거성의, LMW-HS 생성물의 항-Xa 활성은 적어도 90 IU mg-1 및 125 IU mg-1 이하의 범위일 수 있고/있거나, 항-IIa 활성은 적어도 20 IU mg-1 및 35 IU mg-1 이하의 범위일 수 있고/있거나 화학적으로 β-제거성의, LMW-HS 생성물의 항-Xa 활성 대 항-IIa 활성의 비는 3.3:1 내지 5.3:1의 범위일 수 있다. 다양한 구현예에서, 화학적으로 β-제거성의, LMW-HS 생성물은 에녹사파린에 대해 실질적으로 등가의 화학 구조, 중량-평균 분자량, 및/또는 항응고제 활성을 가질 수 있다.
다양한 구현예에서, 벤질 에스테르 HS는 대신 벤제토늄 염, 바람직하게는 벤제토늄 클로라이드의 존재하에서 트랜스염화(transalifying)됨으로써, 벤제토늄 벤질 에스테르 HS를 형성할 수 있고, 이는 이후에 염기를 사용하여 후속적으로 해중합시킬 수 있다. 다양한 구현예에서, 염기는 포스파젠 염기, 바람직하게는 2-3급-부틸이미노-2-디에틸아미노-1,3-디메틸퍼하이드로-1,2,3-디아자-포스포린(BEMP)이다. 해중합이 완료된 후, 화학적으로 β-제거성의, LMW-HS 생성물 내에 남아있는 벤질 에스테르는 비누화하여 제거할 수 있다. 다양한 구현예에서, 화학적으로 β-제거성의, LMW-HS 생성물의 중량-평균 분자량은 2,000 Da 내지 3,000 Da의 범위, 바람직하게는 2,400 Da일 수 있다. 다양한 구현예에서, 화학적으로 β-제거성의, LMW-HS 생성물의 항-Xa 활성은 160 IU mg-1이하일 수 있고/있거나 항-Xa 활성 대 항-IIa 활성의 비는 적어도 20:1, 100:1 이하, 및 바람직하게는 80:1일 수 있다. 다양한 구현예에서, 화학적으로 β-제거성의, LMW-HS 생성물은 세물로파린에 대해 실질적으로 등가의 화학 구조, 중량-평균 분자량, 및/또는 항응고제 활성을 가질 수 있다.
다양한 구현예에서, 분획화되지 않은 N,2,3,6-HS 생성물은 효소적 및 화학적 β-제거 반응 둘 다에 의해 해중합될 수 있다. 예를 들면, 효소적으로-해중합된 LMW-HS 생성물을 염기와 반응시킴으로써 화학적 β-제거 반응에 후속적으로 적용시킬 수 있다. 다른 예에서, 화학적으로 β-제거성의, LMW-HS 생성물은 하나 이상의 탄소-산소 리아제 효소와 반응시킴으로써 효소적 β-제거 반응에 후속적으로 적용시킬 수 있다.
다른 비-제한적 예에서, 분획화되지 않은 N,2,3,6-HS 생성물은 탈아민화 반응에 의해 해중합시킬 수 있다. 다양한 구현예에서, 해중합제는 탈아민화제, 바람직하게는 이소아밀 니트레이트 및 아질산으로 이루어진 그룹으로부터 선택된 탈아민화제를 포함하는 탈아민화 반응 혼합물을 분획화되지 않은 N,2,3,6-HS 생성물의 탈아민화성 절단을 유발하기에 충분한 시간 동안 포함함으로써, 탈아민화된 LMW-HS 생성물을 형성시킬 수 있다.
다양한 구현예에서, 탈아민화제는 아질산일 수 있다. 다양한 구현예에서, 탈아민화 반응 혼합물은 화학량론적 양의 산, 바람직하게는 아세트산 또는 염산, 및 알칼리 또는 알칼린 토금속 니트라이트 염, 바람직하게는 아아질산나트륨을 포함함으로써, 반응계 내에서 아질산을 형성할 수 있다. 다양한 구현예에서, 탈아민화된 LMW-HS 생성물은 환원 말단에서 2,5-안하이드로-D-만노스 잔기를 갖는 다당류를 포함할 수 있다. 다양한 구현예에서, 탈아민화된 LMW-HS 생성물의 중량-평균 분자량은 2,000 Da 내지 10,000 Da, 바람직하게는 4,000 Da 내지 6,000 Da의 범위일 수 있다. 본 발명에 따르면, 및 상기 양태 및 구현예 중 하나 이상과의 조합시 유용하게는, 탈아민화된 LMW-HS 생성물은 특히 2.0:1 내지 4.5:1의 범위의, 항-Xa 활성 대 항-IIa 활성의 비를 갖는 항응고제 활성을 가질 수 있다.
하나의 비-제한적 예에서, 탈아민화된 LMW-HS 생성물의 중량-평균 분자량은 3,600 Da 내지 5,500 Da의 범위, 바람직하게는 4,300 Da일 수 있다. 다양한 구현예에서, 탈아민화된 LMW-HS 생성물의 항-Xa 활성은 적어도 95 IU mg-1 및 130 IU mg-1 이하 까지의 범위일 수 있고/있거나 항-Xa 활성 대 항-IIa 활성의 비는 적어도 2.5:1 및 4.0:1 이하의 범위일 수 있다. 다양한 구현예에서, 탈아민화된 LMW-HS 생성물은 나드로파린에 대해 실질적으로 등가의 화학 구조, 중량-평균 분자량, 및/또는 항응고제 활성을 포함할 수 있다.
다른 비-제한적 예에서, 탈아민화된 LMW-HS 생성물의 중량-평균 분자량은 5,600 Da 내지 6,400 Da의 범위, 바람직하게는 6,000 Da일 수 있다. 다양한 구현예에서, 탈아민화된 LMW-HS 생성물의 항-Xa 활성은 적어도 110 IU mg-1 및 210 IU mg-1 이하까지의 범위일 수 있고/있거나, 항-IIa 활성은 적어도 35 IU mg-1 및 100 IU mg-1 이하까지의 범위일 수 있고/있거나 탈아민화된 LMW-HS 생성물의 항-Xa 활성 대 항-IIa 활성의 비는 적어도 1.9:1, 및 3.2:1 이하일 수 있다. 다양한 구현예에서, 탈아민화된 LMW-HS 생성물은 델테파린에 대해 실질적으로 등가의 화학 구조, 중량-평균 분자량, 및/또는 항응고제 활성을 포함할 수 있다.
다른 비-제한적 예에서, 탈아민화된 LMW-HS 생성물의 중량-평균 분자량은 4,200 Da 내지 4,600 Da의 범위, 바람직하게는 4,400 Da일 수 있고, 항-Xa 활성은 적어도 98 IU mg-1 및 155 IU mg-1 이하의 범위일 수 있고 탈아민화된 LMW-HS 생성물의 항-Xa 활성 대 항-IIa 활성의 비는 적어도 4.0:1, 및 4.5:1 이하, 바람직하게는 4.2:1일 수 있다. 다양한 구현예에서, 탈아민화된 LMW-HS 생성물은 레비파린에 대해 실질적으로 등가의 화학 구조, 중량-평균 분자량, 및/또는 항응고제 활성을 포함할 수 있다.
다른 비-제한적 예에서, 탈아민화제는 이소아밀 니트레이트이고, 탈아민화된 LMW-HS 생성물의 중량-평균 분자량은 5,000 Da 내지 5,600 Da의 범위, 바람직하게는 5,400 Da일 수 있고, 항-Xa 활성은 적어도 80 IU mg-1 및 120 IU mg-1 이하의 범위일 수 있고, 탈아민화된 LMW-HS 생성물의 항-Xa 활성 대 항-IIa 활성의 비는 적어도 2.0:1, 및 2.5:1 이하, 바람직하게는 2.4:1일 수 있다. 다양한 구현예에서, 탈아민화된 LMW-HS 생성물은 세르토파린에 대해 실질적으로 등가의 화학 구조, 중량-평균 분자량, 및/또는 항응고제 활성을 포함할 수 있다.
다른 비-제한적 예에서, 분획화되지 않은 N,2,3,6-HS 생성물은 산화 반응에 의해 해중합될 수 있다. 다양한 구현예에서, 해중합제는 산화제, 바람직하게는 과산화물(peroxide) 또는 초과산화물(superoxide)로 이루어진 그룹으로부터 선택된 산화제, 및 보다 바람직하게는 산화된 LMW-HS 생성물을 형성하기 위한 과산화수소를 포함할 수 있다. 다양한 구현예에서, 분획화되지 않은 N,2,3,6-HS 생성물을 산화제로 처리하는 단계는 다음의 소-단위를 포함할 수 있다: (i) 분획화되지 않은 N,2,3,6-HS 생성물을 산성화시켜 산성화된 HS 생성물을 형성시키는 단계; (ii) 산성화된 HS 생성물을 산화 반응 혼합물과 조합하는 단계; 및 (iii) 산성화된 HS 생성물을 산화 반응 혼합물 내에서 적어도 50℃ 미만의 온도에서 산화된 LMW-HS 생성물을 형성하기에 충분한 시간 동안 항온처리하는 단계.
다양한 구현예에서, 분획화되지 않은 N,2,3,6-HS 생성물을 산성화하는 소-단계는 산, 바람직하게는 아스코르브산을 포함하는 반응 혼합물을 HS 생성물에 첨가하여 산성화된 HS 생성물을 형성함을 포함할 수 있다. 대안적으로, 분획화되지 않은 N,2,3,6-HS 생성물을 산성화시키는 소-단계는 다음의 소-단계를 추가로 포함할 수 있다: 분획화되지 않은 N,2,3,6-HS 생성물을 양이온 교환 수지, 바람직하게는 크로마토그래피 컬럼 내에 현탁된 양이온 교환 수지 내로 로딩(loading)하는 단계; 및 양이온 교환 수지로부터의 분획화되지 않은 N,2,3,6-HS 생성물을 조합하여, 산성화된 HS 생성물을 형성시키는 단계. 다양한 구현예에서, 산성화된 HS 생성물의 pH는 적어도 3.0, 및 5.0 이하, 바람직하게는 3.0 내지 3.5의 범위 일 수 있다.
다양한 구현예에서, 산화된 LMW-HS 생성물의 중량-평균 분자량은 2,000 Da 내지 12,000 Da, 바람직하게는 4,000 Da 내지 6,000 Da의 범위일 수 있다. 다양한 구현예에서, 산화된 LMW-HS 생성물은 항응고제 활성을 가질 수 있고, 특히 여기서 항-Xa 활성 대 항-IIa 활성의 비는 1.5:1 내지 3.0:1의 범위이다.
하나의 비-제한적 예에서, 산화된 LMW-HS 생성물의 중량-평균 분자량은 적어도 4,000 Da로부터 6,000 Da 이하의 범위, 바람직하게는 5,000 Da일 수 있고, 산화된 LMW-HS 생성물의 항-Xa 활성은 적어도 95 IU mg-1 및 110 IU mg-1 이하 까지의 범위일 수 있고 항-Xa 활성 대 항-IIa 활성의 비는 적어도 1.5:1, 및 3.0:1 이하일 수 있다. 다양한 구현예에서, 산화된 LMW-HS 생성물은 파르나파린에 대해 실질적으로 등가의 화학 구조, pH, 중량-평균 분자량, 및/또는 항응고제 활성을 가질 수 있다.
다른 비-제한적 예에서, 산화된 LMW-HS 생성물의 중량-평균 분자량은 5,500 Da 내지 6,500 Da의 범위, 바람직하게는 6,000 Da일 수 있고, 항-Xa 활성 대 항-IIa 활성의 비는 적어도 2.0:1, 및 2.5:1 이하일 수 있다. 다양한 구현예에서, 산화된 LMW-HS 생성물은 아르데파린에 대해 실질적으로 등가의 화학 구조, pH, 중량-평균 분자량, 및/또는 항응고제 활성을 포함할 수 있다.
본 발명의 다른 양태에서, 상술된 임의의 방법에 따른, N,2,3,6-HS 또는 LMW-HS 생성물, 특히 항응고제 N,2,3,6-HS 또는 LMW-HS 생성물을 형성하기 위한 키트(kit)가 제공된다. 다양한 구현예에서, 키트는 적어도 하나의 가공된 아릴 설페이트-의존성 설포트랜스퍼라제 및 적어도 하나의 아릴 설페이트 화합물, 바람직하게는 PNS 또는 NCS를 포함할 수 있다. 다양한 구현예에서, 키트는 가공된 글루코사미닐 N-설포트랜스퍼라제, 가공된 헥수로닐 2-O 설포트랜스퍼라제, 가공된 글루코사미닐 6-O 설포트랜스퍼라제, 및/또는 가공된 글루코사미닐 3-O 설포트랜스퍼라제를 포함할 수 있고, 이들 각각은 설포 그룹 공여체로서 아릴 설페이트 화합물과의 반응하여 설포 그룹의 다당류, 바람직하게는 헤파로산-계 다당류로의 전달을 촉매하는데 의존적이다. 다양한 구현예에서, 키트는 헤파로산 및/또는 다른 HS 다당류를 포함하는 상술한 임의의 출발 다당류 또는 설페이트화된 다당류를 추가로 포함할 수 있다. 다양한 구현예에서, 키트는 에피머라제, 바람직하게는 서열 번호: 29의 아미노산 서열을 포함하는 에피머라제, 및 보다 바람직하게는 서열 번호: 29의 아미노산 잔기 34 내지 617번을 포함하는 에피머라제를 추가로 포함할 수 있다. 다양한 구현예에서, 키트(kit)는 헤파로산-계 다당류, 특히 N-탈아세틸화 헤파로산을 화학적으로 N-설페이트화하기 위한 임의의 구성성분 및/또는 반응 혼합물을 포함할 수 있다. 다양한 구현예에서, 키트는 숙주, 바람직하게는 세균 숙주, 및 보다 바람직하게는, 이. 콜라이로부터 헤파로산을 단리 및 정제하기 위한 임의의 구성성분 및/또는 반응 혼합물을 포함할 수 있다. 다양한 구현예에서, 키트는 상술한 임의의 방법에 따라 N,2,3,6-HS 생성물을 해중합하기 위한 임의의 구성성분 및/또는 반응 혼합물을 포함함으로써, 임의의 효소적으로-해중합된, 화학적으로 β-제거성의, 탈아민화되거나 산화된 LMW-HS 생성물을 형성할 수 있다.
본 발명에 따르면, 및 상기 양태 및 구현예 중 임의의 하나 이상과의 조합시 유용하게, 상술한 방법에 따라 제조된, 비-항응고제 또는 항응고제 HS 생성물, N,2,3,6-HS 생성물, 및/또는 LMW-HS 생성물이 약제학적으로 허용되는 염, 특히 알칼리 또는 알칼리 토금속 염, 예를 들면, 그러나 이에 한정되지 않는 나트륨, 리튬, 또는 칼슘 염으로서 제조될 수 있다.
본 발명의 이러한 및 다른 구현예는 다음의 상세할 설명으로부터 당해 분야의 통상의 기술자에게 명백하게 될 것이다.
도 1a - 도 1c는 사람 글루코사미닐 3-O 설포트랜스퍼라제 효소, 3'-포스포아데노신 5'-포스포설페이트, 및 설포 수용체 다당류 사이의 예시적인 반응 메카니즘을 나타낸다.
도 2는 아미노 작용 그룹이 아세틸 그룹으로 대체되는, 본 발명의 방법에 따라 사용될 수 있는 가공된 아릴 설페이트-의존성 글루코사미닐 N-설포트랜스퍼라제를 위한 다당류 설포 수용체의 비-제한적 예를 나타낸다.
도 3a - 도 3c는 전반적인 서열 동일성과 상관없이 나타난 보존된 아미노산 서열 모티프를 나타내는, 15개의 야생형 EC-2.8.2.8 효소의 N-설포트랜스퍼라제 도메인에 대한 다중 서열 정렬을 나타낸다.
도 4a - 도 4c는 천연의 글루코사미닐 N-설포트랜스퍼라제 효소, 3'-포스포아데노신 5'-포스포설페이트, 및 N-탈아세틸화된 헤파로산 내의 보존된 잔기들 사이의 반응 메카니즘을 나타낸다.
도 5은 EC. 2.8.2.8 효소 부류로부터의 천연 효소의 N-설포트랜스퍼라제 도메인의 결정 구조 위에 겹쳐진, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소의 활성 부위내에서 결합된 아릴 설페이트 화합물의 3차원 모델을 나타낸다.
도 6는 활성 부위 내에 존재하는 아미노산 돌연변이를 나타내는, 도 5에 모델링된 가공된 효소의 3차원 모델을 나타낸다.
도 7은 EC. 2.8.2.8 효소 부류로부터의 천연 효소 의 N-설포트랜스퍼라제 도메인의 결정 구조에 겹쳐진, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소의 활성 부위내에 결합된 아릴 설페이트 화합물의 다른 3차원 모델을 나타낸다.
도 8은 활성 부위 내에 존재하는 아미노산 돌연변이를 나타내는, 도 7에서 모델링된 가공된 효소의 3차원 모델을 나타낸다.
도 9는 각각의 나열된 서열 사이에 아미노산 잔기 차이의 위치 및 동일성을 나타내는, 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12 각각의 아미노산 서열을 포함하는 폴리펩타이드의 서열 정렬을 나타낸다.
도 10은 헥수로닐 2-O 설포트랜스퍼라제와 반응할 수 있고 N-황산화, N-아세틸화, 및 비치환된 글루코사미닐 잔기를 가지는 다당류 설포 수용체를 나타낸다.
도 11는 설페이트 그룹이 다당류내 글루쿠론산 잔기의 2-O 위치에서 전달되는, 본 발명의 방법에 따라 사용될 수 있는 헥수로닐 2-O 설포트랜스퍼라제를 위한 다당류 설포 수용체의 비-제한적 예를 나타난다.
도 12는 설페이트 그룹이 다당류 내 이두론산 잔기의 2-O 위치로 전달되는, 본 발명의 방법에 따라 사용될 수 있는 헥수로닐 2-O 설포트랜스퍼라제를 위한 다당류 설포 수용체의 비-제한적 예를 나타낸다.
도 13은 설페이트 그룹이 다당류내 글루쿠론산 잔기의 2-O 위치 및 이두론산 잔기의 2-O 위치 둘 다로 전달되는, 본 발명의 방법에 따라 사용될 수 있는 헥수로닐 2-O 설포트랜스퍼라제를 위한 다당류 설포 수용체의 비-제한적 예를 나타낸다.
도 14a - 도 14d는 전반적인 서열 동일성과 상관없이 보존된 아미노산 서열 모티프를 나타내는, EC 2.8.2.- 내 12개의 야생형 HS 헥수로닐 2-O 설포트랜스퍼라제 효소에 대한 다중 서열 정렬을 나타낸다.
도 15a - 도 15c는 천연의 2-O 설포트랜스퍼라제 효소, 및 3'-포스포아데노신 5'-포스포설페이트 내의 보존된 잔기 사이의 반응 메카니즘을 나타낸다.
도 16는 천연의 2-O-설포트랜스퍼라제 효소의 결정 구조 위에 겹쳐진, 가공된 헥수로닐 2-O-설포트랜스퍼라제 효소의 활성 부위내 아릴 설페이트 화합물의 결합을 가능하도록 하는 돌연변이된 아미노산 서열 모티프의 3차원 모델을 나타낸다.
도 17은 다수의 글루코사민 잔기의 6-O 위치가 설페이트 그룹을 수용할 수 있는, 본 발명의 방법에 따라 사용될 수 있는 HS 글루코사미닐 6-O 설포트랜스퍼라제를 위한 다당류 설포 수용체의 비-제한적 예를 나타낸다.
도 18a - 도 18c는 전반적인 서열 동일성과 상관없이 보존된 아미노산 서열 모티프를 나타내는, EC 2.8.2.- 내 15개의 야생형 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소의 다중 서열 정렬을 나타낸다.
도 19a - 도 19c는 천연의 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소, 및 3'-포스포아데노신 5'-포스포설페이트 내의 보존된 잔기 사이의 반응 메카니즘을 나타낸다.
도 20은 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소의 결정 구조위에 겹쳐진, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소의 활성 부위내 아릴 설페이트 화합물의 결합을 가능하도록 하는 돌연변이된 아미노산 서열 모티프의 3차원 모델을 나타낸다.
도 21는 각각의 나타낸 서열 사이의 아미노산 잔기 차이의 위치 및 동일성을 나타내는, 서열 번호: 18, 서열 번호: 20, 및 서열 번호: 22의 아미노산 서열을 포함하는 폴리펩타이드의 서열 정렬을 나타낸다.
도 22는 화학식 I의 구조를 포함하는 N,2,3,6-HS 생성물을 형성하기 위한, 본 발명의 방법에 따라 사용될 수 있는 HS 글루코사미닐 3-O 설포트랜스퍼라제를 위한 다당류 설포 수용체의 비-제한적 예를 나타낸다.
도 23a - 도 23c는 전반적인 서열 동일성과 상관없이 나타낸 보존된 아미노산 서열 모티프를 나타내는, EC 2.8.2.23 내 15개의 야생형 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소에 대한 다중 서열 정렬을 나타낸다.
도 24은 천연의 글루코사미닐 3-O 설포트랜스퍼라제 효소 위에 겹쳐진, 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소의 활성 부위내 아릴 설페이트 화합물의 결합을 가능하도록 하는 돌연변이된 아미노산 서열 모티프의 3차원 구조를 나타낸다.
도 25은 각각의 나타낸 서열 사이에 아미노산 잔기 차이의 위치 및 동일성을 나타내는, 서열 번호: 24, 서열 번호: 26, 및 서열 번호: 28 의 아미노산 서열을 포함하는 폴리펩타이드의 서열 정렬을 나타낸다.
도 26는 시판 표준물과 비교하여, 가공된 아릴 설페이트-의존성 글루코사미닐 N-설포트랜스퍼라제를 사용하여 합성된 N-황산화된 다당류 생성물의 오버레이드(overlaid) SAX-HPLC 크로마토그램 시리즈를 나타낸다.
도 27a - 도 27b는 가공된 아릴 설페이트-의존성 헥수로닐 2-O 설포트랜스퍼라제 효소를 사용하여 합성된 황산화된 다당류 생성물의 LCMS 크로마토그램의 시리즈를 나타낸다.
도 28a는 서열 번호: 18의 아미노산 서열을 가지는 가공된 아릴 설페이트-의존성 헥수로닐 6-O 설포트랜스퍼라제를 사용하여 합성된 황산화된 다당류 생성물의 LCMS 크로마토그램을 나타낸다.
도 28b는 서열 번호: 20의 아미노산 서열을 가지는 가공된 아릴 설페이트-의존성 헥수로닐 6-O 설포트랜스퍼라제를 사용하여 합성된 황산화된 다당류 생성물의 LCMS 크로마토그램을 나타낸다.
도 28c는 서열 번호: 22의 아미노산 서열을 가지는 가공된 아릴 설페이트-의존성 헥수로닐 6-O 설포트랜스퍼라제를 사용하여 합성된 황산화된 다당류 생성물의 LCMS 크로마토그램을 나타낸다.
도 29a - 도 29b는 이당류 및 다당류 표준의 시리즈와 비교하여, 가공된 아릴 설페이트-의존성 글루코사미닐 3-O 설포트랜스퍼라제 효소를 사용하여 합성된 황산화된 다당류 생성물의 오버레이드 LCMS 크로마토그램의 시리즈를 나타낸다.
도 30은 핵 자기 공명(NMR) 연구를 위한 목적한 양성자의 중수소 표지화(labeling)를 위한 반응식을 나타낸다.
도 31는 PNS 또는 NCS를 가진 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소를 위한 1H-NMR 스펙트럼의 확대도를 나타낸다.
도 32는 활성 가동된 글루코사미닐 3-O 설포트랜스퍼라제 효소를 위한 1H-NMR 스펙트럼의 3.5ppm 내지 4.5ppm 영역의 확대된 개관을 나타낸다.
도 33은 상업 표준과 비교하여, 화학적으로 N-황산화된 다당류 생성물의 SAX-HPLC 크로마토그램을 나타낸다.
도 34은 상업 표준과 비교하여, 설포 수용체 다당류로서 실시예 7의 화학적으로 N-황산화된 다당류 생성물을 사용하여 제조된 효소적으로 2-O 황산화된 다당류 생성물의 SAX-HPLC 크로마토그램을 나타낸다.
도 35은 상업 표준과 비교하여, 설포 수용체 다당류로서 실시예 7의 화학적으로 N-황산화된 다당류 생성물을 사용하고 반응 혼합물 속에 포함된 C5-헥수로닐 에피머라제와 함께 제조된 효소적으로 2-O 황산화된 다당류 생성물의 SAX-HPLC 크로마토그램을 나타낸다.
도 36는 상업 표준과 비교하여, 설포 그룹 수용체로서 실시예 8의 황산화된 다당류 생성물을 사용하여 제조된 효소적으로 6-O 황산화된 다당류 생성물의 SAX-HPLC 크로마토그램을 나타낸다.
[정의]
용어 "활성 부위"는 촉매작용이 일어나고, 하나 이상의 기질 결합 부위를 포함할 수 있는 촉매 단백질내 부위를 지칭한다. 활성 부위는 특수한 폴리펩타이드와 특이적으로 반응하고, 이의 활성을 조절하는 화합물의 확인시 유의적인 유용성이 있다. 천연의 리간드 또는 기질과 이의 상응하는 수용체 또는 효소의 활성 부위의 회합(association)은 많은 생물학적 작용 메카니즘을 기반으로 한다. 유사하게, 많은 화합물은 수용체의 활성 부위 및 효소의 회합을 통해 이의 생물학적 효과를 발휘한다. 이러한 회합은 활성 부위 모두 또는 임의의 부분으로 일어날 수 있다. 이러한 회합의 이해는 3'-포스포아데노신 5'-포스포설페이트 대신에 아릴 설페이트 화합물에 결합하여 이와 반응할 수 있는 설포트랜스퍼라제내 가공된 활성 부위의 설계를 이끈다.
용어, "아미노산"은 중심 탄소 원자(알파-탄소 원자)가 수소 원자, 카복실산 그룹(이의 탄소 원자는 본원에서 "카복실 탄소 원자"로서 지칭된다), 아미노 그룹(이의 질소 원자는 본원에서 "아미노 질소 원자"로서 지칭된다), 및 측쇄 그룹, R에 연결된 구조를 갖는 분자를 지칭한다. 펩타이드, 폴리펩타이드, 또는 단백질내로 혼입되는 경우, 아미노산은 하나의 아미노산을 다른 것에 연결하는 탈수 반응 에서 이의 아미노 및 카복실산 그룹의 하나 이상의 원자를 상실한다. 그 결과, 단백질내로 혼입되는 경우, 아미노산은 "아미노산 잔기"로 지칭된다. 천연적으로 존재하는 단백질의 경우에, 아미노산 잔기의 R 그룹은, 단백질 내 하나 이상의 아미노산 잔기가 유도체화되어 생물학적 시스템 내 단백질내로 혼입될 수 있다고 해도(예컨대, 글리코실화에 의해 및/또는 2개의 인접하지 않은 시스테인 아미노산 잔기의 산화를 통한 시스테인의 형성에 의해, 흔히 단백질 등의 폴딩된 구조를 안정화하는데 중요한 역활을 하는 이황화물 공유 결합을 생성함), 이로부터 단백질이 합성되는 20개의 아미노산을 구별한다. 또한, 알파-탄소 원자가 4개의 상이한 그룹(탄소 원자에 결합된 2개의 수소 원자를 갖는, 글리신을 제외하고는, 단백질을 합성하기 위해 생물학적 시스템에 의해 사용된 20개 아미노산을 사용하는 경우에서와 같이)을 갖는 경우, 각각의 아미노산의 2개의 상이한 거울상이성체 형태는 D 및 L로 지정된 각각의 아미노산의 2개의 상이한 거울상 이성체 형이 존재한다. 포유동물에서, L-아미노산 만이 천연적으로 존재하는 폴리펩타이드내로 혼입된다. 본 발명의 방법에 따라 사용되는 가공된 설포트랜스퍼라제 효소는 하나 이상의 D- 및 L-아미노산을 혼입할 수 있거나, D- 또는 L-아미노산 잔기 단독으로 포함될 수 있다.
비-천연적으로 존재하는 아미노산은 또한 본 발명의 발명에 따라 사용되는 임의의 설포트랜스퍼라제 효소, 특히 아릴 설페이트-의존성 활성을 갖는 가공된 설포트랜스퍼라제 효소내로 혼입될 수 있다. 이러한 아미노산의 비-제한적 예는 알파-아미노 이소부티르산, 4-아미노 부티르산, L-아미노 부티르산, 6-아미노 헥산산 acid, 2-아미노 이소부티르산, 3-아미노 프로피온산, 오르니틴, 노르루이신, 노르발린, 하이드록시프롤린, 사르코신, 시투룰린, 시스테산, t-부틸 글리신, t-부틸 알라닌, 페닐글리신, 사이클로헥실 알라닌, 베타-알라닌, 플루오로-아미노산, 디자이너(designer) 아미노산(예컨대, 베타-메틸 아미노산, 알파-메틸 아미노산, 알파-메틸 아미노산) 및 일반적으로 아미노산 유사체를 포함한다.
용어, "및/또는"은, 실체의 목록의 맥락에서 사용된 경우, 단일로 또는 함께 존재하는 실체를 지칭한다. 따라서, 예를 들어, 어구 "A, B, C, 및/또는 D"는 개별적으로 A, B, C, 및 D를 포함하지만, 또한 A, B, C, 및 D의 임의의 및 모든 조합 및 소 조합을 포함한다.
용어, "아릴 설페이트" 또는 "아릴 설페이트 화합물"은 방향족 환에 직접 결합된 수소 원자 중 하나 이상이 설페이트 작용 그룹에 의해 대체된 방향족 환으로부터 유도된 임의의 화합물, 작용 그룹, 또는 치환체를 지칭한다. 전형적으로, 설페이트 작용 그룹은 설페이트 에스테르 연결을 통해 아릴 설페이트 화합물의 방향족 모이어티에 공유결합으로 연결된다. 임의의 가공된 설포트랜스퍼라제를 사용하여, 다당류, 특히 헤파로산-계 다당류에 설포 그룹에 공여할 수 있는 예시적인 아릴 설페이트 화합물은, p-니트로페닐 설페이트(PNS), 4-메틸움벨리페릴 설페이트(MUS), 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 1-나프틸 설페이트, 및 4-니트로카테콜 설페이트(NCS)를 포함하나, 이에 한정되지 않는다.
용어, "아릴 설페이트-의존성 설포트랜스퍼라제"는 설포 공여체로서 아릴 설페이트 화합물과 함께 생물학적 또는 촉매 활성을 지닌 가공된 설포트랜스퍼라제의 총괄적인 그룹을 지칭한다. 설포트랜스퍼라제의 생물학적 활성이 의존적일 수 있는 아릴 설페이트 화합물의 비-제한적 예는 PNS 및 NCS를 포함한다. 본원에 기술된 바와 같이, 설포 그룹 공여체로서 아릴 설페이트 화합물과 함께 생물학적 활성을 갖는 가공된 설포트랜스퍼라제는 설포 그룹 수용체로서, 다당류, 특히 헤파로산-계 다당류와 함께 생물학적 활성을 지닐 수 있다. "아릴-설페이트-의존성 설포트랜스퍼라제"는 또한 임의의 아릴 설페이트-의존성 설포트랜스퍼라제, 예를 들면, 본원에 개시된 서열로부터 유도된 돌연변이체를 암호화하는 핵산 및 폴리펩타이드 둘 다를 포함한다.
본 발명의 임의의 방법에 따라 사용되거나 생성되고, 달리 나타내지 않는 한, 임의의 다당류 출발 물질, 중간체, 및/또는 생성물과 관련하여 용어 "평균 분자량"은 다양한 정도의 중합화, 기능화, 및 분자량, 예를 들면, "수-평균 분자량", "질량-평균 분자량", "중량-평균 분자량", "Z-(원심분리) 평균 분자량" 또는 "점도 평균 분자량"을 갖는 중합체의 혼합물의 몰 질량 분포 또는 몰 질량 평균을 지칭한다.
용어, "중량-평균 분자량"은 수학식
Figure pct00011
(여기서 Ni는 분자량 Mi의 다당류의 수이다)을 사용하여, 샘플 내 다당류의 몰 분률 분포를 사용하여 계산된, 혼합물 속의 다당류의 평균 분자량을 보고하는 방법을 지칭한다.
용어 "수-평균 분자량"은 수학식
Figure pct00012
(여기서 Ni는 분자량 Mi의 다당류의 수이다)을 사용하여, 샘플 속 다당류의 수로 나눈 샘플 속의 다당류 모두의 총 중량을 나누어 계산한, 혼합물 속의 다당류의 평균 몰 중량을 보고하는 방법을 지칭한다. 따라서, 중량-평균 분자량, Mw는 동일한 혼합물 속의 다른 다당류보다 더 큰 샘플 내 다당류에 상응하는 보다 높은 값에 대해 필수적으로 왜곡되며, 샘플이 단순분산되고, Mw가 Mn과 동일한 경우를 제외하고는, 수-평균 분자량, Mn보다 항성 더 클 것이다. 샘플 내 다당류의 특수한 샘플이 실제 중량의 큰 분산을 가지는 경우, Mw는 Mn보다 훨씬 더 클 것이다. 역으로, 샘플 내 다당류의 중량 분산이 협소하므로, Mw는 Mn에 도달한다.
용어 "상대적인 분자량" 또는 "상대적인 몰 질량"(Mr)은, 1 원자 질량 단위(amu) 또는 1 달톤(Da)과 같이, 분자의 평균 질량을 원자 질량 상수로 나누어 가장 광범위하게 측정된, 단위가 없는 양으로서의 혼합물 속의 다당류의 평균 분자량을 보고하는 다른 방법을 지칭한다. 다당류와 관련하여, Mr은 샘플 속의 다당류의 상이한 쇄 길이, 작용화, 및/또는 중량 분포를 고려하지 않으며, 대신 작은 분자와 유사한 방식으로 샘플내 다당류의 실제 평균 질량을 단순히 나타낸다.
용어, "생물학적 활성" 또는 "촉매 활성"은 특수한 생성물 또는 생성물들을 생성하기 위해 특수한 기질 또는 기질들의 특이적인 인식에 의해 특수한 화학 반응을 촉매하는 효소의 능력을 지칭한다. 일부 구현예에서, 본 발명의 가공된 효소는 기질로서 아릴 설페이트 화합물, 특히 PNS와 결합하여 반응하는데 의존성인 생물학적 또는 촉매 활성을 지닌다. 또한, 일부 가공된 효소는 MUS, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 1-나프틸 설페이트, 및 NCS를 포함하나, 이에 한정되지 않는 PNS 외에 하나 이상의 대안의 아릴 설페이트 화합물과 함께 잡다한 촉매 활성을 가질 수 있다.
용어, "암호화 서열"은 단백질의 아미노산 서열을 암호화하는, 핵산, 예를 드련, 유전자의 부위를 지칭한다.
용어, "코돈-최적화된"은 암호화된 단백질이 목적한 유기체내에서 효율적으로 발현되도록 단백질을 암호화하는 폴리뉴클레오타이드의 코돈내에서 특수한 유기체에서 우선적으로 사용된 것으로의 변화를 지칭한다. 대부분의 아미노산이 몇가지 코돈으로 나타내어진다는 점에서 유전 코드가 변성된다고 해도, 특수한 유기체에 의한 코돈 사용은 비-무작위적이고 특수한 코돈 삼중자(triplet)를 향해 편향된다는 것이 잘 알려져 있다. 본 발명의 일부 구현예에서, 가공된 효소를 암호화하는 폴리뉴클레오타이드는 발현을 위해 선택된 숙주 유기체로부터 최적의 생성을 위해 코돈 최적화될 수 있다.
용어 "에 상응하는", "에 대한 참고", 또는 "에 대해"는, 주어진 아미노산 또는 폴리뉴클레오타이드 서열의 번호매김(numbering)의 맥락에서 사용된 경우, 주어진 아미노산 또는 폴리뉴클레오타이드 서열을 참고 서열과 비교할 때 구체적인 참고 서열의 잔기의 번호매김을 지칭한다. 다시 말해서, 주어진 중합체의 잔기 번호 또는 잔기 위치는 주어진 아미노산 또는 폴리뉴클레오타이드 서열의 실제 숫자 위치에 의해서보다는 참고 서열에 대해 지정된다.
용어 "결실"은 참고 폴리펩타이드로부터 하나 이상의 아미노산의 제거에 의한 폴리펩타이드의 변형을 지칭한다. 결실은 하나 이상의 아미노산의 제거를 포함할 수 있고, 이의 전체 결과는 참고 폴리펩타이드의 촉매 활성을 보유하는 것이다. 결실은 폴리펩타이드의 내부 부위 및/또는 말단 부위에 대해 지시될 수 있다. 또한, 결실은 연속된 분절을 포함할 수 있거나 이들은 불연속적일 수 있다.
용어, "이당류 단위"는 선형 다당류를 포함하는, 많은 다당류내 가장 작은 반복된 골격 단위를 지칭하고, 여기서 가장작은 반복 단위는 2개의 당 단기로 이루어진다. 헤파로산-계 다당류와 관련하여, 이당류 단위는 헥수론산 잔기 및 글루코사민 잔기로 이루어지고, 이들 중 어느 하나는 작용화될 수 있고 여기서 헥수론산 잔기는 글루쿠론산 또는 이두론산일 수 있다. 헤파로산-계 다당류 내 각각의 이당류 단위는 이의 골격 구조에의해 및 존재하는 설포 그룹의 수 및 위치에 의해 기술될 수 있다. 또한, 동일한 다당류내, 및/또는 다당류의 동일한 샘플 내 동일한 구조를 갖는 이당류 단위의 상대적인 풍부성은 본원에 기술된 임의의 설포트랜스퍼라제와의 반응의 결과로서 특수한 위치에서 황산화의 양을 측정하기 위해 특성화될 수 있다.
용어, "단편" 또는 "분절(segment)"은 아미노- 또는 카복시-말단 결실을 갖는 폴리펩타이드를 지칭하지만, 여기서 나머지 아미노산 서열은 참고 서열에 상응하는 위치와 동일하다. 단편은 적어도 50개 아미노산 이상 더 길 수 있고, 전체 길이 아릴 설페이트-의존성 또는 천연의 설포트랜스퍼라제 효소의 70%, 80%, 90%, 95%, 98%, 및 99% 이하일 수 있다.
용어, "작용 부위" 또는 "작용 도메인"은 일반적으로 단백질에서 기능을 부여하는 단백질내 임의의 부위를 지칭한다. 대표적인 예는 활성 부위(즉, 촉매가 일어나는 경우 촉매 단백질내 부위) 및 리간드 결합 부위를 포함한다. 리간드 결합 부위는 금속 결합 부위, 보조-인자 결합 부위(co-factor binding site), 항원 결합 부위, 기질 채널(channel) 및 터널(tunnel), 및 기질 결합 도메인을 포함하나, 이에 한정되지 않는다. 효소에서, 기질 결합 도메인인 리간드 결합 부위는 또한 활성 부위일 수 있다. 기능성 부위는 또한 다수의 작용 부위의 복합체일 수 있으며, 여기서 복합체를 포함하는 하나 이상의 부위의 부재는 기능의 상실을 야기한다. 비-제한적인 예로서, 특수한 설포트랜스퍼라제 효소의 활성 부위는 다수의 결합 부위 또는 클레프트(cleft), 예를 들면, 설포 공여체에 대한 하나의 부위 및 설포 수용체에 대한 하나의 부위를 포함할 수 있다.
용어 "유전자", "유전자 서열", 및 "유전자 분절"은 기능성 단백질, 폴리펩타이드, 또는 펩타이드를 암호화하는 핵산 단위의 기능성 단위를 지칭한다. 당해 분야의 기술자에 의해 이해될 수 있는 바와 같이, 이러한 기능성 용어는 게놈 서열 및 cDNA 서열 둘 다를 포함한다. 용어 "유전자", "유전자 서열", 및 "유전자 분절"은 또한 가공된 효소 유전자 생성물, 단백질, 또는 다당류를 암호화하는 본원에 기시된 폴리뉴클레오타이드 서열과 실질적으로 동일한 임의의 DNA 서열을 지칭하며 관련된 대조군 서열의 임의의 조합을 포함할 수 있다. 용어는 또한 RNA, 또는 이러한 DNA 서열에 대해 상보성인, 안티센스 서열을 지칭한다. 본원에 사용된 바와 같은, 용어 "DNA 분절"은 재조합 벡터의 단리되어 유리된 단리된 DNA 분자, 예를 들면, 그러나 이에 한정되지 않는 플라스미드, 코스미드, 파아지, 및 바이러스를 포함한다.
용어, "글리코스아미노글리칸"은 반복 이당류 단위로 이루어진 긴, 선형 다당류를 지칭한다. 글리코스아미노글리칸(GAG)의 예는 콘드로이틴, 더마탄, 헤파로산, 하이알루론산, 및 케라탄을 포함한다. GAG는 일반적으로 질량, 길이, 이당류 단위 구조 및 작용화, 황산화도와 관련하여 일반적으로 이종성이다.
용어, "헤파로산"은 반복된 [β(1,4)GlcA-α(1,4)GlcNAc]n 이당류 단위를 갖는 특수한 GAG를 지칭하며, 여기서 GlcA는 글루쿠론산이고 GlcNAc는 N-아세틸 글루코사민이다.
용어 "헤파로산-계 다당류"는 헤파로산과 동일한 골격 구조를 갖는 다당류를 지칭하며, 여기서 이당류 단위는 1→4 글리코시드적으로 연결된 헥수론산 및 글루코사민 잔기를 포함한다. 헥수론산 잔기는 헤파로산에서와 같은 G1cA, 또는 이두론산(IdoA)일 수 있고, 2-O 위치에서 설포 그룹을 임의로 가질 수 있다. 글루코사민 잔기는 헤파로산에서와 같이 N-아세틸화되거나, N-황산화되거나, 또는 N-비치환될 수 있고, N-, 3-O, 또는 6-O 위치에서 임의로 황산화될 수 있다. 본원에 사용된 바와 같이, 글루코사민 잔기와 관련하여, 용어 "N-비치환된"은 "N-탈아세틸화된" 글루코사민 잔기와 동일하며, 글루코사미닐 N-설포트랜스퍼라제를 사용하여 화학적으로, 또는 효소적으로 설포 그룹을 수용할 수 있는 아민 작용 그룹을 지칭한다. 본 발명에 따르면, 헤파로산-계 다당류는 출발 물질로서 이용될 수 있고/있거나, 중간체로서 형성될 수 있고/있거나, 설포 그룹 수용체로서 작용할 수 있고/있거나 본원에 기술된 임의의 방법에 따라 생성물로서 합성될 수 있다.
용어 "삽입"은 참고 폴리펩타이드에 대한 하나 이상의 아미노산의 첨가에 의한 폴리펩타이드에 대한 변형을 지칭한다. 삽입은 폴리펩타이드의 내부 부위내에, 또는 폴리펩타이드의 C- 또는 N-말단에 대해 이루어질 수 있다. 삽입은 당해 분야에 공지되고 하기 기술된 바와 같은 융합 단백질을 포함할 수 있다. 삽입은 아미노산의 연속된 분절 또는 참고 폴리펩타이드내 아미노산 중 하나 이상에 의해 분리된 다수의 삽입을 포함할 수 있다.
천연적으로 존재하는 서열로부터 유래된 핵산과 관련하여 본원에 사용된 바와 같은 용어, "단리된 핵산"은 천연적으로 존재하는 뉴클레오타이드 서열을 포함하고 표준 재조합 DNA 기술에 의해 조작될 수 있지만 이것이 유래된 유기체의 천연적으로 존재하는 게놈내 이의 5' 및 3' 말단에서 바로 연속적인 뉴클레오타이드 서열에 공유결합으로 연결되지 않은 리보핵산 또는 데옥시리보핵산을 의미한다. 합성 핵산과 관련하여 본원에 사용된 바와 같은, 용어 "단리된 핵산"은 천연적으로 존재하지 않고 표준 재조합 DNA 기술에 의해 조작될 수 있는 뉴클레오타이드 서열을 포함하는 리보핵산 또는 데옥시리보핵산을 의미한다. 단리된 핵산은 예를 들어, 폴리머라제 쇄 반응(PCR), 시험관내 해독, 다른 핵산에 대한 연결(예컨대, 클로닝 또는 발현 벡터), 다른 핵산으로부터의 제한(예컨대, 클로닝 또는 발현 벡터), 세포의 형질전환, 하이브리드화 스크리닝 검정 등에 사용될 수 있는 경우 표준 재조합 DNA 기술에 의해 조작될 수 있다.
용어, "천연적으로 존재하는" 또는 "야생형"은 천연에서 발견된 효소의 형태를 지칭한다. 예를 들면, 천연적으로 존재하는 또는 야생형 폴리펩타이드 또는 폴리뉴클레오타이드 서열은 천연의 공급원으로부터 단리될 수 있고 사람 조작에 의해 의도한 대로 변형되지 않은 유기체내에 존재하는 서열이다. 야생형 폴리펩타이드 또는 폴리뉴클레오타이드 서열은 또한 시험관내에서 합성, 증폭, 및/또는 발현될 수 있고, 생체내에서 생산된 효소와 동일한 서열 및 생물학적 활성을 갖는 재조합 단백질 또는 핵산을 지칭할 수 있다. 천연적으로 존재하는 또는 야생형 설포트랜스퍼라제 효소와는 대조적으로, 본 발명의 방법에 따라 이용된 가공된 아릴 설페이트-의존성 설포트랜스퍼라제 효소는 다른 아미노산 및 핵산 서열을 가지고,설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트 대신에 아릴 설페이트 화합물과 함께 생물학적 활성을 가지며, 천연에서 발견될 수 없다.
용어 "올리고사카라이드"는 각각의 분자 내에 동일한 수, 전형적으로 3 내지 9개의 당 잔기를 함유하는 사카라이드 중합체를 지칭한다.
용어 "동일성 퍼센트"는 2개 이상의 핵산 또는 아미노산 서열 사이에 유사성의 정량적 척도를 지칭한다. 비-제한적인 예로서, 동일성 퍼센트는 본 발명의 2개 이상의 가공된 효소 사이, 2개 이상의 천연적으로 존재하는 효소 사이, 또는 하나 이상의 가공된 효소와 하나 이상의 천연적으로 존재하는 효소 사이에서 평가될 수 있다. 동일성 퍼센트는 2개 이상의 전체 길이의 서열, 2개 이상의 트렁케이트된(truncated) 서열, 또는 전체 길이의 서열 및 트렁케이트된 서열의 조합에 대해 평가될 수 있다.
용어, "다당류"는 글리코시드 결합에 의해 함께 결합되고 구조내에서 직쇄로부터 고도로 측쇄된 3차원 구조까지의 범위에 이를 수 있는 반복 단위, 전형적으로 단당류 또는 이달류 단위로 형성된 중합체성 탄수화물 구조를 지칭한다. 당해 분야에 사용된 바와 같은, 용어 "다당류"가 분자당 10개 이상의 당 잔기를 갖는 사카라이드 중합체를 지칭할 수 있지만, "다당류"는 본 출원 내에서 하나 이상의 당 잔기를 갖는 사카라이드 중합체, 예를 들면, 당해 분야에서 "올리고사카라이드"로 정의될 수 있는 3 내지 9개의 당 잔기를 갖는 사카라이드 중합체를 기술하기 위해 사용된다. 본 발명에 따르면, 용어 "다당류"는 또한 GAG 및 GAG-계 화합물, 예를 들면, 콘드로이틴, 더마탄, 헤파로산, 하이알루론산, 및 케라탄 화합물을 기술하기 위해 사용된다.
용어 "단백질", "유전자 생성물", "폴리펩타이드" 및 "펩타이드"는 아미노산 잔기의 하나 이상의 쇄로 이루어진 생체분자를 기술하기 위해 상호교환적으로 사용될 수 있다. 또한, 다수의 폴리펩타이드 소단위(예컨대, 이량체, 삼량체 또는 사량체)를 포함하는 단백질 뿐만 아니라 다른 비-단백질성 촉매 분자가 본원에 사용된 바와 같은 "단백질"의 의미내에 포함되는 것으로 이해될 것이다. 유사하게, "단백질 단편", 즉, 단백질의 아미노산 잔기 모두보다 더 적게 포함하는 아미노산 잔기의 스트레치(stretch)다 또한 본 발명의 영역내에 있으며 본원에서 "단백질"로서 지칭될 수 있다. 또한, "단백질 도메인"은 용어 "단백질"내에 포함된다. "단백질 도메인"은 소수성 및 극성 외부를 지닌 이의 자체의 특징적인 구형 기하학을 갖는 이의 자체의 반-독립적인 폴딩된 영역을 포함하는 단백질의 부위를 나타낸다.
예를 들면, 세포, 핵산, 또는 폴리펩타이드에 대한 참고로 사용되는 경우 용어 "재조합"은 천연에서 달리 존재하지 않을 수 있는 방식으로 개질된 물질을 지칭한다. 비-제한적 예는 다른 것들 중에서도, 세포의 천연(비-재조합) 형태내에서 발견되지 않거나 상이한 수준에서 또한 발현된 천연의 유전자를 발현하는 유전자를 발현하는 재조합 세포를 포함한다.
용어, "참고 서열"은 서열 비교를 위한 기초로서 사용된 개시되거나 정의된 서열을 지칭한다. 참고 서열은 보다 큰 서열의 서브세트, 예를 들면, 전체 길이의 유전자 또는 폴리펩타이드 서열의 분절일 수 있다. 일반적으로, 참고 서열은 전체 길이의 서열의 적어도 일부, 전형적으로 적어도 20개 아미노산, 또는 핵산 또는 폴리펩타이드의 전체 길이 서열을 지칭한다.
용어, "사카라이드"는 탄소, 수소, 및 산소를 포함하는 화학적 화합물에 대한 광범위한 용어인, 당으로 또한 공지된 탄수화물을 지칭하며, 여기서 수소 원자의 수는 산소 원자의 수의 필수적으로 2배이다. 흔히, 반복 단위의 수는 사카라이드에서 변할 수 있다. 따라서, 이당류, 올리고사카라이드, 및 다당류는 설포 그룹 수용체로서 본 발명의 가공된 설포트랜스퍼라제 효소에 의해 인식된 사카라이드 단위를 포함한 쇄의 모든 예이다.
본원에 기술된 임의의 방법에 따라 출발 물질로서 이용되고/되거나, 중간체로서 형성되고/되거나, 설포 그룹 수용체로서 작용하고/하거나, 생성물로서 합성된 다당류와 관련하여, 용어, "실질적으로 등가인"은 선행 기술에서 특성화된 다당류 샘플에서 발견된 것과 동일한 다당류 샘플의 하나 이상의 특성을 지칭한다. 이러한 특성은 화학 구조, 황산화 빈도 및 위치, 이당류 단위 조성, 분자량 프로파일, 및/또는 항응고 활성을 포함하나, 이에 한정되지 않는다. 2개의 다당류 샘플이 상이할 수 있는 추가의 특성을 갖는 경우에서도, 이러한 차이는 이의 실질적인 등가성에 유의적으로 영향을 미치지 않는다. 비-제한적인 예로서, 본 발명의 방법에 따라 합성된 항응고제 N,2,3,6-HS 생성물은 화학 구조, 분자량 프로파일, 및/또는 항응고 활성과 관련하여 미국 약전(United States Pharmacopeia)(USP) 참고 표준(CAS-No:-9041-08-1)과 실질적으로 등가일 수 있지만, 천연의 공급원으로부터 단리되고 동일한 샘플 속에서 비-미량의 다른 GAG를 함유할 수 있는 USP 참고 표준보다 상이한 순도로 생산될 수 있다.
단백질 제조와 관련하여, 용어 "실질적으로 순수한"은 다른 의도적으로 포함된 화합물의 중량을 제외하고는, 목적한 단백질의 적어도 60%(무수 중량당)를 함유하는 제제를 지칭한다. 특히, 제제는 다른 의도적으로 포함된 화합물의 중량을 제외하고는, 목적한 무수 중량 단백질의 적어도 75%, 보다 특히 적어도 90%, 및 가장 특히 적어도 99%이다. 순도는 임의의 적절한 방법, 예컨대, 컬럼 크로마토그래피, 겔 전기영동, 또는 고-성능 액체 크로마토그래피(HPLC) 분석에 의해 측정할 수 있다. 제제가 의도적으로 2개 이상의 상이한 본 발명의 단백질을 포함하는 경우, "실질적으로 순수한" 제제는 본 발명의 단백질의 총 무수 중량이 다른 의도적으로 포함된 화합물의 중량을 제외하고는, 총 무수 중량의 적어도 60%인 제제를 의미한다. 특히, 본 발명의 2개 이상의 단백질을 함유하는 이러한 제제의 경우, 본 발명의 단백질의 총 중량은 다른 의도적으로 포함된 화합물의 중량을 제외하고는, 제제의 총 무수 중량의 적어도 75%, 보다 특히 적어도 90%, 및 가장 특히 적어도 99%일 수 있다.
용어, "설포" 또는 "설푸릴"은 아릴 설페이트 화합물로부터 제거될 수 있고/있거나 공여체 화합물로부터 수용체 화합물로 전달될 수 있는 화학식 SO3H-를 갖는 작용 그룹, 치환체, 또는 모이어티를 지칭한다. 일부 구현예에서, 본 발명의 가공된 설포트랜스퍼라제는 아릴 설페이트 화합물로부터 다당류, 특히 헤파로산 및/또는 헤파로산-계 다당류로 설포 그룹의 전달을 촉매한다.
용어, "설포트랜스퍼라제"는 설포 공여체 화합물로부터 설포 수용체 화합물로 설포 그룹의 전달을 촉매하는데 사용된 생체내 또는 시험관내 공정에서의 임의의 효소를 지칭한다. "설포트랜스퍼라제"는 생체내에서 설포전달 반응을 촉매하는 효소를 기술하거나 시험관내에서 설포전달 반응을 촉매하는 본 발명의 가공된 효소를 기술하기 위해 상호교환적으로 사용될 수 있다.
용어, "형질전환"은 외인성 핵산을 세포 내로 도입하는 임의의 방법, 예를 들면, 그러나 이에 한정되지 않는, 형질전환, 형질감염, 전기천공, 미세주사, 네이크드 핵산(naked nucleic acid)의 직접적인 주입, 입자-매개된 전달, 바이러스-매개된 형질유도 또는 핵산을 상기 핵산의 일시적인 또는 안정한 발현 또는 상기 핵산의 상기 숙주 세포 또는 이의 후손의 게놈내로의 통합을 야기하는 숙주 세포내로 핵산을 전달하는 임의의 다른 수단을 지칭한다.
[발명의 상세한 설명]
천연적으로, 헤파로산은 골지 기구(Golgi apparatus) 내에서 글루쿠론산 및 N-아세틸화 글루코사민의 공-중합체로서 합성된 후, 하나 이상의 설포트랜스퍼라제로 개질되어 헤파란 설페이트(HS) 생성물을 형성할 수 있다. 이러한 개질은 글루코사민의 N-탈아세틸화 및 N-설페이트화, 글루쿠론산의 C5 에피머화를 포함함으로써 이두론산 잔기, 이두론산 및/또는 글루쿠론산의 2-O-설페이트화 뿐만 아니라 글루코사민 잔기의 6-O-설페이트화 및 3-O-설페이트화를 포함한다. 생체 내에서 헤파로산 및 HS 다당류의 N-설페이트화, 2-O-설페이트화, 6-O-설페이트화 및 3-O-설페이트화를 촉매하는 천연의 설포트랜스퍼라제는 특히 진핵세포 내에서 거의 모든 설포트랜스퍼라제에 의해 인식된, 거의 편재된 그룹 공여기인, 3'-포스포아데노신 5'-포스포설페이트를 전적으로 인식하여 이와 결합한다. 사람 글루코사미닐 3-O 설포트랜스퍼라제 효소, 3'-포스포아데노신 5'-포스포설페이트와 다당류 사이의 설포전달 메카니즘의 예가 도 1a - 1c에 나타나 있다. 특히, 43번 위치에서 글루탐산 잔기는 43번 위치에서 다당류 내 N-설포글루코사민 잔기의 3-O 위치로부터 양성자를 추출하여 친핵성 공격 및 3'-포스포아데노신 5'-포스포설페이트로부터 설포 그룹의 제거를 가능하도록 하는 반면, His-45 및 Asp-48은 설페이트화된 다당류 생성물이 활성 부위로부터 방출되기 전의 전이 상태를 안정화하기 위해 배위된다.
그러나, 3'-포스포아데노신 5'-포스포설페이트가 진핵 세포내에서 전적인 설포 공여체이라고 해도, 이는 짧은 반감기를 가지며 설포전달 반응 동안 경쟁적 억제제로서 작용하는, 아데노신 3',5'-디포스페이트로 용이하게 분해될 수 있다. 동물은 아데노신 3',5'-디포스페이트를 대사하여 경쟁적 결합을 방지하고 필요한 경우 각각의 설포전달 반응을 위해 3'-포스포아데노신 5'-포스포설페이트를 보충할 수 있으므로, 3'-포스포아데노신 5'-포스포설페이트를 효율적으로 이용할 수 있다. 다른 한편, 제한된 수의 세균 시스템에서 설포 공여체로서 이용될 수 있는, 아릴 설페이트 화합물(참조 Malojcic, G., et al., 상기됨)은 생체내에서 HS 다당류를 합성하는데 포함되는 것을 포함하는, 진핵 세포내에서 임의의 공지된 천연의 설포트랜스퍼라제 효소와 반응할 수 없다. 특수한 이론에 제한되지 않고, 진핵세포 설포트랜스퍼라제의 활성 부위내에서 3'-포스포아데노신 5'-포스포설페이트에 대한 결합 포켓은 결합을 촉진하고/하거나 아릴 설페이트 화합물이 활성 부위로 전적으로 도입되는 것으로부터 입체적으로 방해되기에 충분히 높은 아릴 설페이트 화합물에 대한 친화성을 가지지 않는다.
본 개시내용은 가공하여 설포 그룹 공여기로서 아릴 설페이트 화합물을 인식하여 이와 결합하도록 가공된 설포트랜스퍼라제 효소를 사용여 설페이트화된 다당류, 특히 HS 다당류를 합성하기 위한 방법 및 키트를 포함한다. 특히, 가공된 설포트랜스퍼라제 효소는 아릴 설페이트 화합물로부터의 설포 그룹을 1→4 글리코시드적으로-연결된 헥수론산 및 글루코사민 잔기의 교호하는 중합체를 함유하는, 헤파로산-계 다당류로 전달하여, HS 다당류를 형성하도록 설계되어 있다. 생체 내에서, HS 다당류는 바이러스 감염을 보조하고, 혈액 응고 및 배아 발달을 조절하고, 종양 성장을 억제하고, 특이적인 조절 단백질과 상호작용함으로써 시험 대상체의 섭식 거동을 조절함을 포함하는 다양한 중요한 생물학적 공정에서 중요한 역활을 한다. 역활에 따라서, HS 다당류는 특수한 생물학적 공정에 포함된 특이적인 단백질(들)에 으해 인식된 하나 이상의 유일한 패턴 또는 모티프(motif)를 함유할 수 있다. 본 발명의 양태에서, 본원에 기술된 임의의 방법 또는 키트에 의해 생산된 HS 다당류는 항응고제 활성을 가질 수 있다.
참고가 예시적인 구현예에 대해 이루어지고 특수한 언어가 이를 기술하지 위해 사용되지만, 본 발명을 제한하는 것으로 의도되지 않음이 이해되어야 한다. 본원에 기술된 방법의 추가의 변형 뿐만 아니라, 관련 분야에서 및 본 개시내용을 소유한 기술자에게서 일어날 수 있는 본 발명의 원리의 추가의 변형은 본 발명의 영역내에 있는 것으로 고려되어야 한다. 또한, 달리 정의하지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어는 특수한 본 발명의 구현예가 속한 당해 분야의 통상의 기술자에 의해 일반적으로 이해되는 바와 동일한 의미를 갖는다. 사용된 전문용어는 구현예만을 기술할 목적이며, 이와 같이 정의되지 않는 한, 제한하는 것으로 해석되지 않는다. 제목은 편의로만 제공되며 어떠한 방식으로도 본 발명을 제한하는 것으로 고려되지 않아야 한다. 또한, 명세서 및 청구범위 전체에서, 제공된 화학식 또는 명칭은 모든 광학 이성체 및 입체이성체 뿐만 아니라 이러한 이성체 및 혼합물이 존재하는 라세미 혼합물(racemic mixture)을 포함할 것이다.
헤파란 설페이트 다당류의 시험관 합성
본 발명의 구현예에서, HS 다당류의 합성은 헤파로산-계 다당류를 아릴 설페이트 화합물 ?? 설포 그룹 공여기로서 아릴 설페이트 화합물을 인식하고, 결합하고 반응하도록 가공된 설포트랜스퍼라제 효소를 처리함으로써 달성할 수 있다. 각각의 가공된 설포트랜스퍼라제 효소, 예를 들어, 이의 서열, 구조, 및 생물학적 활성은 하기에 추가로 상세히 기술되어 있다. 특수한 이론에 제한되지 않고, 설포 그룹 수용기로서 다당류를 인식하지만 또한 설포 공여기로서 아릴 설페이트 화합물과 결합하고 반응하는 설포트랜스퍼라제 효소는 천연적으로 관찰되지 않거나 앞서 기술되지 않았다.
당해 분야의 기술자는 본 발명의 방법에서 활용된 가공된 설포트랜스퍼라제 효소가 아릴 설페이트 화합물과 결합하여 이와 반응할 수 없는 시험관 내 및 생체 내 반응 메카니즘에 걸쳐 수개의 장점을 가짐으로서 설포 전달을 촉매할 수 있다. 현재, 다량의 설페이트화된 다당류, 예를 들면, 항응고제 활성을 갖는 HS 다당류를 수득하는 것은 동물 공급원, 예를 들면, 돼지 및 소로부터 생체내에서 생산된 설페이트화된 다당류를 단리하는 단계를 포함한다(참조, Xu, Y., et al, (2011) Science 334 (6055): 498-501). 그러나, 항응고제 HS 다당류의 전세계적인 오염 위기는 동물 공급원으로부터 이를 수득하는 것에 단독 의존하는 취약성에서의 주목을 나타낸다. 결과적으로, 최근 몇년 내에, 항응고제 HS 다당류를 충분히 다량으로 합성하여 동물-공급된 생성물을 보충 또는 대체하기 위한 합성 경로를 개발하는 것에 대한 압력이 있어 왔다.
시험관내에서 황산화된 다당류를 합성하기 위하여, 2개의 반응 도식이 역사적으로 존재하였다: 전체적인 화학적 합성 및 화학효소적 합성. 반응식 유형 둘 다는 일부 예에서 균질한 정제된 생성물을 이끌었지만, 전체적으로 합성 경로는 황산화된 다당류, 특히 항응고제 HS 다당류를 산업적 규모로 생산하는데 부적절하였다. 실제로, 전체적인 화학적 합성을 사용한 이러한 다당류의 생성이 60개로 많은 단계로서 역사적으로 요구되었고 매우 낮은 수율을 생성하였다 (참조 Balagurunathan, K., et al., (eds.) (2015) Glycosaminoglycans: Chemistry and Biology, Methods in Molecular Biology, vol. 1229, DOI 10.1007/978-1-4939-1714-3_2, ⓒ Springer Science + Business Media New York).
한편, 화학효소적 합성 경로는 일반적으로 훨씬 적은 단계를 이용하며 생성된 항응고제 생성물의 규모를 수밀리그램 양으로 증가시킨다 (참조 U.S. Pat. No. 8,771,995 및 9,951,149, 이들 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 수득가능한 생성물의 양에 있어서의 개선은 반응 용기 속에서 재조합체 HS 설포트랜스퍼라제와 3'-포스포아데노신 5'-포스포설페이트를 합하는 능력에 기여함으로써 설포 그룹의 헤파로산-계 다당류로의 전달을 촉매할 수 있다. 여전히, 이러한 점에 대한 화학효소적 방법은, 이의 활성을 위한 야생형 설포트랜스퍼라제의 3'-포스포아데노신 5'-포스포설페이트에 대한 의존성으로 인하여 항응고제 HS 다당류를 그램- 또는 대규모 양으로 합성하는 것이 적합하지 않다. pH 8.0에서 3'-포스포아데노신 5'-포스포설페이트의 반감기가 단지 약 20시간이므로, 3'-포스포아데노신 5'-포스포설페이트는 효소적으로 설페이트화된 생성물, 예를 들면, 항응고제 HS 다당류의 대규모 생산에 대해 장애가 되는 고가 및 불안정한 분자이다.
또한, 아데노신 3',5'-디포스페이트에 의한 생성물 억제는 또한 황산화된 생성물의 대규모 합성에 대한 제안 요인이 되어 왔다. 아데노신 3',5'-디포스페이트에 의한 생성물 억제의 매우 부정적인 영향은 아데노신 3',5'-디포스페이트를 3'-포스포아데노신 5'-포스포설페이트로 전환시키는 3'-포스포아데노신 5'-포스포설페이트 재생 시스템을 사용함으로써 어느 정도 감소시킬 수 있다 (참조 U.S. Pat. No. 6,255,088, 상기됨, 및 Burkhart, et al. (2000) J. Org. Chem. 65: 5565-5574). 그러나, 3'-포스포아데노신 5'-포스포설페이트 재생 시스템에도 불구하고, 3'-포스포아데노신 5'-포스포설페이트를 공급하여 천연의 설포트랜스퍼라제와의 반응을 개시하기 위한 절대적인 필요성은 그럼에도 불구하고 산업적인, 생산 등급 규모에서 황산화된 생성물, 예를 들면, 항응고제 HS 다당류를 합성하는데 대처할 수 없는 높은 비용 장벽을 생성한다.
활성을 유도하기 위해 설포 공여기로서 3'-포스포아데노신 5'-포스포설페이트를 필요로 하는 설페이트화된 다당류의 선행 화학효소적 합성과는 대조적으로, 본 발명의 방법은, 설포트랜스퍼라제가 가공되어 공여기로서 아릴 설페이트 화합물을 인식하고, 결합하여, 반응하도록 가공되므로, 3'-포스포아데노신 5'-포스포설페이트를 함께 사용할 필요성을 제거한다. 상술한 바와 같이, 일부 아릴 설페이트 화합물, 예를 들어, PNS 또는 MUS는 저렴하고, 광범위하게 이용가능하며, 공여기로서 일부 세균 설포트랜스퍼라제와 반응하는 것으로 밝혀졌다(참조 Malojcic, G., et al.,상기됨). 그러나, 이러한 세균 설포트랜스퍼라제는, 다른 방향족 만을 인식하며, 그룹 수용기로서 임의의 종류의 다당류를 인식하거나 이와 결합하지 않으므로, 세균 설포트랜스퍼라제는 설페이트화된 다당류, 특히 항응고제 HS 다당류를 합성하기에 부적합하다. 결과적으로, 및 특수한 이론에 제한되지 않고, 본 발명의 방법에서 활용된 설포트랜스퍼라제는 설포 그룹 공여기로서 아릴 설페이트 화합물 뿐만 아니라, 그룹 수용기로서 다당류, 특히 헤파로산-계 다당류와 결합할 수 있는 유일하게 알려진 설포트랜스퍼라제이다. 가공된 글루코사미닐 N-, 6-O, 또는 3-O 설포트랜스퍼라제 또는 헥수로닐 2-O 설포트랜스퍼라제는, 이의 생물학적 활성이 설포 그룹 공여기로서 아릴 설페이트 화합물과의 결합, 및 설포 그룹 수용체로서 헤파로산-계 다당류와의 결합에 의존하는 한, 임의의 아미노산 서열을 포함할 수 있다. 각각의 설포트랜스퍼라제 효소에 의해 인식된 구체적인 다당류(들)은 하기에 추가로 상세히 기술되어 있다.
천연적으로, HS 다당류는 임의의 헥수론산 잔기의 2-O 위치에서 및 다당류내 임의의 글루코사민 잔기의 N-, 3-O, 6-O 위치에서 설페이트화될 수 있다. 또한, 동일한 HS 다당류 내 수개의 헥수론산 또는 글루코사민 잔기는 임의의 상기 위치에서 설페이트화될 수 있고, HS 다당류의 국소 환경내에서 하나 이상의 효소 또는 보조 인자(co-foctor)에 의해 인식될 수 있는 특징적인 설페이트화 패턴을 형성할 수 있다. 비-제한적인 예로서, 항응고제 HS 다당류는 항트롬빈에 의해 인식된 특이적인 설페이트화 패턴을 지닌 특징적인 오당류 서열을 함유한다. 이러한 항응고제 HS 다당류, 예를 들어, 이의 특징적인 오당류 서열은 하기에 추가로 상세히 기술되어 있다.
본 발명의 구현예에서, N-, 2-O-, 3-O-, 6-O-설페이트화된-HS (N,2,3,6-HS) 생성물, 특히 항응고제 활성을 갖는 것을 합성하기 위한 방법이 제공된다. N-, 2-O-, 3-O-, 및 6-O 설페이트화 단계 중 하나 이상, 바람직하게는 모두는 3'-포스포아데노신 5'-포스포설페이트의 부재하에서, 아릴 설페이트 화합물과 반응하도록 가공된 설포트랜스퍼라제 효소를 사용하여 촉매시킬 수 있다. 이들 중 각각은 하기에 추가로 상세히 기술되어 있다. 출발 물질로서 활용된 헤파로산-계 다당류의 분자량 및 N-아세틸 글루코사민 함량을 조절함으로써, 혈액 응고를 방지하기 위해 잉ㄹ반적으로 처방된 분획화되지 않은 N,2,3,6-HS 생성물에 대한 미국 약전(USP) 참고 표준(CAS 번호: 9041-08-1)에 대해 비교가능한 분자량, 설페이트화, 및 항응고제 활성을 갖는 N,2,3,6-HS 생성물 조성물을 형성시킬 수 있다.
시험관 내 및 생체 내에서 생산된 항응고제 N,2,3,6-HS 다당류는 하기 추가로 상세히 기술된, 컨센서스(consensus) 오당류 모티프를 가지며, 이는 특이적인 순서로 설페이트화될 수 있다. 따라서, 항응고제 N,2,3,6-HS 생성물이 합성되는 본 발명의 방법에서, 오당류 모티프 내 설페이트화의 순서는 전형적으로: (1) N-설페이트화; (2) 2-O-설페이트화; (3) 6-O-설페이트화; 및 (4) 3-O 설페이트화이다. 그러나, 다당류의 다른 부위는 임의의 순서로 설페이트화될 수 있고, 다른 N,2,3,6-HS 생성물은 HS 다당류를 임의의 순서로 설페이트화시켜 합성할 수 있다. 임의의 N,2,3,6-HS 생성물을 합성하는데 활용된 반응 혼합물, 예를 들어, 항응고제 활성을 갖는 것들 각각은 당일 포트 내에서 수행될 수 있거나, 설페이트화 단계 중 하나 이상의 생성물은 다음의 설페이트화 단계에서 이동하기 전에 단리 및 정제할 수 있다.
일반적으로, 및 상술한 바와 같이, 거의 대부분의 천연의 설포트랜스퍼라제, 특히 진핵세포 설포트랜스퍼라제는, 설포 공여기로서 3'-포스포아데노신 5'-포스포설페이트와 반응한다. 결과적으로, 각각의 설포트랜스퍼라제는 이의 특수한 설포 수용기에 의해 일반적으로 특성화된다. HS 다당류를 합성하는데 활용된 설포트랜스퍼라제와 관련하여, 설포 수용기 다당류는 일반적으로 헤파로산-계 다당류이다. 그러나, 심지어 설포 그룹 수용기로서 작용하는 특수한 헤파로산-계 다당류가 하나 이상의 N- 또는 O-치환된 작용 그룹을 함유하는 경우에도, 다당류는 특수한 설포트랜스퍼라제에 의해 인식되어야만 하는 특징적인 구조 모티프를 포함함으로써, 설포전달 반응이 일어나도록 한다. 가공된, 아릴 설페이트-의존성 설포트랜스퍼라제, 및 이들이 인식하고, 결합하고, 반응하는 설포 수용기 다당류 중 각각은 하기에 추가로 상세히 기술되어 있다.
글루코사미닐 N-설포트랜스퍼라제
천연에서, 글루코사미닐 N-설포트랜스퍼라제는 이중의 N-데아세틸라제 및 N-설포트랜스퍼라제 활성을 가지며, 여기서 동일한 효소는 우선 헤파로산내 글루코사민 잔기로부터 N-아세틸 그룹의 제거를 촉매한 다음, 3'-포스포아데노신 5'-포스포설페이트로부터 설포 그룹의 제1 단계에서 N-탈아세틸화된 동일한 글루코사민 잔기로의 전달을 촉매한다. 효소의 이중의 N-데아세틸라제 및 N-설포트랜스퍼라제 활성은 2개의 별개의 구조적 도메인-N-데아세틸라제 도메인 및 N-설포트랜스퍼라제 도메인을 통해 달성된다. 그러나, 도메인 중 하나의 활성은 다른 도메인의 활성에 대해 사전에 필요하지 않으며, N-데아세틸라제 또는 N-설포트랜스퍼라제 활성을 포함하는 재조합체 단일-도메인 단백질이 발현 및 정제될 수 있다. 일반적으로, 단일-도메인, 재조합체 N-설포트랜스퍼라제 효소가 HS 다당류의 합성을 실행하기 위해 사용된다. 유사하게, 및 본 발명의 구현예에서, 가공된 아릴 설페이트-의존성 글루코사미닐 N-설포트랜스퍼라제 효소는, N-탈아세틸화된 헤파로산의 N-설페이트화를 촉매하기 위하여, 단일의 N-설포트랜스퍼라제 도메인을 포함하기 위하여 발현 및 정제될 수 있다.
설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트를 이용하는 천연적으로 존재하는 글루코사미닐 N-설포트랜스퍼라제 효소는 EC 2.8.2.8 효소 부류의 구성원이다. 설포전달 반응을 시작하기 전에, EC 2.8.2.8 내의 효소에 의해 설포 수용체로서 인식된 N-탈아세틸화된 헤파로산, 특히 EC 2.8.2.8 내의 효소의 N-설포트랜스퍼라제 도메인은 하기 화학식 II의 구조를 포함하는 하나 이상의 이당류 단위를 포함할 수 있다:
[화학식 II]
Figure pct00013
여기서, n은 정수이고 R은 수소 또는 설포 그룹으로 이루어진 그룹으로부터 선택된다. 효소와 반응하는 다당류의 부위가 화학식 II의 구조를 포함한다고 해도, 다당류의 다른 부분들은 N- or O- 대체될 수 있다. 전형적으로, 화학식 II의 구조를 포함하는 N-탈아세틸화된 헤파로산은 적어도 4개의 이당류 단위, 또는 총 8개의 당 잔기를 포함한다. N-탈아세틸화된 헤파로산이 설포 그룹 수용체로서 이용된 설포전달 반응은 문헌: Sheng, J., et al., (2011) J. Biol. Chem. 286 (22):19768-76, as well as Gesteira, T.F., et al., (2013) PLoS One 8 (8):e70880에 논의되어 있고, 이의 개시내용은 이의 전문이 참고로 포함된다.
3'-포스포아데노신 5'-포스포설페이트 및 N-탈아세틸화된 헤파로산의 성공적인 결합시, 글루코사미닐 N-설포트랜스퍼라제 효소는 설포 그룹의 비치환된 글루코사민으로의 전달을 촉매하여 하기 화학식 III의 구조를 포함하는 N-황산화된 헤파로산 생성물을 형성한다:
[화학식 III]
Figure pct00014
여기서, n은 정수이고 R은 수소 원자 또는 설포 그룹으로 이루어진 그룹으로부터 선택된다.
다른 구현예에서, EC 2.8.2.8 내의 임의의 천연의 글루코사미닐 N-설포트랜스퍼라제 효소 또는 임의의 가공된 아릴 설페이트-의존성 글루코사미닐 N-설포트랜스퍼라제 효소와 반응하는 N-탈아세틸화된 헤파로산 내의 반복된 이당류 단위 각각은 화학식 II의 구조를 포함한다. 추가의 구현예에서, 글루코사미닐 잔기의 6-O 위치 및 글루쿠론산 잔기의 2-O 위치에서 R 그룹 둘 다는 이당류 단위 모두에서 수소 원자이다. 다른 구현예에서, 다당류내 일부 위치에서, 글루코사민 잔기의 적어도 일부는, N-아세틸화된 중합체내 글루코사미닐 잔기가 본 발명의 가공된 설포트랜스퍼라제와 함께 설포 그룹 수용체로서 직접 관여할 수 없다고 해도, 도 2에 나타낸 바와 같이, 여전히 N-아세틸화되어 있다. 그러나, 다당류내 N-아세틸화된 잔기의 존재는 가공된 설포트랜스퍼라제가 동일한 다당류내에서 비-아세틸화된 잔기에 대해 갖는 결합 친화성에 영향을 미치지 않는다. 다른 구현예에서, 화학식 II의 구조를 포함하는 부분에 인접한 헤파로산-계 다당류의 구조와 상관없이, 야생형 또는 천연의 글루코사미닐 N-설포트랜스퍼라제와 반응하여 생성되는 N-황산화된 생성물은 화학식 III의 구조를 포함한다.
다른 구현예에서, 다당류 내에 화학식 II의 구조를 포함하는 다수의 이량체가 존재하는 경우, 임의의 글루코사미닐 아민은 N-설페이트화될 수 있다. 유사하게, 동일한 다당류, 예를 들면 및 모든 이하의 이용가능한 존재할 수 있는 비치환된 글루코사미닐 잔기는 N-설페이트화될 수 있다.
다른 구현예에서, 화학식 II를 포함하는 헤파로산-계 다당류은 균질한 조성물로서 제공될 수 있다. 여전히 다른 구현예에서, 화학식 II의 구조를 포함하는 설포 수용기 다당류는 다양한 쇄 길이, 분자량, 및 단당류 조성물 및 작용화를 갖는 다당류의 다분산성 혼합물을 포함하는 조성물 내에 포함될 수 있다.
다른 구현예에서, 화학식 II의 구조를 포함하고 본 발명의 방법에 따라 활용된 헤파로산-계 다당류가 시판 공급원으로부터 수득 및/또는 개질될 수 있다. 다른 구현예에서, 헤파로산은 세균 또는 진핵세포 공급원으로부터 단리된고 후속적으로 화학적으로 처리되어 화학식 II의 구조를 포함하는 N-탈아세틸화 다당류를 생산할 수 있다. 이러한 공정은 하기 설명 및 실시예에 상세히 논의되어 있다.
야생형 EC 2.8.2.8 효소의 N-설포트랜스퍼라제 도메인은 이의 서열에서 크게 변할 수 있지만, 궁극적으로 여전히 정확하게 동일한 기능, 즉, N-탈아세틸화된 헤파로산내 치환되지 않은 글루코사민 잔기의 N-황산화를 촉매하는 기능을 가질 수 있는 대략 300 내지 350개의 아미노산 잔기를 포함한다. 특수한 이론에 제한되지 않고, 각각의 야생형 EC 2.8.2.8 효소는 모든 종에 걸쳐 동일하거나 고도로 보존된 다수의 아미노산 서열 모티프 및 제2 구조가 존재하므로 동일한 화학 반응을 촉매할 수 있다.
또한, 수개의 보존된 아미노산 서열 모티프는 3'-포스포아데노신 5'-포스포설페이트 및/또는 다당류의 결합에 직접 포함되거나, 화학 반응 자체에 관여한다. 천연 효소 의 N-설포트랜스퍼라제 도메인 사이의 보존된 아미노산 서열 모티프의 동일성은 활성 부위내 아미노산 잔기가 EC 2.8.2.8 효소 부류내 다른 천연의 설포트랜스퍼라제의 N-설포트랜스퍼라제 도메인의 아미노산 서열을 따라 확인된 공지된 결정 구조(PDB 코드: 1NST)를 갖는 사람 EC 2.8.2.8의 N-설포트랜스퍼라제 도메인의 아미노산 서열을 비교함으로써 입증될 수 있다. 수개의 원핵세포 유기체 및 사람 효소의 수개의 동형을 포함하는, 15개 효소의 N-설포트랜스퍼라제 도메인의 다중 서열 정렬은 사람 N-설포트랜스퍼라제 효소(UniProtKB-수탁 번호 P52848)에 대한 동일성 퍼센트와 함께, 도 3a 내지 도 3c에 나타나 있다. 도 3a 내지 도 3c에 나타난 바와 같이, 서열은 랫트 N-설포트랜스퍼라제 도메인에 대해 P52848 참고 서열(entry sp|Q02353|NDST1_RAT)과 98.4% 서열 동일성으로부터 초파리 N-설포트랜스퍼라제 도메인에 대해 55.6% 서열 동일성(entry sp|Q9V3L1|NDST_DROME) 까지의 범위이다. 당해 분야의 기술자는 다중 서열 정렬이 명확성의 경우 15개 서열에 한정되었으며, 확인되고 고도로 보존된 활성 부위 및.또는 결합 영역을 또한 갖는 다른 야생형 EC 2.8.2.8 효소의 N-설포트랜스퍼라제 도메인을 암호화하는 수백개의 아미노산 서열이 존재함을 인식할 수 있다.
도 3a 내지 도 3c 내에서, 특수한 위치에서 검정색 배경과 함께 백색으로 나타낸 아미노산은 모든 서열에 걸쳐 100% 동일하다. 특수한 위치에서 아미노산이 동일하거나 화학적으로 또는 구조적으로 유사함을 의미하는, 고도로 보존된 아미노산은 검정색 윤곽으로 둘러싸여 있다. 고도로 보존된 영역 내에서, 서열의 대부분에 존재하는 컨센서스 아미노산은 굵은 글씨체이다. 동일하지 않거나 고도로 보존된 특수한 위치에서의 아미노산은 전형적으로 가변성이다. 서열내 한 주기는 고도로 보존되거나 동일한 영역 사이에 추가의 잔기를 갖는 다른 서열(들)과의 서열 정렬을 촉진하기 위해 서열내로 삽입된 갭을 나타낸다. 최종적으로, 서열의 상기 각각의 블록은 정렬내 아미노산의 동일성을 기반으로 참고로서 야생형 사람 N-설포트랜스퍼라제 효소의 구조를 사용하여, 모든 서열에 걸쳐 보존된 제2 구조를 나타내는 일련의 화살표 및 코일이다. 화살표에 인접한 β 기호는 β-시이트(β-sheet)를 지칭하는 반면, α 기호 또는 η 기호에 인접한 코일은 나선의 제2 구조를 지칭한다.
도 3a 내지 도 3c의 15개의 정렬된 서열 내에서, 사람 N-설포트랜스퍼라제 도메인의 결정 구조를 기반으로, 활성 부위를 포함하는 하나 이상의 아미노산을 포함하는 몇가지 보존된 아미노산 모티프가 존재한다. 도 3a 내지 도 3c 내 아미노산 잔기의 번호매김을 기반으로, 이러한 보존된 아미노산 서열 모티프는 잔기 40-46(Q-K-T-G-T-T-A); 잔기 66-69(T-F-E-E); 잔기 101-105(F-E-K-S-A); 잔기 139-143(S-W-Y-Q-H); 및 잔기 255-262(C-L-G-K/R-S-K-G-R)를 포함한다. 추가의 구현예에서, 보존된 아미노산 서열 모티프 Q-K-T-G-T-T-A를 포함하는 EC 2.8.2.8내 야생형 설포트랜스퍼라제 효소의 일부 동형은 잔기 40 내지 49로부터의 확장된 보존된 아미노산 서열 모티프, Q-K-T-G-T-T-A-L-Y-L을 추가로 포함한다.
특수한 이론에 제한되지 않고, 이러한 잔기는 화학 반응을 촉진시키거나 이에 관여하거나, 활성 부위내 3'-포스포아데노신 5'-포스포설페이트 또는 다당류의 결합을 가능하게 하는 것으로 여겨진다. 특히 및 도 4a 내지 도 4c에 타나낸 바와 같이, 143번 위치(N-데아세틸라제 도메인을 또한 포함하는 전체 길이의 천연의 설포트랜스퍼라제 효소의 아미노산 서열 내 716번 위치에 상응)는 다당류내 치환되지 않은 글루코사미닐 잔기의 아민 작용 그룹내 2개의 양성자 중 하나를 추출하는 위치내에 존재하여, 질소 원자가 3'-포스포아데노신 5'-포스포설페이트의 친핵성 공격을 개시하여 설푸릴 그룹을 제거하는 것을 가능하도록 한다. 또한, 41번 및 260번 위치에서 라이신 잔기는 또한 공통적으로 보존되어 있으며, 설푸릴 모이어티와 함께 조직화되어, 활성 부위내 3'-포스포아데노신 5'-포스포설페이트의 결합을 구동할 뿐 아니라 반응 과정 동안에 전이 상태를 안정화시키는 것으로 고려된다(참조: Gesteira, T.F., et al., 상기됨, 및 Sueyoshi, T., et al., (1998) FEBS Letters 433:211-214, 이들 문헌에 개시된 내용은 본 문서에 참조로서 통합된다).
그러나, 상술한 바와 같이, EC 2.8.2.8 내 천연의 설포트랜스퍼라제 효소는, 천연의 설포트랜스퍼라제의 활성 부위가 결합을 촉진시키고/시키거나 아릴 설페이트 화합물이 활성 부위로 도입하는 것으로부터 입체적으로 방해받도록 충분히 높은 친화성을 가지지 않으므로, 아릴 설페이트 화합물로부터의 설페이트 그룹의 다당류로의 전달을 촉매할 수 없다. 결과적으로, 및 다른 구현예에서, EC 2.8.2.8 효소는 이의 아미노산 서열 내 수개의 위치에서 돌연변이되어 활성 부위내 아릴 설페이트 화합물의 결합을 가능하게 하고/하거나 아릴 설페이트 화합물을 최적으로 위치시켜 설페이트 그룹의 다당류로의 전달이 일어날 수 있도록 할 수 있다.
따라서, 및 다른 구현예에서, 본 발명의 방법에 따라 사용될 수 있는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 도 3a 내지 도 3c에 나타낸 아미노산 서열을 갖는 효소를 포함하는 EC 2.8.2.8 내 임의의 천연 효소 의 N-설포트랜스퍼라제 도메인에 대해 돌연변이된 단일의 N-설포트랜스퍼라제 도메인을 포함할 수 있다. 다른 구현예에서, 본 발명의 방법에 따라 사용될 수 있는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 EC 2.8.2.8의 임의의 천연 효소 의 N-데아세틸라제 도메인의 동일하거나 돌연변이된 아미노산 서열을 갖는 N-데아세틸라제 도메인을 추가로 포함할 수 있다.
다른 구현예에서, 가공된 효소의 아미노산 서열로 가공된 돌연변이는 아릴 설페이트 화합물이 설포 그룹 공여체로서 가공된 글루코사미닐 N-설포트랜스퍼라제 효소와 결합하고 이와 반응하는 생물학적 활성을 촉진시킨다. 추가의 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 설포 그룹 공여체로서 아릴 설페이트 화합물에 결합하여 이와 반응하지만, 이는 설포 그룹 수용체로서 헤파로산 및/또는 N-탈아세틸화된 헤파로산을 가진 대응하는 야생의 설포트랜스퍼라제의 생물학적 활성을 보유한다. 특수한 이론에 제한되지 않고, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소의 아미노산 서열내로 삽입된 돌연변이로 인하여, 이의 설포트랜스퍼라제 활성은 3'-포스포아데노신 5'-포스포설페이트가 아릴 설페이트 화합물로 치환된 것을 제외하고는, 상기 도 4a 내지 도 4c에 기술된 바와 유사한 메카니즘을 사용하여 아릴 설페이트 화합물로부터 설퍼릴 그룹의 설포 수용체 다당류로의 직접적인 전달을 포함할 수 있는 것으로 여겨진다. 그렇지 않으면, 돌연변이는 아릴 설페이트 화합물의 가수분해 및 설포히스티딘 중간체의 형성을 포함하는 2-단계 공정에 이어, N-황산화된 생성물을 형성시키기 위한 N-탈아세틸화된 헤파로산 내 N-비치환된 글루코사민에 의한 설포히스티딘 중간체의 친핵성 공격에 의해 설포트랜스퍼라제 활성을 유발할 수 있는 것으로 여겨진다. 어느 하나의 메카니즘에 의해, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 하기 실시예에 기술된 바와 같이, 아릴 설페이트 화합물로부터 다당류로의 설포 전달을 달성할 수 있다.
다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 상술하고 도 3 내 천연 효소 의 N-설포트랜스퍼라제 도메인내에서 발견된 보존된 아미노산 서열 모티프에 대해 하나 이상의 돌연변이된 상기된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소의 아미노산 서열 내에 존재하는 각각의 돌연변이된 아미노산 서열 모티프는 EDC 2.8.2.8 내 천연 효소 의 N-설포트랜스퍼라제 도메인내 상응하는 보존된 아미노산 서열 모티프에 대해 적어도 하나의 아미노산 돌연변이를 포함한다. 다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 하나의 돌연변이된 아미노산 서열 모티프를 포함한다. 다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 2개의 돌연변이된 아미노산 서열 모티프를 포함한다. 다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 3개의 돌연변이된 아미노산 서열 모티프를 포함한다. 다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 4개의 돌연변이된 아미노산 서열 모티프를 포함한다. 다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 5개의 돌연변이된 아미노산 서열 모티프를 포함한다. 다른 구현예에서, EC 2.8.2.8내 임의의 천연의 글루코사미닐 N-설포트랜스퍼라제 효소의 N-설포트랜스퍼라제 도메인에 대해 적어도 하나의 돌연변이된 아미노산 서열 모티프를 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 33, 서열 번호: 34, 서열 번호: 35, 서열 번호: 36, 서열 번호: 37, 서열 번호: 38, 서열 번호: 39, 및 서열 번호: 40로 이루어진 그룹으로부터 선택된 아미노산 서열을 가질 수 있다.
다른 구현예에서, 3D 분자 가시화 시스템(예를 들면, 비-제한적 예로서, 개방-공급원 소프트웨어, PyMOL) 내 사람 N-데아세틸라제/N-설포트랜스퍼라제 효소(PDB code: 1NST)의 N-설포트랜스퍼라제 도메인의 결정 구조의 고찰 시, 관련 서열, 예를 들면, 사람 N-설포트랜스퍼라제 도메인에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 함유하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소의 구조는 도 8에 나타낸 바와 같이 비교를 위해 모델링될 수 있다. 하나의 비-제한적 예에서, 도 5는 서열 번호: 10의 아미노산 서열을 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소로 덮힌 사람 N-설포트랜스퍼라제 도메인의 활성 부위의 확대된 도면을 나타내며, 여기서 가공된 효소의 구조는 사람 N-설포트랜스퍼라제 도메인 아미노산 서열에 대한 돌연변이의 제조시 계산된다. 3'-포스포아데노신 5'-포스포설페이트가 설포 공여체이고, 사람 N-설포트랜스퍼라제 도메인과 함께 공-결정화된 설포전달 반응의 생성물인, 아데노신 3',5'-디포스페이트가 또한 활성 부위내에 나타나 있다. PNS는 또한 이러한 용액이 가능한 경우, 다당류 결합 부위(나타내지 않음)에 인접한 효소 활성 부위 내 리간드의 최적화된 위치 및 배향을 계산하도록 설계된 분자 역학(MD) 모의의 컨센서스 용액(consensus solution)을 사용하여 가공된 효소 활성 부위로 모델링된다.
도 5에 나타낸 바와 같이, 도 3에 나타낸 사람 N-설포트랜스퍼라제 도메인(UniProtKB-수탁 번호 P52848)의 서열에 대해, 서열 번호: 10 내에 수개의 돌연변이가 존재하지만, 각각의 단백질 골격은 서로 거의 동일한 위치내에 존재함으로써, 활성 부위의 1 대 1 비교가 가능하다. 서열 번호: 10의 서열을 포함하는 가공된 효소의 구조 내에서, MD 시뮬레이션(simulation)으로부터의 컨센서스 용액은 PNS내 설페이트 모이어티가 EC 2.8.2.8 내에 또한 공통적으로 보존된, 천연의 아미노산 잔기, 트레오닌에 대해 돌연변이된, 히스티딘 잔기, His-45에 인접하게 결합하는 것을 선호함을 나타낸다. 다른 한편, 사람 N-설포트랜스퍼라제 도메인 내에서, 아데노신 3',5'-디포스페이트는 상술한 보존된 His-143 근처에 위치한다. 3'-포스포아데노신 5'-포스포설페이트 기질내에 포함될 수 있는 설포 그룹이 나타나 있지 않지만, 당해 분야의 기술자는 3'-포스포아데노신 5'-포스포설페이트가 존재하는 경우, 설페이트 그룹은 His-143에 대해 바로 근접한 위치내에서 배향되고 PNS내에서 설페이트 그룹과 부분적으로 오버래핑될 수 있음을 인식할 수 있다. 특수한 이론에 제한되지 않고, 설페이트 그룹의 거의 오버래핑되는 위치는 염기로서 His-143을 사용함으로써 설포 그룹 전달을 촉진시키는 가공된 효소의 능력을 고려하여 다당류 내에서 글루코사미닐 잔기로부터 양성자를 제거하는 것으로 여겨진다.
그러나, 설페이트 그룹이 활성 부위내 거의 동일한 위치에서 결합할 수 있지만, 아릴 설페이트 화합물은 다당류에 설포 그룹 전달을 촉진시키기 위해 EC 2.8.2.8 효소와 함께 이용될 수 없다. 상술한 바와 같이, 천연 효소 의 활성 부위내 아미노산 잔기는 진화되어 3'-포스포아데노신 5'-포스포설페이트에 대한 강한 결합 친화성을 지니며, 아릴 설페이트 화합물이 결합 및 이어서 반응을 유발하기에 충분한 친화성을 가지지 않는 경향이 있는 것으로 여겨진다. 결과적으로, 다른 돌연변이가 가공된 효소 내에 존재하여 활성 부위내에서 아릴 설페이트 화합물의 결합을 유발시켜야만 한다. 도 6는 서열 번호: 10의 아미노산 서열을 포함하는 가공된 효소내 PNS를 둘러싸는 다른 돌연변이, 예를 들면, Trp-106, His-69, 및 His-40을 나타낸다. Trp-106와 His-69는 PNS 내에서 방향족 모이어티와 π-π 스태킹 결합 접촉(stacking binding contact)을 제공하도록 위치한다. 또한, His-69 및 His-40 내 ε2 질소 원자는 설푸릴 그룹과 직접 배위된다. 천연 효소 서열로부터 보유된 라이신 잔기, Lys-41(명확성을 위해 나타내지 않음) 및 Lys-103은 전달 동안 설페이트 그룹과 배위하는 위치내에 존재하여 전이 상태를 안정화시킨다. 특히, 3'-포스포아데노신 5'-포스포설페이트내 설페이트 그룹과 또한 배위하는, 천연의 아미노산 잔기, Lys-260은 가공된 효소 서열 내에서 발린 잔기로 돌연변이된다. 특수한 이론에 제한되지 않고, PNS와의 반응에 필수적인, His-45는 260번 위치에서 라이신 잔기와 전하 반발을 나타낼 수 있고, 발린 잔기에 대한 돌연변이는 전하 반발을 제거하면서 결합 부위내에서 일부 입체적 부피(steric bulk)를 보유한다. 그럼에도 불구하고 Lys-103은, 특히 설푸릴 그룹이 도 6에 나타낸 바와 같이, His-45와 관련되거나 이에 결합된 경우, 설푸릴 그룹과 배위하도록 위치한다.
다른 비-제한적 예에서, 도 7은 서열 번호: 2의 아미노산 서열을 포함하는, 상이한 가공된 글루코사미닐 N-설포트랜스퍼라제 효소와 겹쳐진 사람 N-설포트랜스퍼라제 도메인(UniProtKB-수탁 번호 P52848)의 활성 부위의 확대된 도면을 나타낸다. PNS는 상술한 바와 같이 가공된 효소 활성 부위로 모델링된다. 서열 번호: 10의 가공된 효소를 사용하므로, 가공된 효소의 서열 번호: 2의 단백질 골격은 또한 사람 효소의 N-설포트랜스퍼라제 도메인과 거의 동일한 구조를 갖는다. 그러나, MD 시뮬레이션으로부터의 컨센서스 용액은 PNS내 설페이트 모이어티가 수개의 EC 2.8.2.8 효소의 N-설포트랜스퍼라제 도메인의 활성 부위에서 보존된 천연의 루이신 잔기로부터 돌연변이된, 상이한 히스티딘 돌연변이(His-49)에 인접하게 결합하는 것을 선호함을 나타낸다. 결과적으로, PNS와 결합 접촉을 형성한 서열 번호: 10 내 돌연변이는 서열 번호: 2 내에 필수적으로 존재하지 않는다. 도 8에 나타내고 서열 번호: 10과 유사한 바와 같이, PNS, Trp-45 및 His-67의 방향족 모이어티를 둘러싸는 π-π 스태킹 결합 접촉을 형성하는 서열 번호; 2 내에 존재하는 2개의 돌연변이가 존재한다. PNS와 배위되는 측쇄를 포함하는 다른 돌연변이는 Ser-69(PNS의 니트로 작용 그룹과 배위됨) 및 His-260(설페이트 모이어티와 배위됨)을 포함한다. 서열 번호: 10과 유사하게, 260번 위치에서 천연의 라이신 잔기가 돌연변이되므로, 천연의 Lys-103 잔기를 서열 번호: 2 내에서 이용하여 PNS 내에서 설페이트 모이어티와 배위시킨다.
당해 분야의 기술자는 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 12, 서열 번호: 33, 서열 번호: 34, 서열 번호: 35, 서열 번호: 36, 서열 번호: 37, 서열 번호: 38, 서열 번호: 39, 및 서열 번호: 40에 기술된 것을 포함하나, 이에 한정되지 않는 임의의 다른 아미노산 서열의 가공된 글루코사미닐 N-설포트랜스퍼라제 효소가 서열 번호: 2 및 서열 번호: 10의 아미노산 서열을 갖는 사람 N-설포트랜스퍼라제 도메인 및 가공된 글루코사미닐 N-설포트랜스퍼라제 효소와 유사한 구조를 나타내는 경향이 있음을 인식할 수 있다. 특수한 이론에 한정되지 않고, 설페이트 그룹이 니트로 그룹에 대해 파라 보다는, 니트로 그룹에 대해 방향족 환 상에서 오르토로 위치한다는 것을 제외하고는, 2개의 아릴 설페이트 화합물의 구조가 매우 유사하므로, NCS는 임의의 가공된 글루코사미닐 N-설포트랜스퍼라제 효소의 활성 부위내에서 PNS와 유사한 위치로 결합할 수 있는 것으로 또한 여겨진다.
또한, 본 발명의 방법에 따라 사용되는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 상술한 돌연변이 뿐만 아니라 기질의 결합, 설포전달 반응, 또는 단백질 발현 동안 효소의 안정성을 촉진하는 다른 돌연변이를 포함하는 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 EC 2.8.2.8내 보존된 아미노산 서열 Q-K-T-G-T-T-A-L-Y-L로부터 돌연변이된, 돌연변이된 아미노산 서열 모티프, X1-K-T-G-A-W/F-A/L-L-X2-H를 포함할 수 있고, 여기서 X1은 글루타민, 세린, 및 알라닌으로 이루어진 그룹으로부터 선택되고; X2는 타이로신, 트레오닌, 및 히스티딘으로 이루어진 그룹으로부터 선택된다. 돌연변이된 아미노산 서열 모티프 X1-K-T-G-A-W/F-A/L-L-X2-H를 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 서열 번호: 2(상술됨) 뿐만 아니라, 서열 번호: 4, 서열 번호: 12; 서열 번호: 33, 서열 번호: 35, 서열 번호: 36, 및 서열 번호: 40를 포함하나, 이에 한정되지 않는다. 추가의 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 보존된 아미노산 서열 T-F-E-E로부터 돌연변이된 돌연변이된 아미노산 서열 모티프, T-X3-X4-S를 추가로 포함할 수 있고, 여기서 X3은 히스티딘 및 글리신으로 이루어진 그룹으로부터 선택된 EC 2.8.2.8 내 천연의 설포트랜스퍼라제 효소에 대한 돌연변이이고; X4는 글리신, 히스티딘, 및 세린으로 이루어진 그룹으로부터 선택된 EC 2.8.2.8 내 천연의 설포트랜스퍼라제 효소에 대한 돌연변이이고; 여기서 X3 및 X4 중 적어도 하나는 히스티딘 잔기이다. 심지어 일부 추가의 구현예에서, X1은 글루타민이고, X2는 타이로신이고, X3은 히스티딘이고, X4는 글리신이고, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 돌연변이된 아미노산 서열 모티프, C-L-G-K/R-S-H-G-R을 추가로 포함한다. 다른 심지어 추가의 구현예에서, X1은 세린이고, X2는 트레오닌이고, X3은 글리신이고, X4는 히스티딘이고, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 돌연변이된 아미노산 서열 모티프, C-H-G-K/R-R-W-G-R을 추가로 포함한다. 여전히 다른 심지어 추가의 구현예에서, X1은 알라닌이고, X2는 히스티딘이고, X3은 히스티딘이고, X4는 세린이고, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 돌연변이된 아미노산 서열 모티프, C-A-H-K/R-G-L-G-R을 추가로 포함한다.
다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 보존된 아미노산 서열 Q-K-T-G-T-T-A로부터 돌연변이된 돌연변이된 아미노산 서열 모티프, H-X5-T-G-X6-H-A를 포함할 수 있고, 여기서 X5는 라이신 및 글리신으로 이루어진 그룹으로부터 선택되고; X6은 글리신 및 발린으로 이루어진 그룹으로부터 선택된, EC 2.8.2.8 내 천연의 설포트랜스퍼라제 효소에 대한 돌연변이이다. 돌연변이된 아미노산 서열 모티프 H-X5-T-G-X6-H-A를 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 서열 번호: 10(상술됨) 뿐만 아니라, 서열 번호: 6, 서열 번호: 8; 서열 번호: 34, 서열 번호: 37, 서열 번호: 38, 및 서열 번호: 39를 포함하나, 이에 한정되지 않는다. 추가의 구현예에서, X5는 글리신이고 X6은 글리신이다. 일부 심지어 추가의 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 돌연변이된 아미노산 서열 모티프, C-G-G-K/R-H-L-G-R을 추가로 포함한다. 다른 심지어 추가의 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 돌연변이된 아미노산 서열 모티프, F-E-H-S-G를 추가로 포함한다.
다른 구현예에서, 돌연변이된 아미노산 서열 모티프, H-X5-T-G-X6-H-A를 포함하는 임의의 가공된 글루코사미닐 N-설포트랜스퍼라제 효소 내에서, X5는 라이신 및 글리신으로 이루어진 그룹으로부터 선택되고; X6은 글리신 및 발린으로 이루어진 그룹으로부터 선택된, EC 2.8.2.8 내 천연의 설포트랜스퍼라제 효소에 대한 돌연변이이다. 추가의 구현예에서, X5는 라이신이 되도록 선택되고, X6은 발린이 되도록 선택되며, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 돌연변이된 아미노산 서열 모티프, T-G-N-H를 추가로 포함한다.
추가로, 설포 그룹 공여체(하기 예 2 참조)로서 아릴 설페이트 화합물과 함께 활성이 되는 것으로 실험적으로 측정된, 6개의 가공된 글루코사미닐 N-설포트랜스퍼라제 효소의 아미노산 서열(서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12)을 다수의 서열 정렬로 사람 글루코사미닐 N-데아세틸라제/N-설포트랜스퍼라제 효소(entry sp|P52848|NDST1_HUMAN)의 N-설포트랜스퍼라제 도메인의 아미노산 서열과 비교하여 각각의 효소 중에서 돌연변이 사이에 관계가 존재하는지의 여부를 측정한다. 가공된 효소의 아미노산 서열내 주기는 사람 N-설포트랜스퍼라제 도메인을 지닌 특수한 위치에서 동일성을 나타낸다. 도 9에 나타낸 바와 같이, 서열 정렬은 6개의 설포트랜스퍼라제 서열내 아미노산 잔기의 90% 이상이 동일하지만, 다수의 아미노산이 선택될 수 있는 수개의 위치가 존재함을 입증한다. 특수한 이론에 제한되지 않고, 이러한 효소는 EC 2.8.2.8을 포함하는 N-데아세틸라제/N-설포트랜스퍼라제 효소의 N-설포트랜스퍼라제 도메인으로서 서로 유사한 관계를 갖는다. 그 결과, 및 다른 구현예에서, 다수의 아미노산이 정의된 위치에서 선택될 수 있는 아미노산 서열을 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 서열 번호: 33 및 서열 번호: 34에 개시되어 있다. 아미노산의 동일성이 가능한 잔기의 선택으로부터 선택될 수 있는 위치는 용어 "Xaa", "Xn", 또는 "위치 n"으로 나타내고, 여기서 n은 잔기 위치를 지칭한다.
다른 구현예에서, 서열 번호: 33 또는 서열 번호: 34의 아미노산 서열을 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소내에서, 41번 위치에서의 아미노산 잔기는 라이신이고, 44번 위치에서 아미노산 잔기는 알라닌이고, 45번 위치에서 아미노산 잔기는 방향족 아미노산 잔기, 바람직하게는 타이로신 또는 페닐알라닌이고, 49번 위치에서 아미노산 잔기는 히스티딘이다. 다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소가 41 내지 49번 위치로부터의 상기 잔기를 포함하는 경우, 67번 위치에서 아미노산 잔기는 글리신 또는 히스티딘이고, 68번 위치에서 아미노산 잔기는 글리신, 히스티딘, 및 세린으로 이루어진 그룹으로부터 선택되고, 69번 위치에서 아미노산 잔기는 세린이다.
다른 구현예에서, 서열 번호: 33 또는 서열 번호: 34의 아미노산 서열을 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소내에서, 40번 위치에서 아미노산 잔기는 히스티딘이고 45번 위치에서 아미노산 잔기는 히스티딘이다. 추가의 구현예에서, 41번 위치에서 아미노산 잔기는 글리신이고 44번 위치에서 아미노산 잔기는 글리신이다. 다른 추가의 구현예에서, 41번 위치에서 아미노산 잔기는 라이신이고 44번 위치에서 아미노산 잔기는 발린이다. 심지어 추가의 구현예에서, 67번 위치에서 아미노산 잔기는 글리신이고 69번 위치에서 아미노산 잔기는 히스티딘이다. 여전히 추가의 구현예에서, 106번 위치에서 아미노산 잔기는 트립토판이다. 심지어 여전히 추가의 구현예에서, 260번 위치에서 아미노산 잔기는 발린이다.
다른 구현예에서, 서열 번호: 33 또는 서열 번호: 34의 아미노산 서열을 포함하는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소내에서, 아미노산 서열은, 임의의 이러한 돌연변이가 효소의 글루코사미닐 N-설포트랜스퍼라제 및/또는 아릴 설페이트-의존성 활성을 제거하지 않는 한, "Xn" 또는 "Xaa"로 규정되지 않는 위치에서 하나 이상의 돌연변이를 임의로 포함할 수 있다. 다른 구현예에서, "Xn" 또는 "Xaa"로 규정되지 않는 위치에서 아릴 설페이트-의존성 활성을 제거하지 않는 이러한 돌연변이는 치환, 결실, 및/또는 첨가를 포함할 수 있다.
따라서, 다른 구현예에서, 본 발명의 임의의 방법에 따라 이용된 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 33, 서열 번호: 34, 서열 번호: 35, 서열 번호: 36, 서열 번호: 37, 서열 번호: 38, 서열 번호: 39, 및 서열 번호: 40로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소는 임의의 아릴 설페이트 화합물과 반응할 수 있다. 추가의 구현예에서, 아릴 설페이트 화합물은 PNS, MUS, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 1-나프틸 설페이트, 및 NCS로 이루어진 그룹으로부터 선택된다. 일부 심지어 추가의 구현예에서, 아릴 설페이트 화합물은 PNS이다. 다른 심지어 추가의 구현예에서, 아릴 설페이트 화합물은 NCS이다.
헥수로닐 2-O 설포트랜스퍼라제
천연적으로, HS 헥수로닐 2-O 설포트랜스퍼라제는 설포 그룹 수용체로서 N-황산화된 헤파로산-계 다당류를 인식하고, 이에 결합하고, 이와 반응한다. 일반적으로, 대부분의 글루코사미닐 잔기는 N-황산화되어 있고, 설포 그룹은 헥수론산 잔기, 일반적으로 글루쿠론산 또는 이두론산의 2-O-위치로 전달된다. 상술한 야생형 글루코사미닐 N-설포트랜스퍼라제를 사용하는 바와 같이, 야생형 HS 헥수로닐 2-O-설포트랜스퍼라제는 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트와 반응시 설포 그룹을 다당류에 전달한다. 그러나, 야생형 HS 헥수로닐 2-O 설포트랜스퍼라제는 EC 2.8.2.- 효소 부류의 구성원이다. 야생형 HS 헥수로닐 2-O 설포트랜스퍼라제 효소에 의해 인식된 HS 다당류는 2개의 명백한 구조적 모티프 중 적어도 하나를 전형적으로 포함한다. 제1의 비-제한 예에서, HS 헥수로닐 2-O-설포트랜스퍼라제 효소는 하기 화학식 IV의 구조를 갖는 다당류를 인식하고, 이에 결합하며, 이와 반응할 수 있다:
[화학식 IV]
Figure pct00015
다른 비-제한적 예에서, HS 헥수로닐 2-O-설포트랜스퍼라제 효소는 하기 화학식 V의 구조를 갖는 다당류를 인식하여, 이에 결합하고 이와 반응할 수 있다:
[화학식 V]
Figure pct00016
예 둘 다에서, 헥수론산 잔기(화학식 IV의 글루쿠론산, 화학식 V의 이두론산)는 3-O 및 6-O 위치에서 달리 치환되지 않은 N-황산화된 글루코사민 잔기에 의해 하나의 측면에서 플랭킹(flanking)된다. 야생형 HS 헥수로닐 2-O 설포트랜스퍼라제 효소, 및 화학식 IV 또는 화학식 V의 구조를 포함하는 다당류를 지닌 이의 생물학적 활성은 문헌: Rong, J., et al., (2001) Biochemistry 40 (18):5548-5555에 기술되어 있으며, 이의 개시내용은 이의 전문이 참고로 포함된다.
상술한 바와 같이, 효소와 반응하는 헤파로산-계 다당류의 부위가 화학식 IV 또는 화학식 V의 구조를 포함하지만, 다당류의 다른 부분들이 N- 또는 O- 대체될 수 있다. 유사하게, 헤파로산-계 다당류는 동일한 다당류 내에서 화학식 IV의 구조 및 화학식 V의 구조 모두를 포함할 수 있고, 화학식 IV 및 화학식 V 다당류의 구조 내의 헥수로닐 잔기의 임의의 하나 또는 둘 모두는 동일한 효소 분자에 의해 황산화될 수 있다. 전형적으로, 화학식 IV 및/또는 화학식 V의 구조를 포함하는 N-황산화된 HS 다당류는 적어도 8개의 단당류 잔기를 포함할 수 있다. 다른 구현예에서, 본 발명의 방법에 따라 사용될 수 있는 가공된 헥수로닐 2-O 설포트랜스퍼라제는 헤파로산-계 다당류, 특히 설포 수용체로서, 야생형 HS 헥수로닐 2-O 설포트랜스퍼라제로서 화학식 IV 및 화학식 V의 구조를 포함하는 것과 동일한 생물학적 활성을 갖는다.
화학식 IV 또는 화학식 V의 구조를 포함하는 N-황산화된 헤파로산-계 다당류내 헥수론산 잔기의 동일성은 헥수로닐 C5-에피머라제의 존재에 의해 제어될 수 있고, 이는 C5-위치의 입체화학을 가역적으로 전환시킨다. 그러나, 화학식 IV 또는 화학식 V의 구조를 포함하는 다당류 내 헥수로닐 잔기가 헥수로닐 2-O 설포트랜스퍼라제 효소에 의해 황산화되면, 더 이상 에피머화되지 않을 수 있다. 진핵세포 시스템에서, HS 헥수로닐 2-O 설포트랜스퍼라제와 반응할 수 있는 N-황산화된 다당류는 N-설포글루코사민 및 글루쿠론산의 이당류 단위로서 거의 전적으로 합성된다. 결론적으로, 글루쿠론산은 헥수로닐 2-O 설포트랜스퍼라제 효소와 반응하기 전에 이두론산 잔기로 에미퍼화되어야 한다. 그러나, 및 특수한 이론에 제한되지 않고, 야생형 헥수로닐 2-O 설포트랜스퍼라제 효소는 일반적으로 화학식 V의 구조를 포함하는 헤파로산-계 다당류와의 결합 및 반응에 대해 선호도를 가지며, 생체내에서 생산된 대부분의 N,2-O 황산화된 HS (N,2-HS) 다당류는 일반적으로 2-O 황산화된 이두론산을 포함하는 것으로 여겨진다.
3'-포스포아데노신 5'-포스포설페이트 및 화학식 IV의 구조를 갖는 N-황산화된 HS 다당류와 성공적인 결합시, 야생형 HS 헥수로닐 2-O 설포트랜스퍼라제 효소는 글루쿠론산 잔기의 2-O 위치로 설포 그룹의 전달을 촉매하여 하기 화학식 VI의 구조를 포함하는 N,2-HS 생성물을 형성한다:
[화학식 VI]
Figure pct00017
3'-포스포아데노신 5'-포스포설페이트 및 화학식 V의 구조를 포함하는 N-황산화 HS 다당류의 성공적인 결합시, 야생형 HS 헥수로닐 2-O 설포트랜스퍼라제 효소는 이두론산 잔기의 2-O 위치로 설포 그룹의 전달을 촉매하여, 하기 화학식 VII의 구조를 포함하는 N,2-HS 생성물을 형성할 수 있다:
[화학식 VII]
Figure pct00018
다른 구현예에서, 상기된 바와 같이 설포 그룹을 수용하기 위하여 폴리머 내의 헥수로닐 잔기들이 두 개의 설포글루코사민 잔기 사이에 있어야 하지만, N-황산화된 설포 수용체 다당류 내의 다른 위치들에서, 몇몇 글루코사미닐 잔기는 설포 그룹, 아세틸 그룹, 또는 수소로 N-대체될 수 있다. 하나의 이러한 다당류의 비-제한적 예는 도 10에 나타나 있다. 도 10에서, 다당류(40) 내 헥수로닐 잔기(10)은 각각 N-황산화, N-아세틸화, 또는 비치환된 글루코사미닐 잔기(20, 21, 22)에 의해 플랭킹된다. 다당류와 야생형 또는 가공된 헥수로닐 2-O-설포트랜스퍼라제의 반응시, 2개의 N-설포글루코사미닐 잔기(20)에 의해 플랭킹된 헥수로닐 잔기(10) 만이 2-O 황산화되어, 궁극적으로 생성물 다당류(41) 내에 황산화된 헥수로닐 잔기(110)을 형성한다.
다른 비-제한적 예에서, 화학식 IV 및 화학식 V의 구조를 포함하는 설포 수용체 다당류는 각각의 도 11, 도 12, 및 도 13에서 다당류(50)에 의해 나타나 있다. 촉매를 위해 필요한 추가적인 단당류 잔기는 명확화를 위해 생략되었다. 도 11, 도 12, 및 도 13에서, 헥수로닐 잔기(10) 및 에피머화된 헥수로닐 잔기(30)는 다당류(50) 내에서 3개의 N-설포글루코사미닐 잔기(20) 사이에 존재한다. 헥수로닐 잔기 10 및 30은 의자 구조(chair conformation)로 나타나지만, 당해 분야의 기술자는 보다 긴 올리고- 또는 다당류 내 이러한 단당류 잔기가 수개의 상이한 구조, 예를 들면, 의자, 반-의자(half-chair), 보트(boat), 스큐(skew), 및 스큐 보트 구조(skew boat conformation)를 채택할 수 있고 이러한 추가의 구조가 명확성을 위해 빠져 있음을 인식할 것이다.
다른 구현예에서, 다당류(50)와 본 발명의 방법에 사용될 수 있는 임의의 가공된 아릴 설페이트-의존성 헥수로닐 2-O 설포트랜스퍼라제 효소의 반응시, 효소는 헥수로닐 잔기(10)으로의 설포 그룹 전달을 촉매하여 생성물 다당류(51) 내에서 황산화된 헥수로닐 잔기(110)을 형성하거나(도 11), 에피머화된 헥수로닐 잔기(30)로의 설포 그룹 전달을 촉매하여 생성물 다당류(52) 내에서 황산화된 헥수로닐 잔기(130)을 형성하거나(도 12), 또는 헥수로닐 잔기(10) 및 에피머화된 헥수로닐 잔기(30) 둘 다로의 설포 그룹 전달을 촉매하여 생성물 다당류(53) 내에서 황산화된 헥수로닐 잔기(110) 및 황산화된 에피머화된 헥수로닐 잔기(130)을 각각 형성한다(도 13).
다른 구현예에서, 화학식 IV 및/또는 화학식 V의 구조를 포함하는 다당류가 균질한 조성물로서 제공될 수 있다. 여전히 다른 구현예에서, 화학식 IV 및/또는 화학식 V의 구조를 포함하는 다당류가 화학식 IV 및/또는 화학식 V의 다양한 쇄 길이, 분자량 및 상대적인 풍부성, 및 전체적인 단당류 조성물 및 작용화를 갖는 다당류의 다분산성 혼합물을 포함하는 조성물 내에 포함될 수 있다.
일부 구현예에서, 본 발명의 방법에 따라 활용된 화학식 IV 및/또는 화학식 V의 구조를 포함하는 다당류가 상업적인 공급원으로부터 수득 및/또는 개질될 수 있다. 다른 구현예에서, 화학식 IV 및/또는 화학식 V의 구조를 포함하는 다당류는 세균 또는 진핵세포 공급원으로부터 단리 및 개질된 다당류를 효소적으로 또는 화학적으로 N-설페이트화시킴으로써 수득될 수 있다. 여전히 다른 구현예에서, 화학식 IV 및/또는 화학식 V의 구조를 포함하는 다당류는 본 발명의 방법과 함께 활용된 임의의 다른 가공된 아릴 설페이트-의존성 설포트랜스퍼라제의 설페이트화된 다당류 생성물을 단리 및 정제함으로써 수득될 수 있다. 이러한 공정 각각은 하기 설명 및 실시예에 상세히 논의되어 있다.
EC 2.8.2.- 효소 분류 내에서 천연의 HS 헥수로닐 2-O 설포트랜스퍼라제는 일반적으로 일부 경우에 이의 서열에 있어 크게 다양하지만, 여전히 궁극적으로 정확하게 동일한 기능, 즉, 3'-포스포아데노신 5'-포스포설페이트로부터 헤파로산-계 다당류, 특히 화학식 IV 및/또는 화학식 V의 구조를 포함하는 것 내 헥수로닐 잔기의 2-O 위치로 설포 그룹의 전달을 촉매하는 기능을 갖는 대략 325 내지 375개의 아미노산 잔기를 포함한다. 특수한 이론에 제한되지 않고, 모든 종에 걸쳐 동일하거나 고도로 보존된 다수의 아미노산 서열 모티프 및 제2 구조가 존재하므로 EC 2.8.2.- 효소 분류 내 각각의 천연의 HS 헥수로닐 2-O-설포트랜스퍼라제가 동일한 화학 반응을 촉매할 수 있는 것으로 여겨진다.
또한, 수개의 보존된 아미노산 서열 모티프는 3'-포스포아데노신 5'-포스포설페이트 및/또는 다당류의 결합에 직접 포함되거나, 화학 반응 자체에 관여하는 것으로 여겨진다. 천연의 HS 헥수로닐 2-O 설포트랜스퍼라제 효소 사이의 동일성은 활성 부위내 아미노산 잔기가 EC 2.8.2.- 효소 분류 내 다른 헥수로닐 2-O-설포트랜스퍼라제의 아미노산 서열을 따라 확인된, 공지된 결정 구조(닭(chicken) 2-O 설포트랜스퍼라제, PDB-코드: 3F5F 및 4NDZ)를 갖는 효소의 아미노산 서열을 비교함으로써 입증될 수 있다. 닭, 사람, 및 다른 진핵 HS 헥수로닐 2-O 설포트랜스퍼라제 효소를 포함하는 12개의 효소의 다수의 서열 정렬은 닭 HS 헥수로닐 2-O 설포트랜스퍼라제 참고 서열(UniProtKB-수탁 번호 Q76KB1)에 대한 동일성 퍼센트와 함께, 도 14a - 도 14d에 나타나 있다. 도 14a - 도 14d에 나타낸 바와 같이, 서열은 방울뱀(timber rattlesnake) 2-O 설포트랜스퍼라제에 대한 Q76KB1 참고 서열(entry tr|T1DMV2|T1DMV2_CROHD)과 94.9% 서열 동일성으로부터 갈색 귀 진드기(brown ear tick) 2-O 설포트랜스퍼라제에 대한 56.3% 서열 동일성(entry tr|A0A131Z2T4| A0A131Z2T4_RHIAP)까지를 갖는 범위이다. 사람 효소(entry sp|Q7LGA3|HS2ST_HUMAN)는 Q76KB1 참고 서열과 94.1% 서열 동일성을 갖는다. 당해 분야의 기술자는 다수의 서열 정렬이 명확성을 위해 12개의 서열로 한정되었고, 확인되고 고도로 보존된 활성 부위 및/또는 결합 영역을 또한 갖는 천연의 HS 헥수로닐 2-O 설포트랜스퍼라제 효소를 암호화하는 수백개의 아미노산 서열이 존재함을 인식할 수 있다.
도 14a - 도 14d 내에서, 특수한 위치에서 검정색 배경과 함께 흰색으로 나타낸 아미노산은 모든 서열에 걸쳐 100% 동일하다. 아미노산이 동일하거나, 화학적으로 또는 구조적으로 유사함을 의미하는, 고도로 보존된 아미노산은 특수한 위치에서 검정색 윤곽으로 둘러싸여 있다. 고도로 보존된 영역 내에서, 서열의 대부분을 나타내는 컨센서스 아미노산은 굵은 글씨체이다. 동일하거나 고도로 보존되지 않은 특수한 위치에서 아미노산은 전형적으로 가변성이다. 서열내 주기는 고도로 보존된 또는 동일한 영역 사이에 추가의 잔기를 갖는 다른 서열(들)과의 서열 정렬을 촉진하기 위하여 서열내로 삽입된 갭을 나타낸다. 최종적으로, 서열의 상기 각각의 블록은 정렬내 아미노산의 동일성을 기반으로 참고로서 천연의 닭 HS 헥수로닐 2-O-설포트랜스퍼라제 효소를 사용하여, 모든 서열에 걸쳐 보존된 제2 구조를 나타내는 일련의 화살표 및 코일이다. 화살표에 인접한 β 기호는 β-시트를 지칭하지만, α 기호 또는 η 기호에 인접한 코일은 나선 제2 구조를 지칭한다.
도 14a - 도 14d에서 12개의 정렬된 서열내에는, 상술한 닭 HS 헥수로닐 2-O-설포트랜스퍼라제 효소의 결정 구조를 기반으로, 활성 부위를 포함하는 하나 이상의 아미노산을 포함하는 수개의 보존된 아미노산 모티프가 존재한다. 도 14a - 도 14d 내 아미노산 잔기의 번호매김을 기반으로, 이러한 모티프는 잔기 12-19(R-V-P-K-T-A/G-S-T), 잔기 40-44(N-T-S/T-K-N), 잔기 71-74(Y-H-G-H), 잔기 108-115(F-L-R-F/H-G-D-D/N-F/Y), 잔기 121-125(R-R-K/R-Q-G), 및 잔기 217-222(S-H-L-R-K/R-T)를 포함한다. 특수한 이론에 제한되지 않고, 이러한 잔기는 화학 반응을 촉진시키거나 이에 관여하거나, 활성 부위내에서 3'-포스포아데노신 5'-포스포설페이트 또는 다당류의 결합을 가능하게 하는 것으로 여겨진다. 특수한 및 도 15a - 도 15c에 나타낸 바와 같이, 74번 위치에서 히스티딘 잔기는 다당류내 이두론산 잔기의 2-O 위치로부터 양성자를 추출하여, 친핵성 공격 및 3'-포스포아데노신 5'-포스포설페이트로부터 설포 그룹의 제거를 가능하도록 하지만, 15번 위치에서 라이신 잔기는 3'-포스포아데노신 5'-포스포설페이트의 포스페이트 모이어티와 조화되어 N,2-HS 생성물이 활성 부위로부터 방출되기 전에 효소의 전이 부위를 안정화시킨다.
그러나, 상술한 바와 같이, EC 2.8.2.- 내 천연의 헥수로닐 2-O 설포트랜스퍼라제 효소는 아릴 설페이트 화합물로부터 다당류로 설페이트 그룹의 전달을 촉매할 수 없다. 글루코사미닐 N-설포트랜스퍼라제를 사용하는 바와 같이, 천연의 설포트랜스퍼라제의 활성 부위내에서 3'-포스포아데노신 5'-포스포설페이트에 대한 결합 포켓은 결합을 촉진시키고/시키거나 아릴 설페이트 화합물이 활성 부위로 도입되는 것으로부터 입체적으로 방해되도록 하기에 충분이 높은 친화성을 가지지 않는다. 결과적으로, 및 다른 구현예에서, EC 2.8.2.- 내 야생형 HS 헥수로닐 2-O 설포트랜스퍼라제 효소는 이의 아미노산 서열 내 수개의 위치에서 돌연변이되어 활성 부위내 아릴 설페이트 화합물의 결합을 가능하도록 할 수 있고/있거나 아릴 설페이트 화합물을 최적으로 위치시켜 다당류에 대한 설페이트 그룹의 전달이 일어날 수 있도록 할 수 있다.
따라서, 및 다른 구현예에서, 본 발명의 방법에 사용될 수 있는 가공된 HS 헥수로닐 2-O-설포트랜스퍼라제 효소는 EC 2.8.2.- 내 천연의 HS 헥수로닐 2-O-설포트랜스퍼라제 효소, 예를 들면, 도 14a - 도 14d에 나타낸 아미노산 서열을 갖는 효소의 돌연변이체일 수 있다. 다른 구현예에서, 아릴 설페이트-의존성 HS 헥수로닐 2-O-설포트랜스퍼라제는 설포 그룹 공여체로서 아릴 설페이트 화합물과 인식, 결합, 및 반응하도록 가공되는 반면, N-황산화된 헤파로산-계 다당류, 특히 설포 그룹 수용체로서 화학식 IV 및/또는 화학식 V의 구조를 포함하는 것과 인식, 결합, 및 반응하는 천연의 효소의 능력을 유지한다. 특수한 이론에 제한되지 않고, 가공된 HS 헥수로닐 2-O-설포트랜스퍼라제 효소의 아미노산 서열내로 삽입된 돌연변이는 3'-포스포아데노신 5'-포스포설페이트가 아릴 설페이트 화합물로 치환되는 것을 제외하고는, 상기 도 15a 내지 도 15c에 기술된 바와 유사한 메카니즘을 사용하여 아릴 설페이트 화합물로부터 설포 수용체 다당류로 설푸릴 그룹의 직접적인 전달을 포함할 수 있다. 또한, 돌연변이는 아릴 설페이트 화합물의 가수분해 및 설포히스티딘 중간체의 형성을 포함하는 2-단계 공정에 이은, 헥수론산 잔기의 2-O 위치에서 산소 원자에 의한 설포히스티딘 중간체의 친핵성 공격으로 N,2-HS 생성물을 형성함을 포함하는 설포트랜스퍼라제 활성을 유발시킬 수 있다. 어느 하나의 메카니즘에 의해서도, 가공된 헥수로닐 2-O-설포트랜스퍼라제 효소는 하기 실시예에 기술된 바와 같이, 아릴 설페이트 화합물로부터 다당류로의 설포 전달을 달성한다.
다른 구현예에서, 가공된 HS 헥수로닐 2-O-설포트랜스퍼라제 효소는 상술한 바와 같이 및 도 14a - 도 14d에서 다수의 서열 정렬에 나타낸 바와 같이, EC 2.8.2.- 내 천연의 헥수로닐 HS 2-O-설포트랜스퍼라제 효소에서 발견된 보존된 상기된 아미노산 서열 모티프에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 효소의 아미노산 서열 내에 존재하는 각각의 돌연변이된 아미노산 서열 모티프는 천연의 HS 헥수로닐 2-O 설포트랜스퍼라제 효소내 상응하는 보존된 아미노산 서열 모티프에 대해 적어도 하나의 아미노산 돌연변이를 포함한다. 다른 구현예에서, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 하나의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 2개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 3개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 4개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 5개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 6개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, EC 2.8.2.- 내 임의의 야생형 헥수로닐 2-O 설포트랜스퍼라제 효소에 대해 적어도 하나의 돌연변이된 아미노산 서열 모티프를 포함하는 가공된 HS 헥수로닐 2-O 설포트랜스퍼라제 효소는 서열 번호: 14, 서열 번호: 16, 서열 번호: 41, 및 서열 번호: 42로 이루어진 그룹으로부터 선택된 아미노산 서열을 가질 수 있다.
다른 구현예에서, 3D 분자 가시화 시스템(예를 들면, 비-제한적인 예로서, 개방-공급원 소프트웨어 PyMOL)내에서 닭 HS 헥수로닐 2-O 설포트랜스퍼라제(PDB-코드:-3F5F)의 고찰 시, 관련된 서열, 예를 들면, 닭 설포트랜스퍼라제 구조에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 함유하는 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소의 서열은 도 16에 나타낸 바와 같은 비교를 위해 모델링될 수 있다. 도 16는 가공된 효소의 구조가 닭 HS 헥수로닐 2-O 설포트랜스퍼라제 아미노산 서열에 대한 돌연변이의 제조시 계산되는, 서열 번호: 14 및 서열 번호; 16의 아미노산 서열을 포함하는 2개의 가공된 HS 헥수로닐 2-O 설포트랜스퍼라제 효소와 겹쳐진 닭 HS 헥수로닐 2-O-설포트랜스퍼라제 효소의 활성 부위의 확대된 도면을 나타낸다. 3'-포스포아데노신 5'-포스포설페이트가 설포 공여체인 설포 전달 반응의 생성물이고, 닭 헥수로닐 2-O 설포트랜스퍼라제와 함께 공-결정화된, 아데노신 3',5'-디포스페이트는 활성 부위 내에 또한 나타나 있다. 천연의 기질인, 3'-포스포아데노신 5'-포스포설페이트 내에 존재할 수 있는 설페이트 그룹은 5'-포스페이트 기능성 그룹에 모델링되어 반응을 개시하기 전에 활성 부위내에서 이의 근접한 위치를 나타낸다. NCS는 또한 이러한 용액이 가능한 경우, 다당류 결합 부위(나타내지 않음)에 인접한 효소 활성 부위내 리간드의 최적화된 위치 및 배향을 계산하기 위해 설계된 분자 역학(MD)의 컨센서스 용액을 사용하여, 가공된 효소의 활성 부위내로 모델링된다. 수소 원자는 나타나 있지 않다.
도 16에 나타낸 바와 같이, 닭 HS 헥수로닐 2-O 설포트랜스퍼라제에 대해 서열 번호: 14 및 서열 번호: 16에 대해 이루어진 수개의 돌연변이가 존재하지만, 각각의 단백질 골격은 서로에 대해 거의 동일한 위치에 존재하여 활성 부위의 1 대 1 비교를 가능하도록 한다. 2개의 활성 부위와 비교시, 3'-포스포아데노신 5'-포스포설페이트는 골격내에 및 라이신 잔기(도 14a - 도 14d에서 Q76KB1 서열의 15번 위치)에 위치하지만, 상기 MD 모의로부터 집중적인 용액은 가공된 효소내 NCS 결합이 활성 부위의 반대 측면에서 선호됨을 나타낸다. 그러나, NCS의 결합은 라이신 잔기에 의해서 뿐만 아니라, 거의 α-나선(도 14a - 도 14d에서 Q76KB1 서열의 108번 위치)에 위치한 페닐알라닌 잔기에 의해 천연 효소 내에서 부분적으로 입체적으로 장애될 수 있다. 특수한 이론에 제한되지 않고, 서열 번호: 14의 아미노산 서열을 포함하는 가공된 효소의 활성 부위내 NCS으 결합은 라이신 잔기의 히스티딘 잔기로의 돌연변이에 의해 촉진되며, 이는 활성 부위내에 추가의 공간을 생성하고 NCS내 방향족 환에 대한 π-π 스태킹 파트너를 제공하는 것으로 제공하는 것으로 여겨진다. 또한 특수한 이론에 제한되지 않고, 서열 번호: 16의 아미노산 서열을 포함하는 가공된 효소의 활성 부위내 NCS의 결합은 프롤린 잔기(도 14a - 도 14d에서 Q76KB1의 14번 위치)의 히스티딘 잔기로의 인접한 돌연변이와 함께 라이신의 아르기닌 잔기로의 돌연변이에 의해 촉진된다. 아르기닌 측쇄의 증가된 수의 구조적 자유도는 NCS의 도입을 촉진하지만 전달 반응 동안 전이 상태를 안정화시키기 위해 극성 접촉을 제공하는 위치에 여전히 존재할 수 있으나, 인접한 히스티딘은 NCS에 대해 다른 결합 접촉을 제공한다.
주목된 다른 돌연변이는 서열 번호: 14 및 서열 번호: 16 둘 다에서 221번 위치에서 발견된 돌연변이인, 아르기닌 잔기(도 14a - 도 14d에서 Q76KB1의 220번 위치)로부터 히스티딘 잔기로의 돌연변이를 포함한다. 특수한 이론에 제한되지 않고, 돌연변이된 히스티딘 잔기는 NCS로부터 설페이트 그룹의 제거를 촉진시키기에 선호되는 위치에 존재한다. 닭 HS 헥수로닐 2-O-설포트랜스퍼라제 효소로부터의 다른 나타낸 돌연변이, 특히 서열 번호: 16 에 나타낸 돌연변이(His-20, Ser-114, Lys-116, Met-122)는 NCS(His-20)내 설페이트 모이어티와 직접적인 접촉을 제공하여, 다른 돌연변이된 잔기(His-221과 조화된 Ser-114)와 조화시키거나, NCS(Met-122) 근처의 소수성 환경을 증가시킴으로써, 활성 부위내 NCS의 결합을 유사하게 유발시킬 수 있다.
당해 분야의 기술자는 서열 번호: 41 및 서열 번호: 42에 개시된 것을 포함하나, 이에 한정되지 않는 임의의 다른 아미노산 서열의 가공된 HS 헥수로닐 2-O 설포트랜스퍼라제 효소가 닭 HS 헥수로닐 2-O 설포트랜스퍼라제 뿐만 아니라, 서열 번호: 14 및 서열 번호: 16의 아미노산 서열을 갖는 가공된 HS 헥수로닐 2-O-설포트랜스퍼라제에 대해 유사한 구조를 나타내는 경향이 있을 수 있음을 인식할 수 있다. 특수한 이론에 제한되지 않고, 설페이트 그룹이 PNS내에서 니트로 그룹에 대해 파라보다는, NCS내 니트로 그룹에 대해 방향족 환 상에서 오르토로 위치하는 것을 제외하고는, 2개의 아릴 설페이트 화합물의 구조가 매우 유사하므로, PNS는 임의의 가공된 HS 헥수로닐 2-O 설포트랜스퍼라제 효소 의 활성 부위내에서 NCS로서 유사한 위치로 결합할 수 있는 것으로 여겨진다.
따라서, 다른 구현예에서, 본 발명의 방법에 따라 사용되는 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소는 서열 번호: 14, 서열 번호: 16, 서열 번호: 41, 또는 서열 번호: 42로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있다. 다른 구현예에서, 임의의 상기한 헥수로닐 2-O 설포트랜스퍼라제 효소는 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트 대신에 아릴 설페이트 그룹과 반응한다. 추가의 구현예에서, 아릴 설페이트 화합물은 PNS, MUS, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 2-나프틸 설페이트, 및 NCS로 이루어진 그룹으로부터 선택된다. 일부 심지어 추가의 구현예에서, 아릴 설페이트 화합물은 PNS이다. 다른 심지어 추가의 구현예에서, 아릴 설페이트 화합물은 NCS이다.
다른 구현예에서, 임의의 천연의 또는 가공된 HS 헥수로닐 2-O-설포트랜스퍼라제 효소, 특히 서열 번호: 14, 서열 번호: 16, 서열 번호: 41, 또는 서열 번호: 42의 아미노산 서열을 포함하는 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소를 포함하는 반응 혼합물 내에서, 반응 혼합물은 헥수로닐 C5-에피머라제를 추가로 포함함으로써 N,2-HS 생성물의 형성을 촉매한다. 일부 구현예에서, N,2-HS 생성물은 화학식 VI의 구조를 포함할 수 있다. 다른 구현예에서, N,2-HS 생성물은 화학식 VII의 구조를 포함할 수 있다. 다른 구현예에서, 헥수로닐 C5-에피머라제는 서열 번호: 29의 아미노산 서열을 포함할 수 있다. 다른 구현예에서, 헥수로닐 C5-에피머라제는 서열 번호: 29의 34 내지 617번 잔기를 포함할 수 있다.
글루코사미닐 6-O 설포트랜스퍼라제
천연적으로, HS 글루코사미닐 6-O 설포트랜스퍼라제는 설포 그룹 수용체로서 헤파로산-계 다당류를 인식하고, 이와 결합하고, 이와 반응한다. 일반적으로, ㄷ또대다수의 글루코사미닐 잔기는 N-황산화되나, 효소는 여전히 설포 그룹을 N-아세틸화된 글루코사미닐 잔기의 6-O 위치로 전달할 수 있다. 추가적으로, 인접한 헥수론산 잔기는 글루쿠론산 또는 이두론산일 수 있고, 임의로 2-O 황산화될 수 있다. 일반적으로, 6-O 설포 그룹을 수용하는 글루코사민 잔기의 비-환원 말단에서 헥수론산은 2-O 황산화된 이두론산이고, 많은 예에서, 글루코사민 잔기 자체는 또한 N-황산화된다. 천연의 글루코사미닐 N-설포트랜스퍼라제 및 HS 헥수로닐 2-O 설포트랜스퍼라제와 유사하게, 천연적으로 발생하는 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소는 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트와의 반응시 설포 그룹을 다당류에 전달한다. 야생형 HS 헥수로닐 2-O 설포트랜스퍼라제를 사용하는 바와 같이, 야생형 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소는 또한 EC-2.8.2.- 효소 부류의 구성원이다. 비-제한된 예에서, EC 2.8.2.- 내 글루코사미닐 6-O 설포트랜스퍼라제 효소는 하기 화학식 VIII의 구조를 포함하는 헤파로산-계 다당류를 인식하고, 이에 결합하고, 이와 반응한다:
[화학식 VIII]
Figure pct00019
여기서, 6-O 설포 그룹을 수용하는 글루코사민 잔기는 N-황산화되고 이의 비-환원 말단에서 2-O 황산화된 이두론산 잔기에 인접하며, X는 상기 화학식 VIII에 나타낸 임의의 헥수로닐 잔기를 포함한다. 화학식 VIII의 구조를 포함하는 다당류와 함께 생물학적 활성을 갖는 EC 2.8.2.- 내 글루코사미닐 6-O 설포트랜스퍼라제 효소는 문헌: Xu, Y., et al., (2017) ACS Chem. Biol. 12 (1):73-82 및 Holmborn, K., et al., (2004) J.-Biol. Chem. 279, (41):42355-42358에 기술되어 있고, 이의 개시내용은 이의 전문이 참고로 포함된다.
상술한 바와 같이, HS 글루코사미닐 6-O 설포트랜스퍼라제 효소와 반응하는 헤파로산-계 다당류의 부위가 화학식 VIII의 구조를 포함할 수 있지만, 다당류내 다른 부분들은 N- 또는, O- 대체될 수 있고, 효소와 반응할 수도 있는 다른 구조적 모티브를 포함할 수 있다. 상기 다른 효소와 유사하게, HS 글루코사미닐 6-O 설포트랜스퍼라제 효소는 설포 그룹을 동일한 다당류 분자 내 다수의 위치들로 전달하며, 동일한 다당류 분자에 다수의 위치들은 동일한 효소 분자에 의해 6-O 황산화될 수 있다. 전형적으로, HS 글루코사미닐 6-O 설포트랜스퍼라제 효소, 예를 들면, 화학식 VIII의 구조를 포함하는 것과 반응할 수 있는 헤파로산-계 다당류는 적어도 3개의 단당류 잔기를 포함할 수 있다.
3'-포스포아데노신 5'-포스포설페이트 및 화학식 VIII의 구조를 포함하는 다당류의 성공적인 결합시, 야생형 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소는 글루코사민 잔기의 6-O 위치로 설포 그룹의 전달을 촉매하여 하기 화학식 IX의 구조를 포함하는 N,2,6-HS 생성물을 형성할 수 있다:
[화학식 IX]
Figure pct00020
여기서, X는 상기 화학식 IX로 나타낸 임의의 헥수로닐 잔기를 포함한다.
HS 글루코사미닐 6-O 설포트랜스퍼라제 효소와 반응할 수 있는 하나의 이러한 다당류의 비-제한적 예는 도 17에 나타나 있다. 도 17은 아세틸 그룹 211 또는 설페이트 그룹 212로 N-치환될 수 있는 3개의 N-치환된 글루코사민 잔기 210을 포함하는 다당류 240을 나타낸다. 다당류 240 내에서, 설포 수용체로서 작용할 수 있는 N-치환된 글루코사민 잔기 210은 2개의 헥수로닐 잔기로 플랭킹된다. 헥수로닐 잔기는 화학식 VIII 내 작용 그룹 "X"로 나타낸 임의의 잔기, 특히 글루쿠로닐 잔기 220 및 인두로닐 잔기 230을 포함할 수 있다. 글루쿠로닐 잔기 220 또는 인두로닐 잔기 230은 2-O 위치에서 설페이트 그룹 231에 의해 추가로 치환될 수 있다. 다당류 240과 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소 및 설포 그룹 공여체의 반응시, 임의의 글루코사민 잔기 210의 6-O 위치 213은 황산화되어, 궁극적으로 생성물 다당류 241 내에 6-O 황산화된 글루코사민 잔기 310을 형성한다. 다른 구현예에서, 글루코사미닐 6-O 설포트랜스퍼라제 효소는 가공된 아릴 설페이트-의존성 효소일 수 있고, 설포 그룹 수용체는 아릴 설페이트 화합물이다.
다른 구현예에서, 본 발명의 방법에 따라 활용될 수 있는 가공된 HS 글루코사미닐 6-O 설포트랜스퍼라제는 야생형 HS 글루코사미닐 6-O 설포트랜스퍼라제로서 헤파로산-계 설포 수용기 다당류, 특히 화학식 VIII의 구조를 포함하는 헤파로산-계 다당류와 동일한 생물학적 활성을 가질 수 있다. 다른 구현예에서, 설포 수용기 다당류 내에 화학식 VIII의 구조를 포함하는 다당류의 다수의 부위가 존재하는 경우, 임의의 글루코사민 잔기는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소에 의해 설페이트화될 수 있다. 유사하게, 동일한 다당류는 가공된 글루코사미닐 6-O 설포트랜스퍼라제, 다당류 내에 존재하는 예를 들면 및 모든 이하의 글루코사민 잔기에 의해 수회 설페이트화될 수 있다.
다른 구현예에서, 가공된 또는 야생형 HS 글루코사미닐 6-O 설포트랜스퍼라제와 반응할 수 있는 설포 수용기 다당류, 예를 들면, 그러나 이에 한정되지 않는, 화학식 VIII의 구조를 포함하는 것이 균질한 조성물로서 제공될 수 있다. 여전히 다른 구현예에서, 가공된 또는 야생형 HS 글루코사미닐 6-O 설포트랜스퍼라제와 반응할 수 있는 설포 수용기 다당류는 화학식 VIII의 다양한 쇄 길이, 분자량, 상대적인 풍부성, 및 전체적인 단당류 조성물 및 작용화를 갖는 다당류의 다분산성 혼합물을 포함하는 조성물 내에 포함될 수 있다.
다른 구현예에서, N,2-HS 다당류, 예를 들면, 그러나 이에 한정되지 않는 화학식 VIII의 구조를 포함하고, 본 발명의 방법에 따라 가공된 또는 야생형 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소 중 하나와 함께 활용될 수 있는 것이 상업적인 공급원으로부터 수득되고/되거나 개질될 수 있다. 다른 구현예에서, 본 발명의 방법에 따라 활용될 수 있는 가공된 또는 야생형 HS 글루코사미닐 6-O 설포트랜스퍼라제는 하나 이상의 이전의 단계에서 글루코사미닐 N-설포트랜스퍼라제에 의해 생산된 N--설페이트화된 헤파로산 생성물과 반응할 수 있다. 다른 구현예에서, 본 발명의 방법에 따라서 활용될 수 있는 가공된 또는 야생형 HS 글루코사미닐 6-O 설포트랜스퍼라제 중 하나는 하나 이상의 이전의 단계에서 글루코사미닐 N-설포트랜스퍼라제 및/또는 헥수로닐 2-O 설포트랜스퍼라제에 의해 생산된 N,2-HS 생성물과 반응할 수 있다. 다른 구현예에서, N,2-HS 생성물을 생산하기 위한 설페이트화 단계 중 하나 이상은 가공된, 아릴 설페이트-의존성 설포트랜스퍼라제에 의해 촉매될 수 있다. 이러한 공정 중 각각은 하기 설명 및 실시예에 상세히 논의되어 있다.
EC 2.8.2.- 효소 분류 내의 천연의 HS 글루코사미닐 6-O-설포트랜스퍼라제 효소는 일반적으로 일부 경우에 이의 서열 내에서 크게 변할 수 있는 300 내지 700개의 아미노산 잔기를 포함하며, 여전히 궁극적으로 정확히 동일한 기능, 즉, 3'-포스포아데노신 5'-포스포설페이트로부터 해파로산-계 다당류, 특히 화학식 VIII의 구조를 포함하는 것의 글루코사민 잔기의 6-O 위치로 설푸릴 그룹의 전달을 촉매하는 기능을 갖는다. 특수한 이론에 제한되지 않고, 모든 종에 걸쳐 동일하거나 고도로 보존된 다수의 아미노산 서열 모티프 및 제2 구조가 존재하므로, EC 2.8.2.- 효소 분류 내의 각각의 천연의 HS 글루코사미닐 6-O-설포트랜스퍼라제는 동일한 화학 반응을 촉매할 수 있는 것으로 여겨진다.
또한, 수개의 보존된 아미노산 서열 모티프가 3'-포스포아데노신 5'-포스포설페이트 및/또는 다당류의 결합에 직접 포함되거나, 화학 반응 자체에 관여하는 것으로 여겨진다. 천연의 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소 사이의 동일성은 활성 부위내 아미노산 잔기가 EC 2.8.2.- 효소 분류 내의 다른 천연의 HS 글루코사미닐 6-O 설포트랜스퍼라제의 아미노산 서열로 확인된 공지?? 결정 구조(제브라피쉬 글루코사미닐 6-O 설포트랜스퍼라제 동형 3-B, PDB 코드 5T03, 5T05 및 5T0A)를 갖는 효소의 아미노산 서열을 비교함으로써 입증될 수 있다. 15개 효소의 다수의 서열 정렬은 마우스 HS 글루코사미닐 6-O-설포트랜스퍼라제(동형 1) 참고 서열(UniProtKB-수탁 번호 Q9QYK5)에 대한 각각의 서열의 동일성 퍼센트를 따라, 도 18a - 도 18c에 나타나 있다. 도 18a - 도 18c에 나타낸 바와 같이, 서열은 Q9QYK5 참고 서열(entry O60243|H6ST1_HUMAN)과 97.3% 동일성으로부터 53.7% 동일성(entry A0A3P8W3M9| A0A3P8W3M9_CYSNE)까지를 갖는 범위이다. 비교를 위해. 제브라피쉬 HS 글루코사미닐 6-O 설포트랜스퍼라제 동형 3-B 효소(entry A0MGZ7|H6S3B_DANRE)는 Q9QYK5 참고 서열과 60.4% 서열 동일성을 갖는다. 당해 분야의 기술자는 다수의 서열 정렬이 명확성을 위해 15개 서열로 한정되며, 확인되고 고도로 보존된 활성 부위 및/또는 결합 영역을 또한 갖는 천연의 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소를 암호화하는 수백개의 아미노산 서열이 존재함을 인식할 수 있다.
도 18a - 도 18c 내에서, 특수한 위치에서 검정색 배경에 백색으로 나타낸 아미노산은 모든 서열에 걸쳐 100% 동일하다. 특수한 위치에서 동일하거나 화학적으로 또는 구조적으로 유사함을 의미하는, 고도로 보존된 아미노산은 검정색 윤곽으로 둘러사여 있다. 고도로 보존된 영역내에서, 서열의 대부분에 존재하는 컨센서스 아미노산은 굵은 글씨체이다. 동일하지 않거나 고도로 보존된 특수한 위치에서의 아미노산은 전형적으로 가변성이다. 서열내 한 주기는 고도로 보존되거나 동일한 영역 사이에 추가의 잔기를 갖는 다른 서열(들)과의 서열 정렬을 촉진하기 위해 서열내로 삽입된 갭을 나타낸다. 최종적으로, 서열의 상기 각각의 블록은 정렬내 아미노산의 동일성을 기반으로 참고로서 천연의 마우스 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소의 구조를 사용하여, 모든 서열에 걸쳐 보존된 제2 구조를 나타내는 일련의 화살표 및 코일이다. 화살표에 인접한 β 기호는 β-시이트를 지칭하는 반면, α 기호에 인접한 코일은 나선의 제2 구조를 지칭한다. 도 18a - 도 18c에 나타낸 각각의 15개의 정렬된 서열은 이의 천연의 완전한 길이의 서열에 대해 트렁케이트됨으로써 본 발명의 가공된 효소, 특히 서열 번호: 18, 서열 번호: 20, 및 서열 번호: 22의 효소를 갖는 것과 일치한다. 특히, 도 18a - 도 18c에 나타낸 잔기는 마우스 HS 글루코사미닐 6-O 설포트랜스퍼라제에 대한 Q9QYK5의 잔기 67 내지 377과 함께 정렬되어 있다.
도 18a - 도 18c에서 15개의 정렬된 서열 내에는 상술한 제브라피쉬 HS 글루코사미닐 6-O-설포트랜스퍼라제 효소(entry A0MGZ7|H6S3B_DANRE)의 결정 구조를 기반으로, 활성 부위를 포함하는 하나 이상의 아미노산을 포함하는 수개의 보존된 아미노산 서열 모티프가 존재한다. 도 18a - 도 18c내 아미노산 잔기의 번호매김을 기반으로 하여, 이러한 보존된 아미노산 서열 모티프는 아미노산 잔기 29 내지 34번(Q-K-T-G-G-T); 81 내지 86번(C-G-L-H-A-D); 127 내지 139번(S-E-W-R/K-H-V-Q-R-G-A-T-W-K); 178 내지 184번(N-L-A-N-N-R-Q); 및 227 내지 231번(L-T-E-F/Y-Q)을 포함한다. 특히, 및 도 19a - 도 19c에 나타낸 바와 같이, C-G-L-H-A-D 보존된 아미노산 서열 모티프내 히스티딘 잔기는 N-설포글루코사민 잔기의 6'-하이드록실 그룹으로부터 수소 원자를 추출하는 위치로 존재함으로써, 음으로 하전된 산소 원자가 이후 3'-포스포아데노신 5'-포스포설페이트의 친핵성 공격을 개시하여 설페이트 그룹을 제거하도록 한다. 또한, Q-K-T-G-G-T 보존된 아미노산 서열 모티프 내에서 공통적으로 보존된 라이신 잔기는 3'-포스포아데노신 5'-포스포설페이트내 5' 포스페이트와 조화되지만, 131번 및 138번 위치에서 공통적으로 보존된 히스티딘 및 트립토판 잔기는 N-설포글루코사민 잔기와 조화된다 (참조 Xu, Y., et al., 상기됨).
그러나, 상술한 바와 같이, EC 2.8.2.- 내 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소는 아릴 설페이트 화합물로부터 다당류로의 설페이트 그룹의 전달을 촉매할 수 없다. 특수한 이론에 제한되지 않고, 및 상술한 글루코사미닐 N-설포트랜스퍼라제 및 헥수로닐 2-O 설포트랜스퍼라제를 사용하는 바와 같이, 천연의 글루코사미닐 6-O 설포트랜스퍼라제의 활성 부위내 3'-포스포아데노신 5'-포스포설페이트에 대한 결합 포켓은 아릴 설페이트 화합물이 결합을 촉진하고 아릴 설페이트 화합물이 활성 부위로 도입하는 것으로부터 입체적으로 방해되기에 충분히 높은 친화성을 갖지 않는 것으로 여겨진다. 결과적으로, 및 다른 구현예에서, EC 2.8.2.- 내 야생형 글루코사미닐 6-O-설포트랜스퍼라제 효소는 이의 아미노산 서열 내 수개의 위치에서 돌연변이되어 활성 부위내에서 아릴 설페이트 화합물의 결합을 가능하도록 하고/하거나 아릴 설페이트 화합물을 최적으로 위치시켜 다당류에 대한 설페이트 그룹의 전달이 일어나도록 한다.
따라서, 및 다른 구현예에서, 본 발명의 방법에서 사용될 수 있는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 EC 2.8.2.- 내 천연의 HS 글루코사미닐 6-O-설포트랜스퍼라제 효소, 예를 들면, 도 18a - 도 18c에 나타낸 아미노산 서열을 갖는 효소의 돌연변이체일 수 있다. 다른 구현예에서, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 설포 그룹 공여체로서 아릴 설페이트 화합물과 인식, 결합, 및 반응하는 반면, 설포 그룹 수용체로서 화학식 VIII의 구조를 포함하는 것을 포함하나 이에 한정되지 않는 상기한 임의의 HS 다당류와 인식, 결합, 및 반응하는 천연 효소의 능력을 유지한다. 특수한 이론에 제한되지 않고, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소의 아미노산 서열내로 삽입된 돌연변이로 인하여, 이의 설포트랜스퍼라제 활성은, 3'-포스포아데노신 5'-포스포설페이트가 아릴 설페이트 화합물로 치환된 것을 제외하고는, 도 19a 내지 도 19c에 기술된 바와 유사한 메카니즘을 사용하여, 아릴 설페이트 화합물로부터 설포 수용체 다당류로 설푸릴 그룹의 직접적인 전달을 포함할 수 있다. 그렇지 않으면, 돌연변이는 설포트랜스퍼라제 활성을 유발함으로써 아릴 설페이트 화합물의 가수분해 및 설포히스티딘 중간체의 형성을 포함하는 2-단계 공정에 이은, 글루코사민 잔기의 6-O 위치에서 산소 원자에 의한 설포히스티딘 중간체의 친핵성 공격에 의해 6-O 황산화된 HS 생성물을 형성시킴을 포함하는 것으로 여겨진다. 다른 구현예에서, 설포전달 메카니즘의 6-O 황산화된 HS 생성물은 N,2,6-HS 생성물이다.
다른 구현예에서, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 상술되고 도 18a 내지 도 18c에서 다수의 서열 정렬에서 나타낸 바와 같이 EC 2.8.2.- 내 천연의 글루코사미닐 6-O-설포트랜스퍼라제 효소에서 발견된 보존된 아미노산 서열 모티프에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 효소의 아미노산 서열 내에 존재하는 각각의 돌연변이된 아미노산 서열 모티프는 천연의 글루코사미닐 6-O 설포트랜스퍼라제 효소내 상응하는 보존된 아미노산 서열 모티프에 대해 적어도 하나의 아미노산 돌연변이를 포함한다. 다른 구현예에서, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 하나의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 2개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 3개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 4개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 5개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 EC 2.8.2.- 내 임의의 야생형 HS 글루코사미닐 6-O-설포트랜스퍼라제 효소에 대해 적어도 하나의 돌연변이된 아미노산 서열 모티프를 포함하며, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 43, 서열 번호: 44, 서열 번호: 45, 서열 번호: 46, 서열 번호: 47, 서열 번호: 48, 서열 번호: 49, 서열 번호: 50, 서열 번호: 59, 서열 번호: 60, 및 서열 번호: 61로 이루어진 그룹으로부터 선택된 아미노산 서열을 가질 수 있다.
다른 구현예에서, 3D 분자 가시화 시스템(예를 들면, 비-제한적 예로서, 개방-공급원 소프트웨어, PyMOL) 내 제브라피쉬 글루코사미닐 6-O-설포트랜스퍼라제 효소(UniProtKB 수탁 번호: A0MGZ7)의 임의의 결정 구조의 고찰 시, 관련 서열, 예를 들면, 임의의 제브라피쉬 글루코사미닐 6-O 설포트랜스퍼라제 구조에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 함유하는 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소의 구조는 도 20 나타낸 바와 같이 비교를 위해 모델링될 수 있다. 도 20 서열 번호: 22의 아미노산 서열을 포함하는 본 발명의 가공된 효소 중 하나를 지닌 제브라피쉬 글루코사미닐 6-O 설포트랜스퍼라제 효소(PDB 코드: 5TO3)의 활성 부위의 확대된 도면을 나타내며, 여기서 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소의 구조는 제브라피쉬 글루코사미닐 6-O 설포트랜스퍼라제 아미노산 서열에 대해 돌연변이의 제조시 계산된다. 3'-포스포아데노신 5'-포스포설페이트가 설포 공여체이고, 제브라피쉬 글루코사미닐 6-O 설포트랜스퍼라제와 함께 공-결정화된 설포전달 반응의 생성물인, 아데노신 3',5'-디포스페이트가 또한 활성 부위내에 나타나 있다. PNS는 또한 이러한 용액이 가능한 경우, 다당류 결합 부위(나타내지 않음)에 인접한 효소 활성 부위 내 리간드의 최적화된 위치 및 배향을 계산하도록 설계된 분자 역학(MD) 모의의 컨센서스 용액을 사용하여, 가공된 효소 활성 부위로 모델링된다. 수소 원자는 명확성을 위해 나타내지 않는다.
도 20에 나타낸 바와 같이, 제브라피쉬 글루코사미닐 6-O 설포트랜스퍼라제 효소에 대해 서열 번호: 22에 이루어진 수개의 돌연변이가 존재하지만, 각각의 단백질 골격은 서로에 대해 거의 동일한 위치내에 존재함으로써 활성 부위의 1 대 1 비교가 가능하도록 한다. 그러나, 2개의 활성 부위를 비교하는 경우, 아데노신 3',5'-디포스페이트 생성물은 상기 MD 시뮬레이션으로부터 집중된 용액에 의해 측정된 것으로서, PNS 분자와 같이 중심 α-나선의 반대 측면에 위치한다. 특수한 이론에 제한되지 않고, 제브리피쉬 효소내 3'-포스포아데노신 5'-포스포설페이트와 동일하거나 유사한 위치에서 PNS를 향산 충분한 친화성이 존재하지 않으므로, 집중된 MD 시뮬레이션 용액은 PNS를 α-나선의 반대 측면에 위치시킨다. 상기 문헌: Xu, Y., et al.에 기술된 바와 같이, 전체 길이의 아미노산 서열의 158번 위치에서 보존된 히스티딘은 N-설포글루코사민의 6' 하이드록실 그룹으로부터 양성자를 추출하는 촉매적 히스티딘이며, 이는 후속적으로 3'-포스포아데노신 5'-포스포설페이트와 반응하여 설포 그룹 전달을 개시할 수 있다. 여전히, 3'-포스포아데노신 5'-포스포설페이트 및 PNS에 대한 결합 포켓에서의 명백한 차이에도 불구하고, 서열 번호: 18, 서열 번호: 20, 및 서열 번호: 22의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소 모두는 하기 실시예에 기술된 바와 같이, 아릴 설페이트 화합물로부터 헤파로산-계 다당류내 글루코사미닐 6-O 위치로 설포 전달을 달성하였다.
그 결과, 및 특수한 이론에 제한되지 않고, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소의 활성 부위내에 존재하는 하나 이상의 돌연변이는 설포 수용체 HS 다당류로 전달될 수 있는 위치에서 아릴 설페이트 화합물의 설페이트 모이어티의 결합을 보조할 수 있다. 도 20에 나타낸 바와 같이, 가공된 효소는 서열 번호: 22의 아미노산 서열을 가지고, 아릴 설페이트 화합물은 PNS이다. 그러나, 설포 수용체 HS 다당류는 나타내지 않는다. 비-제한된 예에서, 서열 번호: 22의 31번 위치로 가공된 히스티딘 잔기는 상기 문헌: Malojcic, et al에 기술된, 핑-퐁 메카니즘(ping-pong mechanism)을 사용하여 PNS로부터 설페이트 그룹의 제거를 촉진하는 위치에 존재할 수 있다. 또한, 서열 번호: 22의 133번 위치로 가공된 히스티딘 잔기는 서열 번호: 22의 132번 위치(도 18a - 도 18c에서 각각의 서열내 131-132번 위치에 상응)에서 보존된 히스티딘을 따라 설페이트 모이어티와 추가로 조화될 수 있다. 서열 번호: 22의 137 내지 139번 위치에서 G-A-N(도 18a - 도 18c에서의 서열의 136 내지 138번 위치에서 보존된 A-T-W 모티프에 상응)에 대한 돌연변이는 설페이트가 서열 번호: 22의 31번 위치에서 가공된 히스티딘에 의해 추출될 수 있는 위치에서 PNS의 결합을 방지할 수 있는 입체적 부피를 제거한다. A-T-W를 함유하는 루프내 G-A-N에 대한 돌연변이는 루프가 PNS로부터 제거되도록 하며, 이는 또한 PNS를 추가로 보조하여 이의 결합 포켓에 이르도록 할 수 있다. 최종적으로, 상술한 전체 길이의 제브라피쉬 글루코사미닐 6-O 설포트랜스퍼라네내 His-158에 상응하는 천연의 히스티딘에 바로 인접한 서열 번호: 108의 84번 위치로 가공된 세린 잔기는 추가의 수소-결합 접촉을 생성하여 설포 수용체 다당류와 함께 제브라피쉬 효소의 천연의 활성을 보유하는데 있어서 가공된 효소를 보조할 수 있다.
당해 분야의 기술자는 임의의 다른 아미노산 서열의 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소, 예를 들면, 그러나 이에 한정되지 않는, 서열 번호: 18, 서열 번호: 20, 서열 번호: 43, 서열 번호: 44, 서열 번호: 45, 서열 번호: 46, 서열 번호: 47, 서열 번호: 48, 서열 번호: 49, 서열 번호: 50, 서열 번호: 59, 서열 번호: 60, 및 서열 번호: 61에 의해 개시된 것이 특히 활성 부위내에서 유사한 구조적 모티프를 나타낼 수 있음을 인식할 수 있다. 특수한 이론에 제한되지 않고, 설페이트 그룹이 니트로 그룹에 대해 파라보다는, 니트로 그룹에 대해 방향족 환 상에서 오르토로 위치하는 것을 제외하고는, 2개의 아릴 설페이트 화합물의 구조가 매우 유사하기 때문에, NCS는 임의의 가공된 효소의 활성 부위내에서 PNS와 유사한 위치로 결합할 수 있는 것으로 여겨진다.
다른 구현예에서, 본 발명의 방법에 따라 이용될 수 있는 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 하나 이상의 돌연변이된 아미노산 서열 모티프를 포함할 수 있으며, 이는 야생형 효소 및/또는 모델링된 가공된 효소, 예를 들면, 그러나 이에 한정되지 않는, 도 20에 나타낸 효소의 공지된 구조(들)을 지닌 도 18a - 도 18c의 다수의 서열 정렬에 나타낸 보존된 아미노산 서열 모티프를 비교함으로써 부분적으로 측정할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소내에 포함될 수 있는 돌연변이된 아미노산 서열 모티프는 (a)-G-H-T-G-G-T; (b)-C-G-X1-X2-A-D(여기서, X1은 트레오닌 및 세린으로 이루어진 그룹으로부터 선택되고, X2는 아스파라긴, 아르기닌, 및 히스티딘으로 이루어진 그룹으로부터 선택된다); (c) X3-X4-W-R-H-X5-Q-R-G-G-X6-N-K(여기서, X3은 세린 및 글리신으로 이루어진 그룹으로부터 선택되고, X4는 글리신 및 히스티딘으로 이루어진 그룹으로부터 선택되고, X5는 히스티딘 및 트레오닌으로 이루어진 그룹으로부터 선택되고, X6은 알라닌 및 트레오닌으로 이루어진 그룹으로부터 선택된다); 및 (d) N-L-X7-N-N-R-Q(여기서, X7은 알라닌 및 글리신으로 이루어진 그룹으로부터 선택된다)로 이루어진 그룹, 예를 들면 이의 임의의 조합으로부터 선택될 수 있다. 각각의 돌연변이된 아미노산 서열 모티프는 상기 도 18a - 도 18c에 나타낸 보존된 아미노산 모티프에 상응하고, 서열 모티프 (a)는 보존된 아미노산 서열 모티프, Q-K-T-G-G-T에 상응하고; 돌연변이된 아미노산 서열 모티프 (b)는 보존된 아미노산 서열 모티프, C-G-L-H-A-D에 상응하고; 돌연변이된 아미노산 서열 모티프 (c)는 보존된 아미노산 서열 모티프, S-E-W-(R/K)-H-V-Q-R-G-A-T-W-K에 상응하고; 돌연변이된 아미노산 서열 모티프 (d)는 보존된 아미노산 서열 모티프, N-L-A-N-N-R-Q에 상응한다. 다른 구현예에서, 상술된 적어도 하나의 돌연변이된 아미노산 서열 모티프를 포함하는 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 43, 서열 번호: 44, 서열 번호: 45, 서열 번호: 46, 서열 번호: 47, 서열 번호: 48, 서열 번호: 49, 서열 번호: 50, 서열 번호: 59, 서열 번호: 60, 및 서열 번호: 61로 이루어진 그룹으로부터 선택될 수 있다.
다른 구현예에서 및 하나의 비-제한된 실시예에서, 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 동일한 아미노산 서열 내에 돌연변이된 아미노산 서열 모티프 (b) 및 (c)를 포함할 수 있다. 돌연변이된 아미노산 서열 모티프 (b) 및 (c)를 포함하는 가공된 효소는 서열 번호: 18, 서열 번호: 20, 서열 번호: 43, 서열 번호: 44, 서열 번호: 45, 서열 번호: 46, 서열 번호: 47, 서열 번호: 48, 서열 번호: 49, 및 서열 번호: 50의 아미노산 서열을 포함하는 효소를 포함하나, 이에 한정되지 않는다. 다른 구현예에서, 돌연변이된 아미노산 서열 모티프 (b) 및 (c)를 포함하는 각각의 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 도 20에 나타낸 바와 같이, 서열 번호: 22과 유사한 활성 부위를 갖는다. 다른 이론에 제한되지 않고, 돌연변이된 아미노산 서열 모티프 (b) 및 (c)에 포함된 수개의 돌연변이는 다음을 포함하나, 이에 한정되지 않는 하나 이상의 기능을 갖는 것으로 여겨진다: 결합 포켓의 크기를 감소시킴에 의한 활성 부위에 대한 아릴 설페이트 화합물의 친화성의 증가, 포켓의 소수성의 증가, 극성 또는 수소 결합 접촉의 제거 또는 생성, 및/또는 아릴 설페이트 화합물의 방향족 모이어티와π-π 상호작용의 생성; 화학 반응 동안 효소의 전이 상태의 안정화; 및/또는 화학 반응 자체에서의 관여.
다른 구현예에서, 돌연변이된 아미노산 서열 모티프 (b) 및 (c)를 포함하는 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소내에서, X4는 글리신이고 X5는 히스티딘이다. 다른 구현예에서, X4는 히스티딘이고 X5는 트레오닌니다.
다른 구현예에서, 돌연변이된 아미노산 서열 모티프 (b) 및 (c)를 포함하는 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소 내에서, X3은 세린이고, X6은 알라닌이고, X7은 글리신이다. 다른 구현예에서, X3은 글리신이고, X6은 트레오닌이고, X7은 알라닌이다.
또한, 설포 그룹 공여체(하기 예 5 참조)로서 아릴 설페이트 화합물과 함께 활성인 것으로 실험적으로 측정된, 3개의 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소의 아미노산 서열(서열 번호: 18, 서열 번호: 20, 및 서열 번호: 22)을 다중 서열 정렬에서 마우스 글루코사미닐 6-O-설포트랜스퍼라제 효소(entry Q9QYK5|H6ST1_MOUSE)의 아미노산 서열과 비교하여 각각의 효소내 돌연변이 사이에 관계가 존재하는지의 여부를 측정할 수 있다. 가공된 효소의 아미노산 서열내 주기는 마우스 글루코사미닐 6-O-설포트랜스퍼라제 효소를 지닌 특수한 위치에서 동일성을 나타낸다. 도 21에 나타낸 바와 같이, 서열 정렬은 3개의 설포트랜스퍼라제 서열내 아미노산 잔기의 90% 이상이 동일하지만, 다수의 아미노산이 선택될 수 있는 수개의 위치가 존재함을 입증한다. 특수한 이론에 제한되지 않고, 이러한 효소는 서로 EC 2.8.2.-를 포함하는 글루코사미닐 6-O-설포트랜스퍼라제 효소와 유사한 관계를 갖는다. 그 결과, 및 다른 구현예에서, 다수의 아미노산이 정의된 위치에서 선택될 수 있는 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소는 서열 번호: 43 및 서열 번호: 44로 개시되어 있다. 아미노산의 동일성이 가능한 잔기의 선택으로부터 선택될 수 있는 위치는 용어 "Xaa", "Xn", 또는 "위치 n"으로 나타내며, 여기서 n은 잔기 위치를 지칭한다.
다른 구현예에서, 서열 번호: 43 내에서, 명칭 "Xaa"를 갖는 잔기는 서열 번호: 18, 서열 번호: 20, 및 서열 번호: 22의 아미노산 서열 내 특수한 위치에서 동일성의 결여가 있는 공지된 예를 나타낸다. 다른 구현예에서, 아미노산 서열, 서열 번호: 44은 또한 서열 번호: 18, 서열 번호: 20, 및 서열 번호: 22의 아미노산 서열내 특수한 위치에서 동일성의 결여가 존재하는 공지된 예를 나타내지만, 서열 번호: 44는 비-제한적인 예로서, 마우스, 사람, 및 돼지 글루코사미닐 6-O 설포트랜스퍼라제 효소를 포함하는 EC 2.8.2.- 내 수개의 전체 길이의 글루코사미닐 6-O 설포트랜스퍼라제 효소의 N-말단 잔기 1-66, 및 C-말단 잔기 378-411를 추가로 포함한다. 대조적으로, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 및 서열 번호: 43 내 아미노산 잔기는 비-제한적인 예로서, 마우스, 사람, 및 돼지 글루코사미닐 6-O 설포트랜스퍼라제 효소를 포함하는, EC 2.8.2.- 내 수개의 전체 길이의 글루코사미닐 6-O 설포트랜스퍼라제 효소의 잔기 67-377에 상응한다. 단백질 발현을 촉진시키기 위해, N-말단 메티오닌 잔기를 마우스, 사람, 및 돼지 글루코사미닐 6-O 설포트랜스퍼라제 효소의 잔기 67-377에 대해 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 및 서열 번호: 43 아미노산 서열 각각에 가하였다.
다른 구현예에서, 수득되는 효소가 설포 그룹 공여체로서 아릴 설페이트 화합물과 반응시 이의 글루코사미닐 6-O 설포트랜스퍼라제 활성을 유지하는 한, 임의의 선택이, 아미노산 서열 서열 번호: 43 또는 서열 번호: 44에 의해 정의된, Xaa 잔기에 대해 이루어질 수 있다.
다른 구현예에서, 서열 번호: 43의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소내에서, 129번 위치에서의 아미노산 잔기는 글리신이고, 133번 위치에서 아미노산 잔기는 히스티딘이다. 다른 구현예에서, 서열 번호: 43의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소내에서, 129번 위치에서 아미노산 잔기는 히스티딘이고 133번 위치에서 아미노산 잔기는 트레오닌이다. 다른 구현예에서, 서열 번호: 44의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소내에서, 194번 위치에서 아미노산 잔기는 글리신이고 198번 위치에서 아미노산 잔기는 히스티딘이다. 다른 구현예에서, 서열 번호: 44의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소내에서, 194번 위치에서 아미노산 잔기는 히스티딘이고 198번 위치에서 아미노산 잔기는 트레오닌이다.
다른 구현예에서, 서열 번호: 43의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소내에서, 128번 위치에서 아미노산 잔기는 세린이고 138번 위치에서 아미노산 잔기는 알라닌이고, 181번 위치에서 아미노산 잔기는 글리신이다. 다른 구현예에서, 서열 번호: 43의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소내에서, 128번 위치에서 아미노산 잔기는 글리신이고 138번 위치에서 아미노산 잔기는 트레오닌이고, 181번 위치에서 아미노산 잔기는 알라닌이다. 다른 구현예에서, 서열 번호: 44의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소내에서, 193번 위치에서 아미노산 잔기는 세린이고 203번 위치에서 아미노산 잔기는 알라닌이고, 246번 위치에서 아미노산 잔기는 글리신이다. 다른 구현예에서, 서열 번호: 44의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소내에서, 193번 위치에서 아미노산 잔기는 글리신이고, 203번 위치에서 아미노산 잔기는 트레오닌이고, 246번 위치에서 아미노산 잔기는 알라닌이다.
다른 구현예에서, 서열 번호: 43 또는 서열 번호: 44의 아미노산 서열을 포함하는 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소내에서, 아미노산 서열은, 임의의 이러한 돌연변이가 효소의 글루코사미닐 6-O 설포트랜스퍼라제 및/또는 아릴 설페이트-의존성 활성을 제거하지 않는 한, "Xn" 또는 "Xaa"로 규정되지 않은 잔기 위치에서 하나 이상의 돌연변이를 임의로 포함할 수 있다. 다른 구현예에서, "Xn" 또는 "Xaa"로 규정되지 않은 위치에서 아릴 설페이트-의존성 활성을 제거하지 않는 이러한 돌연변이는 치환, 결실, 및/또는 첨가를 포함할 수 있다.
따라서, 다른 구현예에서, 본 발명의 임의의 방법에 따라 이용된 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 43, 서열 번호: 44, 서열 번호: 45, 서열 번호: 46, 서열 번호: 47, 서열 번호: 48 서열 번호: 49 서열 번호: 50 서열 번호: 59 서열 번호: 60 및 서열 번호: 61으로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있다. 다른 구현예에서, 임의의 상기한 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트 대신에 아릴 설페이트 화합물과 반응한다. 추가의 구현예에서, 아릴 설페이트 화합물은 PNS, MUS, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 2-나프틸 설페이트, 및 NCS로 이루어진 그룹으로부터 선택된다. 일부의 심지어 추가의 구현예에서, 아릴 설페이트 화합물은 PNS이다. 다른 심지어 추가의 구현예에서, 아릴 설페이트 화합물은 NCS이다.
글루코사미닐 3-O 설포트랜스퍼라제
천연적으로, HS 글루코사미닐 3-O 설포트랜스퍼라제는 설포 그룹 수용체로서 N,2-HS 다당류 및 N,2,6-HS 다당류를 인식하고, 이에 결합하고, 이와 반응한다. 일반적으로, 3-O 위치에서 설포 그룹을 수용하는 글루코사민 잔기는 N-황산화되고, 임으로 또한 6-O 황산화된다. 또한, 인접한 헥수론산 잔기는 글루쿠론산 또는 이두론산일 수 있고, 이들 중 하나는 임의로 2-O 황산화될 수 있다. 몇몇 구현예에서, 글루코사민 잔기의 비-환원 말단의 헥수로닐산 잔기는 비황산화 글루쿠론산이고, 글루코사민 잔기의 환원 말단의 헥수로닐산 잔기는 2-O 황산화된 이두론산이다. 상술한 각각의 야생형 설포트랜스퍼라제와 유사하게, 천연적으로 존재하는 글루코사미닐 3-O 설포트랜스퍼라제는 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트와의 반응시 설포 그룹을 다당류에 전달한다. 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트를 이용하는 야생형 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소는 EC-2.8.2.23 효소 부류의 구성원이다. 비-제한적 예에서, EC 2.8.2.23 내 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소는 하기 화학식 X의 구조를 포함하는 N,2,6-HS 다당류을 인식하고, 이에 결합하고, 이와 반응한다;
[화학식 X]
Figure pct00021
여기서, 중심 글루코사민 잔기는 N-황산화되고 이의 비-환원 말단에서 비대체 글루쿠론산 잔기에 및 이의 환원 말단에서 2-O 황산화된 이두론산 잔기에 인접해 있고, X는 임의로 설페이트 그룹 또는 아세틸 그룹일 수 있고, Y는 임의로 설페이트 그룹 또는 하이드록실 그룹일 수 있다.
상술한 바와 같이, 효소와 반응하는 다당류의 부분은 화학식 X의 구조를 포함할 수 있지만, 다당류의 다른 부분은 다른 글루코사민 잔기는 N- 또는 O- 대체될 수 있고, 효소와 반응할 수 있는 다른 구조적 모티브를 포함할 수 있다. 상기한 다른 효소와 유사하게, HS 글루코사미닐 3-O 설포트랜스퍼라제 효소는 설포 그룹을 동일한 다당류 분자내에서 다수의 위치들에 전달할 수 있고, 동일한 다당류 분자내 다수의 위치들은 동일한 효소 분자에 의해 3-O 황산화될 수 있다. 전형적으로, 설포 그룹 수용체로서 글루코사미닐 3-O 설포트랜스퍼라제와 반응할 수 있는 HS 다당류는 전형적으로 화학식 X에 나타낸 바와 같이, 적어도 5개의 단당류 잔기를 포함한다. 다른 구현예에서, 화학식 X의 구조를 포함하고, 설포 그룹 수용체로서 글루코사미닐 3-O 설포트랜스퍼라제와 반응할 수 있는 HS 다당류는 적어도 32개의 단당류 잔기를 포함할 수 있다.
3'-포스포아데노신 5'-포스포설페이트 및 화학식 X의 구조를 포함하는 N,2,6-HS 다당류의 성공적인 결합시, 야생형 글루코사미닐 3-O 설포트랜스퍼라제 효소는 중심 글루코사민 잔기의 3-O 위치로 설포 그룹의 전달을 촉진하여, 하기 화학식 I의 구조를 포함하는 N,2,3,6-HS 생성물을 형성할 수 있다:
[화학식 I]
Figure pct00022
여기서, X는 설포 그룹 또는 아세테이트 그룹이고 Y는 설포 그룹 또는 하이드록실 그룹이다. 추가의 구현예에서, N,2,3,6-HS 생성물의 기능 그룹 X는 설페이트 그룹이다. 다른 추가의 구현예에서, N,2,3,6-HS 생성물의 기능 그룹 Y는 설페이트 그룹이다. 다른 구현예에서, 폴리머 내의 몇몇 위치들에서 적어도 일부의 글루코사민 잔기는 N-아세틸화된다. EC 2.8.2.23 내 야생형 HS 글루코사미닐 3-O-설포트랜스퍼라제 효소는 설포 그룹 수용체로서 화학식 X의 구조를 포함하는 N,2,6-HS 다당류와 함게 생물학적 활성을 가지며, 화학식 I의 구조를 포함하는 N,2,3,6-HS 생성물을 형성하고, 문헌: Xu, D., et al., (2008) Nat. Chem. Biol. 4(3): 200-202 및 Edavettal, S.C., et al., (2004) J.-Biol. Chem. 24(11): 25789-25797에 기술되어 있으며, 이의 개시내용은 이의 전문이 참고로 포함된다.
EC 2.8.2.23 내의 HS 글루코사미닐 3-O-설포트랜스퍼라제 효소를 위한 하나의 그런 N,2,6-HS 설포 그룹 수용체의 비-제한적 예는 도 22에 나타나 있다. 도 22는 각각의 N-위치에 N-설포 그룹 411 및 각각의 6-O 위치에 O-설포 그룹 412를 포함하는 3개의 글루코사민 잔기 410을 포함하는 다당류 440을 나타낸다. 다당류 440 내에서, 설포 수용체로서 작용할 수 있는 글루코사민 잔기 410는 2개의 헥수론산 잔기에 의해 플랭킹되어야 한다. 헥수론산 잔기는 화학식 X에서 작용 그룹 "X"로 나타낸 임의의 잔기를 포함할 수 있고, 도 22에서 글루쿠론산 잔기 420 및 이두론산 잔기 430으로 나타낸다. 어느 헥수론산 잔기도 2-O 위치에서 설포 그룹 431에 의해 추가로 치환될 수 있다. 다당류 440과 HS 글루코사미닐 3-O-설포트랜스퍼라제 효소 및 설포 그룹 공여체의 반응시, 임의의 글루코사미닐 잔기 410의 3-O 위치 413은 황산화될 수 있다. 도 22에 나타낸 바와 같이, 중심 글루코사민 잔기 410은 설포 그룹을 수용하여, 궁극적으로 황산화된 생성물 다당류 441 내에서 3-O 황산화된 글루코사미닐 잔기 510을 형성한다. 또한, 나타낸 바와 같이, 황산화된 생성물 다당류 441은 화학식 I의 구조를 포함한다.
다른 구현예에서, 본 발명의 방법에 따라서 활용될 수 있는 가공된 HS 글루코사미닐 3-O 설포트랜스퍼라제는 야생형 HS 글루코사미닐 3-O 설포트랜스퍼라제로서 헤파로산-계 설포 수용기 다당류, 특히 화학식 X의 구조를 포함하는 헤파로산-계 다당류와 동일한 생물학적 활성을 가질 수 있다. 다른 구현예에서, 설포 수용기 다당류 내에 화학식 X의 구조를 포함하는 다당류의 다수의 부위가 존재하는 경우, 임의의 N-설페이트화된 글루코사민 잔기는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소에 의해 3-O 설페이트화될 수 있다. 유사하게, 동일한 다당류는 가공된 글루코사미닐 3-O 설포트랜스퍼라제, 예를 들면 및 모든 이하의 다당류 내에 존재하는 N-설페이트화된 글루코사민 잔기에 의해 다수회 설페이트화될 수 있다.
다른 구현예에서, 가공된 또는 야생형 HS 글루코사미닐 3-O 설포트랜스퍼라제, 예를 들면, 그러나 이에 한정되지 않는 화학식 X의 구조를 포함하는 것과 반응할 수 있는 설포 수용기 다당류는 균질한 조성물로서 제공될 수 있다. 여전히 다른 구현예에서, 가공된 또는 야생형 HS 글루코사미닐 3-O 설포트랜스퍼라제와 반응할 수 있는 설포 수용기 다당류는 화학식 X의 다양한 쇄 길이, 분자량, 상대적인 풍부성, 및 전체적인 단당류 조성물 및 작용화를 갖는 다당류의 다분산성 혼합물을 포함하는 조성물 내에 포함될 수 있다.
다른 구현예에서, 가공된 또는 야생형 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소와 함께, N,2-HS 및 N,2,6-HS 다당류, 예를 들면, 그러나 이에 한정되지 않고, 본 발명의 방법에 따라 활용될 수 있는, 화학식 X의 구조를 갖는 것은 상업적인 공급원으로부터 수득되고/되거나 개질될 수 있다. 다른 구현예에서, 본 발명의 방법에 따라서 활용될 수 있는 가공된 또는 야생형 HS 글루코사미닐 6-O 설포트랜스퍼라제는 하나 이상의 이전의 단계에서 글루코사미닐 N-설포트랜스퍼라제 및/또는 헥수로닐 2-O 설포트랜스퍼라제에 의해 생산된 N,2-HS 생성물과 반응할 수 있다. 다른 구현예에서, 본 발명의 방법에 따라 활용될 수 있는 가공된 또는 야생형 HS 글루코사미닐 6-O 설포트랜스퍼라제 중 하나는 글루코사미닐 N-설포트랜스퍼라제, 헥수로닐 2-O 설포트랜스퍼라제, 및/또는 글루코사미닐 6-O 설포트랜스퍼라제에 의해 하나 이상의 이전의 단계에서 생산된 N,2,6-HS 생성물와 반응할 수 있다. 다른 구현예에서, N,2-HS 또는 N,2,6-HS 생성물을 생산하기 위한 설페이트화 단계 중 하나 이상은 가공된, 아릴 설페이트-의존성 설포트랜스퍼라제에 의해 촉매되었다. 다른 구현예에서, N,2-HS 또는 N,2,6-HS 생성물을 생산하기 위한 설페이트화 단계의 모두는 가공된, 아릴 설페이트-의존성 설포트랜스퍼라제에 의해 촉매되었다. 이러한 공정들 각각은 하기 설명 및 실시예에 상세히 논의되어 있다.
EC 2.8.2.23 효소 분류를 포함하는 천연의 HS 글루코사미닐 3-O-설포트랜스퍼라제 효소는 일반적으로 일부 경우에 이의 서열내에서 크게 변할 수 있지만, 여전히 궁극적으로, 정확하게 동일한 기능, 즉, 3'-포스포아데노신 5'-포스포설페이트로부터 N,2-HS 또는 N,2,6-HS 다당류, 특히 화학식 X의 구조를 포함하는 것 내의 N-설포글루코사민 잔기로 설푸릴 그룹의 전달을 촉매하는 기능을 가질 수 있는, 대략 300 내지 325개의 아미노산 잔기를 포함한다. 특수한 이론에 제한되지 않고, EC 2.8.2.23 효소 부류내 각각의 천연의 HS 글루코사미닐 3-O 설포트랜스퍼라제는, 모든 종에 걸쳐 동일하거나 고도로 보존된 다수의 아미노산 서열 모티프 및 제2 구조가 존재하므로, 동일한 화학 반응을 촉매할 수 있다.
또한, 수개의 보존된 아미노산 서열 모티프는 3'-포스포아데노신 5'-포스포설페이트 및/또는 다당류의 결합에 직접 포함되거나, 화학 반응 자체에 관여하는 것으로 여겨진다. 천연의 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소 사이의 동일성은, 활성 부위내 아미노산 잔기가 확인된 공지된 결정 구조를 갖는 특정 효소의 아미노산 서열을 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소와 비교함으로써 입증할 수 있는데, 이는 마우스(PDB 코드: 3UAN) 및 사람(PDB 코드: 1ZRH) 효소를 포함하며, 서로 단지 83% 서열 동일성을 가지지만 거의 동일한 활성 부위 및 전체 구조를 가진다. 마우스 및 사람 효소를 포함하는, EC 2.8.2.23 내 15개 효소의 다중 서열 정렬은 사람 HS 글루코사미닐 3-O 설포트랜스퍼라제 참고 서열(UniProtKB-수탁 번호 O14792)에 대한 각각의 서열의 동일성 퍼센트와 함께, 도 23a - 도 23c에 나타낸다. 도 23a - 도 23c에 나타낸 바와 같이, 서열은 레서스 원숭이(rhesus monkey) HS 글루코사미닐 3-O 설포트랜스퍼라제에 대한 O14792 참고 서열(entry tr|H9ZG39|H9ZG39_MACMU)에 대해 98% 동일성으로부터, 사람 HS 글루코사미닐 3-O 설포트랜스퍼라제의 다른 동형에 대해 53% 동일성(entry sp|Q8IZT8|HS3S5_HUMAN)의 범위이다. 당해 분야의 기술자는 다중 서열 정렬이 명확성을 위해 15개 서열로 한정되었고, 확인되고 고도로 보존된 활성 부위 및/또는 결합 영역을 또한 갖는 천연의 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소를 암호화하는 수백개의 아미노산 서열이 존재함을 인식할 수 있다.
도 23a - 도 23c 내에서, 특수한 위치에서 검정색 배경과 함께 백색으로 나타낸 아미노산은 모든 서열에 걸쳐 100% 동일하다. 아미노산이 특수한 위치에서 동일하거나 구조적으로 유사함을 의미하는, 고도로 보존된 아미노산은 검정색 윤곽으로 둘러싸여 있다. 고도로 보존된 영역 내에서, 서열의 대부분에 존재하는 컨센서스 아미노산은 굵은 글씨체이다. 동일하지 않거나 고도로 보존된 특수한 위치에서의 아미노산은 전형적으로 가변성이다. 서열내 한 주기는 고도로 보존되거나 동일한 영역 사이에 추가의 잔기를 갖는 다른 서열(들)과의 서열 정렬을 촉진하기 위해 서열내로 삽입된 갭을 나타낸다. 최종적으로, 서열의 상기 각각의 블록은 정렬내 아미노산의 동일성을 기반으로 참고로서 천연의 설포트랜스퍼라제 효소의 구조를 사용하여, 모든 서열에 걸쳐 보존된 제2 구조를 나타내는 일련의 화살표 및 코일이다. 화살표에 인접한 β 기호는 β-시이트를 지칭하는 반면, α 기호 또는 η 기호에 인접한 코일은 나선의 제2 구조를 지칭한다.
도 23a - 도 23c의 15개의 정렬된 서열 내에서, 상술된 마우스(entry sp|O35310|HS3S1_MOUSE) 및 사람 HS 글루코사미닐 3-O 설포트랜스퍼라제(entry sp|O14792|HS3S1_HUMAN) 효소의 결정 구조를 기반으로, 활성 부위를 포함하는 하나 이상의 아미노산을 포함하는 수개의 보존된 아미노산 서열 모티프가 존재한다. 도 23a - 도 23c 내 아미노산 잔기의 번호매김을 기반으로 하여, 이러한 모티프는 잔기 16-27번(잔기 18-23로부터 G-V-R-K-G-G 포함), 잔기 43-48번(E-V/I-H-F-F-D), 잔기 78-81번(P-A/G-Y-F), 잔기 112-117번(S-D-Y-T-Q-V 포함), 및 잔기 145-147번(Y-K-A)을 포함한다. 이러한 잔기는 화학 반응을 촉진시키거나 이에 관여하거나, 활성 부위내에서 3'-포스포아데노신 5'-포스포설페이트 또는 다당류의 결합을 가능하게 하는 것으로 여겨진다. 특히, 상술한 바와 같이, 및 도 1에 나타낸 바와 같이, 잔기 43-48번 내에서, 43번 위치의 글루탐산 잔기는 다당류내 N-설포글루코사민 잔기의 3-O 위치로부터 양성자를 추출하여, 친핵성 공격 및 3'-포스포아데노신 5'-포스포설페이트로부터 설포 그룹의 제거를 가능하게 하지만, His-45 및 Asp-48은 조화되어 설푸릴화된 다당류 생성물이 활성 부위로부터 방출되기 전에 효소의 전이 상태를 안정화시킨다.
그러나, 상술한 바와 같이, EC 2.8.2.23 내 천연의 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소는 아릴 설페이트 화합물로부터 다당류로 설페이트 그룹의 전달을 촉매할 수 없다. 특수한 이론에 제한되지 않고, 상술한 글루코사미닐 N-설포트랜스퍼라제, 헥수로닐 2-O 설포트랜스퍼라제, 및 글루코사미닐 6-O 설포트랜스퍼라제를 사용하는 바와 같이, 천연의 설포트랜스퍼라제내 3'-포스포아데노신 5'-포스포설페이트에 대한 결합 포켓은 아릴 설페이트 화합물이 결합을 촉진시키고/시키거나 아릴 설페이트 화합물이 활성 부위로 도입되는 것으로부터 입체적으로 장애되기에 충분히 높은 친화성을 가지지 않는 것으로 여겨진다. 결과적으로, 및 다른 구현예에서, EC-2.8.2.23 내 야생형 글루코사미닐 3-O-설포트랜스퍼라제 효소는 이의 아미노산 서열내 수개의 위치에서 돌연변이되어 활성 부위내에서 아릴 설페이트 화합물의 결합을 가능하도록 하고/하거나 아릴 설페이트 화합물을 최적으로 위치시켜 다당류로의 설페이트 그룹의 전달이 발생할 수 있도록 할 수 있다.
따라서, 및 다른 구현예에서, 본 발명의 방법에서 사용될 수 있는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 EC 2.8.2.23 내 천연의 HS 글루코사미닐 3-O-설포트랜스퍼라제 효소, 예를 들면, 도 23a - 도 23c에 나타낸 아미노산 서열을 갖는 효소의 돌연변이체일 수 있다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 아릴 설페이트 화합물이 설포 그룹 공여체로서 효소에 결함하여 이와 반응할 수 있는 생물학적 활성을 촉진시킨다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 설포 그룹 공여체로서 아릴 설페이트 화합물과 인식, 결합 및 반응하도록 가공되는 반면, 설포 그룹 수용체로서 화학식 X의 구조를 포함하는 것을 가지나 이에 한정되지 않는, 상기한 임의의 HS 다당류와 인식, 결합, 및 반응하는 천연 효소의 능력을 유지한다. 특수한 이론에 제한되지 않고, 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소의 아미노산 서열내로 삽입된 돌연변이로 인하여, 3'-포스포아데노신 5'-포스포설페이트가 아릴 설페이트 화합물로 치환된 것을 제외하고는, 이의 설포트랜스퍼라제 활성은 상기 도 1에 기술된 바와 유사한 메카니즘을 사용하여, 아릴 설페이트 화합물로부터 설포 수용체 다앙류로 설푸릴 그룹의 직접적인 전달을 포함할 수 있다. 그렇지 않으면, 돌연변이는 설포트랜스퍼라제 활성을 유발시켜 아릴 설페이트 화합물의 가수분해 및 설포히스티딘 중간체의 형성을 포함하는 2-단계 공정에 이은, 글루코사민 잔기의 3-O 위치에서 산소 원자에 의한 설포히스티딘 중간체의 친핵성 공격에 의해 3-O 황산화된 HS 생성물을 형성하는 것을 포함할 수 있는 것으로 여겨진다. 다른 구현예에서, 설포전달 메카니즘의 3-O-황산화된 HS 생성물은 N,2,3,6-HS 생성물이다.
다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 상술하고 도 23a - 도 23c 내 다중 서열 정렬에 나타낸 바와 같이, EC 2.8.2.23 내 천연의 글루코사미닐 3-O-설포트랜스퍼라제 효소에서 발견된 보존된 아미노산 서열 모티프에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 효소의 아미노산 서열 내에 존재하는 각각의 돌연변이된 아미노산 서열 모티프는 천연의 글루코사미닐 3-O 설포트랜스퍼라제 효소내 상응하는 보존된 아미노산 서열 모티프에 대해 적어도 하나의 아미노산 돌연변이를 포함한다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 하나의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 2개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 3개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 4개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 5개의 돌연변이된 아미노산 서열 모티프를 포함할 수 있다. 다른 구현예에서, EC-2.8.2.23 내 임의의 야생형 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소에 대해 적어도 하나의 돌연변이된 아미노산 서열 모티프를 포함하는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 51, 서열 번호: 52, 서열 번호: 53, 서열 번호: 54, 서열 번호: 56, 서열 번호: 57, 및 서열 번호: 58으로 이루어진 그룹으로부터 선택된 아미노산 서열을 가질 수 있다.
다른 구현예에서, 3D 분자 가시화 시스템(예를 들면, 비-제한적 예로서, 개방-공급원 소프트웨어, PyMOL) 내 마우스 HS 글루코사미닐 3-O 설포트랜스퍼라제의 결정 구조의 고찰 시, 관련 서열의 구조, 예를 들면, 마우스 HS 글루코사미닐 3-O 설포트랜스퍼라제(UniProtKB 수탁 번호 O35310)에 대해 하나 이상의 돌연변이된 아미노산 서열 모티프를 함유하는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소의 구조는 도 24에 나타낸 바와 같이 비교를 위해 모델링될 수 있다. 도 24은 서열 번호: 24, 서열 번호: 26, 및 서열 번호: 28의 아미노산 서열을 포함하는, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소를 지닌 마우스 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소(PDB 코드: 3UAN)의 활성 부위의 확대된 도면을 나타낸다. 3'-포스포아데노신 5'-포스포설페이트가 설포 공여체이고, 마우스 글루코사미닐 3-O 설포트랜스퍼라제와 함께 공-결정화된 설포전달 반응의 생성물인, 아데노신 3',5'-디포스페이트가 또한 활성 부위내에 나타나 있다. PNS는 또한 이러한 용액이 가능한 경우, 다당류 결합 부위(나타내지 않음)에 인접한 효소 활성 부위 내 리간드의 최적화된 위치 및 배향을 계산하도록 설계된 분자 역학(MD) 시뮬레이션의 컨센서스 용액을 사용하여 가공된 효소 활성 부위로 모델링된다. 수소 원자는 명확성을 위해 나타내지 않는다.
도 24에 나타낸 바와 같이, 천연의 마우스 설포트랜스퍼라제에 대해 서열 번호: 24, 서열 번호: 26, 및 서열 번호: 28 에 대해 이루어진 수개의 돌연변이가 존재하지만, 각각의 단백질 골격은 서로 거의 동일한 위치에 존재함으로써, 활성 부위의 1 대 1 비교가 가능하도록 한다. 그러나, 2개의 활성 부위를 비교하는 경우, 천연의 설포전달 반응로부터의 아데노신 3',5'-디포스페이트 생성물은 라이신 잔기에 인접한 반면, 상기 MD 모의로부터의 집중된 용액은 가공된 효소내 PNS 결합이 활성 부위의 반대 측면에서 선호됨을 나타낸다. 특수한 이론에 제한되지 않고, 집중된 DM 시뮬레이션 용액은, 3'-포스포아데노신 5'-포스포설페이트와 동일하거나 유사한 위치에서 PNS를 향해 충분한 친화성이 존재하지 않으므로, 활성 부위의 반대 측면에 PNS를 위치시키는 것으로 여겨진다. 여전히, 3'-포스포아데노신 5'-포스포설페이트 및 PNS에 대한 결합 포켓에서의 명백한 차이에도 불구하고, 서열 번호: 24, 서열 번호: 26, 및 서열 번호: 28의 아미노산 서열을 포함하는 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소 모두는 하기 실시예에 기술된 바와 같이, 아릴 설페이트 화합물로부터 헤파로산-계 다당류내 글루코사미닐 3-O 위치로 설포 전달을 달성하였다.
또한, 마우스 HS 글루코사미닐 3-O 설포트랜스퍼라제의 20번 위치에 상응하고, 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소내에 존재하는 경우, 도 23a - 도 23c에 나타낸 다른 글루코사미닐 3-O 설포트랜스퍼라제 효소 모두에서 보존된 아르기닌 잔기는 도 24에 나타낸 위치에서의 결합으로부터 PNS를 차단할 것이다. 따라서, 및 다른 구현예에서, PNS에 결합하는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 활성 부위 아르기닌 잔기의 글리신 잔기로의 돌연변이를 포함하고, 이는 결합 포켓내에서 PNS가 결합하기 위한 모든 입체적 장애를 제거한다. 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 51, 서열 번호: 52, 서열 번호: 53, 및 서열 번호: 54에 대한 아미노선 서열에서 나타낸 바와 같이, 아르기닌 대 글리신 돌연변이는 21번 위치에 존재한다. 서열 번호: 56, 서열 번호: 57, 및 서열 번호: 58에 대한 아미노산 서열에서 나타낸 바와 같이, 아르기닌 대 글리신 돌연변이는 99번 위치에 존재한다.
유사하게, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 51, 서열 번호: 52, 서열 번호: 53, 및 서열 번호: 54의 아미노산 서열 내 22번 위치에 상응하는 가공된 효소 각각에서 다음의 아미노산 잔기는 히스티딘 잔기로 돌연변이된다. 특수한 이론에 제한되지 않고, 보존된 라이신 잔기(도 23a - 도 23c내 아미노산 서열 각각에서 21번 위치에 상응함)로부터 히스티딘 잔기에 대한 돌연변이는 상기 문헌: Malojcic, et al.에 기술된 바와 같은 유사한 메카니즘을 사용하여, PNS로부터 설페이트 그룹의 제거를 촉진한다. 서열 번호: 56, 서열 번호: 57, 및 서열 번호: 58에 대한 아미노산 서열에서 나타난 바와 같이, 라이신 대 히스티딘 잔기는 100번 위치에 있다.
당해 분야의 기술자는 임의의 다른 아미노산 서열, 예를 들면, 그러나 이에 한정되지 않는, 서열 번호: 51, 서열 번호: 52, 서열 번호: 53, 서열 번호: 54, 서열 번호: 56, 서열 번호: 57, 및 서열 번호: 58에 개시된 것의 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소가 특히 활성 부위내에서 서열 번호: 24, 서열 번호: 26, 및 서열 번호: 28의 아미노산 서열을 갖는 가공된 효소와 유사한 구조적 모티프를 나타낼 수 있음을 인식할 수 있다. 특수한 이론에 제한되지 않고, 설페이트 그룹이 니트로 그룹에 대해 파라보다는, 니트로 그룹에 대해 방향족 한에서 오르토로 위치한다는 것을 제외하고는, 2개의 아릴 설페이트 화합물의 구조가 매우 유사하므로, NCS는 임의의 가공된 효소의 활성 부위내 PNS와 유사한 위치로 결합할 수 있는 것으로 여겨진다.
다른 구현예에서, 본 발명의 방법에 따라 사용되는 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소는 하나 이상의 돌연변이된 아미노산 서열 모티프를 포함할 수 있으며, 이는 도 23a - 도 23c의 다수의 서열 정렬에 나타낸 보존된 아미노산 서열 모티프를 야생형 효소 및/또는 모델링된 가공된 효소, 예를 들면, 도 24에 나타낸, 그러나 이에 한정되지 않는, 효소의 공지된 구조(들)와 비교함으로써 부분적으로 측정할 수 있다. 다른 구현예에서, 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소 내에 포함될 수 있는 돌연변이된 아미노산 서열 모티프는 (a)-G-V-G-H-G-G; (b)-H-S-Y-F; (c) S-X1-X2-T-H-X3(여기서, X1은 알라닌 및 루이신으로 이루어진 그룹으로부터 선택되고; X2는 타이로신 및 글리신으로 이루어진 그룹으로부터 선택되고, X3은 메티오닌 및 루이신으로 이루어진 그룹으로부터 선택된다); 및 (d) Y-X4-G(여기서, X4는 발린 및 트레오닌으로 이루어진 그룹으로부터 선택된다)로 이루어진 그룹; 예를 들면 이의 임의의 조합으로부터 선택될 수 있다. 각각의 돌연변이된 아미노산 서열 모티프는 상기 23a - 도 23c에 나타낸 보존된 아미노산 모티프에 상응하고; 돌연변이된 아미노산 서열 모티프 G-V-G-H-G-G는 보존된 아미노산 서열 모티프 G-V-R-K-G-G에 상응하고; 돌연변이된 아미노산 서열 모티프 H-S-Y-F는 보존된 아미노산 서열 모티프 P-A/G-Y-F에 상응하고; 돌연변이된 아미노산 서열 모티프 S-X1-X2-T-H-X3은 보존된 아미노산 서열 모티프 S-D-Y-T-Q-V에 상응하고; 돌연변이된 아미노산 서열 모티프 Y-X4-G는 보존된 아미노산 서열 모티프 Y-K-A에 상응한다. 다른 구현예에서, 각각의 상기 돌연변이된 아미노산 서열 모티프를 포함하는 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소는 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 51, 서열 번호: 52, 서열 번호: 53, 서열 번호: 54, 서열 번호: 56, 서열 번호: 57, 및 서열 번호: 58로 이루어진 그룹으로부터 선택될 수 있다.
다른 구현예에서, 각각의 돌연변이된 아미노산 서열 모티프는 EC 2.8.2.23 내 천연의 글루코사미닐 3-O-설포트랜스퍼라제 효소에서 발견된 보존된 아미노산에 대해 이루어진 적어도 하나의 돌연변이를 포함할 수 있다. 다른 구현예에서, 돌연변이된 아미노산 서열 모티프 (a)는 보존된 아미노산 서열 모티프, G-V-R-K-G-G에 대해 R-K 대 G-H 돌연변이를 함유한다. 다른 구현예에서, 돌연변이된 아미노산 서열 모티프 (b)는 보존된 아미노산 서열 모티프, P-A/G-Y-F에 대해 P-A/G 대 H-S 돌연변이를 함유한다. 다른 구현예에서, X1, X2, 및 X3 위치에서 이루어진 잠재적인 돌연변이 외에, 돌연변이된 아미노산 서열 모티프 (c)는 보존된 아미노산 서열 모티프, S-D-Y-T-Q-V에 대해 Q-대-H 돌연변이를 포함한다. 다른 구현예에서, X4 위치에서의 돌연변이 외에, 돌연변이된 아미노산 서열 모티프 (d)는 보존된 아미노산 서열 모티프, Y-K-A에 대해 A 대 G 돌연변이를 포함한다.
다른 구현예에서, X1은 알라닌이고, X2는 타이로신이고; X3은 메티오닌이고, X4는 발린 또는 트레오닌이다. 다른 구현예에서, X1은 루이신이고, X2는 글리신이고; X3은 루이신이고, X4는 트레오닌이다. 다른 이론에 제한되지 않고, 돌연변이된 아미노산 서열 모티프 (b), (c), 및 (d)에 포함된 돌연변이 중 하나 이상은 화학 반응 동안 효소의 전이 상태를 안정화시키거나, 예를 들면, 결합 포켓의 크기를 감소시키고/시키거나, 포켓의 소수성을 증가시키고/시키거나, 아릴 설페이트 화합물의 방향족 모이어티와의 π-π 상호작용을 생성함으로써 활성 부위에 대한 아릴 설페이트 화합물의 친화성을 증가시키는데 역활을 담당하는 것으로 여겨진다.
또한, 설포 그룹 공여체(하기 예 5 참조)로서 아릴 설페이트 화합물과 활성인 것으로 실험적으로 측정된, 3개의 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소의 아미노산 서열(서열 번호: 24, 서열 번호: 26, 및 서열 번호: 28)은 다중 서열 정렬에서 사람 글루코사미닐 3-O 설포트랜스퍼라제 효소(entry sp|O14792|HS3S1_HUMAN)의 제1 동형의 아미노산 서열과 비교하여 각각의 효소 중 돌연변이 사이에 관계가 존재하는지의 여부를 측정할 수 있다. 가공된 효소의 아미노산 서열내 주기는 사람 글루코사미닐 3-O-설포트랜스퍼라제 효소를 지닌 특수한 위치에서 동일성을 나탄내다. 도 25에 나타낸 바와 같이, 서열 정렬은 3개의 설포트랜스퍼라제 서열내 아미노산 잔기의 90% 이상이 동일하지만, 다수의 아미노산이 선택도리 수 있는 수개의 위치가 존재함을 입증한다. 특수한 이론에 제한되지 않고, 이들 효소는 EC 2.8.2.23을 포함하는 글루코사미닐 3-O 설포트랜스퍼라제 효소와 같이 서로 유사한 관계를 가진다. 그 결과, 및 다른 구현예에서, 다수의 아미노산이 정의된 위치에서 선택될 수 있는 아미노산 서열을 포함하는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소는 서열 번호: 51로 개시되어 있다. 아미노산의 동일선이 가능한 잔기의 선택으로부터 선택될 수 있는 위치는 용어 "Xaa", "Xn", 또는 "위치 n"으로 나타내며, 여기서 n은 잔기 위치를 지칭한다.
다른 구현예에서, 서열 번호: 51의 아미노산 서열을 포함하는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소 내에서, 114번 위치에서 아미노산 잔기는 알라닌이도, 118번 위치에서 아미노산 잔기는 메티오닌이다. 추가의 구현예에서, 147번 위치에서 아미노산 잔기는 발린 및 트레오닌으로 이루어진 그룹으로부터 선택된다.
다른 구현예에서, 서열 번호: 51의 아미노산 서열을 포함하는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소 내에서, 114번 위치에서 아미노산 잔기는 루이신이고, 118번 위치에서 아미노산 잔기는 루이신이고, 121번 위치에서 아미노산 잔기는 발린이다. 추가의 구현예에서, 115번 위치에서 아미노산 잔기는 글리신이다. 심지어 추가의 구현예에서, 147번 위치에서 아미노산 잔기는 트레오닌이다.
다른 구현예에서, 서열 번호: 51의 아미노산 서열을 포함하는 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소내에서, 아미노산 서열은, 임의의 이러한 돌연변이가 글루코사미닐 3-O 설포트랜스퍼라제 및/또는 효소의 아릴 설페이트-의존성 활성을 제거하지 않는 한, "Xn" 또는 "Xaa"로 규정되지 않은 잔기 위치에서 하나 이상의 돌연변이를 임의로 포함할 수 있다. 다른 구현예에서, "Xn" 또는 "Xaa"로 규정되지 않은 위치에서 아릴 설페이트-의존성 활성을 제거하지 않는 이러한 돌연변이는 치환, 결실, 및/또는 첨가를 포함할 수 있다.
따라서, 다른 구현예에서, 본 발명의 임의의 방법에 따라 이용된 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소는 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 51, 서열 번호: 52, 서열 번호: 53, 서열 번호: 54, 서열 번호: 56, 서열 번호: 57, 및 서열 번호: 58으로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있다. 다른 구현예에서, 임의의 상기한 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소는 설포 그룹 공여체로서 3'-포스포아데노신 5'-포스포설페이트 대신에 아릴 설페이트 화합물과 반응한다. 추가의 구현예에서, 아릴 설페이트 화합물은 PNS, MUS, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 2-나프틸 설페이트, 및 NCS로 이루어진 그룹으로부터 선택된다. 일부 심지어 추가의 구현예에서, 아릴 설페이트 화합물은 PNS이다. 다른 심지어 추가의 구현예에서, 아릴 설페이트 화합물은 NCS이다.
황산화된 다당류의 시험관내 합성
상술한 바와 같이, 설포 그룹 수용기로서 헤파로산-계 다당류를 인식하고, 이와 결합하고 반응하는 천연의 설포트랜스퍼라제는 생체내에서 광범위한 설페이트화된 다당류 생성물, 예를 들면, 항응고제 활성을 갖는 N,2,3,6-HS 생성물을 생산하는 능력을 갖는다(참조: Desai, U.R., et al., (1998) J. Biol. Chem. 273 (13):7478-7487). 항응고제 N,2,3,6-HS 다당류의 의학적 용도는 수십년 동안 잘 문서화되었다. N,2,3,6-HS 다당류의 항응고제 활성 중 일부는 혈액-응고 캐스케이드 내에서 필수적인 2개의 단백질인, 인자 IIa(트롬빈) 및/또는 인자 Xa의 불활성화를 포함하나, 이에 한정되지 않는다. 특히, N,2,3,6-HS 다당류가 항트롬빈(AT)에 결합하는 경우, 이는 다당류, AT와 트롬빈 또는 인자 Xa 사이에 3원(ternary) 복합체의 형성을 가능하게 하는 효소내 구조적 변화를 유발한다 (참조: Li, W., et al., (2004) Nat. Struct. Mol. Biol. 11 (9):857-862, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). AT와 결합하여 이의 구조적 변화를 유도하기 위하여, N,2,3,6-HS 다당류는 화학식 I의 구조를 포함하는, 특이적인 5개-잔기 AT-인식 서열을 전형적으로 포함한다.
항응고가 AT-인식 서열만으로 이루어진 올리고사카라이드와 항트롬빈을 결합시킴으로써 유도될 수 있지만, N,2,3,6-HS 다당류가 5개 이상의 당 잔기를 포함하는 경우, 전형적으로 혈액 응고의 향상된 억제가 존재한다 (참조: Grey, E., et al., (2008) Thromb. Haemost. 99:807-818, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 그레이(Grey) 등에 의해 보고된 바와 같이, 제2의 결합 상호작용은, N,2,3,6-HS 다당류가 AT-인식 서열의 한쪽 측면에 적어도 13개의 당 잔기를 포함함으로써 다당류가 트롬빈에 결합하도록 하지만 또한 AT에 결합하는 "브릿지(bridge)"로서 작용하는 경우, 제2의 결합 상호작용이 N,2,3,6-HS 다당류와 트롬빈 사이에 형성될 수 있다. 그 결과, 항응고제 N,2,3,6-HS 다당류는 전형적으로 최소 18개의 당 잔기를 요구함으로써 N,2,3,6-HS 다당류, AT, 및 트롬빈 사이에 3원 복합체를 잠재적으로 형성한다. 그러나, 및 특수한 이론에 제한되지 않고, 특수한 다당류 분자 내 AT-인식 서열의 분포가 무작위적이므로, 18개 및 31개 당 잔기 사이의 일부 N,2,3,6-HS 다당류는 이론적으로 한쪽 측면에서 13개의 인접한 당 잔기를 가지지 않는 분자의 중심을 향해 AT-인식 서열을 이론적으로 포함할 수 있다. 결과적으로, 항응고제 N,2,3,6-HS 다당류는 적어도 32개의 당 잔기를 포함함으로써, AT-인식 서열이 분자내에 있는 경우와 상관없이, AT-인식 서열에 인접한 13개의 잔기 "브릿지(bridge)"가 형성될 수 있도록 하여야만 한다.
상술한 바와 같이, 거의 모든 설포트랜스퍼라제의 특성은, 이들이 시험관 내 또는 생체 내 설포전달 반응에서 활용되는 것에 상관없이, 이들이 설포 그룹 공여기로서 3'-포스포아데노신 5'-포스포설페이트를 공통적으로 및 예외적으로 인식한다는 것이다(미국 특허 5,541,095, 5,817,487, 5,834,282, 6,861,254, 8,771,995, 9,951,149, 및 미국 특허 공보 2009/0035787, 2013/0296540, 및 2016/0122446에 기술됨, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 이는 다당류가 설포 그룹 수용기인 설포트랜스퍼라제, 특히 항응고제 및 비-항응고제 N,2,3,6-HS 생성물의 생산에 관여하는 HS 설포트랜스퍼라제를 포함한다. 현재, 3'-포스포아데노신 5'-포스포설페이트는 고가이고 용액 속에서 불안정하므로, 항응고제 N,2,3,6-HS 다당류를 다량으로 수득하기 위한 대부분의 편리하고 경제적으로 용이한 방법은 시험관 내에서 이를 합성하기 보다는, 동물 공급원, 특히 돼지 및 소로부터 이를 단리하는 것이며, 심지어 커플링되는 경우, 효소적 3'-포스포아데노신 5'-포스포설페이트 재생 시스템(참조: U.S. Pat. No. 6,255,088, 상기됨) 이 사용된다. 특수한 이론에 제한되지 않고, N,2,3,6-HS 다당류의 생산시 하나 이상의 설포 전달을 촉매하기 위해 상술한 가공된 임의의 아릴 설페이트-의존성 설포트랜스퍼라제를 활용하는 것은 설포 그룹 공여기로서 3'-포스포아데노신 5'-포스포설페이트를 사용하는 것에 있어서 산업적 의존성을 감소시킬 수 있고, 가공된 아릴 설페이트-의존성 설포트랜스퍼라제가 모든 설포전달 단계에서 활용되는 경우, 3'-포스포아데노신 5'-포스포설페이트를 사용할 필요성은 전적으로 명백할 수 있다.
따라서, N,2,3,6-HS 생성물을 합성하는 방법은 반응 중 적어도 하나가 가공된 아릴 설페이트-의존성 설포트랜스퍼라제 효소 및 아릴 설페이트 화합물을 포함하는 한 천연의 또는 가공된 설포트랜스퍼라제 효소의 임의의 조합을 포함할 수 있다. 일부 구현예에서, N,2,3,6-HS 생성물을 합성하는 방법은 다음의 단계를 포함할 수 있다: (a) N-탈아세틸화 헤파로산을 포함하는 출발 다당류 반응 혼합물을 제공하는 단계; (b) 출발 다당류 반응 혼합물을 설포 그룹 공여기 및 글루코사미닐 N-설포트랜스퍼라제 효소, 헥수로닐 2-O 설포트랜스퍼라제 효소, 및 글루코사미닐 6-O 설포트랜스퍼라제 효소로 이루어진 그룹으로부터 선택된 제1의 설포트랜스퍼라제 효소를 포함하는 반응 혼합물과 조합함으로써, 제1의 설페이트화된 다당류를 형성시키는 단계; (c) 제1의 설페이트화된 다당류를 설포 그룹 공여기 제2의 설포트랜스퍼라제 효소를 포함하는 반응 혼합물과 조합시키는 단계로서, 여기서 제2의 설포트랜스퍼라제 효소가 제2의 설페이트화된 다당류를 형성하기 위한, 단계 (b)에서 선택되지 않은 2개의 효소 중 하나인 단계; (d) 제2의 설페이트화된 다당류를 설포 그룹 공여기 및 제3의 설포트랜스퍼라제 효소를 포함하는 반응 혼합물과 조합시키는 단계로서, 여기서 제3의 설포트랜스퍼라제 효소는 제3의 설페이트화된 다당류를 형성하기 위한, 단계 (b) 또는 단계 (c)에서 선택되지 않았던 효소인 단계; 및 (e) 제3의 설페이트화된 다당류를 설포 그룹 공여기 및 글루코사미닐 3-O 설포트랜스퍼라제 효소를 포함하는 반응 혼합물과 조합하여 N,2,3,6-HS 생성물을 형성시키는 단계. 가공된 설포트랜스퍼라제 효소를 포함하지 않는 반응 혼합물은 3'-포스포아데노신 5'-포스포설페이트 및 설포 그룹 공여기로서 3'-포스포아데노신 5'-포스포설페이트와 함께 생물학적 활성을 지닌 야생형 HS 설포트랜스퍼라제를 포함할 수 있다. 다른 구현예에서, 헥수로닐 2-O 설포트랜스퍼라제 효소를 포함하는 반응 혼합물은 글루쿠로닐 C5-에피머라제 효소를 추가로 포함한다.
다른 구현예에서, 글루코사미닐 N-설포트랜스퍼라제 효소가 가공된 효소일 때, 이 효소는 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 33, 서열 번호: 34, 서열 번호: 35, 서열 번호: 36, 서열 번호: 37, 서열 번호: 38, 서열 번호: 39, 및 서열 번호: 40으로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있다. 다른 구현예에서, 헥수로닐 2-O 설포트랜스퍼라제 효소가 가공된 효소인 경우, 효소는 서열 번호: 14, 서열 번호: 16, 서열 번호: 41, 및 서열 번호: 42로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있다. 다른 구현예에서, 글루코사미닐 6-O 설포트랜스퍼라제 효소가 가공된 효소인 경우, 효소는 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 43, 서열 번호: 44, 서열 번호: 45, 서열 번호: 46, 서열 번호: 47, 서열 번호: 48, 서열 번호: 49, 서열 번호: 50, 서열 번호: 59, 서열 번호: 60, 및 서열 번호: 61로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있다. 다른 구현예에서, 글루코사미닐 3-O 설포트랜스퍼라제 효소가 가공된 효소인 경우, 효소는 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 51, 서열 번호: 52, 서열 번호: 53, 서열 번호: 54, 서열 번호: 56, 서열 번호: 57, 및 서열 번호: 58로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함할 수 있다.
다른 구현예에서, 글루코사미닐 N-설포트랜스퍼라제 효소는 제1의 설포트랜스퍼라제 효소이고, 헥수로닐 2-O 설포트랜스퍼라제 효소는 제2의 설포트랜스퍼라제 효소이고, 글루코사미닐 6-O 설포트랜스퍼라제 효소는 제3의 설포트랜스퍼라제 효소이다.
다른 구현예에서, 설포 그룹 공여기로서 사용된 아릴 설페이트 화합물은 PNS, MUS, 7-하이드록시코우마린 설페이트, 페닐 설페이트, 4-아세틸페닐 설페이트, 인독실 설페이트, 1-나프틸 설페이트, 2-나프틸 설페이트, 및 NCS로 이루어진 그룹으로부터 선택될 수 있다. 심지어 추가의 구현예에서, 아릴 설페이트 화합물은 PNS이다. 다른 심지어 추가의 구현예에서, 아릴 설페이트 화합물은 NCS이다.
다른 구현예에서, 출발 다당류 혼합물 내 N-탈아세틸화 헤파로산은 화학식 II의 구조를 포함한다. 다른 구현예에서, 제3의 설페이트화된 다당류는 N,2,6-HS 생성물이다. 다른 구현예에서, N,2,6-HS 생성물은 화학식 IX의 구조를 포함한다. 다른 구현예에서, N,2,6-HS 생성물은 화학식 X의 구조를 포함한다. 다른 구현예에서, N,2,3,6-HS 생성물은 항응고제 활성을 갖는다. 다른 구현예에서, N,2,3,6-HS 생성물은 화학식 I의 구조를 포함하는 AT-인식 서열을 포함한다. 다른 구현예에서, AT-인식 서열을 포함하는 N,2,3,6-HS 생성물은 적어도 5개의 당 잔기를 갖는 N,2,3,6-HS 다당류를 포함한다. 다른 구현예에서, AT-인식 서열을 포함하는 N,2,3,6-HS 생성물은 적어도 8개의 당 잔기를 갖는 N,2,3,6-HS 다당류를 포함한다. 다른 구현예에서, AT-인식 서열을 포함하는 N,2,3,6-HS 생성물은 적어도 18개의 당 잔기를 갖는 N,2,3,6-HS 다당류를 포함한다. 다른 구현예에서, AT-인식 서열을 포함하는 N,2,3,6-HS 생성물은 적어도 32개의 당 잔기를 갖는 N,2,3,6-HS 다당류를 포함한다.
다른 구현예에서, 본 발명의 방법에 의해 생산된 항응고제 N,2,3,6-HS 다당류는 각각 "항-Xa" 활성 및 "항-IIa" 활성으로 명명된, 인자 Xa 및 트롬빈에 대해 갖는 억제 활성의 정도로 특성화될 수 있다. 항응고제 다당류에 의해 유도된 억제의 양은 밀리그램 당 국제 단위(IU mg-1) 및 가끔 밀리리터당 국제 단위(IU mL-1)로서 흔히 측정된다. 어느 하나의 경우에, 국제 단위는 0℃에서 24시간 동안 1 mL의 고양이의 혈류를 유지하는데 필요한 양에 대해 대략 등가인 양이다. 전형적으로, 항응고제 N,2,3,6-HS 다당류의 측정가능한 항-Xa 활성은 적어도 약 1 IU mg-1, 예를 들면, 적어도 약 50 IU mg-1, 적어도 75 IU mg-1, 100 IU mg-1, 150 IU mg-1, 200 IU mg-1, 또는 500 IU mg-1, 적어도 약 1,000 IU mg-1 이하이고, 항응고제 N,2,3,6-HS 다당류의 측정가능한 항-IIa 활성은 적어도 약 1 IU mg-1, 예를 들면, 적어도 약 10 IU mg-1, 25 IU mg-1, 50 IU mg-1, 100 IU mg-1, 150 IU mg-1, 또는 180 IU mg-1, 적어도 약 200 IU mg-1 이하이다. 32개의 당 잔기 이상이고 AT 및 트롬빈과 3차 복합체를 형성할 수 있는 항응고제 N,2,3,6-HS 다당류의 경우, 항-Xa 활성 대 항-IIa 활성의 비는 일반적으로 1:1, 특히 0.9:1 내지 1.1:1의 범위에 근접한다(참조: Keire, D.A., et al., (2011) Anal. Bioanal. Chem. 399:581-591, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 그러나, 32개 미만의 당 잔기 및 항응고제 N,2,3,6-HS 다당류의 쇄 길이 감소는 트롬빈과 상호작용을 보증하지 않으므로, 항-Xa 대 항-IIa 비는 적어도 약 10.0:1 이하, 적어도 100:1 이하로 증가될 수 있다. 결과적으로, 다른 구현예에서, N,2,3,6-HS 생성물의 항-Xa 활성 대 항-IIa 활성의 비는 적어도 0.5:1, 예를 들면, 적어도 0.75:1, 0.9:1, 1:1, 1.1:1, 1.3:1, 1.5:1, 2.0:1, 3.0:1, 4.0:1, 5.0:1, 6.0:1, 7.0:1, 8.0:1, 9.0:1, 10.0:1, 20:1, 40:1, 60:1, 또는 80:1, 적어도 100:1 이하이다. 다른 구현예에서, N,2,3,6-HS 생성물의 항-Xa 활성 대 항-IIa 활성의 비는 100:1 미만, 예를 들면, 80:1 미만, 60:1. 40:1, 20:1, 10.0:1, 9.0:1, 8.0:1, 7.0:1, 6.0:1, 5.0:1, 4.0:1, 3.0:1, 2.0:1, 1.5:1, 1.3:1, 1.1:1, 0.9:1, 또는 0.75:1 미만, 0.5:1 미만 아래일 수 있다. 다른 구현예에서, 특히 약 0.9 내지 약 1.1일 수 있다. 다른 구현예에서, 32개 이상의 당 잔기를 갖는 다당류를 포함하는 N,2,3,6-HS 생성물의 항-Xa 활성 대 항-IIa 활성의 비는 0.5:1로부터 0.75:1 이하, 또는 0.9:1, 또는 1:1, 또는 1.1:1, 또는 1.3:1, 또는 1.5:1, 또는 2.0:1, 또는 3.0:1, 또는 4.0:1, 또는 5.0:1, 또는 6.0:1, 또는 7.0:1, 또는 8.0:1, 또는 9.0:1, 또는 10.0:1 이하의 범위이다. 다른 구현예에서, 특히 약 0.9 내지 약 1.1일 수 있다. 다른 구현예에서, 32개 이상의 당 잔기를 갖는 다당류를 포함하는 N,2,3,6-HS 생성물의 항-Xa 활성 대 항-IIa 활성의 비는 0.75:1로부터 0.9:1 이하, 또는 1:1, 또는 1.1:1, 또는 1.3:1, 또는 1.5:1, 또는 2.0:1, 또는 3.0:1, 또는 4.0:1, 또는 5.0:1, 또는 6.0:1, 또는 7.0:1, 또는 8.0:1, 또는 9.0:1, 또는 10.0:1 이하의 범위이다. 다른 구현예에서, 32개 이상의 당 잔기를 갖는 다당류를 포함하는 N,2,3,6-HS 생성물의 항-Xa 활성 대 항-IIa 활성의 비는 0.9:1로부터 1:1, 또는 1.1:1, 또는 1.3:1, 또는 1.5:1, 또는 2.0:1, 또는 3.0:1, 또는 4.0:1, 또는 5.0:1, 또는 6.0:1, 또는 7.0:1, 또는 8.0:1, 또는 9.0:1, 또는 10.0:1 이하의 범위이다. 다른 구현예에서, 32개 이상의 당 잔기를 갖는 다당류를 포함하는 N,2,3,6-HS 생성물의 항-Xa 활성 대 항-IIa 활성의 비는 0.5:1 이상 10.0:1 이하에서 상기한 임의의 범위에 있다. 다른 구현예에서, 32개 이상의 당 잔기를 갖는 다당류를 포함하는 N,2,3,6-HS 생성물의 항-Xa 활성 대 항-IIa 활성의 비는 0.9:1 내지 1:1의 범위에 있다.
유사하게, 모든 다당류 혼합물, 예를 들면, N,2,3,6-HS 생성물 혼합물을 이의 중량-평균 분자량(
Figure pct00023
)으로 특성화할 수 있다. 동물 공급원으로부터 단리되거나 시험관 내에서 합성된 항응고제 N,2,3,6-HS 생성물 중 실질적으로 모두는 상이한 쇄 길이 및 설페이트화 정도를 지닌 다당류의 다분산성 혼합물로서 수득되므로, 수 평균(즉, 참 산술 평균(true arithmetic mean)(
Figure pct00024
)) 보다는, 중량 평균으로서 평균 분자량을 표시하는 것이 항응고에서 보다 큰 분자가 가지는 효과에 대해 설명될 수 있으므로 흔히 가장 유리하다. 다당류 혼합물의
Figure pct00025
는 광 산란 방법 또는 분석 초원심분리를 사용하여 실험적으로 측정할 수 있다(참조: Mulloy, B., et al., (2014) Anal. Bioanal. Chem. 406:4815-4823, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 그러나, 전형적으로 크기 배제 크로마토그래피에 의해
Figure pct00026
를 측정하는 것은,
Figure pct00027
Figure pct00028
사이의 비가 특수한 다당류 샘플에서 다분산성의 양으로 유효한 통찰력을 제공할 수 있으므로 여전히 유용할 수 있다.
특히, 항응고제로서 의학적으로 처방된 N,2,3,6-HS 다당류는 일반적으로 이의 평균 분자량, 특히 이의
Figure pct00029
를 기반으로 다수의 부류로 분할된다. 저-분자량 항응고제 N,2,3,6-HS 다당류(LMW-HS)의 샘플은 전형적으로 8,000 Da 미만의
Figure pct00030
를 가지며, 여기서 샘플 내 다당류 분자 모두의 60% 이상은 8,000 Da 미만의 실제 분자량을 갖는다(참조: Linhardt, R.J. and Gunay, N.S., (1999) Seminars in Thrombosis and Hemostasis 25 (Suppl. 3):5-16, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). LMW-HS 다당류는 "분획화되지 않은"으로 지칭된, 생체 내에서 합성되고 동물 공급원으로부터 단리된 보다 큰 항응고제 N,2,3,6-HS 다당류를 화학적으로 또는 효소적으로 개질시킴으로써 전형적으로 제조된다. 분획화되지 않은 항응고제 N,2,3,6-HS 다당류(UF-HS)는 전형적으로 8,000 Da 초과의
Figure pct00031
를 갖는다. 의학적 치료에서에서의 사용에 대해 입증하기 위하여, UF-HS 조성물은 즉 다음을 충족시켜야만 하는 엄격한 분자량 가이드라인을 갖는다: (1) 분자량이 24,000 Da을 초과하는 조성물 내 다당류의 비율은 20% 이하이고; (2) 조성물 자체의
Figure pct00032
는 15,000 Da 내지 19,000 Da이고; (3) 분자량이 16,000 Da 내지 24,000인 조성물 내 다당류의 수에 대해 분자량이 8,000 Da 내지 16,000인 조성물 내 다당류의 수의 비는 1.0:1 이상이다(참조: 상기된 Mulloy, B., et al.).
따라서, 다른 구현예에서, 본 발명의 방법에 따라 합성된 N,2,3,6-HS 생성물은 다수의 N,2,3,6-HS 다당류를 포함할 수 있고, 항응고제로서 의학적으로 처방된 UF-HS 생성물과 동일한 하나 이상의 분자량 특성을 가질 수 있다. 다른 구현예에서, 항응고제 N,2,3,6-HS 생성물은 적어도 1,000 Da, 적어도 2,000 Da, 3,000 Da, 4,000 Da, 5,000 Da, 6,000 Da, 7,000 Da, 8,000 Da, 9,000 Da, 10,000 Da, 11,000 Da, 12,000 Da, 13,000 Da, 14,000 Da, 15,000 Da, 16,000 Da, 17,000 Da, 18,000 Da, 19,000 Da, 20,000 Da, 21,000 Da, 22,000 Da, 23,000 Da, 또는 24,000 Da, 적어도 50,000 Da까지의
Figure pct00033
를 갖는다. 다른 구현예에서, 항응고제 N,2,3,6-HS 생성물은 50,000 Da 미만, 적어도 24,000 Da, 23,000 Da, 22,000 Da, 21,000 Da, 20,000 Da, 19,000 Da, 18,000 Da, 17,000 Da, 16,000 Da, 15,000 Da, 14,000 Da, 13,000 Da, 12,000 Da, 11,000 Da, 10,000 Da, 9,000 Da, 8,000 Da, 7,000 Da, 6,000 Da, 5,000 Da, 4,000 Da, 3,000 Da, 2,000 Da 미만 까지의
Figure pct00034
를 갖는다. 다른 구현예에서, 항응고제 N,2,3,6-HS 생성물은 1,000 이상 2,000 Da 이하, 또는 3,000 Da, 또는 4,000 Da, 또는 5,000 Da, 또는 6,000 Da, 또는 7,000 Da, 또는 8,000 Da, 또는 9,000 Da, 또는 10,000 Da, 또는 11,000 Da, 또는 12,000 Da, 또는 13,000 Da, 또는 14,000 Da, 또는 15,000 Da, 또는 16,000 Da, 또는 17,000 Da, 또는 18,000 Da, 또는 19,000 Da, 또는 20,000 Da, 또는 21,000 Da, 또는 22,000 Da, 또는 23,000 Da, 또는 24,000 Da 이하의
Figure pct00035
를 갖는다. 다른 구현예에서, 항응고제 N,2,3,6-HS 생성물은 2,000 Da 이상 3,000 Da 이하, 또는 4,000 Da, 또는 5,000 Da, 또는 6,000 Da, 또는 7,000 Da, 또는 8,000 Da, 또는 9,000 Da, 또는 10,000 Da, 또는 11,000 Da, 또는 12,000 Da, 또는 13,000 Da, 또는 14,000 Da, 또는 15,000 Da, 또는 16,000 Da, 또는 17,000 Da, 또는 18,000 Da, 또는 19,000 Da, 또는 20,000 Da, 또는 21,000 Da, 또는 22,000 Da, 또는 23,000 Da, 또는 24,000 Da 이하의
Figure pct00036
를 갖는다. 다른 구현예에서, 항응고제 N,2,3,6-HS 생성물은 분획화되지 않은 N,2,3,6-HS 생성물이다. 다른 구현예에서, 분획화되지 않은 항응고제 N,2,3,6-HS 생성물은 8,000 Da로부터 9,000 Da 이하, 또는 10,000 Da, 또는 11,000 Da, 또는 12,000 Da, 또는 13,000 Da, 또는 14,000 Da, 또는 15,000 Da, 또는 16,000 Da, 또는 17,000 Da, 또는 18,000 Da, 또는 19,000 Da, 또는 20,000 Da, 또는 21,000 Da, 또는 22,000 Da, 또는 23,000 Da, 또는 24,000 Da 이하의
Figure pct00037
를 갖는다. 다른 구현예에서, 항응고제 N,2,3,6-HS 생성물은 LMW-HS 생성물이다. 다른 구현예에서, 항응고제 LMW-HS 생성물은 2,000 Da으로부터 3,000 Da 이하, 또는 4,000 Da, 또는 5,000 Da, 또는 6,000 Da, 또는 7,000 Da, 또는 8,000 Da의 범위의
Figure pct00038
를 갖는다. 다른 구현예에서, 항응고제 N,2,3,6-HS 생성물은 15,000 Da 이상 16,000 Da 이하, 17,000 Da, 또는 18,000 Da, 또는 19,000 Da 이하의
Figure pct00039
를 갖는다. 다른 구현예에서, 항응고제 N,2,3,6-HS 생성물은 1,000 Da 내지 24,000 Da에서 상기된 임의의 범위, 바람직하게는 15,000 Da 내지 19,000 Da에서 상기된 임의의 범위의
Figure pct00040
를 가질 수 있다.
다른 구현예에서, N,2,3,6-HS 생성물 내 N,2,3,6-HS 다당류의 50% 미만, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10%, 5%, 3%, 또는 2% 미만, 1% 미만까지는 24,000 Da 초과의 분자량을 갖는다. 일부 바람직한 구현예에서, N,2,3,6-HS 생성물 내에서 N,2,3,6-HS 다당류의 20% 이하는 24,000 Da 초과의 분자량을 갖는다. 다른 구현예에서, N,2,3,6-HS 생성물 내에서 N,2,3,6-HS 다당류의 20% 이하가 24,000 Da 초과의 분자량을 갖는 경우, 항응고제 N,2,3,6-HS 생성물은 1,000 Da 이상 24,000 Da 이하의 상기된 임의의 범위내, 바람직하게는 15,000 Da 이상 19,000 Da의 이하의 상기된 임의의 범위내의
Figure pct00041
를 가질 수 있다.
다른 구현예에서, N,2,3,6-HS 생성물 내 분자량이 8,000 Da 내지 16,000 Da인 N,2,3,6-HS 다당류의 상대적인 양은 동일한 N,2,3,6-HS 생성물 내에서 분자량이 16,000 Da 내지 24,000 Da인 N,2,3,6-HS 다당류의 상대적인 양과의 비로서 비교할 수 있다. 다른 구현예에서, 분자량이 16,000 Da 내지 24,000 Da인 조성물 내 다당류의 수에 대해 분자량이 8,000 Da 내지 16,000 Da인 조성물내 다당류의 수의 비는 0.5:1 이상, 0.75:1, 0.9:1, 1.0:1, 1.1:1, 1.3:1, 또는 1.5:1 이상, 2.0:1 이상 까지, 및 바람직하게는 1.0:1 이상이다. 다른 구현예에서, 분자량이 16,000 Da 내지 24,000 Da인 조성물 내 다당류의 수에 대해 분자량이 8,000 Da 내지 16,000 Da인 조성물내 다당류의 수의 비가 1.0:1 이상인 N,2,3,6-HS 생성물은 또한 1,000 Da 내지 24,000 Da 및 이를 포함하는 임의의 범위, 및 바람직하게는 15,000 Da 내지 약 19,000 Da 및 이를 포함하는 상기 나타낸 임의의 범위에서의
Figure pct00042
를 또한 가질 수 있고, 여기서 N,2,3,6-HS 생성물내 N,2,3,6-HS 다당류의 20% 이하는 24,000 Da보다 큰 분자량을 갖는다.
다른 구현예에서, 본 발명의 임의의 방법에 의해 제조된 항응고제 N,2,3,6-HS 생성물은 항응고제 활성 및 분자량 특성을 포함하는 약제학적 UF-HS 조성물에 대한 미국 약전(USP)에 의해 측정된 임의의 벤치마크(benchmark) 요건을 만족시킬 수 있다. 다른 구현예에서, 항응고제 N,2,3,6-HS 생성물은 다음으로 이루어진 그룹으로부터 선택된 임의의 특성을 지닐 수 있다: 이의 임의의 조합을 포함하는, 180 IU mg-1 이상의 항-IIa 활성; 180 IU mg-1 이상의 항-Xa 활성; 0.9:1 내지 1.1:1의 범위, 바람직하게는 1:1의 항-Xa 대 항-IIa 활성의 비; 15,000 Da 내지 19,000 Da의 범위의
Figure pct00043
; 분자량이 24,000 Da 초과인 20% 이하의 다당류; 및 분자량이 16,000 Da 내지 24,000 Da인 조성물 내 다당류의 수에 대해 분자량이 8,000 Da 내지 16,000 Da인 조성물 내 다당류의 비는 1.0:1 이상이다. 다른 구현예에서, 본 발명의 임의의 방법에 의해 제조된 항응고제 N,2,3,6-HS 생성물은 다음의 항응고제 활성 및 분자량 특성 모두를 가질 수 있다: 180 IU mg-1 이상의 항-IIa 활성; 180 IU mg-1 이상인 항-Xa 활성; 0.9:1 내지 1.1:1의 범위, 바람직하게는 1:1의 항-Xa 대 항-IIa 활성의 비; 15,000 Da 내지 19,000 Da 이하의 범위의
Figure pct00044
; 분자량이 16,000 Da 내지 24,000 Da인 조성물 내 다당류의 수에 대해 분자량이 8,000 Da 내지 16,000 Da인 조성물 내 다당류의 비는 1.0:1 이상이다. 다른 구현예에서, 본 발명의 임의의 방법에 의해 제조된 항응고제 N,2,3,6-HS 생성물은 광범위하게 이용가능한, USP 참고 표준(CAS 번호: 9041-08-1)에 대해 실질적으로 등가의 항응고제 활성 및 분자량 특성을 갖는다.
다른 구현예에서, 항응고제 N,2,3,6-HS 생성물은 생성물 순도, 특히 다른 설페이트화된 다당류, 예를 들면, 그러나 이에 한정되지 않는 콘드로이틴 설페이트로부터의 순도와 관련하여 약제학적 UF-HS 조성물에 대한 USP에 의해 측정된 벤치마크 요건을 만족시킬 수 있다. 특히, 과-설페이트화된 콘드로이틴 설페이트(OSCS)는 2007년 및 2008년에 전세계적으로 수백명의 사망을 유발한 약제학적 UF-HS 조성물 내 오염원인 것으로 측정되었다. 다른 구현예에서, 및 특수한 이론에 한정되지 않고, 상업적으로 또는 세균 자체(이하에서 더 상세히 기술됨)로부터 단리된 헤파로산을 개질시킴으로써 수득될 수 있는, N-탈아세틸화 헤파로산 출발 물질 자체는 콘드로이틴 설페이트를 실질적으로 포함하지 않는 것으로 여겨지므로, 본 발명의 임의의 방법에 의해 형성된 N,2,3,6-HS 생성물의 제제는 콘드로이틴 설페이트, 특히 OSCS로부터 실질적으로 자유롭게 제조될 수 있다.
다른 구현예에서, 임의의 USP 분자량 벤치마크를 충족시키는 항응고제 N,2,3,6-HS 생성물에 도달하기 위하여, 설포 그룹 수용기로서 활용된 임의의 다당류의 분자량이 조절될 수 있다. 비-제한적 예로서, 및 다른 구현예에서, 출발 물질로서 사용된 헤파로산-계 다당류의 분자량 특성은 분자량 특성의 표적 세트에 도달할 때까지 헤파로산을 화학적으로 개실시킴으로써 조절할 수 있다. 후술한 바와 같이, 헤파로산 및 다른 헤파로산-계 다당류는 상업적인 공급원으로부터 입수할 수 있거나 세균 또는 진핵 세포 공급원으로부터 단리할 수 있다.
특히, 헤파로산-계 다당류는 수개의 형태의 생명체에서 발견되며 수개의 상이한 기능을 갖는다. 진핵세포에서, 이는 생체 내에서 HS 및 UF-HS 생성물의 형성시 설포 수용기 및/또는 전구체로서 작동한다. 헤파로산 및 헤파로산-계 다당류는 또한 대사산물 및 다른 외인성 물질에 의한 세포 도입을 조절하는 캡슐로서 세균 내에서 발견될 수 있다. 이러한 세균은 파스퇴렐라 물토시다(Pasteurella multocida) 및 에스케리키아 콜라이(이. 콜라이)를 포함하나, 이에 한정되지 않는다. 일부 구현예에서, 헤파로산은 이콜라이, 특히, 이. 콜라이의 K5 균주로부터, 다양한 분자량을 갖는 다당류 분자의 다분산성 혼합물로서 추출 및 정제될 수 있다. 이. 콜라이의 K5 균주로부터 헤파로산을 단리하는 과정은 문헌: Wang, Z., et al., (2010) Biotechnol. Bioeng. 107 (6):964-973에 논의되고 기술되어 있으며, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다 (참조: also DeAngelis, P.L. (2015) Expert Opinion on Drug Delivery 12 (3):349-352; Ly, M., et al., (2010) Anal. Bioanal. Chem. 399:737-745; 및 Zhang, C., et al., (2012) Metabolic Engineering 14:521-527, 이들 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 그러나, 세균, 예를 들면, 이. 콜라이로부터 단리된 헤파로산의 실질적으로 모두는 N-아세틸화되어 있으므로, 이는 본원에 기술된 임의의 설포트랜스퍼라제에 대한 설포 수용기로서 직접 사용될 수 없고, 본 발명의 방법에 따라 활용될 수 있다. 그 결과, 헤파로산은 설포 그룹 수용기로서 활용될 수 있기 전에, 이는 적어도 부분적으로 N-탈아세틸화되어야만 한다.
그 결과, 다른 구현예에서, 헤파로산은 염기, 특히 수산화리튬 또는 수산화나트륨으로 처리함으로써 적어도 부분적으로 N-탈아세틸화시킬 수 있다 (참조: Wang, Z., et al., (2011) Appl. Microbiol. Biotechnol. 91 (1):91-99, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다; 참조: PCT publication PCT/US2012/026081, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 다른 구현예에서, 염기는 수산화나트륨이다. 목적한 N-탈아세틸화 정도, 헤파로산의 농도, 및 염기의 농도에 따라, 당해 분야의 기술자는 상기 문헌: Wang, et al., (2011)에 기술된 과정에 따라 헤파로산과 염기를 오래 항온처리하는 방법을 측정할 수 있다.
다른 구현예에서, 헤파로산은 목적한 양의 N-아세틸화된 글루코사민 잔기가 N-탈아세틸화된 생성물 내에 잔존할 때가지 염기, 바람직하게는 수산화나트륨과 함께 항온처리될 수 있다. 다른 구현예에서, N-아세틸 글루코사민 잔기는 N-탈아세틸화된 헤파로산 생성물 내에 60% 미만, 예를 들면, 30%, 20%, 18%, 16%, 14%, 12%, 또는 10% 미만, 5% 미만까지, 및 바람직하게는 12% 내지 18%의 글루코사민 잔기를 포함할 수 있다. 다른 구현예에서, N-아세틸 글루코사민은 N-탈아세틸화된 헤파로산 생성물 내에 약 15%의 글루코사민 잔기를 포함할 수 있다.
추가로, 및 특수한 이론에 제한되지 않고, 글루코사민 잔기를 탈-아세틸화하는 것 외에, 헤파로산과 염기 사이의 반응은 동시에 헤파로산 다당류를 해중합(depolymerizing)시키고 이의 분자량을 감소시킬 수 있으며, 이는 궁극적으로 N-탈아세틸화된 헤파로산 조성의
Figure pct00045
을 감소시킬 수 있다. 전형적으로, 세균, 예를 들면, 그러나 이에 한정되지 않는 이. 콜라이로부터 단리된 헤파로산 다당류는 약 3,000 Da 내지 약 150,000 Da 범위의 분자량을 가질 수 있고, 단리된 헤파로산의 조성물은 약 25,000 Da 내지 약 50,000 Da의 범위의
Figure pct00046
를 가질 수 있다 (참조: Ly, M., et al. 및 Wang, et al., (2011), 상기됨). 다른 구현예에서, 출발
Figure pct00047
및 전체 분자량 특성과 독립적으로, 상업적 공급원으로부터 수득되거나 세균, 예를 들면, 그러나 이에 한정되지 않는 이. 콜라이로부터 단리된 헤파로산 조성물은 염기, 바람직하게는 수산화나트륨으로 N-탈아세틸화된 헤파로산 생성물의
Figure pct00048
가 표적 또는 목적한 수준으로 감소되기에 충분한 시간 동안 처리할 수 있다. 다른 구현예에서, 해중합된 N-탈아세틸화된 헤파로산 생성물은 적어도 1,000 Da, 예를 들면, 적어도 2,000 Da, 4,000 Da, 6,000 Da, 7,000 Da, 8,000 Da, 8,500 Da, 9,000 Da, 9,500 Da, 10,000 Da, 10,500 Da, 11,000 Da, 11,500 Da, 12,000 Da, 12,500 Da, 13,000 Da, 13,500 Da, 14,000 Da, 15,000 Da, 16,000 Da, 또는 18,000 Da, 적어도 20,000 Da 까지의
Figure pct00049
를 가질 수 있다. 다른 구현예에서, 해중합된 N-탈아세틸화된 헤파로산 생성물은 20,000 Da 미만, 예를 들면, 18,000 Da, 16,000 Da, 15,000 Da, 14,000 Da, 13,500 Da, 13,000 Da, 12,500 Da, 12,000 Da, 11,500 Da, 11,000 Da, 10,500 Da, 10,000 Da, 9,500 Da, 9,000 Da, 8,500 Da, 8,000 Da, 7,000 Da, 6,000 Da, 또는 4,000 Da, 2,000 Da 미만 까지의
Figure pct00050
를 가질 수 있다. 다른 구현예에서, 해중합된 N-탈아세틸화된 헤파로산 생성물은 1,000 Da 이상 2,000 Da 이하, 또는 4,000 Da, 또는 6,000 Da, 또는 7,000 Da, 또는 8,000 Da, 또는 8,500 Da, 또는 9,000 Da, 또는 9,500 Da, 또는 10,000 Da, 또는 10,500 Da, 또는 11,000 Da, 또는 11,500 Da, 또는 12,000 Da, 또는 12,500 Da, 또는 13,000 Da, 또는 13,500 Da, 또는 14,000 Da, 또는 15,000 Da, 또는 16,000 Da, 또는 18,000 Da, 또는 20,000 Da 이하의
Figure pct00051
를 가진다. 다른 구현예에서, 항응고제 N,2,3,6-HS 생성물은 7,000 Da 이상 8,000 Da 이하, 또는 8,500 Da, 또는 9,000 Da, 또는 9,500 Da, 또는 10,000 Da, 또는 10,500 Da, 또는 11,000 Da, 또는 11,500 Da, 또는 12,000 Da, 또는 12,500 Da, 또는 13,000 Da, 또는 13,500 Da, 또는 14,000 Da, 또는 15,000 Da 이하의
Figure pct00052
를 가진다. 다른 구현예에서, 해중합된 N-탈아세틸화된 헤파로산 생성물은 9,000 Da 이상 9,500 Da 이하, 또는 10,000 Da, 또는 10,500 Da, 또는 11,000 Da, 또는 11,500 Da, 또는 12,000 Da, 또는 12,500 Da 이하의
Figure pct00053
를 가진다. 다른 구현예에서, 해중합된 N-탈아세틸화된 헤파로산 생성물은 1,000 Da 이상 20,000 Da 이하의 상기한 임의의 범위, 바람직하게는 9,000 Da 이상 12,500 Da 이하의 상기한 임의의 범위의
Figure pct00054
를 가진다.
다른 구현예에서, 헤파로산 조성물은 염기, 바람직하게는 수산화나트륨으로, N-탈아세틸화 헤파로산 생성물의
Figure pct00055
를 표적 또는 목적한 수준으로 감소시키고, N-탈아세틸화 헤파로산 생성물 내에서 N-아세틸화로 남아있는 글루코사민 잔기의 목적한 양을 획득하기에 충분한 시간 동안 처리할 수 있다. 다른 구현예에서, N-탈아세틸화 헤파로산 생성물은 1,000 Da 내지 20,000 Da 및 이를 포함하는,
Figure pct00056
를 가질 수 있고, 동시에 N-탈아세틸화 헤파로산 생성물 내 글루코사민 잔기의 60% 미만은 N-아세틸글루코사민 잔기로서 존재한다. 다른 구현예에서, N-탈아세틸화 헤파로산 생성물은 9,000 Da 내지 12,500 및 이를 포함하는 상기 나타낸 임의의 범위에서의
Figure pct00057
를 갖고, 여기서 N-탈아세틸화 헤파로산 생성물 내 글루코사민 잔기의 12% 및 18% 이하는 N-아세틸화되어 있다. 이러한 분자량 특성 및 N-아세틸 함량을 갖는 N-탈아세틸화된 헤파로산의 제조는 상기 문헌: Wang, et al., (2011)에 상세히 기술되어 있다. 다른 구현예에서, 헤파로산과 염기, 바람직하게는 수산화나트륨을 반응시켜 9,000 Da 및 12,500 Da의 범위의
Figure pct00058
, 뿐만 아니라, 12% 내지 18%의 범위의 N-아세틸 글루코사민 함량을 갖는 N-탈아세틸화된 헤파로산 생성물을 형성하기에 충분한 시간은 헤파로산 출발 물질의 분자량 특성 및 농도, 및 반응을 수행하는데 사용된 염기의 농도에 따라, 적어도 1시간, 예를 들면, 적어도 2, 4, 6, 8, 10, 12, 또는 18 시간, 및 적어도 24 시간 이하일 수 있다.
다른 구현예에서, 헤파로산을 염기, 특히 수산화나트륨으로 처리함으로써, 및 상기 문헌: Wang, et al., (2011)에 기술된 과정에 따라 제조된 N-탈아세틸화 헤파로산 조성물은 본원에 기술된 설페이트화된 다당류를 형성시키기 위한 임의의 방법에서 출발 물질로서 활용될 수 있다. 결과적으로, 및 다른 구현예에서, N-탈아세틸화 헤파로산을 포함하는 출발 다당류 반응 혼합물을 제공하는 방법은 다음의 소-단계를 포함한다: (a) 헤파로산을 포함하는 전구체 다당류 조성물을 제공하는 단계; 및 (b) 전구체 다당류 조성물과 염기, 바람직하게는 수산화리튬 또는 수산화나트륨을 포함하는 반응 혼합물을, 헤파로산 내에서, N-아세틸화 글루코사민 잔기 중 적어도 하나를 N-탈아세틸화시키기에 충분한 시간 동안 조합하여 N-탈아세틸화된 헤파로산 조성물을 형성시키는 단계. 다른 구현예에서, N-탈아세틸화 헤파로산 조성물은 9,000 Da 내지 12,500 Da의 범위의
Figure pct00059
, 및 12% 및 18% 이하의 범위의 N-아세틸 글루코사민 함량을 갖는다.
다른 구현예에서, N-탈아세틸화 헤파로산은 N-설페이트화제를 포함하는 반응 혼합물 내에서 반응시켜 N-설페이트화된 다당류를 형성시킬 수 있다. 상술한 바와 같이, 및 다른 구현예에서, N-설페이트화제는 상술한 임의의 야생형 또는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소를 포함할 수 있다. 다른 구현예에서, N-설페이트화제가 야생형 글루코사미닐 N-설포트랜스퍼라제인 경우, 반응 혼합물은 또한 설포 그룹 공여기로서 3'-포스포아데노신 5'-포스포설페이트를 포함할 수 있다. 다른 구현예에서, N-설페이트화제가 가공된 글루코사미닐 N-설포트랜스퍼라제인 경우, 반응 혼합물은 또한 설포 그룹 공여기로서 아릴 설페이트 화합물, 바람직하게는 PNS 또는 NCS를 포함할 수 있다.
다른 구현예에서, N-탈아세틸화된 헤파로산은 효소로 N-황산화되는 대신에 화학적으로 황산화시킬 수 있다. 다른 구현예에서, N-황산화제는 화학작용제, 바람직하게는 삼산화황 및/또는 하나 이상의 삼산화황 함유 화합물 또는 부가물일 수 있다. 삼산화황을 사용하는 다당류 내의 글루코사민 잔기의 화학적 N-황산화는 당해 분야에 일반적으로 공지되어 있다 (참조: Lloyd, A.G., et al., (1971) Biochem. Pharmacol. 20 (3):637-648; Nadkarni, V.D., et al., (1996) Carbohydrate Research 290:87-96; Kuberan, B., et al., (2003) J. Biol. Chem. 278 (52):52613-52621; Zhang, Z., et al., (2008) J. Am. Chem. Soc. 130 (39):12998-13007; 및 Wang, et al., (2011), 상기됨; 참조: U.S. Pat. No. 6,991,183 및 U.S. Pat. Pub. 2008/020789, 이들 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 삼산화황 복합체는 일반적으로 수산화나트륨과는 달리, 탈중합화를 유발하지 않고 다당류의 선택된 N-황산화를 가능하도록 하기에 충분히 온화한 염기이다 (참조 Gilbert, E.E., (1962) Chem. Rev. 62 (6):549-589). 삼산화황 함유 복합체의 비-제한적 예는 이산화황-피리딘, 이산화황-디옥산, 이산화황-트리메틸아민, 이산화황-트리에틸아민, 이산화황-디메틸아닐린, 이산화황-티옥산, 이산화황-비스(2-클로로에틸)에테르, 이산화황-2-메틸피리딘, 이산화황-퀴놀린, 또는 이산화황-디메틸포름아미드를 포함한다. 다른 구현예에서, N-설페이트화제는 삼산화황-트리메닐아민 부가물 및 삼산화황-피리딘 부가물로 이루어진 그룹으로부터 선택된 삼산화황-함유 부가물을 포함한다. 다른 구현예에서, N-설페이트화제는 삼산화황-트리메틸아민 부가물을 포함한다.
다른 구현예에서, N-설페이트화, 특히 화학적 N-설페이트화는, N--탈아세틸화 헤파로산과 관련하여 제1의 설페이트화 단계를 포함할 수 있다. 후속적으로, N--탈아세틸화 헤파로산이 효소적으로 또는 화학적으로 N--설페이트화된 후, N-설페이트화된 헤파로산을 이후 헥수로닐 2-O 설포트랜스퍼라제, 글루코사미닐 6-O 설포트랜스퍼라제, 및 글루코사미닐 3-O 설포트랜스퍼라제를 사용하여 설페이트화할 수 있다. N,2,3,6-HS 생성물이 형성된 구현예에서, 효소적 설페이트화 단계는 2-O, 6-O, 및 3-O 설페이트화의 순서로 일어난다. 상술한 바와 같이, 글루코사미닐 3-O 설포트랜스퍼라제 효소, 및 바람직하게는 설포트랜스퍼라제 효소 중 모두는 가공된 아릴-설페이트 의존성 설포트랜스퍼라제 효소이고, 반응은 3'-포스포아데노신 5'-포스포설페이트의 부재하에서 수행된다. 다른 구현예에서, 헥수로닐 2-O 설포트랜스퍼라제 효소를 포함하는 반응 혼합물은 글루쿠로닐 C5-에피머라제 효소, 바람직하게는 서열 번호: 29의 아미노산을 포함하는 글루쿠로닐 C5-에피머라제 효소, 및 보다 바람직하게는 서열 번호: 29의 34 내지 617번 잔기의 아미노산 서열을 포함하는 글루쿠로닐 C5-에피머라제 효소를 추가로 포함한다. 다른 구현예에서, N,2,3,6-HS 생성물은 항응고제 활성을 포함한다. 다른 구현예에서, N,2,3,6-HS 생성물은 화학식 I의 구조를 포함하는 AT-인식 서열을 포함한다.
다른 구현예에서, 상술한 N,2,3,6-HS 생성물을 형성하기 위한 임의의 방법은 실질적으로 수행될 수 있고, 각각의 설페이트화된 다당류 생성물은 단리 및 정제된 후 후속적인 단계에서 다른 설포트랜스퍼라제로 처리할 수 있다. 다른 구현예에서, 단계들 중 적어도 2개는 단일 포트(single pot) 내에서 수행될 수 있고, 설페이트화된 다당류 생성물은 이러한 포트로부터 단리 및 정제된 후 후속적인 설포전달 단계에서 활용될 수 있다. 다른 구현예에서, 단일 포트에서 일어날 수 있는 설포전달 반응의 하나의 비-제한적인 조합은 N-설페이트화 및 2-O 설페이트화 단계를 포함하고, 이후 N,2-HS 생성물은 단리 및 정제된 후 글루코사미닐 6-O 설포트랜스퍼라제와 반응한다. 특수한 이론에 의해 제한되지 않고, N-설페이트화된 HS 생성물은 헥수로닐 2-O 설포트랜스퍼라제 효소에 대해 설포 수용기로서 직접 활용될 수 있고/있거나 반응 혼합물은 상술한 임의의 글루쿠로닐 C5-에피머라제 효소를 포함함으로써 화학식 IV 및 화학식 V의 구조를 포함하는 다당류 사이의 전환을 촉매한다. 그러나, 및 여전히 추가의 구현예에서, 설포트랜스퍼라제 반응의 임의의 조합을 위한 반응 혼합물 및 효소는 반응 혼합물 및 모든 4개의 설페이트화 반응을 위한 효소, 및 적어도 헥수로닐 2-O 설포트랜스퍼라제, 글루코사미닐 6-O 설포트랜스퍼라제, 및 글루코사미닐 3-O 설포트랜스퍼라제를 포함하는, 단일 포트 내에서 조합될 수 있다.
다른 구현예에서, 상술한 N,2,3,6-HS 생성물을 형성하기 위한 임의의 방법 내에서, 가공된 설포트랜스퍼라제 및 설포 그룹 공여기로서 아릴 설페이트 화합물을 포함하는 임의의 반응 혼합물은 아릴 설페이트 화합물을 다시 채우기 위한 하나 이상의 반응 구성성분을 추가로 포함할 수 있다. 다른 구현예에서, 하나 이상의 반응 구성성분은 아릴 설포트랜스퍼라제(ASST) 효소 및 제2의 아릴 설페이트 화합물을 포함한다. 천연적으로, 아릴 설포트랜스퍼라제 효소는 방향족 화합물의 설페이트화를 촉매함으로써 아릴 설페이트 화합물을 형성한다. 전형적으로, 설포 공여기 자체는 아릴 설페이트 화합물이다. ASST 효소의 반응성은 일반적으로 예컨대 미국 특허 No. 6,225,088 및 8,771,995와 상기된 Malojcic, et al에 기술되어 있으며, 이 문헌들에 개시된 내용은 본 문서에 참조로서 통합된다. 특수한 이론에 제한되지 않고, 가공된 설포트랜스퍼라제를 포함하는 반응 혼합물 내에 ASST 및 제2의 아릴 설페이트 화합물을 추가로 포함시키는 것은 탈설페이트화된 방향족 생성물에 의한 가공된 설포트랜스퍼라제의 잠재적인 경쟁적 억제를 감소시킬 뿐만 아니라 반응 혼합물을 설포 그룹 공여기로 다시 채우는 장점을 가질 수 있다.
다른 구현예에서, 제2의 아릴 설페이트 화합물은 상술한 것을 포함하는 임의의 아릴 설페이트 화합물일 수 있다. 다른 구현예에서, 제2의 아릴 설페이트 화합물은 가공된 설포트랜스퍼라제 효소에 대해 설포 그룹 공여기로서 사용된 동일한 아릴 설페이트 화합물이다. 다른 구현예에서, 제2의 아릴 설페이트 화합물은 가공된 설포트랜스퍼라제 효소에 대해 설포 그룹 공여기로서 사용된 것 보다는 상이한 아릴 설페이트 화합물이다. 비-제한적인 예로서, 및 다른 구현예에서, 가공된 설포트랜스퍼라제가 설포 그룹 공여기로서 NCS와 생물학적 활성을 갖는 경우, 제2의 아릴 설페이트 화합물은 PNS이다. 다른 비-제한적 예에서, 및 다른 구현예에서, 가공된 설포트랜스퍼라제가 설포 그룹 공여기로서 PNS와 생물학적 활성을 갖는 경우, 제2의 아릴 설페이트 화합물은 NCS이다.
다른 구현예에서, 설포 공여기 아릴 설페이트 화합물을 다시채우기 위한 임의의 상기 방법과 함께 활용된 ASST 효소는 생체 내 공급원으로부터 단리되거나 시험관 내에서 재조합적으로 생성된, 임의의 세균 효소일 수 있고, 이는 아릴 설페이트 화합물로부터의 설포 그룹을 방향족 화합물로 전달한다. 다른 구현예에서, 및 하나의 비-제한적 예에서, ASST는 이. 콜라이로부터, 바람직하게는 이. 콜라이 균주 CFT073으로부터 및 서열 번호: 55의 아미노산 서열을 갖는 재조합 ASST이다. 다른 구현예에서, ASST 효소, 바람직하게는 서열 번호: 55의 아미노산 서열을 포함하는 ASST 효소는, 상술한 가공된 임의의 설포트랜스퍼라제에 커플링된 경우, 제2의 아릴 설페이트 화합물로부터의 설페이트 그룹을 가공된 설포트랜스퍼라제에 의해 형성된 탈설페이트화된 방향족 화합물로 전달할 수 있다. 특수한 이론에 제한되지 않고, ASST를 활용하는 것은 또한 HS 또는 헤파로산-계 다당류에 대한 후속적인 설포전달 반응을 위한 설포 그룹 공여기를 또한 재생시키면서, 탈설페이트화된 방향족 화합물에 의한 잠재적인 생성물 억제를 감소시킬 수 있다.
다른 구현예에서, 및 또한 특수한 이론에 제한되지 않고, 가공된 설포트랜스퍼라제-촉매된 반응을 ASST와 커플링시키는 것은 비-설페이트화된 방향족 화합물로부터 아릴 설페이트 설포 공여기를 직접 생성시키는 추가의 장점을 제공할 수 있다. 가공된 설포트랜스퍼라제에 의해 촉매된 특수한 반응에 대한 반응 혼합물을 제형화하여 가공된 설포트랜스퍼라제를 반응 혼합물에 첨가하기 전 또는 이와 동시에 비-설페이트화된 방향족 화합물을 ASST 및 제2의 아릴 설페이트 화합물과 조합시킬 수 있다. 비-제한적인 예에서, 및 다른 구현예에서, 가공된 설포트랜스퍼라제 효소에 의해 촉매된 설포전달 반응은 비-설페이트화된 방향족 화합물, 아릴 설페이트 화합물, 및 ASST를 가공된 설포트랜스퍼라제 및 다당류 설포 그룹 수용기와 동일한 동일한 반응 혼합물 속에서 조합함으로써 개시할 수 있다. ASST, 아릴 설페이트 화합물, 및 비-설페이트화된 방향족 화합물 사이의 반응은 설포 공여기 아릴 설페이트 화합물을 생성할 수 있으며, 이는 이후 가공된 설포트랜스퍼라제 효소와 반응하여 설페이트 그룹을 다당류에 전달할 수 있다. 다른 구현예에서, ASST 효소와의 반응에 의해 생산된 아릴 설페이트 화합물은 ASST 자체와 반응하는 아릴 설페이트 화합물보다 상이한 화합물이다. 비-제한적인 예에서, 비-설페이트화된 방향족 화합물은 NCS이고, ASST와 반응하는 아릴 설페이트 화합물은 PNS이다. NCS는 PNS와 ASST 사이의 반응에 의해 형성되므로, 설포 그룹은 이후 가공된 설포트랜스퍼라제를 사용하여 NCS로부터 다당류로 전달시킬 수 있다.
N,2,3,6-HS 생성물의 후-합성 공정(Post-Synthesis Processing)
상술한 바와 같이, 항응고제로서 의학적 셋팅에서 처방된 UF-HS 생성물은 일반적으로 분자량 및 활성 요건의 엄격하게 조절된 세트에 부착하지만, LMW-HS 생성물은 전형적으로 8,000 Da 미만의 평균 분자량을 가지고, 여기서 샘플 속의 다당류 분자 모두의 60% 이상은 8,000 Da 미만의 실제 분자량을 갖는다(참조: Linhardt, R.J. and Gunay, N.S., 상기됨). 또한, 항응고제로서 처방된 LMW-HS 생성물은 자체적으로 분자량 및 활성 요건의 이들 고유의 조절된 세트를 가지며, 일반적으로 항응고제 UF-HS 약제학적 조성물로부터 제조된다. 따라서, 및 다른 구현예에서, 상술한 임의의 방법에 의해 생산된 N,2,3,6-HS 생성물을 활용하여 당해 분야에 잘 공지된 수단을 사용하여 LMW-HS 생성물을 생산할 수 있다. 다른 구현예에서, 상술한 임의의 방법에 의해 생산되고 LMW-HS 생성물의 합성에 활용된 N,2,3,6-HS 생성물은 항응고제 활성을 갖는다. 다른 구현예에서, 상술된 임의의 방법에 의해 생산되고 LMW-HS 생성물의 합성에 활용된 N,2,3,6-HS 생성물은 약제학적 UF-HS와 동일한 분자량 및/또는 항응고제 활성 특성을 갖는다. 다른 구현예에서, 상술된 임의의 방법에 의해 생산된 N,2,3,6-HS 생성물로부터 합성된 LMW-HS 생성물은 또한 항응고제 활성을 갖는다. N,2,3,6-HS 생성물로부터 LMW-HS 조성물을 합성하기 위한 비-제한적인 예시적인 방법은 하기에 추가로 상세히 기술되어 있다.
하나의 비-제한적 예에서, 및 다른 구현예에서, 저 분자량, 특히 15,000 Da 미만, 14,000 Da, 13,000 Da, 12,000 Da, 11,000 Da, 10,000 Da, 9,000 Da, 8,000 Da, 7,000 Da, 6,000 Da, 5,000 Da, 4,000 Da, 또는 3,000 Da 미만, 2,000 Da 미만까지의 분자량을 갖는 N,2,3,6-HS 생성물 혼합물 내 N,2,3,6-HS 다당류는 동일한 혼합물 내에서 다른 N,2,3,6-HS 다당류로부터 분리할 수 있다. 다른 구현예에서, N,2,3,6-HS 생성물 혼합물 내 N,2,3,6-HS 다당류는 겔 전기영동을 사용하여 전기영동 이동도(electrophoretic mobility)로 분리할 수 있다. 다른 구현예에서, N,2,3,6-HS 생성물 혼합물 내 N,2,3,6-HS 다당류는 크기 배제 크로마토그래피로 분리할 수 있다. 다른 구현예에서, N,2,3,6-HS 생성물 혼합물 내 N,2,3,6-HS 다당류는 2가의 양이온 및 약한 양이온의 염, 예를 들면, 그러나 이에 한정되지 않는 바륨, 칼슘, 마그네슘, 스트론튬, 구리, 니켈, 카드늄, 아연, 수은, 베릴륨, 팔라듐, 백금, 철, 및 주석 염으로 침전시켜 분리할 수 있다. 다른 구현예에서, 다당류는 보다 큰 분자량 다당류로부터 대량으로, 비-제한적인 예로서, 15,000 Da 하에 모든 이러한 N,2,3,6-HS 다당류를 15,000 Da 초과의 다당류로부터 분리함으로써 분리할 수 있다. 다른 구현예에서, 다당류는 하나 이상의 분획으로, 예를 들면, 10,000 Da 내지 15,000 Da, 5,000 Da 내지 10,000 Da으로, 및 다른 비-제한적인 예로서, 5,000 Da 이하의 모든 N,2,3,6-HS 다당류로 분리될 수 있다.
다른 구현예에서, 평균 분자량이 8,000 Da 미만인 N,2,3,6-HS 다당류 생성물 혼합물은 LMW-HS 생성물로서 직접 활용될 수 있다. 다른 구현예에서, 평균 분자량이 8,000 Da 미만인 N,2,3,6-HS 다당류 생성물 혼합물을 다른 글리코사미노글리칸(GAG)과 조합하여 HS-GAG 혼합물을 형성할 수 있다. 수개의 상기 방법, 특히 헤파로산 출발 물질을 이. 콜라이로부터 단리하고 정제하는 방법의 장점이 콘드로이틴 설페이트, 더마탄 설페이트, 및 다른 설페이트화된 GAG로부터 유리된 N,2,3,6-HS 생성물을 합성하는 능력을 포함하지만, 콘드로이틴 설페이트 및/또는 더마탄 설페이트를 포함하는 일부 고도로 정제된 HS-GAG 혼합물은, 심지어 이들이 UF-HS로서 많은 항응고제 활성을 지니지 않는 경우에도, UF-HS에 대해 유리한 약리학적 특성을 가질 수 있으므로, 이는 과거에 환자에게 성공적으로 처방되었다. 의학적으로 처방된 HS-GAG 혼합물의 비-제한적 예는 설로덱사이드(CAS No: 57821-29-1) 및 다나파로이드(CAS No: 308068-55-5)를 포함한다. 다른 구현예에서, 본 발명의 임의의 방법에 의해 합성된 항응고제 N,2,3,6-HS 생성물과 하나 이상의 GAG 사이에 형성된 HS-GAG 혼합물은 항응고제 활성을 가질 수 있다.
역사적으로, 설로덱사이드는 돼지 창자 점막으로부터 추출되었지만(참조: 미국 특허 No. 3,936,351, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다), 설로덱사이드는 또한 더마탄 설페이트(CAS No: 24967-94-0)를, 염 침전, 특히, 바륨 염을 사용하여 UF-HS로부터 분리될 수 있는 "신속하게 이동하는(fast-moving)" HS 분획과 조합함으로써 제조할 수 있다(참조: Volpi, N., (1993) Carbohydr. Res. 247:263-278). 신속하게 이동하는 HS 분획(FM-HS)은, UF-HS의 염 침전시 또한 형성되며, 비-제한적인 예로서, 초원심분리를 사용하여, SM-HS로부터 정제될 수 있는 "보다 무거운, 느리게 이동하는(slow-moving)" HS(SM-HS)에 대한 이의 전기영동 이동도를 기반으로 "신속하게 이동"하는 것으로 여겨진다. 추가로, FM-HS 분획은 UF-HS에 대해 감소된 항응고제 활성 및 전반적인 설페이트화, 및 고 공명 크기 배제 크로마토그래피에 의해 측정된 것으로서, 약 8,000의 상대적인 분자량,
Figure pct00060
을 갖는다(참조: 상기된 Volpi, N.). 그러나, FM-HS 분획 자체의 평균 분자량은 약 7,000 Da이다(참조: Coccheri, S. and Mannello, F., (2014) Drug Design, Development, and Therapy 8:49-65).
또한, UF-HS로부터 분리된 FM-HS 분획은 일반적으로 다른 LMW-HS 조성물에 대해 유사한 화학적 특성, 예를 들면, UF-HS에 대해 보다 긴 반감기 및 증가된 경구 생체이용률(bioavailability)을 갖는다. 다른 한편, 더마탄 설페이트는 일반적으로 항응고제 활성이 최소이거나 없고, 평균 분자량이 25 kDa이지만, 동맥 및 정맥 혈전증을 억제하며, 혈관 벽 및 염증에 대한 보호 뿐만 아니라 가속화된 상처 치유를 제공하는 것으로 밝혀졌다. 조합된, 및 또한 특수한 이론에 제한되지 않고, FM-HS 및 설로덱사이드 내 더마탄 설페이트의 조합은 조합의, 및 잠재적으로 상승작용성 양식을 부여할 수 있다(참조: Coccheri, S. and Mannello, F., 상기됨)
따라서, 다른 구현예에서, FM-HS 분획은 가공된 아릴 설페이트-의존성 설포트랜스퍼라제 효소를 사용하여, 본 발명의 임의의 방법에 의해 합성된 항응고제 N,2,3,6-HS 생성물로부터 제조된다. 다른 구현예에서, 가공된 설포트랜스퍼라제 효소를 사용하여 제조된 N,2,3,6-HS 생성물은 상기 볼피(Volpi)에 의해 기술된 유사한 과정을 사용하여, 2가-양이온 염, 특히 바륨 또는 칼슘 염으로 침전시킬 수 있다. 다른 구현예에서, N,2,3,6-HS 생성물은 HF-HS에 대해 실질적으로 등가이다. FM-HS를 형성하고 이어서 정제하기 위한 UF-HS의 염 침전을 실행하는 방법이 또한 미국 특허 No. 7,687,479 및 8,609,632에 기술되어 있으며, 이들 문헌에 개시된 내용은 본 문서에 참조로서 통합된다. 다른 구현예에서, 수득되는 FM-HS 분획이 정제되면, 이는 더마탄 설페이트와 조합되어 HS-GAG 혼합물을 형성할 수 있다. 다른 구현예에서, 본 발명의 임의의 방법을 사용하여 FM-HS를 직접적으로 합성할 수 있으며, 이는 이후 더마탄 설페이트와 조합되어 HS-GAG 혼합물을 형성할 수 있다. 다른 구현예에서, 어느 하나의 방법에 의해 제조된 HS-GAG 혼합물, 예를 들면, 그러나 이에 한정되지 않는 80%의 FM-HS 분획 및 20%의 더마탄 설페이트을 포함하고(참조: Lauver, D.A. Lucchesi, B.R., Cardio. Drug Rev. 24 (3-4):214-216), 평균 분자량이 7,000 Da이고,
Figure pct00061
이 약 8,000이고/이거나 설페이트 대 카복실 그룹 비가 2.0:1 내지 2.2:1인 조성물은 설로덱사이드와 동일한 하나 이상의 특성을 포함할 수 있다.
설로덱사이드와는 대조적으로, HS-GAG 혼합물, 다나파로이드는 UF-HS보다는 돼지 공급원으로부터 단리된 천연의 HS로부터 역사적으로 제조되었다(참조: 미국 특허 No. 5,164,377, 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다; 참조: "Danaparoid Sodium" (2010) European Pharmacopoeia 7.0, 1789-1792). UF-HS와는 대치되는, HS 다당류는 일반적으로, 설페이트화되지 않거나 N-, 2-O, 및/또는 6-O 설페이트화된 이당류 단위를 함유한다. 그러나, 특수한 이론에 제한되지 않고, 3-O 설페이트화된 글루코사민 잔기를 포함하는 이당류 단위는 HS 내에서는 드믈며, UF-HS에 대해 현저하게 감소된 항응고제 활성을 야기하는 것으로 여겨진다. 따라서, 다나파로이드는 또한 UF-HS에 대해 감소된 활성을 가지고, 일반적으로 11-20 IU mg-1의 항-Xa 활성, 1 IU mg-1 미만의 항-IIa 활성, 및 22:1 이상의 항-Xa 활성 대 항-IIa 활성의 비를 갖는다.
추가로, 미국 특허 제5,164,377호에 따라서 다나파로이드를 정제시, 수득되는 생성물은 HS 만을 함유하지 않지만, 또한 콘드로이틴 설페이트 및 더마탄 설페이트를 함유하며, 이는 염기를 헤파로산과 반응시켜 분자량을 감소시키는 효과와 유사한, 추출 공정 동안에 염기의 첨가의 결과로서 감소된 분자량을 갖는다. 유럽 약전(European Pharmacopoeia)에 따라서, 환자에게 처방되기에 적합한 다나파로이드 HS-GAG 조성물 내 GAG 모두의 중량-평균 분자량(
Figure pct00062
)은 적어도 4,000 Da, 7,000 Da 이하의 범위이며, 다음의 크기 분포 한계를 포함한다: (a) 2,000 미만의
Figure pct00063
을 포함하는 다당류 쇄는 최대 13%(w/w)의 다나파로이드 혼합물을 포함하고; (b) 4,000 미만의
Figure pct00064
을 포함하는 다당류 쇄는 최대 39%(w/w)의 다나파로이드 혼합물을 포함하고; (c) 4,000 내지 8,000의
Figure pct00065
을 포함하는 다당류 쇄는 최소 50%(w/w)의 다나파로이드 혼합물을 포함하고; (d) 8,000 초과의
Figure pct00066
을 포함하는 다당류 쇄는 최대 19%(w/w)의 다나파로이드 혼합물을 포함하고; (e) 10,000 미만의
Figure pct00067
을 포함하는 다당류 쇄는 최대 11%(w/w)의 다나파로이드 혼합물을 포함한다. 유럽 약전에 의해 측정된 다나파로이드에 대한 특수한 조성물 한계와 관련하여, 콘드로이틴 설페이트는 최대 8.5%(w/w)의 다나파로이드 혼합물을 포함할 수 있고, 더마탄 설페이트는 적어도 8.0%(w/w) 내지 16.0%(w/w)의 범위의 다나파로이드 혼합물을 포함할 수 있다. 비-제한적인 예로서, 다나파로이드 조성물 Orgaran®는 약 84%(w/w)의 HS, 약 12%(w/w)의 더마탄 설페이트, 및 약 4%의 콘드로이틴 설페이트를 포함한다.
다른 구현예에서, 다나파로이드(CAS 번호: 308068-55-5)와 유사한 특성을 갖는 가공된 아릴 설페이트-의존성 설포트랜스퍼라제 효소, 더마탄 설페이트, 및 콘드로이틴 설페이트를 사용하여 본 발명의 임의의 방법에 의해 생산된 HS 생성물을 포함하는 HS-GAG 혼합물이 형성될 수 있다. 다른 구현예에서, HS 생성물은 N,2,6-HS 생성물이다. 다른 구현예에서, HS 생성물은 N,2,3,6-HS 생성물이다. 다른 구현예에서, 반응물로부터 직접 합성된 HS 생성물은
Figure pct00068
가 적어도 4,000 Da, 및 8,000 Da 이하의 범위, 바람직하게는 적어도 4,000 Da, 및 7,000 Da 이하의 범위이다. 다른 구현예에서, HS 생성물은 8,000 Da 초과의
Figure pct00069
를 갖고, 헤파로산을 해중합시켜 이의 분자량을 감소시키기 위한 상술된 방법과 유사하게, 이를 염기와 후속적으로 반응시킴으로써 다나파로이드-유사 HS-GAG 혼합물 내포 포함시키기 위해 제조된다. 다른 구현예에서, 콘드로이틴 설페이트 및 더마탄 설페이트를 염기와 반응시켜 이의 분자량을 감소시킨다. 다른 구현예에서, 본 발명의 임의의 방법으로 생산된 HS 생성물, 콘드로이틴 설페이트, 및 더마탄 설페이트을 포함하는 조성물은 여과 장치를 사용하여 여과할 수 있다. 이러한 여과 장치는 원심분리 여과기 장치(centrifugal filter unit), 예를 들면, Amicon® Ultra unit(EMD Millipore), 또는 디스플레이 막을 포함하고, 이들 중 어느 것도 목적한 분자량 컷-오프(molecular weight cut-off)(MWCO)를 갖는다. 다른 구현예에서, 원심분리 여과기 장치 또는 투석 막을 위한 MWCO는 5,500 Da이다. 다른 구현예에서, 다나파로이드 HS-GAG 혼합물 내 모든 GAG에 대한
Figure pct00070
는 적어도 4,000 Da, 및 8,000 Da 이하의 범위, 바람직하게는 적어도 4,000 Da, 및 7,000 Da 이하의 범위, 및 보다 바람직하게는 적어도 5,000 Da, 및 6,000 Da 이하의 범위이다. 다른 구현예에서, 다나파로이드 HS-GAG 혼합물 내 GAG는 다음의 크기 분포 한계를 포함한다: (a)
Figure pct00071
가 2,000 미만인 다당류 쇄는 최대 13%(w/w)의 다나파로이드 HS-GAG 혼합물을 포함하고; (b)
Figure pct00072
가 4,000 미만인 다당류 쇄는 최대 39%(w/w)의 다나파로이드 HS-GAG 혼합물을 포함하고; (c)
Figure pct00073
가 4,000 내지 8,000의 범위인 다당류 쇄는 최소 50%(w/w)의 다나파로이드 HS-GAG 혼합물을 포함하고; (d) 
Figure pct00074
가 8,000 초과인 다당류 쇄는 최대 19%(w/w)의 다나파로이드 HS-GAG 혼합물을 포함하고; (e) 
Figure pct00075
가 10,000 미만인 다당류 쇄는 최대 11%(w/w)의 다나파로이드 HS-GAG 혼합물을 포함한다.
다른 구현예에서, 다나파로이드 HS-GAG 혼합물은 다나파로이드(CAS No: 308068-55-5)와 유사하거나 동일한 GAG 조성물을 포함할 수 있다. 다른 구현예에서, 다나파로이드 HS-GAG 혼합물 내 GAG의 조성물은 적어도 8%(w/w), 16%(w/w) 이하, 및 바람직하게는 12%(w/w)의 더마탄 설페이트, 및 8%(w/w) 미만, 바람직하게는 3%(w/w) 이상 5%(w/w) 이하의 범위, 더 바람직하게는 4%(w/w)의 콘드로이틴 설페이트를 포함한다.
다른 구현예에서, 다나파로이드 HS-GAG 혼합물은 다나파로이드와 유사하거나 동일한 항응고제 활성을 포함할 수 있다. 다른 구현예에서, 다나파로이드 HS-GAG 혼합물은 11-20 IU mg-1의 항-Xa 활성, 1 IU mg-1 미만의 항-IIa 활성 및/또는 22:1 이상의 항-Xa 활성 대 항-IIa 활성의 비를 포함한다.
다른 구현예에서, HS 생성물, 특히 본 발명의 임의의 방법에 따라 합성된 항응고제 N,2,3,6-HS 생성물을 조합하여 HS-GAG 혼합물을 형성하는 것 외에, HS 생성물은 하나 이상의 후속적인 공정에 의해 대신 추가로 개질시켜 HS 생성물을 해중합 및/또는 개질시킴으로써 상술한 바와 같은 LMW-HS 생성물을 형성할 수 있다. 일반적으로, 및 다른 구현예에서, 항응고제 N,2,3,6-HS 생성물로부터 LMW-HS를 형성시키는 공정은 다음의 단계를 포함한다: (a) N,2,3,6-HS 생성물을 임의의 상기 방법에 따라 합성하는 단계; (b) 하나 이상의 해중합제를 제공하는 단계; 및 (c) N,2,3,6-HS 생성물을 하나 이상의 해중합제와 N,2,3,6-HS 생성물의 적어도 일부를 해중합시킴으로써, LMW-HS 생성물을 형성하기에 충분한 시간 동안 처리하는 단계. 특수한 이론에 제한되지 않고, 해중합제에서의 선택은 LMW-HS 생성물을 형성하기 위한 화학적 메카니즘 뿐만 아니라, 생성물(들) 구조, 항응고제 활성, 및 약리학적 특성을 형성하기 위한 화학적 메카니즘을 결정할 수 있는 것으로 여겨진다. 약제학적 항응고제 UF-HS로부터 LMW-HS 생성물을 형성하기 위한 공지된 화학적 메카니즘은 이의 조합을 포함하는, 화학적 및/또는 효소적 β-제거 반응; 탈아민화 반응; 및 산화 반응을 포함하나, 이에 한정되지 않는다.
다른 구현예에서, 본 발명의 임의의 방법에 따라 합성된, N,2,3,6-HS 생성물은 효소적 β-제거 반응으로 개질시켜 효소적으로-해중합된 LMW-HS 생성물을 형성시킬 수 있다. 역사적으로, 효소적으로-해중합된 LMW-HS 생성물은 약제학적 UF-HS를 하나 이상의 탄소-산소 리아제 효소와, LMW-HS 생성물이 목적한 화학 구조, 평균 분자량, 항응고제 활성, 및 설페이트화 정도를 포함할 때까지 항온처리함으로써 제조하였다(참조: "Tinzaparin Sodium" (2010) European Pharmacopoeia 7.0, 3098; Linhardt, R.J. and Gunay, N.S., 상기됨). 하나 이상의 탄소-산소 리아제와의 반응의 결과로서, UF-HS 내에서 다당류는 하기 화학식 XI로 나타낸 특징적인 화학 구조를 해중합 및 발달시킨다.
[화학식 XI]
Figure pct00076
화학식 XI에 나타낸 바와 같이, n은 1 내지 25로부터의 임의의 정수일 수 있다. 글루쿠론산 또는 우론산 잔기 대신에, 생성물 내 대부분의 효소적으로-해중합된 LMW-HS 다당류의 비-환원 말단에서 당 잔기는 2-O-설포-4-에네피라노설폰산이다. 추가로, 환원 말단에서 각각의 글루코사민 잔기는 N- 및 6-O 위치에서 설페이트화된다. 임의로, 하나 이상의 이당류 단위 내 글루코사민 잔기의 3-O 위치는 또한 3-O 설페이트화될 수 있다. 특수한 이론에 제한되지 않고, 효소적으로-해중합된 LMW-HS 생성물 내 다당류 중 적어도 일부는 3-O 설페이트화된 글루코사민 잔기를 포함하고, 이는 궁극적으로 이의 항응고제 활성을 초래한다.
또한, 항응고제 UF-HS와 매우 유사하게, 항응고제로서 처방될 수 있는 항응고제 UF-HS로부터 유도된 효소적으로-해중합된 LMW-HS 생성물은 엄격한 순도 및 특성 표준을 만족시켜야만 한다. 특히, 하나의 이러한 효소적으로-해중합된 LMW-HS 생성물인, 틴자파린(CAS No: 9041-08-1; ATC code: B01AB10)은 화학식 XI의 화학 구조 외에, 특수한 분자량 세트, 항응고제 활성, 및 설페이트화 함량 특성을 갖는데, 예를 들면:
Figure pct00077
는 적어도 5,500 Da, 및7,500 Da 이하의 범위, 특징적으로 6,500 Da이고/이거나; 설페이트 그룹이 이당류 단위당 적어도 1.8개 및 2.5개 이하이고/이거나; 항-Xa 활성이 적어도 70 IU mg-1 및 120 IU mg-1 이하이고/이거나 항-Xa 활성 대 항-IIa 활성의 비가 적어도 1.5:1, 및 2.5:1 이하이다.
따라서, 다른 구현예에서, 상술된 본 발명의 임의의 방법에 따라 합성된 N,2,3,6-HS 생성물은 하나 이상의 탄소-산소 리아제에 의해 후속적으로 해중합되어 효소적으로-해중합된 LMW-HS 생성물을 형성한다. 다른 구현예에서, 효소적으로-해중합된 LMW-HS 생성물은 화학 구조, 분자량, 항응고제 활성, 및/또는 설페이트화 함량 특성을 포함하나, 이에 한정되지 않는, 틴자파린과 동일한 하나 이상의 특성을 포함한다. 다른 구현예에서, 효소적으로-해중합된 LMW-HS 생성물은 틴자파린과 실질적으로 동일하다.
다른 구현예에서, 효소적으로-해중합된 LMW-HS 생성물은 다음의 단계에 따라, 상술한 본 발명의 방법 중 어느 하나에 따라 합성된 N,2,3,6-HS 생성물로부터 형성될 수 있다: (a) 상기 방법 중 어느 하나에 따라 N,2,3,6-HS 생성물을 합성하는 단계; (b) 적어도 하나의 탄소-산소 리아제를 포함하는 반응 혼합물을 제공하는 단계; 및 (c) N,2,3,6-HS 생성물을 탄소-산소 리아제 반응 혼합물로 N,2,3,6-HS 생성물 중 적어도 일부를 해중합시켜 효소적으로-해중합된 LMW-HS 생성물을 형성하기에 충분한 시간 동안 처리하는 단계. 다른 구현예에서, 효소적으로-해중합된 LMW-HS 생성물은 화학식 XI의 구조를 포함한다. 다른 구현예에서, N,2,3,6-HS 생성물은 분획화되지 않은 N,2,3,6-HS 생성물이다.
다른 구현예에서, 적어도 하나의 탄소-산소 리아제는, 효소가 HS 다당류의 β-제거적 절단을 촉매하는 한, 임의의 종으로부터의 탄소-산소 리아제일 수 있다. 다른 구현예에서, 적어도 하나의 탄소-산소 리아제는 서열 번호: 30, 서열 번호: 31, 및 서열 번호: 32의 아미노산 서열을 포함하는 박테로이데스 에게르티이(Bacteroides eggerthii)로부터의 탄소-산소 리아제로 이루어진 그룹으로부터 선택될 수 있다. 다른 구현예에서, 적어도 하나의 탄소-산소 리아제는 서열 번호: 30, 서열 번호: 31, 및 서열 번호: 32의 아미노산 서열을 갖는 효소 중 1, 2, 또는 모든 3개를 포함할 수 있다.
다른 구현예에서, 효소적으로-해중합된 LMW-HS 생성물을 형성하기에 충분한 시간은 생성물이 목적한 평균 분자량을 갖도록 하기에 충분한 시간이다. 다른 구현예에서, 효소적으로-해중합된 LMW-HS 생성물의
Figure pct00078
는 2,000 Da 내지 10,000 Da의 범위, 바람직하게는 5,500 Da 내지 7,500 Da, 더 바람직하게는 6,500 Da일 수 있다. 다른 구현예에서, 효소적으로-해중합된 LMW-HS 생성물은 항응고제 활성을 가질 수 있다. 다른 구현예에서, 효소적으로-해중합된 LMW-HS 생성물은 적어도 70 IU mg-1 및 120 IU mg-1 이하의 항-Xa 활성 및/또는 적어도 1.5:1, 및 2.5:1 이하의 항-Xa 활성 대 항-IIa 활성의 비를 가질 수 있다.
다른 구현예에서, 본 발명의 임의의 방법에 따라 합성된, N,2,3,6-HS 생성물은 화학적 β-제거 반응으로 개질시켜 화학적으로 β-제거성의, LMW-HS 생성물을 형성할 수 있다. 역사적으로, 화학적으로 β-제거성의 LMW-HS 생성물은 약제학적 UF-HS 또는 이의 4급 암모늄 염을 염기로 처리함으로써 제조하였다. 이러한 조건 하에서, 화학적 β-제거가 일어나서 화학식 XI의 구조를 포함하는 효소적으로-해중합된 LMW-HS 다당류에서 관찰된 특징인, 비-환원 말단에 4,5-불포화된 우론산 잔기를 함유하는 화학적으로 β-제거성의 LMW-HS 생성물을 형성한다(참조: 상기된 Linhardt, R.J. 및 Gunay, N.S.). 반응 조건의 조절은 임상 용도로 승인되었거나 하기에 보다 상세히 기술된 임상 시도 동안 투여된 화학적으로 β-제거성의 LMW-HS 조성물의 생산을 이끈다.
제1의 비-제한적인 예에서, 임상 용도로 처방된 화학적으로 β-제거성의 LMW-HS 조성물은 베미파린(CAS No: 91449-79-5; ATC code: B01AB12)이다(참조: 예컨대 Chapman, T.M. and Goa, K.L., (2003) Drugs 63 (21):2357-2377; Sanchez-Ferrer, C.F. (2010) Drugs 70 Suppl. 2:19-23; Ciccone, M.M., et al., (2014) Vascular Pharmacology 62:32-37). 베미파린은 약제학적 UF-HS의 알칼린 해중합에 의해, 특히 약제학적 UF-HS의 벤제토늄 염을 4급 수산화암모늄, 예를 들면, Triton® B(벤질 트리메틸수산화암모늄)로 메탄올의 존재하에 처리함으로써 제조한다(참조: 미국 특허 No. 4,981,955 및 유럽 특허 EP 0293539, 이들 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 후속적인 정제 및 침전 시, 화학식 XI의 구조를 포함하는 수득되는 베미파린 조성물은 적어도 3,000 Da, 및 4,200 Da 이하의 범위, 전형적으로 3,600 Da의
Figure pct00079
및 다음이 되도록 하는 크기 분포를 갖는다: 다당류 쇄의 35% 미만은
Figure pct00080
가 2,000 미만이고; 다당류 쇄의 적어도 50% 및 75% 이하의 범위는
Figure pct00081
가 적어도 2,000 및 6,000 이하의 범위이고; 다당류 쇄의 15% 미만은
Figure pct00082
가 6,000 초과이다. 추가로, 베미파린 조성물은 적어도 80 IU mg-1 및 120 IU mg-1 이하의 항-Xa 활성, 적어도 5 IU mg-1 및 20 IU mg-1 이하의 항-IIa 활성, 및/또는 적어도 8.0:1, 및 10:1 이하의 항-Xa 활성 대 항-IIa 활성을 갖는다(참조: 상기된 Sanchez-Ferrer, C.F.).
다른 비-제한적 예에서, 임상 시험 동안 환자에게 투여된 화학적으로 β-제거성의 LMW-HS 조성물은 세물로파린(CAS 번호: 9041-08-1)이다. 세물로파린은 약제학적 UF-HS 벤제토늄 염의 벤질 에스테르를 강한 포스파젠 염기, BEMP(2-3급-부틸이미노-2-디에틸아미노-1,3-디메틸퍼하이드로-1,2,3-디아자-포스포린)과 반응시키고, 벤질 에스테르를 후속적으로 비누화하고 정제함으로써 제조된다(참조: Viskov, C., et al., (2009) J. Thromb. Haemost. 7:1143-1551). 포스파젠 염기는 가장 강력한 것으로 공지된 유기 염기 중 하나이며, 고도로-입체적으로 장애되어 있고 비-친핵성이다. 그 결과, 포스파젠 염기는 β-제거를 위해 UF-HS의 적어도 입체적으로 장애된 영역을 표적화하고, 3-O 설페이트화된 글루코사민 잔기를 포함하는 AT-인식 서열을 피한다. 화학식 XI의 구조를 갖는 수득되는 세물로파린 생성물은
Figure pct00083
가 적어도 2,000 Da, 및 3,000 Da 이하의 범위, 전형적으로 2,400 Da이고, 세물로파린 생성물의 항응고제 활성은 약 160 IU mg-1의 항-Xa 활성, 약 2 IU mg-1의 항-IIa 활성, 및 약 80:1의 항-Xa 활성 대 항-IIa 활성의 비를 포함한다(참조: 상기된 Viskov, C.).
다른 비-제한적 예에서, 임상용으로 처방된 화학적으로 β-제거성의 LMW-HS 조성물은 에녹사파린(CAS No: 679809-58-6; ATC code: B01AB05)이다(참조: 예컨대 Linhardt, R.J. 및 Gunay, N.S., 상기됨). 에녹사파린은 염기와 반응하기 전에, 약제학적 UF-HS의 벤질 에스테르 형태가 제조된다는 점에서 세물로파린과 유사하게 제조된다. 벤질 에스테르는 염소화된 유기 용매, 예를 들면, 클로로포름 또는 메틸렌 클로라이드 속에서, 염소 유도체, 예를 들면, 벤질 클로라이드의 존재하에서 형성되며, 이는 약제학적 UF-HS의 수득되는 벤질 에스테르에서 에스테르화의 양을 조절한다(약 9 내지 14% 효능). 벤질 에스테르가 형성되면, 이를 강력하고, 비-입체적으로 장애된 염기, 예를 들면, 수산화나트륨으로, 고온에서 후속적으로 처리한다(참조: 미국 특허 No. 5,389,618 및 미국 리이슈 특허 RE38,743, 이들 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 그러나, 에녹사파린 내 일부(약 15% 내지 25%) 다당류는 비-환원 말단에서 특징적인 4,5-불포화된 우론산 외에, 환원 말단에서 말단 1,6-안하이드로 당 잔기(1,6-안하이드로만노스 또는 1,6-안하이드로글루코사민)를 추가로 포함할 수 있다(참조: Guerrini, M., (2010) J. Med. Chem. 53:8030-8040). 그 결과, 에녹사파린은 화학식 XI의 구조를 포함하는 다당류 외에, 화학식 XII에 나타낸 특징적인 구조를 갖는 다당류를 전형적으로 포함한다.
[화학식 XII]
Figure pct00084
화학식 XII에 나타낸 바와 같이, n은 1 내지 21의 임의의 정수일 수 있다. 에녹사파린 다당류의 비-환원 말단에서 글루쿠론산 또는 우론산 잔기, 당 잔기는 2-O-설포-4-에네피라노설폰산이다. 추가로, 환원 말단에서 각각의 글루코사민 잔기는 1,6-안하이드로 모이어티를 포함하고, C2 탄소 주변의 입체화학은, 잔기가 1,6-안하이드로만노스 또는 1,6-안하이드로글루코사민 잔기인지의 여부를 결정한다. 임의로, 하나 이상의 이당류 단위 내 글루코사민 잔기의 3-O 위치는 또한 3-O 설페이트화될 수 있다. 특수한 이론에 제한되지 않고, 에녹사파린 내 다당류 중 적어도 일부는 궁극적으로 이의 항응고제 활성을 초래하는 3-O 설페이트화된 글루코사민 잔기를 포함한다.
일반적으로 처방된 LMW-HS 약물로서, 환자에게 투여된 에녹사파린의 조성물은 유럽 약전 및 USP 둘 다에 의해 확립된 일련의 엄격한 크기, 활성, 및 순도 요건을 만족시켜야만 한다(참조: "Enoxaparin Sodium" (2010) European Pharmacopoeia 7.0, 1920-1921). 화학식 XII의 구조를 포함하는 것 외에, 요건을 만족시키기 위하여 존재하여야만 하는 특성은 다음을 포함한다: 적어도 3,800 Da, 및 5,000 Da 이하의 범위, 및 특징적으로 4,500 Da의
Figure pct00085
; 이당류 단위 당 1.8개 이상의 설페이트 그룹; 및 적어도 90 IU mg-1 및 125 IU mg-1 이하의 항-Xa 활성, 적어도 20 IU mg-1 및 35 IU mg-1 이하의 항-IIa 활성 및/또는 적어도 3.3:1, 및 5.3:1 이하의 항-Xa 활성 대 항-IIa 활성의 비. 또한, 환자에게 투여하기에 적합한 에녹사파린 조성물은 다음과 같이 되도록 하는 크기 분포를 포함한다: 다당류 쇄의 적어도 12.0%, 20.0% 이하의 퍼센트, 및 특징적으로 약 16%는
Figure pct00086
이 2,000 미만; 적어도 68.0%, 82.0% 이하의 범위, 및 특징적으로 약 74%이고, 다당류 쇄의 적어도 12.0%, 20.0% 이하의 퍼센트, 및 특징적으로 약 16%는
Figure pct00087
이 적어도 2,000 및 8,000 이하의 범위이고; 다당류 쇄의 18.0% 이하는
Figure pct00088
이 8,000 초과이다.
따라서, 다른 구현예에서, 상술된 본 발명의 임의의 방법에 따라 합성된 N,2,3,6-HS 생성물은 하나 이상의 염기로 후속적으로 해중합시켜 화학적으로 β-제거성의 LMW-HS 생성물을 형성할 수 있다. 다른 구현예에서, 화학적으로 β-제거성의 LMW-HS 생성물은 베미파린과 동일한 하나 이상의 특성, 예를 들면, 그러나 이에 한정되지 않는 화학 구조, 분자량, 항응고제 활성, 및/또는 설페이트화 함량 특성을 갖는다. 다른 구현예에서, 화학적으로 β-제거성의 LMW-HS 생성물은 베미파린과 실질적으로 동일하다. 다른 구현예에서, 화학적으로 β-제거성의 LMW-HS 생성물은 세물로파린과 동일한 하나 이상의 특성, 예를 들면, 그러나 이에 한정되지 않는 화학 구조, 분자량, 항응고제 활성, 및/또는 설페이트화 함량 특성을 포함한다. 다른 구현예에서, 화학적으로 β-제거성의 LMW-HS 생성물은 세물로파린과 실질적으로 동일하다. 다른 구현예에서, 화학적으로 β-제거성의 LMW-HS 생성물은 에녹사파린과 동일한 하나 이상의 특성, 예를 들면, 그러나 이에 한정되지 않는 화학 구조, 분자량, 항응고제 활성, 및/또는 설페이트화 함량 특성을 포함한다. 다른 구현예에서, 화학적으로 β-제거성의 LMW-HS 생성물은 에녹사파린과 실질적으로 동일하다.
다른 구현예에서, 화학적으로 β-제거성의 LMW-HS 생성물은 상술한 본 발명의 임의의 방법에 따라서 합성된 N,2,3,6-HS 생성물로부터, 다음 단계에 따라서 형성될 수 있다: (a) 임의의 상기 방법에 따라 N,2,3,6-HS 생성물을 합성하는 단계; (b) 염기를 포함하는 반응 혼합물을 제공하는 단계; 및 (c) N,2,3,6-HS 생성물을 염기를 포함하는 반응 혼합물로, N,2,3,6-HS 생성물의 적어도 일부를 해중합하기에 충분한 시간 동안 처리함으로써, 화학적으로 β-제거성의 LMW-HS 생성물을 형성시키는 단계. 다른 구현예에서, 화학적으로 β-제거성의 LMW-HS 생성물은 화학식 XI의 구조를 포함한다. 다른 구현예에서, N,2,3,6-HS 생성물은 분획화되지 않은 N,2,3,6-HS 생성물이다.
다른 구현예에서, 염기는 Triton® B이고, N,2,3,6-HS 생성물을 Triton® B를 포함하는 반응 혼합물로 처리하는 단계는 다음의 소-단계를 추가로 포함한다: (i) 분획화되지 않은 N,2,3,6-HS 생성물을 벤제토늄 염, 바람직하게는 벤제토늄 클로라이드와 반응시켜, 벤제토늄 HS 염을 형성시키는 단계; 및 (ii) 벤제토늄 HS 염을 Triton® B 및 메탄올을 포함하는 반응 혼합물로 처리하여, 화학적으로 β-제거성의 LMW-HS 생성물을 형성시키는 단계. 다른 구현예에서, 벤제토늄 HS 염으로부터 화학적으로 β-제거성의 LMW-HS 생성물을 제조하는 소-단계는 미국 특허 제4,981,955호에서 임의의 실시예, 바람직하게는 실시예 3에 보고된 과정을 포함한다. 다른 구현예에서, 벤제토늄 HS 염을 해중합시키기에 충분한 시간은
Figure pct00089
가 적어도 3,000 Da, 4,200 Da 이하의 범위, 바람직하게는 3,000 Da이고, 다음과 같이 되도록 하는 크기 분포를 갖는 화학적으로 β-제거성의 LMW-HS 생성물을 형성시키기에 충분한 시간이다: 다당류 쇄의 35% 미만은
Figure pct00090
이 2,000 미만이고; 다당류 쇄의 적어도 50% 및 75% 이하의 범위는
Figure pct00091
이 적어도 2,000 및 6,000 이하의 범위이고; 다당류 쇄의 15% 미만은
Figure pct00092
이 6,000 초과이다. 다른 구현예에서, 화학적으로 β-제거성의 LMW-HS 생성물은 화학식 XI의 구조를 포함한다. 다른 구현예에서, 화학적으로 β-제거성의 LMW-HS 생성물은 적어도 80 IU mg-1 및 120 IU mg-1 이하의 항-Xa 활성, 적어도 5 IU mg-1 및 20 IU mg-1 이하의 항-IIa 활성 및/또는 적어도 8.0:1, 및 10:1 이하의 항-Xa 활성 대 항-IIa 활성의 비를 포함한다. 다른 구현예에서, 화학적으로 β-제거성의 LMW-HS 생성물은 베미파린고 실질적으로 등가이다.
다른 구현예에서, 염기는 BEMP이고, N,2,3,6-HS 생성물를 BEMP를 포함하는 반응 혼합물로 처리하는 단계는 다음의 단계를 추가로 포함한다: (i) 분획화되지 않은 N,2,3,6-HS 생성물을 벤제토늄 염, 바람직하게는 벤제토늄 클로라이드와 반응시켜, 벤제토늄 HS 염을 형성시키는 단계; (ii) 벤제토늄 HS 염을 벤질 클로라이드를 사용하여 에스테르화시켜 벤질 에스테르 HS를 형성시키는 단계; (iii) 벤질 에스테르 HS를 벤제토늄 염, 바람직하게는 벤제토늄 클로라이드로 트랜스염화시켜 벤제토늄 벤질 에스테르 HS를 형성시키는 단계; (iv) 벤제토늄 벤질 에스테르 HS를 BEMP로 해중합시켜 벤질 에스테르 화학적으로 β-제거성의 LMW-HS 생성물을 형성시키는 단계; 및 (v) 상기된 Viskov, C., et al에 보고된 바와 같이, 벤질 에스테르 화학적으로 β-제거성의 LMW-HS 생성물을 비누화하여 화학적으로 β-제거성의 LMW-HS 생성물을 형성시키는 단계. 다른 구현예에서, 벤제토늄 벤질 에스테르 HS를 BEMP로 해중합시키기에 충분한 시간은 벤질 에스테르 화학적으로 β-제거성의 LMW-HS 생성물을 형성시킴으로써, 벤질 에스테르의 비누화시, 수득되는 화학적으로 β-제거성의 LMW-HS 생성물이 적어도 2,000 Da, 3,000 Da 이하의 범위, 및 바람직하게는 약 2,400 Da의
Figure pct00093
를 갖도록 하기에 충분한 시간이다. 다른 구현예에서, 화학적으로 β-제거성의 LMW-HS 생성물은 화학식 XI의 구조를 포함한다. 다른 구현예에서, 화학적으로 β-제거성의 LMW-HS 생성물은 약 160 IU mg-1의 항-Xa 활성, 약 2 IU mg-1의 항-IIa 활성 및/또는 적어도 80:1, 및 100:1 이하의 항-Xa 활성 대 항-IIa 활성의 비를 포함한다. 다른 구현예에서, 화학적으로 β-제거성의 LMW-HS 생성물은 세물로파린과 실질적으로 등가이다.
다른 구현예에서, 염기는 수산화나트륨이고, N,2,3,6-HS 생성물을 수산화나트륨을 포함하는 반응 혼합물로 처리하는 단계는 다음의 소-단계를 추가로 포함한다: (i) 분획화되지 않은 N,2,3,6-HS 생성물을 벤제토늄 염, 바람직하게는 벤제토늄 클로라이드와 반응시켜, 벤제토늄 HS 염을 형성시키는 단계; (ii) 벤제토늄 HS 염을 벤질 클로라이드를 사용하여 염소화된 용매, 바람직하게는 메틸렌 클로라이드 또는 클로로포름의 존재하에서 에스테르화하여 벤질 에스테르 HS를 형성시키는 단계; 및 (iii) 벤질 에스테르 HS를 수산화나트륨을 포함하는 반응 혼합물과 조합하여 화학적으로 β-제거성의 LMW-HS 생성물을 형성시키는 단계. 다른 구현예에서, 벤질 에스테르 HS는 적어도 9%, 및 약 14% 이하의 에스테르화도를 갖는다. 다른 구현예에서, 벤질 에스테르 HS와 수산화나트륨 사이의 반응은 적어도 50℃ 및 70℃ 이하의 범위 내, 바람직하게는 적어도 55℃ 및 65℃ 이하의 범위 내에서 선택된 온도에서 수행된다. 다른 구현예에서, 벤질 에스테르 HS 및 화학적으로 β-제거성의 LMW-HS 생성물은 제US RE38,743호 내의 실시예 3의 과정에 따라 제조된다. 다른 구현예에서, 벤질 에스테르 HS를 해중합하기에 충분한 시간은,
Figure pct00094
가 적어도 3,800 Da, 및 5,000 Da 이하의 범위, 바람직하게는 4,500 Da인 화학적으로 β-제거성의 LMW-HS 생성물을 형성하기에 충분한 시간이다. 다른 구현예에서, 화학적으로 β-제거성의 LMW-HS 생성물은 다음이 되도록 하는 크기 분포를 포함한다: 다당류 쇄의 적어도 12.0%, 20.0% 이하의 퍼센트, 및 바람직하게는 약 16%는
Figure pct00095
이 2,000 미만이고; 다당류 쇄의 적어도 68.0%, 82.0% 이하의 범위, 및 바람직하게는 다당류 쇄의 약 74%는
Figure pct00096
이 적어도 2,000 및 8,000 이하의 범위이고; 다당류 쇄의 18.0% 이하는
Figure pct00097
이 8,000 초과이다. 다른 구현예에서, 화학적으로 β-제거성의 LMW-HS 생성물은 이당류 단위당 1.8개 이상의 설페이트 그룹을 포함한다. 다른 구현예에서, 화학적으로 β-제거성의 LMW-HS 생성물은 적어도 90 IU mg-1 및 125 IU mg-1 이하의 항-Xa 활성, 적어도 20 IU mg-1 및 35 IU mg-1 이하의 항-IIa 활성; 및/또는 적어도 3.3:1, 및 5.3:1 이하의 항-Xa 활성 대 항-IIa 활성의 비를 포함한다. 다른 구현예에서, 화학적으로 β-제거성의 LMW-HS 생성물은 에녹사파린과 실질적으로 등가이다.
다른 구현예에서, 본 발명의 임의의 방법에 따라 합성된, N,2,3,6-HS 생성물은 탈아민화 반응으로 개질시켜 탈아민화된 LMW-HS 생성물을 형성시킬 수 있다. 역사적으로, 탈아민화된 LMW-HS 생성물은 약제학적 UF-HS를 아질산으로 처리함으로써 제조되었다. 이러한 조건 하에서, 비-환원 말단에서 2-O-설포-α-L-요오도피라노스우론산 잔기 및 환원 말단에서 6-O-설포-2,5-안하이드로-D-만니톨 잔기를 포함하는 탈아민화된 LMW-HS 생성물이 형성된다(참조: 상기된 Linhardt, R.J. 및 Gunay, N.S.). 비-환원 말단에서 2-O-설포-α-L-요오도피라노스우론산 잔기 및 환원 말단에서 6-O-설포-2,5-안하이드로-D-만니톨 잔기를 포함하는 탈아민화된 LMW-HS 생성물은 화학식 XIII의 구조를 포함한다.
[화학식 XIII]
Figure pct00098
화학식 XIII에 나타낸 바와 같이, n은 3 내지 20의 임의의 정수일 수 있고, Y는 알데하이드, 하이드록실, 또는 카복실산 작용성 그룹일 수 있다. 다른 구현예에서, Y는 하이드록실 그룹이다. 임의로, 하나 이상의 이당류 단위내 3-O 위치는 또한 3-O 설페이트화될 수 있다. 특수한 이론에 제한되지 않고, 탈아민화된 LMW-HS 생성물 내 다당류 중 적어도 일부는 궁극적으로 이의 항응고제 활성을 이끄는, 3-O 설페이트화된 글루코사민 잔기를 포함하는 것으로 여겨진다.
임상용으로 처방된 탈아민화된 LMW-HS 조성물의 비-제한적 예는 달테파린(CAS No: 9041-08-1; ATC code: B01AB04), 나드로파린(CAS No: 9005-49-6; ATC code: B01AB06), 레비파린(CAS No: 9005-49-6; ATC code: B01AB08) 및 세르토파린(CAS No: 9005-49-6)을 포함한다. 일반적으로, 달테파린, 나드로파린, 및 레비파린 각각은 아질산나트륨을 직접 첨가되거나 산성 조성물에 첨가함으로써 반응계 내에서 형성된, 아질산을 사용한 해중합에 의해 제조된다. 세르토파린은 아질산 유도체, 예를 들면, 이소아밀 니트라이트를 사용하여 유사하게 제조된다(참조: 상기된 Linhardt, R.J. and Gunay, N.S.). 반응 조건의 조절은 서로 약간 상이한 항응고제 활성 및 분자량 특성을 갖는 탈아민화된 LMW-HS 조성물의 생산을 이끌었으며, 이는 예컨대, 미국 특허 No. 4,303,651, 4,351,938, 4,438,261, 4,500,519, 4,686,388, 5,019,649, 및 5,599,801에 기술되며, 이들 문헌에 개시된 내용은 본 문서에 참조로서 통합된다.
제1의 비-제한적인 예에서, 임상용으로 처방된 탈아민화된 LMW-HS 조성물은 달테파린이다(참조: 예컨대 Jacobsen, A.F., et al., (2003) Br J Obstet Gynaecol 110:139-144; and Guerrini, M., et al., (2007) Seminars in Thrombosis and Hemostasis 33 (5):478-487). 달테파린은 전형적으로 약제학적 UF-HS의 산 해중합에 의해, 특히 약제학적 UF-HS를 아질산과 반응시킴으로써 나트륨 염으로서 제조된다(참조: 예컨대 미국 특허 No. 5,019,649). 후속적인 정제 및 침전 시, 화학식 XIII의 구조를 포함하는 수득되는 달테파린 조성물은
Figure pct00099
가 적어도 5,600 Da, 및 6,400 Da 이하의 범위, 전형적으로 6,000 Da이고 크기 분포는 3,000 미만의
Figure pct00100
를 갖는 다당류 쇄의 비율이 13.0% 이하이고; 쇄의 적어도 15.0% 및 25.0% 이하가 적어도 8,000의
Figure pct00101
를 갖도록 한다. 추가로, 탈테파린 조성물은 적어도 110 IU mg-1 및 210 IU mg-1 이하의 항-Xa 활성, 적어도 35 IU mg-1 및 100 IU mg-1 이하의 항-IIa 활성 및/또는 적어도 1.9:1, 및 3.2:1 이하의 항-Xa 활성 대 항-IIa 활성의 비를 포함할 수 있다(참조: "Dalteparin Sodium" (2010) European Pharmacopoeia 7.0, 1788-1789).
다른 비-제한적 예에서, 임상용으로 처방된 탈아민화된 LMW-HS 조성물은 나드로파린이다. 나드로파린은 약제학적 UF-HS를 아질산나트륨을 사용하여 pH를 약 2.5로 유지시키기 위한 염산의 존재하에서 산 해중합시킴으로써 나트륨 또는 칼슘 염으로서 일반적으로 제조된다(참조: 예컨대 미국 특허 No. 4,686,388 및 5,599,801), 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 후속적인 정제 및 침전시, 화학식 XIII의 구조를 포함하는 수득되는 나드로파린 조성물은 적어도 3,600 Da, 5,000 Da 이하의 범위, 전형적으로 4,300 Da의
Figure pct00102
, 및
Figure pct00103
이 2,000 미만인 쇄의 비율이 15% 이하이고; 쇄의 적어도 75% 및 95% 이하가 적어도 2,000 내지 8,000의 범위의
Figure pct00104
를 갖고 쇄의 적어도 35% 및 55% 이하가 적어도 2,000 및 4,000 이하의
Figure pct00105
를 갖도록 하는 크기 분포를 갖는다. 추가로, 나드로파린 조성물은 95 IU mg-1 이상 및 130 IU mg-1 이하의 항-Xa 활성 및/또는 적어도 2.5:1, 및 4.0:1 이하의 항-Xa 활성 대 항-IIa 활성의 비를 포함할 수 있다(참조: "Nadroparin Sodium" (2010) European Pharmacopoeia 7.0, 1788-1789).
임상용으로 처방된 탈아민화된 LMW-HS 조성물의 다른 비-제한적인 예는 레비파린 및 세르토파린이다. 레비파린은 아질산을 도입시키거나 반응계 내에서 아질산을 형성시킴으로써, 탈테파린 및 나드로파린과 유사하게 제조되며(참조: Linhardt, R.J. 및 Gunay, N.S., 상기됨), 화학식 XIII의 구조를 포함하는 수득되는 레비파린 조성물은
Figure pct00106
가 적어도 4,200 Da, 4,600 Da 이하의 범위, 전형적으로 4,400 Da이고, 항-Xa 활성 대 항-IIa 활성의 비가 적어도 4.0:1, 및 4.5:1 이하, 및 전형적으로 4.2:1이다(참조: Grey, et al, 상기됨). 세르토파린은 헤파린을 이소아밀 니트라이트와 아세트산 또는 염산의 존재하에서 반응시킴으로써 제조된다(참조: Ahsan, A., et al., (2000) Clin. Appl. Thrombosis/Hemostasis 6 (3):169-174). 수득되는 화학식 XIII의 구조를 포함하는 세르토파린 조성물은
Figure pct00107
가 적어도 5,000 Da, 5,600 Da 이하의 범위, 전형적으로 5,400 Da이고, 항-Xa 활성 대 항-IIa 활성의 비가 적어도 2.0:1, 2.5:1 이하, 바람직하게는 2.4:1 이다(참조: Grey, et al, 상기됨).
따라서, 다른 구현예에서, 상술된 본 발명의 임의의 방법에 따라 합성된 N,2,3,6-HS 생성물은 아질산, 또는 아질산 유도체, 예를 들면, 이소아밀 니트라이트로 후속적으로 해중합시켜, 탈아민화된 LMW-HS 생성물을 형성할 수 있다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 탈테파린과 동일한 하나 이상의 특성, 예를 들면, 그러나 이에 한정되지 않는, 화학 구조, 분자량, 항응고제 활성, 및/또는 설페이트화 함량 특성을 포함한다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 탈테파린과 실질적으로 동일하다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 나드로파린과 동일한 하나 이상의 특성, 예를 들면, 그러나 이에 한정되지 않는, 화학 구조, 분자량, 항응고제 활성, 및/또는 설페이트화 함량 특성을 포함한다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 나드로파린과 실질적으로 동일하다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 레비파린과 동일한 하나 이상의 특성, 예를 들면, 그러나 이에 한정되지 않는, 화학 구조, 분자량, 항응고제 활성, 및/또는 설페이트화 함량 특성을 포함한다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 레비파린과 실질적으로 동일하다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 세르토파린과 동일한 하나 이상의 특성, 예를 들면, 그러나 이에 한정되지 않는, 화학 구조, 분자량, 항응고제 활성, 및/또는 설페이트화 함량 특성을 포함한다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 세르토파린과 실질적으로 동일하다.
다른 구현예에서, 탈아민화된 LMW-HS 생성물은 상술된 본 발명의 임의의 방법에 따라 합성된 N,2,3,6-HS 생성물로부터 다음의 단계에 따라 형성될 수 있다: (a) 임의의 상기 방법에 따라 N,2,3,6-HS 생성물을 합성하는 단계; (b) 탈아민화제, 바람직하게는 이소아밀 니트레이트 및 아질산으로 이루어진 그룹으로부터 선택된 탈아민화제를 포함하는 탈아민화 반응 혼합물을 제공하는 단계; 및 (c) N,2,3,6-HS 생성물을 탈아민화 반응 혼합물과 N,2,3,6-HS 생성물 중 적어도 일부를 해중합하기에 충분한 시간 동안 처리하여 탈아민화된 LMW-HS 생성물을 형성시키는 단계. 다른 구현예에서, 탈아민화제는 아질산이고, 탈아민화 반응 혼합물은 화학량론적 양의 산, 바람직하게는 아세트산 또는 염산, 및 알칼리 또는 알칼린 토금속 니트라이트 염, 바람직하게는 아질산나트륨을 포함할 수 있고, 여기서 아질산은 반응계 내에서 탈아민화 반응 혼합물 내에서 형성된다. 다른 구현예에서, 탈아민화제는 이소아밀 니트라이트이다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 화학식 XIII의 구조를 포함한다. 다른 구현예에서, N,2,3,6-HS 생성물은 분획화되지 않은 N,2,3,6-HS 생성물이다.
다른 구현예에서, 탈아민화된 LMW-HS 생성물을 형성시키기에 충분한 시간은 생성물이 목적한 평균 분자량을 갖도록 하기에 충분한 양이다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물의
Figure pct00108
는 2,000 Da 내지 10,000 Da의 범위, 바람직하게는 4,000 Da 내지 6,000 Da의 범위이다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물의
Figure pct00109
는 4,000 Da 내지 4,500 Da의 범위, 바람직하게는 4,300 Da이다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물의
Figure pct00110
는 4,200 Da 내지 4,600 Da의 범위, 바람직하게는 4,400 Da이다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물의
Figure pct00111
는 5,000 Da 내지 5,600 Da의 범위, 바람직하게는 5,400 Da이다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물의
Figure pct00112
는 5,700 Da 내지 6,300 Da의 범위, 바람직하게는 6,000 Da이다.
다른 구현예에서, 탈아민화된 LMW-HS 생성물은 항응고제 활성을 가질 수 있다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 210 IU mg-1 이하의 항-Xa 활성을 갖는다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 적어도 110 IU mg-1 및 210 IU mg-1 이하의 항-Xa 활성을 갖는다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 95 IU mg-1 이상 및 130 IU mg-1 이하의 항-Xa 활성을 갖는다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 적어도 35 IU mg-1 및 100 IU mg-1 이하의 항-IIa 활성을 갖는다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 적어도 2.0:1, 및 4.5:1 이하의 항-Xa 활성 대 항-IIa 활성의 비를 갖는다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 적어도 3.0:1, 및 3.6:1 이하의 항-Xa 활성 대 항-IIa 활성의 비를 갖는다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 적어도 4.0:1, 및 4.5:1 이하의 항-Xa 활성 대 항-IIa 활성의 비를 갖는다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 적어도 2.0:1, 및 2.5:1 이하의 항-Xa 활성 대 항-IIa 활성의 비를 갖는다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 적어도 2.2:1, 및 2.7:1 이하의 항-Xa 활성 대 항-IIa 활성의 비를 갖는다.
다른 구현예에서, 본 발명의 임의의 방법에 따라 합성된 N,2,3,6-HS 생성물은 산화 반응으로 개질시켜 산화된 LMW-HS 생성물을 형성시킬 수 있다. 역사적으로, 산화된 LMW-HS 생성물은 약제학적 UF-HS를 산으로 처리한 다음 산성화된 UF-HS 를 산화제, 특히, 과산화물 또는 초과산화물, 예를 들면, 과산화수소와, 승온에서 반응시킴으로써 제조하였다. 이러한 조건 하에서, 특히 화학식 I의 구조를 포함하지만 다른 LMW-HS 화합물과 동일한 대략적인 분자량 및 항응고제 활성 범위 내에 있는, 산화된 LMW-HS 생성물이 형성될 수 있다.
반응 조건의 조절은 서로에 대해 상이한 항응고제 활성 및 분자량 특성을 갖는 산화된 LMW-HS 조성물의 생성을 야기하며, 이는 예컨대 미국 특허 No. 4,281,108, 4,629,699, 및 4,791,195와, 유럽 특허 EP 0101141, 이들 문헌에 개시된 내용은 본 문서에 참조로서 통합된다. 특히, 산성화된 UF-HS는 약제학적 UF-HS를 강산, 예를 들면, 염산, 또는 약산, 예를 들면, 아스코르브산과 반응시킴으로써 형성되었다. 산성화된 UF-HS는 또한 약제학적 UF-HS를 강 양이온성 교환 수지에 결합시킴으로써 형성되었다. 유사하게, 해중합 조건은 해중합이 일어나는 pH 및 온도, 및 산화제 자체와 관련하여 조절될 수 있다.
임상용으로 처방된 산화된 LMW-HS 조성물의 비-제한적인 예는 파르나파린(CAS No: 91449-79-5; ATC code: B01AB05) 및 아르데파린(CAS No: 9005-49-6)을 포함한다. 특히, 파르나파린은 정맥 혈전증의 예방시, 만성 정맥 장애의 치료시, 및 정맥 및 동맥 혈전증의 치료시 사용되었다(참조: 예컨대 Camporese, G., et al., (2009) Vascular Health and Risk Management 5:819-831). 특수한 이론에 제한되지 않고, 파르나파린은 아스코르브산을 사용하여 산성화된 UF-HS를 형성시키고, 후속적으로 산성화된 UF-HS를 약 염기성 조건 하에서 쿠프릭 아세테이트 일수화물 및 과산화수소의 존재하에서 50℃에서의 항온처리로 해중합시킴으로써 생산된다(참조: 미국 특허 No. 4,791,195, 예 1). 환자에게 투여된 파르나파린은
Figure pct00113
가 적어도 4,000 Da, 6,000 Da 이하의 범위, 전형적으로 5,000 Da이고, 크기 분포는 3,000 미만의
Figure pct00114
을 갖는 다당류의 비율이 조성물의 30% 이하이고, 적어도 3,000 및 8,000 이하의 범위인
Figure pct00115
을 갖는 다당류의 비율이 조성물의 50% 내지 60%이도록 한다. 추가로, 파르나파린 조성물은 적어도 75 IU mg-1 및 110 IU mg-1 이하인 항-Xa 활성 및/또는 적어도 1.5:1, 및 3.0:1 이하의 항-Xa 활성 대 항-IIa 활성의 비를 포함할 수 있다(참조: "Parnaparin Sodium" (2010) European Pharmacopoeia 7.0, 2672). 다른 한편, 환자에게 처방된 아르데파린 조성물은
Figure pct00116
가 적어도 5,500 Da, 6,500 Da 이하의 범위, 전형적으로 6,000 Da이고, 항-Xa 활성가 120 +/- 25 IU mg-1이고 항-Xa 활성 대 항-IIa 활성의 비가 적어도 2.0:1, 2.5:1 이하이고, 특징적으로 2.3:1이다.
따라서, 다른 구현예에서, 본 발명의 임의의 방법에 따른 N,2,3,6-HS 생성물은 후속적으로 산화제로 해중합시켜 산화된 LMW-HS 생성물을 형성시킬 수 있다. 다른 구현예에서, 산화된 LMW-HS 생성물은 파르나파린과 동일한 하나 이상의 특성, 예를 들면, 그러나 이에 한정되지 않는, 화학 구조, 분자량, 항응고제 활성, 및/또는 설페이트화 함량 특성을 포함한다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 파르나파린과 실질적으로 동일하다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 아르데파린과 동일한 하나 이상의 특성, 예를 들면, 그러나 이에 한정되지 않는, 화학 구조, 분자량, 항응고제 활성, 및/또는 설페이트화 함량 특성을 포함한다. 다른 구현예에서, 탈아민화된 LMW-HS 생성물은 아르데파린과 실질적으로 동일하다.
다른 구현예에서, 산화된 LMW-HS 생성물은 상술된 본 발명의 임의의 방법에 따라 합성된 N,2,3,6-HS 생성물로부터 다음의 단계에 따라 형성될 수 있다: (a) 임의의 상기 방법에 따른 N,2,3,6-HS 생성물을 합성하는 단계; (b) 산화제, 바람직하게는 과산화수소를 포함하는 산화 반응 혼합물을 제공하는 단계; 및 (c) N,2,3,6-HS 생성물을 산화 반응 혼합물로 N,2,3,6-HS 생성물 중 적어도 일부를 해중합시키기에 충분한 시간 동안 처리함으로써, 산화된 LMW-HS 생성물을 형성시키는 단계. 다른 구현예에서, N,2,3,6-HS 생성물을 산화 반응 혼합물로 처리하는 단계는 다음의 소-단계를 포함할 수 있다: (i) N,2,3,6-HS 생성물을 산성화시켜 산성화된 N,2,3,6-HS 생성물을 형성시키는 단계; (ii) 산성화된 HS 생성물을 산화 반응 혼합물과 조합시키는 단계; 및 (c) 산성화된 HS 생성물을 산화 반응 혼합물 내에서 적어도 50℃ 내에서 산화된 LMW-HS 생성물이 형성될 때까지 항온처리하는 단계. 다른 구현예에서, N,2,3,6-HS 생성물을 산화 반응 혼합물로 처리하는 단계는 미국 특허 제4,791,195호의 예 1의 과정을 포함할 수 있다. 다른 구현예에서, 산화된 LMW-HS 생성물은 화학식 I의 구조를 포함한다. 다른 구현예에서, N,2,3,6-HS 생성물은 분획화되지 않은 N,2,3,6-HS 생성물이다.
다른 구현예에서, 산화된 LMW-HS 생성물을 형성시키기에 충분한 시간은 생성물이 목적한 평균 분자량을 갖도록 하기에 충분한 시간이다. 다른 구현예에서, 산화된 LMW-HS 생성물의
Figure pct00117
는 2,000 Da 내지 12,000 Da의 범위, 바람직하게는 4,000 Da 내지 6,000 Da의 범위이다. 다른 구현예에서, 산화된 LMW-HS 생성물의
Figure pct00118
는 4,000 Da 내지 6,000 Da의 범위, 바람직하게는 5,000 Da이다. 추가의 구현예에서, 산화된 LMW-HS 생성물은 3,000 미만의
Figure pct00119
을 갖는 다당류의 비율이 조성물의 30% 이하이고, 적어도 3,000 및 8,000 이하의 범위인
Figure pct00120
을 갖는 다당류의 비율이 조성물의 50% 내지 60%인 크기 분포를 포함한다. 다른 구현예에서, 산화된 LMW-HS 생성물의
Figure pct00121
는 5,500 Da 내지 6,500 Da의 범위, 바람직하게는 6,000 Da이다.
다른 구현예에서, 산화된 LMW-HS 생성물은 항응고제 활성을 가질 수 있다. 다른 구현예에서, 산화된 LMW-HS 생성물은 적어도 75 IU mg-1의 항-Xa 활성을 가질 수 있다. 다른 구현예에서, 산화된 LMW-HS 생성물은 110 IU mg-1 이하의 항-Xa 활성을 가질 수 있다. 다른 구현예에서, 산화된 LMW-HS 생성물은 적어도 1.5:1, 및 3.0:1 이하의 항-Xa 활성 대 항-IIa 활성의 비를 갖는다. 다른 구현예에서, 산화된 LMW-HS 생성물은 적어도 2.0:1, 2.5:1 이하, 및 바람직하게는 2.3:1의 항-Xa 활성 대 항-IIa 활성의 비를 갖는다.
당해 분야의 기술자는 LMW-HS 조성물의 상술한 실시예, 및 하나 이상의 가공된 아릴 설페이트-의존성 설포트랜스퍼라제 효소를 사용하여 합성된 N,2,3,6-HS 생성물로부터 이를 형성하기 위한 방법은 전적이지 않으며, 이러한 다른 예는 명확성 및 간결성에 대해 배제되어 있다. N,2,3,6-HS 생성물, 특히 분획화되지 않은 N,2,3,6-HS 생성물이 상술한 임의의 방법에 따라 형성된 경우, 이는 임의의 공지된 공정에 의해 개질 및/또는 해중합됨으로써, 제2의 생성물, 특히 LMW-HS 생성물을 형성할 수 있다. 이러한 공정은 용매를 사용한 분획화(프랑스 특허 No. 2,440,376, 미국 특허 No. 4,692,435); 음이온성 수지를 사용한 분획화(프랑스 특허 No. 2,453,875); 겔 여과; 친화성 크로마토그래피(미국 특허 No. 4,401,758); 아질산을 포함하나, 이에 한정되지 않는 화학제의 수단에 의한 조절된 해중합(유럽 특허 EP 0014184, 유럽 특허 EP 0037319, 유럽 특허 EP 0076279, 유럽 특허 EP 0623629, 프랑스 특허 No. 2,503,714, 미국 특허 No. 4,804,652 및 PCT 공개 No. WO 81/03276), 헤파린 에스테르(유럽 특허 EP 0040144, 미국 특허 No. 5,389,618), 퍼요오다이드(유럽 특허 EP 0287477), 수소화붕소산나트륨(유럽 특허 EP 0347588, 유럽 특허 EP 0380943), 아스코르브산(미국 특허 No. 4,533,549), 과산화수소(미국 특허 No. 4,629,699, 미국 특허 No. 4,791,195), 헤파린의 4급 암모늄 염으로부터의 4급 수산화암모늄(미국 특허 No. 4,981,955), 알칼리 금속 수산화물(유럽 특허 EP 0380943, 유럽 특허 EP 0347588)로부터, 탄소-산소 리아제 효소를 사용한(유럽 특허 EP 0064452, 미국 특허 No. 4,396,762, 유럽 특허 EP 0244235, 유럽 특허 EP 0244236; 미국 특허 No. 4,826,827; 미국 특허 No. 3,766,167), 조사(유럽 특허 EP 0269981), 정제, 및 신속하게 이동하는 HS 분획(미국 특허 No. 7,687,479, 미국 특허 No. 8,609,632)의 개질의 수단에 의한 β-제거, 및 미국 특허 No. 4,303,651, 미국 특허 No. 4,757,057, 미국 공개 No. 2007/287683, PCT 공개 No. WO 2009/059284 및 PCT 공개 No. WO 2009/059283(이들 문헌에 개시된 내용은 본 문서에 참조로서 통합된다)에 개시된 다른 방법 또는 그러한 방법들의 조합을 포함하나, 이에 한정되지 않는다.
가공된 아릴 설페이트-의존성 설포트랜스퍼라제 효소의 제조
일반적으로, 개시된 핵산 및 아미노산 서열에 의해 암호화된 가공된 설포트랜스퍼라제 효소는 하기 기술된 바와 같은 것을 포함하는, 당해 분야에 공지된 임의의 미생물학적 기술을 사용하여 발현 및 정제할 수 있다. 각각의 정제된 효소의 아릴 설페이트-의존성 설포트랜스퍼라제 활성은 분광광도계적으로 또는 형광성으로 및/도는 질량 분광법(MS) 또는 핵 자기 공명(NMR) 분광기를 사용하여 측정함으로써 출발 물질 및/또는 황산화된 다당류 생성물을 특성화할 수 있다. 이러한 방법은 실시예 단락에서 하기에 기술되어 있다.
본 발명의 방법에 따라 사용되는 가공된 유전자 생성물, 단백질 및 폴리펩타이드는 개시된 DNA 또는 펩타이드 서열에 대해 삽입, 결실, 또는 돌연변이를 함유하고, 아릴 설페이트 화합물이 기질인 반응을 촉매하는 효소를 또한 암호화하는 유사체를 포함할 수 있다. 다른 구현예에서, 각각의 유사체는 설포전달 반응을 유사하게 촉매하며 여기서 아릴 설페이트 화합물은 설포 공여체로서 이용된다. 유사체는 본원에 개시된 바와 같이 뉴클레오타이드 또는 아미노산 서열로부터 유도될 수 있거나, 이는 가상 환경에서(in silico) 또는 새로이(de novo) 컴퓨터 모델링 기술을 사용하여 설계할 수 있다. 당해 분야의 기술자는 아직 개시되지 않거나 발견되지 않은 다른 유사체가 본 발명의 방법에 따라 사용될 수 있는 상이한 설페이트-의존성 설포트랜스퍼라제 효소를 설계 및/또는 작제하는데 사용될 수 있음을 인식할 것이다. 유전자 생성물, 단백질, 또는 폴리펩타이드가 본원에 개시된 바와 같은 가공된 설포트랜스퍼라제의 모든 또는 실질적으로 모든 핵산 또는 아미노산 서열을 포함하도록 할 필요는 없다. 이러한 서열은 본원에서 "분절(segment)"로 지칭된다. 또한, 본원에 논의되고 개시된 유전자 생성물, 단백질, 및 폴리펩타이드는 또한 본원에 개시된 서열의 전체 길이의 서열 또는 생물학적으로 기능성인 분절을 포함하는 융합체 또는 재조합체 아릴 설페이트-의존성 설포트랜스퍼라제를 포함할 수 있다. 이러한 단백질을 제조하는 방법은 당해 분야에 공지되어 있다.
여기서 개시된 핵산 및 아미노산 서열 외에, 본 발명의 방법은 상기 개시된 임의의 아미노산 서열과 실질적으로 동일하거나, 또는 개시된 뉴클레오타이드 서열과 실질적으로 동일한 뉴클레오타이드 서열을 포함하는 핵산으로부터 발현된 아미노산 서열을 포함하는 아릴 설페이트-의존성 설포트랜스퍼라제에 의해 실시될 수 있다(서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 또는 서열 번호: 27). 당해 분야의 기술자는, 상기한 뉴클레오타이드 서열에 기초한, 서열 번호: 33-54 및 56-61의 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 적절한 뉴클레오타이드 서열을 결정할 수 있다. 당해 분야에 사용된 바와 같은, "실질적으로 동일한" 서열은 하나 이상의 결실, 치환, 또는 첨가에 의해 특수한 참고 서열과 상이하며, 이의 전체 효과는 참고 서열에 의해 암호화된 가공된 폴리펩타이드의 생물학적 활성 중 적어도 일부를 유지하는 서열을 지칭한다. 즉, 가공된 아릴 설페이트-의존성 설포트랜스퍼라제의 생물학적 활성은 설포 기여 아릴 설페이트 화합물로부터 설포 그룹 수용체로 작용하는 다당류로 설포 그룹의 전달을 포함한다. 다른 구현예에서, 다당류는 헤파로산-계 및/또는 HS 다당류이다. 따라서, 본 발명의 아릴 설페이트-의존성 효소를 기술하기 위해 사용된 것으로서, "실질적인 동일성"은 아릴 설페이트-의존성 효소의 특수한 유전자 생성물, 폴리펩타이드 또는 아미노산 서열, 또는 아릴 설페이트-의존성 효소를 암호화하는 유전자 또는 핵산 서열과의 동일성을 지칭할 수 있다. 이러한 서열은 생물학적 활성이 일부 정도로 변경, 향상, 또는 감소되어 있지만, 개시된 참고 핵산 서열에 의해 암호화된 개시된 참고 아미노산 서열 또는 폴리펩타이드의 원래의 생물학적 활성의 적어도 일부를 보유하는 개시된 서열들 또는 서열의 돌연변이를 포함할 수 있다.
대안적으로, DNA 유사체 서열은 (a) DNA 유사체 서열이 임의의 개시된 핵산 서열의 암호화 영역으로부터 유래되거나; (b) DNA 유사체 서열이 엄격한 조건(stringent condition) 하에서 (a)의 DNA 서열을 하이브리드화시킬 수 있고 생물학적으로 활성인 아릴 설페이트-의존성 설포트랜스퍼라제 유전자 생성물을 암호화하거나; (c) DNA 서열이 (a) 및/또는 (b)에서 정의된 DNA 유사체 서열에 대한 대안의 유전 코드의 결과로서 변성된 경우, 본원에 개시된 특이적인 DNA 서열과 실질적으로 동일하다. 실질적으로 동일한 유사체 단백질은 천연의 단백질의 상응하는 서열에 대해 약 60% 이상 동일하다. 보다 적은 동일성 정도 그러나 비교가능한 생물학적 활성, 즉, 아릴 설페이트 화합물로부터 다당류, 특히 헤파로산-계 또는 HS 다당류로 설포 그룹을 전달하는 활성을 갖는 서열이 또한 실질적으로 동일한 것으로 고려된다. 핵산 서열의 실질적인 동일성을 측정하는데 있어서, 실질적으로 동일한 아미노산 서열을 암호화할 수 있는 모든 대상 핵산 서열은 생물학적으로 기능성 등가물을 생성하기 위한 코돈 서열 또는 아미노산 치환내에 차이와 상관없이, 참고 핵산 서열과 실질적으로 동일한 것으로 고려된다.
생물학적 수준에서, 동일성은 즉, 유전자 계열의 주어진 계열 구성원내에서 동일한 상대적 위치에 동일한 아미노산이다. 상동성 및 유사성은 일반적으로 보다 광범위한 용로로서 고려된다. 예를 들면, 생화학적으로 유사한 아미노산, 예를 들어, 루이신 및 이소루이신 또는 글루탐산/아스파르트산은 대안적으로 동일한 위치에 존재할 수 있으며-이는 동일하지는 않지만, 생화학적으로 "유사"하다. 본원에 개시된 바와 같이, 이는 보존적 차이 또는 보존적 치환으로서 지칭된다. 이는 DNA 수준에서 보존적 돌연변이와는 상이하며, 이는 암호화된 아미노산내 변화, 예컨대, 이들 둘 다 세린을 암호화하는, TCC 대 TCA로의 변화를 만들지 않고 뉴클레오타이드 서열을 변화시킨다.
일부 구현예에서, 유전자 및 유전자 생성물은 이의 각각의 서열내에서 아릴 설페이트-의존성 설포트랜스퍼라제 또는 이의 상응하는 단백질을 암호화하는 유전자의 "것으로서 필수적인" 서열을 포함한다. 아릴 설페이트-의존성 설포트랜스퍼라제를 암호화하는 유전자의 것으로서 필수적인 서열은 개시된 핵산 서열의 일부와 실질적으로 동일하거나 실질적으로 유사하고 개시된 단백질 또는 유전자의 것과 동일하지 않은 소수의 염기 또는 아미노산(DNA 또는 단백질에 상관없이)을 함유하는 서열을 지칭한다. 생물학적 기능 등가성은 당해 분야에서 잘 이해되어 있고 하기에 상세히 추가로 논의되어 있다. 뉴클레오타이드 서열이 개시된 유전자의 뉴클레오타이드 서열과 동일한 핵산 잔기의 약 75% 내지 약 85%, 또는 특히 약 86% 내지 약 90%, 또는 보다 특히 90% 이상, 또는 심지어 보다 특히 약 91% 내지 약 95% 이상, 또는 여전히 보다 특히 약 96% 내지 약 99%를 갖는 경우 "필수적으로 동일"하다. 유사하게, 개시된 폴리펩타이드 서열의 아미노산 서열에 대해 동일하거나 기능적으로 등가이거나 생물학적으로 기능적으로 등가인 아미노산의 약 80%, 또는 90%, 또는 특히 90 내지 95%, 또는 보다 특히 96% 이상, 또는 심지어 보다 특히 95 내지 98%, 또는 여전히 보다 특히 99% 이상을 갖는 서열은 "필수적으로 동일한" 서열일 것이다.
또한, 기능적으로 등가인 코돈을 포함하는 대안의 핵산 서열이 또한 본 발명에 의해 고려된다. 기능적으로 등가인 코돈은 동일한 아미노산을 암호화하는 코돈, 예를 들면, 세린의 경우 ACG 및 AGU 코돈을 지칭한다. 따라서, 기능적으로 등가인 코돈의 상기 임의의 뉴클레오타이드 서열로의 치환은 생물학적으로 기능성인 등가의 설포트랜스퍼라제를 암호화한다. 따라서, 본 발명은 이러한 치환을 포함하지만 편의상 이의 전체가 본원에 나타나 있지 않은 아미노산 및 핵산 서열을 포함한다.
당해 분야의 기술자는 아미노산 및 핵산 서열이 추가의 잔기, 예를 들면, 추가의 N- 또는 C-말단 아미노산 또는 5' 또는 3' 핵산 서열을 포함할 수 있고, 서열이 설포 공여체로서 아릴 설페이트 화합물과의 결합 및 반응성과 관련하여 이의 생물학적 활성을 보유하는 한, 아직 여전히 필수적으로 본원에 개시된 서열 중 하나에 나타낸 바와 같다. 말단 서열의 첨가는 예를 들면, 암호화 영역의 5' 또는 3' 부위 중 어느 하나를 플랭킹하는 다양한 비-암호화 서열을 포함할 수 있거나, 다양한 내부 서열, 또는 유전자내에서 발생하는 것으로 알려진, 인트론을 포함할 수 있는 핵산 서열에 특히 적용된다.
상기 논의된 바와 같이, 변형 및 변화, 예를 들면, 보존적 및 비-보존적 돌연변이, 결실, 및 첨가는 유사하거나 달리 목적한 특성을 갖는 분자를 여전히 구성하면서, 임의의 개시된 아릴 설페이트-의존성 설포트랜스퍼라제의 서열내에서 이루어질 수 있다. 예를 들면, 특정의 아미노산이 특수한 구조 또는 화합물, 특히 아릴 설페이트 화합물 및/또는 설포 수용체 다당류와의 상호작용 능력의 주목할만한 손실없이 단백질 구조내 다른 아미노산에 대해 치환될 수 있다. 이는 이의 환경내에서 다른 구조 또는 화합물을 인식하고, 이와 결합하며 이와 반응하는 단백질의 능력이 서열 자체가 아닌, 단백질의 생물학적 기능적 활성을 규정하기 때문에 발생할 수 있다. 결과적으로, 특정의 아미노산 서열 치환이 단백질의 서열내에서 이루어져서 동등한, 향상된, 또는 감소된 특성을 지닌 단백질을 수득할 수 있다. 상호작용성 활성의 주목할만한 손실없이 발생할 수 있는 이러한 아미노산 치환의 하나의 비-제한적 예는 단백질의 폴딩 및 용해도에 영향을 미치지 않는 외부 도메인내 또는 단백질의 표면애 치환을 포함한다. 유사하게, 아미노산은, 이의 기질을 인식하여 이에 결합하는 단백질의 능력이 유해하게 영향받지 않는 한, 단백질의 말단에 잠재적으로 첨가될 수 있다. 당해 분야의 기술자는 수개의 다른 방법 및/또는 전략을 사용하여 이의 활성에 영향을 미치지 않고 소소의 서열을 변경시킬 수 있음을 인식할 수 있다.
결과적으로, 변형된 효소가 모 효소의 생물학적 활성을 보유하는 모 효소의 구조 또는 서열에 대한 돌연변이, 결실, 첨가, 또는 다른 변경은 모 효소에 대해 생물학적으로 기능적으로 등가이도록 정의될 수 있다. 따라서, 가공된 아릴 설페이트-의존성 설포트랜스퍼라제와 관련하여, 생물학적으로 기능적으로 등가인 효소는 여기 개시된 임의의 아미노산 서열의 임의의 치환 또는 변경을 포함할 수 있고, 여기서 수득되는 변형된 효소는 아릴 설페이트 화합물, 특히 PNS 또는 NCS와 상호작용하여 다당류, 특히 헤파로산-계 및/또는 HS 다당류에 대한 설포 전달을 촉매하는데 의존적이다. 특히, 이러한 치환 또는 변경은, 효소의 비-효소적으로 활성인 영역이 또한 고려되지만, 하기 기술된 바와 같은, 단백질의 임의의 부위내 아미노산 서열내 보존적 돌연변이로부터 생성될 수 있다. 결과적으로, 본 발명의 방법을 실행할 수 있는 가공된 아릴 설페이트-의존성 설포트랜스퍼라제는, 이러한 뉴클레오타이드 서열이 편의를 위해 이의 전체로서 본원에 나타나 있지 않지만, 생물학적으로 기능성인 등가의 효소를 암호화하는 뉴클레오타이드 서열을 갖는 임의의 핵산으로부터 발현될 수 있다.
대안적으로, 재조합 DNA 기술을 사용하여 생물학적으로 기능적으로 등가의 단백질 또는 펩타이드를 생성할 수 있으며 여기서 단백질 구조내 변화는 변형되는 아미노산의 특성에 대한 고려를 기반으로 가공될 수 있다. 비례적으로 설계된 변화를 부위-지시된 돌연변이유발 기술의 적용을 통해 도입하여, 예를 들면, 특정의 돌연번이가 효소의 아릴 설페이트-의존성 촉매 활성 또는 효소의 활성 부위내 설포 공여체 또는 수용체의 결합에 긍정적으로 또는 부정적으로 영향을 미치는지의 여부를 시험할 수 있다.
아미노산 치환, 예를 들어, 본원에 기술된 임의의 아릴 설페이트-의존성 설포트랜스퍼라제를 변형하는데 사용될 수 있는 것은 일반적으로 아미노산 측쇄 치환체의 상대적인 유사성, 예를 들면, 이의 소수성, 친수성, 전하, 크기 등을 기반으로 한다. 당해 분야의 기술자는 특정의 아미노산 사이의 유사성, 예를 들면, 아미노산 측쇄 치환체의 크기, 형태 및 유형에 친숙하다. 비제한적 예는 예를 들면, 알라닌, 라이신 및 히스티딘이 모드 양으로 하전된 잔기이고; 알라닌, 글리신 및 세린이 모두 유사한 크기이며; 페닐알라닌, 트립토판 및 타이로신이 모드 일반적으로 유사한 형태를 가지는 관계를 포함한다. 결과적으로, 다음의 그룹-아르기닌, 라이신 및 히스티딘; 알라닌, 글리신 및 세린; 및 페닐알라닌, 트립토판 및 타이로신을 포함하는 아미노산은 동일한 그룹내 다른 아미노산에 대해 생물학적으로 기능성 등가물로서 본원에 정의되어 있다. 다른 생물학적으로 기능적으로 등가인 변화는 당해 분야의 기술자에게 친숙할 것이다.
다른 구현예에서, 본 발명은 본 발명의 가공된 효소의 기능성 단편을 포함하는 단리된 핵산, 또는 이의 돌연변이체를 제공하며, 여기서 보존된 치환은 본원에 기술된 임의의 가공된 설포트랜스퍼라제 효소의 아미노산 서열 내에서 특수한 잔기에 대해 이루어졌다.
또한, 본 발명의 방법을 실행할 수 있는 아릴 설페이트-의존성 설포트랜스퍼라제를 발현하는데 사용된 단리된 핵산은 다양한 적용시 사용하기 위해 다른 핵산에 결합시킬 수 있다. 따라서, 예를 들면, 단리된 핵산을 당해 분야에 일반적으로 공지되고 하기 실시예에 기술된 바와 같이, 클로닝 또는 발현 벡터내로 연결시킬 수 있다. 또한, 핵산은 다른 폴리펩타이드를 암호화하는 서열에 대해 프레임내(in-frame)에서 결합됨으로써 당해 분야에 일반적으로 공지된 바와 같은, 융합 단백질을 형성할 수 있다. 융합 단백질은 목적한 기능, 예를 들면, 용해도, 정제, 또는 면역검출을 갖는 다른 단백질 또는 펩타이드와 동일한 발현 단위내에서 정렬된 아릴 설페이트-의존성 설포트랜스퍼라제에 대한 암호화 영역을 포함할 수 있다. 따라서, 다른 구현예에서, 본 발명의 방법에서 사용될 수 있는 아릴 설페이트-의존성 설포트랜스퍼라제를 암호화하는, 임의의 상술한 핵산을 포함하는 클로닝, 발현 및 융합 벡터가 또한 제공된다.
또한, 본 발명의 핵산 분절은, 암호화 서열 자체의 길이와 상관없이, 다른 DNA 서열, 예를 들면, 프로모터, 인핸서(enhancer), 폴리아데닐화 신호, 추가의 제한 효소 부위, 다수의 클로닝 부위, 다른 암호화 분절 등과 조합됨으로써, 이의 전체 길이가 현저히 변할 수 있도록 할 수 있다. 당해 분야의 기술자는 거의 임의의 길이의 핵산 단편이 의도된 재조합 DNA 프로토콜내에서 제조 및 사용 용이성에 의해 전형적으로 제한되는 총 길이로 사용될 수 있음을 인식할 것이다.
특히, 유전자 또는 DNA 분절의 암호화 부위가 프로모터의 제어하에 위치하는 재조합 벡터가 특히 유용하다. 일부 구현예에서, 암호화 DNA 분절은 세균, 바이러스, 진핵세포, 또는 포유동물 세포로부터 단리된 프로모터와 연합될 수 있다. 발현을 위해 선택된 세포 유형에 대해 특이적인 프로모터가 흔히 가장 효과적이다. 단백질 발현을 위한 프로모터 및 세포형 조합의 사용은 일반적으로 분자 생물학 분야의 기술자에게 공지되어 있다 (참조: 예컨대, Sambrook et al. (2012) Molecular Cloning: A Laboratory Manual, Fourth Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다). 사용된 프로모터는 구성적 또는 유도성일 수 있고 적절한 조건 하에 사용되어 도입된 DNA 분절의 고-수준 발현을 지시할 수 있고, 예를 들면, 재조합 단백질 또는 펩타이드의 대규모 생성에 유리하다. 고-수준 발현에 흔히 효과적인 적절한 프로모터 시스템은 박시니아 바이러스 프로모터, 바쿨로바이러스 프로모터, 및 Ptac 프로모터를 포함하나, 이에 한정되지 않는다.
따라서, 일부 구현예에서, 본 발명의 방법에 사용될 수 있는 생물학적으로 활성인, 아릴 설페이트-의존성 설포트랜스퍼라제를 암호화하는 뉴클레오타이드 서열을 포함하는 발현 벡터를 이용할 수 있다. 하나의 예에서, 발현 벡터는 아릴 설페이트-의존성 설포트랜스퍼라제 유전자 생성물을 암호화하는 임의의 뉴클레오타이드 서열을 포함할 수 있다. 추가의 구현예에서, 발현 벡터는 상기된 임의의 뉴클레오타이드 서열, 또는 상기된 임의의 가공된 설포트랜스퍼라제 효소의 아미노산 서열을 포함하는 폴리펩타이드를 암호화하는 임의의 뉴클레오타이드 서열을 포함하는 핵산을 포함한다. 추가의 구현예에서, 본 발명의 가공된 아릴 설페이트-의존성 설포트랜스퍼라제 효소를 암호화하는 임의의 핵산 서열은 효소를 생산하는데 사용된 발현 숙주를 기반으로 코돈-최적화될 수 있다. 재조합 벡터의 제조 및 코돈 최적화는 당해 분야의 기술자에게 잘 공지되어 있고 많은 참고문헌, 예를 들면, Sambrook et al. (2012) Molecular Cloning: A Laboratory Manual, Fourth Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor,-N.Y에 기술되어 있다.
당해 분야의 기술자는 발현될 DNA 암호화 서열, 이러한 경우에, 아릴 설페이트-의존성 설포트랜스퍼라제 유전자 생성물을 암호화하는 것은 벡터내에서 프로모터에 인접하게 및 이의 제어 하에 위치함을 인식할 수 있다. 당해 분야에 공지된 바와 같이, 프로모터는 전사가 개시되는 지점(즉, 전사 출발 부위)의 상부로 약 100개 뉴클레오타이드내 DNA 분자의 영역내에 있다. 이러한 영역은 전형적으로 상이한 유전자내 유사한 상대적인 위치에 있는 DNA 서열 성분의 수개의 유형을 함유한다. 이러한 프로코어의 제어하에서 암호화 서열을 가져오기 위해, 선택된 프로모터(즉, 이의 3')의 "하부"로 약 1 내지 약 50개의 뉴클레오타이드가 발현되도록 유전자의 생성물의 전사 판독 프레임의 전사 개시 부위의 5' 말단에 일반적으로 위치시킴이 당해 분야에 이해되어 있다.
원래의 삽입된 DNA내에 함유되지 않는 경우, 벡터의 전사 단위내로 적절한 폴리아데닐화 부위(예컨대, 5'-AATAAA-3')를 혼힙시키는 것이 또한 요구될 수 있다. 전형적으로, 폴리-A 첨가 부위는 전사 말단 앞 위치에서 암호화 서열의 "하부"로 약 30 내지 2000개 뉴클레오타이드에 위치한다.
별개의 전사 조절 서열 성분의 다른 유형은 인핸서이다. 인핸서는 특수한 암호화 영역 또는 유전자의 시간 특이성, 위치 및 발현 수준을 내포한다. 인핸서의 주요 기능은 이러한 인핸서에 결합하는 하나 이상의 전사 인자를 함유하는 세포내 암호화 서열의 전사 수준을 증가시키는 것이다. 인핸서는 프로모터가 존재하는 한, 전사 개시 부위로부터 다양한 거리에 위치하는 경우 기능할 수 있다.
임의로, 본 발명의 발현 벡터는 인핸서-프로모터에 작동적으로 연결된 폴리뉴클레오타이드를 포함한다. 본원에 사용된 바와 같이, 어구, "인핸서-프로모터"는 인핸서 및 프로모터 성분 둘 다를 함유하는 복합체 단위를 의미한다. 예를 들면, 발현 벡터는 진핵세포 프로모터인 인핸서-프로모터에 작동적으로 연결된 폴리뉴클레오타이드를 포함하고 발현 벡터는 카복시-말단 아미노산의 3' 및 암호화된 폴리펩타이드의 전사 단위내에 위치한 폴리아데닐화 신호를 추가로 포함한다. 본원에 사용된 바와 같이, 어구, "작동적으로 연결된"은 인핸서-프로모터가 이러한 암호화된 서열의 전사가 이러한 인핸서-프로모터에 의해 제어되고 조절되도록 하는 방식으로 암호화 서열에 연결되어 있음을 의미한다. 인핸서-프로모터를 암호화 서열에 작동적으로 연결시키기 위한 기술은 당해 분야에 잘 공지되어 있고; 목적한 암호화 서열에 대해 정밀한 배향 및 위치는 특히, 인핸서-프로모터의 특이적인 특성에 의존적이다.
본 발명의 벡터 작제물에 사용된 인핸서-프로모터는 형질감염될 세포내 발현을 구동하는 임의의 인핸서-프로모터일 수 있다. 잘 공지된 특성을 지닌 인핸서-프로모터를 사용함으로써, 유전자 생성물 발현의 수준 및 양식을 최적화시킬 수 있다.
본 발명의 방법을 실행할 수 있는 설포트랜스퍼라제 효소는 본 발명의 핵산이 내부로 도입됨으로써 이에 의해 암호화된 단백질 또는 펩타이드의 핵산 및/또는 발현의 클론성 증식을 유발하도록, 원핵세포 또는 진핵 세포인, 세포들 또는 세포주내에서 발현시킬 수 있다. 이러한 세포 또는 세포주는 핵산을 증식 및 생산하고 아릴 설페이트-의존성 설포트랜스퍼라제 자체를 생성하는데 유용하다. 여기서 사용된 용어 "형질전환된 세포"는 본 발명의 임의의 핵산이 형질전환, 형질감염, 형질도입, 감염, 또는 다른 수단에 의해 애부로 도입된, 임의의 세포, 또는 임의의 세포의 후대세포를 포함하는 것으로 의도된다. 적절한 벡터를 생산하고, 이러한 벡터로 세포를 형질감염시키고, 형질전환체를 확인하는 방법은 당해 분야에 잘 공지되어 있다 (참조: 예컨대, Sambrook et al. (2012) Molecular Cloning: A Laboratory Manual, Fourth Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.).
형질전환된 세포를 생산하기 위한 원핵 세포는 세균 속(bacterial genera) 에스케리키아(예컨대, 이. 콜라이), 슈도모나스(Pseudomonas)(예컨대, 피. 아에루기노사(P. aeruginosa)), 및 바실러스(Bacillus)(예컨대, 비, 서브틸리스(B. subtilus), 비. 스테아로써모필루스(B. stearothermophilus)) 뿐만 아니라, 당해 분야에 잘 공지되고 흔히 사용된 많은 다른 것의 구성원을 포함한다. 원핵 세포는 단백질 또는 펩타이드(예컨대, 아릴 설페이트-의존성 효소, 그 서열의 단편, 그 서열을 포함하는 융합 단백질)를 대량 생산하는데 특히 유용하다. 세균 세포(예컨대, 이. 콜라이)는 예를 들면, T7 RNA 폴리머라제/프로모터 시스템, 박테리오파아지 λ 조절 서열, 또는 M13 파아지 조절 성분을 지닌 플라스미드를 포함하는 다양한 발현 벡터 시스템을 지닌 플라스미드를 포함하는 다양한 발현 벡터 시스템과 함께 사용될 수 있다. 세균 숙주는 또한 예를 들면, 단백질 A, lacZ, trpE, 말토즈-결합 단백질(MBP), 작은 유비퀴틴-관련 개질제(SUMO), 폴리-His 태그(tag), 또는 글루타티온-S-트랜스퍼라제(GST) 융합 단백질을 생성하는 융합 단백질 벡터(ventor)로 형질전환될 수 있다. 이들 모두 뿐만 아니라, 많은 다른 원핵세포 발현 시스템은 당해 분야에 잘 공지되어 있고, 상업적으로 광범위하게 이용가능하다(예컨대, GST 융합의 경우 pGEX-27(Amrad, USA)).
본 발명의 일부 구현예에서, 상기한 임의의 핵산 서열을 포함하는 발현 벡터는 임의의 아릴 설페이트-의존성 설포트랜스퍼라제와의 융합 단백질을 암호화하는 유전자 또는 핵산 서열을 포함할 수 있다. 추가의 구현예에서, 발현 벡터는 말토즈 결합 단백질을 암호화하는, malE 유전자를 추가로 포함할 수 있다. 이러한 발현 벡터로부터 단백질 발현의 유도시, 발현된 유전자 생성물은 말토즈 결합 단백질 및 임의의 상기한 아릴 설페이트-의존성 설포트랜스퍼라제 효소를 포함하는 융합 단백질을 포함한다. 다른 추가의 구현예에서, 임의의 상기 아릴 설페이트-의존성 설포트랜스퍼라제 효소를 암호화하는 임의의 상기 핵산을 포함하는 발현 벡터는 SUMO 개질제, 예를 들면, 비-제한적 예에서, SUMO-1을 암호화하는 유전자를 추가로 포함할 수 있다.
다른 구현예에서, 본 발명에 따른 발현 벡터는 폴리-His 태그를 암호화하는 핵산 서열을 추가로 포함할 수 있다. 이러한 발현 벡터로부터 단백질 발현의 유도시, 발현된 유전자 생성물은 폴리-His 태그 및 임의의 상기된 아릴 설페이트-의존성 설포트랜스퍼라제 효소를 포함하는 융합 단백질을 포함한다. 추가의 구현예에서, 발현 벡터는 이로부터 폴리-His 태그, MBP, 또는 SUMO를 임의의 아릴 설페이트-의존성 설포트랜스퍼라제 효소와 함께 포함하는 융합 단백질이 발현될 수 있는, 폴리-His 태그 및 malE 유전자 또는 SUMO 유전자를 암호화하는 핵산 서열 둘 다를 포함할 수 있다.
형질전환된 세포를 생산하는데 유용한 진핵 세포 및 세포주는 포유동물 세포(예컨대, 내피 세포, 비만 세포, COS 세포, CHO 세포, 섬유아세포, 하이브리도마, 난모세포, 배아 줄기 세포), 곤중 세포주(예컨대, 드로소필리 슈나이더(Drosophila Schneider) 세포), 효모, 및 진균을 포함한다. 이러한 세포의 비-제한적 예는 COS-7 세포, CHO, 세포, 쥐 1차 심장 미세혈관 내피 세포(CME), 쥐 비만 세포주 C57.1, 사람 제대 혈관의 1차 내피 세포(primary endothelial cells of umbilical vein)(HUVEC), F9 배아 암종 세포, 랫트 지방 패드 내피 세포(rat fat pad endothelial cell)(RFPEC), 및 L 세포(예컨대, 쥐 LTA tk- 세포)를 포함하나, 이에 한정되지 않는다.
벡터는 당해 분야에 잘 공지된 다양한 방법, 예를 들면, 그러나 이에 한정되지 않는, 인산칼슘 형질감염, 인산스트론튬 형질감염, DEAE 덱스트란 형질감염, 전기천공, 지질감염, 미세주사, 미세-비드 상의 발리스틱 삽입(ballistic insertion), 원형질체 융합에 의해 또는, 바이러스 또는 파아지 벡터의 경우, 재조합 바이러스 또는 파아지를 사용한 형질감염에 의해 수용체 또는 "숙주" 세포내로 도입될 수 있다.
다른 구현예에서, 본 발명은 보존적 또는 비-보존적 치환이 상기된 가공된 설포트랜스퍼라제 아미노산 서열 내 특정 잔기에 대해 이루어진 아릴 설페이트-의존성 설포트랜스퍼라제 변이체를 제공한다. 보존적 또는 비-보존적 치환은 활성 부위들 둘러싸거나 촉매작용에 포함된 잔기를 포함하는, 아미노산 서열내 임의의 지점에서 이루어질 수 있으며, 단, 효소는 측정가능한 촉매 활성; 즉, 아릴 설페이트 화합물로부터 다당류, 특히 헤파로산-계 및/또는 HS-다당류로 설포 그룹의 전달을 보유한다. 다른 구현예에서, 아릴 설페이트 화합물은 PNS이다. 여전히 다른 구현예에서, 아릴 설페이트 화합물은 NCS이다.
다른 구현예에서, 아릴 설페이트-의존성 설포트랜스퍼라제 효소는 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 및 서열 번호: 33-54 및 56-61으로 개시된 것을 포함하는, 상기 개시된 임의의 가공된 설포트랜스퍼라제 효소의 아미노산 서열에 대해 적어도 50%, 예를 들면, 적어도 60%, 70%, 80%, 85%, 90% 또는 95% 내지 적어도 99%의 아미노산 서열 동일성을 가지지만, 아릴 설페이트 화합물로부터, 다당류, 특히 헤파로산-계 및/또는 HS 다당류로 설포 그룹의 전달의 이의 촉매 활성을 유지한다. 이러한 서열은 당해 분야의 통상의 기술자에 의해 통상적으로 생산될 수 있고, 설포트랜스퍼라제 활성은 본원에 기술된 것과 같은 통상의 방법으로 시험할 수 있다.
또한, 및 다른 구현예에서, 본원에 기술된 임의의 방법에 따라 이용된 임의의 가공된 아릴 설페이트-의존성 설포트랜스퍼라제의 아미노산 서열(들)은, 설포트랜스퍼라제가 아릴 설페이트-의존성 활성을 가지는 한, 설포 공여체로서 3'-포스포아데노신 5'-포스포설페이트를 사용하여 동일한 반응을 촉매하는 야생형 설포트랜스퍼라제에 대해 동일성 퍼센트로서 특징화될 수 있다. 예를 들면, 및 다른 구현예에서, 본 발명의 임으의 방법에 따라 이용될 수 있는 가공된 아릴 설페이트-의존성 글루코사미닐 N-설포트랜스퍼라제는 이의 생물학적 기능적 단편을 포함하는, EC 2.8.2.8의 아미노산 서열과 적어도 50%, 예를 들면, 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 내지 적어도 97% 이하의 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다. 추가의 구현예에서, 가공된 아릴 설페이트-의존성 글루코사미닐 N-설포트랜스퍼라제는 야생형 사람 글루코사미닐 N-데아세틸라제/N-설포트랜스퍼라제 효소(entry sp|P52848|NDST_1_사람, 상기 도 3)의 N-설포트랜스퍼라제 도메인의 아미노산 서열과 적어도 50%, 예를 들면, 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 내지 적어도 97% 서열 동일성을 포함할 수 있다.
다른 구현예에서, 본 발명의 방법에 따라 사용될 수 있는 가공된 아릴 설페이트-의존성 헥수로닐 2-O 설포트랜스퍼라제는, 이의 생물학적 기능성 단편을 포함하는, EC 2.8.2.- 효소 부류 내에서 임의의 야생형 헥수로닐 2-O 설포트랜스퍼라제 효소의 아미노산 서열과 적어도 50%, 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 적어도 97% 이하의 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다. 추가의 구현예에서, 가공된 아릴 설페이트-의존성 헥수로닐 2-O 설포트랜스퍼라제는 야생형 닭 헥수로닐 2-O 설포트랜스퍼라제 효소(entry sp|Q76KB1|HS2ST_CHICK, 상기 도 14a - 14d)의 아미노산 서열과 적어도 50%, 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 적어도 97% 이하의 서열 동일성을 포함할 수 있다.
다른 구현예에서, 본 발명의 방법에 따라 사용될 수 있는 가공된 아릴 설페이트-의존성 글루코사미닐 6-O 설포트랜스퍼라제는, 이의 생물학적 기능성 단편을 포함하는, EC 2.8.2.- 효소 부류 내에서 임의의 야생형 글루코사미닐 6-O 설포트랜스퍼라제 효소의 아미노산 서열과 적어도 50%, 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 적어도 97% 이하의 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다. 추가의 구현예에서, 가공된 아릴 설페이트-의존성 글루코사미닐 6-O 설포트랜스퍼라제는, 마우스 글루코사미닐 6-O 설포트랜스퍼라제(UniProtKB Accession No. Q9QYK5)의 제1 동형의 아미노산 서열과 적어도 50%, 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 적어도 97% 이하의 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다. 추가의 구현예에서, 가공된 아릴 설페이트-의존성 글루코사미닐 6-O 설포트랜스퍼라제는, 마우스 글루코사미닐 6-O 설포트랜스퍼라제(entry Q9QYK5|H6ST1_MOUSE, 상기 도 18a - 18c)의 제1 동형의 아미노산 서열의 잔기 67-377과 적어도 50%, 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 적어도 97% 이하의 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
다른 구현예에서, 본 발명의 방법에 따라 사용될 수 있는 가공된 아릴 설페이트-의존성 글루코사미닐 3-O 설포트랜스퍼라제는, 이의 생물학적 기능성 단편을 포함하는, EC 2.8.2.23 효소 부류 내에서 임의의 야생형 효소의 아미노산 서열과 적어도 50%, 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 적어도 97% 이하의 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다. 추가의 구현예에서, 가공된 아릴 설페이트-의존성 글루코사미닐 3-O 설포트랜스퍼라제는, 야생형 사람 글루코사미닐 3-O 설포트랜스퍼라제(UniProtKB Accession No. O14792)의 제1 동형의 아미노산 서열의 잔기 48-311과 적어도 50%, 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 적어도 97% 이하의 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다.
실질적으로 순수한 아릴 설페이트-의존성 설포트랜스퍼라제는 다양한 적용에서 사용하기 위해 다른 폴리펩타이드 서열과 결합될 수 있다. 따라서, 예를 들면, 가공된 설포트랜스퍼라제는 하나 이상의 추가의 폴리펩타이드에 결합하여 당해 분야에 일반적으로 공지된 바와 같이, 융합 단백질을 형성할 수 있다. 추가의 폴리펩타이드는 아릴 설페이트-의존성 설포트랜스퍼라제 효소의 N-말단, C-말단 또는 말단 둘 다에 결합될 수 있다. 이러한 융합 단백질은 추가의 폴리펩타이드 서열이 용이하게 확인되거나(예컨대, 항원 결정인자를 제공함으로써), 용이하게 정제되거나(예컨대, 친화성 정제를 위한 리간드를 제공함으로써), 용액 속의 가공된 효소의 용해도를 향상시키는 경우 특히 유용할 수 있다.
다른 구현예에서, 실질적으로 순수한 단백질은 완전 아릴 설페이트-의존성 설포트랜스퍼라제의 아미노산 서열의 부위 또는 단편 만을 포함할 수 있다. 일부 예에서, 특히 최소의 단편이 효소의 용해도 또는 반응성을 향상시키는 경우, 아릴 설페이트-의존성 설포트랜스퍼라제 활성을 보유하는 최소의 단편을 사용하는 것이 바람직할 수 있다. 따라서, 일부 구현예에서, 본 발명의 방법은, 임의의 길이의 실질적으로 순수한 아릴 설페이트-의존성 설포트랜스퍼라제, 예를 들면 전체 길이 형태, 이의 최소의 기능적 단편의 실질적으로 순수한 아릴 설페이트-의존성 설포트랜스퍼라제를 사용하여 실시할 수 있다. 추가로, 이러한 단백질은 또한 상술한 바와 같은 보존적 또는 비-보존적 치환 변이체를 포함할 수 있다.
몇몇 구현예에서, 본 발명은, 상기된 임의의 아미노산 서열을 포함하는 것을 포함하여, 실질적으로 순수한 아릴 설페이트-의존성 설포트랜스퍼라제의 제조를 제공한다. 가공된 설포트랜스퍼라제는 이의 단백질 서열에 의해 나타난 특성을 기반으로 임의의 다양한 방법에 의해 실질적으로 정제될 수 있다. 전형적으로, 아릴 설페이트-의존성 설포트랜스퍼라제, 이의 융합 단백질, 또는 단편은 상술한 바와 같은 발현 벡터로 형질전환되거나 형질감염된 세포로부터 정제될 수 있다. 곤충, 효모, 진핵 세포, 또는 원핵 세포 발현 시스템을 사용할 수 있고, 당해 분야에 잘 공지되어 있다. 단백질 또는 단편이 골지체, 소포체, 또는 이러한 세포의 다른 막-함유 구조로부터 유래된 미소체내에 국재화된 경우, 단백질은 적절한 세포 분획으로부터 정제될 수 있다. 대안적으로, 단백질이 이러한 구조내에 국재화되지 않거나, 재조합 세포(예컨대, 원핵 세포)내에 봉입체(inclusion body) 속에 응집되는 경우, 단백질은 표준 수단에 의해 전체 분해된 세포로부터 또는 가용화된 봉입체로부터 정제될 수 있다.
정제는 표준 단백질 정제 과정, 예를 들면, 그러나 이에 한정되지 않는, 친화성 크로마토그래피, 겔-여과 크로마토그래피, 이온-교환 크로마토그래피, 고-성능 액체 크로마토그래피(RP-HPLC, 이온-교환 HPLC, 크기-배제 HPLC), 고-성능 크로마토포커싱 크로마토그래피(high-performance chromatofocusing chromatography), 소수성 상호작용 크로마토그래피, 면역침전, 또는 면역친화성 정제를 사용하여 달성할 수 있다. 겔 전기영동(예컨대, PAGE, SDS-PAGE)을 또한 사용하여 이의 분자량, 전하 특성 및 소수성을 기반으로 단백질 또는 펩타이드를 단리할 수 있다.
아릴 설페이트-의존성 설포트랜스퍼라제, 또는 이의 단편은 또한 다른 펩타이드, 예를 들면, 항원성 결정인자, 폴리-히스티딘 태그(예컨대, QIAexpress 벡터, QIAGEN Corp., 캘리포니아주 채쓰워쓰 소재), 또는 보다 큰 단백질(예컨대, pGEX-27 벡터를 사용한 GST(Amrad, USA), Green Lantern 벡터를 사용하는 녹색 형광성 단백질 (GlBCO/BRL. 메사츄세츠주 게이터스버그 소재), pMAL 벡터를 사용하는 말토즈 결합 단백질(New England Biolabs, 메사츄세츠주 입스위치 소재), 또는 SUMO 단백질에 융합된 목적한 서열을 포함하는 융합 단백질을 생성시킴으로써 편리하게 정제할 수 있다. 융합 단백질은 원핵 또는 진핵 세포로부터 발현 및 회수할 수 있고 융합 벡터 서열을 기반으로 임의의 표준 방법에 의해 정제할 수 있다. 예를 들면, 융합 단백질은 융합의 비-아릴 설페이트-의존성 설포트랜스퍼라제 부위에 대한 항체를 사용한 면역친화성 또는 면역침전에 의해 또는, 폴리-His 태그의 경우에, 니켈 컬럼에 대한 친화성 결합에 의해 정제할 수 있다. 이후에, 목적한 아릴 설페이트-의존성 설포트랜스퍼라제 단백질 또는 단편을 융합 단백질로부터 융합 단백질의 효소적 절단에 의해 추가로 정제할 수 있다. 단백질의 정제를 위한 이러한 융합 작제물의 제조 및 사용 방법은 당해 분야에 잘 공지되어 있고 이러한 목적을 위해 현재 상업적으로 이용가능하다.
또한, 일부 구현예에서, 임의의 아릴 설페이트-의존성 설포트랜스퍼라제를 암호화하는 단리된 핵산을 사용하여 숙주 세포를 형질전환시킬 수 있다. 수득되는 단백질은 이후에 잘 공지된 방법, 예를 들면, 그러나 이에 한정되지 않는, 하기 실시예에 기술된 것으로 실질적으로 정제할 수 있다. 대안적으로, 단리된 핵산은 세포-유리된 시험관내 해독 시스템에서 이용할 수 있다. 이러한 시스템은 또한 당해 분야에 잘 공지되어 있다.
본 발명의 특수한 구현예가 기술되었지만, 본 발명은 본 개시내용의 취지 및 영역내에서 추가로 변형될 수 있다. 당해 분야의 기술자는 단지 통상의 실험, 구체적인 과정에 대한 다수의 등가물, 본원에 기술된 구현예, 청구범위, 및 실시예를 사용하여 인식하거나, 확인할 수 있다. 따라서, 이러한 등가물은 본 발명의 영역내에 있는 것으로 고려되며, 따라서, 본 출원은 이의 일반적인 원리를 사용한 본 발명의 임의의 변화, 사용 또는 개조를 포함하는 것으로 의도된다. 또한, 본 발명은 본 개시내용으로부터 이러한 이탈을 본 발명이 속하고 첨부된 청구범위내에 속하는 당해 분야에 공지되거나 통상의 실시내에 있는 것으로 포함하는 것으로 의도된다.
명확성을 위해, 별도의 구현예의 문맥에 기술된, 본 발명의 특정 특징은 또한 단일 구현예에서 함께 제공될 수 있음이 인정된다. 역으로, 간략성을 위해, 단일 구현예의 문맥에서 기술된 본 발명의 다양한 특징은 또한 별도로 또는 임의의 적합한 소-조합으로 또는 본 발명의 임의의 다른 기술된 구현예에서 적합한 것으로서 제공될 수 있다. 다양한 구현예의 문맥에서 기술된 특정의 특징은 구현예가 이러한 요소없이 작동되지 않는 한, 이러한 구현예의 필수적인 특징으로 고려되지 않아야 한다.
본 명세서에 언급된 모든 참고문헌, 특허, 및 특허원의 내용은 본원에 참고로 포함되며, 이러한 참고문헌이 본 발명에 대한 선행 기술로 이용가능함을 인정하는 것으로 고려되지 않아야 한다. 본 명세서에 포함된 공보 및 특허원 모두는 본 발명이 속한 당해 분야의 통상의 기술 수준의 지표이며, 각각의 개개 공보 또는 특허원이 구체적으로 나타내어지고 참고로 개별적으로 나타내어진 경우와 동일한 정도로 포함된다.
본 발명은 또한 다음의 작업 및 예측 실시예에 의해 추가로 나타내어지며, 이들 중 어느 것도 본 발명을 제한하는 것으로 고려되지 않아야 한다. 또한, 단락 제목이 사용된 정도까지, 이들은 필수적으로 제한하는 것으로 고려되지 않아야 한다. 구조적 또는 예측적인 것으로 달리 나타낸 실시예를 기술하기 위한 과거시제의 임의의 사용은 구성 또는 예측 실시예가 실제로 수행되었음을 반영하기 위한 것이 아니다.
실시예
다음의 작업 및 예측 실시예는 현재 가장 잘 알려진 본 발명의 구현예를 나타낸다. 그러나, 다음은 본 발명의 원리 적용을 단지 예시하거나 설명하는 것임이 이해되어야 한다. 다수의 변형 및 대안의 조성물, 방법, 및 시스템은 본 발명의 취지 및 영역으로부터 벗어나지 않고 당해 분야의 기술자에 의해 고안될 수 있다. 따라서, 본 발명이 위에서 상세히 기술되었지만, 다음의 실시예를 본 발명의 가장 실제적이고 바람직한 구현예인 것으로 현재 고려되는 것과 관련하여 추가로 상세히 제공한다.
실시예 1: 가공된 아릴 설페이트-의존성 설포트랜스퍼라제의 클로닝, 발현, 및 정제
연구는 본 개시내용의 구현예에 따라서 본 발명에 따른 유전자가 가공된 아릴 설페이트-의존성 설포트랜스퍼라제를 과발현할 수 있는 숙주 세포내로 형질전환될 수 있는지를 측정하기 위해 수행되었다. 발현 후, 각각의 아릴 설페이트-의존성 효소를 숙주 세포로부터 단리하고 정제하였다.
일반적으로, 임의의 서열의 유전자를 암호화하는 DNA를 당해 분야에 일반적으로 공지된 방법, 예를 들면, 그러나 이에 한정되지 않는, 올리고뉴클레오타이드 합성 및 어닐링(annealing)에 의해 새로이 합성할 수 있다. 대안적으로, DNA는 상업적으로 합성, 및 ThermoFisher Scientific, GenScript, DNA 2.0, 또는 OriGene을 포함하나, 이에 한정되지 않는, 주어진 서열의 유전자를 정기적으로 합성하는 수개의 실험실 중 임의의 하나로부터 구입할 수 있다. 당해 분야의 기술자는 동일한 서비스를 제공하는 수개의 회사가 존재하며, 상기 제공된 목록은 단지 이의 작은 샘플임을 인식할 수 있다. 목적한 유전자는 독립적으로 합성하고 후속적으로 통상의 분자 생물학 기술을 사용하여 세균 또는 다른 발현 벡터내로 삽입시킬 수 있거나, 유전자를 발현 벡터 자체를 포함하는 DNA를 사용하여 동시에 합성할 수 있다. 목적한 유전자와 유사하게, 적합한 발현 벡터를 또한 합성하거나 상업적으로 구입할 수 있다. 흔히, 세균 발현 벡터는 숙주 세포에 대해 선택적 항생제 내성을 부여하는 유전자 뿐만 아니라, 세포가 이소프로필 β-D-1-티오갈락토피라노시드(IPTG)의 첨가에 반응하여 목적한 단백질을 과발현하도록 하는 유전자를 포함한다. IPTG를 사용하여 단백질 발현을 유도함에 의한 목적한 단백질의 세균 생산은 당해 분야에 널리 알려져 있다.
상술한 바와 같이, 발현 벡터는 추가의 공지된 단백질과 동시 발현되어 단백질 폴딩(folding) 및 용해도를 보조하는 융합 단백질의 생성을 가능하도록 하는 유전자를 또한 포함할 수 있다. 일반적으로 생산되고 당해 분야에 잘 공지된 융합 단백질의 비-제한적인 예는 MBP, SUMO, 또는 녹색 형광성 단백질과의 융합물을 포함한다. 특히, MBP 융합 단백질은 MBP가 일부 친화성 크로마토그래피에 사용된 아밀로스-계 수지에 대해 높은 친화성을 지니므로 보다 용이한 정제를 촉진하지만, SUMO 융합 단백질은 정지상(stationary phase)으로서 Ni2+-계 수지를 지닌 컬럼 상에서 친화성 정제를 가능하게 하는 폴리-히스티딘 태그를 포함할 수 있다. 흔히, 목적한 단백질과 MBP 및/또는 SUMO 사이의 융합 단백질은 흔히 2개의 단백질을 연결시키는 아미노산 연결 서열을 포함할 수 있다. MBP 융합 단백질을 생산하기 위해 구입할 수 있는 상업적인 발현 벡터의 비-제한적인 예는 pMAL-c5E™ 및 pMAL-c5X™ 벡터를 포함하며, 이는 New England Biolabs로부터 구입할 수 있다. 유사하게, 및 다른 비-제한적인 예에서, 상업적인 발현 벡터, 예를 들면, LifeSensors, Inc로부터 이용가능한 pE-SUMOpro AMP 벡터를 또한 구입하여 SUMO 융합 단백질을 생산할 수 있다. 융합 단백질이 생산되어 분리되면, 프로테아제를 이용하여 융합된 단백질 및, 절단이 활성에 필수적인 경우, 설포트랜스퍼라제로부터 임의의 관련된 연결 서열을 절단시킬 수 있다.
또한, 발현 벡터는 목적한 단백질의 N- 또는 C-말단에서 합성될 수 있는 폴리-히스티딘 태그를 암호화하는 DNA를 또한 포함할 수 있다. MBP 융합과 같이, 폴리-히스티딘 태그를 포함하는 단백질은, 이러한 태그가 많은 정제 컬럼에서 이용되는 Ni2+ 수지에 대해 높은 친화성을 가지므로 효소 정제를 단순화시킨다. 추가로, 폴리-히스티딘 태그가 효소의 최적의 활성에 필수적인 경우 이를 정제 후 임의로 절단할 수 있다. C-말단 폴리-히스티딘 태그를 암호화하는 발현 벡터의 비-제한적인 예는 Novagen으로부터 이용가능한 pET21b 벡터이다. 폴리-히스티딘 태그를 암호화하는 발현 벡터의 다른 비-제한적 예는 pE-SUMO 벡터이며, 이는 SUMO 단백질의 N-말단에서 폴리-히스티딘 태그를 암호화한다.
본 실시예에서, 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 14, 서열 번호: 16, 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 24, 서열 번호: 26, 또는 서열 번호: 28의 아미노산 서열 각각을 포함하는 가공된 아릴 설페이트-의존성 설포트랜스퍼라제를 암호화하는, 서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11, 서열 번호: 13, 서열 번호: 15, 서열 번호: 17, 서열 번호: 19, 서열 번호: 21, 서열 번호: 23, 서열 번호: 25, 서열 번호: 27의 뉴클레오타이드 서열을 포함하는 이중-가닥 DNA 단편을 Integrated DNA Technologies' (IDT) gBlocks® 유전자 단편 합성 서비스(Gene Fragments synthesis service)를 사용하여 합성하였다. 폴리머라제 쇄 반응(PCR)을 개시하여, 발현 벡터내로의 삽입을 촉진시키는 적절한 제한 효소 인식 서열을 포함하는 정방향(forward) 및 역방향(reverse) 프라이머를 사용하여, 각각의 이중-가닥 DNA 단편의 카피를 생성하였다. 가공된 글루코사미닐 N-설포트랜스퍼라제 효소(서열 번호: 1, 서열 번호: 3, 서열 번호: 5, 서열 번호: 7, 서열 번호: 9, 서열 번호: 11) 및 글루코사미닐 3-O-설포트랜스퍼라제 효소(서열 번호: 23, 서열 번호: 25, 서열 번호: 27)를 암호화하는 유전자는 NdeI 및 BamHI 제한 효소 인식 서열을 함유하였으며 pMAL-c5x 발현 벡터 내로 NEB에 의해 제공된 신속한 연결 키트(quick ligation kit)를 사용하여 연결시켰다. 이후에, 발현 벡터를 적격(competent) DH5-α 이. 콜라이 세포내로 형질전환시켰다. 단일의 클론을 100 μL/mL 암피실린이 들어있는 LB 배지 속에서 항온처리하였다. 형질전환된 숙주 세포내 각각의 유전자 및 발현 벡터의 뉴클레오타이드 서열을 시판되는 DNA 서열분석(GeneWiz)으로 확인하였다.
글루코사미닐 N- 및 3-O-설포트랜스퍼라제 효소의 단백질 발현은 확인된 DNA 작제물을 SHuffle® T7 Express lysY 이. 콜라이 세포내로 첫 번째 형질전환시킴으로써 달성되었다. 글루코사미닐 N- 및 3-O-설포트랜스퍼라제 효소의 단백질 발현은 또한 확인된 DNA 작제물을 적격 BL21(DE3) 이. 콜라이 세포내로 형질전환시킴으로써 달성되었다. 어느 하나의 작제물로부터, 수득되는 콜로니를 사용하여 LB 배지 속에서 250 mL 배양물을 접종하고, 이를 32℃에서 대략 0.4 내지 0.6의 600 nM(OD 600)의 광학 밀도가 관찰될 때까지 진탕 및 항온처리하였다. 발현은 100 μM IPTG를 각각의 배양물에 18℃에서 첨가함으로써 유도시켰다.
18℃에서 밤새 항온처리하는 경우, 발현된 세포를 3,620 g에서 원심분리하고 펠렛을 10 mL의 재현탁 완충제(25 mM 트리스-HCl, pH 7.5; 0.15-M-NaCl; 0.2 mg/mL 라이소자임; 10 μg/ml DNase-I; 5 mM MgCl2; 및 0.1% (w/v) 트리톤-X 100) 속에 재현탁시켜 수거하였다. 재현탁된 세포를 빙상에서 각각 10초의 3회 펄스 동안 분해하고, 후속적으로 0.45-μm 주사기 여과기를 통과시켰다. 수득되는 상층액을 25 mM 트리스-HCl, pH 7.5 및 0.15-M-NaCl을 포함하는 Dextrin Sepharose® 수지(GE Biosciences)를 포함하는 5-mL 스핀 컬럼(spin column)(G-biosciences)내로 로딩하였다. 목적한 효소를 25 mM 트리스-HCl, pH 7.5; 0.15-M-NaCl; 및 40 mM 말토즈를 포함하는 용출 완충제 속에 가하여 컬럼으로부터 용출시켰다.
다른 한편, 가공된 헥수로닐 2-O 설포트랜스퍼라제(서열 번호: 13, 서열 번호: 15) 및 글루코사미닐 6-O 설포트랜스퍼라제 효소(서열 번호: 17, 서열 번호: 19, 서열 번호: 21)를 암호화하는 유전자는 BsaI 및 XbaI 제한 효소 인식 서열을 함유하였으며, pE-SUMO 벡터(LifeSensors, Inc.) 내로 연결시켰다. 이후에, 발현 벡터를 적격 BL21-DE3 이. 콜라이 세포내로 형질전환시켰다. 단일 콜로니를 100 μL/mL 암피실린이 들어있는 테리픽 브로쓰(Terrific Broth) 속에서 항온처리하였다. 각각의 유전자의 뉴클레오타이드 서열 및 형질전환된 숙주 세포내 발현 벡터를 시판되는 DNA 서열분석(GeneWiz)으로 확인하였다.
가공된 헥수로닐 2-O 설포트랜스퍼라제 및 글루코사미닐 6-O 설포트랜스퍼라제의 단백질 발현은 암피실린이 들어있는 테리픽 브로쓰 속의 500 mL 배양물을 접종하고 35℃에서 대략 0.6 내지 0.8의 OD 600에 도달할 때까지 진탕하여 항온처리시켰다. 단백질 발현은 0.2 mM IPTG를 18℃에서 첨가하여 유도시켰다. 이후에, 배양물을 18℃에서 밤새 항온처리하고, 후속적으로 분해하고 상기한 글루코사미닐 N- 3-O-설포트랜스퍼라제 효소와 동일한 과정을 사용하여 여과하였다. 헥수로닐 2-O 설포트랜스퍼라제 및 글루코사미닐 6-O 설포트랜스퍼라제 효소를 25 mM 트리스-HCl, pH 7.5, 0.15-M-NaCl, 5 mM MgCl2, 및 30 mM 이미다졸을 포함하는 결합 완충제 속에 현탁된 HisPur Ni-NTA 수지(Thermofisher)를 포함하는 5 mL 스핀 컬럼(G-biosciences) 속에서 후속적으로 정제하였다. 목적한 효소는 25 mM 트리스-HCl, pH 7.5, 0.15-M-NaCl, 5 mM MgCl2, 및 300 mM 이미다졸을 포함하는 용출 완충제를 첨가함으로써 컬럼으로부터 용출하였다.
실시예 2: 가공된 아릴 설페이트-의존성 글루코사미닐 N- 설포트랜스퍼라제 효소의 N- 황산화된 다당류 생성물의 질량 분광법적 특성화
연구를 본 개시내용의 구현예에 따라 수행하여 이의 설포전달 반응의 결과로서 형성된 N-황산화된 다당류 생성물의 존재를 질량 분광법(MS)으로 검출함으로써, 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 또는 서열 번호: 12의 아미노산 서열을 포함하는 효소의 글루코사미닐 N-설포트랜스퍼라제 활성을 확인하였다. 각각의 가공된 효소를 실시예 1의 과정에 따라 정제하였다. 설포트랜스퍼라제 활성을 50 μM의 효소를 함유하는 100 μL의 반응물 속에서 모니터링하였다. 각각의 정제된 단백질 용액에, 20 mg의 아릴 설페이트 화합물(PNS 또는 NCS 중 어느 하나)를 2 mL의 반응 완충제(50 mM MES pH 7.0, 2 mM CaCl2) 속에 용해하고, 단백질 용액에 가하고, 37℃에서 10분 동안 항온처리하였다. 2.5 mL의 N-탈아세틸화된 헤파로산의 2 mg/mL 용액을 단백질/공여체 용액에 가하고 37℃에서 밤새 항온처리하였다. N-탈아세틸화된 헤파로산을 문헌: Balagurunathan, K. et al (eds.) (2015), Glycosaminoglycans: Chemistry and Biology, Methods in Molecular Biology, vol. 1229, DOI 10.1007/978-1-4939-1714-3_2, ⓒSpringer Science+Business Media, New York, pp. 11-19 (section 3.1)에 기술된 프로토콜에 따라 합성하였다. N-황산화된 생성물을 정제하기 위하여, 항온처리된 반응 혼합물을 다음날 5,000 x g에서 10분 동안 원심분리하였다. 여과기를 2 mL의 물로 1회 세척하고, 다시 원심분리하였다. 여액을 1K MWCO 투석 막에 가하고, 2일 동안 Milli-Q water 속에서, 1 h, 2 h, 8 h, 16 h, 32 h 째에 물을 교환하면서 투석한 다음, 동결건조시켰다.
각각의 반응물로부터 동결건조된 N-황산화된 생성물을 헤파로산-계 다당류의 β-제거 절단을 촉매하는, 서열 번호: 30, 서열 번호: 31, 및 서열 번호: 32의 아미노산 서열을 포함하는 3개의 탄소-산소 분해물의 혼합물로 후속적으로 분해하였다. 이러한 분해물은 다른 화학 및 생물학 회사 중에서 New England Biolabs로부터 이용가능하다. 1 μL의 각각의 분해물을 50 μg의 동결건조된 황산화된 다당류 생성물 및 제공된 분해 완충제와 함께 항온처리하고, 24시간에 걸쳐 각각의 리아제를 사용하여 New England Biolabs에 의해 제공된 포장된 설명서에 따라 항온처리하였다. 분해 후, 리아제 효소를 100℃로 5분 동안 가열하여 불활성화시켰다. 샘플을 14,000 rpm에서 30분 동안 원심분리한 후 강력한 이온 교환, 고 성능 액체 크로마토그래피(SAX) 분석에 도입하였다. SAX 분석은 Dionex Ultimate 3000 LC 시스템 인터페이스에서 수행하였다. 분리는 5.0 m 입자 크기를 지닌 4.6250 mm Waters Spherisorb 분석 컬럼에서 45℃에서 수행하였다. 이동상 용액 A는 2.5 mM 인산나트륨, pH 3.5이지만, 이동 상 용액 B는 2.5 mM 인산나트륨, pH 3.5, 및 1.2 M 과염소산나트륨이었다. 각각의 샘플을 컬럼에 로딩한 후, 이동 상 용액을 컬럼에 98% 이동상 용액 A 및 2% 이동상 용액 B의 비로 5분 동안 1.4 mL/min의 유동 속도에서 적용시켰다. 5분 후, 증가하는 이동상 용액 B의 선형 구배를 이동상 용액 A 대 이동상 용액 B의 비가 50:50이 될 때까지 적용하였다.
SAX 분석을 사용하여, 시험한 효소 중 모두 6개는 설포트랜스퍼라제로서 활성인 것으로 측정되었다. 그러나, 설포트랜스퍼라제 각각은 PNS 및 NCS 둘 다와 필수적으로 활성이지 않았다. 서열 번호: 2, 서열 번호: 4, 및 서열 번호: 10의 아미노산 서열을 가진 효소는 NCS와만 활성을 가졌고, 서열 번호: 12의 아미노산 서열을 가진 효소는 PNS와만 활성을 가졌다. 서열 번호: 6 및 서열 번호: 8의 아미노산 서열을 가진 효소는 아릴 설페이트 화합물 둘 다와 활성을 가졌다.
N-황산화된 생성물의 존재를 나타내는 SAX 분석으로부터의 대표적인 크로마토그램을 도 26에 나타낸 반응의 결과로서 생산하였다. 출발 물질 및 생성물을 서열 번호: 30, 서열 번호: 31, 및 서열 번호: 32의 아미노산 서열을 갖는 리아제를 사용하여 상술한 분해 과정에 따라 분해하였다. Iduron, Ltd로부터 상업적으로 이용가능한 2개의 이당류 표준(HD005 및 HD013)을 SAX를 사용하여 또한 분석하였다. HD013 이당류는 비치환된 글루코사민 잔기 및 환원된 헥수론산을 포함하였다. HD005 이당류는, 글루코사민 잔기가 N-황산화된 것을 제외하고는 HD013과 동일하다. 오버레이된(overlaid) 크로마토그램 모두를 표준화함으로써 각각의 크로마토그램에서 가장 우세한 피크에 1.0의 표준화된 상대적인 형광성 값을 지정한다.
도 26에 나타낸 바와 같이, HD013 이당류(* 기호로 나타냄)에 대한 가장 우세한 피크는 거의 즉시 용출되나, HD005 이당류(** 기호로 나타냄)에 대한 가장 우세한 피크는 대략 17분 후 용출된다. 이는, 양으로 하전된 종(HD013과 같은)이 전형적으로 컬럼에 결합하지 않는 반면, 음으로 하전된 종(HD005와 같은)은 컬럼에 결합하므로, SAX 조건 하에서 예측된다. 유사하게 비-황산화된, N-탈아세틸화된 헤파로산은 HD013과 거의 동일한 시간에 가장 우세하게 용출된다. 유사하게, 반응 동안 생산된 동결건조된 샘플은 HD005와 거의 동일한 시간에 피크를 나타내며, 이는 샘플이 N-황산화된 생성물을 함유함을 나타낸다. 각각의 크로마토그램 내, 특히 합성된 출발 물질 및 생성물내에서 다른 피크는 각각의 예에서 다당류를 정제하는 단독 기준으로서 스핀-여과 컬럼의 사용을 기반으로 한 샘플 순도의 결여를 나타낸다. 당해 분야의 기술자는 보다 정제된 생성물이 요구되는 경우 이용될 수 있는 수개의 다른 분리 기술이 존재함을 인식할 수 있다. 또한, 크로마토그램에서 형광성 신호의 기본선의 상향 이동은 증가하는 양의 염이 이동상을 통해 컬럼에 도입되는 경우 알려진 현상이다.
실시예 3: 가공된 아릴 설페이트-의존성 헥수로닐 2 -O 설포트랜스퍼라제 효소의 2- O 황산화된 다당류 생성물의 질량 분광법적 특성화
설포 수용체 다당류가 시판되는 UF-HS이고 여기서 2-O 설페이트 그룹은 화학적 수단(생성물-DSH001/2, Galen Laboratory Supplies로부터 이용가능)에 의해 선택적으로 제거되고 황산화된 생성물을 함유하는 분해된 샘플 각각의 분석은 SAX-기초 고 성능 액체 크로마토그래피(LCMS)와 결합한 질량 분광법을 사용하여 수행하는 것을 제외하고는, 연구를 본 개시내용의 구현예에 따라 수행하여, 이의 설포전달 반응의 결과로서 형성된 2-O 황산화된 다당류 생성물의 존재를 실시예 2에서와 유사한 과정을 사용하여 검출함으로써, 서열 번호: 14 또는 서열 번호: 16의 아미노산 서열을 포함하는 효소의 헥수로닐 2-O 설포트랜스퍼라제 활성을 확인하였다.
실시예 2에서 상술된 과정에 따라 서열 번호: 30, 서열 번호: 31, 및 서열 번호: 32 의 아미노산 서열을 갖는 탄소-산소 리아제를 사용하여 2-O 황산화된 생성물을 분해함으로써 수득한 이당류를 Shimadzu LCMS-8050 Triple Quadrupole 액체 크로마토그래피 질량 분광기로 정량화하였다. 100-ng의 각각의 분해된 샘플을 10-mM 중탄산암노늄(pH 10) 속에 희석시켰다. 이당류를 Thermo Hypercarb HPLC 컬럼(100x2.1 mm, 5 μm)에서 분리하였다. 이동 상은 10 mM 중탄산암모늄(pH 10)으로 이루어졌고, 이당류는 0% 내지 20%의 아세토니트릴 구배로 2.5분 동안 용출시키고, 다음 2.5분 동안 20%에서 유지시키고, 다음 주사 전 0%에서 2분 평형시켰으며; 유동 속도는 0.2 mL/min이었고, 총 작동 시간은 7.1 분이었다.
LCMS로부터 추출된 이온 크로마토그램은 서열 번호: 14 또는 서열 번호: 16의 아미노산 서열을 갖는 가공된 효소를 지닌 반응물로부터 수득된 2-O 황산화된 생성물에 상응하는, 도 27a 및 도 27b에 나타낸다. 피크를 일련의 8개의 이당류 표준물의 크로마토그램 뿐만 아니라, 100 ng의 시판되는 UF-HS 다당류(CAS 코드: 9041-08-1, Millipore Sigma로부터 이용가능)로부터의 크로마토그램과 비교하였고, 이를 또한 리아제 혼합물을 사용하여 분해하였다. 8개의 참고 이당류 표준(D0A0, D0S0, D0A6, D2A0, D0S6, D2S0, D2A6, D2S6)은 N-, 2-O 및 6-O 위치에서 다양하게 황산화되는 이당류를 나타낸다. 특히, 이당류 D2S0는 2-O 위치에서 황산화된 헥수로닐 잔기 및 N-황산화된 글루코사민 잔기를 갖는 이당류를 나타낸다. 이당류 표준(나타내지 않음), 분해된 시판 황산화된 다당류(나타내지 않음), 및 서열 번호: 14 또는 서열 번호: 16의 아미노산 서열을 갖는 황산화된 다당류 생성물로부터의 스펙트럼으로부터의 보유 시간 및 피크 영역을 하기 표 1에 수집한다. 각각의 개개 이당류의 이온화는 상이하므로, EIC 크로마토그램에서 현재의 퍼센트는 이의 실제 풍부성을 나타내지 않을 수 있다. 그러나, 이온화 효율은 샘플 간에 각각의 이당류에 대해 동일하다. 따라서, 샘플 간에 동일한 이당류의 피크 영역 퍼센트를 비교하는 것은 여전히 달성될 수 있는 것으로 여겨진다.
Figure pct00122
가공된 효소의 설포트랜스퍼라제 활성을 반응 전 이미 탈황산화된 설포 수용체 다당류 내에서 헥수론산 잔기의 2-O 위치에서 재-황산화에 의해 확인하였다. 이는 가공된 효소 및 NCS 둘다의 반응으로부터 단리된 생성물 내에서 D2SO 이당류의 존재로 나타내어진다. 특수한 이론에 제한되지 않고, 가공된 효소의 활성은, 헥수론산 잔기가 N-황산화되어 있지만 6-O 황산화되지 않은 글루코사민 잔기에 인접한 다당류의 부위와 반응시 의존성인 것으로도 여겨진다. 이는 단리된 황산화된 다당류 생성물내에서 검출된 D2S6(2-O 황산화된 헥수론산 잔기 및 N,6-황산화된 글루코사민 잔기) 및 D2A6(2-O 황산화된 헥수론산 잔기 및 6-O 황산화된 N-아세틸 글루코사민 잔기) 이당류의 결여로 나타내어진다. 이는 EC 2.8.2.- 내에서 야생형 헥수로닐 2-O 설포트랜스퍼라제에 대해 유사한 반응성이며, 이는 화학식 IV 또는 화학식 V의 구조를 포함하는 N-황산화된 헤파로산과 반응하는 것으로 여겨진다.
실시예 4: 가공된 아릴 설페이트-의존성 글루코사미닐 6 -O 설포트랜스퍼라제 효소의 6- O 황산화된 다당류 생성물의 질량 분광법적 특성화
설포 수용체 다당류를 시판되는 UF-HS(CAS 코드: 9041-08-1, Millipore Sigma로부터 이용가능)를 문헌: Kariya, Y., et al., (2000) J. Biol. Chem. 275 (34):25949-25958)에 의해 제공된 과정에 따라 화학적으로 6-O 탈황산화시켜 제조하는 것을 제외하고는, 연구를 본 개시내용의 구현예에 따라 수행하여 실시예 3에서와 같은 유사한 LCMS 과정을 사용하여, 이의 설포전달 반응의 결과로서 6-O 황산화된 다당류 생성물의 존재를 검출함으로써 서열 번호: 18, 서열 번호: 20, 또는 서열 번호: 22의 아미노산 서열을 포함하는 효소의 글루코사미닐 6-O 설포트랜스퍼라제 활성을 확인하였다.
서열 번호: 18, 서열 번호: 20, 또는 서열 번호: 22의 아미노산 서열을 갖는 가공된 효소와의 반응으로부터 수득한 6-O 황산화된 생성물에 상응하는 추출된 이온 크로마토그램을 도 28a, 도 28b, 및 도 28c 각각에 나타낸다. 서열 번호: 18 및 서열 번호: 20의 서열을 갖는 효소는 NCS가 설포 그룹 공여체인 경우 활성이었지만, 서열 번호: 22의 서열을 갖는 효소는 PNS가 설포 그룹 공여체인 경우 활성이었다. 지정된 피크는 8개의 참고 이당류 표준의 측정된 보유 시간을 기반으로 하였다. 8개의 참고 이당류 표준(D0A0, D0S0, D0A6, D2A0, D0S6, D2S0, D2A6, 및 D2S6)은 N-, 2-O, 및 6-O 위치에서 다양하게 황산화된 이당류를 나타낸다. DOA6, D0S6, D2A6, 및 D2S6은 6-O 황산화된 글루코사민 잔기를 포함한다. S6은 N,6-황산화된 글루코사민 잔기를 나타내지만, A6은 6-O 황산화된 N-아세틸 글루코사민 잔기를 나타낸다. 각각의 크로마토그램은 2-O 위치에서 각각 비황산화되거나 황산화된 헥수론산 잔기에 인접한, N,6-황산화된 글루코사민 잔기의 합성과 관련된, 2개의 통합가능한 피크, D0S6 및 D2S6을 나타낸다. 모든 표지된 이당류의 피크 면적%는 하기 표 2에 있다. 각각의 개개 이당류의 이온화는 필수적으로 D0A0 및 D2S6의 경우 상이하므로, EIC 크로마토그램의 현재의 피크는 이의 실제 풍부성을 나타내지 않을 수 있다. 그러나, 이온화 효능은 샘플 간에 각각의 이당류에 대해 동일하다. 따라서, 샘플 간에 동일한 이당류의 피크 영역을 비교하는 것은 여전히 달성될 수 있는 것으로 여겨진다.
Figure pct00123
가공된 효소의 설포트랜스퍼라제 활성을 상기 문헌: Kariya, Y., et al에 따른 과정에 의해 탈황산화된 글루코사민 잔기의 6-O 위치에서 재-황산화함으로써 확인하였다. 이는 각각의 효소를 사용한 반응물로부터 단리된 생성물내 D0S6 및 D2S6 이당류의 존재에 의해 나타내어진다. 각각의 가공된 효소 중에서, D0S6 및 D2S6 이당류의 피크 영역 퍼센트를 비교하는 것을 기반으로, 서열 번호: 22의 아미노산 서열을 가진 글루코사미닐 6-O 설포트랜스퍼라제가 가장 활성인 것으로 여겨진다. 그러나, D0A6 및 D2A6 다당류가 임의의 특수한 이론에 제한되지 않고, 가공된 효소에 의해 생산된 임의의 6-O 황산화된 생성물에서 관찰되지 않지만, 그럼에도 불구하고, 이러한 효소는 특히 효소 및/또는 다당류의 농도를 증가시킴으로써, 상이한 반응 조건에서 설포 그룹을 N-아세틸 글루코사민 잔기로 전달할 수 있는 것으로 여겨지며 여기서 N-아세틸 글루코사민 잔기의 존재는 EC 2.8.2.- 내 천연의 야생형 글루코사미닐 6-O 설포트랜스퍼라제의 반응성을 기반으로, 반응 전에 확인된다.
실시예 5: 가공된 아릴 설페이트-의존성 글루코사미닐 3 -O 설포트랜스퍼라제 효소의 3- O 황산화된 다당류 생성물의 질량 분광법적 특성화
설포 수용체 다당류가 시판되는 UF-HS(CAS 코드: 9041-08-1, Millipore Sigma로부터 이용가능)인 것을 제외하고는, 연구를 본 개시내용의 구현예에 따라 수행하여, 실시예 3에서와 같은 유사한 LCMS 과정을 사용하는 반응을 사용하여, 이의 설포전달 반응의 결과로서, 3-O 황산화된 다당류 생성물의 존재를 검출함에 의해 서열 번호: 24, 서열 번호: 26, 또는 서열 번호: 28의 아미노산 서열을 포함하는 효소의 글루코사미닐 3-O 설포트랜스퍼라제 활성을 확인하였다. 변형되지 않은 UF-HS이 ~3.5%(w/w)의 3-O-황산화된 글루코사민 잔기를 함유한다고 해도, 글루코사민 잔기의 약 ~60%는 N,6-황산화되고, 화학식 X에서와 같이 2-O 황산화된 헥수론산 잔기에 인접한다. 결과적으로, 이러한 N,6-황산화된 글루코사민 잔기는 여전히 3-O 황산화될 수 있다.
추출된 이온 크로마토그램은 일련의 10개의 참고 표준 및, 리아제 혼합물을 사용하여 또한 분해시킨, 100 ng의 시판 다당류의 크로마토그램과 함께, 도 29a 및 도 29b에 나타낸다. 10개의 참고 표준(D0A0, D0S0, D0A6, D2A0, D0S6, D2S0, D2A6, D2S6, D0A6G0S3, 및 D0A6G0S9)은 N-, 2-O, 3-O, 및 6-O 위치에서 다양하게 황산화된 이당류 또는 사당류를 나타낸다(블랙 스펙트럼). 명확성을 위해, 3-O 황산화된 글루코사민 잔기(D0A6G0S3) 및 (D0A6G0S9)을 나타내는 참고 피크는 붉은색으로 도시된 분해된 시판 다당류 스펙트럼에 나타낸다. 서열 번호: 24(PNS, 노란색 스펙트럼), 서열 번호: 26(PNS, 보라색 스펙트럼)(NCS, 초록색 스펙트럼), 및 서열 번호: 28(NCS, 파란색 스펙트럼)의 아미노산 서열을 포함하는 효소와의 반응으로부터 분해된 황산화된 다당류 생성물을 나타내는 4개의 질량 스펙트럼을 하기 시판 다당류 스펙트럼에서 나타낸다. 모든 표지된 이당류 및 사당류의 피크 영역%는 하기 표 3에 있다. 각각의 개개 이당류의 이온화는, 특히 D0A0 및 D2S6의 경우 상이하므로, EIC 크로마토그램에서 현재의 퍼센트는 이의 실제 풍부성을 나타내지 않을 수 있다. 그러나, 이온화 효능은 샘플간에 각각의 이당류 또는 사당류에 대해 동일하다. 따라서, 샘플 간에 동일한 이당류의 피크 영역 퍼센트를 비교하는 것은 여전히 달성할 수 있는 것으로 여겨진다.
Figure pct00124
각각의 가공된 효소의 설포트랜스퍼라제 활성을 시판되는 HF-HS 샘플에 대해 D0A6G0S3(헥수론산-6-O-황산화된 N-아세틸 글루코사민-글루쿠론산-N,3,6-황산화된 글루코사민) 및 D0A6G0S9(헥수론산-6-O-황산화된 N-아세틸 글루코사민-글루쿠론산-N,3-황산화된 글루코사민) 사당류의 풍부성에 있어서의 증가에 의해 확인하였다. 그러나, 서열 번호: 26 PNS 샘플에서 이당류의 총 풍부성은 다른 샘플보다 훨씬 저 적었다. 후속적인 시도는 주입 용적 10배 이상을 사용하여 실험을 재-작동하는 것, 및 샘플을 리아제 혼합물로 재-분해하는 것을 포함하였다. 그럼에도 불구하고, D2S6 이당류만이 발견될 수 있었으며, 이는 초기 단리된 서열 번호: 26 PNS 황산화된 다당류 샘플의 풍부성이 극도로 낮고/낮거나 다당류가 리아제 분해를 견뎌서, 생성물이, 1시간 보다 긴 보유 시간으로 컬럼으로부터 잠재적으로 용출되도록 함을 나타낸다.
그럼에도 불구하고, NMR 연구(하기 실시예 6에서 나타냄)는 PNS가 아릴 설페이트 화합물인 경우 서열 번호: 26의 아미노산 서열을 포함하는 효소를 사용한 3-O 설포트랜스퍼라제 활성을 나타내었다. 또한, 서열 번호: 26의 아미노산 서열을 갖는 효소는 NCS가 아릴 설페이트 화합물인 경우 설포트랜스퍼라제 활성과 같이 활성인 것으로 측정되었다. 따라서, LCMS 실험 동안 서열 번호: 26 PNS 황산화된 다당류 샘플에 대해 관찰된 결과는 실험 목적으로 생산된 샘플로부터 생성되며, 효소 자체의 활성으로부터 생성되지 않는 것으로 여겨진다. 또한, 3-O 황산화의 보다 높은 풍부성이 시판되는 UF-HS 표준에 대해, 서열 번호: 24, 서열 번호: 26, 및 서열 번호: 28로부터의 다른 황산화된 다당류 생성물 모두에서 발견되었다.
실시예 6: 핵 자기 공명을 사용한 가공된 글루코사미닐 3 -O 설포트랜스퍼라제의 설포트랜스퍼라제 활성의 확인
연구를 본 개시내용의 구현예에 따라 수행하여 서열 번호: 24, 서열 번호: 26, 및 서열 번호: 28의 아미노산 서열을 갖는 가공된 효소의 3-O 설포트랜스퍼라제 활성, 특히 설포 그룹 공여체로서 PNS를 지닌 서열 번호: 26의 아미노산 서열을 갖는 효소의 활성을 확인하였다. 각각의 효소를 실시예 1의 과정에 따라 정제하였다. 각각의 정제된 단백질 용액에, 2 mL의 반응 완충제(50 mM MES pH 7.0, 2 mM CaCl2) 속에 용해된 20 mg의 아릴 설페이트 화합물(PNS 또는 NCS)을 단백질 용액에 가하고 37℃에서 10분 동안 항온처리하였다. 2.5 mL의 실시예 5에서 이용된 시판되는 UF-HS 다당류의 2 mg/mL 용액을 단백질/공여체 용액에 가하고 37℃에서 밤새 항온처리하였다.
각각의 반응물을 5,000 x g에서 10분 동안 원심분리하고, 예비-습윤시킨 30K MWCO Amicon-15 여과기에 적용시키고 5,000 xg에서 10분 동안 원심분리하였다. 여과기를 2 mL의 물로 1회 세척하고, 다시 원심분리하였다. 여액을 1K MWCO 투석 막에 가하고, 2일 동안 Milli-Q water 속에서,1 h, 2 h, 8 h, 16 h, 32-h 째에 물을 교환시키면서 투석한 다음, 동결건조시켰다. 건조된, 백색 분말을 400 μL D2O 속에 재현탁시키고, 동결건조시켜 교환가능한 양성자를 제거한 다음, 600 μL D2O 속에 재현탁시키고 NMR 튜브(Wilmad, 0.38 mm x 7")에 전달하였다. 설포전달이 일어나는지를 측정하기 위해, 1H-NMR 스펙트럼을, 물을 억제하면서, Bruker 600 MHz NMR, 32 스캔에서 수득하였다. 전체적인 반응식은 도 30에 나타낸다. 도 30 내에서, 임의의 글루코사민 잔기의 3-O 위치는 글루코사미닐 3-O 설포트랜스퍼라제 효소에 의해 황산화될 수 있다. 황산화된 3-O 위치를 중심 다당류 내에서 원으로 표시한다. 중수소 교환시 공명을 나타내는 능력을 가진 교환가능한 양성자는 하단 다당류에서 굵은 글씨체로 나타낸다. 조 혼합물 피크를 설포 수용체 다당류 및 관련된 3-O 황산화된 생성물에 대한 문헌-참고한 스펙트럼으로 통합하였다.
도 31에서 오버레인(overlain) 스펙트럼에 나타낸 바와 같이, 시판되는 HF-HS에 존재하는 2-O 황산화된 이두론산의 C2 탄소에서 양성자에 상응하는 5.15 ppm에서의 날카로운 피크는 서열 번호: 24, 서열 번호: 26, 및 서열 번호: 28의 아미노산 서열을 포함하는 효소와의 반응시 사라진다. 목적한 양성자는 스펙트럼 위에 나타낸 다당류내에 원으로 표시되어 있다. PNS 및/또는 NCS와의 반응시 서열 번호: 24, 서열 번호: 26, 또는 서열 번호: 28의 아미노산 서열을 포함하는 효소에 의해 합성된 3-O 황산화된 생성물에 대한 1H NMR 스펙트럼을 모두 나타낸다. 각각의 생성물 스펙트럼에서, IdoA2S 피크는 대략 5.0 내지 5.05 ppm 사이에서 이동한다. 유사한 이전이 천연의 사람 설포트랜스퍼라제 효소를 동일한 다당류 기질 및 3'-포스포아데노신 5'-포스포설페이트와 함께 항온처리하는 경우 나타난다(데이타는 나타내지 않음).
도 32에 나타낸 바와 같이, 4.5와 3.5 사이의 영역은 글루코사민 잔기의 3-O 위치에 대한 설페이트 그룹의 첨가에 대한 반응시 유사하게 이동하는 수개의 피크를 나타내며, 이들 모두는 야생형 사람 글루코사미닐 3-O 설포트랜스퍼라제 효소를 동일한 시판되는 UF-HS 기질 및 3'-포스포아데노신 5'-포스포설페이트와 함께 항온처리시 관찰된 동일한 이동과 관련된다. 이동하는 피크는 굽어진 화살표로 나타내며, 서열 번호: 24, 서열 번호: 26, 또는 서열 번호: 28의 아미노산 서열을 갖는 효소에 의해 생산된 3-O 황산화된 다당류로부터의 피크의 위치는 직선 화살포로 나타낸다. 최대 이동은 GlcNS3S6S의 H3에 대해, 3.7-ppm으로부터 4.2 ppm으로 발생한다. 이는 새로이 첨가된 3-O 설페이트 그룹에 가장 근접하여 생성된다. 또한, Ido2S의 H3 양성자 및 GlcNS3S6S의 H5 양성자 둘 다는 4.07 ppm에서 피크를 향해 수렴하며, 이는 2개의 오버래핑 피크를 나타낸다. GlcNS3S6S의 H4는 3.7 ppm 영역으로부터 3.8 ppm 영역으로 적당히 다운필드(downfield) 이동하며, 참고에 따라서, GlcNS6S로부터 H3 & H4와 같은 많은 피크 및 GlcA로부터 H3, H4, 및 H5가 3.7 ppm 영역으로부터 3.6 ppm 영역으로 이동한다.
실시예 7: N- 황산화된 헤파로산의 화학적 합성
연구를 본 개시내용의 구현예에 따라 수행하여 임의의 가공된 아릴 설페이트-의존성 효소, 특히 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소를 사용하여 설포 수용체 다당류로서 사용하기 위한 N-황산화된 헤파로산을 화학적으로 합성하였다. N-탈아세틸화된 헤파로산은 상기 문헌: Balagurunathan, K. et al.에 기술된 프로토콜에 따라 제조하였다. 특히, DEAE 수지로부터 용출된 헤파로산을 아세트산나트륨으로 포화시킨 에탄올 속에서 -30℃에서 밤새 침전시킨 후, 물속에 재현탁시키고, 1,000 Da 분자량 컷-오프(cut-off)(MWCO)를 갖는 셀룰로즈 투석 막 내에서 투석하였다.
헤파로산을 N-탈아세틸화시키기 위해, 충분한 수산화나트륨 펠렛(~4.0 g)을 용해하여 수중 투석된 헤파로산의 40 mL 분취량 속의 2.5 M 용액을 제조하였다. 용액을 55℃에서 16시간 동안, 100 rpm에서 진탕시키면서 항온처리하였다. 이후에, 샘플 속의 수산화나트륨을 용액이 ~7.0의 pH에 도달할 때까지 아세트산으로 중화시킨 다음, 물 속에서 밤새 1,000 MWCO 투석 막내에서 투석시켰다.
N-탈아세틸화된 헤파로산의 후속적인 N-황산화는 100 mg의 탄산나트륨 및 100 mg의 삼산화황-트리에틸아민 복합체를 가하고, 조성물을 48℃에서 모든 고체가 용해될 때까지 항온처리함으로써 달성하였다. 이후에, 용액의 pH를 아세트산을 사용하여 ~9.5로 재조정하였다. 48℃에서 밤새 100 rpm에서 진탕하면서 항온처리한 후, 추가로 100 mg의 탄산나트륨 및 100 mg의 삼산화황-트리에틸아민 복합체를 가한 후, 아세트산을 사용하여 pH를 ~9.5로 후속적으로 재조절하였다. 용액을 48℃에서 추가로 24시간 동안 항온처리하였다. 황산화된 다당류 용액을 아세트산을 사용하여 pH ~7.0으로 중화시키고, 물 속에서 밤새 1,000 MWCO 투석 막내에서 투석하였다. 이후에, 투석된 N-황산화된 헤파로산을 추가의 사용 전에 동결건조시켰다. 이후에, N-황산화된 헤파로산을 Zenix SEC-100 컬럼에 로딩하고 이를 0.1 M 아세트산암모늄, pH 9.0을 사용하여 등용매적으로 용출시킴으로써 추가로 정제하였다.
정제된 헤파로산-계 다당류의 작용화는 이를 서열 번호: 30, 서열 번호: 31, 및 서열 번호: 32의 아미노산 서열을 포함하는 3개의 탄소-산소 리아제의 혼합물로 분해하고, 분해된 샘플을 SAX를 사용하여, 상술한 유사한 과정으로 분석함으로써 특성화하였다. 양성 대조군으로서, N-황산화된 글루코사민 잔기를 함유하는, 실시예 2의 시판 HD005 이당류를 또한 분석하였다. 샘플 둘 다의 대표적인 크로마토그램을 도 33에 나타낸다. 크로마토그램 둘 다에서, 강력한 피크가 약 16.5분에서 나타나며, 이는 합성된 샘플이 N-황산화된 글루코사민 잔기를 함유함을 나타낸다.
실시예 8: N,2-HS 다당류 생성물의 제조
연구를 본 개시내용의 구현예에 따라 수행함으로써, 설포 수용체로서 가공된 헥수로닐 2-O 설포트랜스퍼라제 및 실시예 7에서 합성된 N-황산화된 헤파로산을 사용하여, N,2-HS 다당류 생성물을 합성하였다. 원뿔 바닥 원심분리 튜브에서, 80 mM 분취량의 NCS를 50 mM MES pH 7.0, 2 mM CaCl2 속에 용해하였다. 각각의 용액에, 2-mg의 서열 번호: 14의 서열을 갖는 효소를, 280 nm에서 효소 샘플의 흡광도를 기준으로, 가하였다(약 4 mL). 실시예 7에서 합성된 동결건조된 N-황산화된 헤파로산 5 mg을 1 mL의 물 속에 재현탁시키고 효소 및 NCS를 함유하는 반응 혼합물에 가하였다. 이후에, 전체 반응 혼합물을 34℃에서 30 rpm에서 진탕시키면서 48시간 동안 항온처리하였다. 2 mg의 서열 번호: 29의 아미노산 서열을 포함하는 C5-헥수로닐 에피머라제를 또한 항온처리 전에 반응 혼합물에 가하는 것을 제외하고는, 2개 세트의 반응물을 동일한 과정을 사용하여 제조하였다.
반응물 세트 둘 다로부터의 황산화 다당류 생성물은 우선 반응 용기를 비등하는 물 속에 10분 동안 위치시키고 고속에서 원심분리하여 펠렛을 형성시킴으로써 반응 혼합물로부터 단백질을 침전시켜 정제하였다. 다당류 생성물을 함유하는 상층액을 펠렛으로부터 경사분리하고 1,000 MWCO 투석 막내에서 밤새 물 속에서 투석하였다. 이후에, 투석된 생성물을 추가의 사용을 위해 동결건조시켰다.
다당류 생성물을 특성화하기 위하여, 동결건조된 샘플을 400 μL의 물 속에 재현탁시키고, Q-Sepharose Fast Flow Column(GE Biosciences)을 사용하여 정제하였다. 샘플을 컬럼으로부터 20 mM 아세트산나트륨 완충제, pH 5.0 속에서 0 내지 2M NaCl 범위의 구배를 사용하여 용출시켰다. 이후에, 정제된 다당류를 분해하고 2-O 황산화된 우론산의 이당류 및 N-황산화된 글루코사민을 함유하는, 시판 다당류, HD002(Iduron)와 함께, 상기 실시예 2에서의 과정에 따라 SAX로 분석하였다. 에피머라제 효소의 부재 또는 이를 포함하는 반응물의 대표적인 크로마토그램을 도 34 및 도 35에 각각 나타낸다. 도 34에서, HD002 이당류에 대한 크로마토그램은 약 21.1분에서 단일의, 날카로운 피크를 가지며, 이는 반응 생성물 속의 거의 동일한 시간에서 날카로운 피크와 관련되어 있고, 이는 N,2-HS 생성물이 반응의 결과로서 형성된 시간을 나타낸다. 도 35에서, HD002 이당류는 다른 이당류 표준과, 도 34에서 HD002 표준의 용출 시간과 상응하는, 20.5분에서 용출하는 HD002에 상응하는 이당류를 함유하는 혼합물내에 제공되었다. 에피머화된 반응 생성물은 HD002 표준과 거의 동일한 용출 시간에서 날카로운 피크를 가지고 있으며, 이는 N,2-HS 생성물이 반응의 결과로서 형성되었음을 나타낸다.
실시예 9: N,2,6-HS 생성물의 제조
에피머화된 N,2-HS 생성물을 설포 수용체 다당류로서 사용하고, 서열 번호: 18의 아미노산 서열을 갖는 가공된 글루코사미닐 6-O 설포트랜스퍼라제를 효소로서 사용한 것을 제외하고는, 실시예 8의 연구를 본 개시내용의 구현예에 따라 수행하여 실시예 8의 과정을 사용하여, N,2,6-HS 생성물을 합성하였다.
황산화된 다당류 생성물 및 시판되는 이당류의 혼합물의 대표적인 크로마토그램을 도 36에 나타낸다. 시판되는 혼합물의 크로마토그램은 약 23.7분에서 피크를 나타내며, 2-O 황산화된 우론산의 이당류 및 N-, 6-O 황산화된 글루코사민으로 이루어진, HD001(Iduron)에 상응하지만, 반응 생성물은 23.4분에서 유사한 피크를 나타내고, 이는 N,2,6-HS 생성물이 반응의 결과로 형성되었음을 나타낸다. N,2,6-HS 생성물 내에 존재하는 다른 피크는 분해되지 않은 다당류(2.5 min), 치환되지 않은 우론산 및 N-아세틸화된 글루코사민(5.5 min), 및 치환되지 않은 우론산과 N-, 6-O 황산화된 글루코사민을 포함한다.
실시예 10: N,2,3,6-HS 생성물의 제조
실시예 9의 화학적으로 합성된 N-, 2-O, 6-O 황산화된 다당류를 설포 수용체 다당류로서 사용하고, 서열 번호: 28의 아미노산 서열을 갖는 가공된 3-O 설포트랜스퍼라제 효소를 설포트랜스퍼라제로서 사용하는 것을 제외하고는, 연구를 본 개시내용의 구현예에 따라 수행함으로써, N-, 6-O, 3-O 황산화된 글루코사민 및 2-O 황산화된 헥수론산 잔기를 갖는 황산화된 다당류 생성물을 실시예 8의 과정을 사용하여 합성하였다. N-, 6-O, 3-O 황산화된 글루코사민 잔기를 포함하는 분해된 시판 테트라사카라이드와 비교시, 황산화된 다당류 생성물이 반응의 결과로서 3-O 황산화되는 것으로 측정될 것임이 예측된다.
설페이트화된 다당류 생성물을 설계하고 LCMS를 사용하여 분석함으로써 N,2,3,6-HS 생성물의 생산을 확인하였다. LCMS를 사용하여 연구를 촉진시키기 위하여, Lawrence, R., et al., (2008) J. Biol. Chem. 283 (48):33674-33684(이 문헌에 개시된 내용은 본 문서에 참조로서 통합된다)에 기술된 방법에 따라 서열 번호: 28 설포트랜스퍼라제 효소의 설페이트화된 다당류 생성물을 단리하고 아닐린 태그로 유도체화하였다. 요약하면, 시판되는 UF-HS 및 다른 N,2,3,6-HS 다당류를 포함하는 일부 GAG를 정량화하고 설페이트화된 생성물을 화학적으로 개질시킴으로써 LCMS를 사용하여 비율척도적으로 비교할 수 있다. 라우렌스, 알.(Lawrence, R.) 등은 리아제-생성된 이당류 및 삼당류의 환원 말단을 [12C6]- 및 [13C6]-아닐린으로 태그화(tagging) 하고N-비치환 글루코사민 잔기를 프로피오닐화함을 기술하고 있다. 이당류 및 사당류의 동위원소 태그화는 크로마토그래피 체류 시간에 영향을 미치지 않지만, 질량 분광학을 사용하여 구별할 수 있다.
설페이트화된 이당류 및 사당류 생성물은 실시예 8에 기술된 바와 같은 음이온 교환 크로마토그래에 의해서, 및 실시예 7에 기술된 바와 같은 서열 번호: 30, 서열 번호: 31, 및 서열 번호: 32의 아미노산 서열을 포함하는 3개의 탄소-산소 리아제의 혼합물로 분해함으로써 제조하였다. 1 pmol 내지 10 nmol의 소화된 샘플을 1.5-ml의 미세원심분리 튜브로 이전시키고 원심분리 증발기 속에서 건조시켰다. 디메필 설폭사이드:아세트산(7:3, v/v) 속에서 새로이 제조한 [12C6]-아닐린 또는 [13C6]-아닐린(15 μl, 165 μmol) 및 15 μl의 1 M NaCNBH3를 각각의 샘플에 가하였다. 반응은 65℃에서 4시간 동안, 또는 대안적으로 37℃에서 16시간 동안 수행한 다음 원심분리 증발기 속에서 건조시켰다.
비치환된 아민을 프로피온산 무수물과 반응시켰다. 건조된 샘플을 20 μl의 50% 메탄올 속에 재구성시키고, 3 μl의 프로피온산 무수물(23.3 μmol)을 가하였다. 반응은 실온에서 2시간 동안 수행하였다. 아실화된 샘플을 후속적으로 상술한 바와 같이 아닐린-태그화하였다.
실시예 3에 기술된 Shimadzu LCMS-8050 질량 분광기와 유사한 전자분무 이온화 공급원이 장착된 사중극 이온 트랩 액체 크로마토그래피 질량 분광기를 이당류 분석에 사용하였다. 유도체화된 및 비-유도체화된 이당류 잔기를 이온 쌍화제 디부틸아민(DBA)이 들어있는 C18 역상 컬럼 상에서 분리하였다. 등용매 단계는 다음과 같다: 100% 완충제 A(8 mm 아세트산, 5 mm DBA)로 10분 동안, 17% 완충제 B(70% 메탄올, 8 mm 아세트산, 5 mm DBA)로 15분 동안; 32% 완충제 B로 15분 동안, 40% 완충제 B로 15분 동안, 60% 완충제 B로 15분 동안; 100% 완충제 B로 10분 동안; 및 100% 완충제 A로 10분 동안. 일반적으로, 3-O 설페이트화된 생성물을 함유하는 샘플에 대한 질량 스펙트럼은 실시예 5에 기술된 바와 같은 탄소-산소 리아제에 의한 분해에 대해 내성인 사당류에 상응하는 m/z 피크를 생성하는 것으로 예측된다. 생산될 수 있는 사당류는 다음을 포함하나, 이에 한정되지 않는다: 4,5-불포화된 우론산-N-아세틸화, 6-O 설페이트화된 글루코사민-글루쿠론산-N-설페이트화된, 3-O 설페이트화된 글루코사민(△U-ANAc6S-G-ANS3S); 4,5-불포화된 우론산-N-아세틸화, 6-O 설페이트화된 글루코사민-글루쿠론산-N-설페이트화된, 3-O 설페이트화된, 6-O 설페이트화된 글루코사민(△U-ANAc6S-G-ANS3S6S); 4,5-불포화된 우론산-N-설페이트화된, 6-O 설페이트화된 글루코사민-글루쿠론산-N-설페이트화된, 3-O 설페이트화된, 6-O 설페이트화된 글루코사민(△U-ANS6S-G-ANS3S6S); 4,5-불포화된, 2-O 설페이트화된 우론산-N-설포글루코사민-글루쿠론산-N-설페이트화된, 3-O 설페이트화된, 6-O 설페이트화된 글루코사민(△U2S-ANS-G-ANS3S6S); 및 4,5-불포화된, 2-O 설페이트화된 우론산-N-설페이트화된, 6-O 설페이트화된 글루코사민-글루쿠론산-N-설페이트화된, 3-O 설페이트화된, 6-O 설페이트화된 글루코사민(△U2S-ANS6S-G-ANS3S6S). 특히, 서열 번호: 28 설포트랜스퍼라제 효소와의 반응으로부터 수집된 분해된 다당류 샘플의 LCMS는 △U-ANAc6S-G-ANS3S6S(m/z = 1036), △U-ANS6S-G-ANS3S6S(m/z = 1074), 및 △U2S-ANS6S-G-ANS3S6S(m/z = 1154) 사당류에 상응하는 m/z 피크를 지닌 질량 스펙트럼(나타내지 않음)을 생성하였으며, 이는 N,2,3,6-HS 생성물이 서열 번호: 28 가공된 설포트랜스퍼라제 효소와의 반응에 의해 생산되었음을 나타낸다.
실시예 11: N,2,3,6-HS 생성물의 항응고제 활성의 확인
연구를 본 개시내용의 구현예에 따라 수행하여 실시예 10에서 생성된 3-O 설페이트화된 다당류 생성물이 문헌: Meneghetti, G., et al. (2017) Org. Biomol. Chem. 15:6792-6799과 유사한 과정을 사용한 항트롬빈에 대해 결합 친화성을 가지는지를 측정하였다. 실시예 10에서 생성된 3-O 설페이트화된 다당류 생성물의 존재하에서 항트롬빈의 용융 곡선은 항트롬빈 단독보다 더 높은 용융 온도를 입증할 것으로 예측되고, 이는 실시예 10에서 생성된 3-O 설페이트화된 다당류 생성물이 화학식 I의 구조를 포함함을 나타낸다.
실시예 12: 다른 EC-2.8.2.8 효소의 가공된 아릴 설페이트-의존성 돌연변이체의 측정
연구를 본 개시내용의 구현예에 따라 수행하여 추가의 아릴 설페이트-의존성 글루코사미닐 N-설포트랜스퍼라제 효소를 가공하였다. 상술한 바와 같이, 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 및 서열 번호: 12 의 아미노산 서열을 갖는 아릴 설페이트-의존성 글루코사미닐 N-설포트랜스퍼라제 효소를 효소 부류 EC 2.8.2.8의 구성원인, 사람 글루코사미닐 N-데아세틸라제/N-설포트랜스퍼라제 효소(참고: entry sp|P52848|NDST_1_사람, 상기 도 3)의 N-설포트랜스퍼라제 도메인의 돌연변이체가 되도록 가공하였다. 다른 글루코사미닐 N-데아세틸라제/N-설포트랜스퍼라제 효소 중 하나 이상의 N-설포트랜스퍼라제 도메인의 아미노산 서열 뿐만 아니라 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 및/또는 서열 번호: 12의 아미노산 서열을 갖는 아릴 설페이트-의존성 글루코사미닐 N-설포트랜스퍼라제 효소의 아미노산 서열을 포함하는 다중 서열 정렬을 생성하고 분석함으로써, 가공된 글루코사미닐 N-설포트랜스퍼라제 효소내 아미노산 서열에서의 돌연변이가 동일한 정렬 내에서 야생형 EC -2.8.2.8 효소의 아미노산 서열에 대해 관찰될 수 있다. 사람 글루코사미닐 N-데아세틸라제/N-설포트랜스퍼라제 효소가 아닌 야생형 2.8.2.8 효소의 N-설포트랜스퍼라제 도메인의 아미노산 서열의 선택시, 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 및/또는 서열 번호: 12 의 아미노산 서열내에 존재하는 돌연변이는 야생형 서열내로 가공되어 아릴 설페이트-의존성 설포트랜스퍼라제 활성을 가질 수 있는 추가의 돌연변이체를 형성할 수 있다.
비-제한적인 예로서, 돼지 글루코사미닐 N-데아세틸라제/N-설포트랜스퍼라제 효소(entry-tr|M3V841|M3V841_PIG, 상기 도 3에서 서열 정렬에 나타낸 바와 같음)의 N-설포트랜스퍼라제 도메인을 암호화하는 아미노산 서열을 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 및 서열 번호: 12의 아미노산 서열과 함께 정렬한다. 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 및 서열 번호: 12에 나타낸 아미노산 돌연변이를 돼지 N-데아세틸라제/N-설포트랜스퍼라제 효소의 N-설포트랜스퍼라제 도메인의 아미노산 서열내 이의 등가의 위치내로 가공하여, 돌연변이체 아미노산 서열 서열 번호: 35, 서열 번호: 36, 서열 번호: 37, 서열 번호: 38, 서열 번호: 39, 또는 서열 번호: 40을 각각 생성시킨다. 서열 번호: 35, 서열 번호: 36, 서열 번호: 37, 서열 번호: 38, 서열 번호: 39, 및 서열 번호: 40의 아미노산 서열 각각을 포함하는 효소를 하기 실시예 13 및 실시예 14에서 이용할 것이다. 그러나, 당해 분야의 기술자는 동일한 과정을 적용하여 EC 2..2.8 효소 부류내 임의의 다른 글루코사미닐 야생형 N-데아세틸라제/N-설포트랜스퍼라제 효소와 관련하여, N-설포트랜스퍼라제 도메인의 돌연변이체, 또는 전체 효소를 생성할 수 있고, 이들이 명확성을 위해 빠져있음을 인식할 수 있다.
실시예 13: 가공된 아릴 설페이트-의존성 EC 2.8.2.8 돌연변이체의 발현 및 정제
연구를 본 개시내용의 구현예에 따라 수행하여 서열 번호: 35, 서열 번호: 36, 서열 번호: 37, 서열 번호: 38, 서열 번호: 39, 및 서열 번호: 40의 아미노산 서열 각각을 갖는 가공된 글루코사미닐 N-설포트랜스퍼라제 효소가 숙주 세포내로 형질전환될 수 있고, 이러한 아미노산 서열 각각을 포함하는 효소가 상기 실시예 1의 과정에 따라 후속적으로 발현, 분리, 및 정제될 수 있는지를 측정한다. 목적한 발현 숙주를 기반으로, 서열 번호: 35, 서열 번호: 36, 서열 번호: 37, 서열 번호: 38, 서열 번호: 39, 및 서열 번호: 40의 아미노산 서열을 갖는 효소를 암호화하는 코돈-최적화된 뉴클레오타이드 서열을 측정한다. 이러한 유전자의 합성 또는 적합한 발현 벡터내에 삽입시, 서열 번호: 35, 서열 번호: 36, 서열 번호: 37, 서열 번호: 38, 서열 번호: 39, 및 서열 번호: 40의 아미노산 서열 각각을 암호화하는 유전자는 숙주 세포내로 형질전환되고, 이러한 서열을 함유하는 효소는 아릴 설페이트-의존성 글루코사미닐 N-설포트랜스퍼라제 활성을 측정하기에 충분한 양 및 순도로 후속적으로 발현, 단리, 및 정제될 것임이 예측된다.
실시예 14: EC 2.8.2.8 돌연변이체의 설포트랜스퍼라제 활성
연구를 본 개시내용의 구현예에 따라 수행하여, 서열 번호: 35, 서열 번호: 36, 서열 번호: 37, 서열 번호: 38, 서열 번호: 39, 및 서열 번호: 40의 서열 각각을 포함하는 돌연변이체 효소가 활성 설포트랜스퍼라제인지를 실시예 2의 과정을 사용하여 측정한다. SAX 연구는 N-탈아세틸화된 헤파로산 및 아릴 설페이트 화합물을 서열 번호: 35, 서열 번호: 36, 서열 번호: 37, 서열 번호: 38, 서열 번호: 39, 또는 서열 번호: 40의 서열 각각을 포함하는 가공된 효소 각각과 반응시킨 결과로서 형성된 N-황산화된 다당류 생성물의 존재를 확인할 것임이 예측된다.
실시예 15: EC 2.8.2.- 내 다른 헥수로닐 2 -O 설포트랜스퍼라제 효소의 가공된 아릴 설페이트-의존성 돌연변이체의 측정
연구를 본 개시내용의 구현예에 따라 수행하여 추가의 아릴 설페이트-의존성 헥수로닐 2-O 설포트랜스퍼라제 효소를 가공한다. 상술한 바와 같이, 서열 번호: 14 및 서열 번호: 16의 아미노산 서열을 가진 아릴 설페이트-의존성 헥수로닐 2-O 설포트랜스퍼라제 효소는 효소 부류 EC 2.8.2.-의 구성원인, 닭 HS 헥수로닐 2-O 설포트랜스퍼라제 효소(참고: entry sp|Q76KB1|HS2ST_CHICK, 상기 도 14a - 도 14d에서)의 돌연변이가 되도록 가공되었다. EC 2.8.2.- 내 다른 HS 헥수로닐 2-O 설포트랜스퍼라제 효소 중 하나 이상의 아미노산 서열 뿐만 아니라 서열 번호: 14 및/또는 서열 번호: 16의 아미노산 서열을 갖는 아릴 설페이트-의존성 HS 헥수로닐 2-O 설포트랜스퍼라제 효소의 아미노산 서열을 포함하는 다중 서열 정렬을 생성 및 분석함으로써, 가공된 HS 헥수로닐 2-O-설포트랜스퍼라제 효소내 아미노산 서열에서의 돌연변이를 동일한 정렬에서 야생형 HS 헥수로닐 2-O-설포트랜스퍼라제 효소의 아미노산 서열에 대해 관찰할 수 있다. 닭 HS 헥수로닐 2-O 설포트랜스퍼라제 효소가 아닌 야생형 HS 헥수로닐 2-O 설포트랜스퍼라제 효소의 아미노산 서열의 선택시, 서열 번호: 14 및/또는 서열 번호: 16의 아미노산 서열 내에 존재하는 돌연변이를 야생형 서열로 가공하여 아릴 설페이트-의존성 설포트랜스퍼라제 활성을 가질 수 있는 추가의 돌연변이체를 형성시킬 수 있다.
비-제한적인 예로서, 사람 HS 헥수로닐 2-O 설포트랜스퍼라제 효소를 암호화하는 아미노산 서열(entry sp|Q7LGA3|HS2ST_사람, 상기 도 14a - 도 14d의 서열 정렬에 나타낸 바와 같음)을 서열 번호: 14 및 서열 번호: 16의 아미노산 서열과 정렬한다. 서열 번호: 14 및 서열 번호: 16에 나타난 아미노산 돌연변이를 사람 HS 헥수로닐 2-O 설포트랜스퍼라제 효소의 아미노산 서열내 이의 등가 위치로 가공하여, 돌연변이체 아미노산 서열 서열 번호: 41 및 서열 번호: 42 각각을 생성시킨다. 서열 번호: 41 및 서열 번호: 42의 아미노산 서열 각각을 포함하는 효소는 하기 실시예 16 및 실시예 17에서 이용될 수 있다. 그러나, 당해 분야의 기술자는 동일한 과정을 적용하여 EC 2.8.2.- 효소 부류내 임의의 다른 HS 헥수로닐 2-O 설포트랜스퍼라제 효소와 관련하여 아릴 설페이트-의존성 돌연변이체를 생성할 수 있고 이들이 명확성을 위해 빠져있음을 인식할 수 있다.
실시예 16: EC 2.8.2.- 헥수로닐 2 -O 설포트랜스퍼라제 활성을 갖는 돌연변이체의 발현 및 정제
연구를 본 개시내용의 구현예에 따라 수행하여 서열 번호: 41 및 서열 번호: 42의 아미노산 서열 각각을 갖는 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소를 암호화하는 유전자가 숙주 세포내로 형질전환될 수 있고, 각각이 이러한 아미노산 서열을 포함하는 효소가 상기 실시에 1의 과정에 따라 후속적으로 발현, 단리, 및 정제될 수 있는지를 측정한다. 목적한 발현 숙주를 기반으로, 서열 번호: 41 및 서열 번호: 42의 아미노산 서열을 갖는 효소를 암호화하는 코돈-최적화된 뉴클레오타이드 서열을 측정한다. 적합한 발현 벡터내 이러한 유전자의 합성 또는 삽입시, 서열 번호: 41 및 서열 번호: 42 각각의 아미노산 서열 각각을 암호화하는 유전자는 숙주 세포내로 형질전환될 것이고, 이러한 서열을 함유하는 효소는 아릴 설페이트-의존성 헥수로닐 2-O 설포트랜스퍼라제 활성을 측정하기에 충분한 양 및 순도로 후속적으로 발현, 단리, 및 정제될 것임이 예측된다.
실시예 17: EC 2.8.2.- 돌연변이체의 헥수로닐 2 -O 설포트랜스퍼라제 활성
연구를 본 개시내용의 구현예에 따라 수행하여, 서열 번호: 41 및 서열 번호: 42의 서열 각각을 포함하는 돌연변이체 효소가 활성의 설포트랜스퍼라제인지를 실시예 3의 과정을 사용하여 측정한다. MS 연구는 N-황산화된 헤파로산-계 다당류 및 아릴 설페이트 화합물과 서열 번호: 41 및 서열 번호: 42의 서열 각각을 포함하는 각각의 가공된 효소의 반응의 결과로서 형성된 N,2-HS 생성물의 존재를 확인할 것이다. 또는, 효소 둘 다는 화학식 IV 또는 화학식 V 중 하나 또는 둘 다를 포함하는 헤파로산-계 다당류와 반응성일 것으로 예측된다.
실시예 18: EC 2.8.2.- 내 다른 글루코사미닐 6 -O 설포트랜스퍼라제 효소의 가공된 아릴 설페이트-의존성 돌연변이체의 측정
연구를 본 개시내용의 구현예에 따라 수행하여 추가의 아릴 설페이트-의존성 글루코사미닐 6-O 설포트랜스퍼라제 효소를 가공한다. 상술된 바와 같이, 서열 번호: 18, 서열 번호: 20, 및 서열 번호: 22 의 아미노산 서열을 갖는 아릴 설페이트-의존성 글루코사미닐 6-O 설포트랜스퍼라제 효소를 가공하여 효소 부류 EC 2.8.2.-의 구성원인, 마우스 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소(참고: entry Q9QYK5|H6ST1_MOUSE, 상기 도 18a - 도 18c에서)의 동형-1의 돌연변이체가 되도록 한다. EC 2.8.2.- 내 다른 HS 글루코사미닐 6-O-설포트랜스퍼라제 효소 중 하나 이상의 아미노산 서열 뿐만 아니라, 서열 번호: 18, 서열 번호: 20, 및/또는 서열 번호: 22의 아미노산 서열을 갖는 아릴 설페이트-의존성 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소의 아미노산 서열 둘 다를 포함하는 다중 서열 정렬을 생성 및 분석함으로써, 가공된 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소 내 아미노산 서열내에서 돌연변이를 동일한 정렬내 야생형 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소의 아미노산 서열에 대해 관찰할 수 있다. 마우스 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소가 아닌 야생형 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소의 아미노산의 선택시, 서열 번호: 18, 서열 번호: 20, 및/또는 서열 번호: 22의 아미노산 서열 내에 존재하는 돌연변이를 야생형 서열내로 가공하여 아릴 설페이트-의존성 설포트랜스퍼라제 활성을 가질 수 있는 추가의 돌연변이체를 형성할 수 있다.
비-제한적인 예로서, 돼지 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소(entry I3LAM6|I3LAM6_PIG, 상기 도 18a - 도 18c에 나타낸 바와 같음)의 아미노산 서열을 서열 번호: 18, 서열 번호: 20, 및/또는 서열 번호: 22의 아미노산 서열과 정렬한다. 서열 번호: 18, 서열 번호: 20, 및/또는 서열 번호: 22에 존재하는 아미노산 돌연변이를 돼지 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소의 아미노산 서열내 이의 등가의 위치내로 가공하여, 돌연변이체 아미노산 서열을 생성한다. 상기 도 18a - 도 18c에 나타낸 바와 같이, 돼지 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소의 잔기 67-377에 상응하는 생성된 돌연변이체 아미노산 서열을 서열 번호: 45, 서열 번호: 46, 및 서열 번호: 47 각각으로 개시한다. 돼지 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소에 대한 전체 길이의 아미노산 서열에 상응하는 생성된 돌연변이체 아미노산 서열(상기 도 18a - 도 18c에 나타내지 않음)은 서열 번호: 48, 서열 번호: 49, 및 서열 번호: 50 각각으로 개시된다.
다른 비-제한적인 예에서, 마우스 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소(entry Q9QYK4|H6HS3_MOUSE, 상기 도 18a - 도 18c에서 서열 정렬로 나타낸 트렁케이트된(truncated) 서열)의 동형 3을 암호화하는 전체 길이의 아미노산 서열을 서열 번호: 18, 서열 번호: 20, 및 서열 번호: 22의 아미노산 서열과 정렬한다. 서열 번호: 18, 서열 번호: 20, 및 서열 번호: 22에 나타난 아미노산 돌연변이를 마우스 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소의 동형 3의 아미노산 서열내 이의 등가 위치내로 가공함으로써, 돌연변이체 아미노산 서열을 생성한다. 생성된 전체 길이의 아미노산 서열은 서열 번호: 59, 서열 번호: 60, 및 서열 번호: 61로서 각각 개시되어 있다. 서열 번호: 45, 서열 번호: 46, 서열 번호: 47, 서열 번호: 48, 서열 번호: 49, 서열 번호: 50, 서열 번호: 59, 서열 번호: 60, 및 서열 번호: 61의 아미노산 서열 각각을 포함하는 효소는 하기 실시예 19 및 실시예 20에서 이용될 것이다. 그러나, 당해 분야의 기술자는 동일한 과정을 적용하여 EC 2.8.2.- 효소 부류내 임의의 다른 HS 글루코사미닐 6-O 설포트랜스퍼라제 효소와 관련하여 아릴 설페이트-의존성 돌연변이체를 생성할 수 있고, 이들이 명확성을 위해 빠져 있음을 인식할 수 있다.
실시예 19: EC 2.8.2.- 글루코사미닐 6 -O 설포트랜스퍼라제 활성을 갖는 돌연변이체의 발현 및 정제
연구를 본 개시내용의 구현예에 따라 수행하여 서열 번호: 45, 서열 번호: 46, 서열 번호: 47, 서열 번호: 48, 서열 번호: 49, 서열 번호: 50, 서열 번호: 59, 서열 번호: 60, 및 서열 번호: 61의 아미노산 서열 각각을 갖는 가공된 글루코사미닐 6-O-설포트랜스퍼라제 효소가 숙주 세포내로 형질전환될 수 있고, 이러한 아미노산 서열 각각을 포함하는 효소가 상기 실시예 1의 과정에 따라 후속적으로 발현, 분리, 및 정제될 수 있는지를 측정한다. 목적한 발현 숙주를 기반으로, 서열 번호: 45, 서열 번호: 46, 서열 번호: 47, 서열 번호: 48, 서열 번호: 49, 서열 번호: 50, 서열 번호: 59, 서열 번호: 60, 및 서열 번호: 61의 아미노산 서열을 갖는 효소를 암호화하는 코돈-최적화된 뉴클레오타이드 서열을 측정한다. 이러한 유전자의 합성 또는 적합한 발현 벡터내에 삽입시, 서열 번호: 45, 서열 번호: 46, 서열 번호: 47, 서열 번호: 48, 서열 번호: 49, 서열 번호: 50, 서열 번호: 59, 서열 번호: 60, 및 서열 번호: 61의 아미노산 서열 각각을 암호화하는 유전자는 숙주 세포내로 형질전환되고, 이러한 서열을 함유하는 효소는 아릴 설페이트-의존성 글루코사미닐 6-O 설포트랜스퍼라제 활성을 측정하기에 충분한 양 및 순도로 후속적으로 발현, 단리, 및 정제될 것임이 예측된다.
실시예 20: EC 2.8.2.- 돌연변이체의 글루코사미닐 6 -O 설포트랜스퍼라제 활성
연구를 수행하여 서열 번호: 45, 서열 번호: 46, 서열 번호: 47, 서열 번호: 48, 서열 번호: 49, 서열 번호: 50, 서열 번호: 59, 서열 번호: 60, 및 서열 번호: 61의 서열 각각을 포함하는 돌연변이체 효소가 활성 설포트랜스퍼라제인지를 실시예 4의 과정을 사용하여 측정한다. MS 연구는 N,2-HS 다당류 및 아릴 설페이트 화합물과 서열 번호: 45, 서열 번호: 46, 서열 번호: 47, 서열 번호: 48, 서열 번호: 49, 서열 번호: 50, 서열 번호: 59, 서열 번호: 60, 및 서열 번호: 61의 서열 각각을 포함하는 각각의 가공된 효소의 반응의 결과로서 형성된 N,2,6-HS 생성물의 존재를 확인할 것으로 예측된다.
실시예 21: EC 2.8.2.23 내 다른 글루코사미닐 3 -O 설포트랜스퍼라제 효소의 가공된 아릴 설페이트-의존성 돌연변이체의 측정
연구를 본 개시내용의 구현예에 따라 수행하여 추가의 아릴 설페이트-의존성 글루코사미닐 3-O 설포트랜스퍼라제 효소를 가공한다. 상술된 바와 같이, 서열 번호: 24, 서열 번호: 26, 및 서열 번호: 28의 아미노산 서열을 갖는 아릴 설페이트-의존성 글루코사미닐 3-O 설포트랜스퍼라제 효소를 가공하여 효소 부류 EC 2.8.2.23의 구성원인, 사람 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소(참고: entry sp|O14792|HS3S1_HUMAN, 상기 도 23a - 도 23c에서)의 동형-1의 돌연변이체가 되로록 한다. EC 2.8.2.23 내 다른 HS 글루코사미닐 3-O-설포트랜스퍼라제 효소 중 하나 이상의 아미노산 서열 뿐만 아니라, 서열 번호: 24, 서열 번호: 26, 및/또는 서열 번호: 28의 아미노산 서열을 갖는 아릴 설페이트-의존성 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소의 아미노산 서열 둘 다를 포함하는 다중 서열 정렬을 생성 및 분석함으로써, 가공된 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소 내 아미노산 서열내에서 돌연변이를 동일한 정렬내 야생형 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소의 아미노산 서열에 대해 관찰할 수 있다. 사람 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소가 아닌 야생형 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소의 아미노산의 선택시, 서열 번호: 24, 서열 번호: 26, 및/또는 서열 번호: 28의 아미노산 서열 내에 존재하는 돌연변이를 야생형 서열내로 가공하여 아릴 설페이트-의존성 설포트랜스퍼라제 활성을 가질 수 있는 추가의 돌연변이체를 형성할 수 있다.
비-제한적인 예로서, 돼지 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소(entry tr|I3LHH5| I3LHH5_PIG, 상기 도 23a - 도 23c에 나타낸 바와 같음)의 동형 1을 암호화하는 아미노산 서열을 서열 번호: 24, 서열 번호: 26, 및 서열 번호: 28의 아미노산 서열과 정렬한다. 서열 번호: 24, 서열 번호: 26, 및 서열 번호: 28에 존재하는 아미노산 돌연변이를 돼지 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소의 아미노산 서열내 이의 등가의 위치내로 가공하여, 돌연변이체 아미노산 서열 서열 번호: 52, 서열 번호: 53, 및 서열 번호: 54 각각을 생성한다.
다른 비-제한적인 예에서, 마우스 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소(상기 도 18a - 도 18c에 나타나 있지 않음)의 동형 5를 암호화하는 전체 길이의 아미노산 서열을 서열 번호: 24, 서열 번호: 26, 및 서열 번호: 28의 아미노산 서열과 정렬한다. 서열 번호: 24, 서열 번호: 26, 및 서열 번호: 28에 나타난 아미노산 돌연변이를 마우스 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소의 동형 5의 아미노산 서열내 이의 등가 위치내로 가공함으로써, 돌연변이체 아미노산 서열을 생성한다. 생성된 전체 길이의 아미노산 서열은 서열 번호: 56, 서열 번호: 57, 및 서열 번호: 58로서 각각 개시되어 있다.
서열 번호: 52, 서열 번호: 53, 서열 번호: 54, 서열 번호: 56, 서열 번호: 57, 및 서열 번호: 58 의 아미노산 서열 각각을 포함하는 효소는 하기 실시예 22 및 실시예 23에서 이용될 것이다. 그러나, 당해 분야의 기술자는 동일한 과정을 적용하여 EC 2.8.2.23 효소 부류내 임의의 다른 HS 글루코사미닐 3-O 설포트랜스퍼라제 효소와 관련하여 아릴 설페이트-의존성 돌연변이체를 생성할 수 있고, 이들이 명확성을 위해 빠져 있음을 인식할 수 있다.
실시예 22: 글루코사미닐 3 -O 설포트랜스퍼라제 활성을 갖는 EC 2.8.2.23 돌연변이체의 발현 및 정제
연구를 본 개시내용의 구현예에 따라 수행하여 서열 번호: 52, 서열 번호: 53, 서열 번호: 54, 서열 번호: 56, 서열 번호: 57, 및 서열 번호: 58의 아미노산 서열 각각을 갖는 가공된 글루코사미닐 3-O-설포트랜스퍼라제 효소가 숙주 세포내로 형질전환될 수 있고, 이러한 아미노산 서열 각각을 포함하는 효소가 상기 실시예 1의 과정에 따라 후속적으로 발현, 분리, 및 정제될 수 있는지를 측정한다. 목적한 발현 숙주를 기반으로, 서열 번호: 52, 서열 번호: 53, 서열 번호: 54, 서열 번호: 56, 서열 번호: 57, 및 서열 번호: 58의 아미노산 서열을 갖는 효소를 암호화하는 코돈-최적화된 뉴클레오타이드 서열을 측정한다. 이러한 유전자의 합성 또는 적합한 발현 벡터내에 삽입시, 서열 번호: 52, 서열 번호: 53, 서열 번호: 54, 서열 번호: 56, 서열 번호: 57, 및 서열 번호: 58의 아미노산 서열 각각을 암호화하는 유전자는 숙주 세포내로 형질전환되고, 이러한 서열을 함유하는 효소는 아릴 설페이트-의존성 글루코사미닐 3-O 설포트랜스퍼라제 활성을 측정하기에 충분한 양 및 순도로 후속적으로 발현, 단리, 및 정제될 것임이 예측된다.
실시예 23: EC 2.8.2.23 돌연변이체의 글루코사미닐 3 -O 설포트랜스퍼라제 활성
연구를 수행하여 서열 번호: 52, 서열 번호: 53, 서열 번호: 54, 서열 번호: 56, 서열 번호: 57, 및 서열 번호: 58의 서열 각각을 포함하는 돌연변이체 효소가 활성 설포트랜스퍼라제인지를 실시예 5 및/또는 실시예 6의 과정을 사용하여 측정한다. MS 및/또는 NMR 연구는 N,2,6-HS 다당류 및 아릴 설페이트 화합물과 서열 번호: 52, 서열 번호: 53, 서열 번호: 54, 서열 번호: 56, 서열 번호: 57, 및 서열 번호: 58의 서열 각각을 포함하는 가공된 효소 각각의 반응의 결과로서 형성된 N,2,3,6-HS 생성물의 존재를 확인할 것으로 예측된다.
SEQUENCE LISTING <110> Optimvia LLC <120> METHODS FOR SYNTHESIZING ANTICOAGULANT POLYSACCHARIDES <130> IP20214090US <160> 61 <170> PatentIn version 3.5 <210> 1 <211> 927 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 1 <400> 1 atgagcgaag agaaggaccc tttgtggcag gacccgtgcg aggacaaacg ccacaaagac 60 atttggtcga aggagaaaac ctgtgaccgc ttccctaagt tgcttattat tggtccgcaa 120 aagaccggcg cctgggcgct ttaccatttc ctgggtatgc atcccgatct tagttccaac 180 tacccgtcga gtgaaacaca tggcagtatc caattcttta atggacataa ctaccataag 240 ggcatcgact ggtatatgga atttttcccc attccctcaa ataccacttc tgacttttat 300 ttcgagaaat cagcgaatta ttttgacagt gaggtagcgc ctcgccgcgc agcagcattg 360 ttgcccaaag caaaagtgct gactattctt atcaatccag ctgaccgcgc atattcttgg 420 tatcagcacc agcgcgccca cgacgacccg gtggcgctga aatacacatt ccatgaagtg 480 attactgctg gaagcgatgc gtcgtctaag ttgcgtgctc tgcagaaccg ctgtttggta 540 cctggctggt atgctacgca cattgaacgt tggctgtccg catatcacgc gaaccagatc 600 ctggttttag atggtaaatt acttcgcacg gagccagcta aagtcatgga catggtacaa 660 aagttcctgg gggtaacgaa taccattgat tatcataaga ctttggcttt cgaccccaag 720 aagggatttt ggtgccagtt attggagggg ggcaagacga agtgcttagg caaatcgcat 780 gggcgcaagt acccggagat ggatttggac tcacgcgcct ttcttaagga ctactaccgc 840 gaccacaaca ttgaattgag taaattatta tacaaaatgg ggcaaactct tccgacttgg 900 ttgcgtgaag acttgcagaa cacacgc 927 <210> 2 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 1 <400> 2 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro Gln Lys Thr Gly Ala Trp Ala Leu Tyr 35 40 45 His Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr His Gly Ser Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Lys Ser Ala Asn Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Leu 245 250 255 Gly Lys Ser His Gly Arg Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 3 <211> 927 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 2 <400> 3 atgagcgaag agaaggaccc tttgtggcag gacccgtgcg aggacaaacg ccataaggac 60 atctggtcga aagagaagac ttgtgaccgt tttccaaaat tacttattat cggtccttca 120 aagaccggcg ctttcctttt aacccacttt ttggggatgc atccagacct tagttcaaat 180 tacccttcgt ctgagactgg gcattccatt caattcttca acgggcacaa ttatcacaag 240 ggtattgact ggtacatgga atttttcccg attccgagca atacaacttc cgatttttac 300 tttgaaacct catccaatta ttttgattcc gaagtcgctc cacgccgcgc cgctgctttg 360 ttgccaaaag ctaaggtttt gactattctg atcaacccgg ctgaccgcgc ctattcatgg 420 taccaacacc agcgtgctca tgatgaccca gtggctttga agtatacgtt ccatgaggtc 480 attacagcgg gcagcgacgc aagctccaaa cttcgcgcat tgcaaaaccg ctgccttgtg 540 cccggttggt acgcgacaca cattgaacgc tggctgtccg cttaccacgc caaccaaatt 600 ttagttttag atgggaaatt acttcgtacc gaacctgcca aggtcatgga catggtgcag 660 aaatttttgg gagtcactaa cactatcgac taccacaaaa cattggcatt cgatccaaaa 720 aaggggtttt ggtgccagct tttagaaggg ggcaagacga agtgtcacgg gaagcgttgg 780 gggcgtaagt atccagagat ggatcttgat agccgcgctt tcttaaaaga ttattaccgt 840 gaccacaaca ttgagcttag caaactgctt tacaagatgg gtcagacact tccgacatgg 900 ctgcgtgaag acttgcagaa cacacgc 927 <210> 4 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 2 <400> 4 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro Ser Lys Thr Gly Ala Phe Leu Leu Thr 35 40 45 His Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Gly His Ser Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Thr Ser Ser Asn Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys His 245 250 255 Gly Lys Arg Trp Gly Arg Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 5 <211> 927 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 3 <400> 5 atgagcgaag agaaggaccc tttgtggcag gacccgtgcg aagataagcg tcacaaggac 60 atctggtcaa aagagaaaac ttgcgaccgc tttccgaaat tgttaattat tggaccacat 120 ggcaccgggg gtcacgcact ttacttattc ttgggaatgc acccagatct gagctccaac 180 taccccagct ctgaaaccgg cgaagaaatc caatttttca acgggcacaa ttatcataaa 240 ggcattgatt ggtatatgga attcttcccc atcccgtcta atactaccag cgatttctat 300 tttgaaaaaa gtgcgaacta cttcgactcg gaggtggcac cccgtcgtgc tgcggcctta 360 ctgccaaagg ccaaggtttt aaccatcttg attaatccgg ctgaccgtgc ttattcctgg 420 taccaggctc aacgcgcaca tgacgacccc gttgcgctta aatatacatt ccacgaggtc 480 attactgcgg gctctgatgc ttcttcgaaa cttcgtgcgc tgcaaaatcg ttgtttagtg 540 ccgggttggt acgccacgca catcgagcgt tggcttagtg cctaccatgc gaatcaaatc 600 cttgtcttgg atgggaagct tttgcgtact gaaccggcca aggtcatgga catggtccag 660 aagtttctgg gtgttaccaa cactattgat taccataaga ctttagcctt cgatccgaag 720 aaaggcttct ggtgtcaatt acttgagggt ggtaagacca agtgcggagg aaaacatctt 780 gggcgcaaat accccgaaat ggacttagat agccgtgcct ttctgaaaga ttactaccgc 840 gaccataata tcgagcttag caaattattg tacaaaatgg gccaaacctt gccgacgtgg 900 ctgcgtgaag acttgcagaa cacacgc 927 <210> 6 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 3 <400> 6 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro His Gly Thr Gly Gly His Ala Leu Tyr 35 40 45 Leu Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Gly Glu Glu Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Lys Ser Ala Asn Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln Ala Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Gly 245 250 255 Gly Lys His Leu Gly Arg Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 7 <211> 927 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 4 <400> 7 atgagcgaag agaaggaccc tttgtggcag gacccgtgcg aagataagcg ccacaaggac 60 atctggagca aggagaaaac ttgcgaccgc tttccaaagt tgctgattat tgggcctcac 120 ggcacgggcg gccacgcgct gtacctgttt cttggcatgc acccggacct ttccagcaat 180 tatcctagta gtgagacatt tttgagtatc caatttttta acggacataa ctatcacaaa 240 ggtatcgatt ggtacatgga attcttccca attccgtcta atacgacatc tgacttttat 300 ttcgagcatt cggggaatta ctttgattcc gaggtagccc cacgccgtgc cgccgctctt 360 ttgcccaagg cgaaagtctt gactattctt attaatcccg cagaccgtgc ctaccgcgcg 420 tatgtatggc aacgcgcaca cgatgaccca gtcgcattga aatatacatt ccatgaggtg 480 attaccgcgg gtagtgacgc ttctagcaag ttacgtgctc ttcagaatcg ctgccttgtc 540 ccaggttggt atgccacaca catcgaacgt tggctgtccg cctaccatgc taatcagatt 600 cttgtgctgg atggtaaatt gttgcgtaca gagcctgcca aagttatgga tatggtgcaa 660 aaatttttgg gtgttacgaa tactattgat taccataaga cacttgcatt tgacccgaaa 720 aaaggtttct ggtgccaatt gttggagggt ggcaagacta agtgcttagg taagagtctt 780 ggttcgaagt accccgaaat ggatttagac tcgcgcgctt tcttgaagga ctattatcgt 840 gaccacaata tcgaactttc taaactttta tataagatgg gccaaacact tcccacgtgg 900 ctgcgtgaag acttgcagaa cacacgc 927 <210> 8 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 4 <400> 8 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro His Gly Thr Gly Gly His Ala Leu Tyr 35 40 45 Leu Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Phe Leu Ser Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu His Ser Gly Asn Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Arg Ala Tyr Val Trp Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Leu 245 250 255 Gly Lys Ser Leu Gly Ser Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 9 <211> 927 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 5 <400> 9 atgagcgaag agaaggaccc tttgtggcag gacccgtgcg aagataagcg tcataaagac 60 atttggagta aagagaagac ttgtgatcgt ttccccaagt tactgatcat cggcccacat 120 aagacaggag tacatgcatt gtacttgttt ttgggaatgc atccggacct gtcttcaaat 180 taccccagtt cagagacagg caatcacatc ggcttcttcg gaggacataa ctaccacaaa 240 ggcatcgatt ggtacatgga attctttcct atcccctcta atactacctc agatttttac 300 ttcgagaaaa gtgcttggta ctttgactcc gaagttgctc ctcgtcgcgc agcagcatta 360 cttccaaagg cgaaagttct gactattttg atcaaccctg cggatcgcgc ctacagctgg 420 tatcaacacc agcgcgccca cgatgatcct gtcgcattga aatacacctt tcatgaagtt 480 atcaccgctg gctccgatgc gtctagcaaa ttgcgtgcat tacagaatcg ttgccttgtg 540 ccaggatggt acgctaccca tattgagcgc tggctgagtg catatcacgc gaatcagatt 600 ctggtgttag atggaaagct gctgcgtact gaaccggcca aagtaatgga catggttcaa 660 aagttcctgg gggtgacgaa cacaattgat taccataaga ctcttgcatt tgatcctaag 720 aaaggctttt ggtgtcaact tttagagggg gggaagacca agtgcttagg gaagagcgtg 780 ggacgcaagt accccgaaat ggacttagat agccgtgctt tcttgaagga ttattatcgc 840 gaccacaaca ttgaactttc taaactgtta tacaagatgg gccagacact gccgacctgg 900 ctgcgtgaag acttgcagaa cacacgc 927 <210> 10 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 5 <400> 10 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro His Lys Thr Gly Val His Ala Leu Tyr 35 40 45 Leu Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Gly Asn His Ile Gly Phe Phe Gly Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Lys Ser Ala Trp Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Leu 245 250 255 Gly Lys Ser Val Gly Arg Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 11 <211> 927 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 6 <400> 11 atgagcgaag agaaggaccc tttgtggcag gacccgtgcg aagataagcg tcacaaggat 60 atttggtcca aagaaaagac ctgcgatcgc tttcccaagc tgttaatcat cggcccggcc 120 aaaacaggcg cctggctttt gcatcatttc ctgggcatgc atcccgactt gtcgagtaac 180 tatccgtcgt ccgaaactca ctcctctatt caattcttca atgggcataa ttatcacaag 240 ggtatcgact ggtacatgga gttctttcca atccctagta atacaaccag tgatttttat 300 tttgagacta gcgctaacta ctttgattca gaggtggcac cgcgtcgtgc ggcggcgctg 360 ttgccgaagg cgaaagtttt aactatcttg atcaatccgg cagatcgtgc gtacagctgg 420 taccaacatc aacgtgctca cgatgacccg gtggccctga aatatacctt ccacgaggtc 480 attacagccg gaagtgacgc ttccagtaaa ttgcgcgcgt tacaaaatcg ttgtctggtc 540 cctgggtggt acgcaacgca cattgaacgc tggttatcgg cataccacgc aaatcagatc 600 cttgtgcttg acggaaagtt attgcgtact gaaccggcca aggtgatgga tatggtacag 660 aaattccttg gcgtcaccaa tacgatcgac tatcacaaga cgcttgcctt cgaccccaag 720 aaggggtttt ggtgccaact tttagagggt ggtaagacaa agtgtgctca taaggggtta 780 ggccgcaagt accctgaaat ggatctggac tcgcgcgctt ttttgaaaga ctattatcgc 840 gatcacaata ttgagttgag caagttgctg tataaaatgg gacagacact gccgacctgg 900 ctgcgtgaag acttgcagaa cacacgc 927 <210> 12 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 6 <400> 12 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro Ala Lys Thr Gly Ala Trp Leu Leu His 35 40 45 His Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr His Ser Ser Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Thr Ser Ala Asn Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Ala 245 250 255 His Lys Gly Leu Gly Arg Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 13 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered aryl sulfate-dependent 2-O-sulfotransferase variant 1 <400> 13 atggatgagg aggacgatgt ggtgatcatc tacaatcgtg tgccgcacac cgcgagcacg 60 agctttacga acatcgccta cgatctgtgc gcgaaaaatc gctaccacgt gctgcacatc 120 aacaccacca agaacaaccc agtgatgagt ctgcaagatc aagtgcgctt cgtgaagaac 180 gtgacgagct ggaaggagat gaaaccgggc ttctaccacg gccacgtgag ctatctcgat 240 ttcgccaagt tcggcgtgaa gaagaagccg atctacatca acgtgattcg cgatccgatc 300 gagcgtctgg tgagctacta ctaccacctc cgttttggcg atgactatcg tccgggtctg 360 cgccgtcgca agcaaggcga caaaaagacg ttcgacgagt gcgttgcggc cggcggtagt 420 gattgtgccc cagaaaagct gtggctgcag atcccgttct tctgcggtca tagcagcgag 480 tgctggaatg tgggtagccg ctgggcgctg gaacaagcca aatacaatct gatcaacgag 540 tactttctgg tgggcgtgac ggaggagctg gaggacttta ttatgctgct cgaggcggcg 600 ctgccgcgct tttttcgtgg tgccaccgag ctgtatcgca ccggcaaaaa aagtcacctc 660 cacaagacca ccgagaagaa gctgccgacg aaagaaacca ttgccaaact gcagcagagc 720 gagatctgga agatggagaa cgaattctac gagttcgcgc tcgagcagtt ccagtttgtt 780 cgtgcccacg ccgtgcgtga aaaggacggc gagctgtaca ttctcgccca gaatttcttc 840 tacgagaaga tctatccaaa aagcaactaa 870 <210> 14 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 2-O-sulfotransferase variant 1 <400> 14 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val Pro His 1 5 10 15 Thr Ala Ser Thr Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Asn Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly His Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr His Leu Arg Phe 100 105 110 Gly Asp Asp Tyr Arg Pro Gly Leu Arg Arg Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 15 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered aryl sulfate-dependent 2-O-sulfotransferase variant 2 <400> 15 atggatgagg aggacgatgt ggtgatcatc tacaaccgtg tgcaccgcac ggcgagtcac 60 agtttcacca acatcgcgta tgatctgtgc gcgaagaacc gctaccacgt gctgcatatc 120 aacacgacca aaggcaaccc ggtgatgagt ctgcaagatc aagttcgctt cgtgaagaac 180 gttacgagct ggaaggagat gaaaccgggt ttttaccacg gcccagtgag ctatctcgac 240 ttcgccaagt tcggcgtgaa gaaaaagccg atctacatca atgtgatccg cgacccgatc 300 gaacgtctgg tgagctacta ctactttctg cgcttcggca gcgacaagcg tccgggtctg 360 cgcatgcgta aacaaggcga caagaagacc ttcgacgaat gcgttgccgc cggcggtagt 420 gattgtgccc cagaaaagct gtggctgcag atcccgttct tctgcggtca tagcagcgag 480 tgctggaatg tgggtagccg ctgggcgctg gagcaagcca aatacaatct gatcaacgaa 540 tactttctcg tgggcgtgac cgaagagctg gaagacttca tcatgctgct ggaggccgcg 600 ctgccgcgtt tctttcgtgg tgccaccgaa ctgtatcgta ccggcaaaaa gagccacctc 660 cacaaaacga cggagaagaa gctgccgacg aaggaaacca ttgccaaact gcagcagagc 720 gagatctgga agatggagaa cgaattctac gagtttgcgc tcgagcagtt ccaatttgtg 780 cgcgcccatg ccgtgcgtga aaaggacggc gagctgtaca ttctcgccca gaatttcttc 840 tacgaaaaga tctatccaaa aagcaactaa 870 <210> 16 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 2-O-sulfotransferase variant 2 <400> 16 Met Asp Glu Glu Asp Asp Val Val Ile Ile Tyr Asn Arg Val His Arg 1 5 10 15 Thr Ala Ser His Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Gly Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Val Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly Pro Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Phe Leu Arg Phe 100 105 110 Gly Ser Asp Lys Arg Pro Gly Leu Arg Met Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Ala Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Leu Glu Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Glu Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Glu Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Val Arg Ala His Ala Val Arg Glu Lys Asp Gly Glu Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 17 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered aryl sulfate-dependent 6-O-sulfotransferase variant 1 <400> 17 atgaagtact attttccggt ccgcgaattg gagcgctcac tgcgttttga tatgaagggt 60 gacgatgtga ttgtattcct tcatattggg catacaggcg ggacgacttt tggacgtcat 120 ttagtccaga acgttcgtct ggaggtaccc tgtgattgcc gcccgggtca aaaaaaatgc 180 acgtgttacc gcccaaatcg ccgtgagacc tggttgttct ctcgcttttc cacaggctgg 240 tcttgcggaa ctaacgccga ctggacagag cttaccaact gtgtcccagg ggtattggac 300 cgccgtgatc cagctgggtt gcgctcgcca cgtaaatttt actatattac cctgctgcgc 360 gatcctgtct cccgctacct ggggggctgg cgccaccatc agcgtggcgg cacaaataaa 420 acatcgttgc acatgtgtga tgggcgcacg ccaacacccg aagagcttcc cccgtgctat 480 gagggaacgg actggagtgg atgtacttta caggaattta tggactgtcc ctacaatttg 540 gcaaacaatc gtcaagtccg catgcttgcg gatcttagtt tggtcggctg ttacaacttg 600 agctttattc ccgaaagtaa gcgcgcacaa cttttattag agagtgccaa gaagaacttg 660 cgtggaatgg cattctttgg attgaccgaa tttcagcgta aaacgcagta tttgtttgaa 720 cgtacattca acctgaaatt tatccgcccg tttatgcagt ataacagtac gcgcgcgggg 780 ggcgtggaag tggacgagga cacgattcgc cacattgagg aattgaatga ccttgatatg 840 caattgtacg actacgccaa agatcttttc cagcaacgtt atcaatacaa gcgccagctt 900 gaacgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 18 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 6-O-sulfotransferase variant 1 <400> 18 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Thr Asn Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Gly 115 120 125 Gly Trp Arg His His Gln Arg Gly Gly Thr Asn Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 19 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered aryl sulfate-dependent 6-O-sulfotransferase variant 2 <400> 19 atgaagtact attttccggt ccgcgaattg gagcgctcat tgcgtttcga tatgaagggt 60 gatgatgtca tcgtcttcct tcacattggt cacactggtg gaaccacctt tggacgtcat 120 cttgtgcaaa acgtacgttt agaggtccct tgcgattgtc gtccgggtca aaaaaaatgt 180 acttgctatc gtcctaatcg tcgtgaaacg tggcttttca gtcgttttag tacggggtgg 240 tcatgcggta cccgcgcaga ctggacggag ttaaccaact gcgtacctgg ggtgttggat 300 cgccgcgatc cggcaggttt acgctcccca cgtaaattct attatattac cctgttacgt 360 gacccagtca gtcgctattt gtctcactgg cgtcacacac aacgtggcgg cgcgaacaag 420 accggactgc acatgtgtga cgggcgtact cctacaccag aggaattacc cccatgctat 480 gagggaactg actggtcggg atgtacactg caggagttca tggactgccc atacaatctg 540 gggaataatc gccaagtccg tatgttggcg gatttaagcc ttgtcggatg ctataatttg 600 tcattcattc cagaatcaaa acgcgcgcaa cttcttcttg agtcagccaa gaaaaatttg 660 cgcggaatgg catttttcgg gttgacagaa tttcagcgca aaacacaata tctgttcgag 720 cgcacattca atttaaaatt tattcgtcct ttcatgcaat acaactctac acgtgcagga 780 ggagtcgaag tggacgagga cacaattcgc cacatcgagg aattaaatga tctggatatg 840 cagttgtatg actatgcaaa agatctgttt cagcaacgct atcaatacaa gcgtcagttg 900 gaacgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 20 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 6-O-sulfotransferase variant 2 <400> 20 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Thr Arg Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser 115 120 125 His Trp Arg His Thr Gln Arg Gly Gly Ala Asn Lys Thr Gly Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 21 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered aryl sulfate-dependent 6-O-sulfotransferase variant 3 <400> 21 atgaagtact attttccggt ccgcgaattg gagcgctcat tgcgtttcga catgaaagga 60 gacgacgtca ttgtattttt acatattggc cacaccggtg gcacgacttt tggccgtcac 120 ttagtccaaa acgtacgctt agaggtgcct tgcgactgtc gtccagggca aaagaaatgc 180 acctgctatc gccccaaccg ccgtgaaaca tggttgttta gtcgctttag taccggttgg 240 agctgtggct ctcatgctga ttggactgaa ctgacgaatt gtgtccccgg agtattggat 300 cgccgtgatc ctgctggttt acgctcacct cgcaaattct attatattac gttacttcgt 360 gatcccgtta gccgttatct tagtgggtgg cgtcaccatc aacgcggagg ggctaataag 420 acgagcctgc acatgtgtga cggacgtacg ccaacccccg aggaactgcc gccctgttac 480 gaggggacgg actggtctgg ctgtacatta caagagttta tggattgccc atataacctg 540 ggtaacaatc gccaagtccg tatgttggcg gatctttcgc tggtgggatg ttataattta 600 agttttatcc cggagagcaa gcgtgcacag ttgctgcttg aatcagcgaa gaagaacctt 660 cgcggaatgg catttttcgg tttaacggag tttcaacgta agactcagta ccttttcgag 720 cgtaccttca acttgaaatt tatccgtccc ttcatgcagt acaactccac ccgcgctggt 780 ggagttgaag tcgacgagga taccatccgc cacattgaag aacttaatga cttagatatg 840 caattgtacg actatgctaa ggacttattc cagcaacgtt atcagtacaa acgccaattg 900 gaacgccgcg agcagcgttt acgcaatcgt gaggaataa 939 <210> 22 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 6-O-sulfotransferase variant 3 <400> 22 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Ser His Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser 115 120 125 Gly Trp Arg His His Gln Arg Gly Gly Ala Asn Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 23 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered aryl sulfate-dependent 3-O-sulfotransferase variant 1 <400> 23 atgggaactg cgtcgaacgg cagtacgcaa caacttccgc agactatcat cattggcgta 60 ggacatggtg gaactcgtgc tctgttggag atgttatcac ttcaccccga cgtcgcagcg 120 gctgagaatg aagttcactt tttcgattgg gaagagcatt attcgcaggg gttaggttgg 180 tatcttaccc aaatgccttt ttcgagtccc catcagttaa cagtagagaa gacccattct 240 tactttacat caccaaaagt gcctgagcgc atccattcga tgaatccgac tatccgcctt 300 ttactgatct tacgcgatcc atcagaacgc gttctttcgg catataccca catgctttat 360 aaccatttgc agaaacacaa gccatatccc cctattgagg atttattaat gcgcgatgga 420 cgcttgaacc tggattatgt aggattaaat cgctctcttt atcacgccca tatgttaaac 480 tggcttcgct tttttccgct tgggcatatc cacatcgttg atggagaccg tttaattcgt 540 gacccgtttc ctgagatcca gaaggtcgaa cgcttcctga aattaagtcc tcagattaat 600 gcgagcaatt tctatttcaa caagacgaaa ggattctact gcctgcgcga ctccggtaag 660 gatcgctgcc tgcacgagtc aaaagggcgc gcgcaccctc aggtcgaccc aaagctgtta 720 gataaattgc atgagtattt ccacgaacct aataagaagt tcttcaaact tgtcggccgc 780 acatttgatt ggcat 795 <210> 24 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 3-O-sulfotransferase variant 1 <400> 24 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Ser 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Ala Tyr Thr His Met Leu Tyr Asn His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Val Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 25 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered aryl sulfate-dependent 3-O-sulfotransferase variant 2 <400> 25 atgggaactg cgtcgaacgg cagtacgcaa cagttgccgc agacaatcat tattggcgtc 60 ggacatggcg gaacccgtgc tcttttggaa atgctgagtc tgcaccctga cgtggcagcg 120 gcggagaatg aggttcactt ctttgattgg gaggaacatt attcgcaggg gttgggatgg 180 tatctgacgc aaatgccgtt ctccagtcca caccagttga ccgttgaaaa gacgcatagt 240 tattttacga gtcccaaagt acctgagcgt attcatagta tgaacccgac catccgtctg 300 ttgttgatcc ttcgcgatcc cagcgaacgc gtcttatcag cgtatactca catgctgtac 360 aaccaccttc aaaaacataa gccgtaccct cccatcgagg atcttttaat gcgtgatggt 420 cgtcttaacc ttgattacac aggtttgaac cgcagtttgt atcacgctca catgttgaat 480 tggttgcgct tctttcccct tggtcatatc catattgttg acggggaccg tctgatccgc 540 gacccgttcc cagagattca gaaagtggaa cgtttcctga aattatcccc acagatcaac 600 gcgagtaact tctattttaa caagacgaaa ggtttctatt gcttacgtga tagtgggaag 660 gaccgctgcc tgcacgagag caaaggacgt gctcatcctc aagttgaccc caagttattg 720 gataaactgc acgagtattt tcacgagcct aataaaaagt tctttaagtt agtcggccgc 780 acatttgatt ggcat 795 <210> 26 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 3-O-sulfotransferase variant 2 <400> 26 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Ser 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Ala Tyr Thr His Met Leu Tyr Asn His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Thr Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 27 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding for engineered aryl sulfate-dependent 3-O-sulfotransferase variant 3 <400> 27 atgggaactg cgtcgaacgg cagtacgcaa caacttccac aaactatcat tattggcgtg 60 ggtcacggtg ggactcgcgc tttacttgaa atgttgagct tacatccgga tgttgccgca 120 gctgaaaacg aggtccattt ctttgactgg gaggaacact attcccaggg tttggggtgg 180 tatctgacgc agatgccttt ctcgtctcct caccaactta cggttgagaa aactcattca 240 tatttcacgt cccctaaagt accagaacgt atccactcaa tgaacccaac aattcgttta 300 ttgttgattt tgcgcgaccc gtcggaacgt gtgttgtcgt taggtacgca cttgctttac 360 gttcatttgc aaaagcataa accgtatcca ccgattgagg accttttgat gcgtgacgga 420 cgtttgaatt tggactatac gggcctgaat cgctcgctgt atcacgccca catgttgaac 480 tggctgcgct tcttccccct tggtcatatc cacatcgtag atggggaccg tctgatccgt 540 gaccctttcc cggaaatcca gaaagtggag cgtttcctga agttatctcc acaaatcaac 600 gcgagcaatt tttactttaa caagactaaa gggttctact gtttacgtga ttctggcaaa 660 gaccgttgcc ttcatgaaag taaaggccgc gctcaccctc aagtcgaccc caaattatta 720 gataagttgc acgagtactt ccatgaacct aataagaagt tcttcaaact tgtcggccgc 780 acatttgatt ggcat 795 <210> 28 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 3-O-sulfotransferase variant 3 <400> 28 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Ser 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Leu Gly Thr His Leu Leu Tyr Val His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Thr Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 29 <211> 617 <212> PRT <213> Homo sapiens <400> 29 Met Arg Cys Leu Ala Ala Arg Val Asn Tyr Lys Thr Leu Ile Ile Ile 1 5 10 15 Cys Ala Leu Phe Thr Leu Val Thr Val Leu Leu Trp Asn Lys Cys Ser 20 25 30 Ser Asp Lys Ala Ile Gln Phe Pro Arg Arg Ser Ser Ser Gly Phe Arg 35 40 45 Val Asp Gly Phe Glu Lys Arg Ala Ala Ala Ser Glu Ser Asn Asn Tyr 50 55 60 Met Asn His Val Ala Lys Gln Gln Ser Glu Glu Ala Phe Pro Gln Glu 65 70 75 80 Gln Gln Lys Ala Pro Pro Val Val Gly Gly Phe Asn Ser Asn Val Gly 85 90 95 Ser Lys Val Leu Gly Leu Lys Tyr Glu Glu Ile Asp Cys Leu Ile Asn 100 105 110 Asp Glu His Thr Ile Lys Gly Arg Arg Glu Gly Asn Glu Val Phe Leu 115 120 125 Pro Phe Thr Trp Val Glu Lys Tyr Phe Asp Val Tyr Gly Lys Val Val 130 135 140 Gln Tyr Asp Gly Tyr Asp Arg Phe Glu Phe Ser His Ser Tyr Ser Lys 145 150 155 160 Val Tyr Ala Gln Arg Ala Pro Tyr His Pro Asp Gly Val Phe Met Ser 165 170 175 Phe Glu Gly Tyr Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile Ser 180 185 190 Gly Val Glu Gly Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly Tyr 195 200 205 Phe Tyr Pro Ile Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser Lys 210 215 220 Asn Leu Thr Glu Lys Pro Pro His Ile Glu Val Tyr Glu Thr Ala Glu 225 230 235 240 Asp Arg Asp Lys Asn Lys Pro Asn Asp Trp Thr Val Pro Lys Gly Cys 245 250 255 Phe Met Ala Asn Val Ala Asp Lys Ser Arg Phe Thr Asn Val Lys Gln 260 265 270 Phe Ile Ala Pro Glu Thr Ser Glu Gly Val Ser Leu Gln Leu Gly Asn 275 280 285 Thr Lys Asp Phe Ile Ile Ser Phe Asp Leu Lys Phe Leu Thr Asn Gly 290 295 300 Ser Val Ser Val Val Leu Glu Thr Thr Glu Lys Asn Gln Leu Phe Thr 305 310 315 320 Ile His Tyr Val Ser Asn Ala Gln Leu Ile Ala Phe Lys Glu Arg Asp 325 330 335 Ile Tyr Tyr Gly Ile Gly Pro Arg Thr Ser Trp Ser Thr Val Thr Arg 340 345 350 Asp Leu Val Thr Asp Leu Arg Lys Gly Val Gly Leu Ser Asn Thr Lys 355 360 365 Ala Val Lys Pro Thr Lys Ile Met Pro Lys Lys Val Val Arg Leu Ile 370 375 380 Ala Lys Gly Lys Gly Phe Leu Asp Asn Ile Thr Ile Ser Thr Thr Ala 385 390 395 400 His Met Ala Ala Phe Phe Ala Ala Ser Asp Trp Leu Val Arg Asn Gln 405 410 415 Asp Glu Lys Gly Gly Trp Pro Ile Met Val Thr Arg Lys Leu Gly Glu 420 425 430 Gly Phe Lys Ser Leu Glu Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly 435 440 445 Gln Ala Ile Ser Thr Leu Val Arg Ala Tyr Leu Leu Thr Lys Asp His 450 455 460 Ile Phe Leu Asn Ser Ala Leu Arg Ala Thr Ala Pro Tyr Lys Phe Leu 465 470 475 480 Ser Glu Gln His Gly Val Lys Ala Val Phe Met Asn Lys His Asp Trp 485 490 495 Tyr Glu Glu Tyr Pro Thr Thr Pro Ser Ser Phe Val Leu Asn Gly Phe 500 505 510 Met Tyr Ser Leu Ile Gly Leu Tyr Asp Leu Lys Glu Thr Ala Gly Glu 515 520 525 Lys Leu Gly Lys Glu Ala Arg Ser Leu Tyr Glu Arg Gly Met Glu Ser 530 535 540 Leu Lys Ala Met Leu Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr 545 550 555 560 Asp Leu Arg His Phe Met Leu Gly Ile Ala Pro Asn Leu Ala Arg Trp 565 570 575 Asp Tyr His Thr Thr His Ile Asn Gln Leu Gln Leu Leu Ser Thr Ile 580 585 590 Asp Glu Ser Pro Val Phe Lys Glu Phe Val Lys Arg Trp Lys Ser Tyr 595 600 605 Leu Lys Gly Ser Arg Ala Lys His Asn 610 615 <210> 30 <211> 394 <212> PRT <213> Bacteroides eggerthii <400> 30 Met Lys Lys Asn Ile Phe Ile Ile Cys Met Ala Met Ala Ala Gly Cys 1 5 10 15 Ile Thr Thr Leu Thr Ala Gln Val Lys Asn Ala Glu Thr Leu Val Pro 20 25 30 Leu Thr Lys Arg Val Asn Val Gln Ala Asp Thr Ala Arg Leu Asp Gln 35 40 45 Ile Ile Asp Gly Cys Trp Val Ala Val Gly Thr Asn Lys Lys His Ala 50 55 60 Ile Gln Arg Asp Phe Thr Arg Leu Phe Ala Gly Lys Pro Ser Tyr Arg 65 70 75 80 Phe Glu Leu Arg Lys Glu Asp Asn Thr Leu Glu Gly Tyr Gly Lys Gly 85 90 95 Glu Thr Lys Gly Arg Ala Glu Phe Ser Tyr Cys Tyr Ala Thr Ser Ala 100 105 110 Asp Phe Lys Gly Leu Pro Ala Asp Ala Tyr Arg Lys Ala Gln Ile Thr 115 120 125 Lys Thr Val Tyr His His Gly Lys Gly Ile Cys Pro Gln Gly Val Ser 130 135 140 Arg Asp Tyr Glu Phe Ser Val Tyr Ile Pro Ser Ala Leu Asp Ser Asn 145 150 155 160 Val Ser Thr Ile Phe Ala Gln Trp His Gly Met Pro Asp Arg Thr Leu 165 170 175 Val Gln Thr Pro Glu Gly Glu Val Lys Lys Leu Thr Val Asp Glu Phe 180 185 190 Leu Glu Leu Asp Lys Thr Thr Ile Phe Lys Lys Asn Thr Gly His Glu 195 200 205 Lys Val Ala Lys Leu Asp Lys Gln Gly Asn Pro Val Lys Asp Lys Lys 210 215 220 Gly Asn Pro Val Tyr Lys Ala Gly Lys Lys Asn Gly Trp Leu Val Glu 225 230 235 240 Gln Gly Gly Tyr Pro Pro Leu Ala Phe Gly Phe Ser Gly Gly Trp Phe 245 250 255 Tyr Ile Lys Ala Asn Ser Asp Arg Arg Trp Leu Thr Asp Lys Thr Asp 260 265 270 Arg Cys Asn Ala Ser Pro Glu Lys Thr Pro Val Met Lys Pro Val Thr 275 280 285 Ser Lys Tyr Lys Ser Ser Thr Ile Ala Tyr Lys Met Pro Phe Ala Asp 290 295 300 Phe Pro Lys Asp Cys Trp Val Thr Phe Arg Val His Ile Asp Trp Thr 305 310 315 320 Thr Tyr Gly Lys Glu Ala Glu Asn Ile Val Lys Pro Gly Lys Leu Asp 325 330 335 Val Gln Met Glu Tyr Thr Asp Lys Lys Lys Thr Val Lys Glu His Ile 340 345 350 Val Asn Asn Glu Val Ile Gln Ile Gly Arg Asn Asp Asp Asp Gly Tyr 355 360 365 Tyr Phe Lys Phe Gly Ile Tyr Arg Val Gly Asn Ser Thr Val Pro Val 370 375 380 Cys Tyr Asn Leu Ala Gly Tyr Lys Glu Glu 385 390 <210> 31 <211> 773 <212> PRT <213> Bacteroides eggerthii <400> 31 Met Lys Lys Ser Ile Leu Phe Ile Thr Ser Leu Phe Leu Cys Ile Phe 1 5 10 15 Cys Leu Lys Ser Asn Ala Gln Gln Ser Arg Thr Glu Val Thr Trp Glu 20 25 30 Lys Met Glu Asp Val Thr Val Pro Ile Pro Pro Gln Val His Pro Arg 35 40 45 Leu Tyr Val Arg Ser Ala Asp Leu Pro Asp Leu Lys Lys Arg Met Asn 50 55 60 His Pro His Val Lys Glu Val Leu Ala Thr Leu Asn Lys Leu Gly Lys 65 70 75 80 Asp Arg Thr Pro Glu Glu Glu Ala Lys Val Lys Asp Arg Gly Phe Arg 85 90 95 Tyr Tyr Phe Glu Met Arg Gly Val Thr Ser Arg Val Gln Val Gln Ala 100 105 110 Leu Glu Tyr Leu Val Tyr Gly Asp Lys Lys Gln Ala Arg Arg Ala Ile 115 120 125 Thr Ala Met Leu Asp Thr Leu Gln Asn Val Asn Tyr Gly Thr Gln Gly 130 135 140 Asp Leu Ser Arg Ala Ser Gly Val Met Leu Thr Cys Gly Ala Met Val 145 150 155 160 Tyr Asp Trp Cys Tyr Asp Gln Met Lys Glu Ser Glu Lys Lys Ala Tyr 165 170 175 Val Glu Ser Phe Ile Arg Ile Ala Lys Thr Met Glu Cys Gly Tyr Pro 180 185 190 Pro Arg Asn Asn Glu Pro Ile Ala Gly His Ser Ser Glu Trp Met Ile 195 200 205 Leu Arg Asp Met Leu Ser Ala Gly Ile Ala Ile Tyr Asp Glu Tyr Pro 210 215 220 Asp Met Tyr Asn Tyr Val Ile Lys Met Met Phe Lys Asp Tyr Leu Pro 225 230 235 240 Val Arg Asn Tyr Ile Tyr Ser Gly His Asn Tyr His Gln Gly Thr Ser 245 250 255 Tyr Val Asn Val Arg Phe Ser Asn Asp Leu Phe Ser Leu Trp Ile Leu 260 265 270 Gln Arg Met Gly Ala Gly Ala Ile Tyr Asn Pro Ala Gln Gln Phe Val 275 280 285 Leu Tyr Asp Phe Leu Tyr Arg Arg Arg Pro Asp Gly Gln Val Met Pro 290 295 300 Ala Gly Asp Thr Asn Pro Ile Arg Lys Asn Thr Pro Ser Tyr Ser Leu 305 310 315 320 Pro Ala Met Leu Ala Ser Ser Phe Tyr Lys Asp Ser Tyr Leu Ala Tyr 325 330 335 Glu Tyr Glu Arg Lys Pro Asn Ile Glu Arg His Cys Leu Ile Phe Asp 340 345 350 Ile Leu Trp Arg Asp Leu Asp Leu Lys Ala Lys Ala Pro Asp Asp Leu 355 360 365 Pro Leu Thr Arg Tyr Ser Gly Ser Pro Phe Gly Trp Met Ile Ala Arg 370 375 380 Thr Ala Trp Asp Glu Asn Ser Val Ile Ala Glu Met Lys Ile Asn Glu 385 390 395 400 Gln Phe Val Gly Asn His Gln His Leu Asp Gly Gly Ser Phe Gln Leu 405 410 415 Tyr Tyr Lys Gly Pro Leu Ala Ile Asp Ala Gly Ala Tyr Gln Gly Ser 420 425 430 Ser Gly Gly Tyr Asn Ser Pro His Asn Lys Asn Phe Phe Lys Arg Thr 435 440 445 Ile Ala His Asn Ser Leu Leu Val Tyr Asn Pro Asp Glu Lys Phe Ala 450 455 460 Cys Trp Asn Tyr Gly Gly Gly Gly Lys Thr Glu Phe Ala Ala Asn Asp 465 470 475 480 Gly Gly Gln Arg Met Pro Gly Asp Arg Trp Glu Thr Cys Arg Ser Phe 485 490 495 Lys Gln Leu Met Ser Lys Asp Tyr Thr Thr Gly Lys Ala Leu Ala His 500 505 510 Gly Phe Gly Pro Asp Ala Cys Lys Pro Asp Tyr Ser Tyr Leu Lys Gly 515 520 525 Asp Ile Thr Gln Ala Tyr Thr Asp Lys Val Lys Glu Ala Lys Arg Ser 530 535 540 Phe Val Phe Leu Asn Leu His Ser Thr Glu Val Pro Gly Ala Leu Ile 545 550 555 560 Val Phe Asp Lys Val Val Ser Ser Asp Pro Gln Phe Lys Lys Phe Trp 565 570 575 Leu Leu His Ser Ile Glu Glu Pro Val Ile Glu Gly Asp Arg Phe Ile 580 585 590 Ile Arg Arg Thr Lys Asn Gly Asp Thr Gly Met Leu Gln Asn Gln Val 595 600 605 Leu Leu Pro Glu Ala Gly Asn Ala Gln Ile Glu Lys Val Gly Gly Lys 610 615 620 Gly Lys Glu Phe Trp Val Phe Gly Thr Asn Tyr Pro Asn Asp Ala Leu 625 630 635 640 Pro Asn Arg Pro Asp Asp Ala Asn Glu Arg Gly Ala Trp Arg Val Glu 645 650 655 Val Ser Pro Ala Val Pro Ala Ala Glu Asn Tyr Phe Leu Asn Val Ile 660 665 670 Gln Val Ala Asp Asn Thr Cys Lys Arg Met Asn Asp Val Lys Arg Ile 675 680 685 Asp Ala Gly Lys Val Val Gly Val Gln Ile Ala Asp Arg Ile Val Thr 690 695 700 Phe Ser Lys Asn Ser Leu Pro Leu Ser Gly Lys Ile Asp Met Lys Val 705 710 715 720 Asp Gly Asn Thr Ser Met Lys Phe Val Ile Thr Asp Leu Ile Pro Gly 725 730 735 Thr Trp Gln Ile Lys Lys Asp Gly Lys Val Tyr Ile Pro Ala Met Glu 740 745 750 Val Arg Ser Asp Asp Gly Ile Leu Ser Phe Glu Gly Thr Ala Gly His 755 760 765 Tyr Glu Phe Leu Arg 770 <210> 32 <211> 666 <212> PRT <213> Bacteroides eggerthii <400> 32 Met Lys Ile Met Lys Phe Ile Leu Ser Val Phe Leu Leu Thr Ile Ala 1 5 10 15 Ile Ile Ala Asp Ala Gln Gln Leu Arg Lys Glu Ala Phe Asp Leu Leu 20 25 30 Asn Leu Asp Tyr Pro Gly Leu Glu Lys Val Lys Thr Ala Cys Ser Arg 35 40 45 Gln Gln Trp Glu Glu Ala Ala Gln Glu Leu Leu Ala Tyr Tyr Arg Asn 50 55 60 Arg Thr Asp Ile Ala His Pro Asp Ile Asp Leu Lys Asn Leu Ala Ile 65 70 75 80 Ser Lys Glu Glu Gln Lys Trp Ala Asp Asp Ala Met Asp His Thr Phe 85 90 95 Phe Val His Lys Gly Tyr Gln Pro Ser Tyr Asn Tyr Gly Lys Asp Ile 100 105 110 Asn Trp Glu Tyr Trp Pro Val Lys Asp Asn Glu Leu Arg Trp Gln Leu 115 120 125 His Arg His Lys Trp Phe Thr Pro Met Gly Lys Ala Tyr Arg Ile Ser 130 135 140 Gly Asp Glu Lys Tyr Ala Lys Glu Trp Ala Phe Gln Tyr Ile Asp Trp 145 150 155 160 Ile Lys Lys Asn Pro Leu Val Lys Met Glu Lys Glu Asn Phe Glu Leu 165 170 175 Val Ser Ala Gly Glu Val Lys Glu Asp Ala Asp Asn Val His Phe Ala 180 185 190 Trp Arg Gln Leu Glu Val Ser Asn Arg Leu Gln Asp Gln Thr Cys Gln 195 200 205 Phe Leu Leu Phe Cys Pro Ala Glu Ala Phe Thr Pro Glu Phe Leu Thr 210 215 220 Glu Phe Leu Val Asn Tyr His Arg His Gly Ala Tyr Leu Phe Lys Asn 225 230 235 240 Tyr Ser Ala Glu Gly Asn His Leu Leu Phe Glu Ala Gln Arg Met Val 245 250 255 Tyr Ala Gly Val Phe Phe Pro Glu Phe Lys Asp Ala Ala Thr Trp Arg 260 265 270 Glu Ser Gly Ile Asn Ile Leu Asn Arg Glu Ile Lys Lys Gln Val Tyr 275 280 285 Asp Asp Gly Gly Gln Tyr Glu Leu Asp Pro His Tyr His Leu Ala Ala 290 295 300 Ile Asn Ile Phe Cys Lys Ala Leu Arg Met Ala Asp Cys Asn Gly Phe 305 310 315 320 Arg Asn Glu Phe Pro Ala Glu Tyr Leu Asp Thr Val Lys Lys Met Ile 325 330 335 Glu Phe Tyr Thr Asn Ile Cys Phe Pro Asp Tyr Thr Asn Pro Cys Phe 340 345 350 Ser Asp Ala Lys Leu Gly Asp Tyr Lys Ser Glu Leu Ala Asn Tyr Arg 355 360 365 Asp Trp Val Thr Leu Phe Pro Asp Ser Glu Trp Ile Arg Tyr Tyr Ala 370 375 380 Thr Glu Gly Arg Glu Gly Ala Pro Leu Pro Tyr Leu Ser His Gly Ser 385 390 395 400 Leu Ala Ser Gly Phe Phe Thr Phe Arg Ser Gly Trp Lys Lys Asp Ala 405 410 415 Ala Val Val Val Val Lys Ala Gly Pro Lys Gly Glu Trp His Cys Gln 420 425 430 Pro Asp Asn Gly Thr Phe Glu Phe Trp Phe Asn Gly Lys Asn Leu Phe 435 440 445 Pro Asp Ser Gly Ala Tyr Val Tyr Ala Gly Ser Asp Glu Val Met Lys 450 455 460 Leu Arg Asn Trp Phe Arg Gln Thr Arg Val His Asn Thr Leu Thr Leu 465 470 475 480 Asp Gly Arg Asn Phe Glu Thr Thr Gln Ser Val Thr Lys Leu Trp Gln 485 490 495 Pro Glu Gly Arg Glu Gln Ile Leu Val Thr Glu Asn Pro Ser Tyr Gln 500 505 510 Gly Leu Lys His Arg Arg Thr Val Phe Phe Val Glu Gln Thr Tyr Tyr 515 520 525 Val Ile Val Asp Glu Ala Val Gly Asp Ala Lys Gly Thr Val Asn Leu 530 535 540 Asn Tyr His Phe Cys Glu Gly Thr Val Asn Val Asp Val Lys Lys Asn 545 550 555 560 Met Ala Thr Thr Ala Tyr Ala Gly Pro Ser Asn Val Lys Leu Gln Cys 565 570 575 Phe Pro Glu Lys Lys Ala Ser Leu Lys Lys Glu Glu Gly Trp Arg Ser 580 585 590 Ile Ala Tyr Arg Gln Arg Val Pro Arg Thr Ser Leu Ser Phe Asp Ile 595 600 605 His Lys Asp Asp Ala Glu Ala Val Arg Tyr Ile Thr Val Ile Tyr Pro 610 615 620 Val Lys Asp Ala Ala Ser Tyr Pro Val Leu Lys Ala Lys Phe Leu Asn 625 630 635 640 Lys Asp Phe Asp Glu Lys Gly Val Lys Val Glu Val Ser Val Asn Gly 645 650 655 Val Ala Arg Gln Leu Met Ser Gln Leu Lys 660 665 <210> 33 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 7 <220> <221> MISC_FEATURE <222> (40)..(40) <223> Xaa is glutamine, serine, or alanine <220> <221> MISC_FEATURE <222> (45)..(45) <223> Xaa is tryptophan or phenyalanine <220> <221> MISC_FEATURE <222> (46)..(46) <223> Xaa is alanine or leucine <220> <221> MISC_FEATURE <222> (48)..(48) <223> Xaa is tyrosine, threonine, or histidine <220> <221> MISC_FEATURE <222> (67)..(67) <223> Xaa is histidine or glycine <220> <221> MISC_FEATURE <222> (68)..(68) <223> Xaa is glycine, histidine, or serine <220> <221> MISC_FEATURE <222> (103)..(103) <223> Xaa is lysine or threonine <220> <221> MISC_FEATURE <222> (105)..(105) <223> Xaa is alanine or serine <220> <221> MISC_FEATURE <222> (256)..(256) <223> Xaa is leucine, histidine, or alanine <220> <221> MISC_FEATURE <222> (257)..(257) <223> Xaa is glycine or histidine <220> <221> MISC_FEATURE <222> (259)..(259) <223> Xaa is serine, arginine, or glycine <220> <221> MISC_FEATURE <222> (260)..(260) <223> Xaa is histidine, tryptophan, or leucine <400> 33 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro Xaa Lys Thr Gly Ala Xaa Xaa Leu Xaa 35 40 45 His Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Xaa Xaa Ser Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Xaa Ser Xaa Asn Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Xaa 245 250 255 Xaa Lys Xaa Xaa Gly Arg Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 34 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 8 <220> <221> MISC_FEATURE <222> (41)..(41) <223> Xaa is glycine or lysine <220> <221> MISC_FEATURE <222> (44)..(44) <223> Xaa is glycine or valine <220> <221> MISC_FEATURE <222> (67)..(67) <223> Xaa is glycine or phenylalanine <220> <221> MISC_FEATURE <222> (68)..(68) <223> Xaa is glutamic acid, leucine, or asparagine <220> <221> MISC_FEATURE <222> (69)..(69) <223> Xaa is glutamic acid, serine, or histidine <220> <221> MISC_FEATURE <222> (71)..(71) <223> Xaa is glutamine or glycine <220> <221> MISC_FEATURE <222> (74)..(74) <223> Xaa is asparagine or glycine <220> <221> MISC_FEATURE <222> (103)..(103) <223> Xaa is lysine or histidine <220> <221> MISC_FEATURE <222> (105)..(105) <223> Xaa is alanine or glycine <220> <221> MISC_FEATURE <222> (106)..(106) <223> Xaa is asparagine or tryptophan <220> <221> MISC_FEATURE <222> (139)..(139) <223> Xaa is serine or arginine <220> <221> MISC_FEATURE <222> (140)..(140) <223> Xaa is tryptophan or alanine <220> <221> MISC_FEATURE <222> (142)..(142) <223> Xaa is glutamine or valine <220> <221> MISC_FEATURE <222> (143)..(143) <223> Xaa is histidine, alanine, or tryptophan <220> <221> MISC_FEATURE <222> (256)..(256) <223> Xaa is leucine or glycine <220> <221> MISC_FEATURE <222> (259)..(259) <223> Xaa is serine or histidine <220> <221> MISC_FEATURE <222> (260)..(260) <223> Xaa is leucine or valine <220> <221> MISC_FEATURE <222> (262)..(262) <223> Xaa is arginine or serine <400> 34 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro His Xaa Thr Gly Xaa His Ala Leu Tyr 35 40 45 Leu Phe Leu Gly Met His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Xaa Xaa Xaa Ile Xaa Phe Phe Xaa Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Glu Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Xaa Ser Xaa Xaa Tyr Phe Asp Ser Glu Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Xaa Xaa Tyr Xaa Xaa Gln 130 135 140 Arg Ala His Asp Asp Pro Val Ala Leu Lys Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Ser Asp Ala Ser Ser Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Ile Glu Arg Trp Leu 180 185 190 Ser Ala Tyr His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Lys Val Met Asp Met Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Xaa 245 250 255 Gly Lys Xaa Xaa Gly Xaa Lys Tyr Pro Glu Met Asp Leu Asp Ser Arg 260 265 270 Ala Phe Leu Lys Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Asp 290 295 300 Leu Gln Asn Thr Arg 305 <210> 35 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 9 <400> 35 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro Gln Lys Thr Gly Ala Trp Ala Leu Tyr 35 40 45 His Phe Leu Gly Leu His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr His Gly Ser Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Asp Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Lys Ser Ala Asn Tyr Phe Asp Ser Asp Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Ala Ala Leu Arg Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Pro Asp Ala Ser Leu Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Leu Glu Arg Trp Leu 180 185 190 Gly Ala Phe His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Arg Val Met Asp Thr Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Leu 245 250 255 Gly Arg Ser His Gly Arg Lys Tyr Pro Asp Met Asp Pro Asp Ser Arg 260 265 270 Ala Phe Leu Arg Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Glu 290 295 300 Leu Gln Asn Thr Arg 305 <210> 36 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 10 <400> 36 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro Ser Lys Thr Gly Ala Phe Leu Leu Thr 35 40 45 His Phe Leu Gly Leu His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Gly His Ser Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Asp Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Thr Ser Ser Asn Tyr Phe Asp Ser Asp Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Ala Ala Leu Arg Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Pro Asp Ala Ser Leu Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Leu Glu Arg Trp Leu 180 185 190 Gly Ala Phe His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Arg Val Met Asp Thr Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys His 245 250 255 Gly Arg Arg Trp Gly Arg Lys Tyr Pro Asp Met Asp Pro Asp Ser Arg 260 265 270 Ala Phe Leu Arg Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Glu 290 295 300 Leu Gln Asn Thr Arg 305 <210> 37 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 11 <400> 37 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro His His Thr Gly Gly His Ala Leu Tyr 35 40 45 Leu Phe Leu Gly Leu His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Gly Glu Glu Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Asp Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Lys Ser Ala Asn Tyr Phe Asp Ser Asp Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln Ala Gln 130 135 140 Arg Ala His Asp Asp Pro Ala Ala Leu Arg Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Pro Asp Ala Ser Leu Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Leu Glu Arg Trp Leu 180 185 190 Gly Ala Phe His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Arg Val Met Asp Thr Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Gly 245 250 255 Gly Arg His Leu Gly Arg Lys Tyr Pro Asp Met Asp Pro Asp Ser Arg 260 265 270 Ala Phe Leu Arg Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Glu 290 295 300 Leu Gln Asn Thr Arg 305 <210> 38 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 12 <400> 38 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro His Gly Thr Gly Gly His Ala Leu Tyr 35 40 45 Leu Phe Leu Gly Leu His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Phe Leu Ser Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Asp Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu His Ser Gly Asn Tyr Phe Asp Ser Asp Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Arg Ala Tyr Val Trp Gln 130 135 140 Arg Ala His Asp Asp Pro Ala Ala Leu Arg Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Pro Asp Ala Ser Leu Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Leu Glu Arg Trp Leu 180 185 190 Gly Ala Phe His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Arg Val Met Asp Thr Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Leu 245 250 255 Gly Arg Ser Leu Gly Ser Lys Tyr Pro Asp Met Asp Pro Asp Ser Arg 260 265 270 Ala Phe Leu Arg Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Glu 290 295 300 Leu Gln Asn Thr Arg 305 <210> 39 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 13 <400> 39 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro His Lys Thr Gly Val His Ala Leu Tyr 35 40 45 Leu Phe Leu Gly Leu His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr Gly Asn His Ile Gly Phe Phe Gly Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Asp Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Lys Ser Ala Trp Tyr Phe Asp Ser Asp Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Ala Ala Leu Arg Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Pro Asp Ala Ser Leu Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Leu Glu Arg Trp Leu 180 185 190 Gly Ala Phe His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Arg Val Met Asp Thr Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Leu 245 250 255 Gly Arg Ser Val Gly Arg Lys Tyr Pro Asp Met Asp Pro Asp Ser Arg 260 265 270 Ala Phe Leu Arg Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Glu 290 295 300 Leu Gln Asn Thr Arg 305 <210> 40 <211> 309 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent N-sulfotransferase variant 14 <400> 40 Met Ser Glu Glu Lys Asp Pro Leu Trp Gln Asp Pro Cys Glu Asp Lys 1 5 10 15 Arg His Lys Asp Ile Trp Ser Lys Glu Lys Thr Cys Asp Arg Phe Pro 20 25 30 Lys Leu Leu Ile Ile Gly Pro Ala Lys Thr Gly Ala Trp Leu Leu His 35 40 45 His Phe Leu Gly Leu His Pro Asp Leu Ser Ser Asn Tyr Pro Ser Ser 50 55 60 Glu Thr His Ser Ser Ile Gln Phe Phe Asn Gly His Asn Tyr His Lys 65 70 75 80 Gly Ile Asp Trp Tyr Met Asp Phe Phe Pro Ile Pro Ser Asn Thr Thr 85 90 95 Ser Asp Phe Tyr Phe Glu Thr Ser Ala Asn Tyr Phe Asp Ser Asp Val 100 105 110 Ala Pro Arg Arg Ala Ala Ala Leu Leu Pro Lys Ala Lys Val Leu Thr 115 120 125 Ile Leu Ile Asn Pro Ala Asp Arg Ala Tyr Ser Trp Tyr Gln His Gln 130 135 140 Arg Ala His Asp Asp Pro Ala Ala Leu Arg Tyr Thr Phe His Glu Val 145 150 155 160 Ile Thr Ala Gly Pro Asp Ala Ser Leu Lys Leu Arg Ala Leu Gln Asn 165 170 175 Arg Cys Leu Val Pro Gly Trp Tyr Ala Thr His Leu Glu Arg Trp Leu 180 185 190 Gly Ala Phe His Ala Asn Gln Ile Leu Val Leu Asp Gly Lys Leu Leu 195 200 205 Arg Thr Glu Pro Ala Arg Val Met Asp Thr Val Gln Lys Phe Leu Gly 210 215 220 Val Thr Asn Thr Ile Asp Tyr His Lys Thr Leu Ala Phe Asp Pro Lys 225 230 235 240 Lys Gly Phe Trp Cys Gln Leu Leu Glu Gly Gly Lys Thr Lys Cys Ala 245 250 255 His Arg Gly Leu Gly Arg Lys Tyr Pro Asp Met Asp Pro Asp Ser Arg 260 265 270 Ala Phe Leu Arg Asp Tyr Tyr Arg Asp His Asn Ile Glu Leu Ser Lys 275 280 285 Leu Leu Tyr Lys Met Gly Gln Thr Leu Pro Thr Trp Leu Arg Glu Glu 290 295 300 Leu Gln Asn Thr Arg 305 <210> 41 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 2-O-sulfotransferase variant 3 <400> 41 Met Asp Glu Glu Glu Asp Met Val Ile Ile Tyr Asn Arg Val Pro His 1 5 10 15 Thr Ala Ser Thr Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Lys Tyr His Val Leu His Ile Asn Thr Thr Lys Asn Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Ile Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly His Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr His Leu Arg Phe 100 105 110 Gly Asp Asp Tyr Arg Pro Gly Leu Arg Arg Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Glu Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Met Asp Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Gln Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Asp Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Ile Arg Ala His Ala Val Arg Glu Lys Asp Gly Asp Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 42 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 2-O-sulfotransferase variant 4 <400> 42 Met Asp Glu Glu Glu Asp Met Val Ile Ile Tyr Asn Arg Val His Arg 1 5 10 15 Thr Ala Ser His Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys 20 25 30 Asn Lys Tyr His Val Leu His Ile Asn Thr Thr Lys Gly Asn Pro Val 35 40 45 Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Ile Thr Ser Trp 50 55 60 Lys Glu Met Lys Pro Gly Phe Tyr His Gly Pro Val Ser Tyr Leu Asp 65 70 75 80 Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile 85 90 95 Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Phe Leu Arg Phe 100 105 110 Gly Ser Asp Lys Arg Pro Gly Leu Arg Met Arg Lys Gln Gly Asp Lys 115 120 125 Lys Thr Phe Asp Glu Cys Val Ala Glu Gly Gly Ser Asp Cys Ala Pro 130 135 140 Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu 145 150 155 160 Cys Trp Asn Val Gly Ser Arg Trp Ala Met Asp Gln Ala Lys Tyr Asn 165 170 175 Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp 180 185 190 Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala 195 200 205 Thr Glu Leu Tyr Arg Thr Gly Lys Lys Ser His Leu His Lys Thr Thr 210 215 220 Glu Lys Lys Leu Pro Thr Lys Gln Thr Ile Ala Lys Leu Gln Gln Ser 225 230 235 240 Asp Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln 245 250 255 Phe Gln Phe Ile Arg Ala His Ala Val Arg Glu Lys Asp Gly Asp Leu 260 265 270 Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser 275 280 285 Asn <210> 43 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 6-O-sulfotransferase variant 4 <220> <221> MISC_FEATURE <222> (84)..(84) <223> Xaa is threonine or serine <220> <221> MISC_FEATURE <222> (85)..(85) <223> Xaa is asparagine, arginine, or histidine <220> <221> MISC_FEATURE <222> (128)..(128) <223> Xaa is glycine or serine <220> <221> MISC_FEATURE <222> (129)..(129) <223> Xaa is glycine or histidine <220> <221> MISC_FEATURE <222> (133)..(133) <223> Xaa is histidine or threonine <220> <221> MISC_FEATURE <222> (138)..(138) <223> Xaa is alanine or threonine <220> <221> MISC_FEATURE <222> (142)..(142) <223> Xaa is glycine or serine <220> <221> MISC_FEATURE <222> (181)..(181) <223> Xaa is glycine or alanine <400> 43 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Xaa Xaa Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Xaa 115 120 125 Xaa Trp Arg His Xaa Gln Arg Gly Gly Xaa Asn Lys Thr Xaa Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Xaa Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys Arg 195 200 205 Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Glu 290 295 300 Gln Arg Leu Arg Asn Arg Glu Glu 305 310 <210> 44 <211> 411 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 6-O-sulfotransferase variant 5 <220> <221> MISC_FEATURE <222> (149)..(149) <223> Xaa is threonine or serine <220> <221> MISC_FEATURE <222> (150)..(150) <223> Xaa is asparagine, arginine, or histidine <220> <221> MISC_FEATURE <222> (193)..(193) <223> Xaa is glycine or serine <220> <221> MISC_FEATURE <222> (194)..(194) <223> Xaa is glycine or histidine <220> <221> MISC_FEATURE <222> (198)..(198) <223> Xaa is histidine or threonine <220> <221> MISC_FEATURE <222> (203)..(203) <223> Xaa is alanine or threonine <220> <221> MISC_FEATURE <222> (207)..(207) <223> Xaa is glycine or serine <220> <221> MISC_FEATURE <222> (246)..(246) <223> Xaa is glycine or alanine <400> 44 Met Arg Arg Arg Arg Ala Gly Gly Arg Thr Met Val Glu Arg Ala Ser 1 5 10 15 Lys Phe Val Leu Val Val Ala Gly Ser Ala Cys Phe Met Leu Ile Leu 20 25 30 Tyr Gln Tyr Ala Gly Pro Gly Leu Ser Leu Gly Ala Pro Gly Gly Arg 35 40 45 Val Pro Pro Asp Asp Leu Asp Leu Phe Pro Thr Pro Asp Pro His Tyr 50 55 60 Glu Lys Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu Arg 65 70 75 80 Phe Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His 85 90 95 Thr Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu 100 105 110 Glu Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr 115 120 125 Arg Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly 130 135 140 Trp Ser Cys Gly Xaa Xaa Ala Asp Trp Thr Glu Leu Thr Asn Cys Val 145 150 155 160 Pro Gly Val Leu Asp Arg Arg Asp Pro Ala Gly Leu Arg Ser Pro Arg 165 170 175 Lys Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu 180 185 190 Xaa Xaa Trp Arg His Xaa Gln Arg Gly Gly Xaa Asn Lys Thr Xaa Leu 195 200 205 His Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys 210 215 220 Tyr Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp 225 230 235 240 Cys Pro Tyr Asn Leu Xaa Asn Asn Arg Gln Val Arg Met Leu Ala Asp 245 250 255 Leu Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Ser Lys 260 265 270 Arg Ala Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met 275 280 285 Ala Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe 290 295 300 Glu Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn 305 310 315 320 Ser Thr Arg Ala Gly Gly Val Glu Val Asp Glu Asp Thr Ile Arg His 325 330 335 Ile Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Lys 340 345 350 Asp Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg 355 360 365 Glu Gln Arg Leu Arg Asn Arg Glu Glu Arg Leu Leu His Arg Ser Lys 370 375 380 Glu Ala Leu Pro Arg Glu Asp Pro Glu Glu Pro Gly Arg Val Pro Thr 385 390 395 400 Glu Asp Tyr Met Ser His Ile Ile Glu Lys Trp 405 410 <210> 45 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 6-O-sulfotransferase variant 6 <400> 45 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu His Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Thr Asn Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Ala Leu Arg Thr Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Gly 115 120 125 Gly Trp Arg His His Gln Arg Gly Gly Thr Asn Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Gly Lys Arg 195 200 205 Ser Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Gly Glu Asp Thr Ile Arg Arg Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Arg Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Gln 290 295 300 Gln Arg Leu Arg Ser Arg Glu Glu 305 310 <210> 46 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 6-O-sulfotransferase variant 7 <400> 46 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu His Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Thr Arg Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Ala Leu Arg Thr Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser 115 120 125 His Trp Arg His Thr Gln Arg Gly Gly Ala Asn Lys Thr Gly Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Gly Lys Arg 195 200 205 Ser Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Gly Glu Asp Thr Ile Arg Arg Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Arg Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Gln 290 295 300 Gln Arg Leu Arg Ser Arg Glu Glu 305 310 <210> 47 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 6-O-sulfotransferase variant 8 <400> 47 Met Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu His Phe 1 5 10 15 Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His Thr 20 25 30 Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu Glu 35 40 45 Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr Arg 50 55 60 Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp 65 70 75 80 Ser Cys Gly Ser His Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro 85 90 95 Gly Val Leu Asp Arg Arg Asp Pro Ala Ala Leu Arg Thr Pro Arg Lys 100 105 110 Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser 115 120 125 Gly Trp Arg His His Gln Arg Gly Gly Ala Asn Lys Thr Ser Leu His 130 135 140 Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys Tyr 145 150 155 160 Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp Cys 165 170 175 Pro Tyr Asn Leu Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu 180 185 190 Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Gly Lys Arg 195 200 205 Ser Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met Ala 210 215 220 Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe Glu 225 230 235 240 Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn Ser 245 250 255 Thr Arg Ala Gly Gly Val Glu Val Gly Glu Asp Thr Ile Arg Arg Ile 260 265 270 Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Arg Asp 275 280 285 Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg Gln 290 295 300 Gln Arg Leu Arg Ser Arg Glu Glu 305 310 <210> 48 <211> 411 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 6-O-sulfotransferase variant 9 <400> 48 Met Arg Arg Arg Arg Ala Gly Ser Arg Thr Met Val Glu Arg Ala Ser 1 5 10 15 Lys Phe Val Leu Val Val Ala Gly Ser Ala Cys Phe Met Leu Ile Leu 20 25 30 Tyr Gln Tyr Ala Gly Pro Gly Leu Ser Leu Gly Ala Pro Gly Gly Arg 35 40 45 Ala Pro Pro Asp Asp Leu Asp Leu Phe Pro Thr Pro Asp Pro His Tyr 50 55 60 Glu Lys Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu His 65 70 75 80 Phe Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His 85 90 95 Thr Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu 100 105 110 Glu Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr 115 120 125 Arg Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly 130 135 140 Trp Ser Cys Gly Thr Asn Ala Asp Trp Thr Glu Leu Thr Asn Cys Val 145 150 155 160 Pro Gly Val Leu Asp Arg Arg Asp Pro Ala Ala Leu Arg Thr Pro Arg 165 170 175 Lys Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu 180 185 190 Gly Gly Trp Arg His His Gln Arg Gly Gly Thr Asn Lys Thr Ser Leu 195 200 205 His Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys 210 215 220 Tyr Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp 225 230 235 240 Cys Pro Tyr Asn Leu Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp 245 250 255 Leu Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Gly Lys 260 265 270 Arg Ser Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met 275 280 285 Ala Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe 290 295 300 Glu Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn 305 310 315 320 Ser Thr Arg Ala Gly Gly Val Glu Val Gly Glu Asp Thr Ile Arg Arg 325 330 335 Ile Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Arg 340 345 350 Asp Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg 355 360 365 Gln Gln Arg Leu Arg Ser Arg Glu Glu Arg Leu Leu His Arg Ala Lys 370 375 380 Glu Ala Pro Pro Arg Gly Asp Thr Glu Glu Pro Gly Arg Val Pro Thr 385 390 395 400 Glu Asp Tyr Met Ser His Ile Ile Glu Lys Trp 405 410 <210> 49 <211> 411 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 6-O-sulfotransferase variant 10 <400> 49 Met Arg Arg Arg Arg Ala Gly Ser Arg Thr Met Val Glu Arg Ala Ser 1 5 10 15 Lys Phe Val Leu Val Val Ala Gly Ser Ala Cys Phe Met Leu Ile Leu 20 25 30 Tyr Gln Tyr Ala Gly Pro Gly Leu Ser Leu Gly Ala Pro Gly Gly Arg 35 40 45 Ala Pro Pro Asp Asp Leu Asp Leu Phe Pro Thr Pro Asp Pro His Tyr 50 55 60 Glu Lys Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu His 65 70 75 80 Phe Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His 85 90 95 Thr Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu 100 105 110 Glu Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr 115 120 125 Arg Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly 130 135 140 Trp Ser Cys Gly Thr Arg Ala Asp Trp Thr Glu Leu Thr Asn Cys Val 145 150 155 160 Pro Gly Val Leu Asp Arg Arg Asp Pro Ala Ala Leu Arg Thr Pro Arg 165 170 175 Lys Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu 180 185 190 Ser His Trp Arg His Thr Gln Arg Gly Gly Ala Asn Lys Thr Gly Leu 195 200 205 His Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys 210 215 220 Tyr Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp 225 230 235 240 Cys Pro Tyr Asn Leu Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp 245 250 255 Leu Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Gly Lys 260 265 270 Arg Ser Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met 275 280 285 Ala Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe 290 295 300 Glu Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn 305 310 315 320 Ser Thr Arg Ala Gly Gly Val Glu Val Gly Glu Asp Thr Ile Arg Arg 325 330 335 Ile Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Arg 340 345 350 Asp Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg 355 360 365 Gln Gln Arg Leu Arg Ser Arg Glu Glu Arg Leu Leu His Arg Ala Lys 370 375 380 Glu Ala Pro Pro Arg Gly Asp Thr Glu Glu Pro Gly Arg Val Pro Thr 385 390 395 400 Glu Asp Tyr Met Ser His Ile Ile Glu Lys Trp 405 410 <210> 50 <211> 411 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 6-O-sulfotransferase variant 11 <400> 50 Met Arg Arg Arg Arg Ala Gly Ser Arg Thr Met Val Glu Arg Ala Ser 1 5 10 15 Lys Phe Val Leu Val Val Ala Gly Ser Ala Cys Phe Met Leu Ile Leu 20 25 30 Tyr Gln Tyr Ala Gly Pro Gly Leu Ser Leu Gly Ala Pro Gly Gly Arg 35 40 45 Ala Pro Pro Asp Asp Leu Asp Leu Phe Pro Thr Pro Asp Pro His Tyr 50 55 60 Glu Lys Lys Tyr Tyr Phe Pro Val Arg Glu Leu Glu Arg Ser Leu His 65 70 75 80 Phe Asp Met Lys Gly Asp Asp Val Ile Val Phe Leu His Ile Gly His 85 90 95 Thr Gly Gly Thr Thr Phe Gly Arg His Leu Val Gln Asn Val Arg Leu 100 105 110 Glu Val Pro Cys Asp Cys Arg Pro Gly Gln Lys Lys Cys Thr Cys Tyr 115 120 125 Arg Pro Asn Arg Arg Glu Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly 130 135 140 Trp Ser Cys Gly Ser His Ala Asp Trp Thr Glu Leu Thr Asn Cys Val 145 150 155 160 Pro Gly Val Leu Asp Arg Arg Asp Pro Ala Ala Leu Arg Thr Pro Arg 165 170 175 Lys Phe Tyr Tyr Ile Thr Leu Leu Arg Asp Pro Val Ser Arg Tyr Leu 180 185 190 Ser Gly Trp Arg His His Gln Arg Gly Gly Ala Asn Lys Thr Ser Leu 195 200 205 His Met Cys Asp Gly Arg Thr Pro Thr Pro Glu Glu Leu Pro Pro Cys 210 215 220 Tyr Glu Gly Thr Asp Trp Ser Gly Cys Thr Leu Gln Glu Phe Met Asp 225 230 235 240 Cys Pro Tyr Asn Leu Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp 245 250 255 Leu Ser Leu Val Gly Cys Tyr Asn Leu Ser Phe Ile Pro Glu Gly Lys 260 265 270 Arg Ser Gln Leu Leu Leu Glu Ser Ala Lys Lys Asn Leu Arg Gly Met 275 280 285 Ala Phe Phe Gly Leu Thr Glu Phe Gln Arg Lys Thr Gln Tyr Leu Phe 290 295 300 Glu Arg Thr Phe Asn Leu Lys Phe Ile Arg Pro Phe Met Gln Tyr Asn 305 310 315 320 Ser Thr Arg Ala Gly Gly Val Glu Val Gly Glu Asp Thr Ile Arg Arg 325 330 335 Ile Glu Glu Leu Asn Asp Leu Asp Met Gln Leu Tyr Asp Tyr Ala Arg 340 345 350 Asp Leu Phe Gln Gln Arg Tyr Gln Tyr Lys Arg Gln Leu Glu Arg Arg 355 360 365 Gln Gln Arg Leu Arg Ser Arg Glu Glu Arg Leu Leu His Arg Ala Lys 370 375 380 Glu Ala Pro Pro Arg Gly Asp Thr Glu Glu Pro Gly Arg Val Pro Thr 385 390 395 400 Glu Asp Tyr Met Ser His Ile Ile Glu Lys Trp 405 410 <210> 51 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 3-O-sulfotransferase variant 4 <220> <221> MISC_FEATURE <222> (114)..(114) <223> Xaa is alanine or leucine <220> <221> MISC_FEATURE <222> (115)..(115) <223> Xaa is tyrosine or glycine <220> <221> MISC_FEATURE <222> (118)..(118) <223> Xaa is methionine or leucine <220> <221> MISC_FEATURE <222> (121)..(121) <223> Xaa is asparagine or valine <220> <221> MISC_FEATURE <222> (147)..(147) <223> Xaa is valine or threonine <400> 51 Met Gly Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln 50 55 60 Met Pro Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr His Ser 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro 85 90 95 Thr Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Xaa Xaa Thr His Xaa Leu Tyr Xaa His Leu Gln Lys His Lys Pro 115 120 125 Tyr Pro Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu 130 135 140 Asp Tyr Xaa Gly Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asp Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 52 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 3-O-sulfotransferase variant 5 <400> 52 Met Gly Val Ala Pro Asn Gly Ser Ala Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser His Gly Leu Gly Trp Tyr Leu Ser Gln 50 55 60 Met Pro Phe Ser Trp Pro His Gln Leu Thr Val Glu Lys Thr His Ser 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Val Tyr Ser Met Asn Pro 85 90 95 Ser Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Leu Gly Thr His Leu Phe Tyr Val His Met Gln Lys His Lys Pro 115 120 125 Tyr Pro Ser Ile Glu Glu Phe Leu Val Arg Asp Gly Arg Leu Asn Val 130 135 140 Asp Tyr Thr Gly Leu Asn Arg Ser Leu Tyr His Val His Met Gln Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Arg His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Arg Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asn Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Glu 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 53 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 3-O-sulfotransferase variant 6 <400> 53 Met Gly Val Ala Pro Asn Gly Ser Ala Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser His Gly Leu Gly Trp Tyr Leu Ser Gln 50 55 60 Met Pro Phe Ser Trp Pro His Gln Leu Thr Val Glu Lys Thr His Ser 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Val Tyr Ser Met Asn Pro 85 90 95 Ser Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Ala Tyr Thr His Met Phe Tyr Asn His Met Gln Lys His Lys Pro 115 120 125 Tyr Pro Ser Ile Glu Glu Phe Leu Val Arg Asp Gly Arg Leu Asn Val 130 135 140 Asp Tyr Thr Gly Leu Asn Arg Ser Leu Tyr His Val His Met Gln Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Arg His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Arg Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asn Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Glu 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 54 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 3-O-sulfotransferase variant 7 <400> 54 Met Gly Val Ala Pro Asn Gly Ser Ala Gln Gln Leu Pro Gln Thr Ile 1 5 10 15 Ile Ile Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu 20 25 30 Ser Leu His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe 35 40 45 Asp Trp Glu Glu His Tyr Ser His Gly Leu Gly Trp Tyr Leu Ser Gln 50 55 60 Met Pro Phe Ser Trp Pro His Gln Leu Thr Val Glu Lys Thr His Ser 65 70 75 80 Tyr Phe Thr Ser Pro Lys Val Pro Glu Arg Val Tyr Ser Met Asn Pro 85 90 95 Ser Ile Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu 100 105 110 Ser Leu Gly Thr His Leu Phe Tyr Val His Met Gln Lys His Lys Pro 115 120 125 Tyr Pro Ser Ile Glu Glu Phe Leu Val Arg Asp Gly Arg Leu Asn Val 130 135 140 Asp Tyr Thr Gly Leu Asn Arg Ser Leu Tyr His Val His Met Gln Asn 145 150 155 160 Trp Leu Arg Phe Phe Pro Leu Arg His Ile His Ile Val Asp Gly Asp 165 170 175 Arg Leu Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe 180 185 190 Leu Lys Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys 195 200 205 Thr Lys Gly Phe Tyr Cys Leu Arg Asp Ser Gly Arg Asp Arg Cys Leu 210 215 220 His Glu Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu 225 230 235 240 Asn Lys Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Glu 245 250 255 Leu Val Gly Arg Thr Phe Asp Trp His 260 265 <210> 55 <211> 598 <212> PRT <213> Escherichia coli <220> <221> misc_feature <222> (172)..(172) <223> Xaa can be any naturally occurring amino acid <400> 55 Met Phe Asp Lys Tyr Arg Lys Thr Leu Val Ala Gly Thr Val Ala Ile 1 5 10 15 Thr Leu Gly Leu Ser Ala Ser Gly Val Met Ala Ala Gly Phe Lys Pro 20 25 30 Ala Pro Pro Ala Gly Gln Leu Gly Ala Val Ile Val Asp Pro Tyr Gly 35 40 45 Asn Ala Pro Leu Thr Ala Leu Val Asp Leu Asp Ser His Val Ile Ser 50 55 60 Asp Val Lys Val Thr Val His Gly Lys Gly Glu Lys Gly Val Glu Ile 65 70 75 80 Ser Tyr Pro Val Gly Gln Glu Ser Leu Lys Thr Tyr Asp Gly Val Pro 85 90 95 Ile Phe Gly Leu Tyr Gln Lys Phe Ala Asn Lys Val Thr Val Glu Trp 100 105 110 Lys Glu Asn Gly Lys Val Met Lys Asp Asp Tyr Val Val His Thr Ser 115 120 125 Ala Ile Val Asn Asn Tyr Met Asp Asn Arg Ser Ile Ser Asp Leu Gln 130 135 140 Gln Thr Lys Val Ile Lys Val Ala Pro Gly Phe Glu Asp Arg Leu Tyr 145 150 155 160 Leu Val Asn Thr His Thr Phe Thr Ala Gln Gly Xaa Asp Leu His Trp 165 170 175 His Gly Glu Lys Asp Lys Asn Ala Gly Ile Leu Asp Ala Gly Pro Ala 180 185 190 Thr Gly Ala Leu Pro Phe Asp Ile Ala Pro Phe Thr Phe Ile Val Asp 195 200 205 Thr Glu Gly Glu Tyr Arg Trp Trp Leu Asp Gln Asp Thr Phe Tyr Asp 210 215 220 Gly Arg Asp Arg Asp Ile Asn Lys Arg Gly Tyr Leu Met Gly Ile Arg 225 230 235 240 Glu Thr Pro Arg Gly Thr Phe Thr Ala Val Gln Gly Gln His Trp Tyr 245 250 255 Glu Phe Asp Met Met Gly Gln Val Leu Glu Asp His Lys Leu Pro Arg 260 265 270 Gly Phe Ala Asp Ala Thr His Glu Ser Ile Glu Thr Pro Asn Gly Thr 275 280 285 Val Leu Leu Arg Val Gly Lys Ser Asn Tyr Arg Arg Asp Asp Gly Val 290 295 300 His Val Thr Thr Ile Arg Asp His Ile Leu Glu Val Asp Lys Ser Gly 305 310 315 320 Arg Val Val Asp Val Trp Asp Leu Thr Lys Ile Leu Asp Pro Lys Arg 325 330 335 Asp Ala Leu Leu Gly Ala Leu Asp Ala Gly Ala Val Cys Val Asn Val 340 345 350 Asp Leu Ala His Ala Gly Gln Gln Ala Lys Leu Glu Pro Asp Thr Pro 355 360 365 Phe Gly Asp Ala Leu Gly Val Gly Pro Gly Arg Asn Trp Ala His Val 370 375 380 Asn Ser Ile Ala Tyr Asp Ala Lys Asp Asp Ser Ile Ile Leu Ser Ser 385 390 395 400 Arg His Gln Gly Val Val Lys Ile Gly Arg Asp Lys Gln Val Lys Trp 405 410 415 Ile Leu Ala Pro Ser Lys Gly Trp Glu Lys Pro Leu Ala Ser Lys Leu 420 425 430 Leu Lys Pro Val Asp Ala Asn Gly Lys Pro Ile Thr Cys Asn Glu Asn 435 440 445 Gly Leu Cys Glu Asn Ser Asp Phe Asp Phe Thr Tyr Thr Gln His Thr 450 455 460 Ala Trp Ile Ser Ser Lys Gly Thr Leu Thr Ile Phe Asp Asn Gly Asp 465 470 475 480 Gly Arg His Leu Glu Gln Pro Ala Leu Pro Thr Met Lys Tyr Ser Arg 485 490 495 Phe Val Glu Tyr Lys Ile Asp Glu Lys Lys Gly Thr Val Gln Gln Val 500 505 510 Trp Glu Tyr Gly Lys Glu Arg Gly Tyr Asp Phe Tyr Ser Pro Ile Thr 515 520 525 Ser Ile Ile Glu Tyr Gln Ala Asp Arg Asn Thr Met Phe Gly Phe Gly 530 535 540 Gly Ser Ile His Leu Phe Asp Val Gly Gln Pro Thr Val Gly Lys Leu 545 550 555 560 Asn Glu Ile Asp Tyr Lys Thr Lys Glu Val Lys Val Glu Ile Asp Val 565 570 575 Leu Ser Asp Lys Pro Asn Gln Thr His Tyr Arg Ala Leu Leu Val Arg 580 585 590 Pro Gln Gln Met Phe Lys 595 <210> 56 <211> 346 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 3-O-sulfotransferase variant 8 <400> 56 Met Leu Phe Lys Gln Gln Val Trp Leu Arg Gln Lys Leu Leu Val Leu 1 5 10 15 Gly Ser Leu Ala Val Gly Ser Leu Leu Tyr Leu Val Ala Arg Val Gly 20 25 30 Ser Leu Asp Arg Leu Gln Pro Ile Cys Pro Val Glu Ser Arg Phe Gly 35 40 45 Gly Ala His Asn Gln Ala Glu Leu Pro Leu Arg Ala Leu Gln Phe Lys 50 55 60 Arg Gly Leu Leu His Glu Phe Arg Lys Gly Asn Ser Ser Lys Glu Gln 65 70 75 80 Val His Leu His Asp Leu Val Gln Gln Leu Pro Lys Ala Ile Ile Ile 85 90 95 Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu Asn Leu 100 105 110 His Pro Ala Val Val Lys Ala Ser Gln Glu Ile His Phe Phe Asp Asn 115 120 125 Asp Glu Asn Tyr Ala Lys Gly Ile Glu Trp Tyr Arg Lys Lys Met Pro 130 135 140 Phe Ser Tyr Pro Gln Gln Ile Thr Ile Glu Lys Ser His Ser Tyr Phe 145 150 155 160 Ile Thr Glu Glu Val Pro Glu Arg Ile Tyr Lys Met Asn Ser Ser Ile 165 170 175 Lys Leu Leu Ile Ile Val Arg Glu Pro Thr Thr Arg Ala Ile Ser Ala 180 185 190 Tyr Thr His Met Leu Glu Gly Lys Glu Arg Lys Asn Lys Thr Tyr Tyr 195 200 205 Lys Phe Glu Lys Leu Ala Ile Asp Pro Asn Thr Cys Glu Val Asn Thr 210 215 220 Lys Tyr Val Gly Val Arg Thr Ser Ile Tyr Thr Lys His Leu Glu Arg 225 230 235 240 Trp Leu Lys Tyr Phe Pro Ile Glu Gln Phe His Ile Val Asp Gly Asp 245 250 255 Arg Leu Ile Thr Glu Pro Leu Pro Glu Leu Gln Leu Val Glu Lys Phe 260 265 270 Leu Asn Leu Pro Pro Arg Ile Ser Gln Tyr Asn Leu Tyr Phe Asn Ala 275 280 285 Thr Arg Gly Phe Tyr Cys Leu Arg Phe Asn Ile Ile Phe Asn Lys Cys 290 295 300 Leu Ala Gly Ser Lys Gly Arg Ile His Pro Glu Val Asp Pro Ser Val 305 310 315 320 Ile Thr Lys Leu Arg Lys Phe Phe His Pro Phe Asn Gln Lys Phe Tyr 325 330 335 Gln Ile Thr Gly Arg Thr Leu Asn Trp Pro 340 345 <210> 57 <211> 346 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 3-O-sulfotransferase variant 9 <400> 57 Met Leu Phe Lys Gln Gln Val Trp Leu Arg Gln Lys Leu Leu Val Leu 1 5 10 15 Gly Ser Leu Ala Val Gly Ser Leu Leu Tyr Leu Val Ala Arg Val Gly 20 25 30 Ser Leu Asp Arg Leu Gln Pro Ile Cys Pro Val Glu Ser Arg Phe Gly 35 40 45 Gly Ala His Asn Gln Ala Glu Leu Pro Leu Arg Ala Leu Gln Phe Lys 50 55 60 Arg Gly Leu Leu His Glu Phe Arg Lys Gly Asn Ser Ser Lys Glu Gln 65 70 75 80 Val His Leu His Asp Leu Val Gln Gln Leu Pro Lys Ala Ile Ile Ile 85 90 95 Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu Asn Leu 100 105 110 His Pro Ala Val Val Lys Ala Ser Gln Glu Ile His Phe Phe Asp Asn 115 120 125 Asp Glu Asn Tyr Ala Lys Gly Ile Glu Trp Tyr Arg Lys Lys Met Pro 130 135 140 Phe Ser Tyr Pro Gln Gln Ile Thr Ile Glu Lys Ser His Ser Tyr Phe 145 150 155 160 Ile Thr Glu Glu Val Pro Glu Arg Ile Tyr Lys Met Asn Ser Ser Ile 165 170 175 Lys Leu Leu Ile Ile Val Arg Glu Pro Thr Thr Arg Ala Ile Ser Ala 180 185 190 Tyr Thr His Met Leu Glu Gly Lys Glu Arg Lys Asn Lys Thr Tyr Tyr 195 200 205 Lys Phe Glu Lys Leu Ala Ile Asp Pro Asn Thr Cys Glu Val Asn Thr 210 215 220 Lys Tyr Thr Gly Val Arg Thr Ser Ile Tyr Thr Lys His Leu Glu Arg 225 230 235 240 Trp Leu Lys Tyr Phe Pro Ile Glu Gln Phe His Ile Val Asp Gly Asp 245 250 255 Arg Leu Ile Thr Glu Pro Leu Pro Glu Leu Gln Leu Val Glu Lys Phe 260 265 270 Leu Asn Leu Pro Pro Arg Ile Ser Gln Tyr Asn Leu Tyr Phe Asn Ala 275 280 285 Thr Arg Gly Phe Tyr Cys Leu Arg Phe Asn Ile Ile Phe Asn Lys Cys 290 295 300 Leu Ala Gly Ser Lys Gly Arg Ile His Pro Glu Val Asp Pro Ser Val 305 310 315 320 Ile Thr Lys Leu Arg Lys Phe Phe His Pro Phe Asn Gln Lys Phe Tyr 325 330 335 Gln Ile Thr Gly Arg Thr Leu Asn Trp Pro 340 345 <210> 58 <211> 346 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 3-O-sulfotransferase variant 10 <400> 58 Met Leu Phe Lys Gln Gln Val Trp Leu Arg Gln Lys Leu Leu Val Leu 1 5 10 15 Gly Ser Leu Ala Val Gly Ser Leu Leu Tyr Leu Val Ala Arg Val Gly 20 25 30 Ser Leu Asp Arg Leu Gln Pro Ile Cys Pro Val Glu Ser Arg Phe Gly 35 40 45 Gly Ala His Asn Gln Ala Glu Leu Pro Leu Arg Ala Leu Gln Phe Lys 50 55 60 Arg Gly Leu Leu His Glu Phe Arg Lys Gly Asn Ser Ser Lys Glu Gln 65 70 75 80 Val His Leu His Asp Leu Val Gln Gln Leu Pro Lys Ala Ile Ile Ile 85 90 95 Gly Val Gly His Gly Gly Thr Arg Ala Leu Leu Glu Met Leu Asn Leu 100 105 110 His Pro Ala Val Val Lys Ala Ser Gln Glu Ile His Phe Phe Asp Asn 115 120 125 Asp Glu Asn Tyr Ala Lys Gly Ile Glu Trp Tyr Arg Lys Lys Met Pro 130 135 140 Phe Ser Tyr Pro Gln Gln Ile Thr Ile Glu Lys Ser His Ser Tyr Phe 145 150 155 160 Ile Thr Glu Glu Val Pro Glu Arg Ile Tyr Lys Met Asn Ser Ser Ile 165 170 175 Lys Leu Leu Ile Ile Val Arg Glu Pro Thr Thr Arg Ala Ile Ser Leu 180 185 190 Gly Thr His Leu Leu Glu Val Lys Glu Arg Lys Asn Lys Thr Tyr Tyr 195 200 205 Lys Phe Glu Lys Leu Ala Ile Asp Pro Asn Thr Cys Glu Val Asn Thr 210 215 220 Lys Tyr Thr Gly Val Arg Thr Ser Ile Tyr Thr Lys His Leu Glu Arg 225 230 235 240 Trp Leu Lys Tyr Phe Pro Ile Glu Gln Phe His Ile Val Asp Gly Asp 245 250 255 Arg Leu Ile Thr Glu Pro Leu Pro Glu Leu Gln Leu Val Glu Lys Phe 260 265 270 Leu Asn Leu Pro Pro Arg Ile Ser Gln Tyr Asn Leu Tyr Phe Asn Ala 275 280 285 Thr Arg Gly Phe Tyr Cys Leu Arg Phe Asn Ile Ile Phe Asn Lys Cys 290 295 300 Leu Ala Gly Ser Lys Gly Arg Ile His Pro Glu Val Asp Pro Ser Val 305 310 315 320 Ile Thr Lys Leu Arg Lys Phe Phe His Pro Phe Asn Gln Lys Phe Tyr 325 330 335 Gln Ile Thr Gly Arg Thr Leu Asn Trp Pro 340 345 <210> 59 <211> 470 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 6-O-sulfotransferase variant 12 <400> 59 Met Asp Glu Arg Phe Asn Lys Trp Leu Leu Thr Pro Val Leu Thr Leu 1 5 10 15 Leu Phe Val Val Ile Met Tyr Gln Tyr Val Ser Pro Ser Cys Thr Ser 20 25 30 Ser Cys Thr Asn Phe Gly Glu Gln Leu Arg Ser Gly Glu Ala Arg Pro 35 40 45 Pro Ala Val Pro Ser Pro Ala Arg Arg Ala Gln Ala Pro Leu Asp Glu 50 55 60 Trp Glu Arg Arg Pro Gln Leu Pro Pro Pro Pro Arg Gly Pro Pro Glu 65 70 75 80 Gly Ser Arg Gly Val Ala Ala Pro Glu Asp Glu Asp Glu Asp Pro Gly 85 90 95 Asp Pro Glu Glu Glu Glu Glu Glu Glu Glu Glu Glu Pro Asp Pro Glu 100 105 110 Ala Pro Glu Asn Gly Ser Leu Pro Arg Phe Val Pro Arg Phe Asn Phe 115 120 125 Thr Leu Lys Asp Leu Thr Arg Phe Val Asp Phe Asn Ile Lys Gly Arg 130 135 140 Asp Val Ile Val Phe Leu His Ile Gly His Thr Gly Gly Thr Thr Phe 145 150 155 160 Gly Arg His Leu Val Lys Asn Ile Arg Leu Glu Gln Pro Cys Ser Cys 165 170 175 Lys Ala Gly Gln Lys Lys Cys Thr Cys His Arg Pro Gly Lys Lys Glu 180 185 190 Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp Ser Cys Gly Thr Asn 195 200 205 Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro Ala Ile Met Glu Lys 210 215 220 Lys Asp Cys Pro Arg Asn His Ser His Thr Arg Asn Phe Tyr Tyr Ile 225 230 235 240 Thr Met Leu Arg Asp Pro Val Ser Arg Tyr Leu Gly Gly Trp Lys His 245 250 255 His Gln Arg Gly Gly Thr Asn Lys Thr Ser Leu His Met Cys Asp Gly 260 265 270 Arg Ser Pro Thr Pro Asp Glu Leu Pro Thr Cys Tyr Pro Gly Asp Asp 275 280 285 Trp Ser Gly Val Ser Leu Arg Glu Phe Met Asp Cys Ser Tyr Asn Leu 290 295 300 Ala Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu Ser Leu Val Gly 305 310 315 320 Cys Tyr Asn Leu Thr Phe Met Asn Glu Ser Glu Arg Asn Thr Ile Leu 325 330 335 Leu Gln Ser Ala Lys Asn Asn Leu Lys Asn Met Ala Phe Phe Gly Leu 340 345 350 Thr Glu Phe Gln Arg Lys Thr Gln Phe Leu Phe Glu Arg Thr Phe Asn 355 360 365 Leu Lys Phe Ile Ser Pro Phe Thr Gln Val Asn Ile Thr Arg Ala Ser 370 375 380 Asn Val Asp Ile Asn Asp Gly Ala Arg Gln His Ile Glu Glu Leu Asn 385 390 395 400 Phe Leu Asp Met Gln Leu Tyr Glu Tyr Ala Lys Asp Leu Phe Gln Gln 405 410 415 Arg Tyr His His Thr Lys Gln Leu Glu His Gln Arg Asp Arg Gln Lys 420 425 430 Arg Arg Glu Glu Arg Arg Leu Gln Arg Glu His Arg Ala His Arg Trp 435 440 445 Pro Lys Glu Asp Arg Ala Met Glu Gly Thr Val Thr Glu Asp Tyr Asn 450 455 460 Ser Gln Val Val Arg Trp 465 470 <210> 60 <211> 470 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 6-O-sulfotransferase variant 13 <400> 60 Met Asp Glu Arg Phe Asn Lys Trp Leu Leu Thr Pro Val Leu Thr Leu 1 5 10 15 Leu Phe Val Val Ile Met Tyr Gln Tyr Val Ser Pro Ser Cys Thr Ser 20 25 30 Ser Cys Thr Asn Phe Gly Glu Gln Leu Arg Ser Gly Glu Ala Arg Pro 35 40 45 Pro Ala Val Pro Ser Pro Ala Arg Arg Ala Gln Ala Pro Leu Asp Glu 50 55 60 Trp Glu Arg Arg Pro Gln Leu Pro Pro Pro Pro Arg Gly Pro Pro Glu 65 70 75 80 Gly Ser Arg Gly Val Ala Ala Pro Glu Asp Glu Asp Glu Asp Pro Gly 85 90 95 Asp Pro Glu Glu Glu Glu Glu Glu Glu Glu Glu Glu Pro Asp Pro Glu 100 105 110 Ala Pro Glu Asn Gly Ser Leu Pro Arg Phe Val Pro Arg Phe Asn Phe 115 120 125 Thr Leu Lys Asp Leu Thr Arg Phe Val Asp Phe Asn Ile Lys Gly Arg 130 135 140 Asp Val Ile Val Phe Leu His Ile Gly His Thr Gly Gly Thr Thr Phe 145 150 155 160 Gly Arg His Leu Val Lys Asn Ile Arg Leu Glu Gln Pro Cys Ser Cys 165 170 175 Lys Ala Gly Gln Lys Lys Cys Thr Cys His Arg Pro Gly Lys Lys Glu 180 185 190 Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp Ser Cys Gly Thr Arg 195 200 205 Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro Ala Ile Met Glu Lys 210 215 220 Lys Asp Cys Pro Arg Asn His Ser His Thr Arg Asn Phe Tyr Tyr Ile 225 230 235 240 Thr Met Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser His Trp Lys His 245 250 255 Thr Gln Arg Gly Gly Ala Asn Lys Thr Gly Leu His Met Cys Asp Gly 260 265 270 Arg Ser Pro Thr Pro Asp Glu Leu Pro Thr Cys Tyr Pro Gly Asp Asp 275 280 285 Trp Ser Gly Val Ser Leu Arg Glu Phe Met Asp Cys Ser Tyr Asn Leu 290 295 300 Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu Ser Leu Val Gly 305 310 315 320 Cys Tyr Asn Leu Thr Phe Met Asn Glu Ser Glu Arg Asn Thr Ile Leu 325 330 335 Leu Gln Ser Ala Lys Asn Asn Leu Lys Asn Met Ala Phe Phe Gly Leu 340 345 350 Thr Glu Phe Gln Arg Lys Thr Gln Phe Leu Phe Glu Arg Thr Phe Asn 355 360 365 Leu Lys Phe Ile Ser Pro Phe Thr Gln Phe Asn Ile Thr Arg Ala Ser 370 375 380 Asn Val Asp Ile Asn Asp Gly Ala Arg Gln His Ile Glu Glu Leu Asn 385 390 395 400 Phe Leu Asp Met Gln Leu Tyr Glu Tyr Ala Lys Asp Leu Phe Gln Gln 405 410 415 Arg Tyr His His Thr Lys Gln Leu Glu His Gln Arg Asp Arg Gln Lys 420 425 430 Arg Arg Glu Glu Arg Arg Leu Gln Arg Glu His Arg Ala His Arg Trp 435 440 445 Pro Lys Glu Asp Arg Ala Met Glu Gly Thr Val Thr Glu Asp Tyr Asn 450 455 460 Ser Gln Val Val Arg Trp 465 470 <210> 61 <211> 470 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence encoding for engineered aryl sulfate-dependent 6-O-sulfotransferase variant 13 <400> 61 Met Asp Glu Arg Phe Asn Lys Trp Leu Leu Thr Pro Val Leu Thr Leu 1 5 10 15 Leu Phe Val Val Ile Met Tyr Gln Tyr Val Ser Pro Ser Cys Thr Ser 20 25 30 Ser Cys Thr Asn Phe Gly Glu Gln Leu Arg Ser Gly Glu Ala Arg Pro 35 40 45 Pro Ala Val Pro Ser Pro Ala Arg Arg Ala Gln Ala Pro Leu Asp Glu 50 55 60 Trp Glu Arg Arg Pro Gln Leu Pro Pro Pro Pro Arg Gly Pro Pro Glu 65 70 75 80 Gly Ser Arg Gly Val Ala Ala Pro Glu Asp Glu Asp Glu Asp Pro Gly 85 90 95 Asp Pro Glu Glu Glu Glu Glu Glu Glu Glu Glu Glu Pro Asp Pro Glu 100 105 110 Ala Pro Glu Asn Gly Ser Leu Pro Arg Phe Val Pro Arg Phe Asn Phe 115 120 125 Thr Leu Lys Asp Leu Thr Arg Phe Val Asp Phe Asn Ile Lys Gly Arg 130 135 140 Asp Val Ile Val Phe Leu His Ile Gly His Thr Gly Gly Thr Thr Phe 145 150 155 160 Gly Arg His Leu Val Lys Asn Ile Arg Leu Glu Gln Pro Cys Ser Cys 165 170 175 Lys Ala Gly Gln Lys Lys Cys Thr Cys His Arg Pro Gly Lys Lys Glu 180 185 190 Thr Trp Leu Phe Ser Arg Phe Ser Thr Gly Trp Ser Cys Gly Ser His 195 200 205 Ala Asp Trp Thr Glu Leu Thr Asn Cys Val Pro Ala Ile Met Glu Lys 210 215 220 Lys Asp Cys Pro Arg Asn His Ser His Thr Arg Asn Phe Tyr Tyr Ile 225 230 235 240 Thr Met Leu Arg Asp Pro Val Ser Arg Tyr Leu Ser Gly Trp Lys His 245 250 255 His Gln Arg Gly Gly Ala Asn Lys Thr Ser Leu His Met Cys Asp Gly 260 265 270 Arg Ser Pro Thr Pro Asp Glu Leu Pro Thr Cys Tyr Pro Gly Asp Asp 275 280 285 Trp Ser Gly Val Ser Leu Arg Glu Phe Met Asp Cys Ser Tyr Asn Leu 290 295 300 Gly Asn Asn Arg Gln Val Arg Met Leu Ala Asp Leu Ser Leu Val Gly 305 310 315 320 Cys Tyr Asn Leu Thr Phe Met Asn Glu Ser Glu Arg Asn Thr Ile Leu 325 330 335 Leu Gln Ser Ala Lys Asn Asn Leu Lys Asn Met Ala Phe Phe Gly Leu 340 345 350 Thr Glu Phe Gln Arg Lys Thr Gln Phe Leu Phe Glu Arg Thr Phe Asn 355 360 365 Leu Lys Phe Ile Ser Pro Phe Thr Gln Phe Asn Ile Thr Arg Ala Ser 370 375 380 Asn Val Asp Ile Asn Asp Gly Ala Arg Gln His Ile Glu Glu Leu Asn 385 390 395 400 Phe Leu Asp Met Gln Leu Tyr Glu Tyr Ala Lys Asp Leu Phe Gln Gln 405 410 415 Arg Tyr His His Thr Lys Gln Leu Glu His Gln Arg Asp Arg Gln Lys 420 425 430 Arg Arg Glu Glu Arg Arg Leu Gln Arg Glu His Arg Ala His Arg Trp 435 440 445 Pro Lys Glu Asp Arg Ala Met Glu Gly Thr Val Thr Glu Asp Tyr Asn 450 455 460 Ser Gln Val Val Arg Trp 465 470

Claims (40)

  1. 항응고제 N-, 2-O, 3-O, 6-O 설페이트화된 헤파란 설페이트(N,2,3,6-HS) 생성물을 효소적으로 합성하는 방법으로서, 이러한 방법이:
    (a) N-탈아세틸화 헤파로산을 포함하는 출발 다당류 반응 혼합물을 제공하는 단계;
    (b) 출발 다당류 반응 혼합물을 가공된 글루코사미닐 N-설포트랜스퍼라제 효소, 및 아릴 설페이트 화합물로 이루어진 설포 그룹 공여기를 포함하는 반응 혼합물과 조합하여, N-설페이트화된 헤파로산을 포함하는 제1의 생성물 혼합물을 형성시키는 단계;
    (c) 제1의 생성물 혼합물을 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소, 및 아릴 설페이트 화합물로 이루어진 설포 그룹 공여기를 포함하는 반응 혼합물과 조합하여, N-, 2-O 설페이트화된 헤파란 설페이트(N,2-HS) 생성물을 포함하는 제2의 생성물 혼합물을 형성시키는 단계;
    (d) 제2의 생성물 혼합물을 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소, 및 아릴 설페이트 화합물로 이루어진 설포 그룹 공여기를 포함하는 반응 혼합물과 조합하여, N-, 2-O, 6-O 설페이트화된 헤파란 설페이트(N,2,6-HS) 생성물을 포함하는 제3의 생성물 혼합물을 형성시키는 단계;
    (e) 제3의 생성물 혼합물을 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소, 및 아릴 설페이트 화합물로 이루어진 설포 그룹 공여기를 포함하는 반응 혼합물과 조합하여, N-, 2-O, 3-O, 6-O 설페이트화된 헤파란 설페이트 (N,2,3,6-HS) 생성물을 포함하는 제4의 생성물 혼합물을 형성시키는 단계를 포함하고;
    가공된 글루코사미닐 N-설포트랜스퍼라제, 헥수로닐 2-O 설포트랜스퍼라제, 글루코사미닐 6-O 설포트랜스퍼라제, 및 글루코사미닐 3-O 설포트랜스퍼라제 효소 각각의 생물학적 활성은 아릴 설페이트 화합물과 결합 및 반응시켜 설포 그룹을 헤파로산-계 다당류로 전달하는 것으로 이루어진, 방법.
  2. 항응고제 N-, 2-O, 3-O, 6-O 설페이트화된 헤파란 설페이트(N,2,3,6-HS) 생성물을 효소적으로 합성하는 방법으로서, 이러한 방법이:
    (a) N-설페이트화된 헤파로산을 포함하는 출발 다당류 반응 혼합물을 제공하는 단계;
    (b) 출발 다당류 반응 혼합물을 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소, 및 아릴 설페이트 화합물로 이루어진 설포 그룹 공여기를 포함하는 반응 혼합물과 조합하여 N,2-HS 생성물을 포함하는 제1의 생성물 혼합물을 형성시키는 단계;
    (c) 제1의 생성물 혼합물을 가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소, 및 아릴 설페이트 화합물로 이루어진 설포 그룹 공여기를 포함하는 반응 혼합물과 조합하여 N,2,6-HS 생성물을 포함하는 제2의 생성물 혼합물을 형성시키는 단계;
    (d) 제2의 생성물 혼합물을 가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소 및 아릴 설페이트 화합물로 이루어진 설포 그룹 공여기를 포함하는 반응 혼합물과 조합하여 N-, 2-O, 3-O, 6-O 설페이트화된 헤파란 설페이트 (N,2,3,6-HS) 생성물을 포함하는 제3의 생성물 혼합물을 형성시키는 단계을 포함하고;
    가공된 헥수로닐 2-O 설포트랜스퍼라제, 글루코사미닐 6-O 설포트랜스퍼라제, 및 글루코사미닐 3-O 설포트랜스퍼라제 효소 각각의 생물학적 활성이 아릴 설페이트 화합물과의 결합 및 반응으로 설포 그룹을 헤파로산-계 다당류로 전달하는 것으로 이루어진, 방법.
  3. 제2항에 있어서, N-설페이트화된 헤파로산을 포함하는 출발 다당류 반응 혼합물을 제공하는 단계가:
    (i) 헤파로산을 포함하는 전구체 다당류 조성물을 제공하는 단계;
    (ii) 전구체 다당류 조성물을, 염기, 바람직하게는 수산화리튬 또는 수산화나트륨을 포함하는 반응 혼합물과, 헤파로산 내 N-아세틸화 글루코사민 잔기 중 적어도 하나를 N-탈아세틸화시켜 N-탈아세틸화 헤파로산 조성물을 형성시키기에 충분한 시간, 바람직하게는 조성물 내 글루코사민 잔기의 적어도 5% 및 60% 이하, 보다 바람직하게는 적어도 12% 및 18% 이하, 및 심지어 보다 바람직하게는 15%가 N-아세틸화되어 남아있는 N-탈아세틸화 헤파로산 조성물을 형성시키기에 충분한 시간 동안 조합하는 단계; 및
    (iii) N-탈아세틸화 헤파로산 조성물을 N-설페이트화제를 포함하는, 바람직하게는 삼산화황-트리메틸아민 부가물을 포함하는 반응 혼합물과 조합함으로써, N-설페이트화된 헤파로산을 포함하는 출발 다당류 반응 혼합물을 형성시키는 단계를 추가로 포함하는, 방법.
  4. 제3항에 있어서, 헤파로산을 포함하는 전구체 다당류 조성물을 제공하는 단계가 세균 또는 진핵 세포 배양물, 바람직하게는 세균 세포 배양물, 및 보다 바람직하게는 에스케리키아 콜라이(Escherichia coli)의 K5 균주 및 에스케리키아 콜라이의 BL21 균주로 이루어진 그룹으로부터 선택된 세균을 포함하는 세균 세포 배양물로부터 헤파로산을 단리하는 소(sub)-단계를 추가로 포함하는, 방법.
  5. 제3항에 있어서, N-탈아세틸화 헤파로산 조성물 내 N-탈아세틸화 헤파로산의 중량-평균 분자량이 적어도 9,000 Da, 및 12,500 Da 이하인, 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    가공된 글루코사미닐 N-설포트랜스퍼라제 효소가 서열 번호: 2, 서열 번호: 4, 서열 번호: 6, 서열 번호: 8, 서열 번호: 10, 서열 번호: 12, 서열 번호: 33, 서열 번호: 34, 서열 번호: 35, 서열 번호: 36, 서열 번호: 37, 서열 번호: 38, 서열 번호: 39, 및 서열 번호: 40으로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하고;
    가공된 헥수로닐 2-O 설포트랜스퍼라제 효소가 서열 번호: 14, 서열 번호: 16, 서열 번호: 41, 및 서열 번호: 42로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하고;
    가공된 글루코사미닐 6-O 설포트랜스퍼라제 효소가 서열 번호: 18, 서열 번호: 20, 서열 번호: 22, 서열 번호: 43, 서열 번호: 44, 서열 번호: 45, 서열 번호: 46, 서열 번호: 47, 서열 번호: 48, 서열 번호: 49, 서열 번호: 50, 서열 번호: 59, 서열 번호: 60, 및 서열 번호: 61으로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하고;
    가공된 글루코사미닐 3-O 설포트랜스퍼라제 효소가 서열 번호: 24, 서열 번호: 26, 서열 번호: 28, 서열 번호: 51, 서열 번호: 52, 서열 번호: 53, 서열 번호: 54, 서열 번호: 56, 서열 번호: 57, 및 서열 번호: 58으로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는, 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 각각의 반응 혼합물 내 아릴 설페이트 화합물이 p-니트로페닐 설페이트 및 4-니트로카테콜 설페이트로 이루어진 그룹으로부터 선택되는, 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 가공된 헥수로닐 2-O 설포트랜스퍼라제 효소를 포함하는 반응 혼합물이 글루쿠로닐 C5-에피머라제 효소, 바람직하게는 서열 번호: 29의 아미노산 서열을 포함하는 글루쿠로닐 C5-에피머라제 효소, 및 보다 바람직하게는 서열 번호: 29의 34 내지 617번 잔기를 포함하는 에피머라제를 추가로 포함하는, 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, N,2,3,6-HS 생성물이 하기 화학식 I에 따른 구조를 포함하는, 방법:
    [화학식 I]
    Figure pct00125

    상기 화학식 I에서, X는 설푸릴 그룹 또는 아세테이트 그룹이고 Y는 설푸릴 그룹 또는 하이드록실 그룹이다.
  10. 제9항에 있어서, N,2,3,6-HS 생성물의 중량-평균 분자량이 적어도 2,000 Da 및 50,000 Da 이하인, 바람직하게는 2,000 Da 내지 24,000 Da인, 방법.
  11. 제9항 또는 제10항에 있어서, N,2,3,6-HS 생성물이 적어도 1 IU mg-1, 바람직하게는 적어도 180 IU mg-1, 및 500 IU mg-1 이하의 항-Xa 활성을 갖는, 방법.
  12. 제9항 내지 제11항 중 어느 한 항에 있어서, N,2,3,6-HS 생성물이 적어도 1 IU mg-1, 바람직하게는 적어도 180 IU mg-1, 및 500 IU mg-1 이하의 항-IIa 활성을 갖는, 방법.
  13. 제11항 또는 제12항에 있어서, N,2,3,6-HS 생성물의 항-Xa 활성 대 항-IIa 활성의 비가 적어도 0.5:1 및 100:1 이하이고, 바람직하게는 0.9:1 내지 1.1:1의 범위인, 방법.
  14. 제9항 내지 제13항 중 어느 한 항에 있어서, N,2,3,6-HS 생성물 내 글루코사민 잔기의 적어도 45% 및 90% 이하, 및 바람직하게는 적어도 65% 및 80% 이하가 N-설페이트화되고 6-O 설페이트화된 것이고, N,2,3,6-HS 생성물 내 글루코사민 잔기의 적어도 1% 및 8% 이하, 및 바람직하게는 적어도 4% 및 5% 이하가 N-설페이트화되고, 3-O 설페이트화되고, 및 6-O 설페이트화된, 방법.
  15. 제14항에 있어서, N,2,3,6-HS 생성물 내 이당류 단위의 적어도 1% 및 30% 이하, 바람직하게는 3%가 2-O 설페이트화된 이두론산 및 N-설페이트화된 글루코사민으로 이루어진, 방법.
  16. 제9항 내지 제15항 중 어느 한 항에 있어서, N,2,3,6-HS 생성물의 중량-평균 분자량이 적어도 15,000 Da, 및 19,000 Da 이하이고, N,2,3,6-HS 생성물 내 다당류 쇄의 20% 이하가 24,000 Da 보다 큰 분자량을 가지고, N,2,3,6-HS 생성물 내 분자량이 8,000 Da 내지 16,000 Da인 다당류 쇄의 수가 분자량이 16,000 Da 내지 24,000 Da인 다당류 쇄의 수보다 더 큰, 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 방법이 N,2,3,6-HS 생성물을 더마탄 설페이트 및 콘드로이틴 설페이트로 이루어진 그룹으로부터 선택된 적어도 하나의 GAG를 포함하는 글루코사미노글리칸(GAG) 조성물과 조합시켜, HS-GAG 혼합물을 형성시키는 단계를 추가로 포함하는, 방법.
  18. 제17항에 있어서,
    (a) 더마탄 설페이트가 HS-GAG 혼합물 내 다당류 쇄의 20%를 포함하고;
    (b) HS-GAG 혼합물 내 N,2,3,6-HS 생성물의 중량-평균 분자량이 적어도 7,000 Da 및 8,000 Da 이하이고;
    (c) N,2,3,6-HS 생성물이 적어도 2.0:1, 및 2.2:1 이하의 설페이트 대 카복실 그룹 비를 포함하는, 방법.
  19. 제17항에 있어서,
    (a) 더마탄 설페이트가 HS-GAG 혼합물 내 다당류 쇄의 적어도 10% 및 15% 이하, 및 바람직하게는 12%를 포함하고;
    (b) 콘드로이틴 설페이트가 HS-GAG 혼합물 내 다당류 쇄의 적어도 3% 및 5% 이하, 및 바람직하게는 4%를 포함하고;
    (c) HS-GAG 혼합물 내 모든 다당류의 중량-평균 분자량이 적어도 4,000 Da, 및 7,000 Da 이하의 범위이고, 바람직하게는 적어도 5,000 Da 및 6,000 Da 이하의 범위이고;
    (d) N,2,3,6-HS 생성물이 적어도 2.0:1, 및 2.2:1 이하의 설페이트 대 카복실 그룹 비를 포함하는, 방법.
  20. 분획화되지 않은 N,2,3,6-HS 생성물로부터 항응고제, 저 분자량 헤파란 설페이트(LMW-HS) 생성물을 합성하는 방법으로서, 이러한 방법이:
    (a) 제1항 내지 제16항 중 어느 하나의 방법, 바람직하게는 제16항의 방법에 따라 분획화되지 않은 N,2,3,6-HS 생성물을 합성하는 단계;
    (b) 하나 이상의 해중합제(depolymerization agent)를 제공하는 단계; 및
    (c) N,2,3,6-HS 생성물을 하나 이상의 해중합제와 N,2,3,6-HS 생성물 내에서 다당류의 적어도 일부를 해중합시키기에 충분한 시간 동안 처리함으로써, LMW-HS 생성물을 형성시키는 단계를 포함하는, 방법.
  21. 제20항에 있어서, LMW-HS 생성물의 중량-평균 분자량이 적어도 2,000 Da 및 12,000 Da 이하의 범위이고, 바람직하게는 적어도 3,000 Da 및 8,000 Da 이하의 범위인, 방법.
  22. 제20항 또는 제21항에 있어서, 해중합제가 적어도 하나의 탄소-산소 리아제 효소, 바람직하게는 서열 번호: 30, 서열 번호: 31, 및 서열 번호: 32로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는 적어도 하나의 탄소-산소 리아제 효소를 포함하는 탄소-산소 리아제 반응 혼합물을 포함하고, 분획화되지 않은 N,2,3,6-HS 생성물을 탄소-산소 리아제 반응 혼합물로 분획화되지 않은 N,2,3,6-HS 생성물의 β-제거 분해를 촉매하기에 충분한 시간 동안 처리함으로써, 효소적으로-해중합된 LMW-HS 생성물, 바람직하게는 비-환원 말단에서 4,5-불포화된 우론산 잔기를 갖는 다당류 쇄를 포함하는 효소적으로-해중합된 LMW-HS 생성물을 형성시키는, 방법.
  23. 제22항에 있어서,
    (A) 효소적으로-해중합된, LMW-HS 생성물의 중량-평균 분자량이 적어도 5,500 Da 및 7,500 Da 이하의 범위, 바람직하게는 6,500 Da이고;
    (B) 효소적으로-해중합된 LMW-HS 생성물이 적어도 70 IU mg-1, 및 120 IU mg-1 이하의 범위의 항-Xa 활성을 가지고 항-Xa 활성 대 항-IIa 활성의 비가 적어도 1.5:1 및 2.5:1 이하의 범위, 바람직하게는 1.6:1인, 방법.
  24. 제20항 또는 제21항에 있어서, 해중합제가 염기, 바람직하게는 수산화나트륨, 4급 수산화암모늄, 및 포스파젠 화합물로 이루어진 그룹으로부터 선택된 염기이고, 분획화되지 않은 N,2,3,6-HS 생성물을 염기로 분획화되지 않은 N,2,3,6-HS 생성물의 β-제거 분해를 유발하기에 충분한 시간 동안 처리함으로써, 화학적으로 β-제거성의, LMW-HS 생성물, 바람직하게는 비-환원 말단에 4,5-불포화된 우론산 잔기를 갖는 다당류 쇄를 포함하는 화학적으로 β-제거성의, LMW-HS 생성물을 형성시키는, 방법.
  25. 제24항에 있어서, 염기가 4급 수산화암모늄, 바람직하게는 벤질 트리메틸수산화암모늄이고, 분획화되지 않은 N,2,3,6-HS 생성물을 해중합제로 처리하는 단계가:
    (i) 분획화되지 않은 N,2,3,6-HS 생성물을 벤제토늄 염, 바람직하게는 벤제토늄 클로라이드와 반응시켜, 벤제토늄 HS 염을 형성시키는 소-단계; 및
    (ii) 벤제토늄 HS 염을 4급 수산화암모늄 및 메탄올을 포함하는 반응 혼합물과 조합하여 화학적으로 β-제거성의, LMW-HS 생성물을 형성시키는 소-단계,를 추가로 포함하는, 방법.
  26. 제25항에 있어서,
    (A) 화학적으로 β-제거성의, LMW-HS 생성물의 중량-평균 분자량이 적어도 3,000 Da 및 4,200 Da 이하의 범위, 바람직하게는 3,600 Da이고;
    (B) 화학적으로 β-제거성의, LMW-HS 생성물이 적어도 80 IU mg-1 및 120 IU mg-1 이하의 범위의 항-Xa 활성, 적어도 5 IU mg-1 및 20 IU mg-1 이하의 범위의 항-IIa 활성, 및 적어도 8.0:1 및 10.0:1 이하의 범위의 항-Xa 활성 대 항-IIa 활성의 비를 갖는, 방법.
  27. 제24항에 있어서, 염기가 포스파잔 염기, 바람직하게는 2-3급-부틸이미노-2-디에틸아미노-1,3-디메틸퍼하이드로-1,2,3-디아자-포스포린이고, 분획화되지 않은 N,2,3,6-HS 생성물을 해중합제로 처리하는 단계가 다음의 소-단계를 추가로 포함하는, 방법:
    (i) 분획화되지 않은 N,2,3,6-HS 생성물을 벤제토늄 염, 바람직하게는 벤제토늄 클로라이드와 반응시켜 벤제토늄 HS 염을 형성시키는 단계;
    (ii) 벤제토늄 HS 염을 벤질 할라이드, 바람직하게는 벤질 클로라이드와 조합하여 벤질 에스테르 HS를 형성시키는 단계;
    (iii) 벤질 에스테르 HS를 벤제토늄 염, 바람직하게는 벤제토늄 클로라이드와 반응시킴으로써 벤질 에스테르 HS의 트랜스염화(transalification)를 개시하여 벤제토늄 벤질 에스테르 HS를 형성시키는 단계;
    (iv) 벤제토늄 벤질 에스테르 HS를 포스파젠 염기를 사용하여 해중합시켜 벤질 에스테르 화학적으로 β-제거성의 LMW-HS 생성물을 형성시키는 단계; 및
    (v) 벤질 에스테르 화학적으로 β-제거성의 LMW-HS 생성물을 비누화하여, 화학적으로 β-제거성의 LMW-HS 생성물을 형성시키는 단계.
  28. 제27항에 있어서,
    (A) 화학적으로 β-제거성의, LMW-HS 생성물의 중량-평균 분자량이 적어도 2,000 Da 및 3,000 Da 이하의 범위, 바람직하게는 2,400 Da이고;
    (B) 화학적으로 β-제거성의, LMW-HS 생성물이 160 IU mg-1의 항-Xa 활성, 2 IU mg-1의 항-IIa 활성, 및 80:1의 화학적으로 β-제거성의, LMW-HS 생성물의 항-Xa 활성 대 항-IIa 활성의 비를 갖는, 방법.
  29. 제24항에 있어서, 염기가 수산화나트륨이고, 분획화되지 않은 N,2,3,6-HS 생성물을 해중합제로 처리하는 단계가 다음의 소-단계를 추가로 포함하는, 방법:
    (i) 분획화되지 않은 N,2,3,6-HS 생성물을 벤제토늄 염, 바람직하게는 벤제토늄 클로라이드와 반응시켜, 벤제토늄 HS 염을 형성시키는 단계;
    (ii) 벤제토늄 HS 염을 벤질 할라이드, 바람직하게는 벤질 클로라이드와 조합하여, 벤질 에스테르 HS를 형성시키는 단계; 및
    (iii) 벤질 에스테르 HS를 수산화나트륨을 포함하는 반응 혼합물과 조합하여, 화학적으로 β-제거성의, LMW-HS 생성물을, 바람직하게는 환원 말단에서 1,6-안하이드로만노스 잔기 또는 1,6-안하이드로글루코사민 잔기를 갖는 다당류 쇄를 포함하는 화학적으로 β-제거성의, LMW-HS 생성물을 형성시키는 단계.
  30. 제29항에 있어서,
    (A) 화학적으로 β-제거성의, LMW-HS 생성물의 중량-평균 분자량이 적어도 3,800 Da 및 5,000 Da 이하의 범위, 바람직하게는 4,500 Da이고;
    (B) 화학적으로 β-제거성의, LMW-HS 생성물이 적어도 90 IU mg-1 및 125 IU mg-1 이하의 범위의 항-Xa 활성, 적어도 20 IU mg-1 및 35 IU mg-1 이하 범위의 항-IIa 활성 및 적어도 3.3:1 및 5.3:1 이하의 범위, 및 바람직하게는 적어도 3.7:1 및 4.0:1 이하의 범위의 항-Xa 활성 대 항-IIa 활성의 비를 갖는, 방법.
  31. 제20항 또는 제21항에 있어서, 해중합제가 탈아민화제, 바람직하게는 이소아밀 니트레이트 및 아질산으로 이루어진 그룹으로부터 선택된 탈아민화제를 포함하는 탈아민화 반응 혼합물을 포함하고, 분획화되지 않은 N,2,3,6-HS 생성물을 탈아민화 반응 혼합물로 분획화되지 않은 N,2,3,6-HS 생성물의 탈아민화성 절단을 유발하기에 충분한 시간 동안 처리함으로써, 탈아민화된 LMW-HS 생성물, 바람직하게는 환원 말단에 2,5-안하이드로-D-만노스 잔기를 갖는 다당류 쇄를 포함하는 탈아민화된 LMW-HS 생성물을 형성시키는, 방법.
  32. 제31항에 있어서,
    (i) 탈아민화제가 아질산(nitrous acid)이고;
    (ii) 탈아민화 반응 혼합물이 산, 바람직하게는 아세트산 또는 염산, 및 알칼리 또는 알칼린 토금속 니트라이트(nitrite) 염, 바람직하게는 아질산나트륨(sodium nitrite)의 화학량론적 양을 추가로 포함하고;
    (iii) 아질산이 산을 알칼리 또는 알칼린 토금속 니트레이트(nitrate) 염과 반응시킴에 의해 반응 혼합물 내에서 반응계 내(in situ) 생산되는, 방법.
  33. 제31항 또는 제32항에 있어서, 탈아민화된 LMW-HS 생성물이:
    (A) 적어도 5,600 Da 및 6,400 Da 이하의 범위, 및 바람직하게는 6,000 Da인 중량-평균 분자량; 및
    (B) 적어도 110 IU mg-1 및 210 IU mg-1 이하의 항-Xa 활성; 적어도 35 IU mg-1 및 100 IU mg-1 이하의 범위의 항-IIa 활성, 및 적어도 1.9:1 및 3.2:1 이하의 범위의 항-Xa 활성 대 항-IIa 활성의 비를 포함하는, 방법.
  34. 제31항 또는 제32항에 있어서, 탈아민화된 LMW-HS 생성물이:
    (A) 적어도 3,600 Da 및 5,000 Da 이하의 범위, 및 바람직하게는 4,300 Da인 중량-평균 분자량; 및
    (B) 95 IU mg-1 이상 및 130 IU mg-1 이하의 범위의 항-Xa 활성 및 적어도 2.5:1 및 4.0:1 이하의 범위의 항-Xa 활성 대 항-IIa 활성의 비를 포함하는, 방법.
  35. 제31항 또는 제32항에 있어서, 탈아민화된 LMW-HS 생성물이:
    (A) 적어도 4,200 Da 및 4,600 Da 이하의 범위, 바람직하게는 4,400 Da의 중량-평균 분자량; 및
    (B) 98 IU mg-1 이상 및 155 IU mg-1 이하의 범위의 항-Xa 활성 및 적어도 4.0:1 및 4.5:1 이하의 항-Xa 활성 대 항-IIa 활성의 비를 포함하는, 방법.
  36. 제31항 또는 제32항에 있어서, 탈아민화된 LMW-HS 생성물이:
    (A) 적어도 5,000 Da 및 5,600 Da 이하의 범위, 및 바람직하게는 5,400 Da인 중량-평균 분자량; 및
    (B) 80 IU mg-1 이상 및 120 IU mg-1 이하의 범위의 항-Xa 활성 및 적어도 2.0:1 및 2.5:1 이하의 범위의 항-Xa 활성 대 항-IIa 활성의 비를 포함하는, 방법.
  37. 제20항 또는 제21항에 있어서, 해중합제가 산화제, 바람직하게는 과산화물 화합물, 보다 바람직하게는 과산화수소를 포함하는 산화 반응 혼합물을 포함하고, 분획화되지 않은 N,2,3,6-HS 생성물을 산화 반응 혼합물로 분획화되지 않은 N,2,3,6-HS 생성물의 산화성 분해를 유발시키기에 충분한 시간 동안 처리함으로써, 산화된 LMW-HS 생성물을 형성시킴을 포함하는, 방법.
  38. 제37항에 있어서, 분획화되지 않은 N,2,3,6-HS 생성물을 산화제로 처리하는 단계가 다음의 소-단계를 포함하는, 방법:
    (i) 분획화되지 않은 N,2,3,6-HS 생성물을, 바람직하게는 산, 보다 바람직하게는 아스코르브산의 첨가 상에서, 산성화시켜 산성화된 분획화되지 않은 N,2,3,6-HS 생성물을 형성시키는 단계;
    (ii) 산성화된 분획화되지 않은 N,2,3,6-HS 생성물을 산화 반응 혼합물과 조합하는 단계; 및
    (iii) 산성화된 분획화되지 않은 N,2,3,6-HS 생성물을 산화 반응 혼합물 내에서 적어도 50℃의 온도에서 산화된 LMW-HS 생성물을 형성하기에 충분한 시간 동안 항온처리하는 단계.
  39. 제37항 또는 제38항에 있어서, 산화된 LMW-HS 생성물이:
    (A) 적어도 4,000 Da 및 6,000 Da 이하의 범위, 및 바람직하게는 5,000 Da의 중량-평균 분자량;
    (B) 적어도 95 IU mg-1 및 110 IU mg-1 이하의 범위의 항-Xa 활성 및 적어도 1.5:1 및 3.0:1 이하의 항-Xa 활성 대 항-IIa 활성의 비를 포함하는, 방법.
  40. 제37항 또는 제38항에 있어서, 산화된 LMW-HS 생성물이:
    (A) 적어도 5,500 Da 및 6,500 Da 이하의 범위, 및 바람직하게는 6,000 Da의 의 중량-평균 분자량; 및
    (B) 120 +/- 25 IU mg-1의 항-Xa 활성 및 적어도 2.0:1 및 2.5:1 이하의 항-Xa 활성 대 항-IIa 활성의 비를 포함하는, 방법.
KR1020227004294A 2019-07-09 2020-07-09 항응고제 다당류의 합성 방법 KR20220032086A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962871980P 2019-07-09 2019-07-09
US62/871,980 2019-07-09
US202062033687P 2020-06-02 2020-06-02
US62/033,687 2020-06-02
PCT/US2020/041404 WO2021007429A1 (en) 2019-07-09 2020-07-09 Methods for synthesizing anticoagulant polysaccharides

Publications (1)

Publication Number Publication Date
KR20220032086A true KR20220032086A (ko) 2022-03-15

Family

ID=80817293

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227004294A KR20220032086A (ko) 2019-07-09 2020-07-09 항응고제 다당류의 합성 방법

Country Status (1)

Country Link
KR (1) KR20220032086A (ko)

Similar Documents

Publication Publication Date Title
JP6670235B2 (ja) 可逆的ヘパリン分子、その製法及びその使用方法
US11629364B2 (en) Methods for synthesizing anticoagulant polysaccharides
KR20210126019A (ko) 엔지니어링된 아릴 설페이트-의존 효소
US10889656B2 (en) Heparan sulfate having high 3-O-sulfation rate in glucosamine residues
KR20220032086A (ko) 항응고제 다당류의 합성 방법
US20230151339A1 (en) Engineered aryl sulfate-dependent enzymes
WO2022015794A1 (en) Methods for synthesizing non-anticoagulant heparan sulfate
US11708593B2 (en) Engineered aryl sulfate-dependent enzymes
US20240076634A1 (en) Engineered aryl sulfate-dependent enzymes