KR20240007135A - 콘드로이틴-생산 재조합 세포 - Google Patents

콘드로이틴-생산 재조합 세포 Download PDF

Info

Publication number
KR20240007135A
KR20240007135A KR1020237037339A KR20237037339A KR20240007135A KR 20240007135 A KR20240007135 A KR 20240007135A KR 1020237037339 A KR1020237037339 A KR 1020237037339A KR 20237037339 A KR20237037339 A KR 20237037339A KR 20240007135 A KR20240007135 A KR 20240007135A
Authority
KR
South Korea
Prior art keywords
recombinant
polypeptide
activity
nucleic acid
chondroitin
Prior art date
Application number
KR1020237037339A
Other languages
English (en)
Inventor
도미니끄 루이
까린 제야르동
뮈리엘 메르깜
도미니끄 또마
Original Assignee
지보당 에스아
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 지보당 에스아 filed Critical 지보당 에스아
Publication of KR20240007135A publication Critical patent/KR20240007135A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/001Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Cosmetics (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

본 발명은 콘드로이틴의 생물생산 (bio-production) 분야에 관한 것이다. 당업계에서는 콘드로이틴의 매우 효율적인 합성 및 분비를 가능하게 하는 콘드로이틴 생산 방법에 대한 필요성이 존재한다. 본 발명에서 제안된 용액은 본 명세서에 기재된 바와 같은 많은 변형을 포함하는 재조합 세포, 특히 재조합 효모의 용도이다. 또한, 본 발명은 재조합 세포, 특히 본 발명의 재조합 효모를 이용하여 콘드로이틴을 생물생산하는 방법을 제안한다.

Description

콘드로이틴-생산 재조합 세포
본 발명은 콘드로이틴의 생물생산 (bio-production) 분야에 관한 것이다.
콘드로이틴은 사람과 동물의 결합 조직에서 자연적으로 발생하는 고분자량 다당류이다. 콘드로이틴은 글리코사미노글리칸이라 불리는 헤테로다당류 계통에 속한다.
글리코사미노글리칸 (GAGs) 또는 뮤코다당류는 산성 당 및 아미노 당 (N-아세틸글루코사민 또는 N-아세틸갈락토사민) 을 포함하는 반복 이당류 단위로 구성된 비분지형의, 음전하 다당류 사슬이다. 유연하지 않은 성질과 높은 음전하 때문에, GAG 는 신체에서 윤활제 또는 충격 흡수제로서 사용된다. 예를 들어 GAG 가 풍부한 무릎 관절을 감싸는 연골 매트릭스는 이러한 기작에 의해 수백 기압의 압력을 지탱할 수 있다.
D-글루쿠론산 및 N-아세틸-D-갈락토사민으로 형성된 콘드로이틴은 황산화될 수 있다. 콘드로이틴 설페이트는 연골 강도와 탄력 유지에 중요하며 관절 통증을 감소시키고 건강한 연골과 관절 기능을 촉진하는 영양 보충제로 시판되고 있다. 임상 연구는 골관절염의 치료를 위한 콘드로이틴 및 콘드로이틴 설페이트의 사용을 지지한다.
콘드로이틴 설페이트 또는 콘드로이틴은 피부의 관절 조직의 세포외 매트릭스에 자연적으로 존재하므로, 화장품 적용, 특히 피부 보습, 개선 및 진정, 또는 모발 컨디셔너의 성분으로도 사용된다.
현재, 콘드로이틴은 주로 동물의 연골에서 화학적 및 효소적 처리를 이용하여 추출에 의해 생성되어, 단백질로부터 다당류를 해리시키고 다양한 품질의 다당류 산물을 생성한다. 그러나, 이들 방법은 수고롭고 고가일 수 있다.
이와 같이, 콘드로이틴의 미생물 생산이 제안되었다. 실제로, 특정 박테리아는 그들의 캡슐의 성분으로서 콘드로이틴 및 콘드로이틴-유사 다당류 중합체를 생성한다. 그러나, 이러한 공지된 박테리아, 예를 들어 파스튜렐라 물토시다 (Pasteurella multocida) 또는 에스케리키아 콜라이 (Escherichia coli) 는 많은 포유동물에게 병원균이며, 적은 양의 다당류를 생성한다.
그 결과, 콘드로이틴의 생산을 위한 재조합 미생물, 특히 재조합 박테리아에 대한 연구가 이루어지고 있다. 예를 들어, WO2011109438, EP2142643, 또는 US20090263867 이 언급될 수 있다.
생물학적 분자의 생산에 흔히 사용되는 다른 미생물과는 달리, 효모는 일반적으로 안전한 것으로 인식된다. 이들은 박테리아와 비교하여 빠르게 성장하고 더 높은 밀도에서 재배될 수 있으며, 무균 환경을 요구하지 않는다. 또한 효모 세포는 박테리아보다 배양 배지로부터 쉽게 분리될 수 있어, 생성물 추출 및 정제 과정을 크게 단순화시킬 수 있다. 마지막으로, 효모는 배양 배지의 pH 변화에 대해 더 저항성인 이점을 제시하며, 이와 같이 더 강한 발효 시스템을 나타낸다.
그러나, 효모 중에서, 종들 사이에서 특성을 구별하는 것은 또한 특정 과제를 제시할 수 있다. 이는 주로 종들 사이의 신진대사 및 이들의 배양 조건의 차이로 인한 것이다.
그러나, 본 발명자는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 는 인간에 의해 사용되는 경우 (예컨대 와인, 맥주 또는 빵에서) 긴 안전한 역사를 갖고 있고, 따라서 당업계에 잘 알려진 유전 정보를 갖는 잘 확립된 모델이기 때문에, 관심 분자의 생산을 위한 도구로서 특히 유용하다는 것을 밝혀냈다. S. 세레비지에 (S. cerevisiae) 는 일반적으로 인간과 동물에게 안전하다고 인식되는 장점을 더 제시한다. 게다가, 이러한 효모를 배양할 때 발생하는 배지의 산성화는 생물 발효기의 오염 가능성을 감소시키며, 따라서 배지에 항생제를 첨가할 필요응 감소시킨다. 마지막으로, 그의 게놈의 안정한 변형 (염색체 내 통합) 을 가능하게 하는 많은 유전적 도구가 개발되었다.
따라서, 당업계에서는 콘드로이틴의 매우 효율적인 합성 및 분비를 가능하게 하는 추가의 콘드로이틴 생산 방법에 대한 필요성이 여전히 존재한다. 특히, 비용 효율적이고 인간 적용에 안전한 콘드로이틴을 공급하는 생산 방법을 제공할 필요성이 여전히 존재한다.
특별한 경우, 당업계에서는 특정하고 제어된 크기의 콘드로이틴을 대량으로 수득할 수 있게 하는 콘드로이틴 생산 방법에 대한 필요성이 여전히 존재한다.
따라서 본 발명은 하기 항목에 관한 것이다.
항목 1: 콘드로이틴을 생산하는 재조합 효모 세포로서,
(a) 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산; 및
(b) UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산; 및
(c) UDP-글루코오스-4-에피머라아제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함하는 재조합 효모 세포.
실시예에 예시된 바와 같이, 본 발명의 재조합 효모는 자연적으로 이 글리코사미노글리칸틴을 생산할 수 없는 효모 세포에서 콘드로이틴의 생산을 가능하게 한다. 재조합 효모에 의해 생산되는 콘드로이틴의 크기를 조절할 수 있음을 실시예에서 추가로 입증하였다.
상기 유리한 특성은 효모를 이하 기재된 추가적인 변형과 재조합하여 추가로 증가될 수 있다.
항목 2: 항목 1 에 있어서, 재조합 세포가 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함하고, 콘드로이티나아제 활성을 갖는 폴리펩티드가 분비 신호, 및 임의로는 고정 신호를 포함하는 것인 재조합 세포.
항목 3: 콘드로이틴을 생산하는 재조합 숙주 세포로서,
(a) 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산; 및
(b) UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산;
(c) UDP-글루코오스-4-에피머라아제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산; 및
(d) 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산으로서, 콘드로이티나아제 활성을 갖는 폴리펩티드는 분비 신호를 포함하거나 분비 신호, 및 임의로는 고정 신호를 포함하여, 콘드로이틴, 특히 원하는 분자량의 콘드로이틴이 숙주 세포에 의해 생산되는 하나 이상의 재조합 핵산을 포함하는 재조합 숙주 세포.
항목 4: 항목 2 또는 3 에 있어서, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산이 큐피엔니우스 살레이 (Cupiennius salei), 티티우스 세르룰라투스 (Tityus serrulatus), 보스 타우루스 (Bos taurus), 베스파 마그니피카 (Vespa magnifica), 마카카 물라타 (Macaca mulata) 또는 아피스 멜리페라 (Apis mellifera) 중 적어도 하나로부터, 바람직하게는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 수득되는 또는 유래되는 재조합 숙주 세포.
항목 5: 항목 2 내지 4 중 어느 하나에 있어서, 콘드로이틴의 분자량이 50kDa 미만의 범위, 바람직하게는 약 20kDa 내지 약 50kDa 범위인 재조합 세포.
항목 6: 항목 1 내지 4 중 어느 하나에 있어서, 콘드로이틴의 분자량이 50kDa 초과의 범위, 바람직하게는 약 50kDa 내지 약 250kDa 범위인 재조합 세포.
항목 7: 항목 1 내지 4 중 어느 하나에 있어서, 콘드로이틴의 분자량이 100kDa 초과의 범위, 바람직하게는 약 100kDa 내지 약 1500kDa 범위인 재조합 세포.
항목 8: 항목 1 내지 7 중 어느 하나에 있어서, UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 핵산이 아라비돕시스 탈리아나 (Arabidopsis thaliana), 클로렐라 바이러스 PBCV1 또는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 중 적어도 하나로부터, 특히 아라비돕시스 탈리아나 (Arabidopsis thaliana) 또는 클로렐라 바이러스 PBCV1 중 적어도 하나로부터 수득되는 또는 유래하는 재조합 세포.
항목 9: 항목 1 내지 8 중 어느 하나에 있어서, 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 핵산이 하기와 같은 재조합 세포:
(i) 콘드로이틴 신타아제를 코딩하는 핵산; 또는
(ii) 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드를 코딩하는 핵산.
항목 10: 항목 9 에 있어서, 핵산이 파스튜렐라 물토시다 (Pasteurella multocida), 클로렐라 바이러스 (Chlorella virus) PBCV1, 마이코박테리움 튜베르쿨로시스 (Mycobacterium tuberculosis), 호모 사피엔스 (Homo sapiens), 에스케리키아 콜라이 (Escherichia coli), 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 또는 페니실룸 옥살리쿰 (Penicillium oxalicum) 중 적어도 하나로부터 수득되는 또는 유래되는 재조합 세포.
항목 11: 항목 1 내지 10 중 어느 하나에 있어서, UDP-글루코오스-4-에피머라제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 핵산이 박테리아로부터, 특히 슈도모나스 아에루기노사 (Pseudomonas aeruginosa), 파스튜렐라 물토시다 (Pasteurella multocida), 및 에스케리키아 콜라이 (Escherichia coli) 로 이루어진 군으로부터 선택되는 박테리아로부터 수득되는 또는 유래되는 재조합 세포.
항목 12: 항목 1 내지 항목 11 중 어느 하나에 있어서,
(i) 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 활성을 갖는 폴리펩티드; 및/또는
(ii) UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 활성을 갖는 폴리펩티드
중 하나 이상을 코딩하는 적어도 하나의 재조합 핵산을 추가로 포함하는 재조합 세포.
항목 13: 항목 1 내지 항목 12 중 어느 하나에 있어서,
(i) 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드; 및/또는
(ii) UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 활성을 갖는 폴리펩티드; 및/또는
(iii) 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드; 및/또는
(iv) 포스포아세틸글루코사민 뮤타아제 (PCM1) 활성을 갖는 폴리펩티드
중 하나 이상을 코딩하는 적어도 하나의 재조합 핵산을 추가로 포함하는 재조합 세포.
항목 14: 항목 12 또는 13 에 있어서,
- 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드를 코딩하는 핵산; 및/또는
- 포스포아세틸글루코사민 뮤타아제 (PCM1) 를 갖는 폴리펩티드를 코딩하는 핵산
이 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되는 또는 유래하는 재조합 세포.
항목 15: 항목 3 내지 14 중 어느 하나에 있어서, 재조합 숙주 세포가 효모인 재조합 숙주 세포.
항목 16: 항목 1 내지 15 중 어느 하나에 있어서, 재조합 세포가 사카로마이세스 (Saccharomyces) 속, 또는 칸디다 (Candida) 속, 또는 클루이베로마이세스 (Kluyveromyces) 속, 또는 오가타에아 (Ogataea) 속, 또는 야로위아 (Yarrowia) 속, 또는 데바리오마이세스 (Debaryomyces) 속, 또는 아쉬비아 (Ashbya) 속에 속하고, 특히 사카로마이세스 속에 속하는 재조합 세포.
항목 17: 항목 16 에 있어서, 재조합 세포가 사카로마이세스 세레비지에 (Saccharomyces cerevisiae), 사카로마이세스 보울라르디이 (Saccharomyces boulardii), 사카로마이세스 바야누스 (Saccharomyces bayanus), 사카로마이세스 파라독수스 (Saccharomyces paradoxus), 사카로마이세스 미카타에 (Saccharomyces mikatae), 사카로마이세스 카스텔리 (Saccharomyces castelli), 칸디다 알비칸스 (Candida albicans), 칸디다 글라브라타 (Candida glabrata), 칸디다 트로피칼리스 (Candida tropicalis), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 클루이베로마이세스 폴리스포루스 (Kluyveromyces polysporus), 클루이베로마이세스 테르모톨레렌스 (Kluyveromyces thermotolerens), 오가타에아 폴리모르파 (Ogataea polymorpha), 야로위아 리폴리티카 (Yarrowia lypolytica), 데바리오마이세스 한세니이 (Debaryomyces hansenii) 및 아쉬비아 고시피이 (Ashbya gossypii) 로 이루어지는 군에서 선택되고, 바람직하게는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 인 재조합 세포.
항목 18: 하기를 포함하는, 원하는 분자량의 콘드로이틴의 생산 방법:
(a) 항목 1 내지 17 중 어느 하나에서 정의된 바와 같은 재조합 세포를 원하는 분자량의 콘드로이틴을 생산하기에 충분한 시간 동안 배양 배지에서 배양하는 단계; 및
(b) 임의로는 재조합 세포 및/또는 배양 배지로부터 콘드로이틴을 단리하거나 회수하는 단계.
항목 19: 항목 18 에 있어서, 콘드로이틴이 약 20kDa 내지 약 50kDa 의 분자량을 갖는 방법.
항목 20: 항목 18 에 있어서, 콘드로이틴이 약 50kDa 내지 약 150kDa 의 분자량을 갖는 방법.
항목 21: 항목 18 에 있어서, 콘드로이틴이 약 150kDa 내지 약 1500 kDa 의 분자량을 갖는 방법.
항목 22: 항목 18 내지 21 중 어느 하나에 있어서, 재조합 세포가 사카로마이세스 속에 속하는 효모이고, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 인 방법.
항목 23: 항목 18 내지 22 중 어느 하나에 있어서, 원하는 분자량의 콘드로이틴을 생산하기에 충분한 시간이 약 35 시간 내지 약 50 시간, 바람직하게는 약 40 시간 내지 약 50 시간, 바람직하게는 약 48 시간의 기간인 방법.
항목 24: 항목 18 내지 항목 23 중 어느 하나에 있어서, 생산된 콘드로이틴의 분자량이 단계 (a) 동안 배양 배지의 pH 를 조절함으로써 제어되는 방법.
항목 25: 항목 18 내지 24 중 어느 하나에 있어서, 방법이 산업적 규모로 실행되고, 바람직하게는 배양 배지가 적어도 약 100L 이고, 더욱 바람직하게는 약 1,000L 내지 약 3,000L 범위이고, 더욱 더 바람직하게는 약 10,000L 이거나, 더욱 더 바람직하게는 약 100,000L 이거나, 심지어 약 250,000L 인 방법.
항목 26: 항목 1 내지 17 중 어느 하나에 따른 재조합 세포로부터 또는 항목 18 내지 25 중 어느 하나에 따른 방법으로부터 수득가능한 콘드로이틴.
항목 27: 항목 26 에 따른 콘드로이틴을 포함하는 배양 배지.
항목 28: 항목 26 에 따른 콘드로이틴을 포함하는 조성물.
항목 29: (i) 항목 5 내지 7 중 어느 하나에서 정의된 바와 같은 분자량을 갖는 콘드로이틴, (ii) 항목 27 의 배양 배지 또는 (iii) 항목 28 의 조성물을 포함하는 공산품 또는 소비재 또는 소모품.
항목 30: 항목 29 에 있어서, 화장품, 향미 제품, 향료 제품, 식료품, 식품, 음료, 식감제, 약학 조성물, 식이 보충제, 기능식품, 세정 제품, 치아 및/또는 구강 위생 조성물인 공산품 또는 소비재 또는 소모품.
항목 31: 약 20kDa 내지 약 50kDa, 또는 약 50kDa 내지 약 1000kDa 범위의 분자량을 갖는 콘드로이틴의 생산을 위한 항목 2 내지 17 중 어느 하나에서 정의된 바와 같은 재조합 세포의 용도.
항목 32:
(a) 항목 1 내지 17 중 어느 하나에서 정의된 바와 같은 재조합 효모를 배양 배지에서 배양하는 단계; 및
(b) 상기 배양 배지로부터 콘드로이틴을 회수하는 단계
를 포함하는, 콘드로이틴의 생산 방법으로서,
여기서, 단계 (b) 에서 회수된 콘드로이틴은,
- 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 핵산의 성질 및 기원,
- 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산의 발현을 제어하는 프로모터의 성질 및 기원,
- 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드와 관련된 고정 및/또는 분비 신호의 존재,
- 재조합 효모를 배양하는 단계 동안 배양 배지의 pH, 및/또는
- 재조합 효모의 배양 지속기간
의 선별을 통해 제어된 분자량을 갖는 생산 방법.
본 발명의 특정 구현예는 하기 이점 중 하나 이상을 제공할 수 있다:
· 제어된 분자량의 콘드로이틴을 생산하는 방법;
· 사카로마이세스 효모 세포에서 제어된 분자량의 콘드로이틴을 생산하는 방법; 및
· 유전적 매개변수 (예를 들어, 조절 서열) 및/또는 방법 매개변수 (pH 또는 발효 시간) 를 변화시킴으로써 제어된 분자량의 콘드로이틴을 생산하는 방법
본 발명의 언급된 양상 중 임의의 특정 하나 이상과 관련하여 제공된 세부사항, 예시 및 바람직함이 본원에서 추가로 설명될 것이고, 본 발명의 모든 양상에 동등하게 적용될 것이다. 이의 모든 가능한 변형에서의 상기에서 기술한 구현예, 예시 및 바람직함의 임의의 조합은 본원에서 달리 나타내지 않거나 또는 문맥에 의해 명확하게 모순되지 않는 한, 본 발명에 포함된다.
도 1 은 콘드로이틴의 생산을 위한 개략적 경로를 나타낸다.
서열의 요약
SEQ ID NO: 1 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-1)
SEQ ID NO: 2 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-2)
SEQ ID NO: 3 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-3)
SEQ ID NO: 4 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS.Sc)
SEQ ID NO: 5 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HHASA.Sc)
SEQ ID NO: 6 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-Vir)
SEQ ID NO: 7 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS2-Vir)
SEQ ID NO: 8 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 마이코박테리움 투베르쿨로시스 (Mycobacterium tuberculosis) 로부터 유래된 갈락토푸라노실트랜스페라아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS3-Vir)
SEQ ID NO: 9 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS4-Vir)
SEQ ID NO: 10 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 페니실리움 옥살리쿰 (Penicillium oxalicum) 으로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS5-Vir)
SEQ ID NO: 11 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS6-Vir)
SEQ ID NO: 12 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS7-Vir)
SEQ ID NO: 13 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS8-Vir)
SEQ ID NO: 14 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS9-Vir)
SEQ ID NO: 15 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS10-Vir)
SEQ ID NO: 16 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS11-Vir)
SEQ ID NO: 17 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS12-Vir)
SEQ ID NO: 18 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-1)
SEQ ID NO: 19 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-2)
SEQ ID NO: 20 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-3)
SEQ ID NO: 21: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편, 파스튜렐라 물토시다로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS.Sc)
SEQ ID NO: 22: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HHASA.Sc)
SEQ ID NO: 23: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-Vir)
SEQ ID NO: 24: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS2-Vir)
SEQ ID NO: 25: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS3-Vir)
SEQ ID NO: 26: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS4-Vir)
SEQ ID NO: 27: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 페니실리움 옥살리쿰 (Penicillium oxalicum) 으로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS5-Vir)
SEQ ID NO: 28: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS6-Vir)
SEQ ID NO: 29: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS7-Vir)
SEQ ID NO: 30: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS8-Vir)
SEQ ID NO: 31: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS9-Vir)
SEQ ID NO: 32: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS10-Vir)
SEQ ID NO: 33: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS11-Vir)
SEQ ID NO: 34: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS12-Vir)
SEQ ID NO: 35 는 아라비돕시스 탈리아나 (Arabidopsis thaliana) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 핵산 서열이다
SEQ ID NO: 36 은 클로렐라 바이러스 PBCV-1 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 재코딩된 핵산 서열이다
SEQ ID NO: 37 은 클로렐라 바이러스 PBCV-1 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB-A) 의 재코딩된 핵산 서열이다
SEQ ID NO: 38 은 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 핵산 서열이다
SEQ ID NO: 39 는 아라비돕시스 탈리아나 (Arabidopsis thaliana) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 아미노산 서열이다
SEQ ID NO: 40 은 클로렐라 바이러스 PBCV-1 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 아미노산 서열이다
SEQ ID NO: 41 는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 아미노산 서열이다
SEQ ID NO: 42 는 슈도모나스 아에루기노사 (Pseudomonas aeruginosa) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (GNE1) 의 핵산 서열이다
SEQ ID NO: 43 은 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 핵산 서열이다
SEQ ID NO: 44 는 에스케리치아 콜라이 (Escherichia coli) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 핵산 서열이다
SEQ ID NO: 45 는 슈도모나스 아에루기노사 (Pseudomonas aeruginosa) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (GNE1) 의 아미노산 서열이다
SEQ ID NO: 46 은 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 아미노산 서열이다
SEQ ID NO: 47 은 에스케리치아 콜라이 (Escherichia coli) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 아미노산 서열이다
SEQ ID NO: 48 은 N-말단 분비 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 49 는 N-말단 분비 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 50 은 N-말단 분비 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 51 은 N-말단 분비 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 52 는 N-말단 분비 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 53 는 N-말단 분비 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 54 는 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 55 는 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 56 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 57 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 58 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 59 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 60 은 N-말단 분비 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 61 은 N-말단 분비 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 62 는 N-말단 분비 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 63 은 N-말단 분비 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 64 는 N-말단 분비 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 65 는 N-말단 분비 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 66 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 67 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 68 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 69 는 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 70 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 71 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 72 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 핵산 서열이다.
SEQ ID NO: 73 은 클로렐라 바이러스 1 (PBCV-1) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 재코딩된 핵산 서열이다
SEQ ID NO: 74 은 클로렐라 바이러스 1 (PBCV-1) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 재코딩된 핵산 서열이다
SEQ ID NO: 75 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 아미노산 서열이다
SEQ ID NO: 76 은 클로렐라 바이러스 1 (PBCV-1) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 아미노산 서열이다
SEQ ID NO: 77 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 의 핵산 서열이다
SEQ ID NO: 78 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 의 아미노산 서열이다
SEQ ID NO: 79 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포글루코뮤타아제-1 (PGM1) 의 핵산 서열이다
SEQ ID NO: 80 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포글루코뮤타아제-1 (PGM1) 의 아미노산 서열이다
SEQ ID NO: 81 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 의 핵산 서열이다
SEQ ID NO: 82 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 의 아미노산 서열이다
SEQ ID NO: 83 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루코사민 6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 의 핵산 서열이다
SEQ ID NO: 84 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루코사민 6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 의 아미노산 서열이다
SEQ ID NO: 85 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포아세틸글루코사민 뮤타아제 (PCM1) 의 핵산 서열이다
SEQ ID NO: 86 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포아세틸글루코사민 뮤타아제 (PCM1) 의 아미노산 서열이다
SEQ ID NO: 87 은 프로모터 pTDH3 의 핵산 서열이다
SEQ ID NO: 88 은 프로모터 pTDH3.Sk 의 핵산 서열이다
SEQ ID NO: 89 은 프로모터 pTDH3-1.sba 의 핵산 서열이다
SEQ ID NO: 90 은 프로모터 pTDH3-1.Sar 의 핵산 서열이다
SEQ ID NO: 91 은 프로모터 pENO2 의 핵산 서열이다
SEQ ID NO: 92 은 프로모터 pTEF3 의 핵산 서열이다
SEQ ID NO: 93 은 프로모터 pTEF1 의 핵산 서열이다
SEQ ID NO: 94 은 프로모터 pTEF1.Ago 의 핵산 서열이다
SEQ ID NO: 95 은 프로모터 pTEF1.Sba 의 핵산 서열이다
SEQ ID NO: 96 은 프로모터 pPDC1 의 핵산 서열이다
SEQ ID NO: 97 은 프로모터 pCCW12 의 핵산 서열이다
SEQ ID NO: 98 은 프로모터 pCCW12.Sm 의 핵산 서열이다
SEQ ID NO: 99 은 프로모터 pCCW12.Sk 의 핵산 서열이다
SEQ ID NO: 100 은 프로모터 pCCW12.Sba 의 핵산 서열이다
SEQ ID NO: 101 은 프로모터 pCCW12.Sar 의 핵산 서열이다
SEQ ID NO: 102 은 프로모터 pNUP57 의 핵산 서열이다
SEQ ID NO: 103 은 프로모터 pCCW10.Ago 의 핵산 서열이다
SEQ ID NO: 104 은 프로모터 pCWP2 의 핵산 서열이다
SEQ ID NO: 105 은 프로모터 pFBA1 의 핵산 서열이다
SEQ ID NO: 106 은 프로모터 pCCW120.Sm 의 핵산 서열이다
SEQ ID NO: 107 은 프로모터 pCUP1 의 핵산 서열이다
SEQ ID NO: 108 은 프로모터 pMET6 의 핵산 서열이다
SEQ ID NO: 109 은 프로모터 pMET25 의 핵산 서열이다
SEQ ID NO: 110 은 프로모터 pSAM1 의 핵산 서열이다
SEQ ID NO: 111 은 터미네이터 tTPI1 의 핵산 서열이다
SEQ ID NO: 112 은 터미네이터 tMET25 의 핵산 서열이다
SEQ ID NO: 113 은 터미네이터 tDIT1 의 핵산 서열이다
SEQ ID NO: 114 은 터미네이터 tRPL3 의 핵산 서열이다
SEQ ID NO: 115 은 터미네이터 tRPL3.Sm 의 핵산 서열이다
SEQ ID NO: 116 은 터미네이터 tRPL3.sba 의 핵산 서열이다
SEQ ID NO: 117 은 터미네이터 tRPL41B 의 핵산 서열이다
SEQ ID NO: 118 은 터미네이터 tRPL41B.Sba 의 핵산 서열이다
SEQ ID NO: 1119 은 터미네이터 tRPL15A 의 핵산 서열이다
SEQ ID NO: 120 은 터미네이터 tRPL15A.Sm 의 핵산 서열이다
SEQ ID NO: 121 은 터미네이터 tRPL15A.sba 의 핵산 서열이다
SEQ ID NO: 122 은 터미네이터 tIDP1 의 핵산 서열이다
SEQ ID NO: 123 은 터미네이터 tIDP1.Sba 의 핵산 서열이다
SEQ ID NO: 124 은 터미네이터 tTEF1.sba 의 핵산 서열이다
SEQ ID NO: 125 은 5' 에서 부가된 분비 서열의 핵산 서열이다
SEQ ID NO: 126 은 N-말단에서 부가된 분비 서열의 아미노산 서열이다
SEQ ID NO: 127 은 3' 에서 부가된 고정 서열의 핵산 서열이다
SEQ ID NO: 128 은 C-말단에서 부가된 고정 서열의 아미노산 서열이다
발명의 상세한 설명
본 발명자들은 부모 세포와 비교하여, 그리고 특히 자연적으로 그렇게 할 수 없는 부모 효모와 비교하여, 콘드로이틴을 생산하는 능력을 갖는 유전적으로 변형된 세포, 특히 유전적으로 변형된 효모를 구상하였다.
이러한 유전적으로 변형된 세포는 본 명세서 전체에 걸쳐 기재되어 있다.
정의
용어 "콘드로이틴" 은 교대 β-(1→4) 및 β-(1→3) 글리코시드 결합을 통해 연결된, N-아세틸갈락토사민 및 글루쿠로니크산의 다당류 (β-글루쿠론산-(1→3)-N-아세틸-β-갈락토사민-4-설페이트-(1→4) 의 교대 중합체) 이며, 화학식 (C14H21NO11)n 을 갖는다.
본원에서 사용되는 용어 "콘드로이틴" 은 또한 화장품, 향미 제품, 향료 제품, 식료품, 식품, 음료, 식감제, 약학 조성물, 식이 보충제, 기능식품, 세정 제품 및/또는 치아 및/또는 구강 위생 조성물 또는 이의 조합에서의 적용에 유용한 콘드로이틴 설페이트를 포함하나 이에 제한되지 않는 콘드로이틴 및 이의 유도체를 포괄하도록 의도된다.
콘드로이틴 설페이트는 콘드로이틴-4-설페이트, 콘드로이틴-6-설페이트, 콘드로이틴-2,6-설페이트, 콘드로이틴-4,6-설페이트 및/또는 이들의 혼합물을 포함하나 이에 제한되지 않는다.
콘드로이틴-4-설페이트의 황화 부위는 N-아세틸갈락토사민 (GalNAc) 당의 탄소 4 이다.
콘드로이틴-6-설페이트의 황화 부위는 GalNAc 당의 탄소 6 이다.
콘드로이틴-2,6-설페이트의 황화 부위는 글루쿠론산의 탄소 2 및 GalNAc 당의 6 이다.
콘드로이틴-4,6-설페이트의 황화 부위는 GalNAc 당의 탄소 4 및 6 이다.
콘드로이틴 유도체, 예컨대 콘드로이틴 설페이트는 골관절염, 연골 악화, 및 골관절염-관련 관절 통증, 압통, 및/또는 부종의 위험의 완화, 감소, 예방 및/또는 치료하는 데 유용할 수 있다.
특히, 콘드로틴 유도체, 예컨대 콘드로이틴 설페이트는 골관절염; 골관절염-관련 관절 통증, 관절 압통, 및 관절 부종; 관절 퇴행; 및/또는 연골 악화의 위험의 완화, 감소, 예방 및/또는 치료하는 데 유용할 수 있다.
콘드로틴, 특히 콘드로이틴 설페이트는 골관절염; 골관절염-관련 관절 통증, 관절 압통, 및 관절 부종; 관절 변성; 및/또는 연골 악화의 치료를 위한 식이 보충제로서 단독으로 또는 글루코사민과 함께 사용될 수 있다.
콘드로이틴, 특히 콘드로이틴 설페이트는 조성물로서 제조될 수 있다.
콘드로이틴 유도체는 적절한 화학적 또는 효소적 단계를 통해 콘드로이틴으로부터 제조될 수 있다.
콘드로이틴은 재조합 세포에서 생산될 수 있다.
본원에서 사용되는 용어 "재조합"은, 세포에 관하여 사용되는 경우, 내인성 및/또는 이종 핵산 또는 단백질의 세포 내로의 도입 또는 천연 세포의 변경에 의해 세포가 변형되거나, 세포가 그렇게 변형된 세포로부터 유래되는 것을 나타낸다. 따라서 예를 들어, 재조합 세포는 천연 (비-재조합) 형태의 세포 내에서 발견되지 않는 유전자 또는 핵산을 발현하거나, 천연 (예를 들어, 내인성) 유전자를 이들의 천연 수준과 상이한 수준으로 발현하거나, 천연 (예를 들어, 내인성) 의 추가적인 또는 보충 카피를 이들의 천연 수준과 상이한 수준으로 발현한다.
본원에서 사용되는 용어 "재조합"은 핵산 또는 벡터에 관하여 사용되는 경우, 당업자에게 잘 알려진 유전 공학 기법에 의해 형성/수득된 서열이다. 이에 따라 미국 국립 보건원 (NIH) 의 지침은 하기와 나타내고 있다:
"재조합 [...] 핵산은 다음과 같이 정의된다:
i. (a) 핵산 분자를 연결함으로써 구성되며 (b) 살아있는 세포에서 복제할 수 있는 분자, 즉 재조합 핵산";
이는 핵산 서열에 붙은 단어 "재조합"의 통상적인 사용을 반영하여, 또 다른 핵산의 삽입 또는 또 다른 핵산과 함께 결합 후에 재조합되는 것을 의미한다.
살아있는 세포 내에서 재조합 DNA 또는 재조합 벡터의 발현으로부터 발생하는 단백질은 또한 재조합 단백질로 불린다.
따라서 용어 "재조합"은 용어 "유전적으로 변형된"과 동의어이다. 용어 "유전자" 는 용어 "핵산" 또는 "뉴클레오티드 서열" 과 동의어이다.
본 발명의 재조합 세포, 및 특히 재조합 효모에서 사용하기 위한 재조합 핵산 서열은 핵산 구축물의 형태로 제공될 수 있다. 용어 "핵산 구축물" 은 천연 (예를 들어, 내인성) 자연 발생 유전자로부터 단리되거나 유래하거나 이종 핵산이거나, 자연에 존재하지 않는 방식으로 조합되고 병치되는 핵산의 세그먼트를 함유하도록 변형된, 단일-가닥 또는 이중-가닥의 핵산 분자를 의미한다. 용어 "핵산 구축물"은 핵산 구축물이 코딩 서열의 발현에 필요한 하나 이상의 조절 요소를 함유하는 경우 용어 "발현 카세트" 또는 "이종 핵산 발현 카세트" 와 동의어이며, 여기서 상기 제어 서열은 상기 코딩 서열에 작동가능하게 연결된다. 조절 요소의 비제한적인 예는 프로모터, 인핸서, 사일런서 (silencer), 터미네이터 및 폴리-A 신호를 포함한다.
본 발명의 재조합 세포에 사용하기 위한 재조합 핵산 서열은 발현 벡터의 형태로 제공될 수 있으며, 여기서 폴리뉴클레오티드 서열은 재조합 세포에서 폴리뉴클레오티드 서열의 발현을 위한 적어도 하나의 제어 서열에 작동가능하게 연결된다.
용어 미생물 또는 동물 "로부터 수득되는" 또는 "로부터 기원하다" 또는 "로부터 기원하는" 은 일반적으로 미생물 또는 동물로부터 기원하는 물질 (예를 들어, 핵산 분자 또는 폴리펩티드) 이 그 미생물 또는 동물에 고유하다는 것을 의미한다.
용어 미생물 또는 동물 "로부터 유래한" 은 일반적으로 미생물 또는 동물로부터 유래한 물질 (예를 들어, 핵산 분자 또는 폴리펩티드) 이 그 미생물 또는 동물에 고유한 (즉, 그 자체로 존재하는) 물질에 초래된 변형의 결과라는 것을 의미한다. 예를 들어, 미생물 또는 동물로부터 유래한 핵산 서열에 관하여, 상기 핵산 서열은 이러한 미생물 또는 동물로부터의 천연 핵산 서열의 재코딩된 및/또는 절단된 버전에 상응할 수 있다. 당업자에게 잘 알려진 다른 변형은 미생물 또는 동물의 본래의 천연 물질 (native substance) 이 되어 상기 미생물 또는 동물로부터 "유래하는" 물질로 이어질 수 있다.
본원에서 사용되는 용어 "폴리펩티드" 는 펩티드 결합에 의해 연결된 아미노산 잔기를 포함하고 5 개 초과의 아미노산 잔기를 함유하는 분자를 의미한다. 아미노산은 단일 문자 또는 세 문자 지정에 의해 식별된다. 본원에서 사용되는 용어 "단백질"은 용어 "폴리펩티드"와 동의어이며, 둘 이상의 폴리펩티드를 또한 의미할 수 있다. 따라서, 용어 "단백질", "펩티드" 및 "폴리펩티드"는 상호교환가능하게 사용될 수 있다. 폴리펩티드는 임의로는 변형 (예를 들어, 글리코실화, 인산화, 아실화, 파르네실화, 프레닐화, 술폰화 등) 되어 기능성이 부가될 수 있다. 활성을 나타내는 폴리펩티드는 효소로 지칭될 수 있다. 유전자 코드의 축퇴 (degeneracy) 의 결과로서, 주어진 폴리펩티드를 코딩하는 다수의 뉴클레오티드 서열이 생성될 수 있다는 것이 이해될 것이다.
본 발명의 재조합 세포, 특히 재조합 효모에서 사용하기 위한 재조합 핵산에 의해 코딩된 폴리펩티드는 신호 펩티드 및/또는 프로펩티드 서열을 포함할 수 있다. 재조합 세포, 특히 재조합 효모에 의해 발현되는 폴리펩티드가 신호 펩티드 및/또는 프로펩티드를 포함하는 경우, 성숙 폴리펩티드 서열에 걸쳐 서열 동일성이 계산될 수 있다.
본원에서 사용되는 용어 "작동가능하게 연결된" 은 물리적으로 연결되어 있고 서로 기능적 관계에 있는 둘 이상의 핵산 서열 요소를 의미한다. 예를 들어, 프로모터가 코딩 서열의 전사 또는 발현을 개시하거나 조절할 수 있다면 프로모터는 코딩 서열에 작동가능하게 연결되며, 이러한 경우 코딩 서열은 프로모터 "의 제어 하에" 있는 것으로 이해되어야 한다. 일반적으로, 2 개의 핵산 서열이 작동가능하게 연결되는 경우, 이들은 동일한 배향에 있을 것이며 통상 또한 동일한 판독 프레임 (reading frame) 에 있을 것이다. 필요하지 않을 수 있지만, 이들은 본질적으로 연속될 것이다.
분자, 특히 효소 및 핵산에 관해 본원에서 사용되는 용어 "천연" 또는 "내인성"은 이들이 기원하는 유기체에서 발현되거나 자연에서 발견되는 분자를 나타낸다.
용어 "내인성 유전자" 는 유전자가 야생형 균주에서 임의의 유전적 변형 전에 세포에 존재하였다는 것을 의미한다. 내인성 유전자는 내인성 조절 요소에 추가로 또는 이를 대체하기 위해 이종 서열을 도입함으로써, 또는 염색체 또는 플라스미드 내로 유전자의 하나 이상의 추가적인 또는 보충 카피를 도입함으로써 과발현될 수 있다 (상기 추가적인 또는 보충 카피는 본원에서 정의된 바와 같은 "외인성 또는 이종 유전자" 또는 "이종 뉴클레오티드 서열" 또는 "이종 핵산" 으로 지정됨). 내인성 유전자는 또한 그의 발현 및/또는 활성을 조절하기 위해 변형될 수 있다. 예를 들어, 유전자 산물을 변형시키기 위해 돌연변이가 코딩 서열 내로 도입될 수 있거나, 내인성 조절 요소에 추가로 또는 이를 대체하기 위해 이종 서열이 도입될 수 있다. 내인성 유전자의 조절은 유전자 산물의 활성의 상향 조절 및/또는 강화를 초래할 수 있거나, 대안적으로, 내인성 유전자 산물의 활성의 하향 조절 및/또는 감쇠를 초래할 수 있다. 내인성 유전자의 발현을 강화시키는 또 다른 방식은 염색체 또는 플라스미드 상에 유전자의 하나 이상의 추가적인 또는 보충 카피를 도입하는 것이다 (상기 보충 카피는 본원에 정의된 바와 같이 "외인성 또는 이종 유전자" 또는 "이종 뉴클레오티드 서열" 또는 "이종 핵산" 임).
본 발명에 따른 "유전자의 하나 이상의 추가적인 또는 보충 카피"는 예를 들어 본 발명에서 1 내지 50 카피, 특히 1 내지 30 카피, 보다 특히 1 내지 20 카피, 바람직하게는 1 내지 10 카피인 것으로 이해된다. 상기 카피는 본 발명의 재조합 세포의 동일한 유전자좌 또는 상이한 유전자좌에 삽입될 수 있다.
용어 "외인성 유전자" 는 당업자에게 잘 알려진 수단에 의해 유전자가 세포에 도입되는 반면, 이 유전자가 야생형 세포에서 자연 발생하거나 자연 발생하지 않는다는 것을 의미한다. 외인성 유전자가 세포 내에서 그의 발현을 허용하는 모든 요소와 함께 세포에 도입된다면, 세포는 외인성 유전자를 발현할 수 있다. 외인성 DNA 로 세포를 형질전환하는 것은 당업자에게 일상적인 작업이다. 외인성 유전자는 숙주 염색체 내로 통합되거나 플라스미드 또는 벡터로부터 염색체외로 발현될 수 있다. 세포에서 그의 복제 기원 (origin of replication) 및 그의 카피 수와 관련하여 상이한 다양한 플라스미드가 모두 당업계에 공지되어 있다. 외인성 유전자의 서열은 세포에서의 그의 발현을 위해 조정될 수 있다. 실제로, 당업자는 코돈 사용 편향의 개념 및 추론된 단백질을 변형시키지 않고 특정 코돈 사용 편향에 대해 핵산 서열을 조정하는 방법을 알고 있다. 특정 구현예에서, 코돈 최적화된 유전자는 천연 효소를 발현한다.
용어 "이종 유전자" 또는 "이종 핵산 서열" 은 자연적으로 주어진 세포에서 일반적으로 발견되지 않는 유전자 또는 핵산 서열을 의미한다. 이와 같이, 이종 핵산 서열은: (a) 그의 숙주 세포에 대해 외래이고 (즉, 세포에 대해 "외인성" 임); (b) 숙주 세포에서 자연적으로 발견되지만 (즉, "내인성") 세포 내에서 비자연적인 양으로 존재하거나 (즉, 숙주 세포에서 자연적으로 발견되는 것보다 더 많거나 더 적음); 또는 (c) 숙주 세포에서 자연적으로 발견되지만 그의 자연적 유전자좌의 외부에 위치할 수 있다.
본 출원에서, 모든 유전자는 이들의 공통적인 명칭에 대해 및 이들의 뉴클레오티드 서열 및 경우에 따라 이들의 아미노산 서열에 대해 언급된다. 공지된 유전자에 대한 등록 번호에 주어진 참조를 사용하여, 당업자는 다른 유기체, 박테리아 균주, 효모, 진균, 포유동물, 식물 등에서 동등한 유전자를 결정할 수 있다. 이러한 일상적인 작업은 유리하게는 다른 세포로부터 유래한 유전자와의 서열 정렬을 실행하고 또 다른 유기체에서 상응하는 유전자를 클로닝하기 위해 축퇴된 프로브를 설계함으로써 결정될 수 있는 컨센서스 서열을 사용하여 수행된다.
당업자는 내인성 유전자의 발현을 조절하는, 특히 상향 조절 또는 하향 조절하는 상이한 수단을 알고 있다. 예를 들어, 내인성 유전자의 발현을 향상시키거나 과발현시키는 방식은 염색체 또는 플라스미드 상에 유전자의 하나 이상의 추가적인 또는 보충 카피를 도입하는 것이다.
또 다른 방식은 유전자의 내인성 프로모터를 더 강한 프로모터로 대체하는 것이다. 이들 프로모터는 동종 또는 이종일 수 있다. 본 발명에서 특히 흥미로운 프로모터는 본 명세서의 다른 곳에서 더 상세히 기재된다.
핵산 발현 구축물은 5' 및/또는 3' 인식 서열 및/또는 선택 마커를 추가로 포함할 수 있다.
용어 "유도성 프로모터"는 활성이 유도된, 즉 증가된 프로모터를 자격부여하는데 사용된다:
- 하나 이상의 특정 대사산물(들) 의 존재 하에. 배지 중 대사산물 농도가 높을수록, 프로모터 활성이 더 강해지거나; 또는
- 낮은 농도의 존재 하에 또는 하나 이상의 대사산물(들) 의 부재 하에. 이들 대사산물은 그의 존재 증가가 프로모터의 활성을 유도하는 것들과 상이하다. 배지 중 대사산물 농도가 낮을수록, 프로모터 활성은 더 강해진다.
용어 "억제성 프로모터"는 활성이 억제된, 즉 감소된 프로모터를 자격부여하는데 사용된다:
- 하나 이상의 특정 대사산물(들) 의 존재 하에. 배지 중 대사산물 농도가 높을수록, 프로모터 활성이 더 약해지거나; 또는
- 낮은 농도의 존재 하에 또는 하나 이상의 대사산물(들) 의 부재 하에. 이들 대사산물은 그의 존재 증가가 프로모터의 활성을 억제하는 것들과 상이하다. 배지 중 대사산물 농도가 낮을수록, 프로모터 활성은 더 약해진다.
본원에서 사용되는 용어 "고정 신호" 는 효소 (예를 들어 히알루로니다아제) 와 같은 단백질 또는 폴리펩티드와 함께 사용되는 경우, 예를 들어 단백질 또는 폴리펩티드를 코딩하는 제 2 핵산에 작동가능하게 연결되는 단백질을 코딩하는 제 1 핵산, 또는 효소 (예컨대, 예를 들어 융합 단백질을 형성하기 위한 히알루로니다아제) 와 같은 제 2 단백질 또는 폴리펩티드에 작동가능하게 연결되는 제 1 단백질 또는 폴리펩티드를 의미하며 이는 세포, 특히 S. 세레비지에 (S. cerevisiae) 세포의 세포 수송 기구가 제 1 단백질에 작동가능하게 연결되는 제 2 단백질을 세포의 멤브레인 내에 정확하게 고정 및/또는 위치시킬 수 있게 한다.
본원에서 사용되는 용어 "분비 신호" 는 효소 (예를 들어 히알루로니다아제) 와 같은 단백질 또는 폴리펩티드와 함께 사용되는 경우, 예를 들어 단백질을 코딩하는 제 2 핵산에 작동가능하게 연결되는 펩티드 또는 단백질을 코딩하는 제 1 핵산, 또는 효소 (예컨대, 예를 들어 융합 단백질을 형성하기 위한 히알루로니다아제) 와 같은 제 2 단백질에 연결되는 제 1 단백질을 의미하며 이는 제 1 단백질이 예를 들어, 제 2 단백질로부터 절단된 후에, 세포, 특히 S. 세레비지에 (S. cerevisiae) 세포의 세포 수송 기구가 적어도 제 2 단백질을 세포의 멤브레인에 위치시키고 제 2 단백질을 세포 외부로 분비시킬 수 있게 한다.
본원에서 사용되는 용어 "분비 신호" 및 "고정 신호" 는 효소 (예를 들어 히알루로니다아제) 와 같은 단백질 또는 폴리펩티드와 함께 사용되는 경우, 예를 들어 단백질을 코딩하는 제 2 핵산에 작동가능하게 연결되는 펩티드 또는 단백질을 코딩하는 제 1 핵산, 또는 효소 (예를 들어 히알루로니다아제) 와 같은 제 2 단백질에 작동가능하게 연결되는 제 1 단백질을 의미하며 이는 세포, 특히 S. 세레비지에 (S. cerevisiae) 세포의 세포 수송 기구가 적어도 제 2 단백질을 세포의 멤브레인에 위치시킬 수 있게 하고 여기서 제 2 단백질이 또한 "고정 신호" 에 작동가능하게 연결되는 경우 제 2 단백질은 분비되지 않으나 세포의 멤브레인에 부착된 채로 남아 있다. 일부 경우에, 분비-고정 신호는 이중 분비 신호 및 고정 신호 기능을 제공할 수 있다.
분비 및 고정 신호의 서열, 세포 (예를 들어 효모 세포) 의 표면 상의 이종 단백질, 예컨대 효소 (예를 들어, 히알루로니다아제) 의 발현, 고정 및/또는 분비를 위한 방법이 당업계에 잘 알려져 있다 (예를 들어, Ast et al (2013) Cell 152: 1134-1145, Ast and Schuldiner (2013) Crit Rev Biochem Mol Biol 48(3) 273-288, Van der Vaart et al (1997) Applied Environmental Microbiology 63(2) 615-620 참조, 이들 간행물 각각의 전체 내용은 본원에 참조로 포함됨).효소의 "활성" 은 용어 "기능" 과 상호교환가능하게 사용되며, 본 발명의 맥락에서, 원하는 반응을 촉매화하는 효소의 능력을 지정한다. 숙주 세포 내 효소의 양은 효소를 코딩하는 유전자의 전사를 변형시킴으로써 변경될 수 있다. 이는 예를 들어 효소를 코딩하는 뉴클레오티드 서열의 카피 수를 변형함으로써 (예를 들어, 뉴클레오티드 서열을 포함하는 더 높거나 더 낮은 카피 수 발현 벡터를 사용함으로써, 또는 뉴클레오티드 서열의 추가적인 카피를 숙주 세포의 게놈에 도입함으로써 또는 숙주 세포의 게놈에서 뉴클레오티드 서열을 결실시키거나 파괴함으로써), 오페론의 폴리시스트론성 mRNA 상의 코딩 서열의 순서를 변경하거나 오페론을 각각 그의 제어 요소를 갖는 개별 유전자로 분해함으로써, 또는 뉴클레오티드 서열이 작동가능하게 연결되는 프로모터 또는 오퍼레이터의 강도를 증가시킴으로써 달성될 수 있다.
대안적으로 또는 추가적으로, 숙주 세포 내의 효소의 카피 수는 효소를 인코딩하는 mRNA 의 번역 수준을 변형시킴으로써 변경될 수 있다. 이는 예를 들어, mRNA 의 안정성을 변형시키고, 리보솜 결합 위치의 서열을 변형시키고, 리보솜 결합 위치와 효소 코딩 서열의 시작 코돈 사이의 거리 또는 서열을 변형시키고, 효소 코딩 부위의 시작 코돈의 5' 측의 "업스트림" 에 위치하거나 이에 인접한 전체 인터시스트론 부위를 변형시키고, 헤어핀 및 특수 서열을 사용하여 mRNA 전사체의 3'-말단을 안정화시키고, 효소의 코돈 용법을 변형시키고, 효소의 생합성에 사용된 희귀 코돈 tRNA 의 발현을 변경시키고/시키거나, 예를 들어 그의 코딩 서열의 돌연변이를 통해 효소의 안정성을 증가시킴으로써 달성될 수 있다.
숙주 세포에서 효소의 활성은, 숙주 세포에서 증가되거나 감소된 용해도를 나타내는 효소의 변형된 형태를 발현시키거나, 효소의 활성이 억제되는 도메인이 결여된 효소의 변경된 형태를 발현시키거나, 기질에 대해 더 높거나 더 낮은 Kcat 또는 더 낮거나 더 높은 Km 을 갖는 효소의 변형된 형태를 발현시키거나, 경로 내의 또 다른 분자에 의한 피드백 또는 피드포워드 조절에 의해 더 많거나 더 적게 영향을 받는 효소의 변경된 형태를 발현시키는 것을 포함하지만 이에 제한되지 않는 다수의 방식으로 변경될 수 있다.용어 "코딩" 또는 "~을 코딩하는" 은 전사 및 번역의 메커니즘을 통해 폴리뉴클레오티드가 아미노산 서열을 생성하는 과정을 의미한다.
본 발명에서 고려되는 효소(들) 를 코딩하는 유전자(들) 는 외인성 또는 내인성일 수 있다.
본 발명에서 실행되는 방법은 바람직하게는 염색체 상의 특정 위치에 이종 뉴클레오티드 서열을 안정적으로 도입하기 위한 또는 유전적으로 변형된 세포에서 하나 이상의 표적 유전자의 기능적 파괴를 위한 하나 이상의 염색체 통합 구축물의 사용을 필요로 한다. 일부 구현예에서, 표적 유전자의 파괴는 관련된 기능적 단백질의 발현을 방지한다. 일부 구현예에서, 표적 유전자의 파괴는 파괴된 유전자로부터 비-기능적 단백질의 발현을 초래한다.
본 발명의 실행에서 변화될 수 있는 염색체 통합 구축물의 매개변수는 상동 서열의 길이; 상동 서열의 뉴클레오티드 서열; 통합 서열의 길이; 통합 서열의 뉴클레오티드 서열; 및 표적 유전자좌의 뉴클레오티드 서열을 포함하나 이에 제한되지 않는다. 일부 구현예에서, 각각의 상동 서열의 길이에 대한 유효 범위는 20 내지 5,000 개 염기쌍, 바람직하게는 50 내지 100 개 염기쌍이다. 특정 구현예에서, 각각의 상동 서열의 길이는 약 50 개 염기쌍이다. 유전자 표적화에 필요한 상동성의 길이에 대한 더 많은 정보는 D. Burke et al., Methods in yeast Genetics - A cold spring harbor laboratory course Manual (2000) 를 참조한다.
일부 구현예에서, (a) 상기 언급된 DNA 구축물(들) 이 삽입되도록 의도되는 파괴된 유전자(들) 는 유리하게는 형질전환된 세포의 선택에 유용한 하나 이상의 선별 마커를 포함할 수 있다. 바람직하게는, 상기 선별 마커(들) 는 본 발명에 따른 DNA 구축물(들) 에 포함된다.
일부 구현예에서, 선별 마커는 항생제 내성 마커이다. 항생제 내성 마커의 예시적인 예는 NAT1, AURl-C, HPH, DSDA, KAN<R> 및 SH BLE 유전자 산물을 포함하지만 이에 제한되지 않는다. S. 누르세이 (S. noursei) 로부터의 NAT 1 유전자 산물은 누르세오트리신에 대한 내성을 부여하고; 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터의 AURl-C 유전자 산물은 아우에로바시딘 A (AbA) 에 대한 내성을 부여하고; 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 의 HPH 유전자 산물은 히그로마이신 B 에 대한 내성을 부여하고; 대장균의 DSDA 유전자 산물은 유일한 질소원으로서 D-세린과 함께 플레이트 상에서 세포가 성장하게 하고; Tn903 트랜스포존의 KAN<R> 유전자는 G418 에 대한 내성을 부여하고; 스트렙토알로테이쿠스 힌두스타누스 (Streptoalloteichus hindustanus) 로부터의 SH BLE 유전자 산물은 제오신 (블레오마이신) 에 대한 내성을 부여한다.
일부 구현예에서, 항생제 내성 마커는 본 발명의 유전적으로 변형된 세포가 단리된 후에 결실된다. 당업자는 특정 유전적 맥락에서 적절한 마커를 선택할 수 있다.
특정 구현예에서, 본 발명에 따른 재조합 세포는 어떠한 항생제 내성 마커도 없다. 이는 유리하게는 선택 배지에 항생제를 첨가할 필요성을 방지한다.
일부 구현예에서, 선별 마커는 유전적으로 변형된 세포에서 영양요구성 (예를 들어, 영양적 영양요구성) 을 구제한다. 이러한 구현예에서, 모 세포, 및 특히 모 효모는 아미노산 또는 뉴클레오티드 생합성 경로에서 기능하는 하나 이상의 유전자 산물, 예를 들어 효모에서의 HIS3, LEU2, LYS1, LYS2, MET15, TRP1, ADE2 및 URA3 유전자 산물에서의 기능적 파괴를 포함하며, 이는 모 세포가 하나 이상의 영양소 (영양요구성 표현형) 의 보충 없이 배지에서 성장할 수 없게 한다. 이어서, 영양요구성 표현형은 파괴된 유전자 산물의 기능적 카피를 코딩하는 염색체 통합으로 모 세포를 형질전환시킴으로써 구제될 수 있고 (일부 구현예에서, 유전자의 기능적 카피는 클루베로마이세스 (Kluveromyces), 칸디다 (Candida) 등과 같은 가까운 종으로부터 기원할 수 있음), 생성된 유전적으로 변형된 세포는 모 세포의 영양요구성 표현형의 손실을 기반으로 하여 선택될 수 있다.
프로모터 서열, 코딩 서열 (예를 들어, 효소 코딩 서열), 또는 터미네이터 서열을 포함하는 핵산 서열 각각에 대해, 참조 서열이 본원에 기재된다. 본 설명은 또한 참조 핵산 서열과 특정 백분율의 핵산 동일성을 갖는 핵산 서열을 포함한다.
각각의 관심 아미노산 서열에 대해, 참조 서열이 본원에 기재된다. 본 설명은 또한 참조 아미노산 서열과 특정 백분율의 아미노산 동일성을 갖는 아미노산 서열 (예를 들어, 효소 아미노산 서열) 을 포함한다.
명백한 이유로, 본 설명 전체에서, 각각 고려되는 뉴클레오티드 또는 아미노산 동일성을 준수하는 특정 핵산 서열 또는 특정 아미노산 서열은 원하는 생물학적 활성을 나타내는 단백질 (또는 효소) 을 수득하는 것으로 더 이어져야 한다. 본원에서 사용되는 바와 같이, 2 개의 핵산 서열 사이 또는 2 개의 아미노산 서열 사이의 "동일성 백분율"은 비교 윈도우 (comparison window) 를 통해 최적으로 정렬된 서열 모두를 비교함으로써 결정된다.
따라서, 비교 윈도우에서 뉴클레오티드 또는 아미노산 서열의 일부는 두 서열 사이의 최적 정렬이 수득되도록 참조 서열 (이들 부가 또는 이들 결실을 포함하지 않음) 과 비교하여 부가 또는 결실 (예를 들어, "갭") 을 포함할 수 있다.
용어 "서열 상동성" 또는 "서열 동일성" 또는 "상동성" 또는 "동일성"은 본원에서 상호교환가능하게 사용된다. 본 발명의 목적을 위해, 2 개의 아미노산 서열 또는 2 개의 핵산 서열의 서열 상동성 또는 서열 동일성의 백분율을 결정하기 위하여, 서열을 최적의 비교 목적을 위해 정렬하는 것이 본원에서 정의된다. 두 서열 사이의 정렬을 최적화하기 위해, 비교되는 2 개 서열 중 임의의 서열에 갭이 도입될 수 있다. 이러한 정렬은 비교되는 서열의 전체 길이에 걸쳐 실행될 수 있다. 대안적으로, 정렬은 더 짧은 길이, 예를 들어 약 20 개, 약 50 개, 약 100 개 이상의 핵산/기반 또는 아미노산에 걸쳐 실행될 수 있다. 서열 동일성은 보고된 정렬된 부위에 걸쳐 2 개의 서열 사이의 동일한 매치 백분율이다. 2 개 서열 사이의 서열의 비교 및 서열 동일성 백분율의 결정은 수학적 알고리즘을 사용하여 수행될 수 있다. 당업자는 여러 상이한 컴퓨터 프로그램이 2 개 서열을 정렬하고 2 개 서열 사이의 동일성을 결정하는데 이용 가능하다는 사실을 인식할 것이다 (Kruskal, J. B. (1983) An overview of sequence comparison In D. Sankoff and J. B. Kruskal, (ed.), Time warps, string edits and macromolecules: the theory and practice of sequence comparison, pp. 1-44 Addison Wesley).
2 개 아미노산 서열 사이 또는 2 개 뉴클레오티드 서열 사이의 서열 동일성 퍼센트는 2 개 서열의 정렬을 위한 니들만 (Needleman) 및 분쉬 (Wunsch) 알고리즘을 사용하여 결정될 수 있다 (Needleman, S. B. and Wunsch, C. D. (1970) J. Mol. Biol. 48, 443-453). 아미노산 서열 및 뉴클레오티드 서열 둘 모두는 알고리즘에 의해 정렬될 수 있다. 니들만-분쉬 알고리즘은 컴퓨터 프로그램 NEEDLE 에서 구현되었다.
본 발명의 목적을 위해, EMBOSS 패키지로부터의 NEEDLE 프로그램을 사용하였다 (버전 2.8.0 이상, EMBOSS: The European Molecular Biology Open Software Suite (2000) Rice, P. LongdenJ. and Bleasby,A. Trends in Genetics 16, (6) pp276― 277, http://emboss.bioinformatics.nl/). 단백질 서열의 경우, EBLOSUM62 가 치환 매트릭스에 사용된다. 뉴클레오티드 서열의 경우, EDNAFULL 이 사용된다. 사용된 선택적인 매개변수는 10 의 갭 개방 페널티 및 0.5 의 갭 연장 페널티이다. 앤드 갭 페널티 (end gap penalty) 가 추가되지 않는다. 출력 (Output) 섹션에서, 출력 정렬 포맷으로서 표시된 질문 "간략한 동일성 및 유사성 (Brief identity and similarity)" 및 "SRS 쌍별 (pairwise)" 에 대한 응답으로 Yes 가 표시되었다.
상기 기재된 바와 같은 프로그램 NEEDLE 에 의한 정렬 후, 질의 서열 (query sequence) 과 본 발명의 서열 사이의 서열 동일성 백분율을 하기와 같이 계산한다: 정렬에서 갭의 총 수를 뺀 후 정렬의 총 길이로 나눈 양 서열에서 동일한 아미노산 또는 동일한 뉴클레오티드를 나타내는 정렬에서 상응하는 위치의 수. 본원에서 정의된 동일성은 NOBRIEF 옵션을 사용하여 NEEDLE 로부터 수득할 수 있고, 프로그램의 출력에서 "최장 동일성 (longest-identity)" 으로서 라벨링된다.
뉴클레오티드 및 아미노산 서열의 유사성, 즉 서열 동일성의 백분율은 여러 다른 업계-공지된 알고리즘을 사용하여, 바람직하게는 칼린 (Karlin) 과 알츠철 (Altschul) 의 수학적 알고리즘 (Karlin & Altschul (1993) Proc. Natl. Acad. Sci. USA 90: 5873-5877), hmmalign (HMMER 패키지, http://hmmer.wustl.edu/) 또는 예를 들어 https://www.ebi.ac.uk/Tools/msa/clustalo/ 또는 GAP 프로그램 (아이오와 대학의 수학적 알고리즘) 에서 이용가능한 CLUSTAL 알고리즘 (Thompson, J. D., Higgins, D. G. & Gibson, T. J. (1994) Nucleic Acids Res. 22, 4673-80) 또는 마이어스 (Myers) 와 밀러 (Miller) (1989 - Cabios 4: 11-17) 또는 Clone Manager 9 의 수학적 알고리즘으로, 서열 정렬을 통해 결정될 수 있다. 사용한 바람직한 매개변수는 https://www.ebi.ac.uk/Tools/msa/clustalo/ 에서 설정되는 바와 같은 디폴트 매개변수이다.
서열 동일성 등급 (서열 매칭) 은 예를 들어, BLAST, BLAT 또는 BlastZ (또는 BlastX) 를 사용하여 계산될 수 있다. 유사한 알고리즘이 Altschul et al (1990) J. Mol. Biol. 215, 403-410 의 BLASTN 및 BLASTP 프로그램에 통합된다. BLAST 폴리뉴클레오티드 검색을 BLASTN 프로그램, 스코어 = 100, 단어 길이 = 12 로 수행하여, 관련 단백질을 코딩하는 핵산과 상동성인 폴리뉴클레오티드 서열을 수득한다.
BLAST 단백질 검색을 BLASTP 프로그램, 스코어 = 50, 단어 길이 = 3 으로 수행하여 SHC 폴리펩티드에 상동성인 아미노산 서열을 수득한다. 비교 목적을 위한 갭화된 정렬 (gapped alignment) 을 수득하기 위해, Gapped BLAST 를 Altschul et al (1997) Nucleic Acids Res. 25, 3389-3402 에서 기재된 바와 같이 이용할 수 있다. BLAST 및 Gapped BLAST 프로그램을 이용할 때, 각각의 프로그램의 디폴트 매개변수가 사용된다. 서열 매칭 분석은 Shuffle-LAGAN (Brudno M., Bioinformatics 2003b, 19 Suppl 1: 154-162) 또는 마르코브 (Markov) 랜덤 필드와 같은 확립된 상동성 맵핑 기법에 의해 보충될 수 있다. 서열 동일성의 백분율이 본 출원에서 언급되는 경우, 이들 백분율은 달리 구체적으로 나타내지 않는 한 더 긴 서열의 전체 길이와 관련하여 계산된다.
특정 구현예에서, 2 개 서열 사이의 동일성 % 는 CLUSTAL O (버전 1.2.4) 를 사용하여 결정된다.
"발효" 또는 "배양"은 일반적으로 적어도 하나의 단순한 탄소원 및 필요한 경우 보조 기질을 함유하는, 배양되는 세포에 적합한 적절한 배양 배지를 갖는 발효기에서 수행된다.
용어 "발효 조성물"은 유전적으로 변형된 숙주 세포 및 유전적으로 변형된 숙주 세포에 의해 생산되는 생성물 또는 대사산물을 포함하는 조성물을 의미한다. 발효 조성물의 예는 전세포 브로쓰 (whole cell broth) 이며, 이는 세포, 수성상, 및 유전적으로 변형된 숙주 세포로부터 생산된 화합물을 포함하는 용기 (예를 들어, 플라스크, 플레이트 또는 발효기) 의 전체 내용물일 수 있다.
용어 "배지"는 배양 (culture) 배지 또는 배양 (cultivation) 배지 또는 발효 배지를 의미한다.
콘드로이틴의 최대 생산을 위해, 생산 숙주로서 사용되는 재조합 세포는 바람직하게는 높은 탄수화물 이용률을 갖는다. 이러한 특징은 돌연변이유발 및 선택, 유전 공학에 의해 부여되거나, 자연적인 것일 수 있다. 본 세포에 대한 발효 배지, 또는 "배양 배지 (culture medium)" 또는 "배양 배지 (cultivation medium)" 는 적어도 약 10 g/L 의 글루코dh스 및/또는 수크로오스를 함유할 수 있다. 추가적인 탄소 기질은 단당류 예컨대 프룩토오스, 만노오스, 자일로오스 및 아라비노오스; 올리고당류 예컨대 락토오스, 말토오스, 갈락토오스 또는 수크로오스; 다당류 예컨대 전분 또는 셀룰로오스 또는 이의 혼합물 및 치즈 유청 투과액 (cheese whey permeate) 옥수수 침지액 (cornsteep liquor), 사탕무 당밀 및 보리 맥아와 같은 재생가능한 공급원료로부터의 비정제된 혼합물을 포함할 수 있으나 이에 제한되지 않는다. 다른 탄소 기질은 글리세롤, 아세테이트 및/또는 에탄올을 포함할 수 있다.
따라서, 본 발명에 사용되는 탄소원은 매우 다양한 탄소 함유 기질을 포함할 수 있고, 단지 세포, 특히 효모의 선택에 의해 제한될 것으로 고려된다.
상기 언급된 모든 탄소 기질 및 이의 혼합물이 본 발명에 적합한 것으로 고려되지만, 바람직한 탄소 기질은 글루코오스, 프룩토오스 및 수크로오스, 또는 C5 당, 보다 특히 글루코오스를 사용하도록 변형된, 세포, 특히 효모에 대한 자일로오스 및/또는 아라비노오스와 같은 C5 당과 이들의 혼합물이다.
바람직한 탄소 기질은 글루코오스 또는 수크로오스이다.
적절한 탄소원에 추가로, 발효 배지는 원하는 생성물의 생산에 필요한 배양물의 성장 및 효소적 경로의 촉진에 적합한, 당업자에게 공지된 적합한 미네랄, 염, 보조인자, 완충제 및 다른 성분을 함유할 수 있다.
게다가, 본 발명에 따른 재조합 세포의 성장에 적합한 추가적인 유전적 변형이 고려될 수 있다.
용어 "호기성 조건" 은 호기성 또는 통성 혐기성 세포, 특히 효모가 말단 전자 수용체로서 이산소 (di-oxygene) 을 사용하기에 충분한 배양 배지 중의 산소 농도를 의미한다.
"미세호기성 조건" 은 산소의 농도가 공기 중의 농도보다 더 낮은, 즉 산소 농도가 6% O2 까지인 배양 배지를 의미한다.
"적절한 배양 배지" 는 탄소원 또는 탄소 기질, 질소원, 예를 들어 펩톤, 효모 추출물, 고기 추출물, 맥아 추출물, 우레아, 암모늄 술페이트, 암모늄 클로라이드, 암모늄 니트레이트 및 암모늄 포스페이트; 인 공급원, 예를 들어 모노포타슘 포스페이트 또는 디포타슘 포스페이트; 미량 원소 (예를 들어, 금속 염), 예를 들어 마그네슘 염, 코발트 염 및/또는 망간 염; 뿐만 아니라 아미노산, 비타민, 성장 촉진제 등과 같은 성장 인자와 같은 세포의 유지 및/또는 성장에 필수적이거나 이로운 영양소를 포함하는 배지 (예를 들어 멸균, 액체 배지) 를 나타낸다. 본 발명에 따른 용어 "탄소원" 또는 "탄소 기질" 또는 "탄소의 공급원" 은 세포의 정상적인 성장을 지지하기 위해 당업자에 의해 사용될 수 있는 탄소의 임의 공급원을 나타내며 헥소오스 (예컨대 글루코오스, 갈락토오스 또는 락토오스), 펜토오스, 단당류, 올리고당류, 이당류 (예컨대 수크로오스, 셀로비오스 또는 말토오스), 당밀, 전분 또는 이의 유도체, 셀룰로오스, 헤미셀룰로오스 및 이의 조합을 포함한다.
본 발명의 재조합 세포, 및 특히 본 발명의 재조합 효모를 생산하기에 특히 적합한 배양 배지는 하기 본문에서 기재된다. 본 발명의 콘드로이틴의 "제어된" 분자량은 본 발명의 방법에 의해 생성된 콘드로이틴의 적어도 80%, 특히 적어도 85% 가, 하기와 같은 본 발명의 방법 및/또는 재조합 세포의 적어도 하나의 매개변수의 조절을 통해 특정한 사전결정된 분자량 범위 내에 포함되는 분자량을 갖는 것을 의미하는 것으로 의도된다:
- 재조합 세포의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 핵산의 성질 및 기원,
- 재조합 세포의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 핵산의 발현을 제어하는 프로모터의 성질 및 기원,
- 재조합 세포의 콘드로이티나아제 활성을 갖는 폴리펩티드와 관련된 고정 및/또는 분비 신호의 존재,
- 재조합 세포를 배양하는 단계 동안 배양 배지의 pH, 및/또는
- 재조합 세포의 배양 지속기간.
본원에서 사용되는 용어 "약" 은 당업자에게 결정되는 바와 같은 값에 대한 합리적인 범위를 의미한다. 특정 구현예에서, 용어 약은 ± 1, 2 또는 3 표준 편차를 의미한다. 특정 구현예에서, 용어 약은 ± 5%, 10%, 20% 또는 25% 를 의미한다. 특정 구현예에서, 용어 약은 ± 0.1, 0.2 또는 0.3 로그 단위, 예를 들어 pH 단위를 의미한다.
본 발명에 따라 도입된 유전자 변형의 일반적 특성
- 모든 게놈 변형은 공지된 유전 공학 기법에 따라 재조합 세포, 특히 재조합 효모에 삽입된다:
- 본 발명에 따른 재조합 세포 게놈에 도입되는 유전자 구축물에 포함되는 연속적인 핵산 서열은 하기 구조의 것이다:
Prom1-ORF1-term1-ORF2-유전자2-term2 - …/… -Promn-ORFn-termn, 여기서:
- Prom1 은 코딩 서열 ORF1 의 발현을 조절하는 서열이고,
- ORF1 은 원하는 단백질 PROT1, 특히 원하는 효소 PROT1 을 코딩하는 핵산 서열이고,
- Term1 은 전사 복합체로부터 mRNA 를 방출하는 과정을 촉발하는 새롭게 합성된 mRNA 에 신호를 제공함으로써 전사 종결을 매개하는 전사 터미네이터 서열이고,
- "1", "2", .../... "n"은 동일한 ORF (개방 판독 프레임), 프로모터 또는 터미네이터를 기재할 수 있거나 기재하지 않을 수 있다. 핵산 서열의 순서는 중요하지 않다. "n" 은 통상 5 내지 20 범위의 정수이다. 이들 구축물은 제어된 위치에서 재조합 세포 염색체 중 하나에 삽입된다. 일부 구현예에서, 삽입 위치는 삽입된 구축물의 기능성에 필수적이지도 않고, 생성된 유전적으로 변형된 세포의 생존력에 필수적이지도 않다.
당업자에 의해 이해되는 바와 같이, 코딩 서열을 변형하여 특정 숙주에서 그의 발현을 향상시키는 것이 유리할 수 있다. 유전자 코드는 64 개의 가능한 코돈과 중복되지만, 대부분의 유기체는 전형적으로 이들 코돈의 하위세트를 사용한다. 한 종에서 가장 자주 사용되는 코돈을 최적 코돈이라고 하며, 매우 자주 사용되지 않는 코돈을 희귀 또는 저사용량 코돈으로 분류한다. 코돈은 때때로 "코돈 최적화" 또는 "종 코돈 편향에 대한 제어" 라고 불리는 공정에서, 숙주의 바람직한 코돈 용법을 반영하도록 치환될 수 있다. 다른 숙주 세포에 대한 코돈 최적화는 코돈 용법 표를 사용하여 쉽게 결정될 수 있거나, Integrated DNA Technologies 로부터의 CodonOp (www.idtdna.com/CodonOptfrom) 와 같은 상업적으로 이용가능한 소프트웨어를 사용하여 수행될 수 있다. 특정 원핵 또는 진핵 숙주에 의해 바람직한 코돈을 함유하는 최적화된 코딩 서열 (Murray et al, 1989 , Nucl Acids Res. 17: 477-508) 은, 예를 들어, 비-최적화된 서열로부터 생성된 전사체와 비교하여, 번역의 속도를 증가시키거나 더 긴 반감기와 같은 바람직한 특성을 갖는 재조합 RNA 전사체를 생성하도록 제조될 수 있다. 번역 중지 코돈은 또한 숙주 선호도를 반영하도록 변형될 수 있다. 예를 들어, S. 세레비지에 (S. cerevisiae) 및 포유동물에 대한 전형적인 중지 코돈은 각각 UAA 및 UGA 이다. 단자엽 식물에 대한 전형적인 중지 코돈은 UGA 인 반면, 곤충 및 대장균은 중지 코돈으로서 UAA 를 통상적으로 사용한다 (Dalphin et al., 1996, Nucl Acids Res. 24: 216-8).
- 재조합 세포가 효모 세포이고, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 효모 세포인 경우, 효모 게놈에 도입되고 사카로마이세스 세레비지에 이외의 다른 유기체로부터 기원하는 핵산 서열은 일반적으로 "트랜스코딩" (일반적으로 "코돈-최적화") 되며, 이는 이들 핵산 서열이 S. 세레비지에 (S. cerevisiae) 에서의 발현을 위한 최적의 코돈 용법으로 합성된다는 것을 의미한다. S. 세레비지에로부터의 일부 핵산 서열의 뉴클레오티드 서열 (및 단백질 서열이 아님) 은 또한 상기 유전자의 내인성 카피와의 재조합을 최소화하기 위해 변형 ("트랜스코딩") 되었다.
- 유전자는 세포 유전 공학에 사용되는 표준 절차를 통해 결실될 수 있다. 일부 구현예에서, 결실을 위해 표적화된 유전자는 상기 기재된 유전자 구축물 중 하나의 삽입에 의해 중단될 수 있거나, 대안적으로 결실을 위해 표적화된 유전자는 뉴클레오티드의 짧은 스트레치에 의해 대체된다.
- 핵산 서열은 핵산 서열의 내인성 카피를 결실시키고 (필요한 경우) 유도성 또는 억제성 프로모터의 조절 하에 ORF 의 새로운 카피를 배치함으로써 "유도성 또는 억제성" 이 될 수 있다. 유도성 또는 억제성 프로모터는 환경 조건 또는 외부 자극의 변화시 활성이 조절되거나 제어되는, 즉 증가 또는 감소되는 프로모터이다. 유도 또는 억제는 인위적으로 제어될 수 있으며, 이는 세포, 특히 효모에서 자연적으로 발견되지 않는 관심 대상의 화학적 화합물, 빛, 산소 수준, 열 또는 냉감과 같은 비생물학적 인자에 의한 유도 또는 억제를 포함한다. 유도성 또는 억제성 프로모터의 목록 및 서열은 본 명세서의 다른 곳에 기재되어 있다.
본 발명에 따른 재조합 세포
본 발명자는 콘드로이틴을 생산하는 능력을 갖는 재조합 세포, 특히 재조합 효모를 구상하였다.
본 발명은 콘드로이틴을 생산하는 능력을 갖는 재조합 세포, 특히 재조합 효모에 관한 것이며, 여기서 콘드로이틴을 생산하는 이러한 능력은 유전 공학 방법에 의해 그의 게놈에 도입된 다수의 변경을 통해 수득된다.
본 발명은 콘드로이틴을 생산하는 재조합 효모 세포에 관한 것이며, 여기서 재조합 세포는 하기를 포함한다:
(a) 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산;
(b) UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산; 및
(c) UDP-글루코오스-4-에피머라아제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산.
본 발명은 또한 콘드로이틴을 생산하는 재조합 숙주 세포에 관한 것이며, 여기서 재조합 숙주 세포는 하기를 포함한다:
(a) 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산;
(b) UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산;
(c) UDP-글루코오스-4-에피머라아제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산; 및
(d) 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산으로서, 콘드로이티나아제 활성을 갖는 폴리펩티드는 분비 신호를 포함하고, 임의로는 고정 신호를 포함하여, 콘드로이틴, 특히 원하는 분자량이 숙주 세포에 의해 생산되는 하나 이상의 재조합 핵산.
본 발명자들은 세포에 의해, 특히 효모 세포에 의해 콘드로이틴을 생산하는 능력이 이들 세포의 게놈에 복수의 유전적 변경을 도입함으로써 달성될 수 있다는 것을 발견하였다.
본 발명의 세포, 특히 본 발명의 효모 세포에 의한 콘드로이틴의 생산은 UDP-글루코오스 및 UDP-N-아세틸-글루코사민의 내인성 대사를 최적화함으로써 달성되어 왔고, 후속적인 인공적으로 변형된 대사 경로를 주로 콘드로이틴 생산으로 유도하면서, 동시에 생성된 유전적으로 변형된 세포의 최적 생존력을 유지한다.
본 발명에 따른 재조합 세포에 의한 콘드로이틴 생산은 글루코오스-6-포스페이트의 연속 중간 대사산물 (i) 글루코오스-1-포스페이트, UDP-글루코오스, UDP-글루쿠로네이트 및 콘드로이틴 또는 (ii) 프룩토오스-6-포스페이트, 글루코사민-6-포스페이트, N-아세틸-글루코사민-6-포스페이트, N-아세틸-글루코사민-1-포스페이트, UDP-N-아세틸-글루코사민, UDP-N-아세틸-갈락토사민 및 콘드로이틴으로의 전환을 증가시키면서, 생성된 재조합 세포의 양호한 생존력을 허용하는 대사 균형을 유지함으로써 증가될 수 있는 것으로 결정되었다.
실제로, 본 발명의 생존가능한 재조합 세포를 수득하기 위해, 생존가능하고 효율적인 재조합 세포, 및 특히 생존가능한 재조합 효모를 수득하기 위해 많은 상이한 구축물을 시험하였다. 특히, 이러한 재조합 효모는 일부 중간체의 일시적인 축적이 효모에 대해 독성을 나타낸 것으로 나타났기 때문에 수득하기 어려웠다.
콘드로이틴을 생산할 수 있는 재조합 세포의 제조, 특히 분자량이 제어된 콘드로이틴을 생산하기에 적합한 조건을 확립하는데 예상치 못한 기술적 어려움이 있었다.
실제로, 많은 연구 및 실험 시험 후, 본 발명자들은 하기 매개변수를 사용하여 제어된 분자량을 갖는 콘드로이틴을 생산할 수 있는 재조합 세포, 및 특히 재조합 효모 세포, 보다 특히 재조합 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 효모 세포를 배양할 수 있다는 것을 발견하였다:
- 본 발명의 재조합 세포, 특히 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 핵산 서열의 성질 및 기원의 선택; 및/또는
- 본 발명의 재조합 세포, 특히 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 핵산 서열의 발현을 제어하는 프로모터의 성질 및 기원; 및/또는
- 본 발명에 따른 재조합 세포, 특히 재조합 효모의 콘드로이티나아제 활성을 갖는 코딩된 폴리펩티드와 관련된 분비 신호에 추가로, 고정 신호의 선택적 존재; 및/또는
- 본 발명에 따른 재조합 세포, 특히 재조합 효모를 배양하는 단계 동안 배양 배지의 pH; 및/또는
- 본 발명에 따른 재조합 세포, 특히 재조합 효모의 배양 지속기간.
발명자들의 지식에 따르면, 이는 이전에는 결코 달성된 적이 없다.
본 발명의 재조합 세포에서 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 핵산은 큐피엔니우스 살레이 (Cupiennius salei), 티티우스 세르룰라투스 (Tityus serrulatus), 보스 타우루스 (Bos taurus), 베스파 마그니피카 (Vespa magnifica), 마카카 물라타 (Macaca mulata) 또는 아피스 멜리페라 (Apis mellifera) 중 적어도 하나로부터, 바람직하게는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 수득되거나 유래될 수 있다.
콘드로이틴의 분자량은 50kDa 미만의 범위, 바람직하게는 약 20kDa 내지 약 50kDa 의 범위일 수 있다.
대안적으로, 콘드로이틴의 분자량은 50kDa 초과의 범위, 바람직하게는 약 50kDa 내지 약 250kDa 의 범위일 수 있다.
또 다른 대안에서, 콘드로이틴의 분자량은 100kDa 초과의 범위, 바람직하게는 약 100kDa 내지 약 1500kDa 의 범위일 수 있다.
UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 핵산은 아라비돕시스 탈리아나 (Arabidopsis thaliana), 클로렐라 바이러스 PBCV1 또는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 중 적어도 하나로부터 수득되거나 유래할 수 있고, 특히 아라비돕시스 탈리아나 (Arabidopsis thaliana) 또는 클로렐라 바이러스 PBCV1 로부터 수득되거나 유래할 수 있다.
콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 핵산은 하기일 수 있다
(i) 콘드로이틴 신타아제를 코딩하는 핵산; 또는
(ii) 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드를 코딩하는 핵산
핵산은 파스튜렐라 물토시다 (Pasteurella multocida), 클로렐라 바이러스 (Chlorella virus) PBCV1, 마이코박테리움 튜베르쿨로시스 (Mycobacterium tuberculosis), 호모 사피엔스 (Homo sapiens), 에스케리키아 콜라이 (Escherichia coli), 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 또는 페니실룸 옥살리쿰 (Penicillium oxalicum) 중 적어도 하나로부터 수득되거나 유래될 수 있다.
UDP-글루코오스-4-에피머라제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 핵산은 박테리아, 특히 슈도모나스 아에루기노사 (Pseudomonas aeruginosa), 파스튜렐라 물토시다 (Pasteurella multocida), 및 에스케리키아 콜라이 (Escherichia coli) 로 이루어진 군으로부터 선택되는 박테리아로부터 수득되거나 유래될 수 있다.
재조합 세포는 하기 중 하나 이상을 코딩하는 적어도 하나의 재조합 핵산을 추가로 포함할 수 있다:
(i) 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 활성을 갖는 폴리펩티드; 및/또는
(ii) UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 활성을 갖는 폴리펩티드.
재조합 세포는 하기 중 하나 이상을 코딩하는 적어도 하나의 재조합 핵산을 추가로 포함할 수 있다:
(i) 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드; 및/또는
(ii) UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 활성을 갖는 폴리펩티드; 및/또는
(iii) 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드; 및/또는
(iv) 포스포아세틸글루코사민 뮤타아제 (PCM1) 활성을 갖는 폴리펩티드.
재조합 세포의 특정 구현예에서,
- 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
- 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드를 코딩하는 핵산; 및/또는
- 포스포아세틸글루코사민 뮤타아제 (PCM1) 를 갖는 폴리펩티드를 코딩하는 핵산
이 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되거나 유래한다.
특정 구현예에서, 재조합 숙주 세포는 효모이다.
특히, 재조합 세포는 사카로마이세스 (Saccharomyces) 속, 또는 칸디다 (Candida) 속, 또는 클루이베로마이세스 (Kluyveromyces) 속, 또는 오가타에아 (Ogataea) 속, 또는 야로위아 (Yarrowia) 속, 또는 데바리오마이세스 (Debaryomyces) 속, 또는 아쉬비아 (Ashbya) 속에 속하고, 특히 사카로마이세스 속에 속한다.
특히, 재조합 세포는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae), 사카로마이세스 보울라르디이 (Saccharomyces boulardii), 사카로마이세스 바야누스 (Saccharomyces bayanus), 사카로마이세스 파라독수스 (Saccharomyces paradoxus), 사카로마이세스 미카타에 (Saccharomyces mikatae), 사카로마이세스 카스텔리 (Saccharomyces castelli), 칸디다 알비칸스 (Candida albicans), 칸디다 글라브라타 (Candida glabrata), 칸디다 트로피칼리스 (Candida tropicalis), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 클루이베로마이세스 폴리스포루스 (Kluyveromyces polysporus), 클루이베로마이세스 테르모톨레렌스 (Kluyveromyces thermotolerens), 오가타에아 폴리모르파 (Ogataea polymorpha), 야로위아 리폴리티카 (Yarrowia lypolytica), 데바리오마이세스 한세니이 (Debaryomyces hansenii) 및 아쉬비아 고시피이 (Ashbya gossypii) 로 이루어지는 군에서 선택되고, 바람직하게는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 이다.
본 발명의 또 다른 목적은 하기 단계를 포함하는 원하는 분자량의 콘드로이틴의 생산 방법에 관한 것이다:
(a) 본원에서 정의된 바와 같은 재조합 세포를 원하는 분자량의 콘드로이틴을 생산하기에 충분한 시간 동안 배양 배지에서 배양하는 단계; 및
(b) 임의로는 재조합 세포 및/또는 배양 배지로부터 콘드로이틴을 단리하거나 회수하는 단계.
본 방법에서, 콘드로이틴은 약 20 kDa 내지 약 50 kDa 의 분자량을 가질 수 있다.
또다른 구현예에서, 콘드로이틴은 약 50 kDa 내지 약 150 kDa 의 분자량을 가질 수 있다.
또다른 구현예에서, 콘드로이틴은 약 150 kDa 내지 약 1500 kDa 의 분자량을 가질 수 있다.
본 발명의 방법에서, 재조합 세포는 사카로마이세스 속에 속하는 효모일 수 있고, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 일 수 있다.
원하는 분자량의 콘드로이틴을 생산하기에 충분한 시간은 약 35 시간 내지 약 50 시간, 바람직하게는 약 40 시간 내지 약 50 시간의 기간일 수 있고, 바람직하게는 약 48 시간일 수 있다.
특정 구현예에서, 생산된 콘드로이틴의 분자량은 단계 (a) 동안 배양 배지의 pH 를 조절함으로써 제어될 수 있다.
구현예에서, 방법이 산업적 규모로 실행되고, 바람직하게는 배양 배지가 적어도 약 100L 이고, 더욱 바람직하게는 약 1,000L 내지 약 3,000L 범위이고, 더욱 더 바람직하게는 약 10,000L 이거나, 더욱 더 바람직하게는 약 100,000L 이거나, 심지어 약 250,000L 이다.
본 발명의 또 다른 목적은 본 발명의 재조합 세포로부터, 또는 본 발명에 따른 방법으로부터 수득되는 콘드로이틴에 관한 것이다.
본 발명은 또한 본 발명의 콘드로이틴을 포함하는 배양 배지에 관한 것이다.
본 발명의 또다른 양상은 본 발명의 콘드로이틴을 포함하는 조성물이다.
본 발명은 또한 (i) 본 발명에 따른 분자량을 갖는 콘드로이틴, (ii) 본 발명에 따른 배양 배지 또는 (iii) 본 발명에 따른 조성물을 포함하는 공산품 또는 소비재 또는 소모품에 관한 것이다.
특히, 공산품 또는 소비재 또는 소모품은 화장품, 향미 제품, 향료 제품, 식료품, 식품, 음료, 식감제, 약학 조성물, 식이 보충제, 기능식품, 세정 제품, 치아 및/또는 구강 위생 조성물일 수 있다.
본 발명은 또한 약 20kDa 내지 약 50kDa 또는 약 50kDa 내지 약 1000kDa 범위의 분자량을 갖는 콘드로이틴의 생산을 위한 본 발명의 재조합 세포의 용도에 관한 것이다.
본 발명의 또다른 목적은 하기의 단계:
(a) 본원에서 정의된 바와 같은 재조합 효모를 배양 배지에서 배양하는 단계; 및
(b) 상기 배양 배지로부터 콘드로이틴을 회수하는 단계
를 포함하는 콘드로이틴의 생산 방법으로서,
여기서, 단계 (b) 에서 회수된 콘드로이틴은,
- 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산의 성질 및 기원,
- 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산의 발현을 제어하는 프로모터의 성질 및 기원,
- 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드와 관련된 고정 및/또는 분비 신호의 존재,
- 재조합 효모를 배양하는 단계 동안 배양 배지의 pH, 및/또는
- 재조합 효모의 배양 지속기간
의 선별을 통해 제어된 분자량을 갖는 생산 방법에 관한 것이다.
또한, 본 발명은 콘드로이틴-생산 재조합 효모에 관한 것이며, 재조합 효모는 하기를 포함한다:
- (A) 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산,
- (B) UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산,
- (C) UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산.
- (D) 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산, 및
- (E) UDP-글루코오스-4-에피머라아제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산, 상기 재조합 효모는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 임.
특정 구현예에서, 본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 (F) 콘드로이티나제 활성을 갖는 폴리펩티드를 코딩하는 하나의 핵산을 추가로 포함하며, 여기서 콘드로이티나제 활성을 갖는 폴리펩티드를 코딩하는 핵산은 콘드로이틴, 특히 원하는 분자량의 콘드로이틴이 숙주 세포에 의해 생성되도록 고정 신호 및/또는 분비 신호를 포함한다.
특정 구현예에서, 본 발명에 따른 재조합 세포, 특히 재조합 효모는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 활성을 갖는 폴리펩티드를 코딩하는 오직 하나의 재조합 핵산을 포함한다.
특정 구현예에서, 본 발명에 따른 재조합 세포, 특히 재조합 효모는 UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 활성을 갖는 폴리펩티드를 코딩하는 1 과 10 사이, 바람직하게는 2 와 8 사이의 재조합 핵산을 포함한다.
특정 구현예에서, 본 발명에 따른 재조합 세포, 특히 재조합 효모는 UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 1 과 5 사이의 재조합 핵산을 포함한다.
또다른 구현예에서, UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 를 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 아라비돕시스 탈리아나 (Arabidopsis thaliana), 클로렐라 바이러스 PBCV1 또는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 중 적어도 하나로부터 수득되거나 유래하고, 특히 클로렐라 바이러스 PBCV1 또는 아라비돕시스 탈리아나 (Arabidopsis thaliana) 로부터 수득되거나 유래한다.
또다른 구현예에서, 본 발명에 따른 재조합 세포, 특히 재조합 효모는 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 1 과 5 사이의 재조합 핵산을 포함한다.
특정 구현예에서, 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 핵산은 파스튜렐라 물토시다 (Pasteurella multocida), 클로렐라 바이러스 (Chlorella virus) PBCV1, 마이코박테리움 튜베르쿨로시스 (Mycobacterium tuberculosis), 호모 사피엔스 (Homo sapiens), 에스케리키아 콜라이 (Escherichia coli), 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 또는 페니실룸 옥살리쿰 (Penicillium oxalicum) 중 적어도 하나로부터 수득되거나 유래한다.
또다른 구현예에서, 본 발명에 따른 재조합 세포, 특히 재조합 효모는 UDP-글루코오스-4-에피머라아제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 1 과 5 사이의 재조합 핵산을 포함한다.
특정 구현예에서, UDP-글루코오스-4-에피머라제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 핵산은 슈도모나스 아에루기노사 (Pseudomonas aeruginosa), 파스퇴렐라 물토시다 (Pasteurella multocida) 및 에스케리키아 콜라이 (Escherichia coli) 중 적어도 하나로부터 수득되거나 유래한다.
특정 구현예에서, 본 발명에 따른 재조합 세포, 특히 재조합 효모는 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 오직 하나의 재조합 핵산을 포함한다.
또다른 구현예에서, 콘드로이티나제 활성을 갖는 폴리펩티드를 인코딩하는 하나 이상의 재조합 핵산은 큐피엔니우스 살레이 (Cupiennius salei), 티티우스 세르룰라투스 (Tityus serrulatus), 보스 타우루스 (Bos taurus), 아피스 멜리페라 (Apis mellifera), 마카카 물라타 (Macaca mulata), 또는 베스파 마그니피카 (Vespa magnifica) 중 적어도 하나로부터 수득되거나 유래한다.
또다른 구현예에서, 본 발명에 따른 재조합 세포, 특히 재조합 효모 세포는 하나 이상의 하기를 코딩하는 적어도 하나의 재조합 핵산을 포함할 수 있다:
(A) 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드, 및/또는
(B) UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 활성을 갖는 폴리펩티드, 및/또는
(C) 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드, 및/또는
(D) 포스포아세틸글루코사민 뮤타아제 (PCM1) 활성을 갖는 폴리펩티드.
특히, 본 발명에 따른 재조합 세포, 특히 본 발명의 재조합 효모 세포는 적어도 2 개, 특히 적어도 3 개, 및 더욱 특히 상기 나타낸 모든 변형을 포함한다.
특정 구현예에서, 포스포글루코뮤타제-1 (PGM1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산, UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라제 (UGP1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산, 글루타민-프룩토스-6-포스페이트 아미도트랜스퍼라제 (GFA1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산, 글루코사민-6-포스페이트 N-아세틸트랜스퍼라제 (GNA1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산, 포스포아세틸글루코사민 뮤타아제 (PCM1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 및 UDP-N-아세틸글루코사민 피로포스포릴라제 (QRI1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산은 효모, 바람직하게는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되는 또는 유래되는 재조합 핵산이다.
특정 구현예에서, 상기 정의되고 본 발명에 따른 재조합 세포에 포함된 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산, 특히 본 발명의 재조합 효모는 pPDC1, pTDH3, pTDH3.Sk, pTDH3-1.Sba, pCCW12, pCCW120.Sm , pTEF1, pENO2 pTEF1.Ago, 및 pTEF1.Sba 로 이루어진 군으로부터 선택된 프로모터의 제어 하에 있다.
특정 구현예에서, 본 명세서에 언급된 유도성 또는 억제성 프로모터는 구리로 유도성 또는 억제성 프로모터 또는 메티오닌으로 유도성 또는 억제성 프로모터, 특히 pCUP1 로 구성된 군으로부터 선택된다.
특정 구현예에서, 재조합 핵산은 프로모터 pCWP2 의 제어 하에 있다.
본 발명의 또다른 목적은 하기의 단계를 포함하는, 콘드로이틴의 생산 방법에 관한 것이다:
(a) 본 발명에 따른 재조합 세포, 및 특히 본 명세서에 정의된 바와 같은 재조합 효모를 배양 배지에서 배양하는 단계; 및
(b) 상기 배양 배지로부터 콘드로이틴을 회수하는 단계.
특정 구현예에서, 단계 (b) 에서 회수된 콘드로이틴은 하기의 선택을 통해 제어된 미리 결정된 분자량을 갖는다:
- 재조합 세포, 및 특히 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산의 성질 및 기원,
- 재조합 세포, 및 특히 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산의 발현을 통제하는 프로모터의 성질 및 기원,
- 재조합 세포, 및 특히 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산과 연관된 고정 또는 분비 신호의 존재,
- 재조합 세포, 및 특히 재조합 효모를 배양하는 단계 동안 배양 배지의 pH, 및/또는
- 재조합 세포, 및 특히 재조합 효모의 배양 지속기간.
특정 구현예에서, 본 발명의 방법은 분자량이 엄격하게 50 kDa 이하, 특히 엄격하게 50 kDa 이하이고 20 kDa 이상인 콘드로이틴을 생산하기 위한 것이며, 여기서 (c) 배양 배지로부터 콘드로이틴을 회수하는 단계는 재조합 세포, 특히 재조합 효모의 배양을 시작한 후 48 시간에 수행된다.
또다른 구현예에서, 본 발명의 방법은 분자량이 엄격하게 50 kDa 이하이고 1000 kDa 이상인 콘드로이틴을 생산하기 위한 것이며, 여기서 (c) 배양 배지로부터 콘드로이틴을 회수하는 단계는 재조합 효모의 배양을 시작한 후 48 시간에 수행된다.
또다른 구현예에서, 본 발명의 방법은 분자량이 엄격하게 1000 kDa 이상, 특히 엄격하게 1000 kDa 이상과 1.5 Million kDa 사이인 콘드로이틴을 생산하기 위한 것이며, 여기서 (c) 배양 배지로부터 콘드로이틴을 회수하는 단계는 재조합 세포, 특히 재조합 효모의 배양을 시작한 후 48 시간에 수행된다.
특히, 배양 배지는 적어도 탄소 공급원, 바람직하게는 글루코오스 및 수크로스로 이루어진 군으로부터 선택되는 탄소 공급원을 포함한다.
본 발명의 또다른 목적은 또한 콘드로이틴, 특히 제어된 분자량의 콘드로이틴의 생산을 위한, 본원에 정의된 바와 같은 본 발명의 재조합 세포, 특히 재조합 효모의 용도에 관한 것이다.
콘드로이틴 신타아제 활성 (HCOS) 을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명의 재조합 효모는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함한다.
본 발명에 따른 콘드로이틴 신타아제 활성을 갖는 폴리펩타이드는 중간체 대사물질 UDP-글루코로네이트 및 UDP-N-아세틸-갈락토사민을 콘드로이틴 ((β-D-1,3-GalNAc-β-D-1,4-GlcA)n) 으로 전환시키는 폴리펩티드를 의미한다.
일부 구현예에서, 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산은 유도성 또는 억제성 프로모터의 제어 하에 있을 수 있다.
콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 pTDH3-1.Sba 또는 pTDH3.Sar 프로모터의 제어 하에 있을 수 있다.
콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 상기 하나 이상의 재조합 핵산은 하기일 수 있다:
(i) 콘드로이틴 신타아제를 코딩하는 핵산; 또는
(ii) 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드를 코딩하는 핵산.
콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산은 파스튜렐라 물토시다 (Pasteurella multocida), 클로렐라 바이러스 (Chlorella virus) PBCV1, 마이코박테리움 튜베르쿨로시스 (Mycobacterium tuberculosis), 호모 사피엔스 (Homo sapiens), 에스케리키아 콜라이 (Escherichia coli), 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 또는 페니실룸 옥살리쿰 (Penicillium oxalicum) 중 적어도 하나로부터 수득되거나 유래될 수 있다;
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나의 재조합 핵산을 포함할 수 있다.
예시적으로, 콘드로이틴 신타아제 유전자는 본원의 실시예에 나타낸 바와 같이, JLP1 유전자 내에 및/또는 SAM3 유전자 내에 삽입될 수 있다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모는 하기를 포함한다:
- 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나의 재조합 핵산;
- 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 상기 하나의 재조합 핵산은 파스튜렐라 물토시다 (Pasteurella multocida), 클로렐라 바이러스 (Chlorella virus) PBCV1, 마이코박테리움 튜베르쿨로시스 (Mycobacterium tuberculosis), 호모 사피엔스 (Homo sapiens), 에스케리키아 콜라이 (Escherichia coli), 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 또는 페니실룸 옥살리쿰 (Penicillium oxalicum) 중 적어도 하나로부터 수득되거나 유래될 수 있음;
- 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 상기 하나의 재조합 핵산은 유도성 또는 억제성 프로모터의 제어 하에 및/또는 pTDH3-1.Sba 또는 pTDH3.Sar 프로모터의 제어 하에 있다.
UDP-글루코오스 탈수소효소 활성 (HASB) 을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함한다.
본 발명에 따른 UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드는 중간 대사산물 우리딘-디포스페이트-글루코오스 (UDP-글루코오스) 를 UDP-글루쿠로네이트로 전환시키는 폴리펩티드를 의미한다.
UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 pTEF1.sba, pCCW12 및 pTDH3.Sk 로 이루어지는 군에서 선택되는 프로모터의 제어 하에 있을 수 있다.
UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 아라비돕시스 탈리아나 (Arabidopsis thaliana), 클로렐라 바이러스 PBCV1 또는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 중 적어도 하나로부터, 특히 아라비돕시스 탈리아나 (Arabidopsis thaliana) 또는 클로렐라 바이러스 PBCV1 중 적어도 하나로부터 수득되거나 유래될 수 있다.
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 1 에서 5 개 사이의 재조합 핵산을 포함할 수 있다.
예시적으로, UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에 나타낸 바와 같이 재조합 세포, 특히 재조합 효모의 JLP1 유전자 및/또는 SAM3 유전자 내에 삽입될 수 있다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모는 하기를 포함한다:
- UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 1 에서 5 개 사이의 재조합 핵산;
- 상기 UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산은 아라비돕시스 탈리아나 (Arabidopsis thaliana), 클로렐라 바이러스 PBCV1 또는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 중 적어도 하나로부터, 특히 아라비돕시스 탈리아나 (Arabidopsis thaliana) 또는 클로렐라 바이러스 PBCV1 중 적어도 하나로부터 수득되거나 유래될 수 있음.
- 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 있는 및/또는 pTEF1.sba, pCCW12 및 pTDH3.Sk 로 이루어지는 군에서 선택되는 프로모터의 제어 하에 있는 상기 UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산.
UDP-글루코오스-4-에피머라아제 활성 (kfoA 또는 GNE1) 을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 UDP-글루코오스-4-에피머라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함한다.
본 발명에 따른 UDP-글루코오스-4-에피머라아제 활성을 갖는 폴리펩티드는 중간체 대사물질 UDP-N-아세틸-글루코사민을 UDP-N-아세틸-갈락토사민으로 전환시키는 폴리펩티드를 의미한다.
일 구현예에서, UDP-글루코오스-4-에피머라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 pCCW12 또는 pCCW120.Sm 으로 이루어지는 군에서 선택되는 프로모터의 제어 하에 있을 수 있다.
UDP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 박테리아, 특히 슈도모나스 아에루기노사 (Pseudomonas aeruginosa), 파스튜렐라 물토시다 (Pasteurella multocida), 및 에스케리키아 콜라이 (Escherichia coli) 로 이루어진 군으로부터 선택되는 박테리아로부터 수득되거나 유래될 수 있다.
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 UDP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 1 에서 5 개 사이의 재조합 핵산을 포함할 수 있다.
예시적으로, UDP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에 나타낸 바와 같이 재조합 세포, 특히 재조합 효모의 JLP1 유전자 및/또는 SAM3 유전자 내에 삽입될 수 있다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모 세포는 하기를 포함한다:
- UDP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 1 에서 5 개 사이의 재조합 핵산;
- 슈도모나스 아에루기노사 (Pseudomonas aeruginosa), 파스퇴렐라 물토시다 (Pasteurella multocida) 및 에스케리키아 콜라이 (Escherichia coli) 로 이루어진 군으로부터 유래되는 또는 수득되는 상기 UDP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산;
- 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 있는 및/또는 pCCW12 또는 pCCW120.Sm 으로 이루어지는 군에서 선택되는 프로모터의 제어 하에 있는 상기 UDP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산.
콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함한다.
본 발명에 따른 콘드로이티나아제 활성을 갖는 폴리펩티드는 콘드로이틴을 분해하는, 즉 주어진 분자량의 콘드로이틴을 더 낮은 분자량의 콘드로이틴으로 전환시키는 폴리펩티드를 의미한다.
본 발명에 따른 콘드로이티나아제 활성을 갖는 폴리펩티드는 히알루로노글루코사미니다제, 예컨대 콘드로이티나아제 또는 히알루로니다아제를 포함할 수 있다.
이전에 나타낸 바와 같이, 본 발명의 콘드로이티나아제 활성을 갖는 폴리펩티드는 분비 신호를 포함한다.
한 구현예에서, 콘드로이티나아제 활성을 갖는 폴리펩티드는 분비 신호 및 고정 신호 둘 모두를 포함한다.
한 구현예에서, 상기 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 있다.
콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 pTEF1, pCCW12, pCCW12.sba, pCCW12.Sar, pPDC1, pTEF3, pTDH3, pNUP57 및 pCCW10.ago 로 이루어지는 군에서 선택되는 프로모터, 특히 pCCW12.Sba 프로모터의 제어 하에 있을 수 있다.
상기 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 큐피엔니우스 살레이 (Csa), 티티우스 세르룰라투스 (Ts), 보스 타우루스 (Bt), 아피스 멜리페라 (Am), 마카카 물라타 (Mm), 또는 베스파 마그니피카 (Vm) 중 적어도 하나로부터, 특히 티티우스 세르룰라투스 (Ts) 로부터 수득되거나 유래한다.
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 콘드로이티나제 활성을 갖는 폴리펩티드를 코딩하는 단 하나의 재조합 핵산을 포함할 수 있다.
예시적으로, 콘드로이티나제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 JLP1 유전자 내에 및/또는 LYP1 유전자 내에 및/또는 LEU2 유전자 내에, 특히 LEU2 유전자 내에 삽입될 수 있다.
바람직한 구현예에서, 콘드로이티나제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산은 히알루로니다아제를 코딩하는 재조합 핵산이다. 특히, 콘드로이티나아제 활성을 갖는 폴리펩티드는 히알루로니다아제이다.
콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산과 관련되는 상기 모든 특징은 히알루로니다아제를 코딩하는 재조합 핵산에 적용된다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모는 하기를 포함한다:
- 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 단 하나의 재조합 핵산;
- 상기 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산은 큐피엔니우스 살레이 (Csa), 티티우스 세르룰라투스 (Ts), 보스 타우루스 (Bt), 아피스 멜리페라 (Am), 마카카 물라타 (Mm), 또는 베스파 마그니피카 (Vm) 중 적어도 하나로부터, 특히 티티우스 세르룰라투스 (Ts) 로부터 유래되거나 수득된다.
- (i) 분비 신호 및 고정 신호 없음 또는 (ii) 분비 신호 및 고정 신호를 포함하는 상기 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산;
- 상기 콘드로이티나아제를 갖는 폴리펩티드는 히알루로니다아제이고,
- 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 있는 및/또는 pTEF1, pCCW12, pCCW12.sba, pCCW12.Sar, pPDC1, pTEF3, pTDH3, pNUP57 및 pCCW10.ago 로 이루어지는 군에서 선택되는 프로모터, 특히 pCCW12.Sba 프로모터의 제어 하에 있는 상기 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산.
글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성 (GFA1) 을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모 세포는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 오직 하나의 재조합 핵산을 포함할 수 있다.
본 발명에 따른 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드는 프룩토오스-6-포스페이트를 글루코사민-6-포스페이트로 전환시키는 폴리펩티드를 의미한다.
한 구현예에서, 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 있다.
글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 pTEF1.Ago 프로모터의 제어 하에 있을 수 있다.
상기 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에서 나타낸 바와 같이 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되거나 유래할 수 있다.
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모 세포는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 오직 하나의 재조합 핵산을 포함할 수 있다.
예시적으로, 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에서 나타낸 바와 같이 재조합 세포, 특히 재조합 효모 세포의 JLP1 유전자 내에 삽입될 수 있다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모 세포는 하기를 포함한다:
- 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 오직 하나의 재조합 핵산;
- 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래되는 상기 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산; 및
- pTEF1.Ago 프로모터의 제어 하에 있는 상기 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산.
UDP-N-아세틸글루코사민 피로포스포릴라아제 활성 (QRI1) 을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모 세포는 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함할 수 있다.
본 발명에 따른 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드는 N-아세틸-글루코사민을 UDP-N-아세틸-글루코사민으로 전환시키는 폴리펩티드를 의미한다.
한 구현예에서, UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터, 예를 들어 유도성 또는 억제성 프로모터 pMET6 또는 pCUP1 의 제어 하에 있다.
UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 프로모터 pTDH3-1.Sba 또는 pTDH3 의 제어 하에 있을 수 있다.
상기 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에서 나타낸 바와 같이 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되거나 유래될 수 있다.
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 UDP-N-아세틸글루코사민 피로포스포릴라제 활성을 갖는 폴리펩티드를 코딩하는 1 과 10 개 사이의 재조합 핵산을 포함할 수 있고, 특히 UDP-N-아세틸글루코사민 피로포스포릴라제 활성을 갖는 폴리펩티드를 코딩하는 2 와 8 개 사이의 재조합 핵산을 포함할 수 있고, 예를 들어 UDP-N-아세틸글루코사민 피로포스포릴라제 활성을 갖는 폴리펩티드를 코딩하는 2, 6 또는 7 개의 재조합 핵산을 포함할 수 있다.
예시적으로, UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에서 나타낸 바와 같이 재조합 세포, 특히 재조합 효모의 HIS3 유전자 내에 및/또는 MET14 유전자 내에 및/또는 JLP1 유전자 내에 삽입될 수 있다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모 세포는 하기를 포함한다:
- UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 2 와 8 개 사이의 재조합 핵산;
- 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래되는 상기 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산;
- 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터, 예를 들어 유도성 또는 억제성 프로모터 pMET6 또는 pCUP1 의 제어 하에 있고/있거나 프로모터 pTDH3-1.Sba 또는 pTDH3 의 제어 하에 있는 상기 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산.
포스포글루코뮤타아제-1 활성 (PGM1) 을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모 세포는 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함할 수 있다.
본 발명에 따른 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드는 글루코오스-6-포스페이트를 중간 대사산물 글루코오스-1-포스페이트로 전환시키는 폴리펩티드를 의미한다.
한 구현예에서, 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 있다.
포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 프로모터 pTDH3 의 제어 하에 있을 수 있다.
포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에서 나타낸 바와 같이 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되거나 유래할 수 있다.
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모 세포는 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드를 코딩하는 단 하나의 재조합 핵산을 포함할 수 있다.
예시적으로, 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 재조합 세포, 특히 재조합 효모의 MET14 유전자 내에 삽입될 수 있다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모는 하기를 포함한다:
- 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 단 하나의 재조합 핵산;
- 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래하는 상기 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산; 및
- 상기 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산은 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 및/또는 프로모터 pTDH3 의 하에 있음.
UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성 (UGP1) 을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모 세포는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함한다.
본 발명에 따른 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 활성을 갖는 폴리펩티드는 중간 대사산물 글루코오스-1-포스페이트를 중간 대사산물 UDP-글루코오스로 전환시키는 폴리펩티드를 의미한다.
한 구현예에서, UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터, 예를 들어 유도성 또는 억제성 프로모터 pSAM1 또는 pCUP1 의 제어 하에 있다.
UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 pFBA1, pENO2 또는 pPDC1 프로모터의 제어 하에 있을 수 있다.
UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에서 나타낸 바와 같이 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되거나 유래될 수 있다.
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모 세포는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 1 과 10 개 사이의 재조합 핵산을 포함할 수 있고, 특히 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 2 와 8 개 사이의 재조합 핵산을 포함할 수 있고, 예를 들어 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 2, 6 또는 8 개의 재조합 핵산을 포함할 수 있다.
예시적으로, UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성 유전자를 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에 나타낸 바와 같이 재조합 세포, 특히 재조합 효모의 HIS3 유전자 내에 및/또는 MET14 유전자 내에 및/또는 JLP1 유전자 내에 및/또는 SAM3 유전자 내에 삽입될 수 있다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모 세포는 하기를 포함한다:
- UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 2 에서 8 개 사이의 재조합 핵산;
- 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래하는 상기 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산; 및
- 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터, 예를 들어 유도성 또는 억제성 프로모터 pSAM1 또는 pCUP1 의 제어 하 및/또는 pFBA1, pENO2 및 pPDC1 로 이루어지는 군에서 선택되는 프로모터의 제어 하에 있는 상기 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산.
글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모 세포는 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드를 코딩하는 단 하나의 재조합 핵산을 포함할 수 있다.
본 발명에 따른 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드는 글루코사민-6-포스페이트를 N-아세틸-글루코사민-6-포스페이트로 전환시키는 폴리펩티드를 의미한다.
한 구현예에서, 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 있다.
글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 프로모터 pCWP2 의 제어 하에 있을 수 있다.
상기 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에서 나타낸 바와 같이 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되거나 유래될 수 있다.
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모 세포는 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 단 하나의 재조합 핵산을 포함할 수 있다.
예시적으로, 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에 나타낸 바와 같이 재조합 세포, 특히 재조합 효모의 MET14 유전자 내에 및/또는 SAM3 유전자 내에 삽입될 수 있다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모는 하기를 포함한다:
- 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 단 하나의 재조합 핵산;
- 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래하는 상기 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산; 및
- 상기 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산은 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 및/또는 프로모터 pCWP2 의 제어 하에 있음.
포스포아세틸글루코사민 뮤타아제 (PCM1) 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 포스포아세틸글루코사민 뮤타아제 (PCM1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함할 수 있다.
본 발명에 따른 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드는 N-아세틸-글루코사민-6-포스페이트를 N-아세틸-글루코사민-1-포스페이트로 전환시키는 폴리펩티드를 의미한다.
한 구현예에서, 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 있다.
포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산 중 하나 이상은 pTEF1 프로모터의 제어 하에 있을 수 있다.
상기 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에서 나타낸 바와 같이 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되거나 유래할 수 있다.
본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모는 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 단 하나의 재조합 핵산을 포함할 수 있다.
예시적으로, 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 본원의 실시예에 나타낸 바와 같이 재조합 세포, 특히 재조합 효모의 MET14 유전자 내에 및/또는 SAM3 유전자 내에 삽입될 수 있다.
본 발명의 구현예에서, 본 발명의 재조합 세포, 특히 재조합 효모 세포는 하기를 포함한다:
- 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 단 하나의 재조합 핵산;
- 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래하는 상기 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산; 및
- 본 발명의 재조합 세포에서 기능적인 유도성 또는 억제성 프로모터의 제어 하에 있는 및/또는 pTEF1 프로모터의 제어 하에 있는 상기 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산.
콘드로이틴 신타아제 (HCOS)
콘드로이틴 신타아제 효소는 UDP-글루쿠로네이트 및 UDP-N-아세틸-갈락토사민의 콘드로이틴으로의 전환을 촉매화하기 위한 당업계에 기재되는 단백질이다.
특정 구현예에서, 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 핵산은 하기이다:
(i) 콘드로이틴 신타아제를 코딩하는 핵산; 또는
(ii) 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드를 코딩하는 핵산.
융합 폴리펩티드로서 또한 공지된 키메라 폴리펩티드는 단일 유닛으로서 전사 및 번역되어 단일 폴리펩티드를 생성하도록 연결된 별개의 핵산에 의해 코딩되는 적어도 2 개의 도메인 또는 단편, 바람직하게는 2 개의 별개의 폴리펩티드로부터 이루어진 폴리펩티드이다. 키메라 폴리펩티드는 재조합 DNA 기술을 사용하여 in vivo 또는 in vitro 로 생성될 수 있다. 당업계에 공지된 이러한 기술은 특히 DNA 고체상 합성, 재조합 PCR, 제한 효소, 리가아제, 리콤비나제의 사용을 포함하는 통상의 분자 기술, 깁슨 어셈블리 (Gibson DG, Young L, Chuang RY, Venter JC, Hutchison CA 3rd, Smith HO (2009). Nature Methods. 6 (5): 343-345) 와 같은 기술 또는 생체 내에서 바람직하게는 효모에서 선형 DNA 재조합의 이용을 포함할 수 있다.
본 발명에 따라 적합한 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드는 히알루로난 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산 및 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산을 포함하는 핵산에 의해 코딩되는, 당업계에 공지된 하이브리드 단백질일 수 있다 (키메라 콘드로이틴 신타아제의 개념은 문헌 Tracy et al.(2006) Journal of biological chemistry, 282, 337-344 and Jing and DeAngelis (2003) Glycobiology 13, 66171 에 기재되어 있다). 생성된 폴리펩티드는 히알루로난 신타아제와 콘드로이틴 신타아제 사이의 키메라 폴리펩티드이다.
본 발명에 따라 적합한 콘드로이틴 신타아제 활성을 갖는 또다른 키메라 폴리펩티드는 히알루로난 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산 및 갈락토푸라노실트랜스퍼라제 활성을 갖는 폴리펩티드를 코딩하는 핵산을 포함하는 핵산에 의해 코딩된다. 생성된 폴리펩티드는 히알루로난 신타아제와 갈락토푸라노실트랜스퍼라제 (갈락토푸라노실트랜스퍼라제 GlfT2 마이코박테리움 투베르쿨로시스 UNIPROT O53585 EC 2.1.4.288) 사이의 융합 단백질이다.
본 발명에 따라 적합한 콘드로이틴 신타아제 활성을 갖는 또다른 키메라 폴리펩티드는 히알루로난 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산 및 키틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산을 포함하는 핵산에 의해 코딩된다. 생성된 폴리펩티드는 히알루로난 신타아제와 키틴 신타아제 (키틴 신타아제 CHS2 사카로마이세스 세레비지에 UNIPROT P14180 EC 2.1.4.16) 사이의 융합 단백질이다.
본 발명에 따라 적합한 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드의 예는 하기를 포함하는 핵산 서열에 의해 코딩될 수 있다:
- 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터의 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편 (예컨대, HCOS1-1, HCOS1-2 또는 HCOS1-3);
- 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편, 파스튜렐라 물토시다로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터의 키틴 신타아제 2 를 코딩하는 핵산으로부터의 단편 (예컨대, HCOS.Sc);
- 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터의 키틴 신타아제 2 를 코딩하는 핵산으로부터의 단편 (예컨대, HHASA.Sc)
- 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 에스케리키아 콜라이 (Escherichia coli) 로부터의 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편 (예컨대, HCOS1-Vir, HCOS2-Vir, 또는 HCOS4-Vir);
- 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 마이코박테리움 투베르쿨로시스 (Mycobaterium tuberculosis) 로부터의 갈락토푸라노실트랜스페라아제를 코딩하는 핵산으로부터의 단편 (예컨대, HCOS3-Vir);
- 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 페니실리움 옥살리쿰 (Penicillium oxalicum) 로부터의 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편 (예컨대, HCOS5-Vir, HCOS6-Vir, HCOS7-Vir 또는 HCOS8-Vir);
- 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스로부터의 콘드로이틴 설페이트 신타아제를 코딩하는 핵산으로부터의 단편 (예컨대, HCOS9-Vir, HCOS10-Vir, HCOS11-Vir, 또는 HCOS12-Vir).
콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 카르바졸 방법 (Bitter and Muir (1962) analytical biochemistry 4, 330-334) 을 이용하여 분석된 상청액 내 콘드로이틴의 존재에 의해 콘드로이틴을 생산하는 효소의 능력을 평가하는 방법을 유용하게 참조할 수 있다.
본 명세서에서 콘드로이틴 신타아제 활성을 갖는 바람직한 폴리펩티드는 2 개의 활성 EC 2.4.1.175 및 2.4.1.226 을 갖는 효소이다.
바람직한 구현예에 따르면, 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물로 이루어진 군에서 선택되는 유기체로부터 수득되거나 유래될 수 있다. 일부 구현예에서, 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 고세균으로부터 수득되거나 유래될 수 있다. 일부 바람직한 구현예에서, 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 파스튜렐라 물토시다 (Pm), 클로렐라 바이러스 PBCV1 (Vir), 마이코박테리움 튜베르쿨로시스 (Mt), 호모 사피엔스 (Hs), 에스케리키아 콜라이 (Ec), 사카로마이세스 세레비지에 (Sc) 또는 페니실룸 옥살리쿰 (Po) 으로 이루어진 군으로부터 수득되거나 유래될 수 있다.
또다른 바람직한 구현예에 따르면, 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 하기를 갖는 핵산 서열로 이루어진 군으로부터 선택될 수 있다: (i) 서열 SEQ ID NO: 1 (HCOS1-1), SEQ ID NO: 2 (HCOS1-2), SEQ ID NO: 3 (HCOS-1-3), SEQ ID NO: 4 (HCOS.Sc), SEQ ID NO: 5 (HHASA.Sc), SEQ ID NO: 6 (HCOS1-Vir), SEQ ID NO: 7 (HCOS2-Vir), SEQ ID NO: 8 (HCOS3-Vir), SEQ ID NO: 9 (HCOS4-Vir), SEQ ID NO: 10 (HCOS5-Vir), SEQ ID NO: 11 (HCOS6-Vir), SEQ ID NO: 12 (HCOS7-Vir), SEQ ID NO: 13 (HCOS8-Vir), SEQ ID NO: 14 (HCOS9-Vir), SEQ ID NO: 15 (HCOS10-Vir), SEQ ID NO: 16 (HCOS11-Vir), 또는 SEQ ID NO: 17 (HCOS12-Vir) 로서 언급된 핵산 서열과 적어도 65%, 유리하게는 적어도 70%, 바람직하게는 적어도 80% 핵산 동일성, 및 (i) 서열 SEQ ID NO: 1 (HCOS1-1), SEQ ID NO: 2 (HCOS1-2), SEQ ID NO: 3 (HCOS-1-3), SEQ ID NO: 4 (HCOS.Sc), SEQ ID NO: 5 (HHASA.Sc), SEQ ID NO: 6 (HCOS1-Vir), SEQ ID NO: 7 (HCOS2-Vir), SEQ ID NO: 8 (HCOS3-Vir), SEQ ID NO: 9 (HCOS4-Vir), SEQ ID NO: 10 (HCOS5-Vir), SEQ ID NO: 11 (HCOS6-Vir), SEQ ID NO: 12 (HCOS7-Vir), SEQ ID NO: 13 (HCOS8-Vir), SEQ ID NO: 14 (HCOS9-Vir), SEQ ID NO: 15 (HCOS10-Vir), SEQ ID NO: 16 (HCOS11-Vir), 또는 SEQ ID NO: 17 (HCOS12-Vir) 로서 언급된 핵산 서열을, 각각 갖는 색산 서열과 동일한 성질의 생물학적 활성.
이러한 서열에 관한 동일한 성질의 생물학적 활성은, 이전에 설명한 바와 같이, UDP-글루쿠로네이트 및 UDP-N-아세틸-갈락토사민을 콘드로이틴으로 전환시키는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 65% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 70% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터의 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 아미노산을 포함하는 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서 각각 등록 번호 Q7BLV3 및 Q9CMP0, 또는 본원에 기재된 SEQ ID NO: 18 (HCOS1-1), SEQ ID NO: 19 (HCOS1-2) 및 SEQ ID NO: 20 (HCOS-1-3) 에 언급된 서열을 참조할 수 있다.
파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편, 파스튜렐라 물토시다 (Pasteurella multocida) 로부터의 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터의 키틴 신타아제 2 를 코딩하는 아미노산으로부터의 단편을 포함하는 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서 각각 등록 번호 Q7BLV3, Q9CMP0 및 P14180, 또는 본원에 기재된 SEQ ID NO: 21 (HCOS.Sc) 에 언급된 서열을 참조할 수 있다.
파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터의 키틴 신타아제 2 를 코딩하는 아미노산으로부터의 단편을 포함하는 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서 각각 등록 번호 Q7BLV3 및 P14180, 또는 본원에 기재된 SEQ ID NO: 22 (HHASA.Sc) 에 언급된 서열을 참조할 수 있다.
클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리키아 콜라이 (Escherichia coli) 로부터의 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서 각각 등록 번호 Q84419 및 Q8L0V4, 또는 본원에 기재된 SEQ ID NO: 23 (HCOS1-Vir), SEQ ID NO: 24 (HCOS2-Vir), 또는 SEQ ID NO: 26 (HCOS4-Vir) 에 언급된 서열을 참조할 수 있다.
클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 마이코박테리움 투베르쿨로시스 (Mycobaterium tuberculosis) 로부터의 갈락토푸라노실트랜스페라아제를 코딩하는 아미노산으로부터의 단편을 포함하는 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서 각각 등록 번호 Q84419 및 O53585, 또는 본원에 기재된 SEQ ID NO: 25 (HCOS3-Vir) 에 언급된 서열을 참조할 수 있다.
클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 페니실리움 옥살리쿰 (Penicillium oxalicum) 로부터의 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서 각각 등록 번호 Q84419 및 S7Z8F8, 또는 SEQ ID NO: 27 (HCOS5-Vir) 에 언급된 서열을 참조할 수 있다.
클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터의 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서 각각 등록 번호 Q84419 및 Q9CMP0, 또는 본원에 기재된 SEQ ID NO: 28 (HCOS6-Vir), SEQ ID NO: 29 (HCOS7-Vir), 또는 SEQ ID NO: 30 (HCOS8-Vir) 에 언급된 서열을 참조할 수 있다.
클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터의 콘드로이틴 설페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서 각각 등록 번호 Q84419 및 Q86X52, 또는 본원에 기재된 SEQ ID NO: 31 (HCOS9-Vir), SEQ ID NO: 32 (HCOS10-Vir), SEQ ID NO: 33 (HCOS11-Vir) 또는 SEQ ID NO: 34 (HCOS12-Vir) 에 언급된 서열을 참조할 수 있다.
또다른 특정 구현예에 따르면, 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 하기를 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다: SEQ ID NO: 18 (HCOS1-1), SEQ ID NO: 19 (HCOS1-2), SEQ ID NO: 20 (HCOS-1-3), SEQ ID NO: 21 (HCOS.Sc), SEQ ID NO: 22 (HHASA.Sc), SEQ ID NO: 23 (HCOS1-Vir), SEQ ID NO: 24 (HCOS2-Vir), SEQ ID NO: 25 (HCOS3-Vir), SEQ ID NO: 26 (HCOS4-Vir), SEQ ID NO: 27 (HCOS5-Vir), SEQ ID NO: 28 (HCOS6-Vir), SEQ ID NO: 29 (HCOS7-Vir), SEQ ID NO: 30 (HCOS8-Vir), SEQ ID NO: 31 (HCOS9-Vir), SEQ ID NO: 32 (HCOS10-Vir), SEQ ID NO: 33 (HCOS11-Vir), 및 SEQ ID NO: 34 (HCOS12-Vir) 의 아미노산 서열과 적어도 55%, 유리하게는 적어도 65%, 바람직하게는 적어도 80% 아미노산 동일성 및 또한 동일한 성질의 생물학적 활성을 갖는 서열로 이루어진 군으로부터 선택되는 아미노산 서열.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같은, 즉 UDP-글루쿠로네이트 및 UDP-N-아세틸-갈락토사민의 UDP-N-아세틸-갈락토사민으로의 전환을 촉매화하는 능력이다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 55% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 65% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 5' 및 3' 위치에 각각 존재한다.
UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB)
UDP-글루코오스 탈수소효소는 UDP-글루코오스의 UDP-글루쿠로네이트로의 전환을 촉매화하는 것으로 당업계에 공지된 단백질이다. 아라비돕시스 탈리아나 (Arabidopsis thaliana), 클로렐라 바이러스 PBCV1 또는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 의 게놈으로부터 기원하는 UDP-글루코오스 탈수소효소는 HASB 로 명명될 수 있다.
UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 유리하게는 Oka 와 Jigami (FEBS Journal 273, 2645-2657, 2006) 에 의해 기재된 방법을 참조할 수 있다.
본 명세서에서 UDP-글루코오스 탈수소효소 활성을 갖는 바람직한 폴리펩티드는 EC 번호 1.1.1.22 를 갖는 효소이다.
바람직한 구현예에 따르면, UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물을 포함하는 군에서 선택되는 유기체로부터 수득하거나 유래할 수 있다. 일부 구현예에서, UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 고세균으로부터 수득하거나 유래할 수 있다. 일부 바람직한 구현예에서, UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 효모, 특히 아라비돕시스 탈리아나 (Arabidopsis thaliana), 클로렐라 바이러스 PBCV1 또는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus), 바람직하게는 아라비돕시스 탈리아나 (Arabidopsis thaliana) 또는 클로렐라 바이러스 PBCV1 로부터 수득하거나 유래할 수 있다.
또다른 바람직한 구현예에 따르면, UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) 서열 SEQ ID NO: 35 (At), SEQ ID NO: 36 (Vir), SEQ ID NO: 37 (Vir) 및 SEQ ID NO: 38 (Sz) 에서 나타낸 바와 같은 핵산 서열과 적어도 65%, 유리하게는 적어도 70%, 바람직하게는 적어도 80% 핵산 동일성, 및 (ii) 서열 SEQ ID NO: 35 (At), SEQ ID NO: 36 (Vir), SEQ ID NO: 37 (Vir) 및 SEQ ID NO: 38 (Sz) 에서 나타낸 바와 같은 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어지는 군에서 선택될 수 있다. SEQ ID NO: 35 (At), SEQ ID NO: 36 (Vir), SEQ ID NO: 37 (Vir) 및 SEQ ID NO: 38 (Sz) 에서 나타낸 핵산 서열은, 본원에서 또한 집합적으로 HASB 로 지칭될 수 있는 아라비돕시스 탈리아나 (At), 클로렐라 바이러스 PBCV1 (Vir) 또는 스트렙토코쿠스 주에피데미쿠스 (Sz) 로부터 각각 수득되는 또는 유래되는 UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩한다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은, 이전에 설명한 바와 같이, UDP-글루코오스를 UDP-글루쿠로네이트로 전환시키는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 65% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 70% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
아라비돕시스 탈리아나 (Arabidopsis thaliana), 클로렐라 바이러스 PBCV1 또는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 로부터의 UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드의 아미노산 서열에 대해, 당업자는 각각 UniProt 데이터베이스에서의 등록 번호 NP_173979.1, NP_048965 또는 KIS19289, 또는 본원에 기재된 SEQ ID NO: 39 (At), SEQ ID NO: 40 (Vir) 및 SEQ ID NO: 41 (Sz) 에 나타낸 바와 같은 서열을 참조할 수 있다.
또 다른 특정 구현예에 따르면, UDP-글루코오스 탈수소효소를 코딩하는 핵산(들) 은 SEQ ID NO: 39 (At), SEQ ID NO: 40 (Cv) 및 SEQ ID NO: 41 (Sz) 의 아미노산 서열과 적어도 55%, 유리하게는 적어도 65%, 바람직하게는 적어도 80% 아미노산 동일성, 및 또한 SEQ ID NO: 39 (At), SEQ ID NO: 40 (Vir) 및 SEQ ID NO: 41 (Sz) 의 아미노산 서열과 동일한 성질의 생물학적 활성 및 또한 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 코딩하는 핵산(들) 일 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같이, 즉 UDP-글루코오스의 UDP-글루쿠로네이트로의 전환을 촉매화하는 능력이다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 55% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 65% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 상기 UDP-글루코오스 탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 핵산의 5' 및 3' 위치에 각각 존재한다.
UDP-글루코오스-4-에피머라제 (kfoA 또는 GNE1)
UDP-글루코오스-4-에피머라제는 UDP-N-아세틸-글루코사민의 UDP-N-아세틸-갈락토사민으로의 전환을 촉매화하는 것으로 당업계에 공지된 단백질이다. 슈도모나스 아에루기노사 (Pseudomonas aeruginosa), 파스튜렐라 물토시다 (Pasteurella multocida), 또는 에스케리키아 콜라이 (Escherichia coli) 로부터 수득되는 또는 유래되는 UDP-글루코오스-4-에피머라제는 kfoA 또는 GNE1 로 명명될 수 있다.
UTP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 유리하게는 Creuzenet et al. (2000, Journal of Biological Chemistry 275, 1906067) 에 기재된 방법을 참조할 수 있다.
본 명세서에서 UTP-글루코오스-4-에피머라제 활성을 갖는 바람직한 폴리펩티드는 EC 번호 5.1.3.7 를 갖는 효소이다.
바람직한 구현예에 따르면, UTP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물로 이루어진 군에서 선택되는 유기체로부터 수득되거나 유래될 수 있다. 일부 구현예에서, UTP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 고세균으로부터 수득되거나 유래될 수 있다. 일부 바람직한 구현예에서, UTP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 슈도모나스 아에루기노사 (Pseudomonas aeruginosa), 파스튜렐라 물토시다 (Pm), 또는 에스케리키아 콜라이 (Ec) 로부터 수득되거나 유래될 수 있다.
또다른 바람직한 구현예에 따르면, UTP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) 서열 SEQ ID NO: 42 (Pa), SEQ ID NO: 43 (Pm), 및 SEQ ID NO: 44 (Ec) 에서 나타낸 바와 같은 핵산 서열과 적어도 65%, 유리하게는 적어도 70%, 바람직하게는 적어도 80% 핵산 동일성, 및 (ii) 서열 SEQ ID NO: 42 (Pa), SEQ ID NO: 43 (Pm), 및 SEQ ID NO: 44 (Ec) 에서 나타낸 바와 같은 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어지는 군에서 선택될 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 설명한 바와 같이, UDP-N-아세틸-글루코사민을 UDP-N-아세틸-갈락토사민으로 전환시키는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 65% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 70% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
슈도모나스 아에루기노사 (Pseudomonas aeruginosa), 파스튜렐라 물토시다 (Pasteurella multocida), 및 에스케리키아 콜라이 (Escherichia coli) 로부터의 UTP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드의 아미노산 서열에 대해, 당업자는 각각 UniProt 데이터베이스에서의 등록 번호 Q8KN66, AAK02370 또는 Q8L0V2, 또는 본원에 기재된 SEQ ID NO: 45 (Pa), SEQ ID NO: 46 (Pm), 및 SEQ ID NO: 47 (Ec) 에 나타낸 바와 같은 서열을 참조할 수 있다.
또 다른 특정 구현예에 따르면, UTP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 SEQ ID NO: 45 (Pa), SEQ ID NO: 46 (Pm), 또는 SEQ ID NO: 47 (Ec) 에 제시된 아미노산 서열과 적어도 55%, 유리하게는 적어도 65%, 바람직하게는 적어도 80% 아미노산 동일성, 및 또한 SEQ ID NO: 45 (Pa), SEQ ID NO: 46 (Pm), 또는 SEQ ID NO: 47 (Ec) 의 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같은, 즉 UDP-N-아세틸-글루코사민의 UDP-N-아세틸-갈락토사민으로의 전환을 촉매화하는 능력이다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 55% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 65% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 UTP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 UTP-글루코오스-4-에피머라제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 5' 및 3' 위치에 각각 존재한다.
콘드로이티나아제 (HYAL)
콘드로이티나아제 효소는 콘드로이틴 분자의 더 작은 콘드로이틴 분자로의 분해를 촉매화하기 위한 당업계에 기재된 단백질이다. 상기 언급된 바와 같이, 콘드로이티나아제 활성을 갖는 폴리펩티드는 콘드로이티나아제 또는 히알루로니다아제와 같은 히알루로노글루코사미니다아제일 수 있다.
특정 구현예에서, 콘드로이티나아제 활성을 갖는 폴리펩티드는 히알루로니다아제이다.
콘드로이티나아제 활성을 갖는 폴리펩티드는 큐피엔니우스 살레이 (Cupiennius salei), 티티우스 세르룰라투스 (Tityus serrulatus), 보스 타우루스 (Bos taurus), 아피스 멜리페라 (Apis mellifera), 마카카 물라타 (Macaca mulata), 또는 베스파 마그니피카 (Vespa magnifica) 의 게놈에 의해 코딩될 수 있으며, HYAL 로 명명될 수 있다.
콘드로이티나아제 활성을 갖는 폴리펩티드는 분비 신호 및 고정 신호 둘 모두를 갖거나 분비 신호를 갖고 고정 신호를 갖지 않거나, 이중 분비 및 고정 기능을 갖는 분비-고정 신호를 가질 수 있다. 콘드로이티나아제 활성을 갖는 코딩된 폴리펩티드가 분비 신호 및 고정 신호 둘 모두를 갖는 경우, 이는 HYAL-31 로 지칭될 수 있다.
콘드로이티나아제 활성을 갖는 코딩된 폴리펩티드가 분비 신호를 갖고 고정 신호를 갖지 않는 경우, 이는 HYAL-3 으로 지칭될 수 있다.
콘드로이티나아제 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 유리하게는 아가로오스 겔 상에서 수득한 콘드로이틴의 분자량을 모니터링할 수 있다.
본 명세서에서 콘드로이티나아제 활성을 갖는 바람직한 폴리펩티드는 EC 번호 n° 3.2.1.35 를 갖는 효소이다.
바람직한 구현예에 따르면, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물을 포함하는 군에서 선택되는 유기체로부터 수득되거나 유래될 수 있다. 일부 구현예에서, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 고세균으로부터 수득되거나 유래될 수 있다. 일부 구현예에서, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 효모로부터 선택되는 유기체로부터 수득되거나 유래될 수 있다. 일부 다른 바람직한 구현예에서, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 큐피엔니우스 살레이 (Csa), 티티우스 세르룰라투스 (Ts), 보스 타우루스 (Bt), 아피스 멜리페라 (Am), 마카카 물라타 (Mm), 또는 베스파 마그니피카 (Vm) 로부터, 특히 티티우스 세르룰라투스 (Ts) 로부터 수득되거나 유래될 수 있다.
또다른 바람직한 구현예에 따르면, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) SEQ ID NO: 48 (Csa), SEQ ID NO: 49 (Ts), SEQ ID NO: 50 (Bt), SEQ ID NO: 51 (Am), SEQ ID NO: 52 (Mm) 또는 SEQ ID NO: 53 (Vm) 의 핵산과 적어도 65%, 유리하게는 적어도 70%, 바람직하게는 적어도 80% 핵산 동일성을 갖고, (ii) 큐피엔니우스 살레이, 티티우스 세르룰라투스, 보스 타우루스, 아피스 멜리페라, 마카카 물라타, 또는 베스파 마그니피카로부터 각각 수득되거나 유래된 분비 신호를 포함하고 고정 신호를 포함하지 않는 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하고, (iii) SEQ ID NO: 48 (Csa), SEQ ID NO: 49 (Ts), SEQ ID NO: 50 (Bt), SEQ ID NO: 51 (Am), SEQ ID NO: 52 (Mm) 또는 SEQ ID NO: 53 (Vm) 의 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어진 군으로부터 선택될 수 있다.
또다른 바람직한 구현예에 따르면, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 SEQ ID NO: 54 (Csa), SEQ ID NO: 55 (Ts), SEQ ID NO: 56 (Bt), SEQ ID NO: 57 (Am), SEQ ID NO: 58 (Mm) 또는 SEQ ID NO: 59 (Vm) 의 핵산과 적어도 65%, 유리하게는 적어도 70%, 바람직하게는 적어도 80% 핵산 동일성을 갖고, (ii) 큐피엔니우스 살레이, 티티우스 세르룰라투스, 보스 타우루스, 아피스 멜리페라, 마카카 물라타, 또는 베스파 마그니피카로부터 각각 수득되거나 유래된 분비 신호 및 고정 신호를 포함하는 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하고, (iii) SEQ ID NO: 54 (Csa), SEQ ID NO: 55 (Ts), SEQ ID NO: 56 (Bt), SEQ ID NO: 57 (Am), SEQ ID NO: 58 (Mm) 또는 SEQ ID NO: 59 (Vm) 의 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어진 군으로부터 선택될 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은, 이전에 설명한 바와 같이, 콘드로이틴 분자의 더 작은 콘드로이틴 분자로의 분해를 촉매화하는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 65% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 70% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
큐피엔니우스 살레이 (Cupiennius salei), 티티우스 세르룰라투스 (Tityus serrulatus), 보스 타우루스 (Bos taurus), 아피스 멜리페라 (Apis mellifera), 마카카 물라타 (Macaca mulata), 또는 베스파 마그니피카 (Vespa magnifica) 유래의 히알루로니다아제의 아미노산 서열에 대해, 당업자는 각각 UniProt 데이터베이스에서의 등록 번호 A0A0S4JYH2, P85841, Q7YS45, Q08169, G7ML68 또는 P86875, 또는 본원에 기재된 SEQ ID NO: 60 (Csa), SEQ ID NO: 61 (Ts), SEQ ID NO: 62 (Bt), SEQ ID NO: 63 (Am), SEQ ID NO: 64 (Mm) 또는 SEQ ID NO: 65 (Vm) 을 참조할 수 있다.
또 다른 특정 구현예에 따르면, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 분비 신호는 포함하고 고정 신호는 포함하지 않는 SEQ ID NO: 60 (Csa), SEQ ID NO: 61 (Ts), SEQ ID NO: 62 (Bt), SEQ ID NO: 63 (Am), SEQ ID NO: 64 (Mm) 또는 SEQ ID NO: 65 (Vm) 의 아미노산 서열과 적어도 55%, 유리하게는 적어도 65%, 바람직하게는 적어도 80% 아미노산 동일성, 및 또한 서열 SEQ ID NO: 60 (Csa), SEQ ID NO: 61 (Ts), SEQ ID NO: 62 (Bt), SEQ ID NO: 63 (Am), SEQ ID NO: 64 (Mm) 또는 SEQ ID NO: 65 (Vm) 과 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다.
또 다른 특정 구현예에 따르면, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 분비 신호 및 고정 신호를 포함하는 SEQ ID NO: 66 (Csa), SEQ ID NO: 67 (Ts), SEQ ID NO: 68 (Bt), SEQ ID NO: 69 (Am), SEQ ID NO: 70 (Mm) 또는 SEQ ID NO: 71 (Vm) 의 아미노산 서열과 적어도 55%, 유리하게는 적어도 65%, 바람직하게는 적어도 80% 아미노산 동일성, 및 또한 SEQ ID NO: 66 (Csa), SEQ ID NO: 67 (Ts), SEQ ID NO: 68 (Bt), SEQ ID NO: 69 (Am), SEQ ID NO: 70 (Mm) 또는 SEQ ID NO: 71 (Vm) 의 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같이, 즉 콘드로이틴 분자의 더 작은 콘드로이틴 분자로의 분해를 촉매화하는 능력이다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 55% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 65% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 5' 및 3' 위치에 각각 존재한다.
글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1)
글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 효소는 프룩토오스-6-포스페이트의 글루코사민-6-포스페이트로의 전환을 촉매화하기 위한 당업계에서 기재된 단백질이다. 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제는 GFA1 로 명명될 수 있다.
글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 유리하게는 Shiga Shibatan 과 Hiroaki Kitazawa (Plant Biotechnology 26, 149-152, 2009) 에 의해 기재된 방법을 참조할 수 있다.
본 발명에서 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 바람직한 폴리펩티드는 EC 번호 n° EC 2.6.1.16 을 갖는 효소이다.
바람직한 구현예에 따르면, 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물을 포함하는 군에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 일부 구현예에서, 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 고세균으로부터 기원하거나 유래할 수 있다. 일부 구현예에서, 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 바실러스 서브틸리스 (Bacillus subtilis) 및 효모에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 일부 다른 바람직한 구현예에서, 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 효모, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래할 수 있다.
바람직한 구현예에 따르면, 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) 서열 SEQ ID NO: 72 (Sc) 에서 나타낸 바와 같은 핵산 서열과 적어도 65%, 유리하게는 적어도 70%, 바람직하게는 적어도 80% 핵산 동일성, 및 (ii) 서열 SEQ ID NO: 72 에서 나타낸 바와 같은 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어지는 군에서 선택될 수 있다. 서열 SEQ ID NO: 72 에서 나타낸 바와 같은 핵산은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되는 또는 유래되는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하며, 또한 GFA1 로 명명된다.
또 다른 구현예에 따르면, 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) 서열 SEQ ID NO: 73 또는 SEQ ID NO: 74 에서 나타낸 바와 같은 핵산 서열과 적어도 65%, 유리하게는 적어도 70%, 바람직하게는 적어도 80% 핵산 동일성, 및 (ii) 서열 SEQ ID NO: 73 또는 SEQ ID NO: 74 에서 나타낸 바와 같은 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어지는 군에서 선택될 수 있다. 서열 SEQ ID NO: 73 또는 SEQ ID NO: 74 에서 나타낸 바와 같은 핵산 서열은 클로렐라 바이러스 PBCV1 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩한다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은, 이전에 설명한 바와 같이, 프룩토오스-6-포스페이트를 글루코사민-6-포스페이트로 전환시키는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 65% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 70% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서의 등록 번호 NP8012818, 또는 본원에 기재된 서열 SEQ ID NO: 75 를 참조할 수 있다.
클로렐라 바이러스 PBCV1 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드의 아미노산 서열에 대해, 당업자는 또한 UniProt 데이터베이스에서의 등록 번호 NP_048448, 또는 본원에 기재된 서열 SEQ ID NO: 76 을 참조할 수 있다.
또 다른 특정 구현예에 따르면, 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 SEQ ID NO: 75 또는 SEQ ID NO: 76 의 아미노산 서열과 적어도 35%, 유리하게는 적어도 65%, 바람직하게는 적어도 80% 아미노산 동일성, 및 또한 SEQ ID NO: 75 또는 SEQ ID NO: 76 의 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같이, 즉 프룩토오스-6-포스페이트의 글루코사민-6-포스페이트로의 전환을 촉매화하는 능력이다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 35% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 36%, 37%, 38%, 39%, 40% 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 65% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 5' 및 3' 위치에 각각 존재한다.
UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1)
UDUDP-N-아세틸글루코사민 피로포스포릴라아제 효소는 N-아세틸-글루코사민-6-포스페이트의 UDP-N-아세틸-글루코오스로의 전환을 촉매화하기 위한 당업계에 기재된 단백질이다. 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UDP-N-아세틸글루코사민 피로포스포릴라아제는 QRI1 로 명명될 수 있다.
UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 유리하게는, UDP-N-아세틸-글루코사민이 Synergi RP Fusion 컬럼을 사용하여 LC MS/MS 에 의해 검출된다는 것을 제외하고는 Mio et al. (The Journal of Biological Chemistry, Col. 273, No 23, June 5, 1998, 14392-14397) 에 의해 기재된 방법을 참조할 수 있다.
본 발명에서 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 바람직한 폴리펩티드는 EC 번호 n° EC 2.7.7.23 을 갖는 효소이다.
바람직한 구현예에 따르면, UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물로 이루어지는 군에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 일부 구현예에서, UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 고세균으로부터 기원하거나 유래할 수 있다. 일부 구현예에서, UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 바실러스 서브틸리스 (Bacillus subtilis), 및 효모에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 일부 다른 바람직한 구현예에서, UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 효모, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래할 수 있다.
바람직한 구현예에 따르면, UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) SEQ ID NO: 77 에서 나타낸 바와 같은 핵산 서열과 적어도 65%, 유리하게는 적어도 70%, 바람직하게는 적어도 80% 핵산 동일성, 및 (ii) SEQ ID NO: 77 에서 나타낸 바와 같은 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어지는 군에서 선택될 수 있다. SEQ ID NO: 77 에서 나타낸 바와 같은 핵산 서열은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하며, 또한 QRI1 로 명명된다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 설명한 바와 같이, N-아세틸-글루코사민-6-포스페이트를 UDP-N-아세틸-글루코오스로 전환시키는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 65% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 70% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 핵산 서열과 적어도 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서의 등록 번호 NP_010180, 또는 본원에 기재된 SEQ ID NO. 78 를 참조할 수 있다.
또 다른 특정 구현예에 따르면, UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 서열 SEQ ID NO. 78 에서 나타낸 바와 같은 아미노산 서열과 적어도 35%, 유리하게는 적어도 45%, 바람직하게는 적어도 80% 아미노산 동일성, 및 또한 서열 SEQ ID NO. 78 에서 나타낸 바와 같은 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같이, 즉 N-아세틸-글루코사민-6-포스페이트의 UDP-N-아세틸-글루코오스로의 전환을 촉매화하는 능력이다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 35% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 36%, 37%, 38%, 39%, 40% 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 45% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 UDP-N-아세틸글루코사민 피로포스포릴라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 5' 및 3' 위치에 각각 존재한다.
포스포글루코뮤타아제-1 (PGM1)
포스포글루코뮤타아제-1 효소는 글루코오스-6-포스페이트의 글루코오스-1-포스페이트로의 전환을 촉매화하기 위한 당업계에 기재된 단백질이다. 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포글루코뮤타아제-1 은 PGM1 로 명명될 수 있다.
포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 유리하게는 Tiwari 와 Bhat (Biochemical and Biophysical Research Communications 366, 340-345, 2008) 에 의해 기재된 방법을 참조할 수 있다.
본 발명에서 포스포글루코뮤타아제-1 활성을 갖는 바람직한 폴리펩티드는 EC 번호 n° 5.4.2.2 를 갖는 효소이다.
바람직한 구현예에 따르면, 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물로 이루어지는 군에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 일부 구현예에서, 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 고세균으로부터 기원하거나 유래할 수 있다. 일부 구현예에서, 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 박테리아에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 바람직한 구현예에서, 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래할 수 있다.
한 구현예에 따르면, 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는, 서열 SEQ ID NO: 79 에서 나타낸 바와 같은 핵산 서열과 적어도 80% 핵산 동일성, 및 (ii) 서열 SEQ ID NO: 79 에서 나타낸 바와 같은 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어지는 군에서 선택될 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은, 이전에 설명한 바와 같이, 글루코오스-6-포스페이트를 글루코오스-1-포스페이트로 전환시키는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터의 포스포글루코뮤타아제-1 활성을 갖는 펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서의 등록 번호 NP33401, 또는 본원에 기재된 SEQ ID NO: 80 를 참조할 수 있다.
또 다른 특정 구현예에 따르면, 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 서열 SEQ ID NO: 80 에서 나타낸 바와 같은 아미노산 서열과 적어도 80% 아미노산 동일성, 및 또한 서열 SEQ ID NO: 80 에서 나타낸 바와 같은 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같이, 즉 글루코오스-6-포스페이트의 글루코오스-1-포스페이트로의 전환을 촉매화하는 능력이다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 포스포글루코뮤타아제-1 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 5' 및 3' 위치에 각각 존재한다.
UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1)
UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 효소는 글루코오스-1-포스페이트의 UDP-글루코오스로의 전환을 촉매화하기 위한 당업계에 기재된 단백질이다. 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제는 UGP1 로 명명될 수 있다.
UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 유리하게는 Roeben (J. Mol. Biol 364, 551-560, 2006) 에 의해 기재된 방법을 참조할 수 있다.
본 발명에서 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 바람직한 폴리펩티드는 EC 번호 n° 2.7.7.9 를 갖는 효소이다.
바람직한 구현예에 따르면, UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물로 이루어지는 군에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 일부 구현예에서, UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 고세균으로부터 기원하거나 유래할 수 있다. 일부 구현예에서, UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 박테리아에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 바람직한 구현예에서, UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래할 수 있다.
특정 구현예에 따르면, UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는, SEQ ID NO: 81 에서 나타낸 바와 같은 핵산과 적어도 80% 핵산 동일성, 및 (ii) SEQ ID NO: 81 에서 나타낸 바와 같은 핵산과 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어지는 군에서 선택될 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은, 이전에 설명한 바와 같이, 글루코오스-1-포스페이트를 UDP-글루코오스로 전환시키는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서의 등록 번호 NP_32861, 또는 본원에 기재된 서열 SEQ ID NO: 82 에 나타낸 서열을 참조할 수 있다.
또 다른 특정 구현예에 따르면, UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 SEQ ID NO: 82 에서 나타낸 바와 같은 아미노산 서열과 적어도 80% 아미노산 동일성, 및 또한 SEQ ID NO: 82 에서 나타낸 바와 같은 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같이, 즉 글루코오스-1-포스페이트의 UDP-글루코오스로의 전환을 촉매화하는 능력이다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 5' 및 3' 위치에 각각 존재한다.
글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1)
글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 효소는 글루코사민-6-포스페이트의 N-아세틸-글루코사민-6-포스페이트로의 전환을 촉매화하기 위한 당업계에서 기재된 단백질이다. 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제는 GNA1 로 명명될 수 있다.
글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 유리하게는 Li et al. (Anal. Biochem. 370, 142-146, 2007) 에 의해 기재된 방법을 참조할 수 있다.
본 발명에서 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 바람직한 폴리펩티드는 EC 번호 n° 2.3.1.4 를 갖는 효소이다.
바람직한 구현예에 따르면, 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물로 이루어지는 군에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 일부 바람직한 구현예에서, 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 효모, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래할 수 있다.
특정 구현예에 따르면, 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) 서열 SEQ ID NO: 83 에서 나타낸 바와 같은 핵산 서열과 적어도 80% 핵산 동일성, 및 (ii) 서열 SEQ ID NO: 83 에서 나타낸 바와 같은 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어지는 군에서 선택될 수 있다. 서열 SEQ ID NO: 83 에서 나타낸 바와 같은 핵산 서열은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하며, 또한 GNA1 로 명명된다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은, 이전에 설명한 바와 같이, 글루코사민-6-포스페이트를 N-아세틸-글루코사민-6-포스페이트로 전환시키는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되는 또는 유래되는 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서의 등록 번호 NP_116637, 또는 본원에 기재된 SEQ ID NO. 84 을 참조할 수 있다.
또 다른 특정 구현예에 따르면, 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 SEQ ID NO. 84 에서 나타낸 바와 같은 아미노산 서열과 적어도 80% 아미노산 동일성, 및 또한 SEQ ID NO. 84 에서 나타낸 바와 같은 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같이, 즉 글루코사민-6-포스페이트의 N-아세틸-글루코사민-6-포스페이트로의 전환을 촉매화하는 능력이다..
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 5' 및 3' 위치에 각각 존재한다.
포스포아세틸글루코사민 뮤타아제 (PCM1)
포스포아세틸글루코사민 뮤타아제 효소는 N-아세틸-글루코사민-6-포스페이트의 N-아세틸-글루코사민-1-포스페이트로의 전환을 촉매화하기 위한 당업계에서 기재된 단백질이다. 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포아세틸글루코사민 뮤타아제는 PCM1 로 명명될 수 있다.
포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드의 활성 수준을 측정하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다.
이와 관련하여, 당업자는 유리하게는 Bandini et al. (Molecular Microbiology 85(3), 513-534, 2012) 에 의해 기재된 방법을 참조할 수 있다.
본 발명에서 포스포아세틸글루코사민 뮤타아제 활성을 갖는 바람직한 폴리펩티드는 EC 번호 n° 5.4.2.3 을 갖는 효소이다.
바람직한 구현예에 따르면, 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 바람직하게는 원핵 생물 및 진핵 생물로 이루어지는 군에서 선택되는 유기체로부터 기원하거나 유래할 수 있다. 일부 바람직한 구현예에서, 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 효모, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하거나 유래할 수 있다.
특정 구현예에 따르면, 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 (i) SEQ ID NO: 85 에서 나타낸 바와 같은 핵산 서열과 적어도 80% 핵산 동일성, 및 (ii) SEQ ID NO: 85 에서 나타낸 바와 같은 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열로 이루어지는 군에서 선택될 수 있다. SEQ ID NO: 85 에서 나타낸 바와 같은 핵산은 사카로마이세스로부터 기원하는 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하며, 또한 PCM1 로 명명된다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은, 이전에 설명한 바와 같이, N-아세틸-글루코사민-6-포스페이트를 N-아세틸-글루코사민-1-포스페이트로 전환시키는 폴리펩티드를 코딩하는 능력이다.
본원에 기재된 바와 같이, 참조 핵산 서열과 적어도 80% 뉴클레오티드 동일성을 갖는 핵산 서열은 상기 참조 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 동일성, 및 또한 상기 참조 핵산 서열과 동일한 성질의 생물학적 활성을 갖는 핵산 서열을 포함한다.
사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드의 아미노산 서열에 대해, 당업자는 UniProt 데이터베이스에서의 등록 번호 NP_010856, 또는 본원에 기재된 SEQ ID NO. 86 을 참조할 수 있다.
또 다른 특정 구현예에 따르면, 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 SEQ ID NO. 86 에서 나타낸 바와 같은 아미노산 서열과 적어도 80% 아미노산 동일성, 및 또한 SEQ ID NO. 86 에서 나타낸 바와 같은 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 서열로 이루어지는 군에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산(들) 일 수 있다.
이러한 서열에 관한 동일한 성질의 생물학적 활성은 이전에 기재된 바와 같이, 즉 N-아세틸-글루코사민-6-포스페이트의 N-아세틸-글루코사민-1-포스페이트로의 전환을 촉매화하는 능력이다.
본원에 기재된 바와 같이, 참조 아미노산 서열과 적어도 80% 아미노산 동일성을 갖는 아미노산 서열은 상기 참조 아미노산 서열과 적어도 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 아미노산 동일성, 및 또한 상기 참조 아미노산 서열과 동일한 성질의 생물학적 활성을 갖는 아미노산 서열을 포함한다.
상기 언급된 바와 같이, 본 발명에서 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 발현 수준은 적어도 하나의 프로모터 및 적어도 하나의 터미네이터에 의해 조절되며, 예를 들어 본원에서 보다 상세하게 정의된 바와 같이, 이는 포스포아세틸글루코사민 뮤타아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 5' 및 3' 위치에 각각 존재한다.
프로모터
본원에 개시된 바와 같이, 본 발명에 따른 재조합 세포를 수득하기 위해 유전자 조작된 관심 유전자의 발현은 본 발명의 재조합 세포, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 를 포함하는 특히 본 발명의 재조합 효모 세포에서 기능적인 적절한 조절 서열을 포함한다.
다양한 프로모터가 관심 코딩 서열의 원하는 발현에 사용될 수 있다.
본 발명에 따른 프로모터는 하기 프로모터로 이루어지는 군에서 선택될 수 있다:
ㆍ pTDH3 (SEQ ID NO: 87),
ㆍ pTDH3.Sk (SEQ ID NO: 88)
ㆍ pTDH3-1.Sba (SEQ ID NO: 89),
ㆍ pTDH3.Sar (SEQ ID NO: 90)
ㆍ pENO2 (SEQ ID NO: 91)
ㆍ pTEF3 (SEQ ID NO: 92)
ㆍ pTEF1 (SEQ ID NO: 93),
ㆍ pTEF1.Ago (SEQ ID NO: 94),
ㆍ pTEF1.sba (SEQ ID NO: 95),
ㆍ pPDC1 (SEQ ID NO: 96),
ㆍ pCCW12 (SEQ ID NO: 97),
ㆍ pCCW12.Sm (SEQ ID NO: 98),
ㆍ pCCW12.sk (SEQ ID NO: 99),
ㆍ pCCW12.sba (SEQ ID NO: 100),
ㆍ pCCW12.sar (SEQ ID NO: 101),
ㆍ pNUP57 (SEQ ID NO: 102),
ㆍ pCCW10.ago (SEQ ID NO: 103),
ㆍ pCWP2 (SEQ ID NO: 104),
ㆍ pFBA1 (SEQ ID NO: 105),
ㆍ pCCW120.Sm (SEQ ID NO: 106).
본 발명에서 보다 특히 관심 대상인 프로모터는 하기로 이루어진 군에서 선택될 수 있다:
ㆍ pTDH3 (SEQ ID NO: 65). 87)
ㆍ pTDH3.Sk (SEQ ID NO: 88)
ㆍ pTDH3-1.Sba (SEQ ID NO: 89)
ㆍ pTDH3.Sar (SEQ ID NO: 90),
ㆍ pENO2 (SEQ ID NO: 91),
ㆍ pTEF3 (SEQ ID NO: 92),
ㆍ pTEF1 (SEQ ID NO: 93),
ㆍ pTEF1.Ago (SEQ ID NO: 94),
ㆍ pTEF1.sba (SEQ ID NO: 95),
ㆍ pPDC1 (SEQ ID NO: 96),
ㆍ pCCW12 (SEQ ID NO: 97),,
ㆍ pCCW12.sba (SEQ ID NO: 100)
ㆍ pCCW120.Sm (SEQ ID NO: 106),
ㆍ pNUP57 (SEQ ID NO: 102),
ㆍ pCCW10.ago (SEQ ID NO: 103),
ㆍ pCWP2 (SEQ ID NO: 104), 및
ㆍ pFBA1 (SEQ ID NO: 105)
상기 터미네이터는 특히 pTDH3, pTDH3.Sk, pTDH3-1.Sba, pTEF1, pTEF1.Ago, pTEF1.sba, pCCW12, pCCW120.Sm, pCWP2 및 pFBA1 로 이루어지는 군에서 선택될 수 있다.
대안적으로, 본 발명에서 관심 대상인 프로모터는 하기로 이루어진 군에서 선택될 수 있다:
ㆍ pNUP57 (SEQ ID NO: 102), 및
ㆍ pCCW10.ago (SEQ ID NO: 103).
본 발명에서 관심있는 또다른 프로모터는 다음과 같을 수 있다:
ㆍ pCWP2 (SEQ ID NO: 104).
이전에 언급된 바와 같이, 유도성 또는 억제성 프로모터는 그의 활성이 생물학적 또는 비생물학적 인자의 존재 또는 부재 및 또한 상기 인자의 양에 의해 제어되는 프로모터이다. 따라서, 일부 프로모터의 경우, 주어진 인자의 양이 증가하거나 증가될 때 이들의 활성이 특히 유도되고 이에 따라 증가할 것이며, 따라서, 상기 인자의 양이 감소하거나 감소될 때 이들 동일한 프로모터의 활성이 억제되고 이에 따라 감소될 수 있다. 유도성 또는 억제성 프로모터를 포함하는 본 발명의 재조합 효모 세포의 배양 배지에서 상기 인자(들) 의 양은 당업자에 의해 결정되고 이에 따라 제어될 수 있다.
예를 들어, pCUP1 프로모터를 포함하는 본 발명에 따른 재조합 효모 세포의 배양 배지에서 구리의 양을 증가시키는 것은 이러한 프로모터의 제어 하에 유전자의 전사를 유도하고 이에 따라 증가시킬 것이다. 반대로, 상기 배양 배지에서 구리의 양을 감소시키는 것은 이러한 프로모터의 제어 하에 유전자의 전사를 억제하고 이에 따라 감소시킬 것이다.
또 다른 예에서, pMET6 프로모터를 포함하는 본 발명에 따른 재조합 효모 세포의 배양 배지에서 메티오닌의 양을 증가시키는 것은 이러한 프로모터의 제어 하에 유전자의 전사를 억제하고 이에 따라 감소시킬 것이다. 반대로, 상기 배양 배지에서 메티오닌의 양을 감소시키는 것은 이러한 프로모터의 제어 하에 유전자의 전사를 유도하고 이에 따라 증가시킬 것이다.
이러한 이유로, 하기 프로모터는 본문에서 "유도성 또는 억제성 프로모터"로 지칭된다.
제 1 구현예에 따르면, 본 발명에 따른 유도성 또는 억제성 프로모터는 구리로의 유도성 또는 억제성 프로모터, 메티오닌으로의 유도성 또는 억제성 프로모터 및 트레오닌으로의 유도성 또는 억제성 프로모터를 포함하는 군에서 선택될 수 있고, 특히 CUP-1 - 구리 유도성 또는 억제성이다.
이러한 구현예에 따르면, 본 발명에 따른 유도성 또는 억제성 프로모터는 특히 pCUP1 (SEQ ID NO: 107) 일 수 있다.
따라서, 이들 프로모터의 활성은 상기 나타낸 바와 같이 메티오닌, 구리 또는 트레오닌의 존재를 증가시킴으로써 유도되고, 메티오닌, 구리 또는 트레오닌의 양이 감소될 때 이들의 활성이 감소, 즉 억제된다.
제 2 구현예에 따르면, 본 발명에 따른 유도성 또는 억제성 프로모터는 구리로의 유도성 또는 억제성 프로모터, 리신으로의 유도성 또는 억제성 프로모터 및 메티오닌으로의 유도성 또는 억제성 프로모터를 포함하는 군에서. 특히 하기로 이루어지는 군에서 선택될수 있다:
ㆍ pMET6 - 메티오닌 유도성 또는 억제성 (SEQ ID NO: 108),
ㆍ pMET25 - 메티오닌 유도성 또는 억제성 (SEQ ID NO: 109), 및
ㆍ pSAM1 - 메티오닌 유도성 또는 억제성 (SEQ ID NO: 110).
이러한 특정 구현예에 따르면, 본 발명에 따른 유도성 또는 억제성 프로모터는, pMET6 및 pSAM1 로 이루어지는 군에서 선택될 수 있다.
따라서, 이들 프로모터의 활성은 상기 나타낸 바와 같이 메티오닌, 구리, 리신 또는 글루코오스의 존재를 증가시킴으로써 억제되고, 메티오닌, 구리, 리신 또는 글루코오스의 양이 감소될 때 이들의 활성이 증가, 즉 유도된다.
특정 구현예에서, 본 발명에 따른 유도성 또는 억제성 프로모터는 구리로의 유도성 또는 억제성 프로모터, 글루코오스로의 유도성 또는 억제성 프로모터, 리신으로의 유도성 또는 억제성 프로모터, 메티오닌으로의 유도성 또는 억제성 프로모터 및 트레오닌으로의 유도성 또는 억제성 프로모터를 포함하는 군에서 선택될 수 있다.
Blazeck & Alper (2013) Biotechnol. J. 8 46-58 에서 기재된 바와 같은 합성 프로모터가 또한 사용될 수 있다.
본 발명의 프로모터는 사카로마이세스 강 (Saccharomycetes class) 으로부터의 임의의 유기체로부터 기원할 수 있고, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae), 사카로마이세스 보울라르디이 (Saccharomyces boulardii), 사카로마이세스 카스텔리이 (Saccharomyces castelii), 사카로마이세스 바야누스 (Saccharomyces bayanus), 사카로마이세스 아르보리콜라 (Saccharomyces arboricola), 사카로마이세스 쿠드리아브제비이 (Saccharomyces kudriavzevii), 사카로마이세스 미카타에 (Saccharomyces mikatae), 아쉬비아 고시피이 (Ashbya gossypii), 클루베로마이세스 락티스 (Kluveromyces lactis), 피치아 파스토리스 (Pichia pastoris), 칸디다 글라브라타 (Candida glabrata), 칸디다 트로피칼리스 (Candida tropicalis), 데바리오마이세스 카르텔리이 (Debaryomyces castelii), 야로위아 리포리티카 (Yarrowia lipolitica) 및 사이버린드네라 자디니이 (Cyberlindnera jadinii) 중 적어도 하나로 이루어지는 군에서 선택되는 유기체로부터 기원할 수 있다.
본 발명의 프로모터는 바람직하게는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) (sc), 사카로마이세스 미카타에 (Saccharomyces mikatae) (Sm), 사카로마이세스 쿠드리아브제비이 (Saccharomyces kudriavzevii) (sk), 사카로마이세스 바야누스 (Saccharomyces bayanus) (sba), 사카로마이세스 아르보리콜라 (Saccharomyces arboricola) (Sar), 및 아쉬비아 고시피이 (Ashbya gossypii) (Ago) 로 이루어지는 군에서 선택되는 유기체로부터 기원할 수 있다.
터미네이터
본원에 개시된 바와 같이, 본 발명에 따른 재조합 세포, 특히 본 발명에 따른 재조합 효모를 수득하기 위해 유전자 조작된 관심 유전자의 발현은 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모 세포, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 에서 기능적인 적절한 전사 터이네이터 서열을 포함한다.
동일하거나 상이한 상기 전사 터미네이터는 문헌 [Yamanishi et al., (2013) ACS synthetic biology 2, 337-347] 에서 발견될 있다.
본 발명에서 보다 특히 관심 대상인 터미네이터는 하기를 포함하는 군에서 선택될 수 있다:
ㆍ 트리오스 포스페이트 이소머라아제를 코딩하는 유전자로부터의 tTPI1 (SEQ ID NO: 111),
ㆍ O-아세틸 호모세린-O-아세틸 세린 술프히드릴라아제를 코딩하는 유전자로부터의 tMET25 (SEQ ID NO: 112),
ㆍ tDIT1 (SEQ ID NO: 113),
ㆍ tRPL3 (SEQ ID NO: 114),
ㆍ tRPL3.sm (SEQ ID NO: 115),
ㆍ tRPL3.sba (SEQ ID NO: 116),
ㆍ tRPL41B (SEQ ID NO: 117),
ㆍ tRPL41B.Sba (SEQ ID NO: 118)
ㆍ tRPL15A (SEQ ID NO: 119),
ㆍ tRPL15A.Sm (SEQ ID NO: 120),
ㆍ tRPL15A.sba (SEQ ID NO: 121),
ㆍ tIDP1 (SEQ ID NO: 122),
ㆍ tIDP1.Sba (SEQ ID NO: 123), 및
ㆍ tTEF1.sba (SEQ ID NO: 124).
본 발명에서 보다 특히 관심 대상인 터미네이터는 하기로 이루어진 군에서 선택될 수 있다:
ㆍ 트리오스 포스페이트 이소머라아제를 코딩하는 유전자로부터의 tTPI1 (SEQ ID NO: 111),
ㆍ O-아세틸 호모세린-O-아세틸 세린 술프히드릴라아제를 코딩하는 유전자로부터의 tMET25 (SEQ ID NO: 112)
ㆍ tDIT1 (SEQ ID NO: 113)
ㆍ tRPL3 (SEQ ID NO: 114)
ㆍ tRPL3.Sm (SEQ ID NO: 115)
ㆍ tRPL3.sba (SEQ ID NO: 116)
ㆍ tRPL41B (SEQ ID NO: 117)
ㆍ tRPL41B.Sba (SEQ ID NO: 118)
ㆍ tRPL15A (SEQ ID NO: 119)
ㆍ tRPL15A.Sm (SEQ ID NO: 120)
ㆍ tIDP1 (SEQ ID NO: 122)
ㆍ tIDP1.Sba (SEQ ID NO: 123), 및
ㆍ tTEF1.sba (SEQ ID NO: 124).
특히, 상기 터미네이터는 tTPI1, tDIT11, tRPL3, tRPL3.Sm, tRPL41B, tRPL41B.Sba, tRPL15A, tRPL15A.Sm, tIDP1, tIDP1.Sba 및 tTEF1.sba 로 이루어지는 군에서 선택될 수 있다.
본 발명의 터미네이터는 사카로마이세스 강으로부터의 임의의 유기체로부터 기원할 수 있고, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) (sc), 사카로마이세스 미카타에 (Saccharomyces mikatae) (Sm) 및 사카로마이세스 바야누스 (Saccharomyces bayanus) (sba) 로 이루어지는 군에서 선택되는 유기체로부터 기원할 수 있다.
재조합 세포
본 발명의 재조합 세포는 효모 및 박테리아로 이루어지는 군에서 선택될 수 있다.
본 발명의 재조합 숙주 세포와 같은 본 발명의 재조합 세포는 바람직하게는 재조합 효모 세포이다.
일반적으로, 효모는 빠르게 성장할 수 있고, 박테리아와 비교하여 더 높은 밀도로 배양될 수 있으며, 산업적 환경에서 무균 환경을 요구하지 않는다. 또한, 효모 세포는 박테리아 세포와 비교하여 배양 배지로부터 더 쉽게 분리될 수 있어, 생성물 추출 및 정제 과정을 크게 단순화시킬 수 있다.
본 발명의 재조합 세포, 특히 본 발명의 효모 세포는 바람직하게는 사카로마이세탈레스 (Saccharomycetales) 세포이다.
본 발명의 재조합 세포, 및 특히 본 발명의 재조합 효모는 특히 사카로마이세스 (Saccharomyces) 속, 또는 칸디다 (Candida) 속, 또는 클루이베로마이세스 (Kluyveromyces) 속, 또는 오가타에아 (Ogataea)속, 또는 야로위아 (Yarrowia) 속, 또는 데바리오마이세스 (Debaryomyces) 속, 또는 아쉬비아 (Ashbya) 속에 속할 수 있다.
사카로마이세스 속에 속하는 본 발명의 재조합 세포는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae), 사카로마이세스 보울라르디이 (Saccharomyces boulardii), 사카로마이세스 바야누스 (Saccharomyces bayanus), 사카로마이세스 파라독수스 (Saccharomyces paradoxus), 사카로마이세스 미카타에 (Saccharomyces mikatae), 사카로마이세스 카스텔리 (Saccharomyces castelli), 사카로마이세스 카리오카누스 (Saccharomyces cariocanus), 사카로마이세스 쿠드리아브제비이 (Saccharomyces kudriavzevii), 사카로마이세스 아르보리콜루스 (Saccharomyces arboricolus), 사카로마이세스 파스토리아누스 (Saccharomyces pastorianus), 사카로마이세스 우바룸 (Saccharomyces uvarum) 및 사카로마이세스 델브루엑키이 (Saccharomyces delbrueckii) 로 이루어지는 군에서 선택될 수 있다.
칸디다 속에 속하는 본 발명의 재조합 세포는 칸디다 알비칸스 (Candida albicans), 칸디다 글라브라타 (Candida glabrata), 칸디다 트로피칼리스 (Candida tropicalis), 칸디다 두블리니엔시스 (Candida dubliniensis), 칸디다 파라프실로시스 (Candida parapsilosis), 칸디다 루시타니에 (Candida lusitaniae) 및 칸디다 길리에르몬디이 (Candida guilliermondii) 로 이루어지는 군에서 선택될 수 있다.
클루이베로마이세스 속에 속하는 본 발명의 재조합 세포는 클루이베로마이세스 락티스 (Kluyveromyces lactis), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 클루이베로마이세스 폴리스포루스 (Kluyveromyces polysporus), 클루이베로마이세스 테르모톨레렌스 (Kluyveromyces thermotolerens), 클루이베로마이세스 도브잔스키이 (Kluyveromyces dobzhanskii) 및 클루이베로마이세스 위커하미이 (Kluyveromyces wickerhamii) 로 이루어지는 군에서 선택될 수 있다.
오가타에아 속에 속하는 본 발명의 재조합 세포는 오가타에아 폴리모르파 (Ogataea polymorpha), 오가타에아 히스트리아니카 (Ogataea histrianica), 오가타에아 데아키이 (Ogataea deakii), 오가타에아 콜롬바넨시스 (Ogataea kolombanensis), 오가타에아 필로덴드라 (Ogataea philodendra), 오가타에아 시아멘시스 (Ogataea siamensis), 오가타에아 안구스타 (Ogataea angusta), 오가타에아 파라폴리모르파 (Ogataea parapolymorpha), 오가타에아 미누타 (Ogataea minuta), 오가타에아 논페르멘탄스 (Ogataea nonfermentans) 및 오가타에아 코다마에 (Ogataea kodamae) 로 이루어지는 군에서 선택될 수 있다.
야로위아 속에 속하는 본 발명의 재조합 세포는 야로위아 리폴리티카 (Yarrowia lypolytica), 야로위아 파로포니이 (Yarrowia parophonii), 야로위아 갈리 (Yarrowia galli), 야로위아 오슬로넨시스 (Yarrowia oslonensis), 야로위아 알리멘타리아 (Yarrowia alimentaria), 야로위아 홀란디카 (Yarrowia hollandica) 및 야로위아 야쿠시멘시스 (Yarrowia yakushimensis) 로 이루어지는 군에서 선택될 수 있다.
데바리오마이세스 속에 속하는 본 발명의 재조합 세포는 데바리오마이세스 한세니이 (Debaryomyces hansenii), 데바리오마이세스 카르소니이 (Debaryomyces carsonii), 데바리오마이세스 카스텔리이 (Debaryomyces castellii), 데바리오마이세스 마라마 (Debaryomyces marama), 데바리오마이세스 옥시덴탈리스 (Debaryomyces occidentalis), 데바리오마이세스 오비포르미스 (Debaryomyces oviformis), 데바리오마이세스 네팔렌시스 (Debaryomyces nepalensis), 데바리오마이세스 쿠데르티이 (Debaryomyces coudertii), 데바리오마이세스 우데니이 (Debaryomyces udenii), 데바리오마이세스 사이크로스포루스 (Debaryomyces psychrosporus) 및 데바리오마이세스 야마다에 (Debaryomyces yamadae) 로 이루어지는 군에서 선택될 수 있다.
아쉬비아 속에 속하는 본 발명의 재조합 세포는 아쉬비아 고시피이 (Ashbya gossypii) 및 아쉬비아 아세리 (Ashbya aceri) 로 이루어지는 군에서 선택될 수 있다.
본 발명의 재조합 세포, 특히 본 발명의 재조합 효모 세포는, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae), 사카로마이세스 보울라르디이 (Saccharomyces boulardii), 사카로마이세스 바야누스 (Saccharomyces bayanus), 사카로마이세스 파라독수스 (Saccharomyces paradoxus), 사카로마이세스 미카타에 (Saccharomyces mikatae), 사카로마이세스 카스텔리 (Saccharomyces castelli), 칸디다 알비칸스 (Candida albicans), 칸디다 글라브라타 (Candida glabrata), 칸디다 트로피칼리스 (Candida tropicalis), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 클루이베로마이세스 폴리스포루스 (Kluyveromyces polysporus) , 클루이베로마이세스 테르모톨레렌스 (Kluyveromyces thermotolerens), 오가타에아 폴리모르파 (Ogataea polymorpha), 야로위아 리폴리티카 (Yarrowia lypolytica), 데바리오마이세스 한세니이 (Debaryomyces hansenii) 및 아쉬비아 고시피이 (Ashbya gossypii) 로 이루어지는 군에서 선택될 수 있고, 바람직하게는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 이다.
특정 구현예에서, 본 발명에 따른 재조합 효모 세포는 사카로마이세스, 클루이베로마이세스 또는 에레모테시움 (Eremothecium) 속의 것이고, 보다 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 오가타에아 폴리모르파 (Ogataea polymorpha) 및 아쉬비아 고시피이 (Ashbya gossypii) 로 이루어지는 군에서 선택되는 종의 것이다..
한 구현예에서, 본 발명의 재조합 숙주 세포는 사카로마이세탈레스 목, 특히 사카로마이세타세아에 과 (Saccharomycetaceae family) 에 속하고, 특히 야로위아 리포리티카 (Yarrowia lipolitica), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 오가타에아 폴리모르파 (Ogataea polymorpha), 아쉬비아 고시피이 (Ashbya gossypii) 및 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로 이루어지는 군에서 선택되는 효모이다.
본 발명의 재조합 세포는 가장 바람직하게는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 세포일 수 있다.
상기 언급된 바와 같이, 본 발명에 따른 재조합 세포는 본 발명에 따른 하나 이상의 재조합 핵산의 삽입에 의해 콘드로이틴을 생산하는 능력을 갖는다. 특정 구체예에서, 본 발명에 따른 재조합 효모는 본 발명에 따른 하나 이상의 재조합 핵산의 삽입에 의해 제어된 크기 (제어된 분자량) 를 갖는 콘드로이틴을 생산하는 능력을 갖는다.
유전자 내에 특정 DNA 구축물을 삽입하기 위해 실행되는 방법은 당업자의 일반적인 지식에 속한다. 관련 방법은 이하 예에서 더 상세히 기재된다.
그러나, 예를 들어 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 의 게놈에서 세포의 게놈 내에, 특히 효모의 게놈 내에 DNA 구축물의 삽입의 결과가 예측할 수 없기 때문에, 예상치 못한 기술적 어려움에 직면하였다. 특히, 세포, 특히 효모의 생존율, 및 원하는 콘드로이틴을 성장시키고 생산하는 이들의 능력도 예측할 수 없다.
본 발명의 재조합 세포, 특히 재조합 효모를 수득하기 위해서, 많은 상이한 구축물을 생존가능하고 효율적인 재조합 세포, 특히 효모를 수득하기 위해 본 발명자들에 의해 시험하였다.
배양 조건
본 발명은 또한 콘드로이틴, 특히 제어된 분자량의 콘드로이틴의 생산을 위한 본 발명의 재조합 세포의 용도에 관한 것이다.
본 발명은 또한 하기 단계를 포함하는, 원하는 분자량의 콘드로이틴을 생산하는 방법에 관한 것이다:
(a) 본원에서 정의된 바와 같은 재조합 세포를 원하는 분자량의 콘드로이틴을 생산하기에 충분한 시간 동안 배양 배지에서 배양하는 단계; 및
(b) 임의로는 재조합 세포 및/또는 배양 배지로부터 콘드로이틴을 단리하거나 회수하는 단계. 전형적으로, 본 발명의 세포, 특히 본 발명의 효모는 적절한 배양 배지에서 약 20℃ 내지 약 37℃ 범위의 온도, 바람직하게는 27℃ 내지 34℃ 범위의 온도에서 성장한다.
본 발명의 세포, 특히 본 발명의 효모를 위한 적합한 성장 배지는 효모 질소 베이스 (base), 암모늄 술페이트 및 덱스트로오스를 탄소/에너지 공급원으로서 포함하는 브로쓰 또는 YPD 배지, 가장 잘 성장시키기 위한 최적 비율로의 펩톤, 효모 추출물 및 덱스트로오스의 배합물과 같은 통상적인 상업적으로 제조된 배지이다. 다른 정의된 또는 합성 성장 배지가 또한 사용될 수 있고, 특정 세포, 특히 효모의 성장을 위한 적절한 배지는 미생물학 또는 발효 과학의 당업자에 의해 알려질 것이다.
본원에서 적합한 특정 배지는 하기 요소를 포함하는 SY 배지이다:
KH2PO4: 100 mM; MgSO4 7H2O: 2,8 mM; K2SO4: 11,5 mM; Na2SO4: 1,1 mM; NaCl: 2,6 mM; CaCl2 2H2O: 0,7 mM; CuSO4 5H2O: 15 μM; KI: 6 μM; FeCl3: 30 μM; ZnSO4 7H2O: 61 μM; MnSO4 H2O: 25 μM; H2SO4: 110 μΜ; 판토텐산 헤미칼슘 염: 42 μΜ; 티아민 히드로클로라이드: 59 μΜ; 피리독신 히드로클로라이드: 49 μΜ ; 마이오-이노시톨 (C6H12O6): 555 μΜ ; 니코틴산 (C6H5NO2): 29 μM ; D-비오틴: 0,82 μΜ; 암모늄 시트레이트 3염기: 33 mM; 및 글루코오스 또는 수크로오스 2-30%.
배양 배지에서 사용될 수 있는 탄소원은 프룩토오스, 만노오스, 자일로오스 및 아라비노오스; 올리고당류 예컨대 락토오스, 말토오스, 갈락토오스 또는 수크로오스; 다당류 예컨대 전분 또는 셀룰로오스 또는 이의 혼합물; 및 치즈 유청 투과액 옥수수 침지액, 사탕무 당밀 및 보리 맥아와 같은 재생가능한 공급원료로부터의 비정제된 혼합물을 포함한다.
배양 배지에 포함될 수 있는 질소원은 펩톤, 효모 추출물, 고기 추출물, 맥아 추출물, 우레아, 암모늄 술페이트, 암모늄 클로라이드, 암모늄 니트레이트, 암모늄 포스페이트, 암모늄 시트레이트 및 이의 조합을 포함한다.
배양 배지는 미량 원소 (예를 들어, 금속 염), 예를 들어 마그네슘 염, 코발트 염 및/또는 망간 염; 뿐만 아니라 아미노산, 비타민, 성장 촉진제 등과 같은 성장 인자를 추가로 포함할 수 있다.
포함될 수 있는 비타민의 예는 판토텐산 헤미칼슘, 티아민 히드로클로라이드; 피리독신 히드로클로라이드; Myo-이노시톨; 니코틴산; D-바이오틴, 엽산, p-아미노벤조산, 리보플라빈이다.
본 발명의 배양 배지는 CuSO4ㆍ5H2O, KI, FeCl3, ZnSO4ㆍ7H2O, MnSO4ㆍH2O, 또는 H2SO4, MgCl2, CaCl2, NaCl, K2HPO4, KH2PO4, ZnCl, H3BO3, MnSO4, Na2MoO4 와 같은 희귀 요소를 추가로 포함할 수 있다.
용어 "적절한 배양 배지" 는 상기 정의되어 있다.
본 발명에 따른 재조합 세포에 대한 공지된 배양 배지의 예는 당업자에게 공지되어 있으며, 다음의 출판물 [D. Burke et al., Methods in yeast Genetics - A cold spring harbor laboratory course Manual (2000)] 에 제시되어 있다.
발효에 적합한 pH 범위는 pH 3.0 과 pH 7.5 사이일 수 있으며, 여기서 초기 조건으로서 pH 4 내지 pH 6 이 바람직하다.
본 명세서의 다른 곳에서 언급된 바와 같이, 배양 배지의 pH 값은 콘드로이틴 활성을 갖는 폴리펩티드의 활성을 조절하기 위해 본 발명의 방법의 배양 단계 동안 조절될 수 있으며 이는 본 발명의 재조합 세포에 의해, 특히 본 발명의 재조합 효모에 의해 생산된 콘드로이틴 분자의 분자량에 영향을 미칠 것이다.
특히, 배양 배지의 pH 는 재조합 효모에 의해 생산되는 것으로 의도되는 콘드로이틴에 따라 변형될 수 있다. 예를 들어, 배양 배지의 pH 는 배양 시간 동안 pH 4, 5,5 또는 6 에서 유지될 수 있다.
특정 구현예에서, 배양 배지의 pH 는 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모의 배양의 시간 길이 동안 변화할 수 있거나 변화될 수 있다. 이전에 언급한 바와 같이, 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 는 그것이 배양되는 배지를 산성화시키고, 따라서 그의 배양 배지의 pH 를 감소시킨다. 예를 들어, 배양 배지의 pH 는 6 에서 시작할 수 있고, 4 로 내려간 다음 6 으로 되돌아올 수 있다. 또 다른 예에서, 배양 배지의 pH 는 6 에서 시작하여 6 에서 남아 있거나 유지된 다음 4 로 낮아질 수 있다.
특정 구현예에서, 배양 배지의 pH 는 본 발명의 방법의 배양 단계 (a) 동안 조절될 수 있어서, 본 발명의 방법의 배양 단계의 말미에, 배양 배지의 pH 는 상기 배양 단계 (a) 의 시작시 pH 와 동일하다.
또 다른 구현예에서, 배양 배지의 pH 는 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모 세포의 배양의 시간 길이 동안 동일하게 유지될 수 있다.
본 발명에 따른 재조합 세포, 특히 본 발명의 재조합 효모의 상기 배양의 시간 길이는 관심 콘드로이틴의 분자량에 따라 달라질 수 있다. 상기 시간 길이가 길수록, 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모 세포의 주어진 배양 배지에서 콘드로이틴의 분자량이 감소된다.
본 발명의 재조합 세포, 특히 본 발명의 재조합 효모의 배양 시간의 시간 길이는 약 35 시간 내지 약 50 시간, 바람직하게는 약 40 시간 내지 약 50 시간, 특히 약 48 시간의 기간일 수 있다.
발효는 호기성 조건 또는 미세호기성 조건 하에 수행될 수 있다.
발효 배지 중 콘드로이틴 생성물의 양은 당업계에 공지된 다수의 방법, 예를 들어 고성능 액체 크로마토그래피 (HPLC) 또는 기체 크로마토그래피 (GC) 를 사용하여 결정될 수 있다.
본 공정은 발효의 회분식 방법을 이용할 수 있다. 고전적인 회분식 발효는 배지의 조성이 발효의 초기에 설정되고 발효 동안 인위적으로 변경되지 않는 폐쇄된 시스템이다. 따라서, 발효의 초기에, 배지에 원하는 유기체 또는 유기체들을 접종하고, 시스템에 아무것도 첨가하지 않고 발효가 일어나도록 허용한다. 그러나 전형적으로, "회분식 (batch)" 발효 방법 또는 시스템은 탄소원의 첨가와 관련되는 회분이며 온도, pH 및 산소 농도와 같은 제어 인자에서 종종 시도된다. 회분식 시스템에서, 시스템의 대사물질 및 바이오매스 조성은 발효가 중지될 때까지 일정하게 변화된다. 회분식 배양물 내에서 세포는 정적 지연 단계 (static lag phase) 를 통해 고성장 로그 단계로, 그리고 마지막으로 성장 속도가 감소되거나 정지되는 정지 단계로 진행된다. 치료하지 않는 경우, 정지 단계에서의 세포는 결국 죽게 된다. 로그 단계에서의 세포는 일반적으로 최종 생성물 또는 중간체의 대량 생산을 담당한다.
본 발명에서는 유가식 (Fed-Batch) 시스템을 또한 사용할 수 있다. 유가식 시스템은 발효가 진행됨에 따라 탄소원 기질이 증분으로 첨가되는 것을 제외하고는 전형적인 회분식 시스템과 유사하다. 유가식 시스템은 이화생성물 억제 (예를 들어, 글루코오스 억제) 가 세포의 대사를 억제하기 쉽고 배지 내에 제한된 양의 기질을 갖는 것이 바람직한 경우에 유용하다. 유가식 시스템에서의 실제 기질 농도의 측정은 어렵고, 따라서 pH, 용존 산소 및 폐가스 예컨대 CO2 의 분압과 같은 측정가능한 인자의 변화를 기반으로 추정된다.
회분식 및 유가식 배양 방법은 통상적이고 당업계에 잘 알려져 있으며, 예는 Biotechnology: A Textbook of Industrial Microbiology, Crueger, Crueger, and Brock, Second Edition (1989) Sinauer Associates, Inc., Sunderland, MA, 또는 Deshpande, Mukund V., Appl. Biochem. Biotechnol., 36, 227, (1992) 에서 발견될 수 있다. 본 발명은 회분식 모드로 수행되지만, 방법은 연속 발효에 적합할 것으로 예상된다.
연속 발효는 정의된 발효 배지가 생물반응기에 연속적으로 첨가되고 동일한 양의 조건화된 배지가 처리를 위해 동시에 제거되는 개방 시스템이다. 연속 발효는 일반적으로 세포가 주로 로그 단계 성장에 있는 일정한 높은 밀도로 배양을 유지한다.
연속 발효는 세포 성장 또는 최종 생성물 농도에 영향을 미치는 하나의 인자 또는 임의의 수의 인자의 조절을 허용한다. 예를 들어, 하나의 방법은 탄소원 또는 질소 수준과 같은 제한 영양소를 고정된 비율로 유지하고 모든 다른 매개변수가 변화되도록 할 것이다. 다른 시스템에서, 배지 혼탁도에 의해 측정되는 세포 농도가 일정하게 유지되면서, 성장에 영향을 미치는 다수의 인자가 연속적으로 변경될 수 있다. 연속 시스템은 정상 상태 (steady state) 성장 조건을 유지하고자 분투하며, 따라서 배지가 배출되는 것으로 인한 세포 손실은 발효에서의 세포 성장 속도에 대해 균형을 이루어야 한다. 생성물 형성 속도를 최대화하기 위한 기법 뿐만 아니라 연속적인 발효 공정을 위한 영양소 및 성장 인자를 조절하는 방법은 산업 미생물학 분야에 잘 알려져 있다.
본 발명이 회분식, 유가식 또는 연속 공정을 사용하여 실시될 수 있으며 임의의 공지된 발효 모드가 적합할 것으로 고려된다. 추가적으로, 세포가 전체 세포 촉매로서 기질 상에 고정될 수 있으며 생산을 위한 발효 조건에 적용될 수 있는 것으로 고려된다.
콘드로이틴 생산을 여전히 개선하기 위해서, 특정 구현예는 상기 언급된 바와 같은 적절한 배지에서 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모 세포를 배양하는 것으로 이루어질 수 있으며, 여기서 상기 배양 배지는 최적의 양의 탄소원, 특히 글루코오스 또는 수크로오스를 포함한다.
바람직한 구현예에서, 상기 최적 배양 배지에 포함된 탄소원은 글루코오스 및/또는 수크로오스로 이루어진다. 바람직한 구현예에서, 상기 최적 배양 배지는 1% w/w 이상의 글루코오스 및/또는 수크로오스를 포함하고, 특히 5% w/w 이상의 글루코오스 및/또는 수크로오스를 포함하고, 특히 10% w/w 이상의 글루코오스 및/또는 수크로오스를 포함하고, 특히 15% w/w 이상의 글루코오스 및/또는 수크로오스를 포함한다. 바람직한 구현예에서, 상기 최적 배양 배지는 최대 40% w/w 글루코오스를 포함하며, 이는 최대 35% w/w 글루코오스를 포함한다.
바람직한 구현예에서, 본 발명의 방법은 산업적 규모로 실행된다.
보다 특히, 본 발명에 따른 방법의 배양 배지는 적어도 약 100L, 더욱 바람직하게는 약 1,000L 내지 약 3,000L 범위, 더욱 더 바람직하게는 약 10,000L, 더욱 더 바람직하게는 100,000L, 또는 심지어 약 250,000L 일 수 있다.
본 발명은 또한 이전에 기재된 바와 같은 콘드로이틴을 생산하는 방법에 관한 것이며, 하기 단계를 포함한다:
(a) 본 발명의 재조합 세포를 배양 배지에서 배양하는 단계; 및
(b) 상기 배양 배지로부터 콘드로이틴을 회수하는 단계,
여기서, 단계 (b) 에서 회수된 콘드로이틴은 하기의 선택을 통해 제어된 분자량을 갖는다:
- 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 성질 및 기원,
- 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산의 발현을 제어하는 프로모터의 성질 및 기원,
- 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산과 연관된 고정 신호의 존재 또는 부재,
- 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모를 배양하는 단계 동안 배양 배지의 pH, 및/또는
- 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모의 배양 지속기간.
콘드로이틴의 분자량은 특정 분자량 또는 더욱 바람직하게는 특정 범위의 분자량, 예를 들어, 50 kDa 미만, 약 20 kDa 내지 약 50 kDa 의 범위, 50 kDa 이상, 약 50 kDa 내지 약 150 kDa 의 범위, 약 50 kDa 내지 약 250 kDa 의 범위, 100 kDa 이상, 약 100 kDa 내지 약 1500 kDa 의 범위, 약 150 kDa 내지 약 1500 kDa 의 범위, 1000 kDa 초과 또는 1500 kDa 초과일 수 있다.
본 발명은 또한 약 20 kDa 내지 약 50 kDa 또는 약 50 kDa 내지 약 1000 kDa 범위의 분자량을 갖는 콘드로이틴의 생산을 위한 본 발명에 따른 재조합 세포, 특히 본 발명의 재조합 효모의 용도에 관한 것이다.
본 발명의 재조합 세포의 콘드로이티나제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은, 예를 들어, 큐피엔니우스 살레이 (Cupiennius salei), 티티우스 세르룰라투스 (Tityus serrulatus), 보스 타우루스 (Bos taurus),
아피스 멜리페라 (Apis mellifera), 마카카 물라타 (Macaca mulata), 또는 베스파 마그니피카 (Vespa magnifica) 중 적어도 하나로부터, 특히 이들의 분비될 때 (즉, 분비 신호의 존재 및 고정 신호의 부재 하에서) 서열 SEQ ID NO: 48 (Csa), SEQ ID NO: 49 (Ts), SEQ ID NO: 50 (Bt), SEQ ID NO: 51 (Am), SEQ ID NO: 52 (Mm) 또는 SEQ ID NO: 53 (Vm) 에 기재된 서열의 것으로부터 수득되거나 유래된 것으로부터 선택될 수 있다.
본 발명의 재조합 세포의 콘드로이티나제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은, 예를 들어, 큐피엔니우스 살레이 (Cupiennius salei), 티티우스 세르룰라투스 (Tityus serrulatus), 보스 타우루스 (Bos taurus),
아피스 멜리페라 (Apis mellifera), 마카카 물라타 (Macaca mulata), 또는 베스파 마그니피카 (Vespa magnifica) 중 적어도 하나로부터, 특히 이들의 고정될 때 (즉, 분비 신호 및 고정 신호 모두의 존재 하에서) 서열 SEQ ID NO: 54 (Csa), SEQ ID NO: 55 (Ts), SEQ ID NO: 56 (Bt), SEQ ID NO: 57 (Am), SEQ ID NO: 58 (Mm) 또는 SEQ ID NO: 59 (Vm) 에 기재된 서열의 것으로부터 수득되거나 유래된 것으로부터 선택될 수 있다.
본 발명의 재조합 세포의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 예를 들어 pTDH3, pTDH3.Sk, pTDH3-1.Sba, pTEF1, pTEF1.Ago, pTEF1.sba, pCCW12, pCCW12.Sba, pCCW120.Sm, pCWP2, pCW10.Ago, pNUP57 및 pFBA1 로 이루어진 군으로부터, 특히 pCCW12.Sba, pCW10.Ago 및 pNUP57 로 이루어진 군으로부터 선택되는 프로모터의 제어 하에 놓일 수 있다.
특히, 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 인코딩하는 하나 이상의 재조합 핵산의 프로모터는
사카로마이세스 바야누스 (Saccharomyces bayanus), 사카로마이세스 쿠드리아브제비이 (Saccharomyces kudriavzevii), 사카로마이세스 미카타에 (Saccharomyces mikatae), 사카로마이세스 아르보리콜라 (Saccharomyces arboricola) 또는 다른 사카로마이세트목 (saccharomycetales), 또는 아쉬비아 고시피이 (Ashbya gossypii) 로부터 수득되거나 유래될 수 있다.
본 발명의 분비 신호는 예를 들어 하기를 가질 수 있다:
- SEQ ID NO: 125 에 나타낸 핵산 서열; 및/또는
- SEQ ID NO: 126 에 기재된 아미노산 서열.
본 발명의 고정 신호는 예를 들어 하기를 가질 수 있다:
- SEQ ID NO: 127 에 나타낸 핵산 서열; 및/또는
- SEQ ID NO: 128 에 나타낸 아미노산 서열.
분비 신호는 신호 펩티드를 코딩하는 핵산 서열에 의해 출발하는 키메라 핵산, 이후 이전에 정의된 바와 같은 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산을 생성함으로써 콘드로이티나아제 활성을 갖는 폴리펩티드에 융합될 수 있다.
분비 신호 및 고정 신호는 신호 펩티드를 코딩하는 핵산 서열에 의해 출발하는 키메라 핵산, 이후 이전에 정의된 바와 같은 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산, 이후 고정 신호를 코딩하는 핵산 서열을 생성함으로써 콘드로이티나아제 활성을 갖는 폴리펩티드에 융합될 수 있다.
이러한 키메라 핵산 서열은 당업자에 의해 공지된 기법 예컨대 핵산의 화학적 합성 또는 임의의 재조합 기법 예컨대 클로닝 또는 PCR 에 의해 수득될 수 있다.
본 발명은 또한 약 10 kDa 미만의 분자량을 갖는 콘드로이틴을 생산하기 위한, 앞서 기재된 바와 같은 방법에 관한 것이며, 여기서:
(a) 배지의 pH 는 4 보다 높고, 특히 약 5 내지 약 7 의 범위이다;
(b) 본 발명의 재조합 세포의 게놈에 통합된 콘드로티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하거나 유래되고, 분비 신호를 보유하지만 고정 신호가 없고, pCCW12.sba 프로모터의 제어 하에 있다;
(c) 콘드로이티나아제 활성을 갖는 폴리펩티드는 히알루로니다아제이다;
(d) 배양 배지로부터 콘드로이틴을 회수하는 단계는 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모 세포의 배양을 시작한 후 약 48 시간에 수행된다;
재조합 세포는 특히 재조합 효모 세포, 보다 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 세포임.
본 발명은 또한 약 10 kDa 내지 약 50 kDa 의 분자량을 갖는 콘드로이틴을 생산하기 위한, 앞서 기재된 바와 같은 방법에 관한 것이며, 여기서:
(a) 배지의 pH 는 4 보다 높고, 특히 약 5 내지 약 7 의 범위이다;
(b) 본 발명의 재조합 세포의 게놈에 통합된 콘드로티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하거나 유래되고, 분비 신호를 보유하지만 고정 신호가 없고, pCCW10.Ago 프로모터의 제어 하에 있다;
(c) 콘드로이티나아제 활성을 갖는 폴리펩티드는 히알루로니다아제이다;
(d) 배양 배지로부터 콘드로이틴을 회수하는 단계는 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모 세포의 배양을 시작한 후 약 48 시간에 수행된다;
재조합 세포는 특히 재조합 효모 세포, 보다 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 세포임.
본 발명은 또한 약 50 kDa 내지 약 500 kDa 의 분자량을 갖는 콘드로이틴을 생산하기 위한, 앞서 기재된 바와 같은 방법에 관한 것이며, 여기서:
(a) 배지의 pH 는 4 보다 높고, 특히 약 5 내지 약 7 의 범위이다;
(b) 본 발명의 재조합 세포의 게놈에 통합된 콘드로티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산은 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하거나 유래되고, 분비 신호를 보유하지만 고정 신호가 없고, pNUP57 프로모터의 제어 하에 있다;
(c) 콘드로이티나아제 활성을 갖는 폴리펩티드는 히알루로니다아제이다;
(d) 배양 배지로부터 콘드로이틴을 회수하는 단계는 본 발명의 재조합 세포, 특히 본 발명의 재조합 효모 세포의 배양을 시작한 후 약 48 시간에 수행된다;
재조합 세포는 특히 재조합 효모 세포, 보다 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 세포임.
본 발명의 또 다른 양상은 본 발명의 재조합 세포 또는 본 발명에 따른 방법으로부터 수득하거나 수득할 수 있는 콘드로이틴에 관한 것이다.
본 발명의 추가 양상은 본 발명의 콘드로이틴을 포함하는 배양 배지이다.
본 발명은 또한 본 발명에 따른 콘드로이틴을 포함하는 조성물에 관한 것이다.
본 발명은 또한 (i) 본 발명의 콘드로이틴, (ii) 본 발명의 콘드로이틴을 포함하는 배양 배지 또는 (iii) 본 발명의 콘드로이틴을 포함하는 조성물을 포함하는 공산품 또는 소비재 또는 소모품에 관한 것이다.
특시, 본 발명에 따른 상기 공산품 또는 소비재 또는 소모품은 화장품, 향미 제품, 향료 제품, 식료품, 식품, 음료, 식감제, 약학 조성물, 식이 보충제, 기능식품, 세정 제품 및/또는 치아 및/또는 구강 위생 조성물일 수 있다.
콘드로이틴의 정제
본 발명의 특정 양상에 따르면, 콘드로이틴의 발효 생산은 바람직하게는 배양 배지로부터 생성된 콘드로이틴을 단리하는 단계를 포함한다. 배양 배지로부터 콘드로이틴을 회수하는 것은 당업자에게 일상적인 작업이다. 이는 투과증발, 선택적 침전, 여과, 원심분리, 분무 건조, 동결건조 또는 액체 추출을 포함하지만 이에 제한되지 않는 당업계에 잘 알려진 다수의 기법에 의해 달성될 수 있다. 당해 분야의 전문가는 분리하고자 하는 재료의 특징에 따라 각 기법의 매개변수를 조정하는 방법을 알고 있다.
본 발명에서 세포 모델로서의 효모는 합성된 콘드로이틴이 세포 외부로 모두 배출되어 정제 공정을 단순화시킨다는 점에서 바람직하다.
가스 스트리핑은 헬륨, 아르곤, 카본 디옥시드, 수소, 질소 또는 이의 혼합물 중에서 선택되는 스트리핑 가스로 달성된다.
액체 추출은 펜탄, 헥산, 헵탄 또는 도데칸과 같은 소수성 상으로서의 유기 용매로 달성된다. 재생 용매가 또한 사용될 수 있다.
제형 및 생성물
본 발명의 조성물은 제형/생성물, 예컨대 기능식품, 약학, 수의학, 양조학 또는 화장 제형/생성물에 포함될 수 있다.
따라서, 본 발명은 본 발명의 조성물을 포함하는 제형을 제공한다. 예를 들어, 본 발명은 본 발명의 조성물을 포함하는 화장 제형을 제공할 수 있다.
본 발명은 또한 본 발명의 조성물을 포함하는 생성물을 제공한다. 예를 들어, 본 발명은 본 발명의 조성물을 포함하는 화장품을 제공할 수 있다.
"화장품" 은 인체의 외부 부분 (표피, 모발 시스템, 손톱, 입술 및 외부 생식 기관) 또는 치아와 구강의 점막과 접촉하게 배치되도록 의도된 임의의 물질 또는 혼합물을 의미하는 것으로 의도되는데, 이는 이들을 단독으로 또는 주로 세정하고, 이들을 훈습하고, 이들의 외관을 변경하고, 이들을 보호하고, 이들을 양호한 상태로 유지하고, 체취를 교정하고/하거나 이의 조합을 위한 것이다.
"물질" 은 그의 안정성을 보존하기 위해 필요한 임의의 첨가제 및 사용된 공정으로부터 유래하는 임의의 불순물을 포함하지만 물질의 안정성에 영향을 주거나 그의 조성을 변화시키지 않으면서 분리될 수 있는 임의의 용매를 제외하여, 자연 상태의 또는 임의의 제조 공정에 의해 수득된 화학 원소 및 그의 화합물을 의미하는 것으로 의도된다.
"혼합물" 은 둘 이상의 물질로 구성된 혼합물 또는 용액을 의미하는 것으로 의도된다.
본 발명은 또한 기능식품, 약학, 수의학, 양조학 또는 화장 제형/생성물에서의 본 발명의 조성물의 용도를 제공한다.
이러한 제형 또는 생성물은 이하에서 "본 발명의 제형 또는 생성물" 로 지칭된다.
기능식품, 약학, 수의학, 양조학 또는 화장 제형/생성물은 임의로는 약학/수의학/화장 (화장 활성물 포함) 성분, 예컨대 적절한 부형제, 담체 및 이의 혼합물을 추가로 포함할 수 있다.
"화장품" 또는 "화장 활성 성분" 은 개별적으로 또는 화합물, 성분, 중간체, 분자, 물질, 원료 또는 생성물, 배합물, 조성물, 제형 (피부 보습제, 크림, 밤, 세럼, 오일, 눈, 얼굴 화장, 워시 오프 (wash off) 헤어 제품, 리브-온 (leave-on) 헤어 제품, 모발 착색제 (천연 모발 착색제를 포함하나 이에 제한되지 않음) 및/또는 이의 조합을 포함하나 이에 제한되지 않음), 완제품 및 관련 기술 (예를 들어, 화장 제형에 혼입된 성분 (예를 들어, 피부, 모발, 두피 등에 활성을 갖지 않지만 완제품의 제형에서 역할을 하는 천연 착색제, 보존제, 유화제, 산화방지제 등을 포함하지만 이에 제한되지 않음) 을 포함하지만 이에 제한되지 않음), 전달 시스템, 마케팅 보조제 (예를 들어, 반투명한 제형에 적용되는 착색 유니스피어) 및 하기에서 유용하고/하기에서 사용되고/하기에 의도되는 이에 관련된 무엇이든 제조하는 방법과의 혼합의 일부로서의, 임의의 및 모든 자연적, 자연 발생적, 자연 동일, 합성, 합성적으로 제조된, 생합성적으로 제조된, 지속가능, 재생가능 및/또는 생분해성 화합물, 성분, 중간체, 분자, 물질, 원료 또는 생성물을 의미한다:
- 사람 또는 동물 신체 상에 또는 이에 문지르거나, 붓거나, 뿌리거나, 분무하거나 다른 방식으로 직접 및/또는 사람 또는 동물 신체의 다양한 외부 및/또는 표면 부분 (피부, 모발, 체모, 모발 시스템, 두피, 손톱, 입술, 외부 생식기, 치아, 구강 및/또는 비강 점막 등을 포함하지만 이에 제한되지 않음) 과 접촉되게 배치함으로써 적용; 및/또는 사람 또는 동물 신체 상에 또는 이에 간접적으로 적용, 예를 들어 직물의 일부로서 적용 또는 직물에 적용된 전달 장치 (예컨대 캡슐) 또는 전달 시스템 (예컨대 배합물 또는 제형) 의 일부로서 직물에 적용; 및/또는
- 사람 또는 동물 신체의 외부 부분 및/또는 표면 (예를 들어 비제한적으로 두피) 또는 인간 또는 동물 신체의 미적 외관을 세정, 관리, 냉각, 미용, 컨디셔닝, 치료, 진정, 텍스처라이징, 매력 증진, 보호, 유지, 개선, 향상, 변경 및/또는 변화시킴; 및/또는 주로 세정 또는 발향, 또는 체취를 양호한 상태로 보호 또는 유지하거나 퇴치하거나, 피부의 진정, 치유, 회복 또는 재활성화, 수화를 제공함으로써 피부, 구강 점막, 두피 또는 모발의 외양을 변화시키거나 이의 불균형 상태를 교정 또는 복구하기 위함, 또는 건조함, 자극, 부상 또는 피로의 상태를 완화하고, 윤활하고, 촉촉하게 하고, 탄력을 주고, 치유하고, 살균하고, 완화하고, 교정 및/또는 치료하기 위해, 및/또는 착색 장애를 교장하거나 비듬, 여드름, 자극 및/또는 염증 등의 비약학적 예방 및/또는 치료를 제공하고/하거나 피부 표면의 세균총 (예를 들어 미생물군집) 의 균형을 재조정하기 위함 (예를 들어, 피부 표면의 유익한 세균총의 수준을 촉진함으로써) 및/또는 건강 및/또는 복지 목적을 위해 인간 또는 동물 신체를 양호한 상태로 유지하기 위한 목적으로 및/또는 예를 들어, 인간 또는 신체에 적용되는 생성물의 외관을 개선함으로써 인간 또는 동물 신체의 외관을 개선하기 위함; 및/또는
- 미용 및/또는 피부과 기능 및/또는 생물학적 활동 이익을 갖는 이익 (그러나 신체의 구조 또는 기능에 영향을 주지 않음) 을 제공. 의심의 여지를 피하기 위해, 화장품 또는 화장 활성 성분 또는 이의 임의의 부분은 또한 기능적 성분 및/또는 기능식품으로서의 자격을 가질 수 있다.
"기능적 성분" 은 의약 또는 건강상 이익을 제공하는 식품 성분 또는 식품의 일부를 의미하며, 카로티노이드, 식이 섬유, 지방산, 사포닌, 산화방지제, 플라보노이드, 이소티오시아네이트, 페놀, 폴리페놀 (예컨대 레스베라트롤), 식물 스테롤 또는 스타놀 (피토스테롤 및 피토스타놀), 폴리올, 프리바이오틱 (prebiotic), 피토에스트로겐, 대두 단백질, 술파이드/티올, 비타민, 글루코사민, 보존제, 수화제, 식용 겔화 성분, 식용 겔 믹스 및 겔 조성물, 장쇄 1차 지방족 포화 알코올, 색상제, 텍스쳐화제, 유화제 및 이의 조합 중 임의의 것을 포함한다.
"기능식품" 은 인체의 외양을 개선하거나 유지할 뿐만 아니라, 건강 및/또는 미용 이익과 관련되는 임의의 그리고 모든 자연적, 자연 발생적, 지속가능, 합성적으로 제조되고 생합성적으로 제조된 화합물, 화합물의 혼합물, 기능적 성분, 분자, 조성물, 원료 및 중간체 (이에 관련된 성분 및 전달 장치 (예컨대 캡슐), 이의 전달 시스템 (예컨대 배합물 또는 제형) 및 전술한 것의 제조 방법 포함) 를 의미한다. 의심의 여지를 피하기 위해, 기능식품은 고체 제형, 캡슐, 정제, 액체 제형, 용액 또는 현탁액이든간에 식품 또는 음료에 대한 보충제로서 사용될 수 있는 화합물을 포함한다.
대안적으로, 기능식품, 약학, 수의학, 양조학 또는 화장 제형/생성물은 본 발명의 조성물로 이루어지거나 본질적으로 이루어질 수 있다.
화장 제형/생성물은 노화방지 제형일 수 있다.
본원에 사용된 바와 같이, 약학적으로, 수의학적으로 또는 미용적으로 허용가능한 부형제에 대한 언급은 당업자에게 공지된 바와 같은 약학적으로, 수의학적으로 또는 미용적으로 허용가능한 보조제, 희석제 및/또는 담체를 지칭할 수 있다.
"약학적/수의학적/미용적으로 허용가능한"은 조성물의 추가 성분이 일반적으로 안전하고, 비-독성이며, 생물학적으로나 달리 바람직하지 않다는 것을 의미한다. 예를 들어, 추가 성분은 일반적으로 무균이며 발열원 (pyrogen) 이 없을 수 있다. 이러한 성분은 본 발명의 조성물과 상용성이며 이의 수용자에게 해롭지 않은 의미에서, "허용가능" 해야 한다. 따라서, "약학적으로 허용가능한 부형제"는 단지 부형제로서 작용하도록 의도된, 즉 생물학적 활성 자체를 갖도록 의도되지 않은 제형의 일부를 형성하는데 사용되는 임의의 화합물(들) 을 포함한다.
기능식품, 약학, 수의학, 양조학 또는 화장 제형/생성물은 액체 또는 고체의 형태일 수 있다.
경구 투여를 위한 액체 투여 제형/제품은 용액, 유액, 수성 또는 유성 현탁액, 시럽 및 엘릭시르 (elixir) 를 포함한다.
경구 투여용으로 의도된 것들과 같은 본원에 기재된 제형 및 생성물 (예를 들어 약학, 수의학 또는 화장 제형/생성물) 은, 예를 들어 제형/생성물의 성분을 함께 혼합하는 것과 같이 당업자에게 공지된 방법에 따라 제조될 수 있다.
제형 또는 생성물 (예를 들어, 약학, 수의학 또는 화장 제형/생성물) 은 하나 이상의 추가 성분, 예컨대 약학 성분 및 부형제, 예컨대 감미제, 향미제, 착색제 및 보존제를 함유할 수 있다.
제형 또는 생성물 (예를 들어, 약학, 수의학 또는 화장 제형/생성물) 은 또한 하나 이상의 추가 활성 성분, 예컨대 화장 또는 약학 활성 성분, 예컨대 히알루론산, 병풀 추출물, 펩티드 예컨대 Matrixyl® 및 Argireline®, 및 이의 혼합물을 함유할 수 있다.
본 발명의 제형 또는 생성물은 활성 성분(들) 을 비독성인 약학적으로 허용가능한 부형제 (또는 성분) 와 혼합하여 함유할 수 있다. 이들 부형제 (또는 성분) 는, 예를 들어, 불활성 희석제, 예컨대 칼슘 카르보네이트, 소듐 카르보네이트, 락토오스, 칼슘 포스페이트 또는 소듐 포스페이트; 과립화제 및 붕괴제, 예를 들어 옥수수 전분, 말토덱스트린 또는 알긴산; 결합제, 예를 들어 전분, 젤라틴 또는 아카시아; 및 윤활제, 예를 들어 마그네슘 스테아레이트, 스테아르산, 탈크 및 이의 혼합물일 수 있다.
액체 제형 또는 생성물 (예를 들어, 약학, 수의학 또는 화장 제형/생성물) 은 캡슐 내에 함유될 수 있으며, 이는 상기 정의된 바와 같이 코팅되지 않거나 코팅될 수 있다.
적합한 약학적 또는 수의학적 담체는 불활성 고체 희석제 또는 충전제, 멸균 수용액 및 다양한 유기 용매를 포함한다. 액체 담체의 예는 시럽, 땅콩 오일, 올리브 오일, 인지질, 지방산, 지방산 아민, 폴리옥시에틸렌 및 물이다.
또한, 담체 또는 희석제는 글리세릴 모노스테아레이트 또는 글리세릴 디스테아레이트와 같은 당업계에 공지된 임의의 지속 방출 물질을 단독으로 또는 왁스와 혼합하여 포함할 수 있다.
적합한 약학적 담체는 불활성 멸균 수용액 및 다양한 유기 용매를 포함한다. 액체 담체의 예는 시럽, 식물성 오일, 인지질, 지방산, 지방산 아민, 폴리옥시에틸렌 및 물이다. 또한, 담체 또는 희석제는 글리세릴 모노스테아레이트 또는 글리세릴 디스테아레이트와 같은 당업계에 공지된 임의의 지속 방출 물질을 단독으로 또는 왁스와 혼합하여 포함할 수 있다.
적합한 화장용 담체는 전형적으로 피부 및/또는 모발 및/또는 두피와 같은 인체의 외부 표면에 국소 투여하기에 적합한 것들이다.
전형적으로, 이러한 담체는 피부과적으로 허용가능하다.
어구 "피부과적으로 허용가능한 담체" 는 담체가 각질 조직에 국소적으로 적용하기에 적합하고, 양호한 미적 특성을 가지고, 조성물 중의 활성물과 상용성이며, 어떠한 불합리한 안전성 또는 독성 우려도 야기하지 않는다는 것을 의미한다.
담체는 매우 다양한 형태일 수 있다. 일부 경우에, 성분 (예를 들어, 추출물, 자외선 차단제 활성물, 추가 성분) 의 용해도 또는 분산성은 담체의 형태 및 특성을 좌우할 수 있다. 비제한적인 예는 단순 용액 (예를 들어, 수성 또는 무수), 분산액, 유액 및 고체 형태 (예를 들어, 겔, 스틱, 유동성 고체 또는 비정질 물질) 를 포함한다.
피부과적으로 허용가능한 담체는 유액의 형태일 수 있다. 유액은 일반적으로 연속 수성상 (예를 들어, 수중유 및 수중유중수) 또는 연속 유상 (예를 들어, 유중수 또는 수중유) 을 갖는 것으로 분류될 수 있다. 본 발명의 유상은 실리콘 오일, 비-실리콘 오일 예컨대 탄화수소 오일, 에스테르, 에테르 등, 및 이의 혼합물을 포함할 수 있다. 수성상은 전형적으로 물 및 수용성 성분 (예를 들어, 수용성 보습제, 컨디셔닝제, 항미생물제, 보습제 및/또는 다른 피부 케어 활성제) 을 포함한다. 그러나 일부 경우에, 수성상은 수용성 보습제, 컨디셔닝제, 항미생물제, 보습제 및/또는 다른 수용성 피부 케어 활성제를 포함하지만 이에 제한되지 않는 물 이외의 성분을 포함할 수 있다. 일부 경우에, 조성물의 물이 아닌 성분은 습윤제, 예컨대 글리세린 및/또는 다른 폴리올(들) 을 포함한다. 유액은 또한 유화제를 함유할 수 있다. 유화제는 비이온성, 음이온성 또는 양이온성일 수 있다.
담체는 하나 이상의 피부과적으로 허용가능한 친수성 희석제를 함유할 수 있다. 본원에서 사용되는 바와 같이, "희석제"는 본 발명의 조성물이 분산, 용해 또는 다르게는 혼입될 수 있는 물질을 포함한다. 친수성 희석제는 물, 유기 친수성 희석제, 예컨대 저급 일가 알코올 (예를 들어, C1-C4), 및 저분자량 글리콜 및 폴리올, 예컨대 프로필렌 글리콜, 폴리에틸렌 글리콜, 폴리프로필렌 글리콜, 글리세롤, 부틸렌 글리콜, 1,2,4-부탄트리올, 소르비톨 에스테르, 1,2,6-헥산트리올, 에탄올, 이소프로판올, 소르비톨 에스테르, 부탄디올, 에테르 프로판올, 에톡실화 에테르, 프로폭실화 에테르 및 이의 조합을 포함한다.
화장 제형/생성물은 임의로는 화장 조성물에 통상적으로 사용되는 하나 이상의 추가 성분 (예를 들어, 착색제, 피부톤 제제, 피부 노화 방지제, 항염증제, 자외선 차단제, 이들의 조합 등) 을 포함할 수 있으며, 단, 추가 성분은 조성물에 의해 제공되는 항-당화 이익을 바람직하지 않게 변경하지 않는다.
일부 경우에, 활성제가 서로 간섭하지 않도록 상이한 생물학적 경로를 통해 기능하는 피부톤 제제를 선택하는 것이 바람직할 수 있으며, 이는 양 제제 모두의 효능을 감소시킬 수 있다. 추가의 성분은, 조성물에 혼입될 때, 과도한 독성, 부적합성, 불안정성, 알레르기 반응 등이 없이 인간 피부 조직과 접촉하여 사용하기에 적합해야 한다.
본원에서 사용되는 용어 "담체"는 또한 천연 생성물, 또는 말토덱스트린과 같이 이것이 유래된 천연 생성물과 구별되도록 변형 또는 개질된 천연물로부터 유래된 생성물을 지칭할 수 있다.
기능식품, 약학, 수의학, 양조학 또는 화장 제형 또는 생성물에 존재하는 본 발명의 조성물의 양은 적용에 따라 가변적일 것이다.
전형적으로, 기능식품, 약학, 수의학, 양조학 또는 화장 제형 또는 제품에 존재할 수 있는 본 발명의 조성물의 양은 기능식품, 약학, 수의학, 양조학 또는 화장 제형 또는 생성물의 약 0.001 내지 약 50 중량%, 예컨대 약 0.01 내지 약 30 중량% 또는 약 1 내지 약 20 중량% , 예컨대 제형 또는 생성물의 약 0.01 내지 약 20 중량%, 또는 약 0.1 내지 10 중량% 또는 약 1 내지 약 5 중량% 일 것이다.
당업자는 유전자 코드의 축퇴 성질로 인해, 그들의 뉴클레오티드 서열에서 상이한 다양한 DNA 분자가 본 개시물의 주어진 효소를 코딩하는데 사용될 수 있다는 것을 인식할 것이다. 상기 기재된 생합성 효소를 코딩하는 천연 DNA 서열은 단지 본 개시물의 구현예를 예시하기 위해 본원에서 참조되며, 본 개시물은 본 개시물의 방법에 이용되는 효소의 단백질 및 폴리펩티드의 아미노산 서열을 코딩하는 임의의 서열의 DNA 분자를 포함한다. 유사한 방식으로, 폴리펩티드는 전형적으로 원하는 활성의 손실 또는 상당한 손실 없이 그의 아미노산 서열에서 하나 이상의 아미노산 치환, 결실 및 삽입을 용인할 수 있다. 본 개시물은 변형된 또는 변이체 폴리펩티드가 참조 폴리펩티드의 효소적 동화 또는 이화 활성을 갖는 한, 본원에 기재된 특정 단백질과는 상이한 아미노산 서열을 갖는 이러한 폴리펩티드를 포함한다. 또한, 본원에 나타낸 DNA 서열에 의해 코딩된 아미노산 서열은 단지 본 개시물의 구현예를 예시한다.
본 개시물의 방법, 조성물 및 유기체에 유용한 특정 유전자 및 단백질이 본원에 기재되지만; 이러한 유전자에 대한 절대적 동일성이 필요하지 않다는 것이 인식될 것이다. 예를 들어, 폴리펩티드 또는 효소를 코딩하는 서열을 포함하는 특정 유전자 또는 폴리뉴클레오티드에서의 변화를 수행하고 활성에 대해 스크리닝할 수 있다. 전형적으로 이러한 변화는 보존적 돌연변이 및 침묵 돌연변이를 포함한다. 이러한 변형된 또는 돌연변이화된 폴리뉴클레오티드 및 폴리펩티드는 당업계에 공지된 방법을 사용하여 기능적 효소의 발현에 대해 스크리닝될 수 있다.
유전자 코드의 고유한 축퇴성으로 인해, 실질적으로 동일하거나 기능적으로 동등한 폴리펩티드를 코딩하는 다른 폴리뉴클레오티드가 또한 이러한 효소를 코딩하는 폴리뉴클레오티드를 클로닝하고 발현하는데 사용될 수 있다.
당업자에게 공지된 기법은 추가적인 상동 유전자 및 상동 효소를 확인하는데 적합할 수 있다. 일반적으로, 유사한 유전자 및/또는 유사한 효소는 기능적 분석에 의해 확인될 수 있으며 기능적 유사성을 가질 것이다.
당업자에게 공지된 기법은 유사한 유전자 및 유사한 효소 또는 임의의 생합성 경로 유전자, 단백질 또는 효소를 확인하는데 적합할 수 있으며, 기법은 관심 대상의 유전자/효소의 공개된 서열을 기반으로 하는 프라이머를 사용하는 PCR 에 의해, 또는 관심 대상의 유전자 중의 보존된 부위를 증폭하도록 설계된 축퇴 프라이머를 사용하는 축퇴 PCR 에 의해 유전자를 클로닝하는 것을 포함할 수 있으나 이에 제한되지 않는다. 또한, 당업자는 기능적 상동성 또는 유사성을 갖는 상동 또는 유사 유전자, 단백질 또는 효소를 확인하는 기법을 사용할 수 있다. 기법은 효소의 촉매 활성에 대한 세포 또는 세포 배양물을 상기 활성에 대한 시험관내 효소 어세이 (예를 들어, 본원 또는 Kiritani, K., Branched-Chain Amino Acids Methods Enzymology, 1970 에서 기재된 바와 같음) 를 통해 검사하는 것, 그런 다음 정제를 통해 상기 활성을 갖는 효소를 단리하는 것, 에드만 (Edman) 분해와 같은 기법을 통해 효소의 단백질 서열을 결정하는 것, 가능한 핵산 서열에 대한 PCR 프라이머의 설계, PCR 을 통한 상기 DNA 서열의 증폭, 및 상기 핵산 서열의 클로닝을 포함한다. 상동 또는 유사 유전자 및/또는 상동 또는 유사 효소, 유사 유전자 및/또는 유사 효소 또는 단백질을 확인하기 위해, 기법은 또한 후보 유전자 또는 효소에 관한 데이터를 BRENDA, KEGG 또는 MetaCYC 와 같은 데이터베이스와 비교하는 것을 포함한다. 후보 유전자 또는 효소는 본원의 교시에 따라 상기 언급된 데이터베이스 내에서 확인될 수 있다.
용어 "...와 ...사이" 및 "... 내지...의 범위" 는 달리 명시되지 않는 한, 한계치를 포함하는 것으로 이해되어야 한다. 본 명세서 및 후속하는 청구항에 걸쳐, 맥락상 달리 요구되지 않는 한, 단어 "포함하다" 및 이의 변형 예컨대 "포함한다", "포함하는" 및 "가지다" 는 언급된 정수 또는 단계 또는 정수들 또는 단계들의 군을 포함하지만 임의의 다른 정수 또는 단계 또는 정수 또는 단계의 군을 배제하지 않는 것으로 이해될 것이다. 용어 "포함하는"은 또한 "함유하는"뿐만 아니라 "~로 이루어지는"을 의미하고, 예를 들어, X 를 "포함하는" 조성물은 X 로만 이루어질 수 있거나 예를 들어 X + Y 와 같은 추가적인 어떤 것을 포함할 수 있다. 또한, 본 명세서 및 첨부된 청구항에서 사용된 바와 같이, 단수 형태는 맥락에서 명확하게 달리 지시하지 않는 한, 복수형 대상을 포함한다는 것에 유의해야 한다. 예를 들어, "유전자" 또는 "효소"에 대한 언급은 "하나 이상의 유전자" 또는 "하나 이상의 효소"에 대한 언급이다.
또한, 본 개시물이 본원에 기재된 특정 방법론, 프로토콜 및 시약에 제한되지 않는다는 것이 이해되어야 하는데, 이들이 가변적일 수 있기 때문이다. 또한 본원에서 사용되는 전문용어가 단지 특정한 구현예를 설명하기 위한 목적이고 본 개시물의 범주를 제한하려는 의도가 아니며, 본 개시물의 범주는 오직 첨부된 청구항에 의해서만 제한될 것임이 이해되어야 한다. 달리 정의되지 않는 한, 본원에서 사용된 모든 기술적 및 과학적 용어들은 당업자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 본 개시물에 따르면, 당업계의 기술 내에 있는 종래의 분자 생물학, 미생물학 및 재조합 DNA 기법이 사용될 수 있다.
본 개시물은 구성의 세부 사항 및 하기의 설명에 나타내거나 도면에 예시된 성분의 배열에 대한 그의 적용에 제한되지 않는다. 본 개시물은 다른 구현예가 가능하고 다양한 방식으로 실시되거나 실행되는 것이 가능하다. 또한, 본원에서 사용된 어법 및 전문용어는 설명의 목적을 위한 것이며 제한하는 것으로서 간주되어서는 안된다. 바람직하게는, 본원에서 사용되는 용어는 "A multilingual glossary of biotechnological terms: (IUPAC Recommendations)", Leuenberger, H.G.W, Nagel, B. and Kolbl, H. eds. (1995), Helvetica Chimica Acta, CH-4010 Basel, Switzerland 에서 기재된 바와 같이 정의된다.
본 명세서의 문서 전체에 걸쳐 몇몇 문헌이 인용된다. 본원에 인용된, 상기 또는 하기의, 각각의 문헌 (모든 특허, 특허 출원, 과학 간행물, 제조업체의 사양, 지침, GenBank 등록 번호 서열 제출 등 포함) 은 본 명세서에 그 전체가 참조로 포함된다.
하기의 실시예 및 도면은 본 발명의 암시적 제한 없이 예시로서 제시된다.
실시예
실시예 1: 본 발명에 따른 재조합 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 균주의 제조를 위한 프로토콜
이하 실행되는 모든 재조합 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 균주는 표준 효모 분자 유전학 절차 (Methods in yeast Genetics - A cold spring harbor laboratory course Manual (2000) by D. Burke, D. Dawson, T. Stearns CSHL Press) 를 사용하여 표준 균주로부터 구축하였다.
서열 상동성을 갖는 유리 DNA 말단을 효율적으로 재조합할 수 있는 효모의 능력을 사용하여 하기 언급된 유전자의 클러스터를 재조합 효모에 한번에 통합하였다.
또한, 하기 유전자형의 더 양호한 이해를 위해:
- jlp1, his 3, leu2, sam3 및 met14 은 삽입 위치이다.
- 소문자는 고려되는 유전자가 비활성임을 의미하고, 대문자는 활성 유전자를 반영한다.
- 유전자 뒤의 "::": 유전자가 뒤이어지는 것에 의해 중단된다는 것을 의미한다 (하나 초과의 유전자가 삽입되는 경우, 이들은 괄호 [] 로 표시됨). 유전자의 중단은 코딩 서열의 전체 결실에 수반되는 것이지만, 프로모터는 보존한다. 그 결과, "::" 에 뒤이어지는 유전자는 비활성이며 소문자로 표시된다. 명시되지 않은 경우 삽입된 유전자의 전사는 파괴된 유전자의 프로모터에 의해 제어된다.
- "gene.Kl" 은 유전자가 클루이베로마이세스 락티스 (Kluyveromyces lactis) 로부터 기원한다는 것을 의미한다. 본 실시예에서 유전자 뒤에 아무것도 나타내지 않는 경우, 이는 유전자가 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 유래한다는 것을 의미한다.
보다 특히, 클로닝하고자 하는 코딩 서열을 인위적으로 합성하였다. 이종 서열 (비-효모) 의 경우, 효모 코돈 용법을 사용하여 동의적 코딩 서열을 수득하기 위해 핵산 서열을 변형시켰다. 제한 효소 및 고전적 클로닝 기법을 사용하여, 각각의 합성 서열을 전사 프로모터와 전사 터미네이터 사이에 클로닝하였다. 각각의 프로모터 서열에는 업스트림 유전자의 터미네이터의 서열에 상동성인 50 내지 200 개 뉴클레오티드 서열이 선행한다. 유사하게, 각각의 유전자 (프로모터-코딩 서열-터미네이터를 포함하는 유전자) 의 터미네이터에는 바로 다음의 유전자에 상동성인 서열이 뒤이어진다. 따라서, 통합되는 단위 각각은 업스트림 및 단위 다운스트림 둘 모두와의 50-200 개 뉴클레오티드 오버랩 (overlap) 을 갖는다. 제 1 단위에 대해, 프로모터에는 이것이 통합될 유전자좌에 대한 효모 염색체 뉴클레오티드와 상동성인 50-200 개 뉴클레오티드가 선행한다. 유사하게, 마지막 단위에 대해, 터미네이터에는 이것이 통합될 유전자좌에 대한 효모 염색체 뉴클레오티드와 상동성인 50-200 개 뉴클레오티드가 뒤이어진다.
그런 다음, 각각의 단위는 플라스미드 구축물로부터 PCR 증폭되어, 오버랩 서열을 갖는 선형 DNA 의 X 단위가 산출된다. 재조합 사건을 위한 선택을 위해, 이러한 유전자의 적어도 하나는 영양요구성 마커이다. 모든 선형 절편은 효모에서 한번에 형질전환되고, 재조합 효모 세포는 사용된 마커와 관련된 영양요구성에 대해 선택된다. 그런 다음, 서열의 무결성 (integrity) 은 PCR 및 서열분석에 의해 확인된다.
실시예 2: 콘드로이틴의 생산을 위한 비교예
먼저, 3 개의 재조합 균주를 수득한다: YA5809, YA5810 및 YA5571.
따라서, 이들 3 개의 균주는 다음과 같다:
YA5809 : MAT-α, his3::[tRPL3-UGP1-pSAM1, pMET6-QRI1-tIDP1, HIS3]x5, jlp1::[LEU2.Sba-loxP, pTEF1.Sba-HASB.Vir-tRPL3.Sm, pTDH3.Sk-HASB-A.Vir-tTEF1.Sba, pTDH3-1.Sba-HCOS1-3.Pm-tRPL15A.Sm, pCCW12-KFOA.Pm-tRPL41B.Sba, pCCW120.Sm-KFOA.Pm-tRPL15A.Sba, pTEF1.Ago-GFA1.Vir-tRPL15A], leu2, met14::[TRP1.Sba-RS, pTDH3-PGM1-tIDP1, pCWP2-GNA1-tTPI1, pTEF1-PCM1-tRPL41B, pFBA1-UGP1-tRPL3, pTDH3-1.Sba-QRI1-tIDP1.Sba, pTEF1.Ago-GFA1-tRPL15A], trp1, ura3
YA5810 : MAT-α, his3::[tRPL3-UGP1-pSAM1, pMET6-QRI1-tIDP1, HIS3]x5, jlp1::[LEU2.Sba-loxP, pTEF1.Sba-HASB.Vir-tRPL3.Sm, pTDH3.Sk-HASB-A.Vir-tTEF1.Sba, pTDH3-1.Sba-HCOS1-3.Pm-tRPL15A.Sm, pCCW12-KFOA.Pm-tRPL41B.Sba, pCCW120.Sm-KFOA.Pm-tRPL15A.Sba, pTEF1.Ago-GFA1.Vir-tRPL15A], leu2, met14::[TRP1.Sba-RS, pTDH3-PGM1-tIDP1, pCWP2-GNA1-tTPI1, pTEF1-PCM1-tRPL41B, pFBA1-UGP1-tRPL3, pTDH3-1.Sba-QRI1-tIDP1.Sba], trp1, ura3
YA5571 : MAT-α, his3::[tRPL3-UGP1-pSAM1, pMET6-QRI1-tIDP1, HIS3]x5, jlp1::[LEU2.Sba-loxP, pTEF1.Sba-HASB.Vir-tRPL3.Sm, pTDH3.Sk-HASB-A.Vir-tTEF1.Sba, pTDH3-1.Sba-HCOS1-3.Pm-tRPL15A.Sm, pCCW12-KFOA.Pm-tRPL41B.Sba, pCCW120.Sm-KFOA.Pm-tRPL15A.Sba, pTEF1.Ago-GFA1.Vir-tRPL15A], leu2, trp1, ura3
HASB 및 HASB-A 는 UDP-글루코오스 6-탈수소효소 활성을 갖는 폴리펩티드를 코딩하는 핵산 서열을 나타낸다. 이들은 효소를 코딩하는 핵산 서열의 상이한 재코딩된 버전이라는 점에서 서로 상이하다. HASB 는 서열 SEQ ID NO: 36 을 갖고, HASB-A 는 서열 SEQ ID NO: 37 을 갖는다. HCOS1-3.Pm 은 히알루로난 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산 및 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산의 단편을 포함하는 핵산인 콘드로이틴 신타아제 활성을 갖는 폴리펩티드를 코딩하는 핵산 서열을 나타낸다. HCOS1-3.Pm 은 서열 SEQ ID NO: 3 을 갖는다.
이들 균주를 2% 글루코스가 보충된 25 ml 의 SY 배지에서 48 시간 동안 28°C 에서 Erlenmeyer 플라스크에서 인큐베이션하였다.
SY 배지는 다음 요소를 포함한다:
KH2PO4: 100 mM; MgSO4 7H2O: 2,8 mM; K2SO4: 11,5 mM; Na2SO4:
1,1 mM; NaCl: 2,6 mM; CaCl2 2H2O: 0,7 mM; CuSO4 5H2O: 15 μM; KI: 6 μM; FeCl3: 30 μM; ZnSO4 7H2O: 61 μM; MnSO4 H2O: 25 μM; H2SO4: 110 μΜ; 판토텐산 헤미칼슘 염: 42 μΜ; 티아민 히드로클로라이드: 59 μΜ; 피리독신 히드로클로라이드: 49 μΜ ; 마이오-이노시톨 (C6H12O6): 555 μΜ ; 니코틴산 (C6H5NO2): 29 μM ; D-비오틴:
0,82 μΜ; 암모늄 시트레이트 3염기: 33 mM; 및 글루코오스 또는 수크로오스 2-30%
성장 배지를 48 시간에 회수하고 콘드로이틴 함량에 대해 어세이하였다.
상청액의 분취액을 로딩하고, 0.5% 아가로스 겔 상에서 실행시킨 후 브로모페놀 블루로 염색하였다.
배지 중에 존재하는 콘드로이틴의 양을 농축 황산 및 카르바졸로 처리한 후 비색 결정에 의해 평가하였다 (Bitter and Muir (1962) analytical biochemistry 4, 330-334).
이들 상이한 균주로 수득된 양은 각각 다음과 같다:
- YA5809: 200 mg.L-1
- YA5810: 200 mg.L-1
- YA5571: 200 mg.L-1
이에 비해, 다른 3 종의 균주가 유해라는 본래의 균주 (Chιrest et al. (2000) J Biol. Chem. 275: 14056-14063) 는 콘드로이틴을 생산하지 않는다.
본 발명에 따른 변형을 포함하는 재조합 균주는 본 발명에 따른 모든 유전적 변형을 포함하지 않는 다른 균주와 동일한 조건에서 배양할 때 더 많은 양의 콘드로이틴을 생산한다는 것이 본 실험으로부터 얻은 결과이다.
실시예 3: 제어된 분자량의 콘드로이틴의 제조에 대한 실시예
1. 분자량이 10kDa 미만인 콘드로이틴의 제조
그 다음, 2 개의 재조합 균주를 수득한다: YA5887 및 5902.
따라서, 이들 두 균주는 다음과 같다:
YA5887 : MAT-a, his3, jlp1::[LEU2.Kl, pCUP1-UGP1-tRPL3, pCUP1-QRI1-tIDP1, pPDC1-UGP1-tTPI1, pTDH3-QRI1-tMET25, pCCW12-HASB.At-tRPL15A], leu2::[TRP1.Sba, pCCW12.Sba-HYAL-3.Ts-tRPL15A], sam3::[HASB.Vir-tTEF1.Sba, pTDH3-1.Sba-HCOS1-3.Pm-tRPL3.Sba, pTDH3.Sar-HCOS1-3.Pm-tRPL15A.Sm, pCCW12-KFOA.Pm-tRPL41B.Sba, pCCW120.Sm-KFOA.Pm-tRPL15A.Sba, HIS3.Sba], trp1
YA5902: MAT-α, his3::[ pSAM1-UGP1-tRPL3, pMET6-QRI1-tIDP1, HIS3]x5, jlp1::[LEU2.Kl, pCUP1-UGP1-tRPL3, pCUP1-QRI1-tIDP1, pPDC1-UGP1-tTPI1, pTDH3-QRI1-tMET25, pCCW12-HASB.At-tRPL15A], leu2::[TRP1.Sba, pCCW12.Sba-HYAL-3.Ts-tRPL15A], sam3::[LEU2.Kl, pENO2-UGP1-tRPL3, pCWP2-GNA1-tTPI1, pTEF1-PCM1-tRPL41B, pTEF1.Sba-HASB.vir-tRPL3.Sm, pTDH3.Sk-HASB-A.Vir-tTEF1.Sba, pTDH3-1.Sba-HCOS1-3.Pm-tRPL15A.Sm, pCCW12-KFOA.Pm-tRPL15A.Sba, HIS3.Sba-loxP], trp1
HYAL-3.Ts 는 분비 신호와 연관된 콘드로이티나아제 활성을 갖지만 고정 신호를 갖지 않는 폴리펩티드를 코딩하는 핵산 서열을 나타낸다. HYAL-3.Ts 는 아미노산 서열 SEQ ID NO: 23 을 갖는다.
HASB, HASB-A 및 HCOS-1.Pm 은 상기 정의된 바와 같다.
이들 균주를 2% 글루코스가 보충된 25 ml 의 SY 배지에서 48 시간 동안 28°C 에서 Erlenmeyer 플라스크에서 인큐베이션하였다.
성장 배지를 48 시간에 회수하고 콘드로이틴 함량에 대해 어세이하였다.
상청액의 분취액을 로딩하고, 0.5% 아가로스 겔 상에서 실행시킨 후 브로모페놀 블루로 염색하였다.
배지 중에 존재하는 콘드로이틴의 양을 농축 황산 및 카르바졸로 처리한 후 비색 결정에 의해 평가하였다 (Bitter and Muir (1962) analytical biochemistry 4, 330-334).
이들 상이한 균주로 수득된 양은 각각 다음과 같다:
- YA5887: 600 mg.L-1
- YA5902: 600 mg.L-1
이에 비해, 다른 2 종의 균주가 유해라는 본래의 균주 (Chιrest et al. (2000) J Biol. Chem. 275: 14056-14063) 는 콘드로이틴을 생산하지 않는다.
본 발명에 따른 변형을 포함하는 재조합 균주는 본 발명에 따른 모든 유전적 변형을 포함하지 않는 다른 균주와 동일한 조건에서 배양할 때 더 많은 양의 콘드로이틴을 생산한다는 것이 본 실험으로부터 얻은 결과이다.
더욱이, 이들 두 균주는 48 시간 후 10kDa 미만의 분자량을 갖는 콘드로이틴의 생산을 유도하였다.
2. 약 10kDa 내지 약 50kDa 의 분자량을 갖는 콘드로이틴의 제조
그 다음, 2 개의 다른 재조합 균주를 수득한다: YA5888 및 5903.
따라서, 이들 두 균주는 다음과 같다:
YA5888 : MAT-a, his3, jlp1::[LEU2.Kl, pCUP1-UGP1-tRPL3, pCUP1-QRI1-tIDP1, pPDC1-UGP1-tTPI1, pTDH3-QRI1-tMET25, pCCW12-HASB.At-tRPL15A], leu2::[TRP1.Sba, pCCW10.Ago-HYAL-3.Ts-tRPL15A], sam3::[HASB.Vir-tTEF1.Sba, pTDH3-1.Sba-HCOS1-3.Pm-tRPL3.Sba, pTDH3.Sar-HCOS1-3.Pm-tRPL15A.Sm, pCCW12-KFOA.Pm-tRPL41B.Sba, pCCW120.Sm-KFOA.Pm-tRPL15A.Sba, HIS3.Sba], trp1
YA5903 : MAT-α, his3::[ pSAM1-UGP1-tRPL3, pMET6-QRI1-tIDP1, HIS3]x5, jlp1::[LEU2.Kl, pCUP1-UGP1-tRPL3, pCUP1-QRI1-tIDP1, pPDC1-UGP1-tTPI1, pTDH3-QRI1-tMET25, pCCW12-HASB.At-tRPL15A], leu2::[TRP1.Sba, pCCW10.Ago-HYAL-3.Ts-tRPL15A], sam3::[LEU2.Kl, pENO2-UGP1-tRPL3, pCWP2-GNA1-tTPI1, pTEF1-PCM1-tRPL41B, pTEF1.Sba-HASB.vir-tRPL3.Sm, pTDH3.Sk-HASB-A.Vir-tTEF1.Sba, pTDH3-1.Sba-HCOS1-3.Pm-tRPL15A.Sm, pCCW12-KFOA.Pm-tRPL15A.Sba, HIS3.Sba-loxP], trp1
HYAL-3.Ts, HASB, HASB-A 및 HCOS-1.Pm 은 상기 정의된 바와 같다.
이들 균주를 2% 글루코스가 보충된 25 ml 의 SY 배지에서 48 시간 동안 28°C 에서 Erlenmeyer 플라스크에서 인큐베이션하였다.
성장 배지를 48 시간에 회수하고 콘드로이틴 함량에 대해 어세이하였다.
상청액의 분취액을 로딩하고, 0.5% 아가로스 겔 상에서 실행시킨 후 브로모페놀 블루로 염색하였다.
배지 중에 존재하는 콘드로이틴의 양을 농축 황산 및 카르바졸로 처리한 후 비색 결정에 의해 평가하였다 (Bitter and Muir (1962) analytical biochemistry 4, 330-334).
이들 상이한 균주로 수득된 양은 각각 다음과 같다:
- YA5888: 600 mg.L-1
- YA5903: 600 mg.L-1
이에 비해, 다른 2 종의 균주가 유해라는 본래의 균주 (Chιrest et al. (2000) J Biol. Chem. 275: 14056-14063) 는 콘드로이틴을 생산하지 않는다.
본 발명에 따른 변형을 포함하는 재조합 균주는 본 발명에 따른 모든 유전적 변형을 포함하지 않는 다른 균주와 동일한 조건에서 배양할 때 더 많은 양의 콘드로이틴을 생산한다는 것이 본 실험으로부터 얻은 결과이다.
더욱이, 이들 두 균주는 48 시간 후 약 10kDa 내지 약 50kDa 범위의 분자량을 갖는 콘드로이틴의 생산을 유도하였다.
3. 약 50kDa 내지 약 500kDa 의 분자량을 갖는 콘드로이틴의 제조
그 다음, 2 개의 다른 재조합 균주를 수득한다: YA5889 및 5904.
따라서, 이들 두 균주는 다음과 같다:
YA5889 : MAT-a, his3, jlp1::[LEU2.Kl, pCUP1-UGP1-tRPL3, pCUP1-QRI1-tIDP1, pPDC1-UGP1-tTPI1, pTDH3-QRI1-tMET25, pCCW12-HASB.At-tRPL15A], leu2::[TRP1.Sba, pNUP57-HYAL-3.Ts-tRPL15A], sam3::[HASB.Vir-tTEF1.Sba, pTDH3-1.Sba-HCOS1-3.Pm-tRPL3.Sba, pTDH3.Sar-HCOS1-3.Pm-tRPL15A.Sm, pCCW12-KFOA.Pm-tRPL41B.Sba, pCCW120.Sm-KFOA.Pm-tRPL15A.Sba, HIS3.Sba], trp1
YA5904 : MAT-α, his3::[ pSAM1-UGP1-tRPL3, pMET6-QRI1-tIDP1, HIS3]x5, jlp1::[LEU2.Kl, pCUP1-UGP1-tRPL3, pCUP1-QRI1-tIDP1, pPDC1-UGP1-tTPI1, pTDH3-QRI1-tMET25, pCCW12-HASB.At-tRPL15A], leu2::[TRP1.Sba, pNUP57-HYAL-3.Ts-tRPL15A], sam3::[LEU2.Kl, pENO2-UGP1-tRPL3, pCWP2-GNA1-tTPI1, pTEF1-PCM1-tRPL41B, pTEF1.Sba-HASB.vir-tRPL3.Sm, pTDH3.Sk-HASB-A.Vir-tTEF1.Sba, pTDH3-1.Sba-HCOS1-3.Pm-tRPL15A.Sm, pCCW12-KFOA.Pm-tRPL15A.Sba, HIS3.Sba-loxP], trp1
HYAL-3.Ts, HASB, HASB-A 및 HCOS-1.Pm 은 상기 정의된 바와 같다.
이들 균주를 2% 글루코스가 보충된 25 ml 의 SY 배지에서 48 시간 동안 28°C 에서 Erlenmeyer 플라스크에서 인큐베이션하였다.
성장 배지를 48 시간에 회수하고 콘드로이틴 함량에 대해 어세이하였다.
상청액의 분취액을 로딩하고, 0.5% 아가로스 겔 상에서 실행시킨 후 브로모페놀 블루로 염색하였다.
배지 중에 존재하는 콘드로이틴의 양을 농축 황산 및 카르바졸로 처리한 후 비색 결정에 의해 평가하였다 (Bitter and Muir (1962) analytical biochemistry 4, 330-334).
이들 상이한 균주로 수득된 양은 각각 다음과 같다:
- YA5889: 600 mg.L-1
- YA5904: 600 mg.L-1
이에 비해, 다른 2 종의 균주가 유해라는 본래의 균주 (Chιrest et al. (2000) J Biol. Chem. 275: 14056-14063) 는 콘드로이틴을 생산하지 않는다.
본 발명에 따른 변형을 포함하는 재조합 균주는 본 발명에 따른 모든 유전적 변형을 포함하지 않는 다른 균주와 동일한 조건에서 배양할 때 더 많은 양의 콘드로이틴을 생산한다는 것이 본 실험으로부터 얻은 결과이다.
더욱이, 이들 두 균주는 48 시간 후 약 10kDa 내지 약 50kDa 범위의 분자량을 갖는 콘드로이틴의 생산을 유도하였다.
서열
SEQ ID NO: 1 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-1):
SEQ ID NO: 2 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-2):
SEQ ID NO: 3 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-3):
SEQ ID NO: 4 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS.Sc)
SEQ ID NO: 5 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HHASA.Sc)
SEQ ID NO: 6 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS1-Vir)
SEQ ID NO: 7 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS2-Vir)
SEQ ID NO: 8 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 마이코박테리움 투베르쿨로시스 (Mycobacterium tuberculosis) 로부터 유래된 갈락토푸라노실트랜스페라아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS3-Vir)
SEQ ID NO: 9 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS4-Vir)
SEQ ID NO: 10 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 페니실리움 옥살리쿰 (Penicillium oxalicum) 으로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS5-Vir)
SEQ ID NO: 11 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS6-Vir)
SEQ ID NO: 12 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS7-Vir)
SEQ ID NO: 13 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS8-Vir)
SEQ ID NO: 14 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS9-Vir)
SEQ ID NO: 15 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS10-Vir)
SEQ ID NO: 16 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS11-Vir)
SEQ ID NO: 17 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 핵산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 핵산으로부터의 단편 및 호모 사피엔스 (Homo sapiens) 로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 핵산으로부터의 단편을 포함하는 키메라 핵산이다 (HCOS12-Vir)
SEQ ID NO: 18 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-1)
SEQ ID NO: 19 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-2)
SEQ ID NO: 20 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-3)
SEQ ID NO: 21: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편, 파스튜렐라 물토시다로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS.Sc)
SEQ ID NO: 22: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae) 로부터 유래된 키틴 신타아제 2 를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HHASA.Sc)
SEQ ID NO: 23: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS1-Vir)
SEQ ID NO: 24: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS2-Vir)
SEQ ID NO: 25: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 마이코박테리움 투베르쿨로시스 (Mycobacterium tuberculosis) 로부터 유래된 갈락토푸라노실트랜스페라아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS3-Vir)
SEQ ID NO: 26: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 에스케리치아 콜라이로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS4-Vir)
SEQ ID NO: 27: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 페니실리움 옥살리쿰 (Penicillium oxalicum) 으로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS5-Vir)
SEQ ID NO: 28: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS6-Vir)
SEQ ID NO: 29: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS7-Vir)
SEQ ID NO: 30: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 유래된 콘드로이틴 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS8-Vir)
SEQ ID NO: 31: 은 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS9-Vir)
SEQ ID NO: 32: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS10-Vir)
SEQ ID NO: 33: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS11-Vir)
SEQ ID NO: 34: 는 콘드로이틴 신타아제 활성을 갖는 폴리펩티드의 재코딩된 아미노산 서열: 클로렐라 바이러스 PBCV-1 로부터 기원하는 히알루로난 신타아제를 코딩하는 아미노산으로부터의 단편 및 호모 사피엔스로부터 유래된 콘드로이틴 술페이트 신타아제를 코딩하는 아미노산으로부터의 단편을 포함하는 키메라 아미노산이다 (HCOS12-Vir)
SEQ ID NO: 35 는 아라비돕시스 탈리아나 (Arabidopsis thaliana) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 핵산 서열이다
SEQ ID NO: 36 은 클로렐라 바이러스 PBCV-1 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 재코딩된 핵산 서열이다
SEQ ID NO: 37 은 클로렐라 바이러스 PBCV-1 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB-A) 의 재코딩된 핵산 서열이다
SEQ ID NO: 38 은 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 핵산 서열이다
SEQ ID NO: 39 는 아라비돕시스 탈리아나 (Arabidopsis thaliana) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 아미노산 서열이다
SEQ ID NO: 40 은 클로렐라 바이러스 PBCV1 로부터 기원하는 UDP-글루코스 탈수소효소 (HASB) 의 아미노산 서열이다
SEQ ID NO: 41 는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 로부터 기원하는 UDP-글루코오스 탈수소효소 (HASB) 의 아미노산 서열이다
SEQ ID NO: 42 는 슈도모나스 아에루기노사 (Pseudomonas aeruginosa) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (GNE1) 의 핵산 서열이다
SEQ ID NO: 43 은 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 핵산 서열이다
SEQ ID NO: 44 는 에스케리치아 콜라이 (Escherichia coli) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 핵산 서열이다
SEQ ID NO: 45 는 슈도모나스 아에루기노사 (Pseudomonas aeruginosa) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (GNE1) 의 아미노산 서열이다
SEQ ID NO: 46 은 파스튜렐라 물토시다 (Pasteurella multocida) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 아미노산 서열이다
SEQ ID NO: 47 은 에스케리치아 콜라이 (Escherichia coli) 로부터 기원하는 UDP-글루코오스-4-에피머라제 (KFOA) 의 아미노산 서열이다
SEQ ID NO: 48 은 N-말단 분비 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 49 는 N-말단 분비 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 50 은 N-말단 분비 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 51 은 N-말단 분비 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 52 는 N-말단 분비 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 53 는 N-말단 분비 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 54 는 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 55 는 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 56 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 57 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 58 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 59 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 재코딩된 핵산 서열이다
SEQ ID NO: 60 은 N-말단 분비 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 61 은 N-말단 분비 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 62 는 N-말단 분비 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 63 은 N-말단 분비 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 64 는 N-말단 분비 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 65 는 N-말단 분비 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 66 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 큐피에니우스 살레이 (Cupiennius salei) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 67 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 68 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 보스 타우루스 (Bos Taurus) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 69 는 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 아피스 멜리페라 (Apis mellifera) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 70 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 마카카 물라타 (Macaca mulatta) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 71 은 N-말단 분비 신호 및 C-말단 고정 신호를 갖는 베스파 마그니피카 (Vespa magnifica) 로부터 기원하는 히알루로니다아제 (HYAL) 의 아미노산 서열이다
SEQ ID NO: 72 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 핵산 서열이다.
SEQ ID NO: 73 은 클로렐라 바이러스 1 (PBCV-1) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 재코딩된 핵산 서열이다
SEQ ID NO: 74 은 클로렐라 바이러스 1 (PBCV-1) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 재코딩된 핵산 서열이다
SEQ ID NO: 75 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 아미노산 서열이다
SEQ ID NO: 76 은 클로렐라 바이러스 1 (PBCV-1) 로부터 기원하는 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 의 아미노산 서열이다
SEQ ID NO: 77 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 의 핵산 서열이다
SEQ ID NO: 78 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 의 아미노산 서열이다
SEQ ID NO: 79 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포글루코뮤타아제-1 (PGM1) 의 핵산 서열이다
SEQ ID NO: 80 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포글루코뮤타아제-1 (PGM1) 의 아미노산 서열이다
SEQ ID NO: 81 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 의 핵산 서열이다
SEQ ID NO: 82 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 의 아미노산 서열이다
SEQ ID NO: 83 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루코사민 6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 의 핵산 서열이다
SEQ ID NO: 84 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 글루코사민 6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 의 아미노산 서열이다
SEQ ID NO: 85 는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포아세틸글루코사민 뮤타아제 (PCM1) 의 핵산 서열이다
SEQ ID NO: 86 은 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 기원하는 포스포아세틸글루코사민 뮤타아제 (PCM1) 의 아미노산 서열이다
SEQ ID NO: 87 은 프로모터 pTDH3 의 핵산 서열이다
SEQ ID NO: 88 은 프로모터 pTDH3.Sk 의 핵산 서열이다
SEQ ID NO: 89 은 프로모터 pTDH3-1.sba 의 핵산 서열이다
SEQ ID NO: 90 은 프로모터 pTDH3.Sar 의 핵산 서열이다
SEQ ID NO: 91 은 프로모터 pENO2 의 핵산 서열이다
SEQ ID NO: 92 은 프로모터 pTEF3 의 핵산 서열이다
SEQ ID NO: 93 은 프로모터 pTEF1 의 핵산 서열이다
SEQ ID NO: 94 은 프로모터 pTEF1.ago 의 핵산 서열이다
SEQ ID NO: 95 은 프로모터 pTEF1.Sba 의 핵산 서열이다
SEQ ID NO: 96 은 프로모터 pPDC1 의 핵산 서열이다
SEQ ID NO: 97 은 프로모터 pCCW12 의 핵산 서열이다
SEQ ID NO: 98 은 프로모터 pCCW12.Sm 의 핵산 서열이다
SEQ ID NO: 99 은 프로모터 pCCW12.Sk 의 핵산 서열이다
SEQ ID NO: 100 은 프로모터 pCCW12.Sba 의 핵산 서열이다
SEQ ID NO: 101 은 프로모터 pCCW12.Sar 의 핵산 서열이다
SEQ ID NO: 102 은 프로모터 pNUP57 의 핵산 서열이다
SEQ ID NO: 103 은 프로모터 pCCW10.ago 의 핵산 서열이다
SEQ ID NO: 104 은 프로모터 pCWP2 의 핵산 서열이다
SEQ ID NO: 105 은 프로모터 pFBA1 의 핵산 서열이다
SEQ ID NO: 106 은 프로모터 pCCW120.Sm 의 핵산 서열이다
SEQ ID NO: 107 은 프로모터 pCUP1 의 핵산 서열이다
SEQ ID NO: 108 은 프로모터 pMET6 의 핵산 서열이다
SEQ ID NO: 109 은 프로모터 pMET25 의 핵산 서열이다
SEQ ID NO: 110 은 프로모터 pSAM1 의 핵산 서열이다
SEQ ID NO: 111 은 터미네이터 tTPI1 의 핵산 서열이다
SEQ ID NO: 112 은 터미네이터 tMET25 의 핵산 서열이다
SEQ ID NO: 113 은 터미네이터 tDIT1 의 핵산 서열이다
SEQ ID NO: 114 은 터미네이터 tRPL3 의 핵산 서열이다
SEQ ID NO: 115 은 터미네이터 tRPL3.sm 의 핵산 서열이다
SEQ ID NO: 116 은 터미네이터 tRPL3.sba 의 핵산 서열이다
SEQ ID NO: 117 은 터미네이터 tRPL41B 의 핵산 서열이다
SEQ ID NO: 118 은 터미네이터 tRPL41B.Sba 의 핵산 서열이다
SEQ ID NO: 119 은 터미네이터 tRPL15A 의 핵산 서열이다
SEQ ID NO: 120 은 터미네이터 tRPL15A.Sm 의 핵산 서열이다
SEQ ID NO: 121 은 터미네이터 tRPL15A.sba 의 핵산 서열이다
SEQ ID NO: 122 은 터미네이터 tIDP1 의 핵산 서열이다
SEQ ID NO: 123 은 터미네이터 tIDP1.Sba 의 핵산 서열이다
SEQ ID NO: 124 은 터미네이터 tTEF1.sba 의 핵산 서열이다
SEQ ID NO: 125 은 5' 에서 부가된 분비 서열의 핵산 서열이다
SEQ ID NO: 126 은 N-말단에서 부가된 분비 서열의 아미노산 서열이다
SEQ ID NO: 127 은 3' 에서 부가된 고정 서열의 핵산 서열이다
SEQ ID NO: 128 은 C-말단에서 부가된 고정 서열의 아미노산 서열이다
SEQUENCE LISTING <110> GIVAUDAN SA <120> CHONDROITIN-PRODUCING RECOMBINANT CELL <130> PR92298/MGG <150> EP21166740.7 <151> 2021-04-01 <160> 128 <170> BiSSAP 1.3.6 <210> 1 <211> 2919 <212> DNA <213> other sequences <220> <223> reencoded nucleic acid sequence of a polypeptide having a chondroitin synthase activity (HCOS-1) <400> 1 atgaacaccc tttcccaggc aattaaggct tataatagta atgattatca actagccctc 60 aagctgttcg aaaagtcggc agaaatctac ggcagaaaga tagttgagtt ccaaattacg 120 aagtgcaagg agaaactttc tgcgcaccca tccgttaaca gtgcgcatct ctcggttaac 180 aaagaagaga aggtgaatgt ttgcgacagt ccattagaca tagccactca attattgtta 240 tcgaatgtga aaaaactcgt ccttagtgat agcgagaaaa atacactaaa gaataaatgg 300 aagttgttga ctgaaaagaa gtctgagaac gcagaggtcc gggccgtagc tttagttccc 360 aaggactttc cgaaagattt agtgcttgcg ccgttaccag accatgtgaa cgattttacg 420 tggtataaga agcggaagaa acgcctagga atcaaaccag aacaccaaca cgttggcctc 480 tccattattg tgacaacgtt caaccgtcct gccatcctca gcatcaccct ggcttgcctc 540 gtcaatcaaa agacccatta tccttttgag gtgatcgtga ccgacgatgg ttctcaagag 600 gatttatcgc ctataatccg tcaatatgag aacaagctag acatccgtta tgttcggcaa 660 aaggactatg ggtatcagct gtgcgccgtt agaaaccttg gtctaaggac agcgaagtat 720 gactttgtct ctatcttgga ttgcgacatg gccccgcagc agctatgggt tcactcttac 780 cttacagaac tattagagga cgatgatttg accataatag gccccaggaa gtacattgac 840 acgcaacaca tagatcccaa ggatttcctt aataacgcct ctctgttaga gtcgttgcca 900 gaggttaaga ccaataattc cgtcgcggct aagggcgagg ggaccgtatc tttagactgg 960 cgtttggaac aatttgagaa gaccgagaac ttgaggctat ccgatagccc tttccgattc 1020 ttcgcagctg ggaatgtggc tttcgccaag aagtggctta acaagtcagg attcttcgac 1080 gaggaattca atcactgggg aggtgaagat gtagagttcg gttatcgtct gtttcggtac 1140 ggttcgttct tcaaaactat agacggcatc atggcctatc atcaggaacc gccaggtaaa 1200 gaaaacgaaa ctgacagaga agcgggcaag aacattaccc tcgatataat gagggagaag 1260 gtgccttaca tctaccgtaa actcctgcct atagaagaca gtcatatcaa ccgagtacca 1320 ttggtatcaa tttacatccc ggcctacaac tgtgctaact atattcaaag atgtgttgat 1380 tcagctttga atcaaacggt agttgatctc gaagtgtgca tttgcaacga cggtagtact 1440 gacaacacgc tggaagttat taacaagctg tatggtaata atccgcgtgt gcgtataatg 1500 tctaaaccca atggcggcat tgcgagtgca tccaacgcag cggtcagctt cgcaaagggt 1560 tattacatag gacagttgga cagcgacgat tacttagaac ccgacgcagt ggagttatgt 1620 ctcaaggaat ttcttaagga taagaccctt gcgtgcgttt acaccactaa tcgtaacgtc 1680 aacccagatg gctctttaat agccaatggc tataactggc cagagttcag tcgtgagaag 1740 ttgactacgg ccatgattgc tcatcacttc cggatgttta ccattcgtgc ttggcatctg 1800 acggatgggt tcaatgagaa gattgagaac gctgttgact acgacatgtt tctcaagctc 1860 agtgaagttg gtaaatttaa gcatctgaac aaaatatgtt ataatcgggt gttacacggc 1920 gataacacct caatcaagaa gcttggcata caaaagaaga atcatttcgt agttgtcaat 1980 cagtctctaa accgccaagg tataacttat tataactacg atgaatttga tgatctcgat 2040 gagagtcgga aatacatttt caacaagact gcagagtatc aagaagagat agatattctt 2100 aaagatatta agatcattca gaacaaagac gccaaaatag ctgtctccat tttctatccg 2160 aacactctaa acgggttggt gaagaagcta aataatatta tagagtataa taagaatatc 2220 ttcgttattg tacttcatgt cgataagaat cacttaaccc cagacatcaa gaaggagata 2280 ttagccttct accataagca tcaggtgaac atcttattga acaatgacat ctcctactat 2340 acatcaaatc gtctgattaa gacagaagcc catttgagta acattaacaa gctaagtcaa 2400 ttaaatctta actgcgaata cattatattc gacaatcacg attccttatt tgtgaagaac 2460 gattcctatg catacatgaa gaagtatgat gttggaatga acttctctgc attgactcat 2520 gattggattg aaaagataaa cgctcacccg ccatttaaga agctgatcaa aacttacttc 2580 aatgacaatg atcttaagtc gatgaatgta aagggtgcct cccagggaat gtttatgaca 2640 tacgcattag cccacgagtt attgacgatc atcaaggagg tgataacctc ttgtcaatcc 2700 attgactccg tccccgaata caacacagaa gatatttggt ttcagtttgc acttttaatt 2760 ctggaaaaga agaccggcca cgtattcaac aagacaagca ctctcacgta tatgccatgg 2820 gaacgtaaac tgcagtggac gaatgaacaa atagagtccg caaagagggg cgaaaacatt 2880 ccggtaaaca agttcatcat taacagcatt accctttaa 2919 <210> 2 <211> 2919 <212> DNA <213> other sequences <220> <223> reencoded nucleic acid sequence of a polypeptide having a chondroitin synthase activity (HCOS1-2) <400> 2 atgaacaccc tttcccaggc aattaaggct tataatagta atgattatca actagccctc 60 aagctgttcg aaaagtcggc agaaatctac ggcagaaaga tagttgagtt ccaaattacg 120 aagtgcaagg agaaactttc tgcgcaccca tccgttaaca gtgcgcatct ctcggttaac 180 aaagaagaga aggtgaatgt ttgcgacagt ccattagaca tagccactca attattgtta 240 tcgaatgtga aaaaactcgt ccttagtgat agcgagaaaa atacactaaa gaataaatgg 300 aagttgttga ctgaaaagaa gtctgagaac gcagaggtcc gggccgtagc tttagttccc 360 aaggactttc cgaaagattt agtgcttgcg ccgttaccag accatgtgaa cgattttacg 420 tggtataaga agcggaagaa acgcctagga atcaaaccag tgaacaagaa catcgggttg 480 tcaatcataa tcccaacttt caatcgtagt aggatattag acatcaccct ggcttgcctc 540 gtcaatcaaa agacccatta tccttttgag gtgatcgtga ccgacgatgg ttctcaagag 600 gatttatcgc ctataatccg tcaatatgag aacaagctag acatccgtta tgttcggcaa 660 aaggactatg ggtatcagct gtgcgccgtt agaaaccttg gtctaaggac agcgaagtat 720 gactttgtct ctatcttgga ttgcgacatg gccccgcagc agctatgggt tcactcttac 780 cttacagaac tattagagga cgatgatttg accataatag gccccaggaa gtacattgac 840 acgcaacaca tagatcccaa ggatttcctt aataacgcct ctctgttaga gtcgttgcca 900 gaggttaaga ccaataattc cgtcgcggct aagggcgagg ggaccgtatc tttagactgg 960 cgtttggaac aatttgagaa gaccgagaac ttgaggctat ccgatagccc tttccgattc 1020 ttctcatgcg gaaatgtggc cttctccaaa gagtggctga acaaagttgg ctggttcgac 1080 gaggaattca atcactgggg aggtgaagat gtagagttcg gttatcgtct gtttcggtac 1140 ggttcgttct tcaaaactat agacggcatc atggcctatc atcaggaacc gccaggtaaa 1200 gaaaacgaaa ctgacagaga agcgggcaag aacattaccc tcgatataat gagggagaag 1260 gtgccttaca tctaccgtaa actcctgcct atagaagaca gtcatatcaa ccgagtacca 1320 ttggtatcaa tttacatccc ggcctacaac tgtgctaact atattcaaag atgtgttgat 1380 tcagctttga atcaaacggt agttgatctc gaagtgtgca tttgcaacga cggtagtact 1440 gacaacacgc tggaagttat taacaagctg tatggtaata atccgcgtgt gcgtataatg 1500 tctaaaccca atggcggcat tgcgagtgca tccaacgcag cggtcagctt cgcaaagggt 1560 tattacatag gacagttgga cagcgacgat tacttagaac ccgacgcagt ggagttatgt 1620 ctcaaggaat ttcttaagga taagaccctt gcgtgcgttt acaccactaa tcgtaacgtc 1680 aacccagatg gctctttaat agccaatggc tataactggc cagagttcag tcgtgagaag 1740 ttgactacgg ccatgattgc tcatcacttc cggatgttta ccattcgtgc ttggcatctg 1800 acggatgggt tcaatgagaa gattgagaac gctgttgact acgacatgtt tctcaagctc 1860 agtgaagttg gtaaatttaa gcatctgaac aaaatatgtt ataatcgggt gttacacggc 1920 gataacacct caatcaagaa gcttggcata caaaagaaga atcatttcgt agttgtcaat 1980 cagtctctaa accgccaagg tataacttat tataactacg atgaatttga tgatctcgat 2040 gagagtcgga aatacatttt caacaagact gcagagtatc aagaagagat agatattctt 2100 aaagatatta agatcattca gaacaaagac gccaaaatag ctgtctccat tttctatccg 2160 aacactctaa acgggttggt gaagaagcta aataatatta tagagtataa taagaatatc 2220 ttcgttattg tacttcatgt cgataagaat cacttaaccc cagacatcaa gaaggagata 2280 ttagccttct accataagca tcaggtgaac atcttattga acaatgacat ctcctactat 2340 acatcaaatc gtctgattaa gacagaagcc catttgagta acattaacaa gctaagtcaa 2400 ttaaatctta actgcgaata cattatattc gacaatcacg attccttatt tgtgaagaac 2460 gattcctatg catacatgaa gaagtatgat gttggaatga acttctctgc attgactcat 2520 gattggattg aaaagataaa cgctcacccg ccatttaaga agctgatcaa aacttacttc 2580 aatgacaatg atcttaagtc gatgaatgta aagggtgcct cccagggaat gtttatgaca 2640 tacgcattag cccacgagtt attgacgatc atcaaggagg tgataacctc ttgtcaatcc 2700 attgactccg tccccgaata caacacagaa gatatttggt ttcagtttgc acttttaatt 2760 ctggaaaaga agaccggcca cgtattcaac aagacaagca ctctcacgta tatgccatgg 2820 gaacgtaaac tgcagtggac gaatgaacaa atagagtccg caaagagggg cgaaaacatt 2880 ccggtaaaca agttcatcat taacagcatt accctttaa 2919 <210> 3 <211> 2919 <212> DNA <213> other sequences <220> <223> reencoded nucleic acid sequence of a polypeptide having a chondroitin synthase activity (HCOS1-3) <400> 3 atgaacaccc tttcccaggc aattaaggct tataatagta atgattatca actagccctc 60 aagctgttcg aaaagtcggc agaaatctac ggcagaaaga tagttgagtt ccaaattacg 120 aagtgcaagg agaaactttc tgcgcaccca tccgttaaca gtgcgcatct ctcggttaac 180 aaagaagaga aggtgaatgt ttgcgacagt ccattagaca tagccactca attattgtta 240 tcgaatgtga aaaaactcgt ccttagtgat agcgagaaaa atacactaaa gaataaatgg 300 aagttgttga ctgaaaagaa gtctgagaac gcagaggtcc gggccgtagc tttagtccca 360 aaggattttc ccaaagactt agttttagcg ccactaccag accatgtgaa cgattttacc 420 tggtacaaga atagaaagaa gagcctgggc ataaagcctg tgaacaagaa catcgggttg 480 tcaatcataa tcccaacttt caatcgtagt aggatattag acattaccct ggcgtgtcta 540 gttaatcaga aaactaacta tccgtttgag gtggttgttg cagatgatgg gtcgaaggaa 600 aatctattga ctatagttca gaaatacgag cagaaactag acattaagta tgtgagacag 660 aaggactatg ggtatcagct gtgcgccgtt agaaaccttg gtctaaggac agcgaagtat 720 gactttgtct ctatcttgga ttgcgacatg gccccgcagc agctatgggt tcactcttac 780 cttacagagt tactggaaga caacgacatc gtcttgatcg ggccaaggaa atacgttgat 840 acccacaaca tcacggctga gcagtttctg aacgacccat atttaattga gagtttaccg 900 gaaaccgcca caaacaataa tccatcgatt accagtaagg gtaacatctc attagattgg 960 agattagaac attttaagaa gacagacaac ctaagactat gcgactcccc gttcaggtat 1020 ttctcatgcg gaaatgtggc cttctccaaa gagtggctga acaaagttgg ctggttcgac 1080 gaagaattta atcactgggg cggcgaagac gtcgaattcg gctacaggtt atttgcaaaa 1140 gggtgcttct ttagggttat cgacggtggt atggcctacc atcaagagcc accaggaaag 1200 gagaacgaaa cggatcgtga ggccggtaag tctatcactc ttaaaatagt aaaggagaaa 1260 gtgccctaca tctacaggaa gttgttgccg attgaggact cccacataaa ccgagtacca 1320 ttggtatcaa tttacatccc ggcctacaac tgtgctaact atattcaaag atgtgttgat 1380 tcagctttga atcaaacggt agttgatctc gaagtgtgca tttgcaacga cggtagtact 1440 gacaacacgc tggaagttat taacaagctg tatggtaata atccgcgtgt gcgtataatg 1500 tctaaaccca atggcggcat tgcgagtgca tccaacgcag cggtcagctt cgcaaagggt 1560 tattacatag gacagttgga cagcgacgat tacttagaac ccgacgcagt ggagttatgt 1620 ctcaaggaat ttcttaagga taagaccctt gcgtgcgttt acaccactaa tcgtaacgtc 1680 aacccagatg gctctttaat agccaatggc tataactggc cagagttcag tcgtgagaag 1740 ttgactacgg ccatgattgc tcatcacttc cggatgttta ccattcgtgc ttggcatctg 1800 acggatgggt tcaatgagaa gattgagaac gctgttgact acgacatgtt tctcaagctc 1860 agtgaagttg gtaaatttaa gcatctgaac aaaatatgtt ataatcgggt gttacacggc 1920 gataacacct caatcaagaa gcttggcata caaaagaaga atcatttcgt agttgtcaat 1980 cagtctctaa accgccaagg tataacttat tataactacg atgaatttga tgatctcgat 2040 gagagtcgga aatacatttt caacaagact gcagagtatc aagaagagat agatattctt 2100 aaagatatta agatcattca gaacaaagac gccaaaatag ctgtctccat tttctatccg 2160 aacactctaa acgggttggt gaagaagcta aataatatta tagagtataa taagaatatc 2220 ttcgttattg tacttcatgt cgataagaat cacttaaccc cagacatcaa gaaggagata 2280 ttagccttct accataagca tcaggtgaac atcttattga acaatgacat ctcctactat 2340 acatcaaatc gtctgattaa gacagaagcc catttgagta acattaacaa gctaagtcaa 2400 ttaaatctta actgcgaata cattatattc gacaatcacg attccttatt tgtgaagaac 2460 gattcctatg catacatgaa gaagtatgat gttggaatga acttctctgc attgactcat 2520 gattggattg aaaagataaa cgctcacccg ccatttaaga agctgatcaa aacttacttc 2580 aatgacaatg atcttaagtc gatgaatgta aagggtgcct cccagggaat gtttatgaca 2640 tacgcattag cccacgagtt attgacgatc atcaaggagg tgataacctc ttgtcaatcc 2700 attgactccg tccccgaata caacacagaa gatatttggt ttcagtttgc acttttaatt 2760 ctggaaaaga agaccggcca cgtattcaac aagacaagca ctctcacgta tatgccatgg 2820 gaacgtaaac tgcagtggac gaatgaacaa atagagtccg caaagagggg cgaaaacatt 2880 ccggtaaaca agttcatcat taacagcatt accctttaa 2919 <210> 4 <211> 3072 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of a polypeptide having chondroitin synthase activity (HCOS.Sc) <400> 4 atgaacaccc tttcccaggc aattaaggct tataatagta atgattatca actagccctc 60 aagctgttcg aaaagtcggc agaaatctac ggcagaaaga tagttgagtt ccaaattacg 120 aagtgcaagg agaaactttc tgcgcaccca tccgttaaca gtgcgcatct ctcggttaac 180 aaagaagaga aggtgaatgt ttgcgacagt ccattagaca tagccactca attattgtta 240 tcgaatgtga aaaaactcgt ccttagtgat agcgagaaaa atacactaaa gaataaatgg 300 aagttgttga ctgaaaagaa gtctgagaac gcagaggtcc gggccgtagc tttagtccca 360 aaggattttc ccaaagactt agttttagcg ccactaccag accatgtgaa cgattttacc 420 tggtacaaga atagaaagaa gagcctgggc ataaagcctg tgaacaagaa catcgggttg 480 tcaatcataa tcccaacttt caatcgtagt aggatattag acattaccct ggcgtgtcta 540 gttaatcaga aaactaacta tccgtttgag gtggttgttg cagatgatgg gtcgaaggaa 600 aatctattga ctatagttca gaaatacgag cagaaactag acattaagta tgtgagacag 660 aaggactatg ggtatcagct gtgcgccgtt agaaaccttg gtctaaggac agcgaagtat 720 gactttgtct ctatcttgga ttgcgacatg gccccgcagc agctatgggt tcactcttac 780 cttacagagt tactggaaga caacgacatc gtcttgatcg ggccaaggaa atacgttgat 840 acccacaaca tcacggctga gcagtttctg aacgacccat atttaattga gagtttaccg 900 gaaaccgcca caaacaataa tccatcgatt accagtaagg gtaacatctc attagattgg 960 agattagaac attttaagaa gacagacaac ctaagactat gcgactcccc gttcaggtat 1020 ttctcatgcg gaaatgtggc cttctccaaa gagtggctga acaaagttgg ctggttcgac 1080 gaagaattta atcactgggg cggcgaagac gtcgaattcg gctacaggtt atttgcaaaa 1140 gggtgcttct ttagggttat cgacggtggt atggcctacc atcaagagcc accaggaaag 1200 gagaacgaaa cggatcgtga ggccggtaag tctatcactc ttaaaatagt aaaggagaaa 1260 gtgccctaca tctacaggaa gttgttgccg attgaggact cccacataaa ccgagtacca 1320 ttggtatcaa tttacatccc ggcctacaac tgtgctaact atattcaaag atgtgttgat 1380 tcagctttga atcaaacggt agttgatctc gaagtgtgca tttgcaacga cggtagtact 1440 gacaacacgc tggaagttat taacaagctg tatggtaata atccgcgtgt gcgtataatg 1500 tctaaaccca atggcggcat tgcgagtgca tccaacgcag cggtcagctt cgcaaagggt 1560 tattacatag gacagttgga cagcgacgat tacttagaac ccgacgcagt ggagttatgt 1620 ctcaaggaat ttcttaagga taagaccctt gcgtgcgttt acaccactaa tcgtaacgtc 1680 aacccagatg gctctttaat agccaatggc tataactggc cagagttcag tcgtgagaag 1740 ttgactacgg ccatgattgc tcatcacttc cggatgttta ccattcgtgc ttggcatctg 1800 acggatgggt tcaatgagaa gattgagaac gctgttgact acgacatgtt tctcaagctc 1860 agtgaagttg gtaaatttaa gcatctgaac aaaatatgtt ataatcgggt gttacacggc 1920 gataacacct caatcaagaa gcttggcata caaaagaaga atcatttcgt agttgtcaat 1980 cagtctctaa accgccaagg tataacttat tataactacg atgaatttga tgatctcgat 2040 gagagtcgga aatacatttt caacaagact gcagagtatc aagaagagat agatattctt 2100 aaagatattt ttattcagat gcttttttcc tggttttcta ttgcaaattt cgttcttacc 2160 ttttattatt tagcaggatc aatgaattta gttattaaac atggtgaggc cttattcatt 2220 ttttttaaat acctgatctt ttgtgacttg gcaagtttat tcattatttc catgggtaat 2280 agaccccagg gcgcgaaaca tttattcatt acctccatgg ttatactgtc tatatgtgcc 2340 acatattctc taatttgtgg gtttgttttt gctttcaagt cgttagcttc tggaacggaa 2400 tcccacaaaa tatttgtcga catcgttatc tcattgctct ccacctatgg cctatacttt 2460 ttctcatcac tgatgtacct agatccttgg cacatgttta catcatccat acaatacttt 2520 ttgacacttc ccgcctttac gtgtacttta cagatttttg ccttctgtaa tacacacgac 2580 gtttcctggg gtactaaagg ttccacacag gagtccaagc aattgtccaa ggccattgtc 2640 gttcaaggtc cagatgggaa acagattgtg gaaacagatt ggcctcagga agttgataag 2700 aagtttttgg aaataaaaag tcgtttgaaa gaaccagaat ttgaagaatc aagcggcaat 2760 gaaaaacaat ccaagaatga ttattataga gatataagaa ccagaattgt gatgatttgg 2820 atgctatcaa atctaatact gatcatgtct ataattcaag tctttacacc acaagatact 2880 gacaatggtt atttgatatt cattttatgg tctgtggccg ctttagctgc ctttagggtg 2940 gttggttcca tggccttttt gttcatgaaa tacttgcgta taatagtgag ttacagaaat 3000 aaagttgaag gtagcggctc atgggaagtc tctaaattag acttaccaaa tgttttccac 3060 aaaaagggct aa 3072 <210> 5 <211> 3072 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of a polypeptide having chondroitin synthase activity (HHASA.Sc) <400> 5 atgaacaccc tttcccaggc aattaaggct tataatagta atgattatca actagccctc 60 aagctgttcg aaaagtcggc agaaatctac ggcagaaaga tagttgagtt ccaaattacg 120 aagtgcaagg agaaactttc tgcgcaccca tccgttaaca gtgcgcatct ctcggttaac 180 aaagaagaga aggtgaatgt ttgcgacagt ccattagaca tagccactca attattgtta 240 tcgaatgtga aaaaactcgt ccttagtgat agcgagaaaa atacactaaa gaataaatgg 300 aagttgttga ctgaaaagaa gtctgagaac gcagaggtcc gggccgtagc tttagttccc 360 aaggactttc cgaaagattt agtgcttgcg ccgttaccag accatgtgaa cgattttacg 420 tggtataaga agcggaagaa acgcctagga atcaaaccag aacaccaaca cgttggcctc 480 tccattattg tgacaacgtt caaccgtcct gccatcctca gcatcaccct ggcttgcctc 540 gtcaatcaaa agacccatta tccttttgag gtgatcgtga ccgacgatgg ttctcaagag 600 gatttatcgc ctataatccg tcaatatgag aacaagctag acatccgtta tgttcggcaa 660 aaggacaacg gttttcaggc atcggccgca cgtaatatgg gcctacgtct agccaaatat 720 gacttcattg ggctccttga ttgtgatatg gctcccaacc ctttgtgggt acactcatac 780 gttgcggaac tattagagga cgatgatttg accataatag gccccaggaa gtacattgac 840 acgcaacaca tagatcccaa ggatttcctt aataacgcct ctctgttaga gtcgttgcca 900 gaggttaaga ccaataattc cgtcgcggct aagggcgagg ggaccgtatc tttagactgg 960 cgtttggaac aatttgagaa gaccgagaac ttgaggctat ccgatagccc tttccgattc 1020 ttcgcagctg ggaatgtggc tttcgccaag aagtggctta acaagtcagg attcttcgac 1080 gaggaattca atcactgggg aggtgaagat gtagagttcg gttatcgtct gtttcggtac 1140 ggttcgttct tcaaaactat agacggcatc atggcctatc atcaggaacc gccaggtaaa 1200 gaaaacgaaa ctgacagaga agcgggcaag aacattaccc tcgatataat gagggagaag 1260 gtgccttaca tctaccgtaa actcctgcct atagaagaca gtcatatcaa ccgagtacca 1320 ttggtatcaa tttacatccc ggcctacaac tgtgctaact atattcaaag atgtgttgat 1380 tcagctttga atcaaacggt agttgatctc gaagtgtgca tttgcaacga cggtagtact 1440 gacaacacgc tggaagttat taacaagctg tatggtaata atccgcgtgt gcgtataatg 1500 tctaaaccca atggcggcat tgcgagtgca tccaacgcag cggtcagctt cgcaaagggt 1560 tattacatag gacagttgga cagcgacgat tacttagaac ccgacgcagt ggagttatgt 1620 ctcaaggaat ttcttaagga taagaccctt gcgtgcgttt acaccactaa tcgtaacgtc 1680 aacccagatg gctctttaat agccaatggc tataactggc cagagttcag tcgtgagaag 1740 ttgactacgg ccatgattgc tcatcacttc cggatgttta ccattcgtgc ttggcatctg 1800 acggatgggt tcaatgagaa gattgagaac gctgttgact acgacatgtt tctcaagctc 1860 agtgaagttg gtaaatttaa gcatctgaac aaaatatgtt ataatcgggt gttacacggc 1920 gataacacct caatcaagaa gcttggcata caaaagaaga atcatttcgt agttgtcaat 1980 cagtctctaa accgccaagg tataacttat tataactacg atgaatttga tgatctcgat 2040 gagagtcgga aatacatttt caacaagact gcagagtatc aagaagagat agatattctt 2100 aaagatattt ttattcagat gcttttttcc tggttttcta ttgcaaattt cgttcttacc 2160 ttttattatt tagcaggatc aatgaattta gttattaaac atggtgaggc cttattcatt 2220 ttttttaaat acctgatctt ttgtgacttg gcaagtttat tcattatttc catgggtaat 2280 agaccccagg gcgcgaaaca tttattcatt acctccatgg ttatactgtc tatatgtgcc 2340 acatattctc taatttgtgg gtttgttttt gctttcaagt cgttagcttc tggaacggaa 2400 tcccacaaaa tatttgtcga catcgttatc tcattgctct ccacctatgg cctatacttt 2460 ttctcatcac tgatgtacct agatccttgg cacatgttta catcatccat acaatacttt 2520 ttgacacttc ccgcctttac gtgtacttta cagatttttg ccttctgtaa tacacacgac 2580 gtttcctggg gtactaaagg ttccacacag gagtccaagc aattgtccaa ggccattgtc 2640 gttcaaggtc cagatgggaa acagattgtg gaaacagatt ggcctcagga agttgataag 2700 aagtttttgg aaataaaaag tcgtttgaaa gaaccagaat ttgaagaatc aagcggcaat 2760 gaaaaacaat ccaagaatga ttattataga gatataagaa ccagaattgt gatgatttgg 2820 atgctatcaa atctaatact gatcatgtct ataattcaag tctttacacc acaagatact 2880 gacaatggtt atttgatatt cattttatgg tctgtggccg ctttagctgc ctttagggtg 2940 gttggttcca tggccttttt gttcatgaaa tacttgcgta taatagtgag ttacagaaat 3000 aaagttgaag gtagcggctc atgggaagtc tctaaattag acttaccaaa tgttttccac 3060 aaaaagggct aa 3072 <210> 6 <211> 1719 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of a polypeptide having chondroitin synthase activity (HCOS1-Vir) <400> 6 atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60 gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120 aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180 tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240 ctccgaccca aagggtggaa tgatgttagg ttggctgtaa ttattgccgg ctaccgtgag 300 gacccgtata tgttccaaaa gtgtcttgaa agtgtgcgtg actcagacta tgggaatgta 360 gctagactaa tatgcgttat tgacggcgat gaagacgacg acatgaggat ggctgcagtg 420 tacaaggcta tctataacga caacatcaag aaacctgagt ttgtcctctg tgagagtgac 480 gataaggagg gtgagagaat agatagcgat ttcagccgtg atatctgcgt gctgcaaccg 540 catcgcggaa agcgtgaatg tttgtacaca gggttccaat tggcaaagat ggacccctca 600 gttaatgccg tcgtcctaat cgacagtgac actgtgttag aaaaggacgc gattctcgaa 660 gtagtatacc cgctggcatg cgatccagaa atacaggctg tagcaggcga atgcaaaata 720 tggaatactg acacactgtt gagtttgctg gtagcctggc gatattacag cgcattttgc 780 gtagagcgta gcgcccaatc attcttcagg acagtacaat gcgtcggagg acctctcggc 840 gcctacaaga ttgatataat taaggaaatc aaggacccat ggatcagcca acgtttcctt 900 ggccaaaagt gcacatacgg cgacgataga cgactcacta atgaaatact aatgaggggt 960 aagaaagtag ttttcacccc attcgctgtt ggctggggat ggttcgacga ggagttcaca 1020 cactggggtg gccgttacat tgtacagcaa acacggtggt ccaagtcgtg gtgtagggag 1080 atatggtata cactgtttgc agcatggaag catggacttt cgggcatttg gctcgcattc 1140 gagtgcttat accagattac ttatttcttc ctggtgattt acctattctc ccgtttggct 1200 gttgaggctg acccacgggc gcaaacggcc accgtcattg tttcgaccac agttgcgctt 1260 attaagtgcg gttactttag cttcagagct aaagacatta gggccttcta tttcgtcctc 1320 tacacgttcg tttacttctt ctgcatgatt ccggcacgaa taactgcgat gatgaccctg 1380 tgggacatag gttggggaac caggggagga aatgagaagc cttccgtagg caccagagtt 1440 gctttgtggg ccaagcaata tttgattgct tacatgtggt gggccgctgt cgtcggtgct 1500 ggcgtgtact ccatcgttca taattggatg tttgactgga attcactttc ctacaggttc 1560 gcactggtag gcatctgttc gtatatagtt ttcattgtaa tagtgctggt agtctacttt 1620 acaggaaaga tcacgacctg gaacttcacg aagctacaga aagaattgat cgaggaccgc 1680 gtactgtacg acgcaacgac caatgcccag tcggtataa 1719 <210> 7 <211> 1716 <212> DNA <213> other sequences <220> <223> reencoded nucleic acid sequence of a polypeptide having chondroitin synthase activity (HCOS2-Vir) <400> 7 atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60 gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120 aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180 tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240 ctccgaccca aagggtggaa tgatgttagg ttggctgtaa ttattgccgg ctaccgtgag 300 gacccgtata tgttccaaaa gtgtcttgaa agtgtgcgtg actcagacta tgggaatgta 360 gctagactaa tatgcgttat tgacggcgat gaagacgacg acatgaggat ggctgcagtg 420 tacaaggcta tctataacga caacatcaag aaacctgagt ttgtcctctg tgagagtgac 480 gataaggagg gtgagagaat agatagcgat ttcagccgtg atatctgcgt gctgcaaccg 540 catcgcggaa agcgtgaatg tttgtacaca gggttccaat tggcaaagat ggacccctca 600 gttaatgccg tcgtcctaat cgacagtgac actgtgttag aaaaggacgc gattctcgaa 660 gtagtatacc cgctggcatg cgatccagaa atacaggctg tagcaggcga atgcaaaata 720 tggaatactg acacactgtt gagtttgctg gtagcctggc gatattacag cgcattttgc 780 gtagagcgta gcgcccaatc attcttcagg acagtacaat gcgtcggagg acctctcggc 840 gcctacaaga ttgatataat taaggaaatc aaggacccat ggatcagcca acgtttcctt 900 ggccaaaagt gcacatacgg cgacgataga cgactcacta atgaaatact aatgaggggt 960 aagaaagtag ttttcacccc attcgctgtt ggctggctac acggtgagaa tacgtctatc 1020 aagaagttac gttacattgt acagcaaaca cggtggtcca agtcgtggtg tagggagata 1080 tggtatacac tgtttgcagc atggaagcat ggactttcgg gcatttggct cgcattcgag 1140 tgcttatacc agattactta tttcttcctg gtgatttacc tattctcccg tttggctgtt 1200 gaggctgacc cacgggcgca aacggccacc gtcattgttt cgaccacagt tgcgcttatt 1260 aagtgcggtt actttagctt cagagctaaa gacattaggg ccttctattt cgtcctctac 1320 acgttcgttt acttcttctg catgattccg gcacgaataa ctgcgatgat gaccctgtgg 1380 gacataggtt ggggaaccag gggaggaaat gagaagcctt ccgtaggcac cagagttgct 1440 ttgtgggcca agcaatattt gattgcttac atgtggtggg ccgctgtcgt cggtgctggc 1500 gtgtactcca tcgttcataa ttggatgttt gactggaatt cactttccta caggttcgca 1560 ctggtaggca tctgttcgta tatagttttc attgtaatag tgctggtagt ctactttaca 1620 ggaaagatca cgacctggaa cttcacgaag ctacagaaag aattgatcga ggaccgcgta 1680 ctgtacgacg caacgaccaa tgcccagtcg gtataa 1716 <210> 8 <211> 1719 <212> DNA <213> other sequences <220> <223> reencoded nucleic acid sequence of a polypeptide having chondroitin synthase activity (HCOS3-Vir) <400> 8 atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60 gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120 aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180 tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240 ctccgaccca aagggtggaa tgatgttagg ttggctgtaa ttattgccgg ctaccgtgag 300 gacccgtata tgttccaaaa gtgtcttgaa agtgtgcgtg actcagacta tgggaatgta 360 gctagactaa tatgcgttat tgacggcgat gaagacgacg acatgaggat ggctgcagtg 420 tacaaggcta tctataacga caacatcaag aaacctgagt ttgtcctctg tgagagtgac 480 gataaggagg gtgagagaat agatagcgat ttcagccgtg atatctgcgt gctgcaaccg 540 catcgcggaa agcgtgaatg tttgtacaca gggttccaat tggcaaagat ggacccctca 600 gttaatgccg tcgtcctaat cgacagtgac actgtgttag aaaaggacgc gattctcgaa 660 gtagtatacc cgctggcatg cgatccagaa atacaggctg tagcaggcga atgcaaaata 720 tggaatactg acacactgtt gagtttgctg gtagcctggc gatattacag cgcattttgc 780 gtagagcgta gcgcccaatc attcttcagg acagtacaat gcgtcggagg acctctcggc 840 gcctacaaga ttgatataat taaggaaatc aaggacccat ggatcagcca acgtttcctt 900 ggccaaaagt gcacatacgg cgacgataga cgactcacta atgaaatact aatgaggggt 960 aagaaagtag ttttcacccc attcgctgtt ggctggcaca tggcatggtc cgacaaggac 1020 gacgcaatcg accgttacat tgtacagcaa acacggtggt ccaagtcgtg gtgtagggag 1080 atatggtata cactgtttgc agcatggaag catggacttt cgggcatttg gctcgcattc 1140 gagtgcttat accagattac ttatttcttc ctggtgattt acctattctc ccgtttggct 1200 gttgaggctg acccacgggc gcaaacggcc accgtcattg tttcgaccac agttgcgctt 1260 attaagtgcg gttactttag cttcagagct aaagacatta gggccttcta tttcgtcctc 1320 tacacgttcg tttacttctt ctgcatgatt ccggcacgaa taactgcgat gatgaccctg 1380 tgggacatag gttggggaac caggggagga aatgagaagc cttccgtagg caccagagtt 1440 gctttgtggg ccaagcaata tttgattgct tacatgtggt gggccgctgt cgtcggtgct 1500 ggcgtgtact ccatcgttca taattggatg tttgactgga attcactttc ctacaggttc 1560 gcactggtag gcatctgttc gtatatagtt ttcattgtaa tagtgctggt agtctacttt 1620 acaggaaaga tcacgacctg gaacttcacg aagctacaga aagaattgat cgaggaccgc 1680 gtactgtacg acgcaacgac caatgcccag tcggtataa 1719 <210> 9 <211> 1713 <212> DNA <213> other sequences <220> <223> reencoded nucleic acid sequence of a polypeptide having chondroitin synthase activity (HCOS4-Vir) <400> 9 atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60 gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120 aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180 tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240 ctccgaccca aagggtggaa tgatgttagg ttggctgtaa ttattgccgg ctaccgtgag 300 gacccgtata tgttccaaaa gtgtcttgaa agtgtgcgtg actcagacta tgggaatgta 360 gctagactaa tatgcgttat tgacggcgat gaagacgacg acatgaggat ggctgcagtg 420 tacaaggcta tctataacga caacatcaag aaacctgagt ttgtcctctg tgagagtgac 480 gataaggagg gtgagagaat agatagcgat ttcagccgtg atatctgcgt gctgcaaccg 540 catcgcggaa agcgtgaatg tttgtacaca gggttccaat tggcaaagat ggacccctca 600 gttaatgccg tcgtcctaat cgacagtgac actgtgttag aaaaggacgc gattctcgaa 660 gtagtatacc cgctggcatg cgatccagaa atacaggctg tagcaggcga atgcaaaata 720 tggaatactg acacactgtt gagtttgctg gtagcctggc gatattacag cgcattttgc 780 gtagagcgta gcgcccaatc attcttcagg acagtacaat gcgtcggagg acctctcggc 840 gcctacaaga ttgatataat taaggaaatc aaggacccat ggatcagcca acgtttcctt 900 ggccaaaagt gcacatacgg cgacgataga cgactcacta atgaaatact aatgaggggt 960 aagaaagtag ttttcacccc attcgctgtt ggctggttcg acgaggagtt cacacactgg 1020 ggtggccgtt acattgtaca gcaaacacgg tggtccaagt cgtggtgtag ggagatatgg 1080 tatacactgt ttgcagcatg gaagcatgga ctttcgggca tttggctcgc attcgagtgc 1140 ttataccaga ttacttattt cttcctggtg atttacctat tctcccgttt ggctgttgag 1200 gctgacccac gggcgcaaac ggccaccgtc attgtttcga ccacagttgc gcttattaag 1260 tgcggttact ttagcttcag agctaaagac attagggcct tctatttcgt cctctacacg 1320 ttcgtttact tcttctgcat gattccggca cgaataactg cgatgatgac cctgtgggac 1380 ataggttggg gaaccagggg aggaaatgag aagccttccg taggcaccag agttgctttg 1440 tgggccaagc aatatttgat tgcttacatg tggtgggccg ctgtcgtcgg tgctggcgtg 1500 tactccatcg ttcataattg gatgtttgac tggaattcac tttcctacag gttcgcactg 1560 gtaggcatct gttcgtatat agttttcatt gtaatagtgc tggtagtcta ctttacagga 1620 aagatcacga cctggaactt cacgaagcta cagaaagaat tgatcgagga ccgcgtactg 1680 tacgacgcaa cgaccaatgc ccagtcggta taa 1713 <210> 10 <211> 2079 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of a polypeptide having chondroitin synthase activity (HCOS5-Vir) <400> 10 atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60 gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120 aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180 tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240 ctccgaccca aatccattca ccatccaatt tcgaaaacga ctcaccccga cacagaaaat 300 gcaggtgact caacattgtt gtgcccgccc atggatggta tggacgacat attagtcgtt 360 atgaagacag gtgtcacaga ggctaaggaa aaggtgccag tacattttca gacaacgctg 420 aggtgtgtgc cgcactacgt tatctatagc gacttcgaag aagagataga aggtgtaaag 480 atttacgacg tcttgcaagg aatggacccc gatgttatga cgcaggttcc ggacttcgat 540 ctttacaatc gtattaagaa gttagggcgt cagggccttg cggagaacga cttcgcggac 600 gaagcgaact ctgcggtggg taagcctaat aaccctggtt ggaagttaga taaatggaag 660 ttcttaccta tgatcattga ggctctgaga tacaaaccaa aggctaagtg gtatgttttc 720 atggaagcag acacttatat atcttggccg actttattag cctggctaaa acacttcaac 780 cacaagaagc cgtggtatct tggcactgag acacagatag ccgatgtgat tttcgctcat 840 ggtggttcag gattcatgat tagtcatgcc gcgcttaagc ttgctgctga agaatatacc 900 gcacgtcgta ctgagttgca ccactacaca gacggtcact gggcaggaga ctgcgtatta 960 ggtaaagttc ttgctgacgc aggtgtgaac ttgcatttct cctggccaat tttacagaat 1020 tccaatctgg gcgaactgga tgagttcaac gttgacttat acaggcaacc ttggtgcttt 1080 ccagctgccg ctttccacca cttgaacgct cagaagatcc aggacttatg gtcttacgag 1140 cagaaaaggt ggcaggacaa ggacaagagg gttctgttac atagcgacgt cttcagggac 1200 ctattatatc cggatatagc attaaaaccc gcgaggatcg gttgggacaa cctgagtgca 1260 gacgaacagt ctacggcctc tagtttcgag gaatgcaggc aaatttgtga tcaattagac 1320 gattgtaccc agtttagttt cagggacaaa tcctgtttta catcaagaac tccacgtttg 1380 ggcgcagcca atccaaatac agttagcgga tggatggttg atcgtatccg tgcgaatatg 1440 gagaagtctg gactgtttgc agcatggaag catggacttt cgggcatttg gctcgcattc 1500 gagtgcttat accagattac ttatttcttc ctggtgattt acctattctc ccgtttggct 1560 gttgaggctg acccacgggc gcaaacggcc accgtcattg tttcgaccac agttgcgctt 1620 attaagtgcg gttactttag cttcagagct aaagacatta gggccttcta tttcgtcctc 1680 tacacgttcg tttacttctt ctgcatgatt ccggcacgaa taactgcgat gatgaccctg 1740 tgggacatag gttggggaac caggggagga aatgagaagc cttccgtagg caccagagtt 1800 gctttgtggg ccaagcaata tttgattgct tacatgtggt gggccgctgt cgtcggtgct 1860 ggcgtgtact ccatcgttca taattggatg tttgactgga attcactttc ctacaggttc 1920 gcactggtag gcatctgttc gtatatagtt ttcattgtaa tagtgctggt agtctacttt 1980 acaggaaaga tcacgacctg gaacttcacg aagctacaga aagaattgat cgaggaccgc 2040 gtactgtacg acgcaacgac caatgcccag tcggtataa 2079 <210> 11 <211> 2733 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of a polypeptide having chondroitin synthase activity (HCOS6-Vir) <400> 11 atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60 gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120 aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180 tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240 ctccgaccca aattagacat tgcaacacag ttattactat cgaatgttaa gaaattgacc 300 ttaagcgagt ccgaaaagaa cagcttaaag aataagtgga agagtataac aggcaagaag 360 tccgagaatg ctgaaattag gaaggttgag ttagtcccaa aggattttcc caaagactta 420 gttttagcgc cactaccaga ccatgtgaac gattttacct ggtacaagaa tagaaagaag 480 agcctgggca taaagcctgt gaacaagaac atcgggttgt caatcataat cccaactttc 540 aatcgtagta ggatattaga cattaccctg gcgtgtctag ttaatcagaa aactaactat 600 ccgtttgagg tggttgttgc agatgatggg tcgaaggaaa atctattgac tatagttcag 660 aaatacgagc agaaactaga cattaagtat gtgagacaga aggactatgg gtatcagctg 720 tgcgccgtta gaaaccttgg tctaaggaca gcgaagtatg actttgtctc tatcttggat 780 tgcgacatgg ccccgcagca gctatgggtt cactcttacc ttacagagtt actggaagac 840 aacgacatcg tcttgatcgg gccaaggaaa tacgttgata cccacaacat cacggctgag 900 cagtttctga acgacccata tttaattgag agtttaccgg aaaccgccac aaacaataat 960 ccatcgatta ccagtaaggg taacatctca ttagattgga gattagaaca ttttaagaag 1020 acagacaacc taagactatg cgactccccg ttcaggtatt tctcatgcgg aaatgtggcc 1080 ttctccaaag agtggctgaa caaagttggc tggttcgacg aagaatttaa tcactggggc 1140 ggcgaagacg tcgaattcgg ctacaggtta tttgcaaaag ggtgcttctt tagggttatc 1200 gacggtggta tggcctacca tcaagagcca ccaggaaagg agaacgaaac ggatcgtgag 1260 gccggtaagt ctatcactct taaaatagta aaggagaaag tgccctacat ctacaggaag 1320 ttgttgccga ttgaggactc ccacatacac cgtataccgc ttgtgagcat atacattcca 1380 gcgtacaact gcgccaatta tattcaaagg tgtgtagata gcgcgttgaa tcaaacagtg 1440 gtagatttgg aagtttgtat atgtaacgac ggaagtactg acaatacttt agaggtgatt 1500 aacaagctgt atggcaacaa cccgcgtgtc aggataatga gcaagcccaa tggtggaatt 1560 gcttccgcgt ctaacgctgc cgtttcattc gcgaaaggct actacattgg ccagttggac 1620 tcggatgatt acttggaacc tgacgcagtg gagctttgtt taaaggagtt cttgaaggac 1680 aaaacactag cctgtgtata tacaacgaac agaaatgtta atcctgacgg ttccctaatc 1740 gctaacggat acaattggcc tgagttcagc agggagaagc tgaccactgc tatgatcgcc 1800 caccatttca ggatgttcac aatcagggct tggcatttaa cagatggttt taatgagaaa 1860 atagagaacg cagtagacta cgatatgttt ctgaagttat cagaggtcgg gaaattcaaa 1920 cacttgaaca aaatttgtta caatagggta ttacacggtg acaacaccag tattaagaat 1980 cttgacaccc aaaagaagaa ccacttcgta gtagtgaacc agtctctgaa cagacaaagg 2040 gtgtcgaatt ataactacga tgagtttgat aacctggacg agagccgtaa gtacatattc 2100 aacaagctgt ttgcagcatg gaagcatgga ctttcgggca tttggctcgc attcgagtgc 2160 ttataccaga ttacttattt cttcctggtg atttacctat tctcccgttt ggctgttgag 2220 gctgacccac gggcgcaaac ggccaccgtc attgtttcga ccacagttgc gcttattaag 2280 tgcggttact ttagcttcag agctaaagac attagggcct tctatttcgt cctctacacg 2340 ttcgtttact tcttctgcat gattccggca cgaataactg cgatgatgac cctgtgggac 2400 ataggttggg gaaccagggg aggaaatgag aagccttccg taggcaccag agttgctttg 2460 tgggccaagc aatatttgat tgcttacatg tggtgggccg ctgtcgtcgg tgctggcgtg 2520 tactccatcg ttcataattg gatgtttgac tggaattcac tttcctacag gttcgcactg 2580 gtaggcatct gttcgtatat agttttcatt gtaatagtgc tggtagtcta ctttacagga 2640 aagatcacga cctggaactt cacgaagcta cagaaagaat tgatcgagga ccgcgtactg 2700 tacgacgcaa cgaccaatgc ccagtcggta taa 2733 <210> 12 <211> 2112 <212> DNA <213> other sequences <220> <223> reencoded nucleic acid sequence of a polypeptide having chondroitin synthase activity (HCOS7-Vir) <400> 12 atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60 gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120 aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180 tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240 ctccgaccca aaatcccaac tttcaatcgt agtaggatat tagacattac cctggcgtgt 300 ctagttaatc agaaaactaa ctatccgttt gaggtggttg ttgcagatga tgggtcgaag 360 gaaaatctat tgactatagt tcagaaatac gagcagaaac tagacattaa gtatgtgaga 420 cagaaggact atgggtatca gctgtgcgcc gttagaaacc ttggtctaag gacagcgaag 480 tatgactttg tctctatctt ggattgcgac atggccccgc agcagctatg ggttcactct 540 taccttacag agttactgga agacaacgac atcgtcttga tcgggccaag gaaatacgtt 600 gatacccaca acatcacggc tgagcagttt ctgaacgacc catatttaat tgagagttta 660 ccggaaaccg ccacaaacaa taatccatcg attaccagta agggtaacat ctcattagat 720 tggagattag aacattttaa gaagacagac aacctaagac tatgcgactc cccgttcagg 780 tatttctcat gcggaaatgt ggccttctcc aaagagtggc tgaacaaagt tggctggttc 840 gacgaagaat ttaatcactg gggcggcgaa gacgtcgaat tcggctacag gttatttgca 900 aaagggtgct tctttagggt tatcgacggt ggtatggcct accatcaaga gccaccagga 960 aaggagaacg aaacggatcg tgaggccggt aagtctatca ctcttaaaat agtaaaggag 1020 aaagtgccct acatctacag gaagttgttg ccgattgagg actcccacat acaccgtata 1080 ccgcttgtga gcatatacat tccagcgtac aactgcgcca attatattca aaggtgtgta 1140 gatagcgcgt tgaatcaaac agtggtagat ttggaagttt gtatatgtaa cgacggaagt 1200 actgacaata ctttagaggt gattaacaag ctgtatggca acaacccgcg tgtcaggata 1260 atgagcaagc ccaatggtgg aattgcttcc gcgtctaacg ctgccgtttc attcgcgaaa 1320 ggctactaca ttggccagtt ggactcggat gattacttgg aacctgacgc agtggagctt 1380 tgtttaaagg agttcttgaa ggacaaaaca ctagcctgtg tatatacaac gaacagaaat 1440 gttaatcctg acggttccct aatcgctaac ggatacaatt ggcctctgtt tgcagcatgg 1500 aagcatggac tttcgggcat ttggctcgca ttcgagtgct tataccagat tacttatttc 1560 ttcctggtga tttacctatt ctcccgtttg gctgttgagg ctgacccacg ggcgcaaacg 1620 gccaccgtca ttgtttcgac cacagttgcg cttattaagt gcggttactt tagcttcaga 1680 gctaaagaca ttagggcctt ctatttcgtc ctctacacgt tcgtttactt cttctgcatg 1740 attccggcac gaataactgc gatgatgacc ctgtgggaca taggttgggg aaccagggga 1800 ggaaatgaga agccttccgt aggcaccaga gttgctttgt gggccaagca atatttgatt 1860 gcttacatgt ggtgggccgc tgtcgtcggt gctggcgtgt actccatcgt tcataattgg 1920 atgtttgact ggaattcact ttcctacagg ttcgcactgg taggcatctg ttcgtatata 1980 gttttcattg taatagtgct ggtagtctac tttacaggaa agatcacgac ctggaacttc 2040 acgaagctac agaaagaatt gatcgaggac cgcgtactgt acgacgcaac gaccaatgcc 2100 cagtcggtat aa 2112 <210> 13 <211> 1710 <212> DNA <213> other sequences <220> <223> reencoded nucleic acid sequence of a polypeptide having chondroitin synthase activity (HCOS8-Vir) <400> 13 atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60 gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120 aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180 tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240 ctccgaccca aagggtggaa tgatgttagg ttggctgtaa ttattgccgg ctaccgtgag 300 gacccgtata tgttccaaaa gtgtcttgaa agtgtgcgtg actcagacta tgggaatgta 360 gctagactaa tatgcgttat tgacggcgat gaagacgacg acatgaggat ggctgcagtg 420 tacaaggcta tctataacga caacatcaag aaacctgagt ttgtcctctg tgagagtgac 480 gataaggagg gtgagagaat agatagcgat ttcagccgtg atatctgcgt gctgcaaccg 540 catcgcggaa agcgtgaatg tttgtacaca gggttccaat tggcaaagat ggacccctca 600 gttaatgccg tcgtcctaat cgacagtgac actgtgttag aaaaggacgc gattctcgaa 660 gtagtatacc cgctggcatg cgatccagaa atacaggctg tagcaggcga atgcaaaata 720 tggaatactg acacactgtt gagtttgctg gtagcctggc gatattacag cgcattttgc 780 gtagagcgta gcgcccaatc attcttcagg acagtacaat gcgtcagact atgcgactcc 840 ccgttcaggt atttctcatg cggaaatgtg gccttctcca aagagtggct gaacaaagtt 900 ggctggttcg acgaagaatt taatcactgg ggcggcgaag acgtcgaatt cggctacagg 960 ttaaagaaag tagttttcac cccattcgct gttggctggt ccgacagccc gacgaacgtc 1020 ttccgttaca ttgtacagca aacacggtgg tccaagtcgt ggtgtaggga gatatggtat 1080 acactgtttg cagcatggaa gcatggactt tcgggcattt ggctcgcatt cgagtgctta 1140 taccagatta cttatttctt cctggtgatt tacctattct cccgtttggc tgttgaggct 1200 gacccacggg cgcaaacggc caccgtcatt gtttcgacca cagttgcgct tattaagtgc 1260 ggttacttta gcttcagagc taaagacatt agggccttct atttcgtcct ctacacgttc 1320 gtttacttct tctgcatgat tccggcacga ataactgcga tgatgaccct gtgggacata 1380 ggttggggaa ccaggggagg aaatgagaag ccttccgtag gcaccagagt tgctttgtgg 1440 gccaagcaat atttgattgc ttacatgtgg tgggccgctg tcgtcggtgc tggcgtgtac 1500 tccatcgttc ataattggat gtttgactgg aattcacttt cctacaggtt cgcactggta 1560 ggcatctgtt cgtatatagt tttcattgta atagtgctgg tagtctactt tacaggaaag 1620 atcacgacct ggaacttcac gaagctacag aaagaattga tcgaggaccg cgtactgtac 1680 gacgcaacga ccaatgccca gtcggtataa 1710 <210> 14 <211> 2499 <212> DNA <213> other sequences <220> <223> a nucleic acid sequence of a polypeptide having chondroitin synthase activity (HCOS9-Vir) <400> 14 atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60 gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120 aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180 tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240 ctccgaccca aacacattgg taagtgtcta agggaaatgt atacgactca tgaggacgtg 300 gaagtaggaa gatgcgttag gagattcgct ggagtacagt gtgtttggtc ttacgagatg 360 caacagttat tctacgagaa ctacgagcag aataagaagg gatacatccg tgatctgcac 420 aactccaaaa ttcaccaagc aataacgctg catcctaaca agaatccgcc ctatcagtat 480 aggttgcact cttacatgtt gagtagaaag atatctgagc tacgtcatag aactattcag 540 ttgcacaggg agatagtact gatgtctaaa tactcaaaca cggagatcca taaggaagac 600 ctacagttgg gtataccacc ttcgttcatg agattccagc caagacagag ggaagaaatt 660 ttggagtggg agttcttgac tggtaaatac ttgtattctg ctgttgacgg tcaaccacct 720 aggagaggga tggactctgc acagcgtgag gctttagacg atatagtgat gcaagtaatg 780 gaaatgatca acgctaatgc aaagacacgt ggtcgtatca tagatttcaa agagatccag 840 tatggatatc gtcgtgtgaa cccaatgtac ggcgcggagt atattcttga cttattgttg 900 ctatacaaga aacataaggg taagaagatg actgtcccgg ttcgtaggca cgcgtatttg 960 caacagactt tctcgaaaat acagtttgta gagcatgagg aacttgacgc gcaagagtta 1020 gcgaaacgta taaaccaaga gtcggggagt ttatccttct taagtaattc ccttaagaag 1080 ttggttcctt tccagctgcc tggaagtaaa agtgagcaca aggagccaaa ggataagaaa 1140 atcaacattc ttatacctct ttccggcaga ttcgacatgt tcgttaggtt catgggtaac 1200 ttcgagaaga cctgcttaat tcctaaccag aatgttaagt tggtagtttt gttattcaat 1260 tctgacagta accccgacaa agcaaagcag gttgaactga tgagagacta taggattaag 1320 tacccaaaag cagatatgca gatactacct gtttccggag aattctcaag agccttggct 1380 ctggaagtag gcagctctca gtttaataat gagtctcttc tgttcttctg cgacgttgac 1440 ttagttttca cgacagagtt tctgcagaga tgtcgtgcaa acactgtact aggtcagcag 1500 atatatttcc ccattatttt cagtcagtac gatccaaaga ttgtttatag tggaaaagtt 1560 ccatctgaca accattttgc gtttactcaa aagacagggt tttggcgtaa ctacgggttc 1620 ggcataacat gtatctataa aggggacctg gtaagagttg gcggattcga cgtatctata 1680 cagggctggg gtttagaaga cgtcgatcta tttaataaag tagttcaggc aggtttgaag 1740 acattccgta gtcaagaggt aggcgttgta cacgtgcacc atccagtatt ttgcgaccca 1800 aacttagacc cgaagcaata taaaatgtgc ttgggttcca aggcatcgac ttacggttcc 1860 acgcagcaac tactgtttgc agcatggaag catggacttt cgggcatttg gctcgcattc 1920 gagtgcttat accagattac ttatttcttc ctggtgattt acctattctc ccgtttggct 1980 gttgaggctg acccacgggc gcaaacggcc accgtcattg tttcgaccac agttgcgctt 2040 attaagtgcg gttactttag cttcagagct aaagacatta gggccttcta tttcgtcctc 2100 tacacgttcg tttacttctt ctgcatgatt ccggcacgaa taactgcgat gatgaccctg 2160 tgggacatag gttggggaac caggggagga aatgagaagc cttccgtagg caccagagtt 2220 gctttgtggg ccaagcaata tttgattgct tacatgtggt gggccgctgt cgtcggtgct 2280 ggcgtgtact ccatcgttca taattggatg tttgactgga attcactttc ctacaggttc 2340 gcactggtag gcatctgttc gtatatagtt ttcattgtaa tagtgctggt agtctacttt 2400 acaggaaaga tcacgacctg gaacttcacg aagctacaga aagaattgat cgaggaccgc 2460 gtactgtacg acgcaacgac caatgcccag tcggtataa 2499 <210> 15 <211> 3006 <212> DNA <213> other sequences <220> <223> reencoded nucleic acid sequence of a polypeptide having chondroitin synthase activity (HCOS10-Vir) <400> 15 atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60 gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120 aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180 tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240 ctccgaccca aaagagatag aaacttccta ttcgttggtg ttatgacagc tcagaagtac 300 ttacagacca gggcggttgc agcatataga acctggtcaa agacaattcc aggtaaggta 360 cagttcttca gctccgaggg ttctgacacc agcgtcccta tcccagtagt gcctttgcgt 420 ggagtggatg attcataccc acctcagaag aagtccttca tgatgcttaa gtatatgcac 480 gaccactatc tggacaaata cgagtggttc atgagagcag acgacgacgt ttacataaag 540 ggtgatagac tggagaattt cttgaggtca ctaaacagtt cagaaccact tttcctagga 600 cagacgggcc ttggtacgac agaggagatg ggtaagttgg cattggagcc aggggagaac 660 ttctgcatgg gtggccctgg tgtgattatg agtagggaag ttttaagaag aatggttccg 720 cacattggta agtgtctaag ggaaatgtat acgactcatg aggacgtgga agtaggaaga 780 tgcgttagga gattcgctgg agtacagtgt gtttggtctt acgagatgca acagttattc 840 tacgagaact acgagcagaa taagaaggga tacatccgtg atctgcacaa ctccaaaatt 900 caccaagcaa taacgctgca tcctaacaag aatccgccct atcagtatag gttgcactct 960 tacatgttga gtagaaagat atctgagcta cgtcatagaa ctattcagtt gcacagggag 1020 atagtactga tgtctaaata ctcaaacacg gagatccata aggaagacct acagttgggt 1080 ataccacctt cgttcatgag attccagcca agacagaggg aagaaatttt ggagtgggag 1140 ttcttgactg gtaaatactt gtattctgct gttgacggtc aaccacctag gagagggatg 1200 gactctgcac agcgtgaggc tttagacgat atagtgatgc aagtaatgga aatgatcaac 1260 gctaatgcaa agacacgtgg tcgtatcata gatttcaaag agatccagta tggatatcgt 1320 cgtgtgaacc caatgtacgg cgcggagtat attcttgact tattgttgct atacaagaaa 1380 cataagggta agaagatgac tgtcccggtt cgtaggcacg cgtatttgca acagactttc 1440 tcgaaaatac agtttgtaga gcatgaggaa cttgacgcgc aagagttagc gaaacgtata 1500 aaccaagagt cggggagttt atccttctta agtaattccc ttaagaagtt ggttcctttc 1560 cagctgcctg gaagtaaaag tgagcacaag gagccaaagg ataagaaaat caacattctt 1620 atacctcttt ccggcagatt cgacatgttc gttaggttca tgggtaactt cgagaagacc 1680 tgcttaattc ctaaccagaa tgttaagttg gtagttttgt tattcaattc tgacagtaac 1740 cccgacaaag caaagcaggt tgaactgatg agagactata ggattaagta cccaaaagca 1800 gatatgcaga tactacctgt ttccggagaa ttctcaagag ccttggctct ggaagtaggc 1860 agctctcagt ttaataatga gtctcttctg ttcttctgcg acgttgactt agttttcacg 1920 acagagtttc tgcagagatg tcgtgcaaac actgtactag gtcagcagat atatttcccc 1980 attattttca gtcagtacga tccaaagatt gtttatagtg gaaaagttcc atctgacaac 2040 cattttgcgt ttactcaaaa gacagggttt tggcgtaact acgggttcgg cataacatgt 2100 atctataaag gggacctggt aagagttggc ggattcgacg tatctataca gggctggggt 2160 ttagaagacg tcgatctatt taataaagta gttcaggcag gtttgaagac attccgtagt 2220 caagaggtag gcgttgtaca cgtgcaccat ccagtatttt gcgacccaaa cttagacccg 2280 aagcaatata aaatgtgctt gggttccaag gcatcgactt acggttccac gcagcaacta 2340 gcagagatgt ggttggagaa gaacgaccca tcttatagcc tgtttgcagc atggaagcat 2400 ggactttcgg gcatttggct cgcattcgag tgcttatacc agattactta tttcttcctg 2460 gtgatttacc tattctcccg tttggctgtt gaggctgacc cacgggcgca aacggccacc 2520 gtcattgttt cgaccacagt tgcgcttatt aagtgcggtt actttagctt cagagctaaa 2580 gacattaggg ccttctattt cgtcctctac acgttcgttt acttcttctg catgattccg 2640 gcacgaataa ctgcgatgat gaccctgtgg gacataggtt ggggaaccag gggaggaaat 2700 gagaagcctt ccgtaggcac cagagttgct ttgtgggcca agcaatattt gattgcttac 2760 atgtggtggg ccgctgtcgt cggtgctggc gtgtactcca tcgttcataa ttggatgttt 2820 gactggaatt cactttccta caggttcgca ctggtaggca tctgttcgta tatagttttc 2880 attgtaatag tgctggtagt ctactttaca ggaaagatca cgacctggaa cttcacgaag 2940 ctacagaaag aattgatcga ggaccgcgta ctgtacgacg caacgaccaa tgcccagtcg 3000 gtataa 3006 <210> 16 <211> 1596 <212> DNA <213> other sequences <220> <223> reencoded nucleic acid sequence of a polypeptide having chondroitin synthase activity (HCOS11-Vir) <400> 16 atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60 gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120 aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180 tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240 ctccgaccca aaagagatag aaacttccta ttcgttggtg ttatgacagc tcagaagtac 300 ttacagacca gggcggttgc agcatataga acctggtcaa agacaattcc aggtaaggta 360 cagttcttca gctccgaggg ttctgacacc agcgtcccta tcccagtagt gcctttgcgt 420 ggagtggatg attcataccc acctcagaag aagtccttca tgatgcttaa gtatatgcac 480 gaccactatc tggacaaata cgagtggttc atgagagcag acgacgacgt ttacataaag 540 ggtgatagac tggagaattt cttgaggtca ctaaacagtt cagaaccact tttcctagga 600 cagacgggcc ttggtacgac agaggagatg ggtaagttgg cattggagcc aggggagaac 660 ttctgcatgg gtggccctgg tgtgattatg agtagggaag ttttaagaag aatggttccg 720 cacattggta agtgtctaag ggaaatgtat acgactcatg aggacgtgga agtaggaaga 780 tgcgttagga gattcgctgg agtacagtgt gtttggtctt acgagatgca acagttattc 840 tacgagaact acgagcagaa taagaaggga tacatccgtg atctgcacaa ctccaaaatt 900 caccaagcaa taacgctgca tcctaacaag aatccgccct atcagtatag gttgcactct 960 tacatgttgc tgtttgcagc atggaagcat ggactttcgg gcatttggct cgcattcgag 1020 tgcttatacc agattactta tttcttcctg gtgatttacc tattctcccg tttggctgtt 1080 gaggctgacc cacgggcgca aacggccacc gtcattgttt cgaccacagt tgcgcttatt 1140 aagtgcggtt actttagctt cagagctaaa gacattaggg ccttctattt cgtcctctac 1200 acgttcgttt acttcttctg catgattccg gcacgaataa ctgcgatgat gaccctgtgg 1260 gacataggtt ggggaaccag gggaggaaat gagaagcctt ccgtaggcac cagagttgct 1320 ttgtgggcca agcaatattt gattgcttac atgtggtggg ccgctgtcgt cggtgctggc 1380 gtgtactcca tcgttcataa ttggatgttt gactggaatt cactttccta caggttcgca 1440 ctggtaggca tctgttcgta tatagttttc attgtaatag tgctggtagt ctactttaca 1500 ggaaagatca cgacctggaa cttcacgaag ctacagaaag aattgatcga ggaccgcgta 1560 ctgtacgacg caacgaccaa tgcccagtcg gtataa 1596 <210> 17 <211> 1662 <212> DNA <213> other sequences <220> <223> reencoded nucleic acid sequence of a polypeptide having chondroitin synthase activity (HCOS12-Vir) <400> 17 atgggtaaga acatcattat tatggtttct tggtacacta ttattacatc caatctcatc 60 gcagtgggtg gcgcctcact catactagcc ccagctatta cgggctatgt ccttcactgg 120 aacattgccc tttcaacaat ttggggagtg tcggcctacg gaattttcgt gtttggtttc 180 tttcttgccc aggtattatt tagtgaactc aaccggaaaa ggctccggaa gtggatttcc 240 ctccgaccca aaaaggataa gaaaatcaac attcttatac ctctttccgg cagattcgac 300 atgttcgtta ggttcatggg taacttcgag aagacctgct taattcctaa ccagaatgtt 360 aagttggtag ttttgttatt caattctgac agtaaccccg acaaagcaaa gcaggttgaa 420 ctgatgagag actataggat taagtaccca aaagcagata tgcagatact acctgtttcc 480 ggagaattct caagagcctt ggctctggaa gtaggcagct ctcagtttaa taatgagtct 540 cttctgttct tctgcgacgt tgacttagtt ttcacgacag agtttctgca gagatgtcgt 600 gcaaacactg tactaggtca gcagatatat ttccccatta ttttcagtca gtacgatcca 660 aagattgttt atagtggaaa agttccatct gacaaccatt ttgcgtttac tcaaaagaca 720 gggttttggc gtaactacgg gttcggcata acatgtatct ataaagggga cctggtaaga 780 gttggcggat tcgacgtatc tatacagggc tggggtttag aagacgtcga tctatttaat 840 aaagtagttc aggcaggttt gaagacattc cgtagtcaag aggtaggcgt tgtacacgtg 900 caccatccag tattttgcga cccaaactta gacccgaagc aatataaaat gtgcttgggt 960 tccaaggcat cgacttacgg ttccacgcag caactagcag agatgtggtt ggagaagaac 1020 gacccatctt atagcctgtt tgcagcatgg aagcatggac tttcgggcat ttggctcgca 1080 ttcgagtgct tataccagat tacttatttc ttcctggtga tttacctatt ctcccgtttg 1140 gctgttgagg ctgacccacg ggcgcaaacg gccaccgtca ttgtttcgac cacagttgcg 1200 cttattaagt gcggttactt tagcttcaga gctaaagaca ttagggcctt ctatttcgtc 1260 ctctacacgt tcgtttactt cttctgcatg attccggcac gaataactgc gatgatgacc 1320 ctgtgggaca taggttgggg aaccagggga ggaaatgaga agccttccgt aggcaccaga 1380 gttgctttgt gggccaagca atatttgatt gcttacatgt ggtgggccgc tgtcgtcggt 1440 gctggcgtgt actccatcgt tcataattgg atgtttgact ggaattcact ttcctacagg 1500 ttcgcactgg taggcatctg ttcgtatata gttttcattg taatagtgct ggtagtctac 1560 tttacaggaa agatcacgac ctggaacttc acgaagctac agaaagaatt gatcgaggac 1620 cgcgtactgt acgacgcaac gaccaatgcc cagtcggtat aa 1662 <210> 18 <211> 972 <212> PRT <213> other sequences <220> <223> an amino acid sequence of a polypeptide having a chondroitin synthase activity (HCOS-1) <400> 18 Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr 1 5 10 15 Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg 20 25 30 Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Lys Glu Lys Leu Ser Ala 35 40 45 His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys 50 55 60 Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu 65 70 75 80 Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu 85 90 95 Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu 100 105 110 Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val 115 120 125 Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Lys 130 135 140 Arg Lys Lys Arg Leu Gly Ile Lys Pro Glu His Gln His Val Gly Leu 145 150 155 160 Ser Ile Ile Val Thr Thr Phe Asn Arg Pro Ala Ile Leu Ser Ile Thr 165 170 175 Leu Ala Cys Leu Val Asn Gln Lys Thr His Tyr Pro Phe Glu Val Ile 180 185 190 Val Thr Asp Asp Gly Ser Gln Glu Asp Leu Ser Pro Ile Ile Arg Gln 195 200 205 Tyr Glu Asn Lys Leu Asp Ile Arg Tyr Val Arg Gln Lys Asp Tyr Gly 210 215 220 Tyr Gln Leu Cys Ala Val Arg Asn Leu Gly Leu Arg Thr Ala Lys Tyr 225 230 235 240 Asp Phe Val Ser Ile Leu Asp Cys Asp Met Ala Pro Gln Gln Leu Trp 245 250 255 Val His Ser Tyr Leu Thr Glu Leu Leu Glu Asp Asp Asp Leu Thr Ile 260 265 270 Ile Gly Pro Arg Lys Tyr Ile Asp Thr Gln His Ile Asp Pro Lys Asp 275 280 285 Phe Leu Asn Asn Ala Ser Leu Leu Glu Ser Leu Pro Glu Val Lys Thr 290 295 300 Asn Asn Ser Val Ala Ala Lys Gly Glu Gly Thr Val Ser Leu Asp Trp 305 310 315 320 Arg Leu Glu Gln Phe Glu Lys Thr Glu Asn Leu Arg Leu Ser Asp Ser 325 330 335 Pro Phe Arg Phe Phe Ala Ala Gly Asn Val Ala Phe Ala Lys Lys Trp 340 345 350 Leu Asn Lys Ser Gly Phe Phe Asp Glu Glu Phe Asn His Trp Gly Gly 355 360 365 Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Arg Tyr Gly Ser Phe Phe 370 375 380 Lys Thr Ile Asp Gly Ile Met Ala Tyr His Gln Glu Pro Pro Gly Lys 385 390 395 400 Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Asn Ile Thr Leu Asp Ile 405 410 415 Met Arg Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu 420 425 430 Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala 435 440 445 Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn 450 455 460 Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr 465 470 475 480 Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg 485 490 495 Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn 500 505 510 Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser 515 520 525 Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe 530 535 540 Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val 545 550 555 560 Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe 565 570 575 Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met 580 585 590 Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile 595 600 605 Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly 610 615 620 Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly 625 630 635 640 Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe 645 650 655 Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn 660 665 670 Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn 675 680 685 Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Lys 690 695 700 Ile Ile Gln Asn Lys Asp Ala Lys Ile Ala Val Ser Ile Phe Tyr Pro 705 710 715 720 Asn Thr Leu Asn Gly Leu Val Lys Lys Leu Asn Asn Ile Ile Glu Tyr 725 730 735 Asn Lys Asn Ile Phe Val Ile Val Leu His Val Asp Lys Asn His Leu 740 745 750 Thr Pro Asp Ile Lys Lys Glu Ile Leu Ala Phe Tyr His Lys His Gln 755 760 765 Val Asn Ile Leu Leu Asn Asn Asp Ile Ser Tyr Tyr Thr Ser Asn Arg 770 775 780 Leu Ile Lys Thr Glu Ala His Leu Ser Asn Ile Asn Lys Leu Ser Gln 785 790 795 800 Leu Asn Leu Asn Cys Glu Tyr Ile Ile Phe Asp Asn His Asp Ser Leu 805 810 815 Phe Val Lys Asn Asp Ser Tyr Ala Tyr Met Lys Lys Tyr Asp Val Gly 820 825 830 Met Asn Phe Ser Ala Leu Thr His Asp Trp Ile Glu Lys Ile Asn Ala 835 840 845 His Pro Pro Phe Lys Lys Leu Ile Lys Thr Tyr Phe Asn Asp Asn Asp 850 855 860 Leu Lys Ser Met Asn Val Lys Gly Ala Ser Gln Gly Met Phe Met Thr 865 870 875 880 Tyr Ala Leu Ala His Glu Leu Leu Thr Ile Ile Lys Glu Val Ile Thr 885 890 895 Ser Cys Gln Ser Ile Asp Ser Val Pro Glu Tyr Asn Thr Glu Asp Ile 900 905 910 Trp Phe Gln Phe Ala Leu Leu Ile Leu Glu Lys Lys Thr Gly His Val 915 920 925 Phe Asn Lys Thr Ser Thr Leu Thr Tyr Met Pro Trp Glu Arg Lys Leu 930 935 940 Gln Trp Thr Asn Glu Gln Ile Glu Ser Ala Lys Arg Gly Glu Asn Ile 945 950 955 960 Pro Val Asn Lys Phe Ile Ile Asn Ser Ile Thr Leu 965 970 <210> 19 <211> 972 <212> PRT <213> other sequences <220> <223> an amino acid sequence of a polypeptide having a chondroitin synthase activity (HCOS1-2) <400> 19 Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr 1 5 10 15 Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg 20 25 30 Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Lys Glu Lys Leu Ser Ala 35 40 45 His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys 50 55 60 Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu 65 70 75 80 Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu 85 90 95 Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu 100 105 110 Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val 115 120 125 Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Lys 130 135 140 Arg Lys Lys Arg Leu Gly Ile Lys Pro Val Asn Lys Asn Ile Gly Leu 145 150 155 160 Ser Ile Ile Ile Pro Thr Phe Asn Arg Ser Arg Ile Leu Asp Ile Thr 165 170 175 Leu Ala Cys Leu Val Asn Gln Lys Thr His Tyr Pro Phe Glu Val Ile 180 185 190 Val Thr Asp Asp Gly Ser Gln Glu Asp Leu Ser Pro Ile Ile Arg Gln 195 200 205 Tyr Glu Asn Lys Leu Asp Ile Arg Tyr Val Arg Gln Lys Asp Tyr Gly 210 215 220 Tyr Gln Leu Cys Ala Val Arg Asn Leu Gly Leu Arg Thr Ala Lys Tyr 225 230 235 240 Asp Phe Val Ser Ile Leu Asp Cys Asp Met Ala Pro Gln Gln Leu Trp 245 250 255 Val His Ser Tyr Leu Thr Glu Leu Leu Glu Asp Asp Asp Leu Thr Ile 260 265 270 Ile Gly Pro Arg Lys Tyr Ile Asp Thr Gln His Ile Asp Pro Lys Asp 275 280 285 Phe Leu Asn Asn Ala Ser Leu Leu Glu Ser Leu Pro Glu Val Lys Thr 290 295 300 Asn Asn Ser Val Ala Ala Lys Gly Glu Gly Thr Val Ser Leu Asp Trp 305 310 315 320 Arg Leu Glu Gln Phe Glu Lys Thr Glu Asn Leu Arg Leu Ser Asp Ser 325 330 335 Pro Phe Arg Phe Phe Ser Cys Gly Asn Val Ala Phe Ser Lys Glu Trp 340 345 350 Leu Asn Lys Val Gly Trp Phe Asp Glu Glu Phe Asn His Trp Gly Gly 355 360 365 Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Arg Tyr Gly Ser Phe Phe 370 375 380 Lys Thr Ile Asp Gly Ile Met Ala Tyr His Gln Glu Pro Pro Gly Lys 385 390 395 400 Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Asn Ile Thr Leu Asp Ile 405 410 415 Met Arg Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu 420 425 430 Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala 435 440 445 Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn 450 455 460 Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr 465 470 475 480 Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg 485 490 495 Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn 500 505 510 Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser 515 520 525 Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe 530 535 540 Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val 545 550 555 560 Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe 565 570 575 Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met 580 585 590 Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile 595 600 605 Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly 610 615 620 Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly 625 630 635 640 Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe 645 650 655 Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn 660 665 670 Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn 675 680 685 Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Lys 690 695 700 Ile Ile Gln Asn Lys Asp Ala Lys Ile Ala Val Ser Ile Phe Tyr Pro 705 710 715 720 Asn Thr Leu Asn Gly Leu Val Lys Lys Leu Asn Asn Ile Ile Glu Tyr 725 730 735 Asn Lys Asn Ile Phe Val Ile Val Leu His Val Asp Lys Asn His Leu 740 745 750 Thr Pro Asp Ile Lys Lys Glu Ile Leu Ala Phe Tyr His Lys His Gln 755 760 765 Val Asn Ile Leu Leu Asn Asn Asp Ile Ser Tyr Tyr Thr Ser Asn Arg 770 775 780 Leu Ile Lys Thr Glu Ala His Leu Ser Asn Ile Asn Lys Leu Ser Gln 785 790 795 800 Leu Asn Leu Asn Cys Glu Tyr Ile Ile Phe Asp Asn His Asp Ser Leu 805 810 815 Phe Val Lys Asn Asp Ser Tyr Ala Tyr Met Lys Lys Tyr Asp Val Gly 820 825 830 Met Asn Phe Ser Ala Leu Thr His Asp Trp Ile Glu Lys Ile Asn Ala 835 840 845 His Pro Pro Phe Lys Lys Leu Ile Lys Thr Tyr Phe Asn Asp Asn Asp 850 855 860 Leu Lys Ser Met Asn Val Lys Gly Ala Ser Gln Gly Met Phe Met Thr 865 870 875 880 Tyr Ala Leu Ala His Glu Leu Leu Thr Ile Ile Lys Glu Val Ile Thr 885 890 895 Ser Cys Gln Ser Ile Asp Ser Val Pro Glu Tyr Asn Thr Glu Asp Ile 900 905 910 Trp Phe Gln Phe Ala Leu Leu Ile Leu Glu Lys Lys Thr Gly His Val 915 920 925 Phe Asn Lys Thr Ser Thr Leu Thr Tyr Met Pro Trp Glu Arg Lys Leu 930 935 940 Gln Trp Thr Asn Glu Gln Ile Glu Ser Ala Lys Arg Gly Glu Asn Ile 945 950 955 960 Pro Val Asn Lys Phe Ile Ile Asn Ser Ile Thr Leu 965 970 <210> 20 <211> 972 <212> PRT <213> other sequences <220> <223> amino acid sequence of a polypeptide having a chondroitin synthase activity (HCOS1-3) <400> 20 Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr 1 5 10 15 Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg 20 25 30 Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Lys Glu Lys Leu Ser Ala 35 40 45 His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys 50 55 60 Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu 65 70 75 80 Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu 85 90 95 Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu 100 105 110 Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val 115 120 125 Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Asn 130 135 140 Arg Lys Lys Ser Leu Gly Ile Lys Pro Val Asn Lys Asn Ile Gly Leu 145 150 155 160 Ser Ile Ile Ile Pro Thr Phe Asn Arg Ser Arg Ile Leu Asp Ile Thr 165 170 175 Leu Ala Cys Leu Val Asn Gln Lys Thr Asn Tyr Pro Phe Glu Val Val 180 185 190 Val Ala Asp Asp Gly Ser Lys Glu Asn Leu Leu Thr Ile Val Gln Lys 195 200 205 Tyr Glu Gln Lys Leu Asp Ile Lys Tyr Val Arg Gln Lys Asp Tyr Gly 210 215 220 Tyr Gln Leu Cys Ala Val Arg Asn Leu Gly Leu Arg Thr Ala Lys Tyr 225 230 235 240 Asp Phe Val Ser Ile Leu Asp Cys Asp Met Ala Pro Gln Gln Leu Trp 245 250 255 Val His Ser Tyr Leu Thr Glu Leu Leu Glu Asp Asn Asp Ile Val Leu 260 265 270 Ile Gly Pro Arg Lys Tyr Val Asp Thr His Asn Ile Thr Ala Glu Gln 275 280 285 Phe Leu Asn Asp Pro Tyr Leu Ile Glu Ser Leu Pro Glu Thr Ala Thr 290 295 300 Asn Asn Asn Pro Ser Ile Thr Ser Lys Gly Asn Ile Ser Leu Asp Trp 305 310 315 320 Arg Leu Glu His Phe Lys Lys Thr Asp Asn Leu Arg Leu Cys Asp Ser 325 330 335 Pro Phe Arg Tyr Phe Ser Cys Gly Asn Val Ala Phe Ser Lys Glu Trp 340 345 350 Leu Asn Lys Val Gly Trp Phe Asp Glu Glu Phe Asn His Trp Gly Gly 355 360 365 Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Ala Lys Gly Cys Phe Phe 370 375 380 Arg Val Ile Asp Gly Gly Met Ala Tyr His Gln Glu Pro Pro Gly Lys 385 390 395 400 Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Ser Ile Thr Leu Lys Ile 405 410 415 Val Lys Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu 420 425 430 Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala 435 440 445 Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn 450 455 460 Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr 465 470 475 480 Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg 485 490 495 Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn 500 505 510 Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser 515 520 525 Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe 530 535 540 Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val 545 550 555 560 Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe 565 570 575 Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met 580 585 590 Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile 595 600 605 Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly 610 615 620 Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly 625 630 635 640 Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe 645 650 655 Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn 660 665 670 Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn 675 680 685 Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Lys 690 695 700 Ile Ile Gln Asn Lys Asp Ala Lys Ile Ala Val Ser Ile Phe Tyr Pro 705 710 715 720 Asn Thr Leu Asn Gly Leu Val Lys Lys Leu Asn Asn Ile Ile Glu Tyr 725 730 735 Asn Lys Asn Ile Phe Val Ile Val Leu His Val Asp Lys Asn His Leu 740 745 750 Thr Pro Asp Ile Lys Lys Glu Ile Leu Ala Phe Tyr His Lys His Gln 755 760 765 Val Asn Ile Leu Leu Asn Asn Asp Ile Ser Tyr Tyr Thr Ser Asn Arg 770 775 780 Leu Ile Lys Thr Glu Ala His Leu Ser Asn Ile Asn Lys Leu Ser Gln 785 790 795 800 Leu Asn Leu Asn Cys Glu Tyr Ile Ile Phe Asp Asn His Asp Ser Leu 805 810 815 Phe Val Lys Asn Asp Ser Tyr Ala Tyr Met Lys Lys Tyr Asp Val Gly 820 825 830 Met Asn Phe Ser Ala Leu Thr His Asp Trp Ile Glu Lys Ile Asn Ala 835 840 845 His Pro Pro Phe Lys Lys Leu Ile Lys Thr Tyr Phe Asn Asp Asn Asp 850 855 860 Leu Lys Ser Met Asn Val Lys Gly Ala Ser Gln Gly Met Phe Met Thr 865 870 875 880 Tyr Ala Leu Ala His Glu Leu Leu Thr Ile Ile Lys Glu Val Ile Thr 885 890 895 Ser Cys Gln Ser Ile Asp Ser Val Pro Glu Tyr Asn Thr Glu Asp Ile 900 905 910 Trp Phe Gln Phe Ala Leu Leu Ile Leu Glu Lys Lys Thr Gly His Val 915 920 925 Phe Asn Lys Thr Ser Thr Leu Thr Tyr Met Pro Trp Glu Arg Lys Leu 930 935 940 Gln Trp Thr Asn Glu Gln Ile Glu Ser Ala Lys Arg Gly Glu Asn Ile 945 950 955 960 Pro Val Asn Lys Phe Ile Ile Asn Ser Ile Thr Leu 965 970 <210> 21 <211> 1023 <212> PRT <213> other sequences <220> <223> amino acid sequence of a polypeptide having chondroitin synthase activity (HCOS.Sc) <400> 21 Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr 1 5 10 15 Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg 20 25 30 Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Lys Glu Lys Leu Ser Ala 35 40 45 His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys 50 55 60 Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu 65 70 75 80 Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu 85 90 95 Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu 100 105 110 Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val 115 120 125 Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Asn 130 135 140 Arg Lys Lys Ser Leu Gly Ile Lys Pro Val Asn Lys Asn Ile Gly Leu 145 150 155 160 Ser Ile Ile Ile Pro Thr Phe Asn Arg Ser Arg Ile Leu Asp Ile Thr 165 170 175 Leu Ala Cys Leu Val Asn Gln Lys Thr Asn Tyr Pro Phe Glu Val Val 180 185 190 Val Ala Asp Asp Gly Ser Lys Glu Asn Leu Leu Thr Ile Val Gln Lys 195 200 205 Tyr Glu Gln Lys Leu Asp Ile Lys Tyr Val Arg Gln Lys Asp Tyr Gly 210 215 220 Tyr Gln Leu Cys Ala Val Arg Asn Leu Gly Leu Arg Thr Ala Lys Tyr 225 230 235 240 Asp Phe Val Ser Ile Leu Asp Cys Asp Met Ala Pro Gln Gln Leu Trp 245 250 255 Val His Ser Tyr Leu Thr Glu Leu Leu Glu Asp Asn Asp Ile Val Leu 260 265 270 Ile Gly Pro Arg Lys Tyr Val Asp Thr His Asn Ile Thr Ala Glu Gln 275 280 285 Phe Leu Asn Asp Pro Tyr Leu Ile Glu Ser Leu Pro Glu Thr Ala Thr 290 295 300 Asn Asn Asn Pro Ser Ile Thr Ser Lys Gly Asn Ile Ser Leu Asp Trp 305 310 315 320 Arg Leu Glu His Phe Lys Lys Thr Asp Asn Leu Arg Leu Cys Asp Ser 325 330 335 Pro Phe Arg Tyr Phe Ser Cys Gly Asn Val Ala Phe Ser Lys Glu Trp 340 345 350 Leu Asn Lys Val Gly Trp Phe Asp Glu Glu Phe Asn His Trp Gly Gly 355 360 365 Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Ala Lys Gly Cys Phe Phe 370 375 380 Arg Val Ile Asp Gly Gly Met Ala Tyr His Gln Glu Pro Pro Gly Lys 385 390 395 400 Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Ser Ile Thr Leu Lys Ile 405 410 415 Val Lys Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu 420 425 430 Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala 435 440 445 Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn 450 455 460 Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr 465 470 475 480 Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg 485 490 495 Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn 500 505 510 Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser 515 520 525 Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe 530 535 540 Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val 545 550 555 560 Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe 565 570 575 Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met 580 585 590 Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile 595 600 605 Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly 610 615 620 Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly 625 630 635 640 Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe 645 650 655 Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn 660 665 670 Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn 675 680 685 Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Phe 690 695 700 Ile Gln Met Leu Phe Ser Trp Phe Ser Ile Ala Asn Phe Val Leu Thr 705 710 715 720 Phe Tyr Tyr Leu Ala Gly Ser Met Asn Leu Val Ile Lys His Gly Glu 725 730 735 Ala Leu Phe Ile Phe Phe Lys Tyr Leu Ile Phe Cys Asp Leu Ala Ser 740 745 750 Leu Phe Ile Ile Ser Met Gly Asn Arg Pro Gln Gly Ala Lys His Leu 755 760 765 Phe Ile Thr Ser Met Val Ile Leu Ser Ile Cys Ala Thr Tyr Ser Leu 770 775 780 Ile Cys Gly Phe Val Phe Ala Phe Lys Ser Leu Ala Ser Gly Thr Glu 785 790 795 800 Ser His Lys Ile Phe Val Asp Ile Val Ile Ser Leu Leu Ser Thr Tyr 805 810 815 Gly Leu Tyr Phe Phe Ser Ser Leu Met Tyr Leu Asp Pro Trp His Met 820 825 830 Phe Thr Ser Ser Ile Gln Tyr Phe Leu Thr Leu Pro Ala Phe Thr Cys 835 840 845 Thr Leu Gln Ile Phe Ala Phe Cys Asn Thr His Asp Val Ser Trp Gly 850 855 860 Thr Lys Gly Ser Thr Gln Glu Ser Lys Gln Leu Ser Lys Ala Ile Val 865 870 875 880 Val Gln Gly Pro Asp Gly Lys Gln Ile Val Glu Thr Asp Trp Pro Gln 885 890 895 Glu Val Asp Lys Lys Phe Leu Glu Ile Lys Ser Arg Leu Lys Glu Pro 900 905 910 Glu Phe Glu Glu Ser Ser Gly Asn Glu Lys Gln Ser Lys Asn Asp Tyr 915 920 925 Tyr Arg Asp Ile Arg Thr Arg Ile Val Met Ile Trp Met Leu Ser Asn 930 935 940 Leu Ile Leu Ile Met Ser Ile Ile Gln Val Phe Thr Pro Gln Asp Thr 945 950 955 960 Asp Asn Gly Tyr Leu Ile Phe Ile Leu Trp Ser Val Ala Ala Leu Ala 965 970 975 Ala Phe Arg Val Val Gly Ser Met Ala Phe Leu Phe Met Lys Tyr Leu 980 985 990 Arg Ile Ile Val Ser Tyr Arg Asn Lys Val Glu Gly Ser Gly Ser Trp 995 1000 1005 Glu Val Ser Lys Leu Asp Leu Pro Asn Val Phe His Lys Lys Gly 1010 1015 1020 <210> 22 <211> 1023 <212> PRT <213> other sequences <220> <223> an amino acid sequence of a polypeptide having chondroitin synthase activity (HHASA.Sc) <400> 22 Met Asn Thr Leu Ser Gln Ala Ile Lys Ala Tyr Asn Ser Asn Asp Tyr 1 5 10 15 Gln Leu Ala Leu Lys Leu Phe Glu Lys Ser Ala Glu Ile Tyr Gly Arg 20 25 30 Lys Ile Val Glu Phe Gln Ile Thr Lys Cys Lys Glu Lys Leu Ser Ala 35 40 45 His Pro Ser Val Asn Ser Ala His Leu Ser Val Asn Lys Glu Glu Lys 50 55 60 Val Asn Val Cys Asp Ser Pro Leu Asp Ile Ala Thr Gln Leu Leu Leu 65 70 75 80 Ser Asn Val Lys Lys Leu Val Leu Ser Asp Ser Glu Lys Asn Thr Leu 85 90 95 Lys Asn Lys Trp Lys Leu Leu Thr Glu Lys Lys Ser Glu Asn Ala Glu 100 105 110 Val Arg Ala Val Ala Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val 115 120 125 Leu Ala Pro Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Lys 130 135 140 Arg Lys Lys Arg Leu Gly Ile Lys Pro Glu His Gln His Val Gly Leu 145 150 155 160 Ser Ile Ile Val Thr Thr Phe Asn Arg Pro Ala Ile Leu Ser Ile Thr 165 170 175 Leu Ala Cys Leu Val Asn Gln Lys Thr His Tyr Pro Phe Glu Val Ile 180 185 190 Val Thr Asp Asp Gly Ser Gln Glu Asp Leu Ser Pro Ile Ile Arg Gln 195 200 205 Tyr Glu Asn Lys Leu Asp Ile Arg Tyr Val Arg Gln Lys Asp Asn Gly 210 215 220 Phe Gln Ala Ser Ala Ala Arg Asn Met Gly Leu Arg Leu Ala Lys Tyr 225 230 235 240 Asp Phe Ile Gly Leu Leu Asp Cys Asp Met Ala Pro Asn Pro Leu Trp 245 250 255 Val His Ser Tyr Val Ala Glu Leu Leu Glu Asp Asp Asp Leu Thr Ile 260 265 270 Ile Gly Pro Arg Lys Tyr Ile Asp Thr Gln His Ile Asp Pro Lys Asp 275 280 285 Phe Leu Asn Asn Ala Ser Leu Leu Glu Ser Leu Pro Glu Val Lys Thr 290 295 300 Asn Asn Ser Val Ala Ala Lys Gly Glu Gly Thr Val Ser Leu Asp Trp 305 310 315 320 Arg Leu Glu Gln Phe Glu Lys Thr Glu Asn Leu Arg Leu Ser Asp Ser 325 330 335 Pro Phe Arg Phe Phe Ala Ala Gly Asn Val Ala Phe Ala Lys Lys Trp 340 345 350 Leu Asn Lys Ser Gly Phe Phe Asp Glu Glu Phe Asn His Trp Gly Gly 355 360 365 Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Arg Tyr Gly Ser Phe Phe 370 375 380 Lys Thr Ile Asp Gly Ile Met Ala Tyr His Gln Glu Pro Pro Gly Lys 385 390 395 400 Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Asn Ile Thr Leu Asp Ile 405 410 415 Met Arg Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu 420 425 430 Asp Ser His Ile Asn Arg Val Pro Leu Val Ser Ile Tyr Ile Pro Ala 435 440 445 Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn 450 455 460 Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr 465 470 475 480 Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg 485 490 495 Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn 500 505 510 Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser 515 520 525 Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe 530 535 540 Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val 545 550 555 560 Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe 565 570 575 Ser Arg Glu Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met 580 585 590 Phe Thr Ile Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile 595 600 605 Glu Asn Ala Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly 610 615 620 Lys Phe Lys His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly 625 630 635 640 Asp Asn Thr Ser Ile Lys Lys Leu Gly Ile Gln Lys Lys Asn His Phe 645 650 655 Val Val Val Asn Gln Ser Leu Asn Arg Gln Gly Ile Thr Tyr Tyr Asn 660 665 670 Tyr Asp Glu Phe Asp Asp Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn 675 680 685 Lys Thr Ala Glu Tyr Gln Glu Glu Ile Asp Ile Leu Lys Asp Ile Phe 690 695 700 Ile Gln Met Leu Phe Ser Trp Phe Ser Ile Ala Asn Phe Val Leu Thr 705 710 715 720 Phe Tyr Tyr Leu Ala Gly Ser Met Asn Leu Val Ile Lys His Gly Glu 725 730 735 Ala Leu Phe Ile Phe Phe Lys Tyr Leu Ile Phe Cys Asp Leu Ala Ser 740 745 750 Leu Phe Ile Ile Ser Met Gly Asn Arg Pro Gln Gly Ala Lys His Leu 755 760 765 Phe Ile Thr Ser Met Val Ile Leu Ser Ile Cys Ala Thr Tyr Ser Leu 770 775 780 Ile Cys Gly Phe Val Phe Ala Phe Lys Ser Leu Ala Ser Gly Thr Glu 785 790 795 800 Ser His Lys Ile Phe Val Asp Ile Val Ile Ser Leu Leu Ser Thr Tyr 805 810 815 Gly Leu Tyr Phe Phe Ser Ser Leu Met Tyr Leu Asp Pro Trp His Met 820 825 830 Phe Thr Ser Ser Ile Gln Tyr Phe Leu Thr Leu Pro Ala Phe Thr Cys 835 840 845 Thr Leu Gln Ile Phe Ala Phe Cys Asn Thr His Asp Val Ser Trp Gly 850 855 860 Thr Lys Gly Ser Thr Gln Glu Ser Lys Gln Leu Ser Lys Ala Ile Val 865 870 875 880 Val Gln Gly Pro Asp Gly Lys Gln Ile Val Glu Thr Asp Trp Pro Gln 885 890 895 Glu Val Asp Lys Lys Phe Leu Glu Ile Lys Ser Arg Leu Lys Glu Pro 900 905 910 Glu Phe Glu Glu Ser Ser Gly Asn Glu Lys Gln Ser Lys Asn Asp Tyr 915 920 925 Tyr Arg Asp Ile Arg Thr Arg Ile Val Met Ile Trp Met Leu Ser Asn 930 935 940 Leu Ile Leu Ile Met Ser Ile Ile Gln Val Phe Thr Pro Gln Asp Thr 945 950 955 960 Asp Asn Gly Tyr Leu Ile Phe Ile Leu Trp Ser Val Ala Ala Leu Ala 965 970 975 Ala Phe Arg Val Val Gly Ser Met Ala Phe Leu Phe Met Lys Tyr Leu 980 985 990 Arg Ile Ile Val Ser Tyr Arg Asn Lys Val Glu Gly Ser Gly Ser Trp 995 1000 1005 Glu Val Ser Lys Leu Asp Leu Pro Asn Val Phe His Lys Lys Gly 1010 1015 1020 <210> 23 <211> 572 <212> PRT <213> other sequences <220> <223> amino acid sequence of a polypeptide having chondroitin synthase activity (HCOS1-Vir) <400> 23 Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr 1 5 10 15 Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala 20 25 30 Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp 35 40 45 Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln 50 55 60 Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser 65 70 75 80 Leu Arg Pro Lys Gly Trp Asn Asp Val Arg Leu Ala Val Ile Ile Ala 85 90 95 Gly Tyr Arg Glu Asp Pro Tyr Met Phe Gln Lys Cys Leu Glu Ser Val 100 105 110 Arg Asp Ser Asp Tyr Gly Asn Val Ala Arg Leu Ile Cys Val Ile Asp 115 120 125 Gly Asp Glu Asp Asp Asp Met Arg Met Ala Ala Val Tyr Lys Ala Ile 130 135 140 Tyr Asn Asp Asn Ile Lys Lys Pro Glu Phe Val Leu Cys Glu Ser Asp 145 150 155 160 Asp Lys Glu Gly Glu Arg Ile Asp Ser Asp Phe Ser Arg Asp Ile Cys 165 170 175 Val Leu Gln Pro His Arg Gly Lys Arg Glu Cys Leu Tyr Thr Gly Phe 180 185 190 Gln Leu Ala Lys Met Asp Pro Ser Val Asn Ala Val Val Leu Ile Asp 195 200 205 Ser Asp Thr Val Leu Glu Lys Asp Ala Ile Leu Glu Val Val Tyr Pro 210 215 220 Leu Ala Cys Asp Pro Glu Ile Gln Ala Val Ala Gly Glu Cys Lys Ile 225 230 235 240 Trp Asn Thr Asp Thr Leu Leu Ser Leu Leu Val Ala Trp Arg Tyr Tyr 245 250 255 Ser Ala Phe Cys Val Glu Arg Ser Ala Gln Ser Phe Phe Arg Thr Val 260 265 270 Gln Cys Val Gly Gly Pro Leu Gly Ala Tyr Lys Ile Asp Ile Ile Lys 275 280 285 Glu Ile Lys Asp Pro Trp Ile Ser Gln Arg Phe Leu Gly Gln Lys Cys 290 295 300 Thr Tyr Gly Asp Asp Arg Arg Leu Thr Asn Glu Ile Leu Met Arg Gly 305 310 315 320 Lys Lys Val Val Phe Thr Pro Phe Ala Val Gly Trp Gly Trp Phe Asp 325 330 335 Glu Glu Phe Thr His Trp Gly Gly Arg Tyr Ile Val Gln Gln Thr Arg 340 345 350 Trp Ser Lys Ser Trp Cys Arg Glu Ile Trp Tyr Thr Leu Phe Ala Ala 355 360 365 Trp Lys His Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr 370 375 380 Gln Ile Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala 385 390 395 400 Val Glu Ala Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr 405 410 415 Thr Val Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp 420 425 430 Ile Arg Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys 435 440 445 Met Ile Pro Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly 450 455 460 Trp Gly Thr Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val 465 470 475 480 Ala Leu Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala 485 490 495 Val Val Gly Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp 500 505 510 Trp Asn Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr 515 520 525 Ile Val Phe Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile 530 535 540 Thr Thr Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg 545 550 555 560 Val Leu Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val 565 570 <210> 24 <211> 571 <212> PRT <213> other sequences <220> <223> reencoded amino acid sequence of a polypeptide having chondroitin synthase activity (HCOS2-Vir) <400> 24 Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr 1 5 10 15 Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala 20 25 30 Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp 35 40 45 Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln 50 55 60 Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser 65 70 75 80 Leu Arg Pro Lys Gly Trp Asn Asp Val Arg Leu Ala Val Ile Ile Ala 85 90 95 Gly Tyr Arg Glu Asp Pro Tyr Met Phe Gln Lys Cys Leu Glu Ser Val 100 105 110 Arg Asp Ser Asp Tyr Gly Asn Val Ala Arg Leu Ile Cys Val Ile Asp 115 120 125 Gly Asp Glu Asp Asp Asp Met Arg Met Ala Ala Val Tyr Lys Ala Ile 130 135 140 Tyr Asn Asp Asn Ile Lys Lys Pro Glu Phe Val Leu Cys Glu Ser Asp 145 150 155 160 Asp Lys Glu Gly Glu Arg Ile Asp Ser Asp Phe Ser Arg Asp Ile Cys 165 170 175 Val Leu Gln Pro His Arg Gly Lys Arg Glu Cys Leu Tyr Thr Gly Phe 180 185 190 Gln Leu Ala Lys Met Asp Pro Ser Val Asn Ala Val Val Leu Ile Asp 195 200 205 Ser Asp Thr Val Leu Glu Lys Asp Ala Ile Leu Glu Val Val Tyr Pro 210 215 220 Leu Ala Cys Asp Pro Glu Ile Gln Ala Val Ala Gly Glu Cys Lys Ile 225 230 235 240 Trp Asn Thr Asp Thr Leu Leu Ser Leu Leu Val Ala Trp Arg Tyr Tyr 245 250 255 Ser Ala Phe Cys Val Glu Arg Ser Ala Gln Ser Phe Phe Arg Thr Val 260 265 270 Gln Cys Val Gly Gly Pro Leu Gly Ala Tyr Lys Ile Asp Ile Ile Lys 275 280 285 Glu Ile Lys Asp Pro Trp Ile Ser Gln Arg Phe Leu Gly Gln Lys Cys 290 295 300 Thr Tyr Gly Asp Asp Arg Arg Leu Thr Asn Glu Ile Leu Met Arg Gly 305 310 315 320 Lys Lys Val Val Phe Thr Pro Phe Ala Val Gly Trp Leu His Gly Glu 325 330 335 Asn Thr Ser Ile Lys Lys Leu Arg Tyr Ile Val Gln Gln Thr Arg Trp 340 345 350 Ser Lys Ser Trp Cys Arg Glu Ile Trp Tyr Thr Leu Phe Ala Ala Trp 355 360 365 Lys His Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr Gln 370 375 380 Ile Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala Val 385 390 395 400 Glu Ala Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr Thr 405 410 415 Val Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp Ile 420 425 430 Arg Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys Met 435 440 445 Ile Pro Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly Trp 450 455 460 Gly Thr Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val Ala 465 470 475 480 Leu Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala Val 485 490 495 Val Gly Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp Trp 500 505 510 Asn Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr Ile 515 520 525 Val Phe Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile Thr 530 535 540 Thr Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg Val 545 550 555 560 Leu Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val 565 570 <210> 25 <211> 572 <212> PRT <213> other sequences <220> <223> reencoded amino acid sequence of a polypeptide having chondroitin synthase activity (HCOS3-Vir) <400> 25 Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr 1 5 10 15 Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala 20 25 30 Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp 35 40 45 Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln 50 55 60 Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser 65 70 75 80 Leu Arg Pro Lys Gly Trp Asn Asp Val Arg Leu Ala Val Ile Ile Ala 85 90 95 Gly Tyr Arg Glu Asp Pro Tyr Met Phe Gln Lys Cys Leu Glu Ser Val 100 105 110 Arg Asp Ser Asp Tyr Gly Asn Val Ala Arg Leu Ile Cys Val Ile Asp 115 120 125 Gly Asp Glu Asp Asp Asp Met Arg Met Ala Ala Val Tyr Lys Ala Ile 130 135 140 Tyr Asn Asp Asn Ile Lys Lys Pro Glu Phe Val Leu Cys Glu Ser Asp 145 150 155 160 Asp Lys Glu Gly Glu Arg Ile Asp Ser Asp Phe Ser Arg Asp Ile Cys 165 170 175 Val Leu Gln Pro His Arg Gly Lys Arg Glu Cys Leu Tyr Thr Gly Phe 180 185 190 Gln Leu Ala Lys Met Asp Pro Ser Val Asn Ala Val Val Leu Ile Asp 195 200 205 Ser Asp Thr Val Leu Glu Lys Asp Ala Ile Leu Glu Val Val Tyr Pro 210 215 220 Leu Ala Cys Asp Pro Glu Ile Gln Ala Val Ala Gly Glu Cys Lys Ile 225 230 235 240 Trp Asn Thr Asp Thr Leu Leu Ser Leu Leu Val Ala Trp Arg Tyr Tyr 245 250 255 Ser Ala Phe Cys Val Glu Arg Ser Ala Gln Ser Phe Phe Arg Thr Val 260 265 270 Gln Cys Val Gly Gly Pro Leu Gly Ala Tyr Lys Ile Asp Ile Ile Lys 275 280 285 Glu Ile Lys Asp Pro Trp Ile Ser Gln Arg Phe Leu Gly Gln Lys Cys 290 295 300 Thr Tyr Gly Asp Asp Arg Arg Leu Thr Asn Glu Ile Leu Met Arg Gly 305 310 315 320 Lys Lys Val Val Phe Thr Pro Phe Ala Val Gly Trp His Met Ala Trp 325 330 335 Ser Asp Lys Asp Asp Ala Ile Asp Arg Tyr Ile Val Gln Gln Thr Arg 340 345 350 Trp Ser Lys Ser Trp Cys Arg Glu Ile Trp Tyr Thr Leu Phe Ala Ala 355 360 365 Trp Lys His Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr 370 375 380 Gln Ile Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala 385 390 395 400 Val Glu Ala Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr 405 410 415 Thr Val Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp 420 425 430 Ile Arg Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys 435 440 445 Met Ile Pro Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly 450 455 460 Trp Gly Thr Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val 465 470 475 480 Ala Leu Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala 485 490 495 Val Val Gly Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp 500 505 510 Trp Asn Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr 515 520 525 Ile Val Phe Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile 530 535 540 Thr Thr Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg 545 550 555 560 Val Leu Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val 565 570 <210> 26 <211> 570 <212> PRT <213> other sequences <220> <223> reencoded amino acid sequence of a polypeptide having chondroitin synthase activity (HCOS4-Vir) <400> 26 Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr 1 5 10 15 Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala 20 25 30 Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp 35 40 45 Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln 50 55 60 Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser 65 70 75 80 Leu Arg Pro Lys Gly Trp Asn Asp Val Arg Leu Ala Val Ile Ile Ala 85 90 95 Gly Tyr Arg Glu Asp Pro Tyr Met Phe Gln Lys Cys Leu Glu Ser Val 100 105 110 Arg Asp Ser Asp Tyr Gly Asn Val Ala Arg Leu Ile Cys Val Ile Asp 115 120 125 Gly Asp Glu Asp Asp Asp Met Arg Met Ala Ala Val Tyr Lys Ala Ile 130 135 140 Tyr Asn Asp Asn Ile Lys Lys Pro Glu Phe Val Leu Cys Glu Ser Asp 145 150 155 160 Asp Lys Glu Gly Glu Arg Ile Asp Ser Asp Phe Ser Arg Asp Ile Cys 165 170 175 Val Leu Gln Pro His Arg Gly Lys Arg Glu Cys Leu Tyr Thr Gly Phe 180 185 190 Gln Leu Ala Lys Met Asp Pro Ser Val Asn Ala Val Val Leu Ile Asp 195 200 205 Ser Asp Thr Val Leu Glu Lys Asp Ala Ile Leu Glu Val Val Tyr Pro 210 215 220 Leu Ala Cys Asp Pro Glu Ile Gln Ala Val Ala Gly Glu Cys Lys Ile 225 230 235 240 Trp Asn Thr Asp Thr Leu Leu Ser Leu Leu Val Ala Trp Arg Tyr Tyr 245 250 255 Ser Ala Phe Cys Val Glu Arg Ser Ala Gln Ser Phe Phe Arg Thr Val 260 265 270 Gln Cys Val Gly Gly Pro Leu Gly Ala Tyr Lys Ile Asp Ile Ile Lys 275 280 285 Glu Ile Lys Asp Pro Trp Ile Ser Gln Arg Phe Leu Gly Gln Lys Cys 290 295 300 Thr Tyr Gly Asp Asp Arg Arg Leu Thr Asn Glu Ile Leu Met Arg Gly 305 310 315 320 Lys Lys Val Val Phe Thr Pro Phe Ala Val Gly Trp Phe Asp Glu Glu 325 330 335 Phe Thr His Trp Gly Gly Arg Tyr Ile Val Gln Gln Thr Arg Trp Ser 340 345 350 Lys Ser Trp Cys Arg Glu Ile Trp Tyr Thr Leu Phe Ala Ala Trp Lys 355 360 365 His Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr Gln Ile 370 375 380 Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala Val Glu 385 390 395 400 Ala Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr Thr Val 405 410 415 Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp Ile Arg 420 425 430 Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys Met Ile 435 440 445 Pro Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly Trp Gly 450 455 460 Thr Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val Ala Leu 465 470 475 480 Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala Val Val 485 490 495 Gly Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp Trp Asn 500 505 510 Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr Ile Val 515 520 525 Phe Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile Thr Thr 530 535 540 Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg Val Leu 545 550 555 560 Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val 565 570 <210> 27 <211> 692 <212> PRT <213> other sequences <220> <223> amino acid sequence of a polypeptide having chondroitin synthase activity (HCOS5-Vir) <400> 27 Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr 1 5 10 15 Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala 20 25 30 Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp 35 40 45 Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln 50 55 60 Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser 65 70 75 80 Leu Arg Pro Lys Ser Ile His His Pro Ile Ser Lys Thr Thr His Pro 85 90 95 Asp Thr Glu Asn Ala Gly Asp Ser Thr Leu Leu Cys Pro Pro Met Asp 100 105 110 Gly Met Asp Asp Ile Leu Val Val Met Lys Thr Gly Val Thr Glu Ala 115 120 125 Lys Glu Lys Val Pro Val His Phe Gln Thr Thr Leu Arg Cys Val Pro 130 135 140 His Tyr Val Ile Tyr Ser Asp Phe Glu Glu Glu Ile Glu Gly Val Lys 145 150 155 160 Ile Tyr Asp Val Leu Gln Gly Met Asp Pro Asp Val Met Thr Gln Val 165 170 175 Pro Asp Phe Asp Leu Tyr Asn Arg Ile Lys Lys Leu Gly Arg Gln Gly 180 185 190 Leu Ala Glu Asn Asp Phe Ala Asp Glu Ala Asn Ser Ala Val Gly Lys 195 200 205 Pro Asn Asn Pro Gly Trp Lys Leu Asp Lys Trp Lys Phe Leu Pro Met 210 215 220 Ile Ile Glu Ala Leu Arg Tyr Lys Pro Lys Ala Lys Trp Tyr Val Phe 225 230 235 240 Met Glu Ala Asp Thr Tyr Ile Ser Trp Pro Thr Leu Leu Ala Trp Leu 245 250 255 Lys His Phe Asn His Lys Lys Pro Trp Tyr Leu Gly Thr Glu Thr Gln 260 265 270 Ile Ala Asp Val Ile Phe Ala His Gly Gly Ser Gly Phe Met Ile Ser 275 280 285 His Ala Ala Leu Lys Leu Ala Ala Glu Glu Tyr Thr Ala Arg Arg Thr 290 295 300 Glu Leu His His Tyr Thr Asp Gly His Trp Ala Gly Asp Cys Val Leu 305 310 315 320 Gly Lys Val Leu Ala Asp Ala Gly Val Asn Leu His Phe Ser Trp Pro 325 330 335 Ile Leu Gln Asn Ser Asn Leu Gly Glu Leu Asp Glu Phe Asn Val Asp 340 345 350 Leu Tyr Arg Gln Pro Trp Cys Phe Pro Ala Ala Ala Phe His His Leu 355 360 365 Asn Ala Gln Lys Ile Gln Asp Leu Trp Ser Tyr Glu Gln Lys Arg Trp 370 375 380 Gln Asp Lys Asp Lys Arg Val Leu Leu His Ser Asp Val Phe Arg Asp 385 390 395 400 Leu Leu Tyr Pro Asp Ile Ala Leu Lys Pro Ala Arg Ile Gly Trp Asp 405 410 415 Asn Leu Ser Ala Asp Glu Gln Ser Thr Ala Ser Ser Phe Glu Glu Cys 420 425 430 Arg Gln Ile Cys Asp Gln Leu Asp Asp Cys Thr Gln Phe Ser Phe Arg 435 440 445 Asp Lys Ser Cys Phe Thr Ser Arg Thr Pro Arg Leu Gly Ala Ala Asn 450 455 460 Pro Asn Thr Val Ser Gly Trp Met Val Asp Arg Ile Arg Ala Asn Met 465 470 475 480 Glu Lys Ser Gly Leu Phe Ala Ala Trp Lys His Gly Leu Ser Gly Ile 485 490 495 Trp Leu Ala Phe Glu Cys Leu Tyr Gln Ile Thr Tyr Phe Phe Leu Val 500 505 510 Ile Tyr Leu Phe Ser Arg Leu Ala Val Glu Ala Asp Pro Arg Ala Gln 515 520 525 Thr Ala Thr Val Ile Val Ser Thr Thr Val Ala Leu Ile Lys Cys Gly 530 535 540 Tyr Phe Ser Phe Arg Ala Lys Asp Ile Arg Ala Phe Tyr Phe Val Leu 545 550 555 560 Tyr Thr Phe Val Tyr Phe Phe Cys Met Ile Pro Ala Arg Ile Thr Ala 565 570 575 Met Met Thr Leu Trp Asp Ile Gly Trp Gly Thr Arg Gly Gly Asn Glu 580 585 590 Lys Pro Ser Val Gly Thr Arg Val Ala Leu Trp Ala Lys Gln Tyr Leu 595 600 605 Ile Ala Tyr Met Trp Trp Ala Ala Val Val Gly Ala Gly Val Tyr Ser 610 615 620 Ile Val His Asn Trp Met Phe Asp Trp Asn Ser Leu Ser Tyr Arg Phe 625 630 635 640 Ala Leu Val Gly Ile Cys Ser Tyr Ile Val Phe Ile Val Ile Val Leu 645 650 655 Val Val Tyr Phe Thr Gly Lys Ile Thr Thr Trp Asn Phe Thr Lys Leu 660 665 670 Gln Lys Glu Leu Ile Glu Asp Arg Val Leu Tyr Asp Ala Thr Thr Asn 675 680 685 Ala Gln Ser Val 690 <210> 28 <211> 910 <212> PRT <213> other sequences <220> <223> amino acid sequence of a polypeptide having chondroitin synthase activity (HCOS6-Vir) <400> 28 Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr 1 5 10 15 Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala 20 25 30 Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp 35 40 45 Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln 50 55 60 Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser 65 70 75 80 Leu Arg Pro Lys Leu Asp Ile Ala Thr Gln Leu Leu Leu Ser Asn Val 85 90 95 Lys Lys Leu Thr Leu Ser Glu Ser Glu Lys Asn Ser Leu Lys Asn Lys 100 105 110 Trp Lys Ser Ile Thr Gly Lys Lys Ser Glu Asn Ala Glu Ile Arg Lys 115 120 125 Val Glu Leu Val Pro Lys Asp Phe Pro Lys Asp Leu Val Leu Ala Pro 130 135 140 Leu Pro Asp His Val Asn Asp Phe Thr Trp Tyr Lys Asn Arg Lys Lys 145 150 155 160 Ser Leu Gly Ile Lys Pro Val Asn Lys Asn Ile Gly Leu Ser Ile Ile 165 170 175 Ile Pro Thr Phe Asn Arg Ser Arg Ile Leu Asp Ile Thr Leu Ala Cys 180 185 190 Leu Val Asn Gln Lys Thr Asn Tyr Pro Phe Glu Val Val Val Ala Asp 195 200 205 Asp Gly Ser Lys Glu Asn Leu Leu Thr Ile Val Gln Lys Tyr Glu Gln 210 215 220 Lys Leu Asp Ile Lys Tyr Val Arg Gln Lys Asp Tyr Gly Tyr Gln Leu 225 230 235 240 Cys Ala Val Arg Asn Leu Gly Leu Arg Thr Ala Lys Tyr Asp Phe Val 245 250 255 Ser Ile Leu Asp Cys Asp Met Ala Pro Gln Gln Leu Trp Val His Ser 260 265 270 Tyr Leu Thr Glu Leu Leu Glu Asp Asn Asp Ile Val Leu Ile Gly Pro 275 280 285 Arg Lys Tyr Val Asp Thr His Asn Ile Thr Ala Glu Gln Phe Leu Asn 290 295 300 Asp Pro Tyr Leu Ile Glu Ser Leu Pro Glu Thr Ala Thr Asn Asn Asn 305 310 315 320 Pro Ser Ile Thr Ser Lys Gly Asn Ile Ser Leu Asp Trp Arg Leu Glu 325 330 335 His Phe Lys Lys Thr Asp Asn Leu Arg Leu Cys Asp Ser Pro Phe Arg 340 345 350 Tyr Phe Ser Cys Gly Asn Val Ala Phe Ser Lys Glu Trp Leu Asn Lys 355 360 365 Val Gly Trp Phe Asp Glu Glu Phe Asn His Trp Gly Gly Glu Asp Val 370 375 380 Glu Phe Gly Tyr Arg Leu Phe Ala Lys Gly Cys Phe Phe Arg Val Ile 385 390 395 400 Asp Gly Gly Met Ala Tyr His Gln Glu Pro Pro Gly Lys Glu Asn Glu 405 410 415 Thr Asp Arg Glu Ala Gly Lys Ser Ile Thr Leu Lys Ile Val Lys Glu 420 425 430 Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile Glu Asp Ser His 435 440 445 Ile His Arg Ile Pro Leu Val Ser Ile Tyr Ile Pro Ala Tyr Asn Cys 450 455 460 Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu Asn Gln Thr Val 465 470 475 480 Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser Thr Asp Asn Thr 485 490 495 Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro Arg Val Arg Ile 500 505 510 Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser Asn Ala Ala Val 515 520 525 Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp Ser Asp Asp Tyr 530 535 540 Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu Phe Leu Lys Asp 545 550 555 560 Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn Val Asn Pro Asp 565 570 575 Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Glu Phe Ser Arg Glu 580 585 590 Lys Leu Thr Thr Ala Met Ile Ala His His Phe Arg Met Phe Thr Ile 595 600 605 Arg Ala Trp His Leu Thr Asp Gly Phe Asn Glu Lys Ile Glu Asn Ala 610 615 620 Val Asp Tyr Asp Met Phe Leu Lys Leu Ser Glu Val Gly Lys Phe Lys 625 630 635 640 His Leu Asn Lys Ile Cys Tyr Asn Arg Val Leu His Gly Asp Asn Thr 645 650 655 Ser Ile Lys Asn Leu Asp Thr Gln Lys Lys Asn His Phe Val Val Val 660 665 670 Asn Gln Ser Leu Asn Arg Gln Arg Val Ser Asn Tyr Asn Tyr Asp Glu 675 680 685 Phe Asp Asn Leu Asp Glu Ser Arg Lys Tyr Ile Phe Asn Lys Leu Phe 690 695 700 Ala Ala Trp Lys His Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys 705 710 715 720 Leu Tyr Gln Ile Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg 725 730 735 Leu Ala Val Glu Ala Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val 740 745 750 Ser Thr Thr Val Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala 755 760 765 Lys Asp Ile Arg Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe 770 775 780 Phe Cys Met Ile Pro Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp 785 790 795 800 Ile Gly Trp Gly Thr Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr 805 810 815 Arg Val Ala Leu Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp 820 825 830 Ala Ala Val Val Gly Ala Gly Val Tyr Ser Ile Val His Asn Trp Met 835 840 845 Phe Asp Trp Asn Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys 850 855 860 Ser Tyr Ile Val Phe Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly 865 870 875 880 Lys Ile Thr Thr Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu 885 890 895 Asp Arg Val Leu Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val 900 905 910 <210> 29 <211> 703 <212> PRT <213> other sequences <220> <223> reencoded amino acid sequence of a polypeptide having chondroitin synthase activity (HCOS7-Vir) <400> 29 Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr 1 5 10 15 Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala 20 25 30 Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp 35 40 45 Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln 50 55 60 Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser 65 70 75 80 Leu Arg Pro Lys Ile Pro Thr Phe Asn Arg Ser Arg Ile Leu Asp Ile 85 90 95 Thr Leu Ala Cys Leu Val Asn Gln Lys Thr Asn Tyr Pro Phe Glu Val 100 105 110 Val Val Ala Asp Asp Gly Ser Lys Glu Asn Leu Leu Thr Ile Val Gln 115 120 125 Lys Tyr Glu Gln Lys Leu Asp Ile Lys Tyr Val Arg Gln Lys Asp Tyr 130 135 140 Gly Tyr Gln Leu Cys Ala Val Arg Asn Leu Gly Leu Arg Thr Ala Lys 145 150 155 160 Tyr Asp Phe Val Ser Ile Leu Asp Cys Asp Met Ala Pro Gln Gln Leu 165 170 175 Trp Val His Ser Tyr Leu Thr Glu Leu Leu Glu Asp Asn Asp Ile Val 180 185 190 Leu Ile Gly Pro Arg Lys Tyr Val Asp Thr His Asn Ile Thr Ala Glu 195 200 205 Gln Phe Leu Asn Asp Pro Tyr Leu Ile Glu Ser Leu Pro Glu Thr Ala 210 215 220 Thr Asn Asn Asn Pro Ser Ile Thr Ser Lys Gly Asn Ile Ser Leu Asp 225 230 235 240 Trp Arg Leu Glu His Phe Lys Lys Thr Asp Asn Leu Arg Leu Cys Asp 245 250 255 Ser Pro Phe Arg Tyr Phe Ser Cys Gly Asn Val Ala Phe Ser Lys Glu 260 265 270 Trp Leu Asn Lys Val Gly Trp Phe Asp Glu Glu Phe Asn His Trp Gly 275 280 285 Gly Glu Asp Val Glu Phe Gly Tyr Arg Leu Phe Ala Lys Gly Cys Phe 290 295 300 Phe Arg Val Ile Asp Gly Gly Met Ala Tyr His Gln Glu Pro Pro Gly 305 310 315 320 Lys Glu Asn Glu Thr Asp Arg Glu Ala Gly Lys Ser Ile Thr Leu Lys 325 330 335 Ile Val Lys Glu Lys Val Pro Tyr Ile Tyr Arg Lys Leu Leu Pro Ile 340 345 350 Glu Asp Ser His Ile His Arg Ile Pro Leu Val Ser Ile Tyr Ile Pro 355 360 365 Ala Tyr Asn Cys Ala Asn Tyr Ile Gln Arg Cys Val Asp Ser Ala Leu 370 375 380 Asn Gln Thr Val Val Asp Leu Glu Val Cys Ile Cys Asn Asp Gly Ser 385 390 395 400 Thr Asp Asn Thr Leu Glu Val Ile Asn Lys Leu Tyr Gly Asn Asn Pro 405 410 415 Arg Val Arg Ile Met Ser Lys Pro Asn Gly Gly Ile Ala Ser Ala Ser 420 425 430 Asn Ala Ala Val Ser Phe Ala Lys Gly Tyr Tyr Ile Gly Gln Leu Asp 435 440 445 Ser Asp Asp Tyr Leu Glu Pro Asp Ala Val Glu Leu Cys Leu Lys Glu 450 455 460 Phe Leu Lys Asp Lys Thr Leu Ala Cys Val Tyr Thr Thr Asn Arg Asn 465 470 475 480 Val Asn Pro Asp Gly Ser Leu Ile Ala Asn Gly Tyr Asn Trp Pro Leu 485 490 495 Phe Ala Ala Trp Lys His Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu 500 505 510 Cys Leu Tyr Gln Ile Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser 515 520 525 Arg Leu Ala Val Glu Ala Asp Pro Arg Ala Gln Thr Ala Thr Val Ile 530 535 540 Val Ser Thr Thr Val Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg 545 550 555 560 Ala Lys Asp Ile Arg Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr 565 570 575 Phe Phe Cys Met Ile Pro Ala Arg Ile Thr Ala Met Met Thr Leu Trp 580 585 590 Asp Ile Gly Trp Gly Thr Arg Gly Gly Asn Glu Lys Pro Ser Val Gly 595 600 605 Thr Arg Val Ala Leu Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp 610 615 620 Trp Ala Ala Val Val Gly Ala Gly Val Tyr Ser Ile Val His Asn Trp 625 630 635 640 Met Phe Asp Trp Asn Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile 645 650 655 Cys Ser Tyr Ile Val Phe Ile Val Ile Val Leu Val Val Tyr Phe Thr 660 665 670 Gly Lys Ile Thr Thr Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile 675 680 685 Glu Asp Arg Val Leu Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val 690 695 700 <210> 30 <211> 569 <212> PRT <213> other sequences <220> <223> reencoded amino acid sequence of a polypeptide having chondroitin synthase activity (HCOS8-Vir) <400> 30 Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr 1 5 10 15 Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala 20 25 30 Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp 35 40 45 Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln 50 55 60 Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser 65 70 75 80 Leu Arg Pro Lys Gly Trp Asn Asp Val Arg Leu Ala Val Ile Ile Ala 85 90 95 Gly Tyr Arg Glu Asp Pro Tyr Met Phe Gln Lys Cys Leu Glu Ser Val 100 105 110 Arg Asp Ser Asp Tyr Gly Asn Val Ala Arg Leu Ile Cys Val Ile Asp 115 120 125 Gly Asp Glu Asp Asp Asp Met Arg Met Ala Ala Val Tyr Lys Ala Ile 130 135 140 Tyr Asn Asp Asn Ile Lys Lys Pro Glu Phe Val Leu Cys Glu Ser Asp 145 150 155 160 Asp Lys Glu Gly Glu Arg Ile Asp Ser Asp Phe Ser Arg Asp Ile Cys 165 170 175 Val Leu Gln Pro His Arg Gly Lys Arg Glu Cys Leu Tyr Thr Gly Phe 180 185 190 Gln Leu Ala Lys Met Asp Pro Ser Val Asn Ala Val Val Leu Ile Asp 195 200 205 Ser Asp Thr Val Leu Glu Lys Asp Ala Ile Leu Glu Val Val Tyr Pro 210 215 220 Leu Ala Cys Asp Pro Glu Ile Gln Ala Val Ala Gly Glu Cys Lys Ile 225 230 235 240 Trp Asn Thr Asp Thr Leu Leu Ser Leu Leu Val Ala Trp Arg Tyr Tyr 245 250 255 Ser Ala Phe Cys Val Glu Arg Ser Ala Gln Ser Phe Phe Arg Thr Val 260 265 270 Gln Cys Val Arg Leu Cys Asp Ser Pro Phe Arg Tyr Phe Ser Cys Gly 275 280 285 Asn Val Ala Phe Ser Lys Glu Trp Leu Asn Lys Val Gly Trp Phe Asp 290 295 300 Glu Glu Phe Asn His Trp Gly Gly Glu Asp Val Glu Phe Gly Tyr Arg 305 310 315 320 Leu Lys Lys Val Val Phe Thr Pro Phe Ala Val Gly Trp Ser Asp Ser 325 330 335 Pro Thr Asn Val Phe Arg Tyr Ile Val Gln Gln Thr Arg Trp Ser Lys 340 345 350 Ser Trp Cys Arg Glu Ile Trp Tyr Thr Leu Phe Ala Ala Trp Lys His 355 360 365 Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr Gln Ile Thr 370 375 380 Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala Val Glu Ala 385 390 395 400 Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr Thr Val Ala 405 410 415 Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp Ile Arg Ala 420 425 430 Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys Met Ile Pro 435 440 445 Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly Trp Gly Thr 450 455 460 Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val Ala Leu Trp 465 470 475 480 Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala Val Val Gly 485 490 495 Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp Trp Asn Ser 500 505 510 Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr Ile Val Phe 515 520 525 Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile Thr Thr Trp 530 535 540 Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg Val Leu Tyr 545 550 555 560 Asp Ala Thr Thr Asn Ala Gln Ser Val 565 <210> 31 <211> 832 <212> PRT <213> other sequences <220> <223> amino acid sequence of a polypeptide having chondroitin synthase activity (HCOS9-Vir) <400> 31 Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr 1 5 10 15 Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala 20 25 30 Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp 35 40 45 Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln 50 55 60 Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser 65 70 75 80 Leu Arg Pro Lys His Ile Gly Lys Cys Leu Arg Glu Met Tyr Thr Thr 85 90 95 His Glu Asp Val Glu Val Gly Arg Cys Val Arg Arg Phe Ala Gly Val 100 105 110 Gln Cys Val Trp Ser Tyr Glu Met Gln Gln Leu Phe Tyr Glu Asn Tyr 115 120 125 Glu Gln Asn Lys Lys Gly Tyr Ile Arg Asp Leu His Asn Ser Lys Ile 130 135 140 His Gln Ala Ile Thr Leu His Pro Asn Lys Asn Pro Pro Tyr Gln Tyr 145 150 155 160 Arg Leu His Ser Tyr Met Leu Ser Arg Lys Ile Ser Glu Leu Arg His 165 170 175 Arg Thr Ile Gln Leu His Arg Glu Ile Val Leu Met Ser Lys Tyr Ser 180 185 190 Asn Thr Glu Ile His Lys Glu Asp Leu Gln Leu Gly Ile Pro Pro Ser 195 200 205 Phe Met Arg Phe Gln Pro Arg Gln Arg Glu Glu Ile Leu Glu Trp Glu 210 215 220 Phe Leu Thr Gly Lys Tyr Leu Tyr Ser Ala Val Asp Gly Gln Pro Pro 225 230 235 240 Arg Arg Gly Met Asp Ser Ala Gln Arg Glu Ala Leu Asp Asp Ile Val 245 250 255 Met Gln Val Met Glu Met Ile Asn Ala Asn Ala Lys Thr Arg Gly Arg 260 265 270 Ile Ile Asp Phe Lys Glu Ile Gln Tyr Gly Tyr Arg Arg Val Asn Pro 275 280 285 Met Tyr Gly Ala Glu Tyr Ile Leu Asp Leu Leu Leu Leu Tyr Lys Lys 290 295 300 His Lys Gly Lys Lys Met Thr Val Pro Val Arg Arg His Ala Tyr Leu 305 310 315 320 Gln Gln Thr Phe Ser Lys Ile Gln Phe Val Glu His Glu Glu Leu Asp 325 330 335 Ala Gln Glu Leu Ala Lys Arg Ile Asn Gln Glu Ser Gly Ser Leu Ser 340 345 350 Phe Leu Ser Asn Ser Leu Lys Lys Leu Val Pro Phe Gln Leu Pro Gly 355 360 365 Ser Lys Ser Glu His Lys Glu Pro Lys Asp Lys Lys Ile Asn Ile Leu 370 375 380 Ile Pro Leu Ser Gly Arg Phe Asp Met Phe Val Arg Phe Met Gly Asn 385 390 395 400 Phe Glu Lys Thr Cys Leu Ile Pro Asn Gln Asn Val Lys Leu Val Val 405 410 415 Leu Leu Phe Asn Ser Asp Ser Asn Pro Asp Lys Ala Lys Gln Val Glu 420 425 430 Leu Met Arg Asp Tyr Arg Ile Lys Tyr Pro Lys Ala Asp Met Gln Ile 435 440 445 Leu Pro Val Ser Gly Glu Phe Ser Arg Ala Leu Ala Leu Glu Val Gly 450 455 460 Ser Ser Gln Phe Asn Asn Glu Ser Leu Leu Phe Phe Cys Asp Val Asp 465 470 475 480 Leu Val Phe Thr Thr Glu Phe Leu Gln Arg Cys Arg Ala Asn Thr Val 485 490 495 Leu Gly Gln Gln Ile Tyr Phe Pro Ile Ile Phe Ser Gln Tyr Asp Pro 500 505 510 Lys Ile Val Tyr Ser Gly Lys Val Pro Ser Asp Asn His Phe Ala Phe 515 520 525 Thr Gln Lys Thr Gly Phe Trp Arg Asn Tyr Gly Phe Gly Ile Thr Cys 530 535 540 Ile Tyr Lys Gly Asp Leu Val Arg Val Gly Gly Phe Asp Val Ser Ile 545 550 555 560 Gln Gly Trp Gly Leu Glu Asp Val Asp Leu Phe Asn Lys Val Val Gln 565 570 575 Ala Gly Leu Lys Thr Phe Arg Ser Gln Glu Val Gly Val Val His Val 580 585 590 His His Pro Val Phe Cys Asp Pro Asn Leu Asp Pro Lys Gln Tyr Lys 595 600 605 Met Cys Leu Gly Ser Lys Ala Ser Thr Tyr Gly Ser Thr Gln Gln Leu 610 615 620 Leu Phe Ala Ala Trp Lys His Gly Leu Ser Gly Ile Trp Leu Ala Phe 625 630 635 640 Glu Cys Leu Tyr Gln Ile Thr Tyr Phe Phe Leu Val Ile Tyr Leu Phe 645 650 655 Ser Arg Leu Ala Val Glu Ala Asp Pro Arg Ala Gln Thr Ala Thr Val 660 665 670 Ile Val Ser Thr Thr Val Ala Leu Ile Lys Cys Gly Tyr Phe Ser Phe 675 680 685 Arg Ala Lys Asp Ile Arg Ala Phe Tyr Phe Val Leu Tyr Thr Phe Val 690 695 700 Tyr Phe Phe Cys Met Ile Pro Ala Arg Ile Thr Ala Met Met Thr Leu 705 710 715 720 Trp Asp Ile Gly Trp Gly Thr Arg Gly Gly Asn Glu Lys Pro Ser Val 725 730 735 Gly Thr Arg Val Ala Leu Trp Ala Lys Gln Tyr Leu Ile Ala Tyr Met 740 745 750 Trp Trp Ala Ala Val Val Gly Ala Gly Val Tyr Ser Ile Val His Asn 755 760 765 Trp Met Phe Asp Trp Asn Ser Leu Ser Tyr Arg Phe Ala Leu Val Gly 770 775 780 Ile Cys Ser Tyr Ile Val Phe Ile Val Ile Val Leu Val Val Tyr Phe 785 790 795 800 Thr Gly Lys Ile Thr Thr Trp Asn Phe Thr Lys Leu Gln Lys Glu Leu 805 810 815 Ile Glu Asp Arg Val Leu Tyr Asp Ala Thr Thr Asn Ala Gln Ser Val 820 825 830 <210> 32 <211> 1001 <212> PRT <213> other sequences <220> <223> reencoded amino acid sequence of a polypeptide having chondroitin synthase activity (HCOS10-Vir) <400> 32 Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr 1 5 10 15 Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala 20 25 30 Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp 35 40 45 Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln 50 55 60 Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser 65 70 75 80 Leu Arg Pro Lys Arg Asp Arg Asn Phe Leu Phe Val Gly Val Met Thr 85 90 95 Ala Gln Lys Tyr Leu Gln Thr Arg Ala Val Ala Ala Tyr Arg Thr Trp 100 105 110 Ser Lys Thr Ile Pro Gly Lys Val Gln Phe Phe Ser Ser Glu Gly Ser 115 120 125 Asp Thr Ser Val Pro Ile Pro Val Val Pro Leu Arg Gly Val Asp Asp 130 135 140 Ser Tyr Pro Pro Gln Lys Lys Ser Phe Met Met Leu Lys Tyr Met His 145 150 155 160 Asp His Tyr Leu Asp Lys Tyr Glu Trp Phe Met Arg Ala Asp Asp Asp 165 170 175 Val Tyr Ile Lys Gly Asp Arg Leu Glu Asn Phe Leu Arg Ser Leu Asn 180 185 190 Ser Ser Glu Pro Leu Phe Leu Gly Gln Thr Gly Leu Gly Thr Thr Glu 195 200 205 Glu Met Gly Lys Leu Ala Leu Glu Pro Gly Glu Asn Phe Cys Met Gly 210 215 220 Gly Pro Gly Val Ile Met Ser Arg Glu Val Leu Arg Arg Met Val Pro 225 230 235 240 His Ile Gly Lys Cys Leu Arg Glu Met Tyr Thr Thr His Glu Asp Val 245 250 255 Glu Val Gly Arg Cys Val Arg Arg Phe Ala Gly Val Gln Cys Val Trp 260 265 270 Ser Tyr Glu Met Gln Gln Leu Phe Tyr Glu Asn Tyr Glu Gln Asn Lys 275 280 285 Lys Gly Tyr Ile Arg Asp Leu His Asn Ser Lys Ile His Gln Ala Ile 290 295 300 Thr Leu His Pro Asn Lys Asn Pro Pro Tyr Gln Tyr Arg Leu His Ser 305 310 315 320 Tyr Met Leu Ser Arg Lys Ile Ser Glu Leu Arg His Arg Thr Ile Gln 325 330 335 Leu His Arg Glu Ile Val Leu Met Ser Lys Tyr Ser Asn Thr Glu Ile 340 345 350 His Lys Glu Asp Leu Gln Leu Gly Ile Pro Pro Ser Phe Met Arg Phe 355 360 365 Gln Pro Arg Gln Arg Glu Glu Ile Leu Glu Trp Glu Phe Leu Thr Gly 370 375 380 Lys Tyr Leu Tyr Ser Ala Val Asp Gly Gln Pro Pro Arg Arg Gly Met 385 390 395 400 Asp Ser Ala Gln Arg Glu Ala Leu Asp Asp Ile Val Met Gln Val Met 405 410 415 Glu Met Ile Asn Ala Asn Ala Lys Thr Arg Gly Arg Ile Ile Asp Phe 420 425 430 Lys Glu Ile Gln Tyr Gly Tyr Arg Arg Val Asn Pro Met Tyr Gly Ala 435 440 445 Glu Tyr Ile Leu Asp Leu Leu Leu Leu Tyr Lys Lys His Lys Gly Lys 450 455 460 Lys Met Thr Val Pro Val Arg Arg His Ala Tyr Leu Gln Gln Thr Phe 465 470 475 480 Ser Lys Ile Gln Phe Val Glu His Glu Glu Leu Asp Ala Gln Glu Leu 485 490 495 Ala Lys Arg Ile Asn Gln Glu Ser Gly Ser Leu Ser Phe Leu Ser Asn 500 505 510 Ser Leu Lys Lys Leu Val Pro Phe Gln Leu Pro Gly Ser Lys Ser Glu 515 520 525 His Lys Glu Pro Lys Asp Lys Lys Ile Asn Ile Leu Ile Pro Leu Ser 530 535 540 Gly Arg Phe Asp Met Phe Val Arg Phe Met Gly Asn Phe Glu Lys Thr 545 550 555 560 Cys Leu Ile Pro Asn Gln Asn Val Lys Leu Val Val Leu Leu Phe Asn 565 570 575 Ser Asp Ser Asn Pro Asp Lys Ala Lys Gln Val Glu Leu Met Arg Asp 580 585 590 Tyr Arg Ile Lys Tyr Pro Lys Ala Asp Met Gln Ile Leu Pro Val Ser 595 600 605 Gly Glu Phe Ser Arg Ala Leu Ala Leu Glu Val Gly Ser Ser Gln Phe 610 615 620 Asn Asn Glu Ser Leu Leu Phe Phe Cys Asp Val Asp Leu Val Phe Thr 625 630 635 640 Thr Glu Phe Leu Gln Arg Cys Arg Ala Asn Thr Val Leu Gly Gln Gln 645 650 655 Ile Tyr Phe Pro Ile Ile Phe Ser Gln Tyr Asp Pro Lys Ile Val Tyr 660 665 670 Ser Gly Lys Val Pro Ser Asp Asn His Phe Ala Phe Thr Gln Lys Thr 675 680 685 Gly Phe Trp Arg Asn Tyr Gly Phe Gly Ile Thr Cys Ile Tyr Lys Gly 690 695 700 Asp Leu Val Arg Val Gly Gly Phe Asp Val Ser Ile Gln Gly Trp Gly 705 710 715 720 Leu Glu Asp Val Asp Leu Phe Asn Lys Val Val Gln Ala Gly Leu Lys 725 730 735 Thr Phe Arg Ser Gln Glu Val Gly Val Val His Val His His Pro Val 740 745 750 Phe Cys Asp Pro Asn Leu Asp Pro Lys Gln Tyr Lys Met Cys Leu Gly 755 760 765 Ser Lys Ala Ser Thr Tyr Gly Ser Thr Gln Gln Leu Ala Glu Met Trp 770 775 780 Leu Glu Lys Asn Asp Pro Ser Tyr Ser Leu Phe Ala Ala Trp Lys His 785 790 795 800 Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr Gln Ile Thr 805 810 815 Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala Val Glu Ala 820 825 830 Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr Thr Val Ala 835 840 845 Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp Ile Arg Ala 850 855 860 Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys Met Ile Pro 865 870 875 880 Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly Trp Gly Thr 885 890 895 Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val Ala Leu Trp 900 905 910 Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala Val Val Gly 915 920 925 Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp Trp Asn Ser 930 935 940 Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr Ile Val Phe 945 950 955 960 Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile Thr Thr Trp 965 970 975 Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg Val Leu Tyr 980 985 990 Asp Ala Thr Thr Asn Ala Gln Ser Val 995 1000 <210> 33 <211> 531 <212> PRT <213> other sequences <220> <223> reencoded amino acid sequence of a polypeptide having chondroitin synthase activity (HCOS11-Vir) <400> 33 Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr 1 5 10 15 Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala 20 25 30 Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp 35 40 45 Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln 50 55 60 Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser 65 70 75 80 Leu Arg Pro Lys Arg Asp Arg Asn Phe Leu Phe Val Gly Val Met Thr 85 90 95 Ala Gln Lys Tyr Leu Gln Thr Arg Ala Val Ala Ala Tyr Arg Thr Trp 100 105 110 Ser Lys Thr Ile Pro Gly Lys Val Gln Phe Phe Ser Ser Glu Gly Ser 115 120 125 Asp Thr Ser Val Pro Ile Pro Val Val Pro Leu Arg Gly Val Asp Asp 130 135 140 Ser Tyr Pro Pro Gln Lys Lys Ser Phe Met Met Leu Lys Tyr Met His 145 150 155 160 Asp His Tyr Leu Asp Lys Tyr Glu Trp Phe Met Arg Ala Asp Asp Asp 165 170 175 Val Tyr Ile Lys Gly Asp Arg Leu Glu Asn Phe Leu Arg Ser Leu Asn 180 185 190 Ser Ser Glu Pro Leu Phe Leu Gly Gln Thr Gly Leu Gly Thr Thr Glu 195 200 205 Glu Met Gly Lys Leu Ala Leu Glu Pro Gly Glu Asn Phe Cys Met Gly 210 215 220 Gly Pro Gly Val Ile Met Ser Arg Glu Val Leu Arg Arg Met Val Pro 225 230 235 240 His Ile Gly Lys Cys Leu Arg Glu Met Tyr Thr Thr His Glu Asp Val 245 250 255 Glu Val Gly Arg Cys Val Arg Arg Phe Ala Gly Val Gln Cys Val Trp 260 265 270 Ser Tyr Glu Met Gln Gln Leu Phe Tyr Glu Asn Tyr Glu Gln Asn Lys 275 280 285 Lys Gly Tyr Ile Arg Asp Leu His Asn Ser Lys Ile His Gln Ala Ile 290 295 300 Thr Leu His Pro Asn Lys Asn Pro Pro Tyr Gln Tyr Arg Leu His Ser 305 310 315 320 Tyr Met Leu Leu Phe Ala Ala Trp Lys His Gly Leu Ser Gly Ile Trp 325 330 335 Leu Ala Phe Glu Cys Leu Tyr Gln Ile Thr Tyr Phe Phe Leu Val Ile 340 345 350 Tyr Leu Phe Ser Arg Leu Ala Val Glu Ala Asp Pro Arg Ala Gln Thr 355 360 365 Ala Thr Val Ile Val Ser Thr Thr Val Ala Leu Ile Lys Cys Gly Tyr 370 375 380 Phe Ser Phe Arg Ala Lys Asp Ile Arg Ala Phe Tyr Phe Val Leu Tyr 385 390 395 400 Thr Phe Val Tyr Phe Phe Cys Met Ile Pro Ala Arg Ile Thr Ala Met 405 410 415 Met Thr Leu Trp Asp Ile Gly Trp Gly Thr Arg Gly Gly Asn Glu Lys 420 425 430 Pro Ser Val Gly Thr Arg Val Ala Leu Trp Ala Lys Gln Tyr Leu Ile 435 440 445 Ala Tyr Met Trp Trp Ala Ala Val Val Gly Ala Gly Val Tyr Ser Ile 450 455 460 Val His Asn Trp Met Phe Asp Trp Asn Ser Leu Ser Tyr Arg Phe Ala 465 470 475 480 Leu Val Gly Ile Cys Ser Tyr Ile Val Phe Ile Val Ile Val Leu Val 485 490 495 Val Tyr Phe Thr Gly Lys Ile Thr Thr Trp Asn Phe Thr Lys Leu Gln 500 505 510 Lys Glu Leu Ile Glu Asp Arg Val Leu Tyr Asp Ala Thr Thr Asn Ala 515 520 525 Gln Ser Val 530 <210> 34 <211> 553 <212> PRT <213> other sequences <220> <223> reencoded amino acid sequence of a polypeptide having chondroitin synthase activity (HCOS12-Vir) <400> 34 Met Gly Lys Asn Ile Ile Ile Met Val Ser Trp Tyr Thr Ile Ile Thr 1 5 10 15 Ser Asn Leu Ile Ala Val Gly Gly Ala Ser Leu Ile Leu Ala Pro Ala 20 25 30 Ile Thr Gly Tyr Val Leu His Trp Asn Ile Ala Leu Ser Thr Ile Trp 35 40 45 Gly Val Ser Ala Tyr Gly Ile Phe Val Phe Gly Phe Phe Leu Ala Gln 50 55 60 Val Leu Phe Ser Glu Leu Asn Arg Lys Arg Leu Arg Lys Trp Ile Ser 65 70 75 80 Leu Arg Pro Lys Lys Asp Lys Lys Ile Asn Ile Leu Ile Pro Leu Ser 85 90 95 Gly Arg Phe Asp Met Phe Val Arg Phe Met Gly Asn Phe Glu Lys Thr 100 105 110 Cys Leu Ile Pro Asn Gln Asn Val Lys Leu Val Val Leu Leu Phe Asn 115 120 125 Ser Asp Ser Asn Pro Asp Lys Ala Lys Gln Val Glu Leu Met Arg Asp 130 135 140 Tyr Arg Ile Lys Tyr Pro Lys Ala Asp Met Gln Ile Leu Pro Val Ser 145 150 155 160 Gly Glu Phe Ser Arg Ala Leu Ala Leu Glu Val Gly Ser Ser Gln Phe 165 170 175 Asn Asn Glu Ser Leu Leu Phe Phe Cys Asp Val Asp Leu Val Phe Thr 180 185 190 Thr Glu Phe Leu Gln Arg Cys Arg Ala Asn Thr Val Leu Gly Gln Gln 195 200 205 Ile Tyr Phe Pro Ile Ile Phe Ser Gln Tyr Asp Pro Lys Ile Val Tyr 210 215 220 Ser Gly Lys Val Pro Ser Asp Asn His Phe Ala Phe Thr Gln Lys Thr 225 230 235 240 Gly Phe Trp Arg Asn Tyr Gly Phe Gly Ile Thr Cys Ile Tyr Lys Gly 245 250 255 Asp Leu Val Arg Val Gly Gly Phe Asp Val Ser Ile Gln Gly Trp Gly 260 265 270 Leu Glu Asp Val Asp Leu Phe Asn Lys Val Val Gln Ala Gly Leu Lys 275 280 285 Thr Phe Arg Ser Gln Glu Val Gly Val Val His Val His His Pro Val 290 295 300 Phe Cys Asp Pro Asn Leu Asp Pro Lys Gln Tyr Lys Met Cys Leu Gly 305 310 315 320 Ser Lys Ala Ser Thr Tyr Gly Ser Thr Gln Gln Leu Ala Glu Met Trp 325 330 335 Leu Glu Lys Asn Asp Pro Ser Tyr Ser Leu Phe Ala Ala Trp Lys His 340 345 350 Gly Leu Ser Gly Ile Trp Leu Ala Phe Glu Cys Leu Tyr Gln Ile Thr 355 360 365 Tyr Phe Phe Leu Val Ile Tyr Leu Phe Ser Arg Leu Ala Val Glu Ala 370 375 380 Asp Pro Arg Ala Gln Thr Ala Thr Val Ile Val Ser Thr Thr Val Ala 385 390 395 400 Leu Ile Lys Cys Gly Tyr Phe Ser Phe Arg Ala Lys Asp Ile Arg Ala 405 410 415 Phe Tyr Phe Val Leu Tyr Thr Phe Val Tyr Phe Phe Cys Met Ile Pro 420 425 430 Ala Arg Ile Thr Ala Met Met Thr Leu Trp Asp Ile Gly Trp Gly Thr 435 440 445 Arg Gly Gly Asn Glu Lys Pro Ser Val Gly Thr Arg Val Ala Leu Trp 450 455 460 Ala Lys Gln Tyr Leu Ile Ala Tyr Met Trp Trp Ala Ala Val Val Gly 465 470 475 480 Ala Gly Val Tyr Ser Ile Val His Asn Trp Met Phe Asp Trp Asn Ser 485 490 495 Leu Ser Tyr Arg Phe Ala Leu Val Gly Ile Cys Ser Tyr Ile Val Phe 500 505 510 Ile Val Ile Val Leu Val Val Tyr Phe Thr Gly Lys Ile Thr Thr Trp 515 520 525 Asn Phe Thr Lys Leu Gln Lys Glu Leu Ile Glu Asp Arg Val Leu Tyr 530 535 540 Asp Ala Thr Thr Asn Ala Gln Ser Val 545 550 <210> 35 <211> 1446 <212> DNA <213> Arabidopsis thaliana <220> <223> nucleic acid sequence of UDP-Glucose dehydrogenase (HASB) <400> 35 atggtcaaaa tatgctgtat cggggctgga tatgtcggtg ggcctacaat ggccgttatg 60 gccctaaagt gtccagagat tgaagtcgtg gtagttgata tatcggagcc acgaattaac 120 gcatggaact cagaccgtct accaatttat gagccagggt tagaggatgt cgtcaaacag 180 tgtagaggga agaatttgtt cttctctaca gatgtagaga agcatgtatt tgagtcagat 240 atagtgtttg tttcggtaaa cactcctacg aaaacgcagg gtctgggtgc aggtaaagca 300 gcagatttga catattggga gtccgctgct cgcatgatag ctgatgtgag caaatcgtcg 360 aaaatcgtcg ttgaaaagag tacagtacca gttcgtacag ccgaggctat agaaaagatt 420 ttaacgcaca attcgaaggg tatcgaattc cagatcttat caaatccaga attcttggcc 480 gaagggacgg cgattaaaga cttatataac cctgatagag ttctaatcgg tggcagggac 540 accgctgcgg gacaaaaggc cattaaggcg ttgcgtgacg tgtatgccca ctgggttcct 600 gttgagcaaa taatctgtac taatttatgg agtgccgagc tatcaaagtt ggctgcgaac 660 gcatttctag ctcaaaggat aagttcagta aacgcaatgt cagcgctttg tgaggcaact 720 ggtgctgacg taacccaagt cgctcacgcc gttggaaccg acactagaat tggaccgaag 780 tttcttaacg catccgtagg cttcggcgga tcttgctttc agaaagacat cctgaatctt 840 atttacatct gcgaatgcaa tggtcttcca gaagcagcca attattggaa acaggtagtc 900 aaggtaaatg actaccaaaa gattaggttt gctaatcgag tcgtatcttc tatgttcaac 960 accgtctccg gtaagaaaat tgctattttg ggatttgcgt tcaagaagga caccggcgac 1020 acgcgtgaaa ctcctgccat agatgtgtgt aatcgcctcg tggctgataa agcaaagctg 1080 tcgatctatg atccgcaagt attagaagag cagatccgcc gtgatctgtc catggcccga 1140 ttcgattggg accatccagt cccactccag cagatcaaag ctgaaggtat ctccgaacag 1200 gttaacgttg tgtccgacgc ctacgaggct acgaaggatg ctcatggttt atgtgtttta 1260 accgaatggg acgaattcaa gtcacttgat tttaagaaga tctttgataa tatgcagaaa 1320 cccgctttcg ttttcgacgg aagaaacgtg gtcgacgctg tgaaattgag agaaattgga 1380 ttcatagtat attccatagg taaacctctg gatagttggc tcaaggatat gccggctgtt 1440 gcataa 1446 <210> 36 <211> 1166 <212> DNA <213> Chlorella virus <220> <223> reencoded nucleic acid sequence of UDP-Glucose dehydrogenase (HASB) <400> 36 atgagtagaa ttgctgtcgt tggatgcggt tacgtgggta cggcctgcgc cgtacttttg 60 gcgcagaaga acgaagttat cgttttggat atctcggagg accgggtaca actgattaag 120 aataagaagt cacctataga agataaggaa atcgaagaat tcctggagac gaaagatttg 180 aatctaacag cgacgacgga taaggtgctc gcctatgaga atgctgaatt cgttataata 240 gctacaccga ccgattacga tgtcgtcact agatatttca acactaagtc tgttgaaaat 300 gtgataggcg atgtcattaa gaacactcag acacacccta ctatagtgat caagagtact 360 attccaatcg gtttcgtgga taaagttaga gaacagttcg attatcaaaa tattatcttc 420 tcgccggaat tcttgagaga aggacgagca ttatatgata atctttaccc ctcccgtatc 480 atcgtcggtg atgactcccc aattgcctta aaattcgcga atctcttggt cgagggtagc 540 aaaactccac tagctcccgt attaactatg ggtacgcgag aggccgaagc tgtaaaacta 600 ttttcaaata catatttggc tatgagagta gcatacttca atgagctaga cacatttgca 660 atgtcccatg gtatgaacgc aaaagagatt atcgacggag tcacactaga accaaggata 720 gggcagggtt attcgaatcc ttcatttggg tatggagcct attgtttccc aaaagataca 780 aagcaattgt tggctaattt tgaaggggtt ccacaagata ttattggcgc aatcgtagag 840 tctaacgaaa ctagaaagga ggttattgtt tctgaggtcg agaacagatt tccgaccaca 900 gttggcgtat ataagttggc tgctaaagct ggttcggata atttcaggtc tagtgcgata 960 gtcgatatca tggaaaggtt ggctaataag ggctaccaca tcaaaatatt tgaacctacc 1020 gttgaacaat ttgagaattt tgaggtagat aataatctca caacttttgc aaccgagtct 1080 gatgtaataa ttgcgaacag agttccagtc gaacatcgca ttctgtttgg gaagaagtta 1140 ataacacggg atgtctatgg ggataa 1166 <210> 37 <211> 1170 <212> DNA <213> Chlorella virus <220> <223> reencoded nucleic acid sequence of UDP-Glucose dehydrogenase (HASB-A) <400> 37 atgtcacgaa tcgcagtagt tggctgtggg tacgtgggaa ccgcatgcgc tgtactgctg 60 gcgcaaaaga atgaggtaat cgttcttgat attagtgagg atagggtcca actaatcaag 120 aacaagaaat ccccgatcga agataaggag attgaagaat tcttggaaac aaaagaccta 180 aacttaactg caacaactga caaagtttta gcctacgaaa acgctgagtt tgtgattata 240 gcgacaccca cagattatga cgtagttacc agatacttta acacgaagtc cgtagagaac 300 gtcattggag atgttataaa gaatactcag actcatccta cgatagtaat aaagtcaacc 360 attcccatag gtttcgtaga taaggttagg gagcaattcg attaccagaa cattatattt 420 tcgccagaat ttctgagaga gggtcgcgcc ctgtatgata atctatatcc atcacggatt 480 atagtgggcg atgactctcc gattgcactt aagtttgcta atcttttagt tgagggctcc 540 aaaactccgc tcgccccagt acttacgatg ggtacacgtg aggctgaagc tgtcaagctg 600 ttttcaaaca cataccttgc tatgcgagtc gcatacttta acgaactaga tacctttgct 660 atgtcgcacg gtatgaatgc taaagaaatc atagatggcg taacgttgga gcctcggata 720 ggtcaaggat attccaatcc atcttttggc tacggtgcgt attgtttccc aaaggacacg 780 aagcaattat tagctaactt tgagggtgtt ccgcaagata taattggggc gatagtagaa 840 agcaatgaaa cacggaagga ggtaatcgtg agtgaagtgg aaaaccgatt ccccactacg 900 gtcggcgttt acaaattagc cgccaaggct ggttccgaca atttccgatc cagcgcaata 960 gtagatatta tggaaagatt agctaataag ggataccaca ttaaaatctt tgaacctact 1020 gtcgaacagt tcgagaactt cgaggttgat aataacttga cgactttcgc aacggagagc 1080 gatgtaatta ttgcaaaccg cgtacctgtg gaacatcgaa ttttgttcgg aaagaagctg 1140 attacacgcg atgtatatgg cgataactaa 1170 <210> 38 <211> 1199 <212> DNA <213> Streptococcus <220> <223> a nucleic acid sequence of UDP-Glucose dehydrogenase (HASB) <400> 38 atgaagatat cggtagcggg ttcggggtac gtggggttat ccttgtcaat cttgcttgcc 60 caacataacg atgtgactgt tgtagatata atcgacgaaa aggtacggct aattaaccag 120 ggcatatctc cgattaagga tgcggacatt gaggaatatc tgaagaatgc accgttgaat 180 cttacggcta cactagacgg agcttcggct tatagtaatg ctgatctgat tataatcgca 240 acgccaacta attacgattc agaacgcaat tatttcgaca ccagacacgt tgaagaagta 300 attgagcaag tattggattt aaatgcctcc gctactataa tcatcaagag taccataccc 360 ttgggtttta ttaaacacgt aagagagaaa taccaaacag acagaatcat cttttctcca 420 gagttcttaa gagagtcaaa ggcattgtac gataacttat acccctctcg tataatagtc 480 agttatgaga aggatgactc tccaagagtt atacaagcag ctaaggcgtt cgcgggttta 540 ttaaaagagg gggcaaagag caaggatacc ccagttctgt ttatgggctc tcaagaagct 600 gaagctgtca agctgtttgc taatactttt ctcgccatga gggtcagtta cttcaacgag 660 cttgacactt atagcgaatc aaaaggacta gacgcccaaa gagttataga aggcgtctgc 720 catgatcaaa ggataggtaa tcattacaat aatccatcct tcggatatgg cggttattgt 780 ttacccaaag actcaaagca acttttggct aattatagag gcatacctca gtctctaatg 840 tctgccatcg ttgaatcgaa caagatccgt aagtcgtatt tagctgaaca aatattagat 900 agggcttctt cacaaaagca ggctggtgta cctttaacca taggatttta ccgtttgatt 960 atgaagtcca actccgataa ctttagagaa tcagccatta aagatattat tgacatcatt 1020 aatgactacg gtgtcaatat tgtcatttat gaacctatgt tgggagaaga cattggttat 1080 agagtcgtta aagatttgga acagtttaag aacgaaagta caattattgt tagtaacagg 1140 tttgaagatg atttaggtga tgttattgat aaagtttata cacgtgacgt ctttggtag 1199 <210> 39 <211> 481 <212> PRT <213> Arabidopsis thaliana <220> <223> amino acid sequence of UDP-Glucose dehydrogenase (HASB) <400> 39 Met Val Lys Ile Cys Cys Ile Gly Ala Gly Tyr Val Gly Gly Pro Thr 1 5 10 15 Met Ala Val Met Ala Leu Lys Cys Pro Glu Ile Glu Val Val Val Val 20 25 30 Asp Ile Ser Glu Pro Arg Ile Asn Ala Trp Asn Ser Asp Arg Leu Pro 35 40 45 Ile Tyr Glu Pro Gly Leu Glu Asp Val Val Lys Gln Cys Arg Gly Lys 50 55 60 Asn Leu Phe Phe Ser Thr Asp Val Glu Lys His Val Phe Glu Ser Asp 65 70 75 80 Ile Val Phe Val Ser Val Asn Thr Pro Thr Lys Thr Gln Gly Leu Gly 85 90 95 Ala Gly Lys Ala Ala Asp Leu Thr Tyr Trp Glu Ser Ala Ala Arg Met 100 105 110 Ile Ala Asp Val Ser Lys Ser Ser Lys Ile Val Val Glu Lys Ser Thr 115 120 125 Val Pro Val Arg Thr Ala Glu Ala Ile Glu Lys Ile Leu Thr His Asn 130 135 140 Ser Lys Gly Ile Glu Phe Gln Ile Leu Ser Asn Pro Glu Phe Leu Ala 145 150 155 160 Glu Gly Thr Ala Ile Lys Asp Leu Tyr Asn Pro Asp Arg Val Leu Ile 165 170 175 Gly Gly Arg Asp Thr Ala Ala Gly Gln Lys Ala Ile Lys Ala Leu Arg 180 185 190 Asp Val Tyr Ala His Trp Val Pro Val Glu Gln Ile Ile Cys Thr Asn 195 200 205 Leu Trp Ser Ala Glu Leu Ser Lys Leu Ala Ala Asn Ala Phe Leu Ala 210 215 220 Gln Arg Ile Ser Ser Val Asn Ala Met Ser Ala Leu Cys Glu Ala Thr 225 230 235 240 Gly Ala Asp Val Thr Gln Val Ala His Ala Val Gly Thr Asp Thr Arg 245 250 255 Ile Gly Pro Lys Phe Leu Asn Ala Ser Val Gly Phe Gly Gly Ser Cys 260 265 270 Phe Gln Lys Asp Ile Leu Asn Leu Ile Tyr Ile Cys Glu Cys Asn Gly 275 280 285 Leu Pro Glu Ala Ala Asn Tyr Trp Lys Gln Val Val Lys Val Asn Asp 290 295 300 Tyr Gln Lys Ile Arg Phe Ala Asn Arg Val Val Ser Ser Met Phe Asn 305 310 315 320 Thr Val Ser Gly Lys Lys Ile Ala Ile Leu Gly Phe Ala Phe Lys Lys 325 330 335 Asp Thr Gly Asp Thr Arg Glu Thr Pro Ala Ile Asp Val Cys Asn Arg 340 345 350 Leu Val Ala Asp Lys Ala Lys Leu Ser Ile Tyr Asp Pro Gln Val Leu 355 360 365 Glu Glu Gln Ile Arg Arg Asp Leu Ser Met Ala Arg Phe Asp Trp Asp 370 375 380 His Pro Val Pro Leu Gln Gln Ile Lys Ala Glu Gly Ile Ser Glu Gln 385 390 395 400 Val Asn Val Val Ser Asp Ala Tyr Glu Ala Thr Lys Asp Ala His Gly 405 410 415 Leu Cys Val Leu Thr Glu Trp Asp Glu Phe Lys Ser Leu Asp Phe Lys 420 425 430 Lys Ile Phe Asp Asn Met Gln Lys Pro Ala Phe Val Phe Asp Gly Arg 435 440 445 Asn Val Val Asp Ala Val Lys Leu Arg Glu Ile Gly Phe Ile Val Tyr 450 455 460 Ser Ile Gly Lys Pro Leu Asp Ser Trp Leu Lys Asp Met Pro Ala Val 465 470 475 480 Ala <210> 40 <211> 389 <212> PRT <213> Chlorella virus <220> <223> amino acid sequence of UDP-Glucose dehydrogenase (HASB) <400> 40 Met Ser Arg Ile Ala Val Val Gly Cys Gly Tyr Val Gly Thr Ala Cys 1 5 10 15 Ala Val Leu Leu Ala Gln Lys Asn Glu Val Ile Val Leu Asp Ile Ser 20 25 30 Glu Asp Arg Val Gln Leu Ile Lys Asn Lys Lys Ser Pro Ile Glu Asp 35 40 45 Lys Glu Ile Glu Glu Phe Leu Glu Thr Lys Asp Leu Asn Leu Thr Ala 50 55 60 Thr Thr Asp Lys Val Leu Ala Tyr Glu Asn Ala Glu Phe Val Ile Ile 65 70 75 80 Ala Thr Pro Thr Asp Tyr Asp Val Val Thr Arg Tyr Phe Asn Thr Lys 85 90 95 Ser Val Glu Asn Val Ile Gly Asp Val Ile Lys Asn Thr Gln Thr His 100 105 110 Pro Thr Ile Val Ile Lys Ser Thr Ile Pro Ile Gly Phe Val Asp Lys 115 120 125 Val Arg Glu Gln Phe Asp Tyr Gln Asn Ile Ile Phe Ser Pro Glu Phe 130 135 140 Leu Arg Glu Gly Arg Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile 145 150 155 160 Ile Val Gly Asp Asp Ser Pro Ile Ala Leu Lys Phe Ala Asn Leu Leu 165 170 175 Val Glu Gly Ser Lys Thr Pro Leu Ala Pro Val Leu Thr Met Gly Thr 180 185 190 Arg Glu Ala Glu Ala Val Lys Leu Phe Ser Asn Thr Tyr Leu Ala Met 195 200 205 Arg Val Ala Tyr Phe Asn Glu Leu Asp Thr Phe Ala Met Ser His Gly 210 215 220 Met Asn Ala Lys Glu Ile Ile Asp Gly Val Thr Leu Glu Pro Arg Ile 225 230 235 240 Gly Gln Gly Tyr Ser Asn Pro Ser Phe Gly Tyr Gly Ala Tyr Cys Phe 245 250 255 Pro Lys Asp Thr Lys Gln Leu Leu Ala Asn Phe Glu Gly Val Pro Gln 260 265 270 Asp Ile Ile Gly Ala Ile Val Glu Ser Asn Glu Thr Arg Lys Glu Val 275 280 285 Ile Val Ser Glu Val Glu Asn Arg Phe Pro Thr Thr Val Gly Val Tyr 290 295 300 Lys Leu Ala Ala Lys Ala Gly Ser Asp Asn Phe Arg Ser Ser Ala Ile 305 310 315 320 Val Asp Ile Met Glu Arg Leu Ala Asn Lys Gly Tyr His Ile Lys Ile 325 330 335 Phe Glu Pro Thr Val Glu Gln Phe Glu Asn Phe Glu Val Asp Asn Asn 340 345 350 Leu Thr Thr Phe Ala Thr Glu Ser Asp Val Ile Ile Ala Asn Arg Val 355 360 365 Pro Val Glu His Arg Ile Leu Phe Gly Lys Lys Leu Ile Thr Arg Asp 370 375 380 Val Tyr Gly Asp Asn 385 <210> 41 <211> 401 <212> PRT <213> Streptococcus <220> <223> amino acid sequence of UDP-Glucose dehydrogenase (HASB) <400> 41 Met Lys Ile Ser Val Ala Gly Ser Gly Tyr Val Gly Leu Ser Leu Ser 1 5 10 15 Ile Leu Leu Ala Gln His Asn Asp Val Thr Val Val Asp Ile Ile Asp 20 25 30 Glu Lys Val Arg Leu Ile Asn Gln Gly Ile Ser Pro Ile Lys Asp Ala 35 40 45 Asp Ile Glu Glu Tyr Leu Lys Asn Ala Pro Leu Asn Leu Thr Ala Thr 50 55 60 Leu Asp Gly Ala Ser Ala Tyr Ser Asn Ala Asp Leu Ile Ile Ile Ala 65 70 75 80 Thr Pro Thr Asn Tyr Asp Ser Glu Arg Asn Tyr Phe Asp Thr Arg His 85 90 95 Val Glu Glu Val Ile Glu Gln Val Leu Asp Leu Asn Ala Ser Ala Thr 100 105 110 Ile Ile Ile Lys Ser Thr Ile Pro Leu Gly Phe Ile Lys His Val Arg 115 120 125 Glu Lys Tyr Gln Thr Asp Arg Ile Ile Phe Ser Pro Glu Phe Leu Arg 130 135 140 Glu Ser Lys Ala Leu Tyr Asp Asn Leu Tyr Pro Ser Arg Ile Ile Val 145 150 155 160 Ser Tyr Glu Lys Asp Asp Ser Pro Arg Val Ile Gln Ala Ala Lys Ala 165 170 175 Phe Ala Gly Leu Leu Lys Glu Gly Ala Lys Ser Lys Asp Thr Pro Val 180 185 190 Leu Phe Met Gly Ser Gln Glu Ala Glu Ala Val Lys Leu Phe Ala Asn 195 200 205 Thr Phe Leu Ala Met Arg Val Ser Tyr Phe Asn Glu Leu Asp Thr Tyr 210 215 220 Ser Glu Ser Lys Gly Leu Asp Ala Gln Arg Val Ile Glu Gly Val Cys 225 230 235 240 His Asp Gln Arg Ile Gly Asn His Tyr Asn Asn Pro Ser Phe Gly Tyr 245 250 255 Gly Gly Tyr Cys Leu Pro Lys Asp Ser Lys Gln Leu Leu Ala Asn Tyr 260 265 270 Arg Gly Ile Pro Gln Ser Leu Met Ser Ala Ile Val Glu Ser Asn Lys 275 280 285 Ile Arg Lys Ser Tyr Leu Ala Glu Gln Ile Leu Asp Arg Ala Ser Ser 290 295 300 Gln Lys Gln Ala Gly Val Pro Leu Thr Ile Gly Phe Tyr Arg Leu Ile 305 310 315 320 Met Lys Ser Asn Ser Asp Asn Phe Arg Glu Ser Ala Ile Lys Asp Ile 325 330 335 Ile Asp Ile Ile Asn Asp Tyr Gly Val Asn Ile Val Ile Tyr Glu Pro 340 345 350 Met Leu Gly Glu Asp Ile Gly Tyr Arg Val Val Lys Asp Leu Glu Gln 355 360 365 Phe Lys Asn Glu Ser Thr Ile Ile Val Ser Asn Arg Phe Glu Asp Asp 370 375 380 Leu Gly Asp Val Ile Asp Lys Val Tyr Thr Arg Asp Val Phe Gly Arg 385 390 395 400 Asp <210> 42 <211> 1026 <212> DNA <213> Pseudomonas aeruginosa <220> <223> nucleic acid sequence of UDP-glucose-4-epimerase (GNE1) <400> 42 atgatgtccc gttacgagga acttcgtaaa gagctgcctg cacagccgaa ggtatggttg 60 atcactggtg tcgcgggctt catcgggtca aatctgctag agaccttgct taaattggat 120 cagaaggttg ttggcttgga caactttgca actggccacc agaggaatct ggacgaggtg 180 aggtcattgg tttctgagaa acagtggagc aactttaagt ttattcaagg ggacattaga 240 aatctggacg actgcaacaa cgcatgtgca ggcgtcgatt atgtcttaca ccaggcagca 300 ttgggcagtg tgccgaggtc tataaacgac cctataacat cgaatgcaac taacatagac 360 ggtttcttga acatgctgat tgcagcgagg gatgcaaaag ttcagtcttt tacctatgcc 420 gcttcatcct ctacatacgg ggatcacccc ggtttgccaa aggtggaaga cactatcggc 480 aagcctctat ctccatacgc tgtgacgaag tatgttaatg agttgtacgc agacgtgttt 540 tcacgttgtt atggattttc aaccatcggt ctgagatact ttaacgtctt cggccgtaga 600 caagatccga atggggcata cgccgccgta atccctaagt ggacatcctc aatgatacag 660 ggtgacgacg tctacattaa cggagatgga gagacatcac gtgacttctg ctacatagaa 720 aacacagttc aagcaaactt attagccgca acggccggcc tagacgccag aaaccaggtg 780 tataatatcg cggtgggtgg tagaacgtca ctaaatcagc ttttcttcgc cttgagagac 840 ggtctagctg agaacggcgt tagctaccat agggaaccag tttataggga ttttagagaa 900 ggagatgtga gacacagctt ggcagatatt tccaaggcgg ctaaacttct tgggtatgct 960 cctaaatatg acgtatcagc aggggtggcg cttgcaatgc catggtatat aatgtttctt 1020 aagtaa 1026 <210> 43 <211> 1020 <212> DNA <213> Pasteurella multocida <220> <223> nucleic acid sequence of UDP-glucose-4-epimerase (KFOA) <400> 43 atgaacattc tagtgaccgg cggtgctggc tatatcggct cccataccag tttatgctta 60 ctgaataaag gatataacgt ggtcatcatt gacaacctga tcaatagttc atgcgagtcg 120 atccgtagga tagaactgat agctaagaag aaggtcacct tctacgagct gaacattaat 180 aatgaaaagg aagtgaacca gatccttaag aaacacaaat tcgattgcat aatgcacttc 240 gcaggtgcca agtcggtggc cgagtcacta attaagccaa ttttctacta tgacaacaac 300 gtctctggaa ctttgcagct gattaattgt gctataaaga acgacgtcgc aaatttcatc 360 ttttcttcat cagcaactgt ttatggtgag tcaaagatta tgccagtgac agaggactgc 420 cacatcggcg gcacactaaa tccatacgga acatcaaaat acatttcaga gttgatgata 480 agggacatcg ccaagaagta ctcagacact aatttcttat gcttgcgtta tttcaatcct 540 accggggccc acgagtccgg catgatcggc gagtctccag ctgatatacc atccaatctg 600 gtgccttaca ttttacaggt ggccatgggc aagttggaga agttaatggt attcggcggt 660 gactacccaa caaaggacgg cacgggtgtg agagactata ttcacgtgat ggacctagcg 720 gaaggtcatg tggcagccct aagctacctt ttcagagata ataacactaa ttaccatgta 780 ttcaatctgg gcacgggtaa gggctacagt gtccttgaat tagtaagcac attcgagaaa 840 atctcgggtg tcaggattcc atacgagatc gtttctcgtc gtgatgggga catcgcagag 900 agttggtcat caccggagaa agcgaacaag tacttaaatt ggaaggccaa gagggagctt 960 gagacaatgc tagaagacgc atggcgttgg cagatgaaga acccgaatgg ttacatataa 1020 <210> 44 <211> 1021 <212> DNA <213> Escherichia coli <220> <223> nucleic acid sequence of UDP-glucose-4-epimerase (KFOA) <400> 44 aatgaacatt ctagtgaccg gcggtgctgg ctatatcggc tcccatacca gtttatgctt 60 actgaataaa ggatataacg tggtcatcat tgacaacctg atcaatagtt catgcgagtc 120 gatccgtagg atagaactga tagctaagaa gaaggtcacc ttctacgagc tgaacattaa 180 taatgaaaag gaagtgaacc agatccttaa gaaacacaaa ttcgattgca taatgcactt 240 cgcaggtgcc aagtcggtgg ccgagtcact aattaagcca attttctact atgacaacaa 300 cgtctctgga actttgcagc tgattaattg tgctataaag aacgacgtcg caaatttcat 360 cttttcttca tcagcaactg tttatggtga gtcaaagatt atgccagtga cagaggactg 420 ccacatcggc ggcacactaa atccatacgg aacatcaaaa tacatttcag agttgatgat 480 aagggacatc gccaagaagt actcagacac taatttctta tgcttgcgtt atttcaatcc 540 taccggggcc cacgagtccg gcatgatcgg cgagtctcca gctgatatac catccaatct 600 ggtgccttac attttacagg tggccatggg caagttggag aagttaatgg tattcggcgg 660 tgactaccca acaaaggacg gcacgggtgt gagagactat attcacgtga tggacctagc 720 ggaaggtcat gtggcagccc taagctacct tttcagagat aataacacta attaccatgt 780 attcaatctg ggcacgggta agggctacag tgtccttgaa ttagtaagca cattcgagaa 840 aatctcgggt gtcaggattc catacgagat cgtttctcgt cgtgatgggg acatcgcaga 900 gagttggtca tcaccggaga aagcgaacaa gtacttaaat tggaaggcca agagggagct 960 tgagacaatg ctagaagacg catggcgttg gcagatgaag aacccgaatg gttacatata 1020 a 1021 <210> 45 <211> 341 <212> PRT <213> Pseudomonas aeruginosa <220> <223> amino acid sequence of UDP-glucose-4-epimerase (GNE1) <400> 45 Met Met Ser Arg Tyr Glu Glu Leu Arg Lys Glu Leu Pro Ala Gln Pro 1 5 10 15 Lys Val Trp Leu Ile Thr Gly Val Ala Gly Phe Ile Gly Ser Asn Leu 20 25 30 Leu Glu Thr Leu Leu Lys Leu Asp Gln Lys Val Val Gly Leu Asp Asn 35 40 45 Phe Ala Thr Gly His Gln Arg Asn Leu Asp Glu Val Arg Ser Leu Val 50 55 60 Ser Glu Lys Gln Trp Ser Asn Phe Lys Phe Ile Gln Gly Asp Ile Arg 65 70 75 80 Asn Leu Asp Asp Cys Asn Asn Ala Cys Ala Gly Val Asp Tyr Val Leu 85 90 95 His Gln Ala Ala Leu Gly Ser Val Pro Arg Ser Ile Asn Asp Pro Ile 100 105 110 Thr Ser Asn Ala Thr Asn Ile Asp Gly Phe Leu Asn Met Leu Ile Ala 115 120 125 Ala Arg Asp Ala Lys Val Gln Ser Phe Thr Tyr Ala Ala Ser Ser Ser 130 135 140 Thr Tyr Gly Asp His Pro Gly Leu Pro Lys Val Glu Asp Thr Ile Gly 145 150 155 160 Lys Pro Leu Ser Pro Tyr Ala Val Thr Lys Tyr Val Asn Glu Leu Tyr 165 170 175 Ala Asp Val Phe Ser Arg Cys Tyr Gly Phe Ser Thr Ile Gly Leu Arg 180 185 190 Tyr Phe Asn Val Phe Gly Arg Arg Gln Asp Pro Asn Gly Ala Tyr Ala 195 200 205 Ala Val Ile Pro Lys Trp Thr Ser Ser Met Ile Gln Gly Asp Asp Val 210 215 220 Tyr Ile Asn Gly Asp Gly Glu Thr Ser Arg Asp Phe Cys Tyr Ile Glu 225 230 235 240 Asn Thr Val Gln Ala Asn Leu Leu Ala Ala Thr Ala Gly Leu Asp Ala 245 250 255 Arg Asn Gln Val Tyr Asn Ile Ala Val Gly Gly Arg Thr Ser Leu Asn 260 265 270 Gln Leu Phe Phe Ala Leu Arg Asp Gly Leu Ala Glu Asn Gly Val Ser 275 280 285 Tyr His Arg Glu Pro Val Tyr Arg Asp Phe Arg Glu Gly Asp Val Arg 290 295 300 His Ser Leu Ala Asp Ile Ser Lys Ala Ala Lys Leu Leu Gly Tyr Ala 305 310 315 320 Pro Lys Tyr Asp Val Ser Ala Gly Val Ala Leu Ala Met Pro Trp Tyr 325 330 335 Ile Met Phe Leu Lys 340 <210> 46 <211> 338 <212> PRT <213> Pasteurella multocida <220> <223> amino acid sequence of UDP-glucose-4-epimerase (KFOA) <400> 46 Met Ala Ile Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Thr 1 5 10 15 Val Val Glu Leu Leu Asn Ala Asn Lys Asp Val Val Val Leu Asp Asn 20 25 30 Leu Cys Asn Ser Ser Pro Lys Ser Leu Glu Arg Val Ala Gln Ile Thr 35 40 45 Gly Lys Gln Val Lys Phe Tyr Gln Gly Asp Ile Leu Asp Thr Ala Leu 50 55 60 Leu Gln Lys Ile Phe Ala Glu Asn Gln Ile Gln Ser Val Ile His Phe 65 70 75 80 Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln Lys Pro Ala Glu Tyr 85 90 95 Tyr Met Asn Asn Val Thr Gly Ser Leu Val Leu Ile Gln Glu Met Lys 100 105 110 Lys Ala Gly Val Trp Asn Phe Val Phe Ser Ser Ser Ala Thr Val Tyr 115 120 125 Gly Asp Pro Glu Ile Ile Pro Ile Thr Glu Ser Cys Lys Val Gly Gly 130 135 140 Thr Thr Asn Pro Tyr Gly Thr Ser Lys Phe Met Val Glu Gln Ile Leu 145 150 155 160 Lys Asp Ile Ala Lys Ala Thr Pro Glu Phe Ser Ile Thr Ile Leu Arg 165 170 175 Tyr Phe Asn Pro Val Gly Ala His Glu Ser Gly Leu Ile Gly Glu Asp 180 185 190 Pro Asn Gly Ile Pro Asn Asn Leu Leu Pro Tyr Ile Ser Gln Val Ala 195 200 205 Ile Gly Lys Leu Pro Gln Leu Ser Val Phe Gly Ser Asp Tyr Glu Thr 210 215 220 His Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Val Asp Leu Ala 225 230 235 240 Ile Gly His Leu Lys Ala Leu Asp Arg His Glu Gly Asp Ala Gly Leu 245 250 255 His Ile Tyr Asn Leu Gly Thr Gly Ser Gly Tyr Ser Val Leu Asp Met 260 265 270 Val Lys Ala Phe Glu Lys Val Asn Asp Ile Lys Ile Pro Tyr Lys Leu 275 280 285 Val Asp Arg Arg Pro Gly Asp Ile Ala Thr Cys Tyr Ser Asp Pro Ser 290 295 300 Leu Ala Lys Thr Glu Leu Asn Trp Thr Ala Ala Arg Gly Leu Glu Gln 305 310 315 320 Met Met Lys Asp Thr Trp His Trp Gln Lys Lys Asn Pro Lys Gly Tyr 325 330 335 Arg Asp <210> 47 <211> 339 <212> PRT <213> Escherichia coli <220> <223> amino acid sequence of UDP-glucose-4-epimerase (KFOA) <400> 47 Met Asn Ile Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Thr 1 5 10 15 Ser Leu Cys Leu Leu Asn Lys Gly Tyr Asn Val Val Ile Ile Asp Asn 20 25 30 Leu Ile Asn Ser Ser Cys Glu Ser Ile Arg Arg Ile Glu Leu Ile Ala 35 40 45 Lys Lys Lys Val Thr Phe Tyr Glu Leu Asn Ile Asn Asn Glu Lys Glu 50 55 60 Val Asn Gln Ile Leu Lys Lys His Lys Phe Asp Cys Ile Met His Phe 65 70 75 80 Ala Gly Ala Lys Ser Val Ala Glu Ser Leu Ile Lys Pro Ile Phe Tyr 85 90 95 Tyr Asp Asn Asn Val Ser Gly Thr Leu Gln Leu Ile Asn Cys Ala Ile 100 105 110 Lys Asn Asp Val Ala Asn Phe Ile Phe Ser Ser Ser Ala Thr Val Tyr 115 120 125 Gly Glu Ser Lys Ile Met Pro Val Thr Glu Asp Cys His Ile Gly Gly 130 135 140 Thr Leu Asn Pro Tyr Gly Thr Ser Lys Tyr Ile Ser Glu Leu Met Ile 145 150 155 160 Arg Asp Ile Ala Lys Lys Tyr Ser Asp Thr Asn Phe Leu Cys Leu Arg 165 170 175 Tyr Phe Asn Pro Thr Gly Ala His Glu Ser Gly Met Ile Gly Glu Ser 180 185 190 Pro Ala Asp Ile Pro Ser Asn Leu Val Pro Tyr Ile Leu Gln Val Ala 195 200 205 Met Gly Lys Leu Glu Lys Leu Met Val Phe Gly Gly Asp Tyr Pro Thr 210 215 220 Lys Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Met Asp Leu Ala 225 230 235 240 Glu Gly His Val Ala Ala Leu Ser Tyr Leu Phe Arg Asp Asn Asn Thr 245 250 255 Asn Tyr His Val Phe Asn Leu Gly Thr Gly Lys Gly Tyr Ser Val Leu 260 265 270 Glu Leu Val Ser Thr Phe Glu Lys Ile Ser Gly Val Arg Ile Pro Tyr 275 280 285 Glu Ile Val Ser Arg Arg Asp Gly Asp Ile Ala Glu Ser Trp Ser Ser 290 295 300 Pro Glu Lys Ala Asn Lys Tyr Leu Asn Trp Lys Ala Lys Arg Glu Leu 305 310 315 320 Glu Thr Met Leu Glu Asp Ala Trp Arg Trp Gln Met Lys Asn Pro Asn 325 330 335 Gly Tyr Ile <210> 48 <211> 1197 <212> DNA <213> Cupiennius salei <220> <223> reencoded nucleic acid sequence of hyaluronidase (HYAL) originating from Cupiennius salei with a N-terminal secretion signal <400> 48 atgcaattca gcactgttgc atcagttgca tttgtcgccc tggcgaattt tgtagccgcg 60 ttcaagattt actggaacgt cccaactttt cagtgcacgc ataactacaa aatcgattat 120 gtcaaattgt tgtccactta cgggatacag gtcaatgatg gcggtaagtt tcaaggaaac 180 caagtgacta tcttttatga aacccagttg ggtttgtatc cacgaatcct aaaatctggt 240 aaaatggaaa acggcggaat ccctcaacgc ggtaactttg agaaacacct agaaaaggca 300 agcacggacc tccagaaagt gatcccttgg aaagagttta gcggattagg tgtgatagat 360 tgggaggctt ggagacccac atgggaattt aactgggaac cgttgaggat atatcaaacc 420 gaatcaatta agagagctaa agaactacac cctaccgcaa acgattccgc agtaaaagaa 480 attgcagagc ggcaatggga agattcagcc aagttataca tgttagaaac actgcggctg 540 gcaaagaaac ttcgacctca agcgccttgg tgttactact tatttcctga ttgctataat 600 tacgtcggaa agaaaccaaa agatttccaa tgtagtgcct cgatacgtaa aggtaacgat 660 aagctaagct ggttgtggaa agattctacg gcattgtgtc catcgatata cgtatatgaa 720 tcacaattag acaggtattc ttttgaacaa aggacatggc gcgacaatga gaaacttcgg 780 gaagcgttgc gtgtagccac gagaacctct aaaatatacc catacgttaa ctatttcgat 840 aaggagctta taccggagca agaagtatgg agaatgcttg cgcaggcagc tgctgtcggt 900 ggcagtggtg cggtaatttg gggctcatct gctgcagttg catctgaaga gttatgtaaa 960 tctttaaaac agtatattat tgaaacgctt gggccggcgg cagagaaggt ggcttggcgt 1020 agtgacttat gcagcaaaga aatttgtaat aatcagggtc gctgcacatt cccggacgat 1080 gattatgcaa acgcatggaa attatttaca gatgatactg ttaagtttta tgctggtaat 1140 attacatgta ggtgctccga gaattattct ggtcgtttct gcgaaaagaa gaattaa 1197 <210> 49 <211> 1218 <212> DNA <213> Tityus serrulatus <220> <223> reencoded nucleic acid sequence of hyaluronidase (HYAL) originating from Tityus serrulatus with a N-terminal secretion signal <400> 49 atgcaattct ctactgtcgc ttccgttgct ttcgtcgctt tggctaactt tgttgccgct 60 gctgatttta aagtttactg ggaagtgcct tccttccttt gttctaaacg ttttaaaatt 120 aatgtaacgg aagttttaac aagtcacgag attcttgtca atcagggtga gagtttcaac 180 ggtgacaaga tagtaatctt ttacgaaaac caattgggga agtacccgca tattgactca 240 aacaatgtgg agatcaatgg aggaatactt caagtagccg atttggcgaa gcatttgaaa 300 gtagccaagg ataatatcac taaattcgtc ccgaatccta atttcaacgg tgtcggagtg 360 atcgactggg aagcttggcg gccatcatgg gaatttaact ggggtaagtt aaaagtatat 420 aaagaaaaga gcattgactt ggtcaagtcg aaacatccgg agtggccctc cgacagggtt 480 gaaaaggttg ctaaagagga gtgggaggag agtgccaaag aatggatggt gaagaccctg 540 aagttagcac aggaaatgcg accgaacgca gtttggtgct attatctatt ccctgactgc 600 tacaattatt tcggtaagga tcaaccctct caattcagct gctcgtctcg aattcagaag 660 gaaaattctc gtctttcttg gctctggaat caatcaacag ccatttgcct aagcatttat 720 atccaggaat cccatgttac caaatataat atgtcccagc ggacatggtg gatcgatgcg 780 agattaagag aagcaattcg agtcagcgaa cacagaccaa acatacccat ctacccttac 840 attaattata ttctacctgg aactaatcaa actgtaccag caatggactt taaaaggaca 900 ctgggtcaaa tagctagcct cggcctagat ggtgctttgt tatggggatc tagctatcat 960 gttttaacag aatctcaatg caaaatcact tctgattatg tgaaatcagt gattgctcct 1020 accgtggcta ctgtcgttct caatacaaac agatgctcac agataatttg taagggtcgc 1080 ggcaactgtg tttggcctga agaaccattt agttcttgga aatacttagt tgaccccaaa 1140 atgccagtgt tcaagccaac caacatccac tgtaaatgta aaggttacct aggtagatac 1200 tgtgagatcc caaagtaa 1218 <210> 50 <211> 1308 <212> DNA <213> Bos taurus <220> <223> reencoded nucleic acid sequence of hyaluronidase (HYAL) originating from Bos Taurus with a N-terminal secretion signal <400> 50 atgcaatttt ctactgttgc ttctgtcgct ttcgtagcac tggccaattt tgtagctgct 60 ggaagccgtg accccgttgt cccaaaccag cctttcacaa caatatggaa cgcaaatacg 120 gagtggtgca tgaagaagca tggagtggac gtcgatattt caatcttcga cgtggtcact 180 aatccaggac agacatttag aggtccaaat atgacaatat tttacagttc acaattgggg 240 acctaccctt actacacatc cgcgggtgag ccagtattcg gtggtctacc ccagaacgca 300 agtttgaatg cccacttggc taggacattt caagatattc tggcagccat gccagagccc 360 aggttctcag gtttggctgt catagactgg gaagcgtgga gacctcgttg ggcatttaat 420 tgggatacga aagacatata caggcagagg tccagagcat tggttcagaa acagcacccg 480 gattggctgg cgccacgtgt tgaggccgca gcgcaagacc agttcgaggg cgctgctgag 540 gagtggatgg ccggcacact taaattaggg caggcgcttc gtcctcaagg cttgtggggt 600 ttctataact tcccggagtg ttacaattat gacttcaaat ctccgaacta cacaggaagg 660 tgccctttaa acatctgtgc gcagaacgac cagttaggtt ggctatgggg tcaaagtcgt 720 gcactatatc catcaatcta cttgccggcg gctttggaag gcacgaagaa gactcagatg 780 ttcgttcagc accgtgtagc agaggcattt agggtggcgg caggcgctgg tgaccccaag 840 ctacccgtct taccctatat gcagctattt tacgatatga caaaccactt cttgcccgcg 900 gaagaactgg aacatagctt aggtgagtca gcagcgcagg gtgcagccgg ggttgttctg 960 tgggtttcct ggttatcaac ttcgacaaag gaaagctgtc aagcaatcaa ggaatacgta 1020 gatactacgt tgggcccttc aatcttgaac gtcacatctg gtgccaggtt gtgttctcag 1080 gtattgtgca gtggccacgg gagatgcgcg agaagacctt catatcctaa agccaggctg 1140 attctaaatt caacgtcgtt ctccatcaag ccaacacccg gtggtggtcc attgacactt 1200 caaggcgctt tgagtttgga agacagatta cgtatggcag ttgagtttga atgcagatgt 1260 tacagaggat ggagagggac acgttgtgag cagtggggca tgtggtaa 1308 <210> 51 <211> 1137 <212> DNA <213> Apis mellifera <220> <223> reencoded nucleic acid sequence of hyaluronidase (HYAL) originating from Apis mellifera with a N-terminal secretion signal <400> 51 atgcagtttt ccacagttgc ttccgtagct ttcgtagctt tagcaaattt tgtcgcagct 60 ttgttgttgg gcttcgttca gtctactcca gataataata agactgtgcg tgaatttaac 120 gtgtattgga acgttcctac attcatgtgc cataagtacg ggttgagatt cgaagaggtg 180 agcgagaagt atggcatttt gcaaaattgg atggacaaat tcagaggaga ggaaattgcg 240 atcttatacg accccggcat gttccccgca ctgttgaaag accccaatgg gaatgtagta 300 gctaggaatg gcggagtgcc ccagcttggc aatttaacta aacatttaca ggtgttcagg 360 gaccacctaa tcaatcagat tccagataaa agctttcccg gagttggtgt aatagatttc 420 gagtcatgga gacctatttt cagacagaac tgggcctctt tgcaaccgta caagaagcta 480 tcagtcgaag tcgtacgtcg tgagcaccca ttctgggatg atcagagagt ggagcaagag 540 gcgaaaagaa gatttgaaaa gtacggccag cttttcatgg aagagacctt gaaagccgca 600 aaacgtatgc gtcctgcagc caattggggc tactacgctt acccttattg ctacaacctg 660 accccaaacc agccctcagc tcaatgcgag gctacaacaa tgcaggagaa cgacaagatg 720 tcatggttat tcgagtccga ggacgtctta ctgcccagcg tctatttgag gtggaacctg 780 actagcggag agagggttgg tttagttggt ggtcgtgtca aggaagccct gagaatagct 840 cgtcagatga ccacctctag gaagaaggtc ctaccatact actggtacaa ataccaggat 900 aggagagaca cggacctaag tagggctgat cttgaggcga ctctacgtaa aatcacggac 960 ttaggagccg acggtttcat aatctgggga tcttccgatg acatcaacac caaggcaaaa 1020 tgtttgcagt tcagagaata tttgaataac gagttgggcc cggcagtgaa gagaatagcc 1080 ttaaacaata atgcgaatga caggctaaca gtggatgtgt ctgttgacca ggtttaa 1137 <210> 52 <211> 1305 <212> DNA <213> Macaca mulatta <220> <223> reencoded nucleic acid sequence of hyaluronidase (HYAL) originating from Macaca mulatta with a N-terminal secretion signal <400> 52 atgcaattca gtactgtcgc tagcgtcgcc tttgtggctc ttgcaaattt cgtcgctgct 60 tcacgtgggc ctttattgcc gaacagacca tttgcaacgg tatggaatgc taacacccaa 120 tggtgtttag agaggcactc agtagacgtc gatgtctcca tatttgatgt tgtagcaaac 180 cccggccaga cttttcgtgg gccggacatg actattttct attccagtca gctaggtact 240 tacccttatt ataccccgac gggtgaacct gtctttggtg gccttccaca gaacgcatca 300 cttatagcgc acttggctag gactttccag gatatattgg cagctatacc agcccccgac 360 ttttctgggc tagccgtaat tgactgggaa gcatggagac cgagatgggc atttaactgg 420 gacacgaaag acatttacag gcaaaggtcc cgtgccttag tccaagcaca gcatcccgac 480 tggccagtta ctcaagttga ggctgtggca caagaccagt tccagggtgc tgcgagggca 540 tggatggcag gaaccttgca attaggccgt gctttaagac caaggggact atggggcttc 600 tacggttttc ccgattgcta caattacgat ttcctatctc ctaattacac agggcaatgc 660 ccatcaggga tcagagcaca aaatgaccag ttaggatggt tgtggggtca gagtcgtgca 720 ttatatccca gtatctacat gccggctgtt ttggaaggaa caggcaaatc ccaaatgtac 780 gtgcagcaca gggtcgcgga agcctttagg gttgctgttg cagcaggcga cccaaactta 840 cccgtcctac cgtacgtcca gattttctac gatatgacca accactttct tccattggac 900 gagttagagc atagtcttgg agaatcagcg gctcagggcg cagcaggagt cgtgttatgg 960 gtgtcatggg agaatactag aacaaaagaa tcttgccagg caattaaaga atatatggac 1020 actaccttgg ggccttttat tctgaacgtc acttcgggtg cgttgttatg ctcgcaagcc 1080 ttatgttcaa gccatggtcg ttgtgtccgt cgtccctcac atccaaaagc cttgctaatc 1140 cttaatcccg caagctttag tattcagttg acaccagatg gtggtccctt gtcgttaagg 1200 ggagcattgt cacttgagga ccaggcacaa atggctgttg aattcaaatg caggtgctac 1260 cccgggtggc aaggcccttg gtgtgagcag aagagtatgt ggtaa 1305 <210> 53 <211> 1083 <212> DNA <213> Vespa magnifica <220> <223> reencoded nucleic acid sequence of hyaluronidase (HYAL) originating from Vespa magnifica with a N-terminal secretion signal <400> 53 atgcaatttt ctacagtggc aagtgttgca ttcgttgcac tagccaactt tgtggcggca 60 gatagctgtg ggtcaaactg cgaaaagagt gagagaccga aaagggtctt caacatttac 120 tggaacgtac ctacattcat gtgtcaccag tacggactat actttgacga ggtcacgaat 180 tttaatataa agcacaacag caaagacaat tttcaagggg acaagatcgc gatcttttat 240 gaccccgggg agtttcccgc tctgctgcca ctaaactatg gtaagtacaa gatcaggaat 300 ggtggtgttc cacaagaggg taacatcacc atccatctgc agagattcat agagtaccta 360 gataagacct atccgaaccg taacttttca ggcatcggtg tgatcgattt cgagaggtgg 420 agaccaattt tcagacagaa ttggggtaat atgaagattt acaagaactt ctccatcgat 480 cttgtgcgta aagagcatcc tttctggaat aagaaaatga tcgagttgga agcttctaaa 540 agattcgaga aatacgcccg tctgttcatg gaagaaacat taaagttggc taagaaaact 600 agaaaacagg ccgattgggg ctactacggt tacccctatt gcttcaacat gtctcctact 660 aatttcgttc ctgactgcga tgtcacagct agggatgaga acaacgagat gtcttggttg 720 tttaacaacc agaatgtcct attaccaagt gtatacatta ggagagagct aactcctgac 780 cagaggattg ggcttgtaca ggggagagtg aaggaagctg tgagaatttc aaataaactg 840 aagcactcac ctaaagtctt cagctattgg tggtatgttt accaagacga gaccaacacc 900 ttcttaacgg agaccgacgt caagaagacg tttcaggaga ttgtgatcaa cggtggagat 960 gggattataa tctggggttc gtcctctgat gtaaacagct tgtccaagtg tacgaggtta 1020 agggagtacc tattgacagt cttgggacca attgctgtta acgtgactga agcagtaaac 1080 taa 1083 <210> 54 <211> 1407 <212> DNA <213> Cupiennius salei <220> <223> reencoded nucleic acid sequence of hyaluronidase (HYAL) originating from Cupiennius salei with a N-terminal secretion signal and a C-terminal anchoring signal <400> 54 atgcaattca gcactgttgc atcagttgca tttgtcgccc tggcgaattt tgtagccgcg 60 ttcaagattt actggaacgt cccaactttt cagtgcacgc ataactacaa aatcgattat 120 gtcaaattgt tgtccactta cgggatacag gtcaatgatg gcggtaagtt tcaaggaaac 180 caagtgacta tcttttatga aacccagttg ggtttgtatc cacgaatcct aaaatctggt 240 aaaatggaaa acggcggaat ccctcaacgc ggtaactttg agaaacacct agaaaaggca 300 agcacggacc tccagaaagt gatcccttgg aaagagttta gcggattagg tgtgatagat 360 tgggaggctt ggagacccac atgggaattt aactgggaac cgttgaggat atatcaaacc 420 gaatcaatta agagagctaa agaactacac cctaccgcaa acgattccgc agtaaaagaa 480 attgcagagc ggcaatggga agattcagcc aagttataca tgttagaaac actgcggctg 540 gcaaagaaac ttcgacctca agcgccttgg tgttactact tatttcctga ttgctataat 600 tacgtcggaa agaaaccaaa agatttccaa tgtagtgcct cgatacgtaa aggtaacgat 660 aagctaagct ggttgtggaa agattctacg gcattgtgtc catcgatata cgtatatgaa 720 tcacaattag acaggtattc ttttgaacaa aggacatggc gcgacaatga gaaacttcgg 780 gaagcgttgc gtgtagccac gagaacctct aaaatatacc catacgttaa ctatttcgat 840 aaggagctta taccggagca agaagtatgg agaatgcttg cgcaggcagc tgctgtcggt 900 ggcagtggtg cggtaatttg gggctcatct gctgcagttg catctgaaga gttatgtaaa 960 tctttaaaac agtatattat tgaaacgctt gggccggcgg cagagaaggt ggcttggcgt 1020 agtgacttat gcagcaaaga aatttgtaat aatcagggtc gctgcacatt cccggacgat 1080 gattatgcaa acgcatggaa attatttaca gatgatactg ttaagtttta tgctggtaat 1140 attacatgta ggtgctccga gaattattct ggtcgtttct gcgaaaagaa gaatggatcc 1200 gccatttctc aaatcactga cggtcaaatc caagctacta ccactgctac caccgaagct 1260 accaccactg ctgccccatc ttccaccgtt gaaactgttt ctccatccag caccgaaact 1320 atctctcaac aaactgaaaa tggtgctgct aaggccgctg tcggtatggg tgccggtgct 1380 ctagctgctg ctgctatgtt gttataa 1407 <210> 55 <211> 1428 <212> DNA <213> Tityus serrulatus <220> <223> reencoded nucleic acid sequence of hyaluronidase (HYAL) originating from Tityus serrulatus with a N-terminal secretion signal and a C-terminal anchoring signal <400> 55 atgcaattct ctactgtcgc ttccgttgct ttcgtcgctt tggctaactt tgttgccgct 60 gctgatttta aagtttactg ggaagtgcct tccttccttt gttctaaacg ttttaaaatt 120 aatgtaacgg aagttttaac aagtcacgag attcttgtca atcagggtga gagtttcaac 180 ggtgacaaga tagtaatctt ttacgaaaac caattgggga agtacccgca tattgactca 240 aacaatgtgg agatcaatgg aggaatactt caagtagccg atttggcgaa gcatttgaaa 300 gtagccaagg ataatatcac taaattcgtc ccgaatccta atttcaacgg tgtcggagtg 360 atcgactggg aagcttggcg gccatcatgg gaatttaact ggggtaagtt aaaagtatat 420 aaagaaaaga gcattgactt ggtcaagtcg aaacatccgg agtggccctc cgacagggtt 480 gaaaaggttg ctaaagagga gtgggaggag agtgccaaag aatggatggt gaagaccctg 540 aagttagcac aggaaatgcg accgaacgca gtttggtgct attatctatt ccctgactgc 600 tacaattatt tcggtaagga tcaaccctct caattcagct gctcgtctcg aattcagaag 660 gaaaattctc gtctttcttg gctctggaat caatcaacag ccatttgcct aagcatttat 720 atccaggaat cccatgttac caaatataat atgtcccagc ggacatggtg gatcgatgcg 780 agattaagag aagcaattcg agtcagcgaa cacagaccaa acatacccat ctacccttac 840 attaattata ttctacctgg aactaatcaa actgtaccag caatggactt taaaaggaca 900 ctgggtcaaa tagctagcct cggcctagat ggtgctttgt tatggggatc tagctatcat 960 gttttaacag aatctcaatg caaaatcact tctgattatg tgaaatcagt gattgctcct 1020 accgtggcta ctgtcgttct caatacaaac agatgctcac agataatttg taagggtcgc 1080 ggcaactgtg tttggcctga agaaccattt agttcttgga aatacttagt tgaccccaaa 1140 atgccagtgt tcaagccaac caacatccac tgtaaatgta aaggttacct aggtagatac 1200 tgtgagatcc caaagggatc cgccatttct caaatcactg acggtcaaat ccaagctact 1260 accactgcta ccaccgaagc taccaccact gctgccccat cttccaccgt tgaaactgtt 1320 tctccatcca gcaccgaaac tatctctcaa caaactgaaa atggtgctgc taaggccgct 1380 gtcggtatgg gtgccggtgc tctagctgct gctgctatgt tgttataa 1428 <210> 56 <211> 1518 <212> DNA <213> Bos taurus <220> <223> reencoded nucleic acid sequence of hyaluronidase (HYAL) originating from Bos taurus with a N-terminal secretion signal and a C-terminal anchoring signal <400> 56 atgcaatttt ctactgttgc ttctgtcgct ttcgtagcac tggccaattt tgtagctgct 60 ggaagccgtg accccgttgt cccaaaccag cctttcacaa caatatggaa cgcaaatacg 120 gagtggtgca tgaagaagca tggagtggac gtcgatattt caatcttcga cgtggtcact 180 aatccaggac agacatttag aggtccaaat atgacaatat tttacagttc acaattgggg 240 acctaccctt actacacatc cgcgggtgag ccagtattcg gtggtctacc ccagaacgca 300 agtttgaatg cccacttggc taggacattt caagatattc tggcagccat gccagagccc 360 aggttctcag gtttggctgt catagactgg gaagcgtgga gacctcgttg ggcatttaat 420 tgggatacga aagacatata caggcagagg tccagagcat tggttcagaa acagcacccg 480 gattggctgg cgccacgtgt tgaggccgca gcgcaagacc agttcgaggg cgctgctgag 540 gagtggatgg ccggcacact taaattaggg caggcgcttc gtcctcaagg cttgtggggt 600 ttctataact tcccggagtg ttacaattat gacttcaaat ctccgaacta cacaggaagg 660 tgccctttaa acatctgtgc gcagaacgac cagttaggtt ggctatgggg tcaaagtcgt 720 gcactatatc catcaatcta cttgccggcg gctttggaag gcacgaagaa gactcagatg 780 ttcgttcagc accgtgtagc agaggcattt agggtggcgg caggcgctgg tgaccccaag 840 ctacccgtct taccctatat gcagctattt tacgatatga caaaccactt cttgcccgcg 900 gaagaactgg aacatagctt aggtgagtca gcagcgcagg gtgcagccgg ggttgttctg 960 tgggtttcct ggttatcaac ttcgacaaag gaaagctgtc aagcaatcaa ggaatacgta 1020 gatactacgt tgggcccttc aatcttgaac gtcacatctg gtgccaggtt gtgttctcag 1080 gtattgtgca gtggccacgg gagatgcgcg agaagacctt catatcctaa agccaggctg 1140 attctaaatt caacgtcgtt ctccatcaag ccaacacccg gtggtggtcc attgacactt 1200 caaggcgctt tgagtttgga agacagatta cgtatggcag ttgagtttga atgcagatgt 1260 tacagaggat ggagagggac acgttgtgag cagtggggca tgtggggatc cgccatttct 1320 caaatcactg acggtcaaat ccaagctact accactgcta ccaccgaagc taccaccact 1380 gctgccccat cttccaccgt tgaaactgtt tctccatcca gcaccgaaac tatctctcaa 1440 caaactgaaa atggtgctgc taaggccgct gtcggtatgg gtgccggtgc tctagctgct 1500 gctgctatgt tgttataa 1518 <210> 57 <211> 1347 <212> DNA <213> Apis mellifera <220> <223> reencoded nucleic acid sequence of hyaluronidase (HYAL) originating from Apis mellifera with a N-terminal secretion signal and a C-terminal anchoring signal <400> 57 atgcagtttt ccacagttgc ttccgtagct ttcgtagctt tagcaaattt tgtcgcagct 60 ttgttgttgg gcttcgttca gtctactcca gataataata agactgtgcg tgaatttaac 120 gtgtattgga acgttcctac attcatgtgc cataagtacg ggttgagatt cgaagaggtg 180 agcgagaagt atggcatttt gcaaaattgg atggacaaat tcagaggaga ggaaattgcg 240 atcttatacg accccggcat gttccccgca ctgttgaaag accccaatgg gaatgtagta 300 gctaggaatg gcggagtgcc ccagcttggc aatttaacta aacatttaca ggtgttcagg 360 gaccacctaa tcaatcagat tccagataaa agctttcccg gagttggtgt aatagatttc 420 gagtcatgga gacctatttt cagacagaac tgggcctctt tgcaaccgta caagaagcta 480 tcagtcgaag tcgtacgtcg tgagcaccca ttctgggatg atcagagagt ggagcaagag 540 gcgaaaagaa gatttgaaaa gtacggccag cttttcatgg aagagacctt gaaagccgca 600 aaacgtatgc gtcctgcagc caattggggc tactacgctt acccttattg ctacaacctg 660 accccaaacc agccctcagc tcaatgcgag gctacaacaa tgcaggagaa cgacaagatg 720 tcatggttat tcgagtccga ggacgtctta ctgcccagcg tctatttgag gtggaacctg 780 actagcggag agagggttgg tttagttggt ggtcgtgtca aggaagccct gagaatagct 840 cgtcagatga ccacctctag gaagaaggtc ctaccatact actggtacaa ataccaggat 900 aggagagaca cggacctaag tagggctgat cttgaggcga ctctacgtaa aatcacggac 960 ttaggagccg acggtttcat aatctgggga tcttccgatg acatcaacac caaggcaaaa 1020 tgtttgcagt tcagagaata tttgaataac gagttgggcc cggcagtgaa gagaatagcc 1080 ttaaacaata atgcgaatga caggctaaca gtggatgtgt ctgttgacca ggttggatcc 1140 gccatttctc aaatcactga cggtcaaatc caagctacta ccactgctac caccgaagct 1200 accaccactg ctgccccatc ttccaccgtt gaaactgttt ctccatccag caccgaaact 1260 atctctcaac aaactgaaaa tggtgctgct aaggccgctg tcggtatggg tgccggtgct 1320 ctagctgctg ctgctatgtt gttataa 1347 <210> 58 <211> 1515 <212> DNA <213> Macaca mulatta <220> <223> reencoded nucleic acid sequence of hyaluronidase (HYAL) originating from Macaca mulatta with a N-terminal secretion signal and a C-terminal anchoring signal <400> 58 atgcaattca gtactgtcgc tagcgtcgcc tttgtggctc ttgcaaattt cgtcgctgct 60 tcacgtgggc ctttattgcc gaacagacca tttgcaacgg tatggaatgc taacacccaa 120 tggtgtttag agaggcactc agtagacgtc gatgtctcca tatttgatgt tgtagcaaac 180 cccggccaga cttttcgtgg gccggacatg actattttct attccagtca gctaggtact 240 tacccttatt ataccccgac gggtgaacct gtctttggtg gccttccaca gaacgcatca 300 cttatagcgc acttggctag gactttccag gatatattgg cagctatacc agcccccgac 360 ttttctgggc tagccgtaat tgactgggaa gcatggagac cgagatgggc atttaactgg 420 gacacgaaag acatttacag gcaaaggtcc cgtgccttag tccaagcaca gcatcccgac 480 tggccagtta ctcaagttga ggctgtggca caagaccagt tccagggtgc tgcgagggca 540 tggatggcag gaaccttgca attaggccgt gctttaagac caaggggact atggggcttc 600 tacggttttc ccgattgcta caattacgat ttcctatctc ctaattacac agggcaatgc 660 ccatcaggga tcagagcaca aaatgaccag ttaggatggt tgtggggtca gagtcgtgca 720 ttatatccca gtatctacat gccggctgtt ttggaaggaa caggcaaatc ccaaatgtac 780 gtgcagcaca gggtcgcgga agcctttagg gttgctgttg cagcaggcga cccaaactta 840 cccgtcctac cgtacgtcca gattttctac gatatgacca accactttct tccattggac 900 gagttagagc atagtcttgg agaatcagcg gctcagggcg cagcaggagt cgtgttatgg 960 gtgtcatggg agaatactag aacaaaagaa tcttgccagg caattaaaga atatatggac 1020 actaccttgg ggccttttat tctgaacgtc acttcgggtg cgttgttatg ctcgcaagcc 1080 ttatgttcaa gccatggtcg ttgtgtccgt cgtccctcac atccaaaagc cttgctaatc 1140 cttaatcccg caagctttag tattcagttg acaccagatg gtggtccctt gtcgttaagg 1200 ggagcattgt cacttgagga ccaggcacaa atggctgttg aattcaaatg caggtgctac 1260 cccgggtggc aaggcccttg gtgtgagcag aagagtatgt ggggatccgc catttctcaa 1320 atcactgacg gtcaaatcca agctactacc actgctacca ccgaagctac caccactgct 1380 gccccatctt ccaccgttga aactgtttct ccatccagca ccgaaactat ctctcaacaa 1440 actgaaaatg gtgctgctaa ggccgctgtc ggtatgggtg ccggtgctct agctgctgct 1500 gctatgttgt tataa 1515 <210> 59 <211> 1293 <212> DNA <213> Vespa magnifica <220> <223> reencoded nucleic acid sequence of hyaluronidase (HYAL) originating from Vespa magnifica with a N-terminal secretion signal and a C-terminal anchoring signal <400> 59 atgcaatttt ctacagtggc aagtgttgca ttcgttgcac tagccaactt tgtggcggca 60 gatagctgtg ggtcaaactg cgaaaagagt gagagaccga aaagggtctt caacatttac 120 tggaacgtac ctacattcat gtgtcaccag tacggactat actttgacga ggtcacgaat 180 tttaatataa agcacaacag caaagacaat tttcaagggg acaagatcgc gatcttttat 240 gaccccgggg agtttcccgc tctgctgcca ctaaactatg gtaagtacaa gatcaggaat 300 ggtggtgttc cacaagaggg taacatcacc atccatctgc agagattcat agagtaccta 360 gataagacct atccgaaccg taacttttca ggcatcggtg tgatcgattt cgagaggtgg 420 agaccaattt tcagacagaa ttggggtaat atgaagattt acaagaactt ctccatcgat 480 cttgtgcgta aagagcatcc tttctggaat aagaaaatga tcgagttgga agcttctaaa 540 agattcgaga aatacgcccg tctgttcatg gaagaaacat taaagttggc taagaaaact 600 agaaaacagg ccgattgggg ctactacggt tacccctatt gcttcaacat gtctcctact 660 aatttcgttc ctgactgcga tgtcacagct agggatgaga acaacgagat gtcttggttg 720 tttaacaacc agaatgtcct attaccaagt gtatacatta ggagagagct aactcctgac 780 cagaggattg ggcttgtaca ggggagagtg aaggaagctg tgagaatttc aaataaactg 840 aagcactcac ctaaagtctt cagctattgg tggtatgttt accaagacga gaccaacacc 900 ttcttaacgg agaccgacgt caagaagacg tttcaggaga ttgtgatcaa cggtggagat 960 gggattataa tctggggttc gtcctctgat gtaaacagct tgtccaagtg tacgaggtta 1020 agggagtacc tattgacagt cttgggacca attgctgtta acgtgactga agcagtaaac 1080 ggatccgcca tttctcaaat cactgacggt caaatccaag ctactaccac tgctaccacc 1140 gaagctacca ccactgctgc cccatcttcc accgttgaaa ctgtttctcc atccagcacc 1200 gaaactatct ctcaacaaac tgaaaatggt gctgctaagg ccgctgtcgg tatgggtgcc 1260 ggtgctctag ctgctgctgc tatgttgtta taa 1293 <210> 60 <211> 398 <212> PRT <213> Cupiennius salei <220> <223> amino acid sequence of hyaluronidase (HYAL) originating from Cupiennius salei with a N-terminal secretion signal <400> 60 Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn 1 5 10 15 Phe Val Ala Ala Phe Lys Ile Tyr Trp Asn Val Pro Thr Phe Gln Cys 20 25 30 Thr His Asn Tyr Lys Ile Asp Tyr Val Lys Leu Leu Ser Thr Tyr Gly 35 40 45 Ile Gln Val Asn Asp Gly Gly Lys Phe Gln Gly Asn Gln Val Thr Ile 50 55 60 Phe Tyr Glu Thr Gln Leu Gly Leu Tyr Pro Arg Ile Leu Lys Ser Gly 65 70 75 80 Lys Met Glu Asn Gly Gly Ile Pro Gln Arg Gly Asn Phe Glu Lys His 85 90 95 Leu Glu Lys Ala Ser Thr Asp Leu Gln Lys Val Ile Pro Trp Lys Glu 100 105 110 Phe Ser Gly Leu Gly Val Ile Asp Trp Glu Ala Trp Arg Pro Thr Trp 115 120 125 Glu Phe Asn Trp Glu Pro Leu Arg Ile Tyr Gln Thr Glu Ser Ile Lys 130 135 140 Arg Ala Lys Glu Leu His Pro Thr Ala Asn Asp Ser Ala Val Lys Glu 145 150 155 160 Ile Ala Glu Arg Gln Trp Glu Asp Ser Ala Lys Leu Tyr Met Leu Glu 165 170 175 Thr Leu Arg Leu Ala Lys Lys Leu Arg Pro Gln Ala Pro Trp Cys Tyr 180 185 190 Tyr Leu Phe Pro Asp Cys Tyr Asn Tyr Val Gly Lys Lys Pro Lys Asp 195 200 205 Phe Gln Cys Ser Ala Ser Ile Arg Lys Gly Asn Asp Lys Leu Ser Trp 210 215 220 Leu Trp Lys Asp Ser Thr Ala Leu Cys Pro Ser Ile Tyr Val Tyr Glu 225 230 235 240 Ser Gln Leu Asp Arg Tyr Ser Phe Glu Gln Arg Thr Trp Arg Asp Asn 245 250 255 Glu Lys Leu Arg Glu Ala Leu Arg Val Ala Thr Arg Thr Ser Lys Ile 260 265 270 Tyr Pro Tyr Val Asn Tyr Phe Asp Lys Glu Leu Ile Pro Glu Gln Glu 275 280 285 Val Trp Arg Met Leu Ala Gln Ala Ala Ala Val Gly Gly Ser Gly Ala 290 295 300 Val Ile Trp Gly Ser Ser Ala Ala Val Ala Ser Glu Glu Leu Cys Lys 305 310 315 320 Ser Leu Lys Gln Tyr Ile Ile Glu Thr Leu Gly Pro Ala Ala Glu Lys 325 330 335 Val Ala Trp Arg Ser Asp Leu Cys Ser Lys Glu Ile Cys Asn Asn Gln 340 345 350 Gly Arg Cys Thr Phe Pro Asp Asp Asp Tyr Ala Asn Ala Trp Lys Leu 355 360 365 Phe Thr Asp Asp Thr Val Lys Phe Tyr Ala Gly Asn Ile Thr Cys Arg 370 375 380 Cys Ser Glu Asn Tyr Ser Gly Arg Phe Cys Glu Lys Lys Asn 385 390 395 <210> 61 <211> 405 <212> PRT <213> Tityus serrulatus <220> <223> amino acid sequence of hyaluronidase (HYAL) originating from Tityus serrulatus with a N-terminal secretion signal <400> 61 Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn 1 5 10 15 Phe Val Ala Ala Ala Asp Phe Lys Val Tyr Trp Glu Val Pro Ser Phe 20 25 30 Leu Cys Ser Lys Arg Phe Lys Ile Asn Val Thr Glu Val Leu Thr Ser 35 40 45 His Glu Ile Leu Val Asn Gln Gly Glu Ser Phe Asn Gly Asp Lys Ile 50 55 60 Val Ile Phe Tyr Glu Asn Gln Leu Gly Lys Tyr Pro His Ile Asp Ser 65 70 75 80 Asn Asn Val Glu Ile Asn Gly Gly Ile Leu Gln Val Ala Asp Leu Ala 85 90 95 Lys His Leu Lys Val Ala Lys Asp Asn Ile Thr Lys Phe Val Pro Asn 100 105 110 Pro Asn Phe Asn Gly Val Gly Val Ile Asp Trp Glu Ala Trp Arg Pro 115 120 125 Ser Trp Glu Phe Asn Trp Gly Lys Leu Lys Val Tyr Lys Glu Lys Ser 130 135 140 Ile Asp Leu Val Lys Ser Lys His Pro Glu Trp Pro Ser Asp Arg Val 145 150 155 160 Glu Lys Val Ala Lys Glu Glu Trp Glu Glu Ser Ala Lys Glu Trp Met 165 170 175 Val Lys Thr Leu Lys Leu Ala Gln Glu Met Arg Pro Asn Ala Val Trp 180 185 190 Cys Tyr Tyr Leu Phe Pro Asp Cys Tyr Asn Tyr Phe Gly Lys Asp Gln 195 200 205 Pro Ser Gln Phe Ser Cys Ser Ser Arg Ile Gln Lys Glu Asn Ser Arg 210 215 220 Leu Ser Trp Leu Trp Asn Gln Ser Thr Ala Ile Cys Leu Ser Ile Tyr 225 230 235 240 Ile Gln Glu Ser His Val Thr Lys Tyr Asn Met Ser Gln Arg Thr Trp 245 250 255 Trp Ile Asp Ala Arg Leu Arg Glu Ala Ile Arg Val Ser Glu His Arg 260 265 270 Pro Asn Ile Pro Ile Tyr Pro Tyr Ile Asn Tyr Ile Leu Pro Gly Thr 275 280 285 Asn Gln Thr Val Pro Ala Met Asp Phe Lys Arg Thr Leu Gly Gln Ile 290 295 300 Ala Ser Leu Gly Leu Asp Gly Ala Leu Leu Trp Gly Ser Ser Tyr His 305 310 315 320 Val Leu Thr Glu Ser Gln Cys Lys Ile Thr Ser Asp Tyr Val Lys Ser 325 330 335 Val Ile Ala Pro Thr Val Ala Thr Val Val Leu Asn Thr Asn Arg Cys 340 345 350 Ser Gln Ile Ile Cys Lys Gly Arg Gly Asn Cys Val Trp Pro Glu Glu 355 360 365 Pro Phe Ser Ser Trp Lys Tyr Leu Val Asp Pro Lys Met Pro Val Phe 370 375 380 Lys Pro Thr Asn Ile His Cys Lys Cys Lys Gly Tyr Leu Gly Arg Tyr 385 390 395 400 Cys Glu Ile Pro Lys 405 <210> 62 <211> 435 <212> PRT <213> Bos taurus <220> <223> amino acid sequence of hyaluronidase (HYAL) originating from Bos taurus with a N-terminal secretion signal <400> 62 Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn 1 5 10 15 Phe Val Ala Ala Gly Ser Arg Asp Pro Val Val Pro Asn Gln Pro Phe 20 25 30 Thr Thr Ile Trp Asn Ala Asn Thr Glu Trp Cys Met Lys Lys His Gly 35 40 45 Val Asp Val Asp Ile Ser Ile Phe Asp Val Val Thr Asn Pro Gly Gln 50 55 60 Thr Phe Arg Gly Pro Asn Met Thr Ile Phe Tyr Ser Ser Gln Leu Gly 65 70 75 80 Thr Tyr Pro Tyr Tyr Thr Ser Ala Gly Glu Pro Val Phe Gly Gly Leu 85 90 95 Pro Gln Asn Ala Ser Leu Asn Ala His Leu Ala Arg Thr Phe Gln Asp 100 105 110 Ile Leu Ala Ala Met Pro Glu Pro Arg Phe Ser Gly Leu Ala Val Ile 115 120 125 Asp Trp Glu Ala Trp Arg Pro Arg Trp Ala Phe Asn Trp Asp Thr Lys 130 135 140 Asp Ile Tyr Arg Gln Arg Ser Arg Ala Leu Val Gln Lys Gln His Pro 145 150 155 160 Asp Trp Leu Ala Pro Arg Val Glu Ala Ala Ala Gln Asp Gln Phe Glu 165 170 175 Gly Ala Ala Glu Glu Trp Met Ala Gly Thr Leu Lys Leu Gly Gln Ala 180 185 190 Leu Arg Pro Gln Gly Leu Trp Gly Phe Tyr Asn Phe Pro Glu Cys Tyr 195 200 205 Asn Tyr Asp Phe Lys Ser Pro Asn Tyr Thr Gly Arg Cys Pro Leu Asn 210 215 220 Ile Cys Ala Gln Asn Asp Gln Leu Gly Trp Leu Trp Gly Gln Ser Arg 225 230 235 240 Ala Leu Tyr Pro Ser Ile Tyr Leu Pro Ala Ala Leu Glu Gly Thr Lys 245 250 255 Lys Thr Gln Met Phe Val Gln His Arg Val Ala Glu Ala Phe Arg Val 260 265 270 Ala Ala Gly Ala Gly Asp Pro Lys Leu Pro Val Leu Pro Tyr Met Gln 275 280 285 Leu Phe Tyr Asp Met Thr Asn His Phe Leu Pro Ala Glu Glu Leu Glu 290 295 300 His Ser Leu Gly Glu Ser Ala Ala Gln Gly Ala Ala Gly Val Val Leu 305 310 315 320 Trp Val Ser Trp Leu Ser Thr Ser Thr Lys Glu Ser Cys Gln Ala Ile 325 330 335 Lys Glu Tyr Val Asp Thr Thr Leu Gly Pro Ser Ile Leu Asn Val Thr 340 345 350 Ser Gly Ala Arg Leu Cys Ser Gln Val Leu Cys Ser Gly His Gly Arg 355 360 365 Cys Ala Arg Arg Pro Ser Tyr Pro Lys Ala Arg Leu Ile Leu Asn Ser 370 375 380 Thr Ser Phe Ser Ile Lys Pro Thr Pro Gly Gly Gly Pro Leu Thr Leu 385 390 395 400 Gln Gly Ala Leu Ser Leu Glu Asp Arg Leu Arg Met Ala Val Glu Phe 405 410 415 Glu Cys Arg Cys Tyr Arg Gly Trp Arg Gly Thr Arg Cys Glu Gln Trp 420 425 430 Gly Met Trp 435 <210> 63 <211> 378 <212> PRT <213> Apis mellifera <220> <223> amino acid sequence of hyaluronidase (HYAL) originating from Apis mellifera with a N-terminal secretion signal <400> 63 Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn 1 5 10 15 Phe Val Ala Ala Leu Leu Leu Gly Phe Val Gln Ser Thr Pro Asp Asn 20 25 30 Asn Lys Thr Val Arg Glu Phe Asn Val Tyr Trp Asn Val Pro Thr Phe 35 40 45 Met Cys His Lys Tyr Gly Leu Arg Phe Glu Glu Val Ser Glu Lys Tyr 50 55 60 Gly Ile Leu Gln Asn Trp Met Asp Lys Phe Arg Gly Glu Glu Ile Ala 65 70 75 80 Ile Leu Tyr Asp Pro Gly Met Phe Pro Ala Leu Leu Lys Asp Pro Asn 85 90 95 Gly Asn Val Val Ala Arg Asn Gly Gly Val Pro Gln Leu Gly Asn Leu 100 105 110 Thr Lys His Leu Gln Val Phe Arg Asp His Leu Ile Asn Gln Ile Pro 115 120 125 Asp Lys Ser Phe Pro Gly Val Gly Val Ile Asp Phe Glu Ser Trp Arg 130 135 140 Pro Ile Phe Arg Gln Asn Trp Ala Ser Leu Gln Pro Tyr Lys Lys Leu 145 150 155 160 Ser Val Glu Val Val Arg Arg Glu His Pro Phe Trp Asp Asp Gln Arg 165 170 175 Val Glu Gln Glu Ala Lys Arg Arg Phe Glu Lys Tyr Gly Gln Leu Phe 180 185 190 Met Glu Glu Thr Leu Lys Ala Ala Lys Arg Met Arg Pro Ala Ala Asn 195 200 205 Trp Gly Tyr Tyr Ala Tyr Pro Tyr Cys Tyr Asn Leu Thr Pro Asn Gln 210 215 220 Pro Ser Ala Gln Cys Glu Ala Thr Thr Met Gln Glu Asn Asp Lys Met 225 230 235 240 Ser Trp Leu Phe Glu Ser Glu Asp Val Leu Leu Pro Ser Val Tyr Leu 245 250 255 Arg Trp Asn Leu Thr Ser Gly Glu Arg Val Gly Leu Val Gly Gly Arg 260 265 270 Val Lys Glu Ala Leu Arg Ile Ala Arg Gln Met Thr Thr Ser Arg Lys 275 280 285 Lys Val Leu Pro Tyr Tyr Trp Tyr Lys Tyr Gln Asp Arg Arg Asp Thr 290 295 300 Asp Leu Ser Arg Ala Asp Leu Glu Ala Thr Leu Arg Lys Ile Thr Asp 305 310 315 320 Leu Gly Ala Asp Gly Phe Ile Ile Trp Gly Ser Ser Asp Asp Ile Asn 325 330 335 Thr Lys Ala Lys Cys Leu Gln Phe Arg Glu Tyr Leu Asn Asn Glu Leu 340 345 350 Gly Pro Ala Val Lys Arg Ile Ala Leu Asn Asn Asn Ala Asn Asp Arg 355 360 365 Leu Thr Val Asp Val Ser Val Asp Gln Val 370 375 <210> 64 <211> 434 <212> PRT <213> Macaca mulatta <220> <223> amino acid sequence of hyaluronidase (HYAL) originating from Macaca mulatta with a N-terminal secretion signal <400> 64 Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn 1 5 10 15 Phe Val Ala Ala Ser Arg Gly Pro Leu Leu Pro Asn Arg Pro Phe Ala 20 25 30 Thr Val Trp Asn Ala Asn Thr Gln Trp Cys Leu Glu Arg His Ser Val 35 40 45 Asp Val Asp Val Ser Ile Phe Asp Val Val Ala Asn Pro Gly Gln Thr 50 55 60 Phe Arg Gly Pro Asp Met Thr Ile Phe Tyr Ser Ser Gln Leu Gly Thr 65 70 75 80 Tyr Pro Tyr Tyr Thr Pro Thr Gly Glu Pro Val Phe Gly Gly Leu Pro 85 90 95 Gln Asn Ala Ser Leu Ile Ala His Leu Ala Arg Thr Phe Gln Asp Ile 100 105 110 Leu Ala Ala Ile Pro Ala Pro Asp Phe Ser Gly Leu Ala Val Ile Asp 115 120 125 Trp Glu Ala Trp Arg Pro Arg Trp Ala Phe Asn Trp Asp Thr Lys Asp 130 135 140 Ile Tyr Arg Gln Arg Ser Arg Ala Leu Val Gln Ala Gln His Pro Asp 145 150 155 160 Trp Pro Val Thr Gln Val Glu Ala Val Ala Gln Asp Gln Phe Gln Gly 165 170 175 Ala Ala Arg Ala Trp Met Ala Gly Thr Leu Gln Leu Gly Arg Ala Leu 180 185 190 Arg Pro Arg Gly Leu Trp Gly Phe Tyr Gly Phe Pro Asp Cys Tyr Asn 195 200 205 Tyr Asp Phe Leu Ser Pro Asn Tyr Thr Gly Gln Cys Pro Ser Gly Ile 210 215 220 Arg Ala Gln Asn Asp Gln Leu Gly Trp Leu Trp Gly Gln Ser Arg Ala 225 230 235 240 Leu Tyr Pro Ser Ile Tyr Met Pro Ala Val Leu Glu Gly Thr Gly Lys 245 250 255 Ser Gln Met Tyr Val Gln His Arg Val Ala Glu Ala Phe Arg Val Ala 260 265 270 Val Ala Ala Gly Asp Pro Asn Leu Pro Val Leu Pro Tyr Val Gln Ile 275 280 285 Phe Tyr Asp Met Thr Asn His Phe Leu Pro Leu Asp Glu Leu Glu His 290 295 300 Ser Leu Gly Glu Ser Ala Ala Gln Gly Ala Ala Gly Val Val Leu Trp 305 310 315 320 Val Ser Trp Glu Asn Thr Arg Thr Lys Glu Ser Cys Gln Ala Ile Lys 325 330 335 Glu Tyr Met Asp Thr Thr Leu Gly Pro Phe Ile Leu Asn Val Thr Ser 340 345 350 Gly Ala Leu Leu Cys Ser Gln Ala Leu Cys Ser Ser His Gly Arg Cys 355 360 365 Val Arg Arg Pro Ser His Pro Lys Ala Leu Leu Ile Leu Asn Pro Ala 370 375 380 Ser Phe Ser Ile Gln Leu Thr Pro Asp Gly Gly Pro Leu Ser Leu Arg 385 390 395 400 Gly Ala Leu Ser Leu Glu Asp Gln Ala Gln Met Ala Val Glu Phe Lys 405 410 415 Cys Arg Cys Tyr Pro Gly Trp Gln Gly Pro Trp Cys Glu Gln Lys Ser 420 425 430 Met Trp <210> 65 <211> 360 <212> PRT <213> Vespa magnifica <220> <223> amino acid sequence of hyaluronidase (HYAL) originating from Vespa magnifica with a N-terminal secretion signal <400> 65 Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn 1 5 10 15 Phe Val Ala Ala Asp Ser Cys Gly Ser Asn Cys Glu Lys Ser Glu Arg 20 25 30 Pro Lys Arg Val Phe Asn Ile Tyr Trp Asn Val Pro Thr Phe Met Cys 35 40 45 His Gln Tyr Gly Leu Tyr Phe Asp Glu Val Thr Asn Phe Asn Ile Lys 50 55 60 His Asn Ser Lys Asp Asn Phe Gln Gly Asp Lys Ile Ala Ile Phe Tyr 65 70 75 80 Asp Pro Gly Glu Phe Pro Ala Leu Leu Pro Leu Asn Tyr Gly Lys Tyr 85 90 95 Lys Ile Arg Asn Gly Gly Val Pro Gln Glu Gly Asn Ile Thr Ile His 100 105 110 Leu Gln Arg Phe Ile Glu Tyr Leu Asp Lys Thr Tyr Pro Asn Arg Asn 115 120 125 Phe Ser Gly Ile Gly Val Ile Asp Phe Glu Arg Trp Arg Pro Ile Phe 130 135 140 Arg Gln Asn Trp Gly Asn Met Lys Ile Tyr Lys Asn Phe Ser Ile Asp 145 150 155 160 Leu Val Arg Lys Glu His Pro Phe Trp Asn Lys Lys Met Ile Glu Leu 165 170 175 Glu Ala Ser Lys Arg Phe Glu Lys Tyr Ala Arg Leu Phe Met Glu Glu 180 185 190 Thr Leu Lys Leu Ala Lys Lys Thr Arg Lys Gln Ala Asp Trp Gly Tyr 195 200 205 Tyr Gly Tyr Pro Tyr Cys Phe Asn Met Ser Pro Thr Asn Phe Val Pro 210 215 220 Asp Cys Asp Val Thr Ala Arg Asp Glu Asn Asn Glu Met Ser Trp Leu 225 230 235 240 Phe Asn Asn Gln Asn Val Leu Leu Pro Ser Val Tyr Ile Arg Arg Glu 245 250 255 Leu Thr Pro Asp Gln Arg Ile Gly Leu Val Gln Gly Arg Val Lys Glu 260 265 270 Ala Val Arg Ile Ser Asn Lys Leu Lys His Ser Pro Lys Val Phe Ser 275 280 285 Tyr Trp Trp Tyr Val Tyr Gln Asp Glu Thr Asn Thr Phe Leu Thr Glu 290 295 300 Thr Asp Val Lys Lys Thr Phe Gln Glu Ile Val Ile Asn Gly Gly Asp 305 310 315 320 Gly Ile Ile Ile Trp Gly Ser Ser Ser Asp Val Asn Ser Leu Ser Lys 325 330 335 Cys Thr Arg Leu Arg Glu Tyr Leu Leu Thr Val Leu Gly Pro Ile Ala 340 345 350 Val Asn Val Thr Glu Ala Val Asn 355 360 <210> 66 <211> 468 <212> PRT <213> Cupiennius salei <220> <223> amino acid sequence of hyaluronidase (HYAL) originating from Cupiennius salei with a N-terminal secretion signal and a C-terminal anchoring signal <400> 66 Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn 1 5 10 15 Phe Val Ala Ala Phe Lys Ile Tyr Trp Asn Val Pro Thr Phe Gln Cys 20 25 30 Thr His Asn Tyr Lys Ile Asp Tyr Val Lys Leu Leu Ser Thr Tyr Gly 35 40 45 Ile Gln Val Asn Asp Gly Gly Lys Phe Gln Gly Asn Gln Val Thr Ile 50 55 60 Phe Tyr Glu Thr Gln Leu Gly Leu Tyr Pro Arg Ile Leu Lys Ser Gly 65 70 75 80 Lys Met Glu Asn Gly Gly Ile Pro Gln Arg Gly Asn Phe Glu Lys His 85 90 95 Leu Glu Lys Ala Ser Thr Asp Leu Gln Lys Val Ile Pro Trp Lys Glu 100 105 110 Phe Ser Gly Leu Gly Val Ile Asp Trp Glu Ala Trp Arg Pro Thr Trp 115 120 125 Glu Phe Asn Trp Glu Pro Leu Arg Ile Tyr Gln Thr Glu Ser Ile Lys 130 135 140 Arg Ala Lys Glu Leu His Pro Thr Ala Asn Asp Ser Ala Val Lys Glu 145 150 155 160 Ile Ala Glu Arg Gln Trp Glu Asp Ser Ala Lys Leu Tyr Met Leu Glu 165 170 175 Thr Leu Arg Leu Ala Lys Lys Leu Arg Pro Gln Ala Pro Trp Cys Tyr 180 185 190 Tyr Leu Phe Pro Asp Cys Tyr Asn Tyr Val Gly Lys Lys Pro Lys Asp 195 200 205 Phe Gln Cys Ser Ala Ser Ile Arg Lys Gly Asn Asp Lys Leu Ser Trp 210 215 220 Leu Trp Lys Asp Ser Thr Ala Leu Cys Pro Ser Ile Tyr Val Tyr Glu 225 230 235 240 Ser Gln Leu Asp Arg Tyr Ser Phe Glu Gln Arg Thr Trp Arg Asp Asn 245 250 255 Glu Lys Leu Arg Glu Ala Leu Arg Val Ala Thr Arg Thr Ser Lys Ile 260 265 270 Tyr Pro Tyr Val Asn Tyr Phe Asp Lys Glu Leu Ile Pro Glu Gln Glu 275 280 285 Val Trp Arg Met Leu Ala Gln Ala Ala Ala Val Gly Gly Ser Gly Ala 290 295 300 Val Ile Trp Gly Ser Ser Ala Ala Val Ala Ser Glu Glu Leu Cys Lys 305 310 315 320 Ser Leu Lys Gln Tyr Ile Ile Glu Thr Leu Gly Pro Ala Ala Glu Lys 325 330 335 Val Ala Trp Arg Ser Asp Leu Cys Ser Lys Glu Ile Cys Asn Asn Gln 340 345 350 Gly Arg Cys Thr Phe Pro Asp Asp Asp Tyr Ala Asn Ala Trp Lys Leu 355 360 365 Phe Thr Asp Asp Thr Val Lys Phe Tyr Ala Gly Asn Ile Thr Cys Arg 370 375 380 Cys Ser Glu Asn Tyr Ser Gly Arg Phe Cys Glu Lys Lys Asn Gly Ser 385 390 395 400 Ala Ile Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala Thr Thr Thr Ala 405 410 415 Thr Thr Glu Ala Thr Thr Thr Ala Ala Pro Ser Ser Thr Val Glu Thr 420 425 430 Val Ser Pro Ser Ser Thr Glu Thr Ile Ser Gln Gln Thr Glu Asn Gly 435 440 445 Ala Ala Lys Ala Ala Val Gly Met Gly Ala Gly Ala Leu Ala Ala Ala 450 455 460 Ala Met Leu Leu 465 <210> 67 <211> 475 <212> PRT <213> Tityus serrulatus <220> <223> amino acid sequence of hyaluronidase (HYAL) originating from Tityus serrulatus with a N-terminal secretion signal and a C-terminal anchoring signal <400> 67 Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn 1 5 10 15 Phe Val Ala Ala Ala Asp Phe Lys Val Tyr Trp Glu Val Pro Ser Phe 20 25 30 Leu Cys Ser Lys Arg Phe Lys Ile Asn Val Thr Glu Val Leu Thr Ser 35 40 45 His Glu Ile Leu Val Asn Gln Gly Glu Ser Phe Asn Gly Asp Lys Ile 50 55 60 Val Ile Phe Tyr Glu Asn Gln Leu Gly Lys Tyr Pro His Ile Asp Ser 65 70 75 80 Asn Asn Val Glu Ile Asn Gly Gly Ile Leu Gln Val Ala Asp Leu Ala 85 90 95 Lys His Leu Lys Val Ala Lys Asp Asn Ile Thr Lys Phe Val Pro Asn 100 105 110 Pro Asn Phe Asn Gly Val Gly Val Ile Asp Trp Glu Ala Trp Arg Pro 115 120 125 Ser Trp Glu Phe Asn Trp Gly Lys Leu Lys Val Tyr Lys Glu Lys Ser 130 135 140 Ile Asp Leu Val Lys Ser Lys His Pro Glu Trp Pro Ser Asp Arg Val 145 150 155 160 Glu Lys Val Ala Lys Glu Glu Trp Glu Glu Ser Ala Lys Glu Trp Met 165 170 175 Val Lys Thr Leu Lys Leu Ala Gln Glu Met Arg Pro Asn Ala Val Trp 180 185 190 Cys Tyr Tyr Leu Phe Pro Asp Cys Tyr Asn Tyr Phe Gly Lys Asp Gln 195 200 205 Pro Ser Gln Phe Ser Cys Ser Ser Arg Ile Gln Lys Glu Asn Ser Arg 210 215 220 Leu Ser Trp Leu Trp Asn Gln Ser Thr Ala Ile Cys Leu Ser Ile Tyr 225 230 235 240 Ile Gln Glu Ser His Val Thr Lys Tyr Asn Met Ser Gln Arg Thr Trp 245 250 255 Trp Ile Asp Ala Arg Leu Arg Glu Ala Ile Arg Val Ser Glu His Arg 260 265 270 Pro Asn Ile Pro Ile Tyr Pro Tyr Ile Asn Tyr Ile Leu Pro Gly Thr 275 280 285 Asn Gln Thr Val Pro Ala Met Asp Phe Lys Arg Thr Leu Gly Gln Ile 290 295 300 Ala Ser Leu Gly Leu Asp Gly Ala Leu Leu Trp Gly Ser Ser Tyr His 305 310 315 320 Val Leu Thr Glu Ser Gln Cys Lys Ile Thr Ser Asp Tyr Val Lys Ser 325 330 335 Val Ile Ala Pro Thr Val Ala Thr Val Val Leu Asn Thr Asn Arg Cys 340 345 350 Ser Gln Ile Ile Cys Lys Gly Arg Gly Asn Cys Val Trp Pro Glu Glu 355 360 365 Pro Phe Ser Ser Trp Lys Tyr Leu Val Asp Pro Lys Met Pro Val Phe 370 375 380 Lys Pro Thr Asn Ile His Cys Lys Cys Lys Gly Tyr Leu Gly Arg Tyr 385 390 395 400 Cys Glu Ile Pro Lys Gly Ser Ala Ile Ser Gln Ile Thr Asp Gly Gln 405 410 415 Ile Gln Ala Thr Thr Thr Ala Thr Thr Glu Ala Thr Thr Thr Ala Ala 420 425 430 Pro Ser Ser Thr Val Glu Thr Val Ser Pro Ser Ser Thr Glu Thr Ile 435 440 445 Ser Gln Gln Thr Glu Asn Gly Ala Ala Lys Ala Ala Val Gly Met Gly 450 455 460 Ala Gly Ala Leu Ala Ala Ala Ala Met Leu Leu 465 470 475 <210> 68 <211> 448 <212> PRT <213> Bos taurus <220> <223> amino acid sequence of hyaluronidase (HYAL) originating from Bos taurus with a N-terminal secretion signal and a C-terminal anchoring signal <400> 68 Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn 1 5 10 15 Phe Val Ala Ala Leu Leu Leu Gly Phe Val Gln Ser Thr Pro Asp Asn 20 25 30 Asn Lys Thr Val Arg Glu Phe Asn Val Tyr Trp Asn Val Pro Thr Phe 35 40 45 Met Cys His Lys Tyr Gly Leu Arg Phe Glu Glu Val Ser Glu Lys Tyr 50 55 60 Gly Ile Leu Gln Asn Trp Met Asp Lys Phe Arg Gly Glu Glu Ile Ala 65 70 75 80 Ile Leu Tyr Asp Pro Gly Met Phe Pro Ala Leu Leu Lys Asp Pro Asn 85 90 95 Gly Asn Val Val Ala Arg Asn Gly Gly Val Pro Gln Leu Gly Asn Leu 100 105 110 Thr Lys His Leu Gln Val Phe Arg Asp His Leu Ile Asn Gln Ile Pro 115 120 125 Asp Lys Ser Phe Pro Gly Val Gly Val Ile Asp Phe Glu Ser Trp Arg 130 135 140 Pro Ile Phe Arg Gln Asn Trp Ala Ser Leu Gln Pro Tyr Lys Lys Leu 145 150 155 160 Ser Val Glu Val Val Arg Arg Glu His Pro Phe Trp Asp Asp Gln Arg 165 170 175 Val Glu Gln Glu Ala Lys Arg Arg Phe Glu Lys Tyr Gly Gln Leu Phe 180 185 190 Met Glu Glu Thr Leu Lys Ala Ala Lys Arg Met Arg Pro Ala Ala Asn 195 200 205 Trp Gly Tyr Tyr Ala Tyr Pro Tyr Cys Tyr Asn Leu Thr Pro Asn Gln 210 215 220 Pro Ser Ala Gln Cys Glu Ala Thr Thr Met Gln Glu Asn Asp Lys Met 225 230 235 240 Ser Trp Leu Phe Glu Ser Glu Asp Val Leu Leu Pro Ser Val Tyr Leu 245 250 255 Arg Trp Asn Leu Thr Ser Gly Glu Arg Val Gly Leu Val Gly Gly Arg 260 265 270 Val Lys Glu Ala Leu Arg Ile Ala Arg Gln Met Thr Thr Ser Arg Lys 275 280 285 Lys Val Leu Pro Tyr Tyr Trp Tyr Lys Tyr Gln Asp Arg Arg Asp Thr 290 295 300 Asp Leu Ser Arg Ala Asp Leu Glu Ala Thr Leu Arg Lys Ile Thr Asp 305 310 315 320 Leu Gly Ala Asp Gly Phe Ile Ile Trp Gly Ser Ser Asp Asp Ile Asn 325 330 335 Thr Lys Ala Lys Cys Leu Gln Phe Arg Glu Tyr Leu Asn Asn Glu Leu 340 345 350 Gly Pro Ala Val Lys Arg Ile Ala Leu Asn Asn Asn Ala Asn Asp Arg 355 360 365 Leu Thr Val Asp Val Ser Val Asp Gln Val Gly Ser Ala Ile Ser Gln 370 375 380 Ile Thr Asp Gly Gln Ile Gln Ala Thr Thr Thr Ala Thr Thr Glu Ala 385 390 395 400 Thr Thr Thr Ala Ala Pro Ser Ser Thr Val Glu Thr Val Ser Pro Ser 405 410 415 Ser Thr Glu Thr Ile Ser Gln Gln Thr Glu Asn Gly Ala Ala Lys Ala 420 425 430 Ala Val Gly Met Gly Ala Gly Ala Leu Ala Ala Ala Ala Met Leu Leu 435 440 445 <210> 69 <211> 448 <212> PRT <213> Apis mellifera <220> <223> amino acid sequence of hyaluronidase (HYAL) originating from Apis mellifera with a N-terminal secretion signal and a C-terminal anchoring signal <400> 69 Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn 1 5 10 15 Phe Val Ala Ala Leu Leu Leu Gly Phe Val Gln Ser Thr Pro Asp Asn 20 25 30 Asn Lys Thr Val Arg Glu Phe Asn Val Tyr Trp Asn Val Pro Thr Phe 35 40 45 Met Cys His Lys Tyr Gly Leu Arg Phe Glu Glu Val Ser Glu Lys Tyr 50 55 60 Gly Ile Leu Gln Asn Trp Met Asp Lys Phe Arg Gly Glu Glu Ile Ala 65 70 75 80 Ile Leu Tyr Asp Pro Gly Met Phe Pro Ala Leu Leu Lys Asp Pro Asn 85 90 95 Gly Asn Val Val Ala Arg Asn Gly Gly Val Pro Gln Leu Gly Asn Leu 100 105 110 Thr Lys His Leu Gln Val Phe Arg Asp His Leu Ile Asn Gln Ile Pro 115 120 125 Asp Lys Ser Phe Pro Gly Val Gly Val Ile Asp Phe Glu Ser Trp Arg 130 135 140 Pro Ile Phe Arg Gln Asn Trp Ala Ser Leu Gln Pro Tyr Lys Lys Leu 145 150 155 160 Ser Val Glu Val Val Arg Arg Glu His Pro Phe Trp Asp Asp Gln Arg 165 170 175 Val Glu Gln Glu Ala Lys Arg Arg Phe Glu Lys Tyr Gly Gln Leu Phe 180 185 190 Met Glu Glu Thr Leu Lys Ala Ala Lys Arg Met Arg Pro Ala Ala Asn 195 200 205 Trp Gly Tyr Tyr Ala Tyr Pro Tyr Cys Tyr Asn Leu Thr Pro Asn Gln 210 215 220 Pro Ser Ala Gln Cys Glu Ala Thr Thr Met Gln Glu Asn Asp Lys Met 225 230 235 240 Ser Trp Leu Phe Glu Ser Glu Asp Val Leu Leu Pro Ser Val Tyr Leu 245 250 255 Arg Trp Asn Leu Thr Ser Gly Glu Arg Val Gly Leu Val Gly Gly Arg 260 265 270 Val Lys Glu Ala Leu Arg Ile Ala Arg Gln Met Thr Thr Ser Arg Lys 275 280 285 Lys Val Leu Pro Tyr Tyr Trp Tyr Lys Tyr Gln Asp Arg Arg Asp Thr 290 295 300 Asp Leu Ser Arg Ala Asp Leu Glu Ala Thr Leu Arg Lys Ile Thr Asp 305 310 315 320 Leu Gly Ala Asp Gly Phe Ile Ile Trp Gly Ser Ser Asp Asp Ile Asn 325 330 335 Thr Lys Ala Lys Cys Leu Gln Phe Arg Glu Tyr Leu Asn Asn Glu Leu 340 345 350 Gly Pro Ala Val Lys Arg Ile Ala Leu Asn Asn Asn Ala Asn Asp Arg 355 360 365 Leu Thr Val Asp Val Ser Val Asp Gln Val Gly Ser Ala Ile Ser Gln 370 375 380 Ile Thr Asp Gly Gln Ile Gln Ala Thr Thr Thr Ala Thr Thr Glu Ala 385 390 395 400 Thr Thr Thr Ala Ala Pro Ser Ser Thr Val Glu Thr Val Ser Pro Ser 405 410 415 Ser Thr Glu Thr Ile Ser Gln Gln Thr Glu Asn Gly Ala Ala Lys Ala 420 425 430 Ala Val Gly Met Gly Ala Gly Ala Leu Ala Ala Ala Ala Met Leu Leu 435 440 445 <210> 70 <211> 504 <212> PRT <213> Macaca mulatta <220> <223> amino acid sequence of hyaluronidase (HYAL) originating from Macaca mulatta with a N-terminal secretion signal and a C-terminal anchoring signal <400> 70 Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn 1 5 10 15 Phe Val Ala Ala Ser Arg Gly Pro Leu Leu Pro Asn Arg Pro Phe Ala 20 25 30 Thr Val Trp Asn Ala Asn Thr Gln Trp Cys Leu Glu Arg His Ser Val 35 40 45 Asp Val Asp Val Ser Ile Phe Asp Val Val Ala Asn Pro Gly Gln Thr 50 55 60 Phe Arg Gly Pro Asp Met Thr Ile Phe Tyr Ser Ser Gln Leu Gly Thr 65 70 75 80 Tyr Pro Tyr Tyr Thr Pro Thr Gly Glu Pro Val Phe Gly Gly Leu Pro 85 90 95 Gln Asn Ala Ser Leu Ile Ala His Leu Ala Arg Thr Phe Gln Asp Ile 100 105 110 Leu Ala Ala Ile Pro Ala Pro Asp Phe Ser Gly Leu Ala Val Ile Asp 115 120 125 Trp Glu Ala Trp Arg Pro Arg Trp Ala Phe Asn Trp Asp Thr Lys Asp 130 135 140 Ile Tyr Arg Gln Arg Ser Arg Ala Leu Val Gln Ala Gln His Pro Asp 145 150 155 160 Trp Pro Val Thr Gln Val Glu Ala Val Ala Gln Asp Gln Phe Gln Gly 165 170 175 Ala Ala Arg Ala Trp Met Ala Gly Thr Leu Gln Leu Gly Arg Ala Leu 180 185 190 Arg Pro Arg Gly Leu Trp Gly Phe Tyr Gly Phe Pro Asp Cys Tyr Asn 195 200 205 Tyr Asp Phe Leu Ser Pro Asn Tyr Thr Gly Gln Cys Pro Ser Gly Ile 210 215 220 Arg Ala Gln Asn Asp Gln Leu Gly Trp Leu Trp Gly Gln Ser Arg Ala 225 230 235 240 Leu Tyr Pro Ser Ile Tyr Met Pro Ala Val Leu Glu Gly Thr Gly Lys 245 250 255 Ser Gln Met Tyr Val Gln His Arg Val Ala Glu Ala Phe Arg Val Ala 260 265 270 Val Ala Ala Gly Asp Pro Asn Leu Pro Val Leu Pro Tyr Val Gln Ile 275 280 285 Phe Tyr Asp Met Thr Asn His Phe Leu Pro Leu Asp Glu Leu Glu His 290 295 300 Ser Leu Gly Glu Ser Ala Ala Gln Gly Ala Ala Gly Val Val Leu Trp 305 310 315 320 Val Ser Trp Glu Asn Thr Arg Thr Lys Glu Ser Cys Gln Ala Ile Lys 325 330 335 Glu Tyr Met Asp Thr Thr Leu Gly Pro Phe Ile Leu Asn Val Thr Ser 340 345 350 Gly Ala Leu Leu Cys Ser Gln Ala Leu Cys Ser Ser His Gly Arg Cys 355 360 365 Val Arg Arg Pro Ser His Pro Lys Ala Leu Leu Ile Leu Asn Pro Ala 370 375 380 Ser Phe Ser Ile Gln Leu Thr Pro Asp Gly Gly Pro Leu Ser Leu Arg 385 390 395 400 Gly Ala Leu Ser Leu Glu Asp Gln Ala Gln Met Ala Val Glu Phe Lys 405 410 415 Cys Arg Cys Tyr Pro Gly Trp Gln Gly Pro Trp Cys Glu Gln Lys Ser 420 425 430 Met Trp Gly Ser Ala Ile Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala 435 440 445 Thr Thr Thr Ala Thr Thr Glu Ala Thr Thr Thr Ala Ala Pro Ser Ser 450 455 460 Thr Val Glu Thr Val Ser Pro Ser Ser Thr Glu Thr Ile Ser Gln Gln 465 470 475 480 Thr Glu Asn Gly Ala Ala Lys Ala Ala Val Gly Met Gly Ala Gly Ala 485 490 495 Leu Ala Ala Ala Ala Met Leu Leu 500 <210> 71 <211> 360 <212> PRT <213> Vespa magnifica <220> <223> amino acid sequence of hyaluronidase (HYAL) originating from Vespa magnifica with a N-terminal secretion signal and a C-terminal anchoring signal <400> 71 Asp Asn Phe Gln Gly Asp Lys Ile Ala Ile Phe Tyr Asp Pro Gly Glu 1 5 10 15 Phe Pro Ala Leu Leu Pro Leu Asn Tyr Gly Lys Tyr Lys Ile Arg Asn 20 25 30 Gly Gly Val Pro Gln Glu Gly Asn Ile Thr Ile His Leu Gln Arg Phe 35 40 45 Ile Glu Tyr Leu Asp Lys Thr Tyr Pro Asn Arg Asn Phe Ser Gly Ile 50 55 60 Gly Val Ile Asp Phe Glu Arg Trp Arg Pro Ile Phe Arg Gln Asn Trp 65 70 75 80 Gly Asn Met Lys Ile Tyr Lys Asn Phe Ser Ile Asp Leu Val Arg Lys 85 90 95 Glu His Pro Phe Trp Asn Lys Lys Met Ile Glu Leu Glu Ala Ser Lys 100 105 110 Arg Phe Glu Lys Tyr Ala Arg Leu Phe Met Glu Glu Thr Leu Lys Leu 115 120 125 Ala Lys Lys Thr Arg Lys Gln Ala Asp Trp Gly Tyr Tyr Gly Tyr Pro 130 135 140 Tyr Cys Phe Asn Met Ser Pro Thr Asn Phe Val Pro Asp Cys Asp Val 145 150 155 160 Thr Ala Arg Asp Glu Asn Asn Glu Met Ser Trp Leu Phe Asn Asn Gln 165 170 175 Asn Val Leu Leu Pro Ser Val Tyr Ile Arg Arg Glu Leu Thr Pro Asp 180 185 190 Gln Arg Ile Gly Leu Val Gln Gly Arg Val Lys Glu Ala Val Arg Ile 195 200 205 Ser Asn Lys Leu Lys His Ser Pro Lys Val Phe Ser Tyr Trp Trp Tyr 210 215 220 Val Tyr Gln Asp Glu Thr Asn Thr Phe Leu Thr Glu Thr Asp Val Lys 225 230 235 240 Lys Thr Phe Gln Glu Ile Val Ile Asn Gly Gly Asp Gly Ile Ile Ile 245 250 255 Trp Gly Ser Ser Ser Asp Val Asn Ser Leu Ser Lys Cys Thr Arg Leu 260 265 270 Arg Glu Tyr Leu Leu Thr Val Leu Gly Pro Ile Ala Val Asn Val Thr 275 280 285 Glu Ala Val Asn Ala Ile Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala 290 295 300 Thr Thr Thr Ala Thr Thr Glu Ala Thr Thr Thr Ala Ala Pro Ser Ser 305 310 315 320 Thr Val Glu Thr Val Ser Pro Ser Ser Thr Glu Thr Ile Ser Gln Gln 325 330 335 Thr Glu Asn Gly Ala Ala Lys Ala Ala Val Gly Met Gly Ala Gly Ala 340 345 350 Leu Ala Ala Ala Ala Met Leu Leu 355 360 <210> 72 <211> 2154 <212> DNA <213> Saccharomyces cerevisiae <220> <223> nucleic acid sequence of glutamine-fructose-6-phosphate amidotransferase (GFA1) originating from Saccharomyces cerevisiae <400> 72 atgtgtggta tctttggtta ctgcaattat ctagtggaaa gatccagagg agaaattatc 60 gacaccttag tggatggttt acaaagatta gaatatagag gctatgattc caccggtatt 120 gctatcgatg gtgacgaagc tgattctact ttcatctata agcaaatcgg taaagtgagt 180 gctttgaaag aggagattac taagcaaaat ccgaacagag acgttacttt tgtctctcat 240 tgtggtattg cgcatactag atgggctact cacggtcgac cagaacaagt taactgtcac 300 cctcaaagat ctgacccaga agaccaattt gtggtcgttc ataatggtat catcacaaat 360 tttagagaac tgaagactct tttaattaac aaaggttata aattcgaaag tgataccgat 420 accgagtgta ttgctaaact atatttgcat ttatacaata caaatttaca aaatgggcat 480 gacttagatt tccacgaatt aaccaagcta gttcttttag aactagaagg ttcatacggg 540 ttattatgta aatcttgtca ctatcctaat gaggttatcg ccactagaaa agggtcccct 600 ttactgattg gtgtcaaatc tgaaaaaaaa ctaaaagtcg acttcgtgga tgtggaattt 660 cccgaagaaa acgctggtca accggaaatt ccattgaaat ctaacaacaa atcatttggc 720 ttgggcccaa agaaagctcg tgaatttgaa gctggttccc aaaatgccaa tttactacca 780 attgccgcca atgaatttaa cttgagacat tctcaatcca gggctttcct atcagaagat 840 ggatctccaa caccggtgga attttttgtt tcttcggatg cggcatctgt tgttaaacat 900 accaagaagg tgctattttt agaagatgac gatttggctc atatttacga tggtgagtta 960 catattcata gatctagaag agaagtaggc gcatcaatga caaggtccat tcaaacttta 1020 gagatggagt tagctcagat catgaagggc ccttacgacc attttatgca aaaggaaatc 1080 tatgagcaac cagaatctac tttcaatact atgagaggta gaatcgacta tgaaaataat 1140 aaagtgatat tgggtggttt aaaggcatgg ttaccagttg tcagaagagc acggagactg 1200 atcatgatcg catgcggtac ttcttatcat tcatgtttgg ctactcgtgc tatcttcgaa 1260 gaattatcag atatcccagt tagtgtggaa ttagcgtctg actttctgga cagaaaatgc 1320 cctgtcttca gagacgatgt atgcgtgttt gtttcacaaa gtggtgaaac tgcggatacc 1380 atgctggctc taaattattg tttagaaaga ggagccttaa ctgtcggaat tgttaacagt 1440 gttggttctt ctatctctcg tgtcacccac tgtggtgttc atattaacgc tggtcctgaa 1500 attggtgttg cctctacaaa agcttatact tcccagtata ttgccttagt gatgtttgct 1560 ctatcgctgt cagatgaccg tgtatcgaaa atagacagaa gaattgaaat cattcaaggc 1620 ttgaagttaa tcccgggcca aattaagcag gtattaaagc tggaaccaag aataaaaaag 1680 ctctgtgcga ctgaattaaa ggatcaaaaa tctctattgt tattgggtag aggttaccaa 1740 tttgctgctg ctctggaagg tgctttgaag atcaaagaaa tttcttatat gcattctgaa 1800 ggtgttttgg caggtgagtt gaagcacggt gtcttggcct tggtggacga aaacttgcca 1860 atcattgctt ttggtaccag agactctcta ttccctaaag tagtttcctc tattgagcaa 1920 gttactgtaa gaaagggcca tccaattatt atttgtaacg aaaatgatga agtgtgggcg 1980 caaaaatcta aatcaatcga cctgcaaacc ttagaagttc cacaaactgt tgattgttta 2040 caaggtctaa ttaatattat tccattacaa ctaatgtcat attggttggc tgttaataaa 2100 gggattgatg ttgattttcc aagaaacttg gctaaatctg ttaccgtcga ataa 2154 <210> 73 <211> 1788 <212> DNA <213> Chlorella virus <220> <223> reencoded nucleic acid sequence of glutamine-fructose-6-phosphate amidotransferase (GFA1) originating from Chlorella virus 1 (PBCV-1) <400> 73 atgtgcggga tcttcggtgc tgtgtcgaac aataatagca tagaagtttc catcaagggt 60 atacagaagc tagagtaccg cgggtacgat tcgtgtggaa tagcctatac agacggaggc 120 gccattgaac ggatcaggtc aatagatggg atcgacgact taaggaagaa aacaataaca 180 gagtcttccc cggtagctat cgctcattca aggtggagta ccactgggat tccaagtgtt 240 gtgaacgccc acccgcacat ctctcggggc acgtctggat gcgagtcgcg cattgcagtc 300 gtacacaatg gcattattga aaattaccag cagatccgca agtacttgat aaatcttggg 360 tatactttcg attcacagac cgacacggaa gtcattgctc atctaataga ctcgcagtat 420 aacgggaaca tcctgcacac cgtccaaatg gcagttaagc acctcaaagg aagctacgcc 480 atagcagtca tgtgccataa ggagtccggg aagatcgtgg tggcaaaaca gaagagtccg 540 ttggtattgg gtataggaag cgacggagct tattatatcg catcggacgt attggctctt 600 cccactaaca aagtggtcta cataagtgac ggattctctg ctgagttaag tcctggatcg 660 atgactatct atgatctgga tggcaataag gtagaatacg aggtggaaga cgttgaaatg 720 gagcagacgt cgatgtcttt agataacttt gatcactaca tgatcaaaga gatcaatgaa 780 cagccgatat caattctcaa tactattaag aacaaaggat tctatgcaga gatatttggt 840 gatctagcac atgaaatatt tcagaagatc gacaatatat tgattctagc ctgcggaact 900 tcgtatcatg caggtctcgt cgggaagcaa tggatagaga ccatctcacg catcccggtg 960 gatgttcata ttgcaagcga gtatgagccg acaattccac gagccaatac acttgtgata 1020 acgattagtc aaagcggcga gactgcggat acaatcgcag cccttcaacg agcgcaaaac 1080 gcaggaatga tatacacttt gtgtatctgc aacagcccca agtcaactct agtgcgcgag 1140 tcgataatga aatacataac caaatgcggt tcagaagttt ctgttgccag tactaaagca 1200 tttacgtcgc aacttgtggt gttgtatatg cttgcgaacg ttcttgcgaa caaaactgat 1260 gatctgctag gggatcttcc tcaagctatc gagagagtaa tctgtcttac taatgacgaa 1320 atgaagcgtt gggcggatga aatttgtact gccaaaagtg ccatcttctt agggagagga 1380 ctgaacgcac ctgtagcatt tgagggcgcg ctaaagttga aggaaatctc atatatccat 1440 gccgagggtt tcctcggtgg agagttgaag catgggccgc tggctttgtt ggacgataag 1500 atccctgtaa tcgtgactgt tgctgaccac gcttatttgg atcacattaa ggctaacatc 1560 gacgaggtat tggcacgaaa cgttaccgta tacgcgatcg tcgatcagta tgttaatatt 1620 gaaccacagg agcgactgca tgtagtaaaa gtgccgtttg tgagtaaaga gttttctccc 1680 atcatccaca caattccgat gcaattgtta tcgtattatg tcgcgatcaa gctgggcaag 1740 aacgttgaca agccacgtaa cctggcgaaa agtgttacaa cattctaa 1788 <210> 74 <211> 1788 <212> DNA <213> Chlorella virus <220> <223> reencoded nucleic acid sequence of glutamine-fructose-6-phosphate amidotransferase (GFA1) originating from Chlorella virus 1 (PBCV-1) <400> 74 atgtgtggca tctttggagc agtgtcaaac aacaactcta tcgaggtgtc aatcaagggt 60 attcagaagc tagaatatcg tgggtatgat tcgtgcggta ttgcgtatac agatgggggt 120 gcgattgagc gtatacgttc tattgacggc attgacgatc tgcgtaagaa aacaatcaca 180 gaatcatcac cagtggccat tgctcactcg cggtggagca ccactggaat tccatcagtg 240 gtgaacgcac atcctcatat ttctcgcgga accagtgggt gtgagtctcg tatcgcggta 300 gtccacaacg gtatcattga aaactatcag cagatccgaa aatatctcat caatcttggt 360 tatacgtttg atagtcaaac ggacacagag gtcattgcgc atttgattga ttctcagtac 420 aatgggaata tcttgcacac cgtccaaatg gctgtcaagc acctgaaggg ctcttatgcc 480 attgcagtta tgtgtcataa agagtctggt aaaatagtcg tggcgaaaca gaagtcaccc 540 ctcgtacttg gaatcggctc agatggtgct tactacatcg cttcggacgt gctggcgctg 600 ccgacaaata aagttgttta tatttcagac ggtttctccg cagaactatc tccagggagt 660 atgaccattt acgatcttga tggaaataaa gtagaatatg aagtagagga cgttgaaatg 720 gaacaaacta gtatgtctct cgataacttt gatcattaca tgattaagga aattaatgag 780 caaccaatca gtattctaaa cactataaaa aataaagggt tctatgcaga aatattcggt 840 gatttggctc atgaaatctt ccaaaaaata gacaacatcc tgatactggc ttgtggtaca 900 agttatcacg ccggtcttgt aggaaaacag tggatagaga ccatctctag aatccccgtg 960 gatgttcaca tcgcgagtga atacgaacct actattccga gagcgaacac attggtaatc 1020 actatttcac agtcgggtga aactgcggac acgatagcgg ctttgcaacg ggcccaaaac 1080 gccgggatga tttatacatt gtgtatttgc aattcaccaa agagcactct tgttcgtgag 1140 agcattatga agtacatcac gaaatgtggt tctgaggtgt cagtggcatc aacgaaggcg 1200 tttacttctc agctcgtagt actgtacatg ctggcaaacg tattggcaaa taaaaccgat 1260 gatttgctgg gagacctccc acaggcaata gaacgggtaa tttgtttgac aaatgacgaa 1320 atgaaacgat gggccgacga aatttgcact gcgaaatccg cgatcttcct gggaagagga 1380 ctaaacgcac cagttgcctt tgagggagcg ttgaagctca aagaaatctc ttacattcat 1440 gcagagggct tcctgggagg tgagttgaaa cacggccccc tcgcactcct tgatgacaag 1500 attcctgtta tcgtaaccgt agcagatcat gcttatttgg accatatcaa agcaaatatc 1560 gacgaagtgc ttgcgaggaa cgttacggta tacgccatag tagaccagta tgtgaacatc 1620 gagccccagg aacgccttca cgtcgtcaag gttccgtttg tatccaaaga attttctccg 1680 ataattcaca ctatcccgat gcaactgctt tcgtattacg tggcaattaa gcttggaaag 1740 aacgttgaca aaccaaggaa tcttgcaaaa tccgtgacta ccttttaa 1788 <210> 75 <211> 717 <212> PRT <213> Saccharomyces cerevisiae <220> <223> amino acid sequence of glutamine-fructose-6-phosphate amidotransferase (GFA1) originating from Saccharomyces cerevisiae <400> 75 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 76 <211> 595 <212> PRT <213> Chlorella virus <220> <223> amino acid sequence of glutamine-fructose-6-phosphate amidotransferase (GFA1) originating from Chlorella virus 1 (PBCV-1) <400> 76 Met Cys Gly Ile Phe Gly Ala Val Ser Asn Asn Asn Ser Ile Glu Val 1 5 10 15 Ser Ile Lys Gly Ile Gln Lys Leu Glu Tyr Arg Gly Tyr Asp Ser Cys 20 25 30 Gly Ile Ala Tyr Thr Asp Gly Gly Ala Ile Glu Arg Ile Arg Ser Ile 35 40 45 Asp Gly Ile Asp Asp Leu Arg Lys Lys Thr Ile Thr Glu Ser Ser Pro 50 55 60 Val Ala Ile Ala His Ser Arg Trp Ser Thr Thr Gly Ile Pro Ser Val 65 70 75 80 Val Asn Ala His Pro His Ile Ser Arg Gly Thr Ser Gly Cys Glu Ser 85 90 95 Arg Ile Ala Val Val His Asn Gly Ile Ile Glu Asn Tyr Gln Gln Ile 100 105 110 Arg Lys Tyr Leu Ile Asn Leu Gly Tyr Thr Phe Asp Ser Gln Thr Asp 115 120 125 Thr Glu Val Ile Ala His Leu Ile Asp Ser Gln Tyr Asn Gly Asn Ile 130 135 140 Leu His Thr Val Gln Met Ala Val Lys His Leu Lys Gly Ser Tyr Ala 145 150 155 160 Ile Ala Val Met Cys His Lys Glu Ser Gly Lys Ile Val Val Ala Lys 165 170 175 Gln Lys Ser Pro Leu Val Leu Gly Ile Gly Ser Asp Gly Ala Tyr Tyr 180 185 190 Ile Ala Ser Asp Val Leu Ala Leu Pro Thr Asn Lys Val Val Tyr Ile 195 200 205 Ser Asp Gly Phe Ser Ala Glu Leu Ser Pro Gly Ser Met Thr Ile Tyr 210 215 220 Asp Leu Asp Gly Asn Lys Val Glu Tyr Glu Val Glu Asp Val Glu Met 225 230 235 240 Glu Gln Thr Ser Met Ser Leu Asp Asn Phe Asp His Tyr Met Ile Lys 245 250 255 Glu Ile Asn Glu Gln Pro Ile Ser Ile Leu Asn Thr Ile Lys Asn Lys 260 265 270 Gly Phe Tyr Ala Glu Ile Phe Gly Asp Leu Ala His Glu Ile Phe Gln 275 280 285 Lys Ile Asp Asn Ile Leu Ile Leu Ala Cys Gly Thr Ser Tyr His Ala 290 295 300 Gly Leu Val Gly Lys Gln Trp Ile Glu Thr Ile Ser Arg Ile Pro Val 305 310 315 320 Asp Val His Ile Ala Ser Glu Tyr Glu Pro Thr Ile Pro Arg Ala Asn 325 330 335 Thr Leu Val Ile Thr Ile Ser Gln Ser Gly Glu Thr Ala Asp Thr Ile 340 345 350 Ala Ala Leu Gln Arg Ala Gln Asn Ala Gly Met Ile Tyr Thr Leu Cys 355 360 365 Ile Cys Asn Ser Pro Lys Ser Thr Leu Val Arg Glu Ser Ile Met Lys 370 375 380 Tyr Ile Thr Lys Cys Gly Ser Glu Val Ser Val Ala Ser Thr Lys Ala 385 390 395 400 Phe Thr Ser Gln Leu Val Val Leu Tyr Met Leu Ala Asn Val Leu Ala 405 410 415 Asn Lys Thr Asp Asp Leu Leu Gly Asp Leu Pro Gln Ala Ile Glu Arg 420 425 430 Val Ile Cys Leu Thr Asn Asp Glu Met Lys Arg Trp Ala Asp Glu Ile 435 440 445 Cys Thr Ala Lys Ser Ala Ile Phe Leu Gly Arg Gly Leu Asn Ala Pro 450 455 460 Val Ala Phe Glu Gly Ala Leu Lys Leu Lys Glu Ile Ser Tyr Ile His 465 470 475 480 Ala Glu Gly Phe Leu Gly Gly Glu Leu Lys His Gly Pro Leu Ala Leu 485 490 495 Leu Asp Asp Lys Ile Pro Val Ile Val Thr Val Ala Asp His Ala Tyr 500 505 510 Leu Asp His Ile Lys Ala Asn Ile Asp Glu Val Leu Ala Arg Asn Val 515 520 525 Thr Val Tyr Ala Ile Val Asp Gln Tyr Val Asn Ile Glu Pro Gln Glu 530 535 540 Arg Leu His Val Val Lys Val Pro Phe Val Ser Lys Glu Phe Ser Pro 545 550 555 560 Ile Ile His Thr Ile Pro Met Gln Leu Leu Ser Tyr Tyr Val Ala Ile 565 570 575 Lys Leu Gly Lys Asn Val Asp Lys Pro Arg Asn Leu Ala Lys Ser Val 580 585 590 Thr Thr Phe 595 <210> 77 <211> 1434 <212> DNA <213> Saccharomyces cerevisiae <220> <223> nucleic acid sequence of UDP-N-acetylglucosamine pyrophosphorylase (QRI1) originating from Saccharomyces cerevisiae <400> 77 atgactgaca caaaacagct attcattgaa gccggacaaa gtcaactttt ccacaattgg 60 gaaagcttgt ctcgcaaaga ccaagaagaa ttgctttcaa acctggagca aatatcttcc 120 aagaggtccc ctgcaaaact actggaagac tgtcaaaatg ctattaaatt ctcactagct 180 aactcttcta aggatactgg cgtcgaaatt tcaccattgc cccctacttc gtacgagtcg 240 cttattggca acagtaagaa agaaaatgaa tactggcgtt taggccttga agctattggc 300 aagggtgaag tcgcagtgat tttaatggct ggcggacaag gtacgcggtt aggatcctct 360 caaccaaagg gctgttacga cattggattg ccttctaaga aatctctttt tcaaattcaa 420 gctgaaaagt tgatcaggtt gcaagatatg gtaaaggaca aaaaggtaga aattccttgg 480 tatattatga catcaggccc cactagagcg gctactgagg catactttca agaacacaat 540 tattttggct tgaataaaga acaaattacg ttcttcaacc agggaaccct gcctgccttt 600 gatttaaccg ggaagcattt cctaatgaaa gacccagtaa acctatctca atcaccagat 660 ggaaatggtg gactctaccg tgccatcaag gaaaacaagt tgaacgaaga ctttgatagg 720 agaggaatca agcatgttta catgtactgt gtcgataatg tcctatctaa aatcgcagac 780 cctgtattta ttggttttgc catcaagcat ggcttcgaac tggccaccaa agccgttaga 840 aagagagatg cgcatgaatc agttgggtta attgctacta aaaacgagaa accatgtgtc 900 atagaatatt ctgaaatttc caatgaattg gctgaagcaa aggataaaga tggcttatta 960 aaactacgcg caggcaacat tgtaaatcat tattacctag tggatttact aaaacgtgat 1020 ttggatcagt ggtgtgagaa tatgccatat cacattgcga agaagaaaat tccagcttat 1080 gatagtgtta ccggcaagta cactaagcct accgaaccaa acggtataaa attagagcaa 1140 ttcatatttg atgtctttga cactgtacca ctgaacaagt ttgggtgctt agaagtagat 1200 agatgcaaag aattttcacc tttaaaaaac ggtcctggtt ctaagaacga taatcctgag 1260 accagcagac tagcatattt gaaactagga acctcgtggt tggaagatgc aggcgctatt 1320 gtaaaagatg gggtactagt cgaagtttcc agcaaattga gttatgcagg tgaaaatcta 1380 tcccagttca aaggtaaagt ctttgacaga agtggtatag tattagaaaa ataa 1434 <210> 78 <211> 477 <212> PRT <213> Saccharomyces cerevisiae <220> <223> amino acid sequence of UDP-N-acetylglucosamine pyrophosphorylase (QRI1) originating from Saccharomyces cerevisiae <400> 78 Met Thr Asp Thr Lys Gln Leu Phe Ile Glu Ala Gly Gln Ser Gln Leu 1 5 10 15 Phe His Asn Trp Glu Ser Leu Ser Arg Lys Asp Gln Glu Glu Leu Leu 20 25 30 Ser Asn Leu Glu Gln Ile Ser Ser Lys Arg Ser Pro Ala Lys Leu Leu 35 40 45 Glu Asp Cys Gln Asn Ala Ile Lys Phe Ser Leu Ala Asn Ser Ser Lys 50 55 60 Asp Thr Gly Val Glu Ile Ser Pro Leu Pro Pro Thr Ser Tyr Glu Ser 65 70 75 80 Leu Ile Gly Asn Ser Lys Lys Glu Asn Glu Tyr Trp Arg Leu Gly Leu 85 90 95 Glu Ala Ile Gly Lys Gly Glu Val Ala Val Ile Leu Met Ala Gly Gly 100 105 110 Gln Gly Thr Arg Leu Gly Ser Ser Gln Pro Lys Gly Cys Tyr Asp Ile 115 120 125 Gly Leu Pro Ser Lys Lys Ser Leu Phe Gln Ile Gln Ala Glu Lys Leu 130 135 140 Ile Arg Leu Gln Asp Met Val Lys Asp Lys Lys Val Glu Ile Pro Trp 145 150 155 160 Tyr Ile Met Thr Ser Gly Pro Thr Arg Ala Ala Thr Glu Ala Tyr Phe 165 170 175 Gln Glu His Asn Tyr Phe Gly Leu Asn Lys Glu Gln Ile Thr Phe Phe 180 185 190 Asn Gln Gly Thr Leu Pro Ala Phe Asp Leu Thr Gly Lys His Phe Leu 195 200 205 Met Lys Asp Pro Val Asn Leu Ser Gln Ser Pro Asp Gly Asn Gly Gly 210 215 220 Leu Tyr Arg Ala Ile Lys Glu Asn Lys Leu Asn Glu Asp Phe Asp Arg 225 230 235 240 Arg Gly Ile Lys His Val Tyr Met Tyr Cys Val Asp Asn Val Leu Ser 245 250 255 Lys Ile Ala Asp Pro Val Phe Ile Gly Phe Ala Ile Lys His Gly Phe 260 265 270 Glu Leu Ala Thr Lys Ala Val Arg Lys Arg Asp Ala His Glu Ser Val 275 280 285 Gly Leu Ile Ala Thr Lys Asn Glu Lys Pro Cys Val Ile Glu Tyr Ser 290 295 300 Glu Ile Ser Asn Glu Leu Ala Glu Ala Lys Asp Lys Asp Gly Leu Leu 305 310 315 320 Lys Leu Arg Ala Gly Asn Ile Val Asn His Tyr Tyr Leu Val Asp Leu 325 330 335 Leu Lys Arg Asp Leu Asp Gln Trp Cys Glu Asn Met Pro Tyr His Ile 340 345 350 Ala Lys Lys Lys Ile Pro Ala Tyr Asp Ser Val Thr Gly Lys Tyr Thr 355 360 365 Lys Pro Thr Glu Pro Asn Gly Ile Lys Leu Glu Gln Phe Ile Phe Asp 370 375 380 Val Phe Asp Thr Val Pro Leu Asn Lys Phe Gly Cys Leu Glu Val Asp 385 390 395 400 Arg Cys Lys Glu Phe Ser Pro Leu Lys Asn Gly Pro Gly Ser Lys Asn 405 410 415 Asp Asn Pro Glu Thr Ser Arg Leu Ala Tyr Leu Lys Leu Gly Thr Ser 420 425 430 Trp Leu Glu Asp Ala Gly Ala Ile Val Lys Asp Gly Val Leu Val Glu 435 440 445 Val Ser Ser Lys Leu Ser Tyr Ala Gly Glu Asn Leu Ser Gln Phe Lys 450 455 460 Gly Lys Val Phe Asp Arg Ser Gly Ile Val Leu Glu Lys 465 470 475 <210> 79 <211> 1713 <212> DNA <213> Saccharomyces cerevisiae <220> <223> nucleic acid sequence of Phosphoglucomutase-1 (PGM1) originating from Saccharomyces cerevisiae <400> 79 atgtcacttc taatagattc tgtaccaaca gttgcttata aggaccaaaa accgggtact 60 tcaggtttac gtaagaagac caaggttttc atggatgagc ctcattatac tgagaacttc 120 attcaagcaa caatgcaatc tatccctaat ggctcagagg gaaccacttt agttgttgga 180 ggagatggtc gtttctacaa cgatgttatc atgaacaaga ttgccgcagt aggtgctgca 240 aacggtgtca gaaagttagt cattggtcaa ggcggtttac tttcaacacc agctgcttct 300 catataatta gaacatacga ggaaaagtgt accggtggtg gtatcatatt aactgcctca 360 cacaacccag gcggtccaga gaatgattta ggtatcaagt ataatttacc taatggtggg 420 ccagctccag agagtgtcac taacgctatc tgggaagcgt ctaaaaaatt aactcactat 480 aaaattataa agaacttccc caagttgaat ttgaacaagc ttggtaaaaa ccaaaaatat 540 ggcccattgt tagtggacat aattgatcct gccaaagcat acgttcaatt tctgaaggaa 600 atttttgatt ttgacttaat taaaagcttc ttagcgaaac agcgcaaaga caaagggtgg 660 aagttgttgt ttgactcctt aaatggtatt acaggaccat atggtaaggc tatatttgtt 720 gatgaatttg gtttaccggc agaggaagtt cttcaaaatt ggcacccttt acctgatttc 780 ggcggtttac atcccgatcc gaatctaacc tatgcacgaa ctcttgttga cagggttgac 840 cgcgaaaaaa ttgcctttgg agcagcctcc gatggtgatg gtgataggaa tatgatttac 900 ggttatggcc ctgctttcgt ttcgccaggt gattctgttg ccattattgc cgaatatgca 960 cccgaaattc catacttcgc caaacaaggt atttatggct tggcacgttc atttcctaca 1020 tcctcagcca ttgatcgtgt tgcagcaaaa aagggattaa gatgttacga agttccaacc 1080 ggctggaaat tcttctgtgc cttatttgat gctaaaaagc tatcaatctg tggtgaagaa 1140 tccttcggta caggttccaa tcatatcaga gaaaaggacg gtctatgggc cattattgct 1200 tggttaaata tcttggctat ctaccatagg cgtaaccctg aaaaggaagc ttcgatcaaa 1260 actattcagg acgaattttg gaacgagtat ggccgtactt tcttcacaag atacgattac 1320 gaacatatcg aatgcgagca ggccgaaaaa gttgtagctc ttttgagtga atttgtatca 1380 aggccaaacg tttgtggctc ccacttccca gctgatgagt ctttaaccgt tatcgattgt 1440 ggtgattttt cgtatagaga tctagatggc tccatctctg aaaatcaagg ccttttcgta 1500 aagttttcga atgggactaa atttgttttg aggttatccg gcacaggcag ttctggtgca 1560 acaataagat tatacgtaga aaagtatact gataaaaagg agaactatgg ccaaacagct 1620 gacgtcttct tgaaacccgt catcaactcc attgtaaaat tcttaagatt taaagaaatt 1680 ttaggaacag acgaaccaac agtccgcaca tag 1713 <210> 80 <211> 570 <212> PRT <213> Saccharomyces cerevisiae <220> <223> amino acid sequence Phosphoglucomutase-1 (PGM1) originating from Saccharomyces cerevisiae <400> 80 Met Ser Leu Leu Ile Asp Ser Val Pro Thr Val Ala Tyr Lys Asp Gln 1 5 10 15 Lys Pro Gly Thr Ser Gly Leu Arg Lys Lys Thr Lys Val Phe Met Asp 20 25 30 Glu Pro His Tyr Thr Glu Asn Phe Ile Gln Ala Thr Met Gln Ser Ile 35 40 45 Pro Asn Gly Ser Glu Gly Thr Thr Leu Val Val Gly Gly Asp Gly Arg 50 55 60 Phe Tyr Asn Asp Val Ile Met Asn Lys Ile Ala Ala Val Gly Ala Ala 65 70 75 80 Asn Gly Val Arg Lys Leu Val Ile Gly Gln Gly Gly Leu Leu Ser Thr 85 90 95 Pro Ala Ala Ser His Ile Ile Arg Thr Tyr Glu Glu Lys Cys Thr Gly 100 105 110 Gly Gly Ile Ile Leu Thr Ala Ser His Asn Pro Gly Gly Pro Glu Asn 115 120 125 Asp Leu Gly Ile Lys Tyr Asn Leu Pro Asn Gly Gly Pro Ala Pro Glu 130 135 140 Ser Val Thr Asn Ala Ile Trp Glu Ala Ser Lys Lys Leu Thr His Tyr 145 150 155 160 Lys Ile Ile Lys Asn Phe Pro Lys Leu Asn Leu Asn Lys Leu Gly Lys 165 170 175 Asn Gln Lys Tyr Gly Pro Leu Leu Val Asp Ile Ile Asp Pro Ala Lys 180 185 190 Ala Tyr Val Gln Phe Leu Lys Glu Ile Phe Asp Phe Asp Leu Ile Lys 195 200 205 Ser Phe Leu Ala Lys Gln Arg Lys Asp Lys Gly Trp Lys Leu Leu Phe 210 215 220 Asp Ser Leu Asn Gly Ile Thr Gly Pro Tyr Gly Lys Ala Ile Phe Val 225 230 235 240 Asp Glu Phe Gly Leu Pro Ala Glu Glu Val Leu Gln Asn Trp His Pro 245 250 255 Leu Pro Asp Phe Gly Gly Leu His Pro Asp Pro Asn Leu Thr Tyr Ala 260 265 270 Arg Thr Leu Val Asp Arg Val Asp Arg Glu Lys Ile Ala Phe Gly Ala 275 280 285 Ala Ser Asp Gly Asp Gly Asp Arg Asn Met Ile Tyr Gly Tyr Gly Pro 290 295 300 Ala Phe Val Ser Pro Gly Asp Ser Val Ala Ile Ile Ala Glu Tyr Ala 305 310 315 320 Pro Glu Ile Pro Tyr Phe Ala Lys Gln Gly Ile Tyr Gly Leu Ala Arg 325 330 335 Ser Phe Pro Thr Ser Ser Ala Ile Asp Arg Val Ala Ala Lys Lys Gly 340 345 350 Leu Arg Cys Tyr Glu Val Pro Thr Gly Trp Lys Phe Phe Cys Ala Leu 355 360 365 Phe Asp Ala Lys Lys Leu Ser Ile Cys Gly Glu Glu Ser Phe Gly Thr 370 375 380 Gly Ser Asn His Ile Arg Glu Lys Asp Gly Leu Trp Ala Ile Ile Ala 385 390 395 400 Trp Leu Asn Ile Leu Ala Ile Tyr His Arg Arg Asn Pro Glu Lys Glu 405 410 415 Ala Ser Ile Lys Thr Ile Gln Asp Glu Phe Trp Asn Glu Tyr Gly Arg 420 425 430 Thr Phe Phe Thr Arg Tyr Asp Tyr Glu His Ile Glu Cys Glu Gln Ala 435 440 445 Glu Lys Val Val Ala Leu Leu Ser Glu Phe Val Ser Arg Pro Asn Val 450 455 460 Cys Gly Ser His Phe Pro Ala Asp Glu Ser Leu Thr Val Ile Asp Cys 465 470 475 480 Gly Asp Phe Ser Tyr Arg Asp Leu Asp Gly Ser Ile Ser Glu Asn Gln 485 490 495 Gly Leu Phe Val Lys Phe Ser Asn Gly Thr Lys Phe Val Leu Arg Leu 500 505 510 Ser Gly Thr Gly Ser Ser Gly Ala Thr Ile Arg Leu Tyr Val Glu Lys 515 520 525 Tyr Thr Asp Lys Lys Glu Asn Tyr Gly Gln Thr Ala Asp Val Phe Leu 530 535 540 Lys Pro Val Ile Asn Ser Ile Val Lys Phe Leu Arg Phe Lys Glu Ile 545 550 555 560 Leu Gly Thr Asp Glu Pro Thr Val Arg Thr 565 570 <210> 81 <211> 1500 <212> DNA <213> Saccharomyces cerevisiae <220> <223> nucleic acid sequence of UTP-glucose-1-phosphate uridylyltransferase (UGP1) originating from Saccharomyces cerevisiae <400> 81 atgtccacta agaagcacac caaaacacat tccacttatg cattcgagag caacacaaac 60 agcgttgctg cctcacaaat gagaaacgcc ttaaacaagt tggcggactc tagtaaactt 120 gacgatgctg ctcgcgctaa gtttgagaac gaactggatt cgtttttcac gcttttcagg 180 agatatttgg tagagaagtc ttctagaacc accttggaat gggacaagat caagtctccc 240 aacccggatg aagtggttaa gtatgaaatt atttctcagc agcccgagaa tgtctcaaac 300 ctttccaaat tggctgtttt gaagttgaac ggtgggctgg gtacctccat gggctgcgtt 360 ggccctaaat ctgttattga agtgagagag ggaaacacct ttttggattt gtctgttcgt 420 caaattgaat acttgaacag acagtacgat agcgacgtgc cattgttatt gatgaattct 480 ttcaacactg acaaggatac ggaacacttg attaagaagt attccgctaa cagaatcaga 540 atcagatctt tcaatcaatc caggttccca agagtctaca aggattcttt attgcctgtc 600 cccaccgaat acgattctcc actggatgct tggtatccac caggtcacgg tgatttgttt 660 gaatctttac acgtatctgg tgaactggat gccttaattg cccaaggaag agaaatatta 720 tttgtttcta acggtgacaa cttgggtgct accgtcgact taaaaatttt aaaccacatg 780 atcgagactg gtgccgaata tataatggaa ttgactgata agaccagagc cgatgttaaa 840 ggtggtactt tgatttctta cgatggtcaa gtccgtttat tggaagtcgc ccaagttcca 900 aaagaacaca ttgacgaatt caaaaatatc agaaagttta ccaacttcaa cacgaataac 960 ttatggatca atctgaaagc agtaaagagg ttgatcgaat cgagcaattt ggagatggaa 1020 atcattccaa accaaaaaac tataacaaga gacggtcatg aaattaatgt cttacaatta 1080 gaaaccgctt gtggtgctgc tatcaggcat tttgatggtg ctcacggtgt tgtcgttcca 1140 agatcaagat tcttgcctgt caagacctgt tccgatttgt tgctggttaa atcagatcta 1200 ttccgtctgg aacacggttc tttgaagtta gacccatccc gttttggtcc aaacccatta 1260 atcaagttgg gctcgcattt caaaaaggtt tctggtttta acgcaagaat ccctcacatc 1320 ccaaaaatcg tcgagctaga tcatttgacc atcactggta acgtcttttt aggtaaagat 1380 gtcactttga ggggtactgt catcatcgtt tgctccgacg gtcataaaat cgatattcca 1440 aacggctcca tattggaaaa tgttgtcgtt actggtaatt tgcaaatctt ggaacattga 1500 <210> 82 <211> 499 <212> PRT <213> Saccharomyces cerevisiae <220> <223> amino acid sequence of UTP--glucose-1-phosphate uridylyltransferase (UGP1) originating from Saccharomyces cerevisiae <400> 82 Met Ser Thr Lys Lys His Thr Lys Thr His Ser Thr Tyr Ala Phe Glu 1 5 10 15 Ser Asn Thr Asn Ser Val Ala Ala Ser Gln Met Arg Asn Ala Leu Asn 20 25 30 Lys Leu Ala Asp Ser Ser Lys Leu Asp Asp Ala Ala Arg Ala Lys Phe 35 40 45 Glu Asn Glu Leu Asp Ser Phe Phe Thr Leu Phe Arg Arg Tyr Leu Val 50 55 60 Glu Lys Ser Ser Arg Thr Thr Leu Glu Trp Asp Lys Ile Lys Ser Pro 65 70 75 80 Asn Pro Asp Glu Val Val Lys Tyr Glu Ile Ile Ser Gln Gln Pro Glu 85 90 95 Asn Val Ser Asn Leu Ser Lys Leu Ala Val Leu Lys Leu Asn Gly Gly 100 105 110 Leu Gly Thr Ser Met Gly Cys Val Gly Pro Lys Ser Val Ile Glu Val 115 120 125 Arg Glu Gly Asn Thr Phe Leu Asp Leu Ser Val Arg Gln Ile Glu Tyr 130 135 140 Leu Asn Arg Gln Tyr Asp Ser Asp Val Pro Leu Leu Leu Met Asn Ser 145 150 155 160 Phe Asn Thr Asp Lys Asp Thr Glu His Leu Ile Lys Lys Tyr Ser Ala 165 170 175 Asn Arg Ile Arg Ile Arg Ser Phe Asn Gln Ser Arg Phe Pro Arg Val 180 185 190 Tyr Lys Asp Ser Leu Leu Pro Val Pro Thr Glu Tyr Asp Ser Pro Leu 195 200 205 Asp Ala Trp Tyr Pro Pro Gly His Gly Asp Leu Phe Glu Ser Leu His 210 215 220 Val Ser Gly Glu Leu Asp Ala Leu Ile Ala Gln Gly Arg Glu Ile Leu 225 230 235 240 Phe Val Ser Asn Gly Asp Asn Leu Gly Ala Thr Val Asp Leu Lys Ile 245 250 255 Leu Asn His Met Ile Glu Thr Gly Ala Glu Tyr Ile Met Glu Leu Thr 260 265 270 Asp Lys Thr Arg Ala Asp Val Lys Gly Gly Thr Leu Ile Ser Tyr Asp 275 280 285 Gly Gln Val Arg Leu Leu Glu Val Ala Gln Val Pro Lys Glu His Ile 290 295 300 Asp Glu Phe Lys Asn Ile Arg Lys Phe Thr Asn Phe Asn Thr Asn Asn 305 310 315 320 Leu Trp Ile Asn Leu Lys Ala Val Lys Arg Leu Ile Glu Ser Ser Asn 325 330 335 Leu Glu Met Glu Ile Ile Pro Asn Gln Lys Thr Ile Thr Arg Asp Gly 340 345 350 His Glu Ile Asn Val Leu Gln Leu Glu Thr Ala Cys Gly Ala Ala Ile 355 360 365 Arg His Phe Asp Gly Ala His Gly Val Val Val Pro Arg Ser Arg Phe 370 375 380 Leu Pro Val Lys Thr Cys Ser Asp Leu Leu Leu Val Lys Ser Asp Leu 385 390 395 400 Phe Arg Leu Glu His Gly Ser Leu Lys Leu Asp Pro Ser Arg Phe Gly 405 410 415 Pro Asn Pro Leu Ile Lys Leu Gly Ser His Phe Lys Lys Val Ser Gly 420 425 430 Phe Asn Ala Arg Ile Pro His Ile Pro Lys Ile Val Glu Leu Asp His 435 440 445 Leu Thr Ile Thr Gly Asn Val Phe Leu Gly Lys Asp Val Thr Leu Arg 450 455 460 Gly Thr Val Ile Ile Val Cys Ser Asp Gly His Lys Ile Asp Ile Pro 465 470 475 480 Asn Gly Ser Ile Leu Glu Asn Val Val Val Thr Gly Asn Leu Gln Ile 485 490 495 Leu Glu His <210> 83 <211> 480 <212> DNA <213> Saccharomyces cerevisiae <220> <223> nucleic acid sequence of Glucosamine 6-phosphate N-acetyltransferase (GNA1) originating from Saccharomyces cerevisiae <400> 83 atgagcttac ccgatggatt ttatataagg cgaatggaag agggggattt ggaacaggtc 60 actgagacgc taaaggtttt gaccaccgtg ggcactatta cccccgaatc cttcagcaaa 120 ctcataaaat actggaatga agccacagta tggaatgata acgaagataa aaaaataatg 180 caatataacc ccatggtgat tgtggacaag cgcaccgaga cggttgccgc tacggggaat 240 atcatcatcg aaagaaagat cattcatgaa ctggggctat gtggccacat cgaggacatt 300 gcagtaaact ccaagtatca gggccaaggt ttgggcaagc tcttgattga tcaattggta 360 actatcggct ttgactacgg ttgttataag attattttag attgcgatga gaaaaatgtc 420 aaattctatg aaaaatgtgg gtttagcaac gcaggcgtgg aaatgcaaat tagaaaatag 480 <210> 84 <211> 159 <212> PRT <213> Saccharomyces cerevisiae <220> <223> amino acid sequence of Glucosamine 6-phosphate N-acetyltransferase (GNA1) originating from Saccharomyces cerevisiae <400> 84 Met Ser Leu Pro Asp Gly Phe Tyr Ile Arg Arg Met Glu Glu Gly Asp 1 5 10 15 Leu Glu Gln Val Thr Glu Thr Leu Lys Val Leu Thr Thr Val Gly Thr 20 25 30 Ile Thr Pro Glu Ser Phe Ser Lys Leu Ile Lys Tyr Trp Asn Glu Ala 35 40 45 Thr Val Trp Asn Asp Asn Glu Asp Lys Lys Ile Met Gln Tyr Asn Pro 50 55 60 Met Val Ile Val Asp Lys Arg Thr Glu Thr Val Ala Ala Thr Gly Asn 65 70 75 80 Ile Ile Ile Glu Arg Lys Ile Ile His Glu Leu Gly Leu Cys Gly His 85 90 95 Ile Glu Asp Ile Ala Val Asn Ser Lys Tyr Gln Gly Gln Gly Leu Gly 100 105 110 Lys Leu Leu Ile Asp Gln Leu Val Thr Ile Gly Phe Asp Tyr Gly Cys 115 120 125 Tyr Lys Ile Ile Leu Asp Cys Asp Glu Lys Asn Val Lys Phe Tyr Glu 130 135 140 Lys Cys Gly Phe Ser Asn Ala Gly Val Glu Met Gln Ile Arg Lys 145 150 155 <210> 85 <211> 1674 <212> DNA <213> Saccharomyces cerevisiae <220> <223> nucleic acid sequence of phosphoacetylglucosamine mutase (PCM1) originating from Saccharomyces cerevisiae <400> 85 atgaaggttg attacgagca attgtgcaaa ctctacgatg acacgtgccg cacaaagaat 60 gtgcagttca gttacggtac ggccggattc agaacgctgg ccaagaattt ggatacggtg 120 atgttcagta ctggtatact ggcggttctc aggtcgctga agcttcaggg tcagtatgtg 180 ggggtgatga tcacggcgtc gcacaaccca taccaggaca acggggtcaa gatcgtggaa 240 ccagacggat cgatgctttt ggccacatgg gagccatatg ccatgcagtt ggccaatgcg 300 gcctcttttg ccactaattt tgaagaattt cgtgttgagt tggccaagct gattgaacac 360 gaaaagattg atttgaatac aaccgtcgtg cctcacatcg tggttgggag agactctagg 420 gaaagtagtc catacttgct gcgctgcttg acttcctcca tggccagcgt cttccacgcg 480 caagttttgg acctaggctg tgtcactacg cctcaattgc attacattac tgatttgtcc 540 aacaggcgga aactggaagg agacacagcg ccagttgcca cagaacagga ctactattcg 600 ttctttatag gagccttcaa cgagctcttc gccacgtatc agctggagaa gaggctgtct 660 gtcccaaaat tgttcataga cacagccaat ggtatcggtg gtccacagtt gaaaaaacta 720 ctggcctccg aagattggga cgtgccagcg gagcaagttg aggtaatcaa cgacaggtcc 780 gatgttccag aactgttgaa ttttgaatgc ggtgcggatt atgtgaagac taaccagaga 840 ttacccaagg gtctttctcc atcctcgttt gattcgctat attgctcctt tgatggtgac 900 gcagacaggg ttgtgttcta ctatgtcgac tcaggatcaa aatttcattt gttggatggt 960 gacaaaattt ccactttgtt tgcaaagttc ttgtctaaac aactagaatt ggcacaccta 1020 gaacattctt tgaagattgg tgttgtgcaa actgcctatg caaacggcag ttccaccgct 1080 tacataaaaa atacgttgca ctgtcccgtg tcttgcacta agacaggtgt taaacacttg 1140 catcatgaag ctgccactca gtacgatatt ggcatttatt tcgaagcaaa tggacatggt 1200 acgattatat tcagcgaaaa atttcatcga actatcaaat ctgaattatc caagtccaag 1260 ttaaatggtg atacgttagc tttgagaact ttgaagtgtt tctctgaatt gattaatcag 1320 accgtgggag atgctatttc agacatgctt gctgtccttg ctactttggc gattttgaaa 1380 atgtcgccaa tggattggga tgaagagtat actgatttgc ccaacaagct ggttaagtgc 1440 atcgttcctg ataggtcaat tttccaaacc acggaccagg aaagaaaatt gctcaatcca 1500 gtggggttgc aagacaagat agatcttgtg gtagccaagt atcccatggg aagaagcttt 1560 gtcagagcca gtggtacgga ggatgcggtg agggtttatg cggaatgtaa ggactcctct 1620 aagttaggtc aattttgtga cgaagtggtg gagcacgtta aggcatctgc ttga 1674 <210> 86 <211> 557 <212> PRT <213> Saccharomyces cerevisiae <220> <223> amino acid sequence of phosphoacetylglucosamine mutase (PCM1) originating from Saccharomyces cerevisiae <400> 86 Met Lys Val Asp Tyr Glu Gln Leu Cys Lys Leu Tyr Asp Asp Thr Cys 1 5 10 15 Arg Thr Lys Asn Val Gln Phe Ser Tyr Gly Thr Ala Gly Phe Arg Thr 20 25 30 Leu Ala Lys Asn Leu Asp Thr Val Met Phe Ser Thr Gly Ile Leu Ala 35 40 45 Val Leu Arg Ser Leu Lys Leu Gln Gly Gln Tyr Val Gly Val Met Ile 50 55 60 Thr Ala Ser His Asn Pro Tyr Gln Asp Asn Gly Val Lys Ile Val Glu 65 70 75 80 Pro Asp Gly Ser Met Leu Leu Ala Thr Trp Glu Pro Tyr Ala Met Gln 85 90 95 Leu Ala Asn Ala Ala Ser Phe Ala Thr Asn Phe Glu Glu Phe Arg Val 100 105 110 Glu Leu Ala Lys Leu Ile Glu His Glu Lys Ile Asp Leu Asn Thr Thr 115 120 125 Val Val Pro His Ile Val Val Gly Arg Asp Ser Arg Glu Ser Ser Pro 130 135 140 Tyr Leu Leu Arg Cys Leu Thr Ser Ser Met Ala Ser Val Phe His Ala 145 150 155 160 Gln Val Leu Asp Leu Gly Cys Val Thr Thr Pro Gln Leu His Tyr Ile 165 170 175 Thr Asp Leu Ser Asn Arg Arg Lys Leu Glu Gly Asp Thr Ala Pro Val 180 185 190 Ala Thr Glu Gln Asp Tyr Tyr Ser Phe Phe Ile Gly Ala Phe Asn Glu 195 200 205 Leu Phe Ala Thr Tyr Gln Leu Glu Lys Arg Leu Ser Val Pro Lys Leu 210 215 220 Phe Ile Asp Thr Ala Asn Gly Ile Gly Gly Pro Gln Leu Lys Lys Leu 225 230 235 240 Leu Ala Ser Glu Asp Trp Asp Val Pro Ala Glu Gln Val Glu Val Ile 245 250 255 Asn Asp Arg Ser Asp Val Pro Glu Leu Leu Asn Phe Glu Cys Gly Ala 260 265 270 Asp Tyr Val Lys Thr Asn Gln Arg Leu Pro Lys Gly Leu Ser Pro Ser 275 280 285 Ser Phe Asp Ser Leu Tyr Cys Ser Phe Asp Gly Asp Ala Asp Arg Val 290 295 300 Val Phe Tyr Tyr Val Asp Ser Gly Ser Lys Phe His Leu Leu Asp Gly 305 310 315 320 Asp Lys Ile Ser Thr Leu Phe Ala Lys Phe Leu Ser Lys Gln Leu Glu 325 330 335 Leu Ala His Leu Glu His Ser Leu Lys Ile Gly Val Val Gln Thr Ala 340 345 350 Tyr Ala Asn Gly Ser Ser Thr Ala Tyr Ile Lys Asn Thr Leu His Cys 355 360 365 Pro Val Ser Cys Thr Lys Thr Gly Val Lys His Leu His His Glu Ala 370 375 380 Ala Thr Gln Tyr Asp Ile Gly Ile Tyr Phe Glu Ala Asn Gly His Gly 385 390 395 400 Thr Ile Ile Phe Ser Glu Lys Phe His Arg Thr Ile Lys Ser Glu Leu 405 410 415 Ser Lys Ser Lys Leu Asn Gly Asp Thr Leu Ala Leu Arg Thr Leu Lys 420 425 430 Cys Phe Ser Glu Leu Ile Asn Gln Thr Val Gly Asp Ala Ile Ser Asp 435 440 445 Met Leu Ala Val Leu Ala Thr Leu Ala Ile Leu Lys Met Ser Pro Met 450 455 460 Asp Trp Asp Glu Glu Tyr Thr Asp Leu Pro Asn Lys Leu Val Lys Cys 465 470 475 480 Ile Val Pro Asp Arg Ser Ile Phe Gln Thr Thr Asp Gln Glu Arg Lys 485 490 495 Leu Leu Asn Pro Val Gly Leu Gln Asp Lys Ile Asp Leu Val Val Ala 500 505 510 Lys Tyr Pro Met Gly Arg Ser Phe Val Arg Ala Ser Gly Thr Glu Asp 515 520 525 Ala Val Arg Val Tyr Ala Glu Cys Lys Asp Ser Ser Lys Leu Gly Gln 530 535 540 Phe Cys Asp Glu Val Val Glu His Val Lys Ala Ser Ala 545 550 555 <210> 87 <211> 574 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pTDH3 <400> 87 ctgctgtaac ccgtacatgc ccaaaatagg gggcgggtta cacagaatat ataacatcgt 60 aggtgtctgg gtgaacagtt tattcctggc atccactaaa tataatggag cccgcttttt 120 aagctggcat ccagaaaaaa aaagaatccc agcaccaaaa tattgttttc ttcaccaacc 180 atcagttcat aggtccattc tcttagcgca actacagaga acaggggcac aaacaggcaa 240 aaaacgggca caacctcaat ggagtgatgc aacctgcctg gagtaaatga tgacacaagg 300 caattgaccc acgcatgtat ctatctcatt ttcttacacc ttctattacc ttctgctctc 360 tctgatttgg aaaaagctga aaaaaaaggt tgaaaccagt tccctgaaat tattccccta 420 cttgactaat aagtatataa agacggtagg tattgattgt aattctgtaa atctatttct 480 taaacttctt aaattctact tttatagtta gtcttttttt tagttttaaa acaccaagaa 540 cttagtttcg aataaacaca cataaacaaa caaa 574 <210> 88 <211> 585 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pTDH3.Sk <400> 88 caattcatcg gcccttttag cggctacccg cgccatctaa atgatagggc gggtgacact 60 atggtaaatc ccataattag gtgtctgggt gagtggttct gatgccggca tccactaaat 120 atattggagc ccatttttta cgcgggcttc cagaaaaaaa gagaatccca gcaccaaaag 180 gtggttctct tcaccaacca tcagatcata ggtccacaac cacacataac aggggcacaa 240 aaaggcaaaa aacggacata acctcaatgg agtgatgcaa attgactgga gcaaaagctg 300 acacaaggca ttgattgacc tacgcatgta tctgtattct tttcttacac cttctattac 360 cttctaactc tttgggttgg aaaaaactga aaaaaaaggt tgggacctgg ttcccccaag 420 ttgtccccct acttggttat taaatatata aagacagcaa gtgttgatta taatcttgta 480 aatctatagt tcttaatcta tacttctatt tatattttaa attagtcttt ttatttccaa 540 gtccccaaga acttagtttc gaataaacac acacaaataa acaca 585 <210> 89 <211> 700 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pTDH3-1.sba <400> 89 gcagcgcttc ttccgctcta gtttttatag ttattattac taccacctta aaaatacgta 60 aatactcaaa atagtagtga tattcccaac cttattcatc caaggcacat catcatcatc 120 agccattcat ctttcacctg ccattagtaa cccgtcttct cattgagcgg gttacggcag 180 ccacaggcca cattccgaat gtctgggtga gcggtccctt ttccagcatc cactaaatat 240 ctccgatccc gctttttaat ctggcttcct gaaaaaaaga gaatcccagc accaaaaaat 300 ggctctcttc accaaccatc agatcatagg tcccattctc ttaccgcaac cgtacagaac 360 aggggaaaac gggtacaacc tcaatggagt gatgcaaact gactggagca aaaagctgac 420 acaaggcaat cgacctacgt gtctgtctat tttctcacac cttctattac cttctaactc 480 tctgggttgg aaaaaactga aaaaaaggtt gagaccagtt tccacaaatc atccccctgt 540 ttgattaata aatatataaa gacgacaact atcgatcata aactcataaa actataactc 600 ctttacactt cttattttat agttattcta ttttaattct tattgatttt aaaaccccaa 660 gaacttagtt tcgaaaacac acacacacaa acaattaaaa 700 <210> 90 <211> 602 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pTDH3.Sar <400> 90 gagctaaata tcagcccttc gggtcctgcc tgctacccgg tcctgttcga ataaaaacgc 60 gggtaacacg acccagtaac acctgtcgtt gggtgtctgg gtcagaagtt ctgataccgg 120 cttccactaa atagattggg ttccgctctt tacgctggct tcctgaaaaa agagattccg 180 ggcaccaaaa aattggtctc tttgccaacc atcagatcat aggtccattc tcttaccata 240 accacacagg ataggggcac cacaggcgaa aatgggcaca aaatctcaat ggagtgatgc 300 aaattagctg gaacaaaagc tgacacaagg caattaacct gcgcatgtat ccatctcctt 360 ttcttacacc ttctcttacg ttctaactgt ttgggttgga aaaattaaaa aaaaaaggtt 420 gagaccagtt tccccaaatc gtccccctac ttgattcata aatatataaa gacgacaact 480 attgattata atcttgtaaa tctataactc tttactttct cctatttata atttaactta 540 atctttttag atttaaaacc ccaagaactt agtttcgaac aaacacacac aaataaacaa 600 aa 602 <210> 91 <211> 550 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pENO2 <400> 91 cgctcagcat ctgcttcttc ccaaagatga acgcggcgtt atgtcactaa cgacgtgcac 60 caacttgcgg aaagtggaat cccgttccaa aactggcatc cactaattga tacatctaca 120 caccgcacgc cttttttctg aagcccactt tcgtggactt tgccatatgc aaaattcatg 180 aagtgtgata ccaagtcagc atacacctca ctagggtagt ttctttggtt gtattgatca 240 tttggttcat cgtggttcat taattttttt tctccattgc tttctggctt tgatcttact 300 atcatttgga tttttgtcga aggttgtaga attgtatgtg acaagtggca ccaagcatat 360 ataaaaaaaa aaagcattat cttcctacca gagttgattg ttaaaaacgt atttatagca 420 aacgcaattg taattaattc ttattttgta tcttttcttc ccttgtctca atcttttatt 480 tttattttat ttttcttttc ttagtttctt tcataacacc aagcaactaa tactataaca 540 tacaataata 550 <210> 92 <211> 598 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pTEF3 <400> 92 ggctgataat agcgtataaa caatgcatac tttgtacgtt caaaatacaa tgcagtagat 60 atatttatgc atattacata taatacatat cacataggaa gcaacaggcg cgttggactt 120 ttaattttcg aggaccgcga atccttacat cacacccaat cccccacaag tgatccccca 180 cacaccatag cttcaaaatg tttctactcc ttttttactc ttccagattt tctcggactc 240 cgcgcatcgc cgtaccactt caaaacaccc aagcacagca tactaaattt cccctctttc 300 ttcctctagg gtgtcgttaa ttacccgtac taaaggtttg gaaaagaaaa aagagaccgc 360 ctcgtttctt tttcttcgtc gaaaaaggca ataaaaattt ttatcacgtt tctttttctt 420 gaaaattttt ttttttgatt tttttctctt tcgatgacct cccattgata tttaagttaa 480 taaacggtct tcaatttctc aagtttcagt ttcatttttc ttgttctatt acaacttttt 540 ttacttcttg ctcattagaa agaaagcata gcaatctaat ctaagtttta attacaaa 598 <210> 93 <211> 383 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pTEF1 <400> 93 gtttagcttg cctcgtcccc gccgggtcac ccggccagcg acatggaggc ccagaatacc 60 ctccttgaca gtcttgacgt gcgcagctca ggggcatgat gtgactgtcg cccgtacatt 120 tagcccatac atccccatgt ataatcattt gcatccatac attttgatgg ccgcacggcg 180 cgaagcaaaa attacggctc ctcgctgcag acctgcgagc agggaaacgc tcccctcaca 240 gacgcgttga attgtcccca cgccgcgccc ctgtagagaa atataaaagg ttaggatttg 300 ccactgaggt tcttctttca tatacttcct tttaaaatct tgctacgata cagttctcac 360 atcacatccg aacataaaca acc 383 <210> 94 <211> 383 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pTEF1.ago <400> 94 gtttagcttg cctcgtcccc gccgggtcac ccggccagcg acatggaggc ccagaatacc 60 ctccttgaca gtcttgacgt gcgcagctca ggggcatgat gtgactgtcg cccgtacatt 120 tagcccatac atccccatgt ataatcattt gcatccatac attttgatgg ccgcacggcg 180 cgaagcaaaa attacggctc ctcgctgcag acctgcgagc agggaaacgc tcccctcaca 240 gacgcgttga attgtcccca cgccgcgccc ctgtagagaa atataaaagg ttaggatttg 300 ccactgaggt tcttctttca tatacttcct tttaaaatct tgctacgata cagttctcac 360 atcacatccg aacataaaca acc 383 <210> 95 <211> 498 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pTEF1.Sba <400> 95 cgccaacaaa ccttcgaaca ctttaatttt cgaggaccgc agatcctcac atcacaccca 60 cacccaagac tgcttccccc acacaccctg catctgtaca ctttcttctg ctctgttttt 120 ctctccggcg ttctctcggg tcgcccgcat cgccgcgccg gctggaaccg cccacgcacc 180 gcatattgca aatcgcctgc cccctcttgc tcctttttga gggcgcgccg ttacccgcgc 240 ccagggtccg gaaaaagaaa caaggctcta ccgcgtttct ttttccttgt cgaaaaaggc 300 aaaaatgaaa atttttatca cgtttctttt tttttgaaaa attttttttt tggttttttt 360 tctttcgatg gcctcccatt gatatttaag ttaataaatg gttttcagtt ttcaagtttc 420 agtttgtgtt cttctttgct aactttcact tacacctcga aagaaagtat agcaatctaa 480 tcttagtttt aattacaa 498 <210> 96 <211> 700 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pPDC1 <400> 96 ttatttacct atctctaaac ttcaacacct tatatcataa ctaatatttc ttgagataag 60 cacactgcac ccataccttc cttaaaaacg tagcttccag tttttggtgg ttccggcttc 120 cttcccgatt ccgcccgcta aacgcatatt tttgttgcct ggtggcattt gcaaaatgca 180 taacctatgc atttaaaaga ttatgtatgc tcttctgact tttcgtgtga tgaggctcgt 240 ggaaaaaatg aataatttat gaatttgaga acaattttgt gttgttacgg tattttacta 300 tggaataatc aatcaattga ggattttatg caaatatcgt ttgaatattt ttccgaccct 360 ttgagtactt ttcttcataa ttgcataata ttgtccgctg cccctttttc tgttagacgg 420 tgtcttgatc tacttgctat cgttcaacac caccttattt tctaactatt ttttttttag 480 ctcatttgaa tcagcttatg gtgatggcac atttttgcat aaacctagct gtcctcgttg 540 aacataggaa aaaaaaatat ataaacaagg ctctttcact ctccttgcaa tcagatttgg 600 gtttgttccc tttattttca tatttcttgt catattcctt tctcaattat tattttctac 660 tcataacctc acgcaaaata acacagtcaa atcaatcaaa 700 <210> 97 <211> 924 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pCCW12 <400> 97 aactgtaaac aggtacaatg cggacccttt tgccacaaaa catacatcat tcattgccgg 60 aaaaagaaag aagtgaagac agcagtgcag ccagccatgt tgcgccaatc taattataga 120 tgctggtgcc ctgaggatgt atctggagcc agccatggca tcatgcgcta ccgccggatg 180 taaaatccga cacgcaaaag aaaaccttcg aggttgcgca cttcgcccac ccatgaacca 240 cacggttagt ccaaaagggg cagttcagat tccagatgcg ggaattagct tgctgccacc 300 ctcacctcac taacgctgcg gtgtgcggat acttcatgct atttatagac gcgcgtgtcg 360 gaatcagcac gcgcaagaac caaatgggaa aatcggaatg ggtccagaac tgctttgagt 420 gctggctatt ggcgtctgat ttccgttttg ggaatccttt gccgcgcgcc cctctcaaaa 480 ctccgcacaa gtcccagaaa gcgggaaaga aataaaacgc caccaaaaaa aaaaataaaa 540 gccaatcctc gaagcgtggg tggtaggccc tggattatcc cgtacaagta tttctcagga 600 gtaaaaaaac cgtttgtttt ggaattcccc atttcgcggc cacctacgcc gctatctttg 660 caacaactat ctgcgataac tcagcaaatt ttgcatattc gtgttgcagt attgcgataa 720 tgggagtctt acttccaaca taacggcaga aagaaatgtg agaaaatttt gcatcctttg 780 cctccgttca agtatataaa gtcggcatgc ttgataatct ttctttccat cctacattgt 840 tctaattatt cttattctcc tttattcttt cctaacatac caagaaatta atcttctgtc 900 attcgcttaa acactatatc aata 924 <210> 98 <211> 976 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pCCW12.Sm <400> 98 cgttgtgctg tagtgaagga agactaaaaa ggataatcac agttgtaaag aggtataatg 60 cggacccttt tgccacaaaa cacacatctt tcgtttccaa aataagaaag aagaaagcaa 120 aaagattagc agccacgttg ctgcgatcta attatagacg gtggcgtcat cattctcacc 180 caagattgtg tcttgaacct gccacgggtc ctgcgttatc gccggatgta aaactagaca 240 tgcaaaaaaa ggaccttcca ggtagcgtgc tccacaccac ccatgaccac cacagttagt 300 ccaaaagagg cagcaccact tcccgatggg ggaattagat tgctgccacc ctcacctcac 360 taatgctgcg gtgtgcggat atgccctgct atatatagct ccgcgttttt gaaccagcac 420 agcgcgagca ccaaaaagga aaatcgcata ggcccagaac tgatttcagc acgggctatt 480 ggcgttgggt ttccgttctg ggaaaccttc gccgcgtccc cctcacaaac ctccgcacaa 540 gttcgagcaa gcgggaaaaa acgaaaaacg ccattaatac taaataaagc aaatcctcga 600 agcgtgggtg gcaagcccct ggatttttcc gcacaagtac tcttctcagg agtaaaaaaa 660 cccgtttgtt ttggaattcc ccatttcgcg gccatctacg ccggtatctt cgcaatatct 720 atcagcgata actcagcaat tttaatattc gtgttgcagt gctgcgatag cgggagtctt 780 gtttgtaaca taacggcaga aaggaatgag agaaaatttt ccattctttg gcctccgttc 840 aagtatataa agccggcatg cttggtaatc tttctctctc ttctgtattg tttctataat 900 acttttatct tctaattatt ttctgaaaaa accaagaaat taatcttctg tcattcgctt 960 aaacactata tcaata 976 <210> 99 <211> 750 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pCCW12.Sk <400> 99 tgtaaaatcc tacacgcaaa aaacctcttg ggttgcgcgt tttccaccac ccacgacccg 60 cacaatcaat ccaaaagggg caacgccagt tcccaatgcg ggaattagct cctcaccccc 120 ctcacccgct aacgctgcgg tgtgcggaca cgcagcagta tttatagatc ctcgtgttgg 180 aaccagcccg cgtgagcacc aaattggaaa gtcgcaatgg gcccagaacc gctttcagta 240 ctgggccatt ggcgtctagt ttccgttttg agcgtccttc gccgcgtctc tctgtgaaat 300 ccccgcacaa gtctgagcag gcaaaaaaaa aaaacgccac caaaaataaa taaagccaat 360 cctcgaagga tgagtaggaa aggaagcccc tggttttttc ccgcacgaat atttttcagg 420 agtgaaaaaa tccgtttgtt ttggaattcc ccatttcgcg ctcacctacg ccggtatctt 480 tggaacaact atcagcgata actcagcaaa atttgcatat ccgtgctgca atagtgcgat 540 agtgggattg ggagtcttgt tgcatcataa cggcagaaag gaatgaataa aaattttccg 600 ttctttgtct ccgttcaagt atataaagtc ggcatgcttg attatctttt cttctcttct 660 actacatttc tatttcactt tctactctat tcttccctga aaaacccaag aaaataatct 720 tctgtcattc gcttaaacaa tatatcaaaa 750 <210> 100 <211> 750 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pCCW12.Sba <400> 100 accatgccac ggtgctggcc ccacttccac ccacgacccg cacggttggc ccgaaagggg 60 caacaccagt tcccaatacg gaaattagtc cgccaccacc ctcacctcgc tagagctgcg 120 gtgtgcgggc gtgcatcgct atttatagac atgcctgctg gcgtcaccgc gcgcgagcac 180 caaacaggaa aatcgcactg ggcccagaac cacgctatgc gctgggccga tggcgtccgg 240 tttccctttg ggagccccct gccacgttcg cctaacaaat ccccgcaccg gcttgagaaa 300 aaagcgaaaa gcgaaaaaaa aaaatcaacg ccaccaaaat taaaaaaaaa gagccatcct 360 cgaagggtga atagtagccc ctgacttttc ccgcacagac agacaccttt caggagtgaa 420 caaaaaagca gtttgttttg gaattccccc atttcgcggt ggcctgcgca ggtatctctg 480 cgtcaactat cagcgataac tcagcaaatt ttgcatattc gtgttgcgat actacgataa 540 tgggagtctg tcgcctaata acggcaacaa ggaatgagag agaaaaattt tcttcattct 600 ccagctcccg ttcaagtata taaggtcggc atggtcgatt gtctttcctt ctcttcagtt 660 acgtctctct atttacatta ttcttatttt tatttaataa aaaccccaag aaattaatct 720 tctgtcattc gcttaaacac tatatcaaaa 750 <210> 101 <211> 750 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pCCW12.Sar <400> 101 aaaaaacaac cttctgccaa cctgcgtgct tctcaccacc catgacccac acaattgacc 60 cgaatggggc aactccagtt cccaatacgg gaattaactc gccaccatat ttaccgcgtt 120 gaagctgtgg tgtgcggaca ctccgtacta tttatagacc cacgcggtgg aaccagcacg 180 cgcgcgcact aaacaggaaa atcgcattga gtccagaacc gccaccagca cttggccatt 240 ggcgtctaat ttccgttttc ggcgcccctc accgcgtcct tctaacaaag cgcgcacaag 300 cttgagcaag tgaaaagaaa attaaaaata aaaaaccgcc accaaaacaa ataaagcaat 360 cttcgaagtg tgggttggtg ggaagcccct ggcttttccc gcaccagtcg ttttcaggag 420 taaaaaaata cccgtttgtt ttggaattcc ccatttcgcg gcgacctgcg ccggtatctt 480 tgcaacaact atttgcgata actcagcaaa atttgcatat tcgtgttggg atattgcgat 540 agtgggagtc ttgttgcata ataacggtaa aaagaagtga aggaaaaaaa tttgcatcct 600 ttagtctcag ttcaagtata taaagtcggg atattcaatt atctttcttt ctcttgctca 660 aaggtttcta tatttttttt atagtatttc ttttgttata aaataccaag aaattaatct 720 tctgtcattc gcttaaatac tacatcaata 750 <210> 102 <211> 500 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pNUP57 <400> 102 tcatctgcgc aatgactatc aagaccttct gcaagaattt caaatctcac tgaaaatctt 60 gaccgaaaag tgtcttgaaa acccatcaag cctgcaaaac ctatctttga cattagtctc 120 cattataaaa acggcatagt tgggagaaaa ctttccatac ttcaattgtg gactgatata 180 agtattttag ttttgcccgc atgatcatcc cacatggcta cagcagttct ctcataggaa 240 aatagtacaa tagctacgtg atataatcta aataattgtt gccaatgtgt aattatatca 300 ttttgaacgt acgcgaaatg gattattttc aaaaattttg tttcttgaaa tgagtaaaag 360 caaaagtcca actctccaag tcgatgtaaa caactttttg ccaaagggac tgaaagacta 420 aatcgaggat tatcccgttc aaactattcc agaaacgctc gttagtaaca aaagacatac 480 cttgttgacc aattgatcac 500 <210> 103 <211> 523 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pCCW10.ago <400> 103 ggtaccacgg caacctcgtt cgctgttcat ccccttcgtc acacaggacg ttggatgccg 60 taagcagcgt tgcttttgat cctcaggatc ggccgggtaa cccgcggctg cttctatttt 120 agtattcata tctcaagcac atccattccg gccgtttggg ggcgccgccg cactcgtgtc 180 cattcctacc gtggcactta gggctatcct gtcggagcgc cccgccgacc gccttatcgg 240 caccaaaagt agaagccccg gccccgcgtg gctcagactc accatcggtg ctatttactt 300 ttcgatcaga tcgcggcgcg cggtggccgg catttccgga agcggccacg gagcagaggt 360 ggcgcattcg aatcgcatac gtcttcgcca cgccggaaaa aaaattttcg gctatataag 420 gagaggcggc cgtcttgctg caggcagttt cactttctct aaaaccaaag aacatcgatt 480 tctttagtca ctcgcttcct tacaccgaac tcgaggcggc cgc 523 <210> 104 <211> 943 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pCWP2 <400> 104 ctagcctccc ctttttattt tgtgcggtca ccgcaaggga caaagctttt cttagaaaac 60 cgtctgagaa gcataacgta cgccatcccc tagacatatt aataatgcta cagatactat 120 gctgctcgtc tttttttgac gaccctttta ttgcaatgtg caactaatgg caaacaacca 180 catagtatca cagtattaca ttgcctccac cgatgcggat gttagggcgc caagtctgtc 240 atgaagcatg ttcctgtcat aatcttgtat gcaaaatacc gcgttctgcg ccactgatat 300 gctaggcagc agcaacctat gcagaagatt gcttttccca cgcctgtttt acgtctccag 360 ggcacttgaa acaatgcagc gatcgccgcc acaacacgcc aaagagaagc gaaagtgggc 420 ctgggcggcc tcagtttcgg cagaggtaaa caacacgaac tgaactgcct tagctccgaa 480 gggcaattcc acaggcactc cgcggggccc ggccaaggcc caaaaggcgt ggaatatgcg 540 cgttttgggg ccataacacc cagtaccacg gccggaacgg gccatataat aagtttttca 600 ctctcaagaa tggtaaacgt aaataggaac atcccactac cctagaaatt gcggaaattt 660 cgcgcttatc attagaaaat ctggaaccgt cctttttcct ctttcttgca tttccctttc 720 cgtattattg ccattcttta actgcatttg gggaaccgta gaccaaaagc caaacagaga 780 aatgtaacgt tctaaaaaaa aaacaacgaa aaaattgaaa aataagatac aataatcgta 840 tataaatcag gcttcttgtt catcattttc aattctcttc ttgccatccc ttttcctatc 900 tttgttcttt tcttctcata atcaagaata aataacttca tca 943 <210> 105 <211> 650 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pFBA1 <400> 105 acgcaagccc taagaaatga ataacaatac tgacagtact aaataattgc ctacttggct 60 tcacatacgt tgcatacgtc gatatagata ataatgataa tgacagcagg attatcgtaa 120 tacgtaatag ttgaaaatct caaaaatgtg tgggtcatta cgtaaataat gataggaatg 180 ggattcttct atttttcctt tttccattct agcagccgtc gggaaaacgt ggcatcctct 240 ctttcgggct caattggagt cacgctgccg tgagcatcct ctctttccat atctaacaac 300 tgagcacgta accaatggaa aagcatgagc ttagcgttgc tccaaaaaag tattggatgg 360 ttaataccat ttgtctgttc tcttctgact ttgactcctc aaaaaaaaaa aatctacaat 420 caacagatcg cttcaattac gccctcacaa aaactttttt ccttcttctt cgcccacgtt 480 aaattttatc cctcatgttg tctaacggat ttctgcactt gatttattat aaaaagacaa 540 agacataata cttctctatc aatttcagtt attgttcttc cttgcgttat tcttctgttc 600 ttctttttct tttgtcatat ataaccataa ccaagtaata catattcaaa 650 <210> 106 <211> 996 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pCCW120.Sm <400> 106 cgttgtgctg tagtgaagga agactaaaaa ggataatcac agttgtaaag aggtataatg 60 cggacccttt tgccacaaaa cacacatctt tcgtttccaa aataagaaag aagaaagcaa 120 aaagattagc agccacgttg ctgcgatcta attatagacg gtggcgtcat cattctcacc 180 caagattgtg tcttgaacct gccacgggtc ctgcgttatc gccggatgta aaactagaca 240 tgcaaaaaaa ggaccttcca ggtagcgtgc tccacaccac ccatgaccac cacagttagt 300 ccaaaagagg cagcaccact tcccgatggg ggaattagat tgctgccacc ctcacctcac 360 taatgctgcg gtgtgcggat atgccctgct atatatagct ccgcgttttt gaaccagcac 420 agcgcgagca ccaaaaagga aaatcgcata ggcccagaac tgatttcagc acgggctatt 480 ggcgttgggt ttccgttctg ggaaaccttc gccgcgtccc cctcacaaac ctccgcacaa 540 gttcgagcaa gcgggaaaaa acgaaaaacg ccattaatac taaataaagc aaatcctcga 600 agcgtgggtg gcaagcccct ggatttttcc gcacaagtac tcttctcagg agtaaaaaaa 660 cccgtttgtt ttggaattcc ccatttcgcg gccatctacg ccggtatctt cgcaatatct 720 atcagcgata actcagcaat tttaatattc gtgttgcagt gctgcgatag cgggagtctt 780 gtttgtaaca taacggcaga aaggaatgag agaaaatttt ccattctttg gcctccgttc 840 aagtatataa agccggcatg cttggtaatc tttctctctc ttctgtattg tttctataat 900 acttttatct tctaattatt ttctgaaaaa accaagaaat taatcttctg tcattcgctt 960 aaacactata tcaatactcg aaatccaagg tggtgt 996 <210> 107 <211> 505 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pCUP1 <400> 107 cggcaaactt caacgatttc tatgatgcat tttataatta gtaagccgat cccattaccg 60 acatttgggc gctatacgtg catatgttca tgtatgtatc tgtatttaaa acacttttgt 120 attatttttc ctcatatatg tgtataggtt tatacggatg atttaattat tacttcacca 180 ccctttattt caggctgata tcttagcctt gttactagtt agaaaaagac atttttgctg 240 tcagtcactg tcaagagatt cttttgctgg catttcttct agaagcaaaa agagcgatgc 300 gtcttttccg ctgaaccgtt ccagcaaaaa agactaccaa cgcaatatgg attgtcagaa 360 tcatataaaa gagaagcaaa taactccttg tcttgtatca attgcattat aatatcttct 420 tgttagtgca atatcatata gaagtcatcg aaatagatat taagaaaaac aaactgtaca 480 atcaatcaat caatcatcac ataaa 505 <210> 108 <211> 510 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pMET6 <400> 108 ccacaggaaa tatttcacgt gacttacaaa cagagtcgta cgtcaggacc ggagtcaggt 60 gaaaaaatgt gggccggtaa agggaaaaaa ccagaaacgg gactactatc gaactcgttt 120 agtcgcgaac gtgcaaaagg ccaatatttt tcgctagagt catcgcagtc atggcagctc 180 tttcgctcta tctcccggtc gcaaaactgt ggtagtcata gctcgttctg ctcaattgag 240 aactgtgaat gtgaatatgg aacaaatgcg atagatgcac taatttaagg gaagctagct 300 agttttccca actgcgaaag aaaaaaagga aagaaaaaaa aattctatat aagtgataga 360 tatttccatc tttactagca ttagtttctc ttttacgtat tcaatatttt tgttaaactc 420 ttcctttatc ataaaaaagc aagcatctaa gagcattgac aacactctaa gaaacaaaat 480 accaatataa tttcaaagta catatcaaaa 510 <210> 109 <211> 686 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pMET25 <400> 109 ttacattatc aatccttgcg tttcagcttc cactaattta gatgactatt tctcatcatt 60 tgcgtcatct tctaacaccg tatatgataa tatactagta acgtaaatac tagttagtag 120 atgatagttg atttttattc caacactaag aaataatttc gccatttctt gaatgtattt 180 aaagatattt aatgctataa tagacattta aatccaattc ttccaacata caatgggagt 240 ttggccgagt ggtttaaggc gtcagattta ggtggattta acctctaaaa tctctgatat 300 cttcggatgc aagggttcga atcccttagc tctcattatt ttttgctttt tctcttgagg 360 tcacatgatc gcaaaatggc aaatggcacg tgaagctgtc gatattgggg aactgtggtg 420 gttggcaaat gactaattaa gttagtcaag gcgccatcct catgaaaact gtgtaacata 480 ataaccgaag tgtcgaaaag gtggcacctt gtccaattga acacgctcga tgaaaaaaat 540 aagatatata taaggttaag taaagcgtct gttagaaagg aagtttttcc tttttcttgc 600 tctcttgtct tttcatctac tatttccttc gtgtaataca gggtcgtcag atacatagat 660 acaattctat tacccccatc cataca 686 <210> 110 <211> 363 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of promoter pSAM1 <400> 110 gaaacggacg taagacggaa atagaatttg aagataaagt tatatatcac tacacacgaa 60 tactttcttt tttttttttc acaggaaaac tgtggtggcg cccttgccta ctagtgcatt 120 tcttttttcg ggttcttgtc tcgacgaaat tttagcctca tcgtagtttt tcactctggt 180 atcgatgaaa aagggaagag taaaaagttt tccgtttagt acttaatggg attggtttgg 240 gacgtatata tcgactggtg ttgtctgtta ttcatcgttg tttttcggtt agcttcgaaa 300 aaaaaataga gtaaaaacca ggaatttacc ctaaaaacaa gaaaaaataa gataaacgaa 360 aat 363 <210> 111 <211> 300 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of terminator tTPI1 <400> 111 gattaatata attatataaa aatattatct tcttttcttt atatctagtg ttatgtaaaa 60 taaattgatg actacggaaa gcttttttat attgtttctt tttcattctg agccacttaa 120 atttcgtgaa tgttcttgta agggacggta gatttacaag tgatacaaca aaaagcaagg 180 cgctttttct aataaaaaga agaaaagcat ttaacaattg aacacctcta tatcaacgaa 240 gaatattact ttgtctctaa atccttgtaa aatgtgtacg atctctatat gggttactca 300 <210> 112 <211> 299 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of terminator tMET25 <400> 112 gtgtgcgtaa tgagttgtaa aattatgtat aaacctactt tctctcacaa gtactatact 60 tttataaaac gaactttatt gaaatgaata tccttttttt cccttgttac atgtcgtgac 120 tcgtactttg aacctaaatt gttctaacat caaagaacag tgttaattcg cagtcgagaa 180 gaaaaatatg gtgaacaaga ctcatctact tcatgagact actttacgcc tcctataaag 240 ctgtcacact ggataaattt attgtaggac caagttacaa aagaggatga tggaggttt 299 <210> 113 <211> 300 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of terminator tDIT1 <400> 113 taaagtaaga gcgctacatt ggtctacctt tttgttcttt tacttaaaca ttagttagtt 60 cgttttcttt ttctcatttt tttatgtttc ccccccaaag ttctgatttt ataatatttt 120 atttcacaca attccattta acagaggggg aatagattct ttagcttaga aaattagtga 180 tcaatatata tttgcctttc ttttcatctt ttcagtgata ttaatggttt cgagacactg 240 caatggccct agttgtctaa gaggatagat gttactgtca aagatgatat tttgaatttc 300 <210> 114 <211> 300 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of terminator tRPL3 <400> 114 gaagttttgt tagaaaataa atcatttttt aattgagcat tcttattcct attttattta 60 aatagtttta tgtattgtta gctacataca acagtttaaa tcaaattttc tttttcccaa 120 gtccaaaatg gaggtttatt ttgatgaccc gcatgcgatt atgttttgaa agtataagac 180 tacatacatg tacatatatt taaacatgta aacccgtcca ttatattgct tactttcttc 240 ttttttgccg ttttgacttg gacctctggt ttgctatttc cttacaatct ttgctacaat 300 <210> 115 <211> 304 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of terminator tRPL3.sm <400> 115 gaagttttta aagcattttt tagacacttc tcatttttct aagttttttt aaaatagttt 60 tatgtattta ctacgtatca caatttgaaa taattcatct tcccaaaaaa ctaagatttt 120 tatccttgtc acgatccgta accagtttat aatattttag agcttataca cgtacgtata 180 cacacgtgtc ggtacatgag aattacgttc aaaattattc actttttttt tctctgccgt 240 tttacttttg aactctgtct cgctatttcc ttacaatctt cgctacaata ccacttgccc 300 ttgg 304 <210> 116 <211> 299 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of terminator tRPL3.sba <400> 116 gaagttttct gacaaaaaca taacgttttt tccaatcatt tcttattttt ccggtttatt 60 taaatagttt ttatgtacta ttatacgtat gactatttaa cttaaattct tcctcccaag 120 aaatctccca agtttttcat tatcatggca tacaccacta tcagttacaa aatggtagct 180 caaccatata tatatctcta tatacacata taaatgcaaa caggtccaag tcaccgctca 240 ctgcagtttc ttttgccgtt ttgacttcga tctctgcttg gctattttct cacaatcct 299 <210> 117 <211> 300 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of terminator tRPL41B <400> 117 gcggattgag agcaaatcgt taagttcagg tcaagtaaaa attgatttcg aaaactaatt 60 tctcttatac aatcctttga ttggaccgtc atcctttcga atataagatt ttgttaagaa 120 tattttagac agagatctac tttatattta atatctagat attacataat ttcctctcta 180 ataaaatatc attaataaaa taaaaatgaa gcgatttgat tttgtgttgt caacttagtt 240 tgccgctatg cctcttgggt aatgctatta ttgaatcgaa gggctttatt atattaccct 300 <210> 118 <211> 301 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of terminator tRPL41B.Sba <400> 118 gcggattgcg agtgattttt tgagtacaga ccaagtaaaa ttgatctatg cataatcttt 60 tctcatccac aatccctaga atggaccgtc atcctttcta aaatgtttta ttaagaatat 120 ttaaagtgga agtcaggttt atatctatca attaaatatt acataatttc cccttaataa 180 aatactgtta ataaaataac gaaacgttca tagtttttca taaatagtcc tgatgcttac 240 tgcaccggaa cgtactgttt tagtgtattg ctcccttcat tgccattttt cctagttatt 300 g 301 <210> 119 <211> 300 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of terminator tRPL15A <400> 119 gctggttgat ggaaaatata attttattgg gcaaactttt gtttatctga tgtgttttat 60 actattatct ttttaattaa tgattctata tacaaacctg tatatttttt ctttaaccaa 120 tttttttttt tatagaccta gagctgtact tttattctgc tatcaagcaa acccctaccc 180 cctcttctca atcctcccct caggcagaac ttatctacct gtatcaagga gcggacgagg 240 gagtcctaat tgttctacgt ataccaatgc tagcagctta cataggtggt ggcactacca 300 <210> 120 <211> 299 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of terminator tRPL15A.Sm <400> 120 gctaattaga accatatata catcgataaa aacacttgaa tgtatttttc tttttcttct 60 tattttttca ttttccttcg ctttctatta gcgtgcgaat ctaaagtgtg cagcgctatc 120 tttgactctt tttttccttt agtgggaacg aacaatatta atcatgccaa gttaagtcat 180 tgaagaagtc agtagtatgt tattcggaga gaagaccctg ctatgtatct cagcctaccc 240 aaaaaatgaa ttgactcctc tcataacttg ttaatattcg gatgagcaca tcacgttcg 299 <210> 121 <211> 300 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of terminator tRPL15A.sba <400> 121 gctggctgat gaaaaatata gttctgttgg gcaagcattt gtttacctag catctctttt 60 atactattat tatctttata tttgatgatt ttatatacaa gttgtatacc ttttctttaa 120 ccaatttttt tttttctaat ggtgcaccta gaagtacatt ttttctcacc aatagatagt 180 caagatactc ccagcctcta tggcgttacc acggagccga caagggaaag ctgcttatct 240 tacatatgca gatgccaagg cccgttacag gccgccttat tgatgtttag aaatagcttc 300 <210> 122 <211> 300 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of terminator tIDP1 <400> 122 tcgaatttac gtagcccaat ctaccacttt tttttttcat tttttaaagt gttatactta 60 gttatgctct aggataatga actacttttt tttttttttt tttactgtta tcataaatat 120 atatacctta ttgttgtttg caaccgtcgg ttaattcctt atcaaggttc cccaagttcg 180 gatcattacc atcaatttcc aacattttca tgagttcttc ttcttcatta ccgtgtttta 240 gggggctgtt cgcacttcta atagggctat caccaagctg ttctaattcg tccaaaagtt 300 <210> 123 <211> 290 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of terminator tIDP1.Sba <400> 123 tctgatcttt ggaatgctcc atttactttt ttatttcata tttaggtacg atatatagtt 60 acgcttgaga actatgaact aataacttcc tttttctcta atacatactt acttcagctg 120 atggttgcaa acaacaataa aattccttgt cgaggttccc taaattagga tcattgccat 180 cgacttctaa cattttcatg agatcctcct cttcgttccc attctttaaa agactgtttc 240 cacttctaat agggttatcg cccaattgtt ctagttcgtc tagcaattcg 290 <210> 124 <211> 300 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of terminator tTEF1.sba <400> 124 ggagattgat aggacttttc tagttgcata tcttttattt ttaaatctta tctattagtt 60 aattttttgt aatttatcct tatatatata gtttggttat tctaaaacat catttcagta 120 tctaaaacct ctcttattca ttaccttttt atttaatggt ttttgctaca ggcaaaaatt 180 taatggtttt tgctacaggc aaaaatcccg ccgtggactt attccacgtt aactcggtta 240 cagggtcatg aaccattttg tcaattatcg aaataacttc ttcaaaagtc cctcttactt 300 <210> 125 <211> 60 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of the secretion sequence added in 5a ? <400> 125 atgcaattta gcacagtcgc atcagtagcc ttcgttgcct tggccaactt cgtggcagca 60 <210> 126 <211> 20 <212> PRT <213> other sequences <220> <223> amino acid sequence of the secretion sequence added in N-ter <400> 126 Met Gln Phe Ser Thr Val Ala Ser Val Ala Phe Val Ala Leu Ala Asn 1 5 10 15 Phe Val Ala Ala 20 <210> 127 <211> 213 <212> DNA <213> other sequences <220> <223> nucleic acid sequence of the anchoring sequence added in 3a ? <400> 127 ggatccgcca tttctcaaat cactgacggt caaatccaag ctactaccac tgctaccacc 60 gaagctacca ccactgctgc cccatcttcc accgttgaaa ctgtttctcc atccagcacc 120 gaaactatct ctcaacaaac tgaaaatggt gctgctaagg ccgctgtcgg tatgggtgcc 180 ggtgctctag ctgctgctgc tatgttgtta taa 213 <210> 128 <211> 68 <212> PRT <213> other sequences <220> <223> amino acid sequence of the anchoring sequence added in C-ter <400> 128 Ala Ile Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala Thr Thr Thr Ala 1 5 10 15 Thr Thr Glu Ala Thr Thr Thr Ala Ala Pro Ser Ser Thr Val Glu Thr 20 25 30 Val Ser Pro Ser Ser Thr Glu Thr Ile Ser Gln Gln Thr Glu Asn Gly 35 40 45 Ala Ala Lys Ala Ala Val Gly Met Gly Ala Gly Ala Leu Ala Ala Ala 50 55 60 Ala Met Leu Leu 65

Claims (32)

  1. 콘드로이틴을 생산하는 재조합 효모 세포로서,
    (a) 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산;
    (b) UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산; 및
    (c) UDP-글루코오스-4-에피머라아제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산
    을 포함하는 재조합 효모 세포.
  2. 제 1 항에 있어서, 재조합 세포가 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산을 포함하고, 콘드로이티나아제 활성을 갖는 폴리펩티드가 분비 신호, 및 임의로는 고정 신호를 포함하는 재조합 세포.
  3. 콘드로이틴을 생산하는 재조합 숙주 세포로서,
    (a) 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산;
    (b) UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산;
    (c) UDP-글루코오스-4-에피머라아제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산; 및
    (d) 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 하나 이상의 재조합 핵산으로서, 콘드로이티나아제 활성을 갖는 폴리펩티드는 분비 신호, 및 임의로는 고정 신호를 포함하여, 콘드로이틴, 특히 원하는 분자량의 콘드로이틴이 숙주 세포에 의해 생산되는 하나 이상의 재조합 핵산
    을 포함하는 재조합 숙주 세포.
  4. 제 2 항 또는 제 3 항에 있어서, 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산이 큐피엔니우스 살레이 (Cupiennius salei), 티티우스 세르룰라투스 (Tityus serrulatus), 보스 타우루스 (Bos taurus), 베스파 마그니피카 (Vespa magnifica), 마카카 물라타 (Macaca mulata) 또는 아피스 멜리페라 (Apis mellifera) 중 적어도 하나로부터, 바람직하게는 티티우스 세르룰라투스 (Tityus serrulatus) 로부터 수득되는 또는 유래되는 재조합 숙주 세포.
  5. 제 2 항 내지 제 4 항 중 어느 한 항에 있어서, 콘드로이틴의 분자량이 50kDa 미만의 범위, 바람직하게는 약 20kDa 내지 약 50kDa 범위인 재조합 세포.
  6. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서, 콘드로이틴의 분자량이 50kDa 초과의 범위, 바람직하게는 약 50kDa 내지 약 250kDa 범위인 재조합 세포.
  7. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서, 콘드로이틴의 분자량이 100kDa 초과의 범위, 바람직하게는 약 100kDa 내지 약 1500kDa 범위인 재조합 세포.
  8. 제 1 항 내지 제 7 항 중 어느 한 항에 있어서, UDP-글루코오스 탈수소효소 (UDP-GlcDH 또는 HASB) 활성을 갖는 폴리펩티드를 코딩하는 핵산이 아라비돕시스 탈리아나 (Arabidopsis thaliana), 클로렐라 바이러스 PBCV1 또는 스트렙토코쿠스 주에피데미쿠스 (Streptococcus zooepidemicus) 중 적어도 하나로부터, 특히 아라비돕시스 탈리아나 (Arabidopsis thaliana) 또는 클로렐라 바이러스 PBCV1 중 적어도 하나로부터 수득되는 또는 유래되는 재조합 세포.
  9. 제 1 항 내지 제 8 항 중 어느 한 항에 있어서, 콘드로이틴 신타아제 (HCOS) 활성을 갖는 폴리펩티드를 코딩하는 핵산이,
    (i) 콘드로이틴 신타아제를 코딩하는 핵산; 또는
    (ii) 콘드로이틴 신타아제 활성을 갖는 키메라 폴리펩티드를 코딩하는 핵산
    인 재조합 세포.
  10. 제 9 항에 있어서, 핵산이 파스튜렐라 물토시다 (Pasteurella multocida), 클로렐라 바이러스 (Chlorella virus) PBCV1, 마이코박테리움 튜베르쿨로시스 (Mycobacterium tuberculosis), 호모 사피엔스 (Homo sapiens), 에스케리키아 콜라이 (Escherichia coli), 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 또는 페니실룸 옥살리쿰 (Penicillium oxalicum) 중 적어도 하나로부터 수득되는 또는 유래되는 재조합 세포.
  11. 제 1 항 내지 제 10 항 중 어느 한 항에 있어서, UDP-글루코오스-4-에피머라제 (kfoA 또는 GNE1) 활성을 갖는 폴리펩티드를 코딩하는 핵산이 박테리아로부터, 특히 슈도모나스 아에루기노사 (Pseudomonas aeruginosa), 파스튜렐라 물토시다 (Pasteurella multocida), 및 에스케리키아 콜라이 (Escherichia coli) 로 이루어진 군으로부터 선택되는 박테리아로부터 수득되는 또는 유래되는 재조합 세포.
  12. 제 1 항 내지 제 11 항 중 어느 한 항에 있어서, 하기:
    (i) 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 활성을 갖는 폴리펩티드; 및/또는
    (ii) UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 활성을 갖는 폴리펩티드
    중 하나 이상을 코딩하는 적어도 하나의 재조합 핵산을 추가로 포함하는 재조합 세포.
  13. 제 1 항 내지 제 12 항 중 어느 한 항에 있어서, 하기:
    (i) 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드;
    (ii) UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 활성을 갖는 폴리펩티드;
    (iii) 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드; 및/또는
    (iv) 포스포아세틸글루코사민 뮤타아제 (PCM1) 활성을 갖는 폴리펩티드
    중 하나 이상을 코딩하는 적어도 하나의 재조합 핵산을 추가로 포함하는 재조합 세포.
  14. 제 12 항 또는 제 13 항에 있어서,
    - 글루타민-프룩토오스-6-포스페이트 아미도트랜스퍼라아제 (GFA1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
    - UDP-N-아세틸글루코사민 피로포스포릴라아제 (QRI1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
    - 포스포글루코뮤타아제-1 (PGM1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
    - UTP-글루코오스-1-포스페이트 유리딜릴트랜스퍼라아제 (UGP1) 활성을 갖는 폴리펩티드를 코딩하는 핵산;
    - 글루코사민-6-포스페이트 N-아세틸트랜스퍼라아제 (GNA1) 활성을 갖는 폴리펩티드를 코딩하는 핵산; 및/또는
    - 포스포아세틸글루코사민 뮤타아제 (PCM1) 를 갖는 폴리펩티드를 코딩하는 핵산
    이 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 로부터 수득되는 또는 유래되는 재조합 세포.
  15. 제 3 항 내지 제 14 항 중 어느 한 항에 있어서, 재조합 숙주 세포가 효모인 재조합 숙주 세포.
  16. 제 1 항 내지 제 15 항 중 어느 한 항에 있어서, 재조합 세포가 사카로마이세스 (Saccharomyces) 속, 또는 칸디다 (Candida) 속, 또는 클루이베로마이세스 (Kluyveromyces) 속, 또는 오가타에아 (Ogataea) 속, 또는 야로위아 (Yarrowia) 속, 또는 데바리오마이세스 (Debaryomyces) 속, 또는 아쉬비아 (Ashbya) 속에 속하고, 특히 사카로마이세스 속에 속하는 재조합 세포.
  17. 제 16 항에 있어서, 재조합 세포가 사카로마이세스 세레비지에 (Saccharomyces cerevisiae), 사카로마이세스 보울라르디이 (Saccharomyces boulardii), 사카로마이세스 바야누스 (Saccharomyces bayanus), 사카로마이세스 파라독수스 (Saccharomyces paradoxus), 사카로마이세스 미카타에 (Saccharomyces mikatae), 사카로마이세스 카스텔리 (Saccharomyces castelli), 칸디다 알비칸스 (Candida albicans), 칸디다 글라브라타 (Candida glabrata), 칸디다 트로피칼리스 (Candida tropicalis), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 클루이베로마이세스 폴리스포루스 (Kluyveromyces polysporus), 클루이베로마이세스 테르모톨레렌스 (Kluyveromyces thermotolerens), 오가타에아 폴리모르파 (Ogataea polymorpha), 야로위아 리폴리티카 (Yarrowia lypolytica), 데바리오마이세스 한세니이 (Debaryomyces hansenii) 및 아쉬비아 고시피이 (Ashbya gossypii) 로 이루어지는 군에서 선택되고, 바람직하게는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 인 재조합 세포.
  18. (a) 제 1 항 내지 제 17 항 중 어느 한 항에 따른 재조합 세포를 원하는 분자량의 콘드로이틴을 생산하기에 충분한 시간 동안 배양 배지에서 배양하는 단계; 및
    (b) 임의로는 재조합 세포 및/또는 배양 배지로부터 콘드로이틴을 단리하거나 회수하는 단계
    를 포함하는, 원하는 분자량의 콘드로이틴의 생산 방법.
  19. 제 18 항에 있어서, 콘드로이틴이 약 20kDa 내지 약 50kDa 의 분자량을 갖는 생산 방법.
  20. 제 18 항에 있어서, 콘드로이틴이 약 50kDa 내지 약 150kDa 의 분자량을 갖는 생산 방법.
  21. 제 18 항에 있어서, 콘드로이틴이 약 150kDa 내지 약 1500kDa 의 분자량을 갖는 생산 방법.
  22. 제 18 항 내지 제 21 항 중 어느 한 항에 있어서, 재조합 세포가 사카로마이세스 속에 속하는 효모이고, 특히 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 인 생산 방법.
  23. 제 18 항 내지 제 22 항 중 어느 한 항에 있어서, 원하는 분자량의 콘드로이틴을 생산하기에 충분한 시간이 약 35 시간 내지 약 50 시간, 바람직하게는 약 40 시간 내지 약 50 시간, 바람직하게는 약 48 시간의 기간인 생산 방법.
  24. 제 18 항 내지 제 23 항 중 어느 한 항에 있어서, 생산된 콘드로이틴의 분자량이 단계 (a) 동안 배양 배지의 pH 를 조절함으로써 제어되는 생산 방법.
  25. 제 18 항 내지 제 24 항 중 어느 한 항에 있어서, 방법이 산업적 규모로 실행되고, 바람직하게는 배양 배지가 적어도 약 100L 이고, 더욱 바람직하게는 약 1,000L 내지 약 3,000L 범위이고, 더욱 더 바람직하게는 약 10,000L 이거나, 더욱 더 바람직하게는 약 100,000L 이거나, 심지어 약 250,000L 인 생산 방법.
  26. 제 1 항 내지 제 17 항 중 어느 한 항에 따른 재조합 세포로부터 또는 제 18 항 내지 제 25 항 중 어느 한 항에 따른 방법으로부터 수득가능한 콘드로이틴.
  27. 제 26 항에 따른 콘드로이틴을 포함하는 배양 배지.
  28. 제 26 항에 따른 콘드로이틴을 포함하는 조성물.
  29. (i) 제 5 항 내지 제 7 항 중 어느 한 항에서 정의된 바와 같은 분자량을 갖는 콘드로이틴, (ii) 제 27 항의 배양 배지 또는 (iii) 제 28 항의 조성물을 포함하는 공산품 또는 소비재 또는 소모품.
  30. 제 29 항에 있어서, 화장품, 향미 제품, 향료 제품, 식료품, 식품, 음료, 식감제, 약학 조성물, 식이 보충제, 기능식품, 세정 제품, 치아 및/또는 구강 위생 조성물인 공산품 또는 소비재 또는 소모품.
  31. 약 20kDa 내지 약 50kDa, 또는 약 50kDa 내지 약 1000kDa 범위의 분자량을 갖는 콘드로이틴의 생산을 위한 제 2 항 내지 제 17 항 중 어느 한 항에 따른 재조합 세포의 용도.
  32. (a) 제 1 항 내지 제 17 항 중 어느 한 항에서 정의된 바와 같은 재조합 효모를 배양 배지에서 배양하는 단계; 및
    (b) 상기 배양 배지로부터 콘드로이틴을 회수하는 단계
    를 포함하는, 콘드로이틴의 생산 방법으로서,
    여기서, 단계 (b) 에서 회수된 콘드로이틴은:
    - 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산의 성질 및 기원,
    - 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드를 코딩하는 재조합 핵산의 발현을 제어하는 프로모터의 성질 및 기원,
    - 재조합 효모의 콘드로이티나아제 활성을 갖는 폴리펩티드와 관련된 고정 및/또는 분비 신호의 존재,
    - 재조합 효모를 배양하는 단계 동안 배양 배지의 pH, 및/또는
    - 재조합 효모의 배양 지속기간
    의 선별을 통해 제어된 분자량을 갖는 생산 방법.
KR1020237037339A 2021-04-01 2022-03-31 콘드로이틴-생산 재조합 세포 KR20240007135A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21166740.7 2021-04-01
EP21166740.7A EP4067487A1 (en) 2021-04-01 2021-04-01 Chondroitin-producing recombinant cell
PCT/EP2022/058583 WO2022207797A1 (en) 2021-04-01 2022-03-31 Chondroitin-producing recombinant cell

Publications (1)

Publication Number Publication Date
KR20240007135A true KR20240007135A (ko) 2024-01-16

Family

ID=75362519

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237037339A KR20240007135A (ko) 2021-04-01 2022-03-31 콘드로이틴-생산 재조합 세포

Country Status (6)

Country Link
EP (2) EP4067487A1 (ko)
JP (1) JP2024511877A (ko)
KR (1) KR20240007135A (ko)
CN (1) CN117460824A (ko)
BR (1) BR112023019848A2 (ko)
WO (1) WO2022207797A1 (ko)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030104601A1 (en) * 1999-04-01 2003-06-05 Deangelis Paul L. Chondroitin synthase gene and methods of making and using same
US8067204B2 (en) 2005-12-15 2011-11-29 Seikagaku Corporation Long-chain chondroitin sugar chain and method for producing the same and method for promoting synthesis of chondroitin
KR101548139B1 (ko) 2007-04-24 2015-08-28 세이가가쿠 고교 가부시키가이샤 콘드로이틴 생산 세균 및 콘드로이틴 생산 방법
KR101848102B1 (ko) 2010-03-01 2018-04-11 세이가가쿠 고교 가부시키가이샤 콘드로이틴의 박테리아 생산을 위한 조성물 및 방법

Also Published As

Publication number Publication date
WO2022207797A1 (en) 2022-10-06
BR112023019848A2 (pt) 2024-01-16
JP2024511877A (ja) 2024-03-15
EP4067487A1 (en) 2022-10-05
EP4314270A1 (en) 2024-02-07
CN117460824A (zh) 2024-01-26

Similar Documents

Publication Publication Date Title
US10907137B2 (en) Biosynthesis of oligosaccharides
US11739337B2 (en) Gadusol derivative production in bacteria
US20240150742A1 (en) Gene for efficiently expressing hyaluronic acid hydrolase and expression method thereof
US20220112526A1 (en) Biosynthesis of vanillin from isoeugenol
US20220112525A1 (en) Biosynthesis of vanillin from isoeugenol
EP4174175A1 (en) Hyaluronic acid-producing recombinant cells
CN108192899B (zh) 一种兽疫链球菌乳酸脱氢酶基因突变体及其应用
KR20240007135A (ko) 콘드로이틴-생산 재조합 세포
Zhang et al. Metabolic engineering of Aureobasidium melanogenum 9–1 for overproduction of liamocins by enhancing supply of acetyl-CoA and ATP
CN109628476B (zh) 一种利用全细胞转化生产4-羟基异亮氨酸的方法
KR20240007906A (ko) 히알루론산-생산 재조합 세포
KR20240007134A (ko) 헤파로산-생산 재조합 세포
EP4067499A1 (en) Hyaluronic acid-producing recombinant cells
US20240052381A1 (en) Biosynthesis of vanillin from isoeugenol
JP7573630B2 (ja) ヤロウイア属変異体及びそれを用いた脂肪の製造方法
US20240052380A1 (en) Biosynthesis of vanillin from isoeugenol
KR20150134512A (ko) 메발로네이트 또는 메발로노락톤 생성능을 가지는 재조합 미생물, 및 이를 이용한 메발로네이트 또는 메발로노락톤의 제조방법
KR102605543B1 (ko) 메티오닌-생산 효모
JP5344517B2 (ja) 小胞体局在化シグナル付スフィンゴリピッドδ4−デサチュラーゼを用いた形質転換細胞におけるセラミドの製造方法
KR102016050B1 (ko) 신규한 프로모터 및 이의 용도
KR20050081235A (ko) 스핑가닌 수산화 효소를 코딩하는 신규한 유전자 및 이유전자를 이용한 스핑고이드 염기의 생산방법