KR20080074134A

KR20080074134A - 재조합 콜라겐 유사 단백질의 생산

Info

Publication number: KR20080074134A
Application number: KR1020087012272A
Authority: KR
Inventors: 토마스 샤이벨
Original assignee: 테크니쉐 유니베르시테트 뮌헨
Priority date: 2005-11-17
Filing date: 2006-11-17
Publication date: 2008-08-12
Also published as: EP1948684A1; CA2629821C; WO2007057207A1; EP1787995A1; EP1948684B1; CA2629821A1; RU2008123706A; AU2006314708A1; JP2009515540A; AU2006314708B2; CN101316862A; US20090162896A1

Abstract

본 발명은 재조합 콜라겐 유사 단백질을 생산하는 효모 세포에 관한 것이다.

더 나아가 본 발명은 상기 재조합 단백질 생산의 용도를 위한 공동 발현 시스템 또는 그 부분들의 키트와 상기 재조합 단백질 및 그로부터 생산된 실을 생산하는 방법에 관한 것이다. 또한 본 발명은 본 발명의 방법에 따른 단백질 또는 실뿐만 아니라 의료 및 기술의 다양한 분야에 있어 이들의 사용에 관한 것이다.

Description

재조합 콜라겐 유사 단백질의 생산{Production of recombinant collagen like proteins}

바다 홍합(Marine mussels)은 조간대(inter-tidal zone)의 거친 서식지에서 발견된다. 그리고 여기서 바다 홍합은 파도와 바람에 노출된 이식 암석(colonizing rocks)에서 매우 성공적으로 자란다. 이러한 성공은 암석의 단단한 표면에 그들을 고정하는 고유한 고정수단에 부분적으로 기인한다. 이러한 고정수단의 일부는 족사(byssus) 또는 홍합 실크(mussel silk)라고 알려진 섬유 구조이다. 상기 족사는 파도의 거친 타격에서 살아남게 하기 위해 홍합을 단단한 표면 또는 암석에 부착시키는 충분한 접착력을 제공한다.

홍합 족사(mussel byssus)는 완벽하게 조그마한 힘줄(건)을 닮은 작은 실들의 다발을 구성하는 세포외 기질(extra-cellular matrix)로 이루어졌다(Qin, Coyne, K.J., and Waite, J.H., 1997, Tough tendons., Mussel byssus has collagen with silk-like domains., Journal of Biological Chemistry 272, 32623-32627). 족사 실(byssus threads)의 한쪽 끝은 연한 고무를 다른 쪽 끝은 딱딱한 나일론을 닮았다. 이러한 속성은 솔기가 없고 점진적인 전이(transition)로 나타나는 독특한 기계적인 속성을 보여준다(Qin, Waite, J.H., 1995, Exotic Collagen Gradients in the Byssus of ht eMussel Mytilus Edulia., The Journal of Experimental Biology 198, 633-644). 또한 족사 실은 상당한 변형에도 붕괴 없이 견딜 수 있고, 압력이 제거되면 원 상태로 되돌아오는 엘라스토머적(elastomeric)인 속성을 갖는다(Vaccaro E., Waite J.H., 2001, Yield and Post-Yield Behavior of Mussel Byssal Thread: A Self-Healing Biomolecular Material, Biomacromolecules 2, 906-911). 족사 실은 말단(distal)의 끝에서 바위에 점착 플라크(adhesive plaque)에 의해 고정된다. 인접하는 끝에서 족사 실은 홍합 다리의 기저에 단단히 붙은 소위 족사 줄기(byssus stem)에 결합한다(도 3 참조).

바다 홍합의 족사 실은 에너지를 흡수하고 방산(dissipation)하는 대용량의 엘라스토머적 섬유이다. 총 흡수 에너지의 70% 이상이 족사에서 방산될 수 있다. 미틸러스(Mytilus) 속(M. edulis 및 M. galoprovincialis)에서 각각 새로운 실은 반경 0.1cm 보다 작고 수 센티미터 길이의 넓이를 갖으며, 사출 성형 반응과 유사한 과정에 의해서 발의 배 쪽(ventral) 홈(groove)에서 5분 안에 생산된다(Waite J.H., 1992, Results Probl., Cell Differ, 19, 27p).

형태학적으로 족사는 인접부에서 말단부로 뿌리(root), 줄기(stem), 실(thread), 및 플라크(plaque) (또는 패드)의 4부분으로 나뉜다. 더 나아가 실은 외관에 따라서, 예를 들면 인접부와 말단부로 나누어지는데 말단부는 매끄럽고 경직되며, 인접부는 연약하고 더 약하다.

족사 실은 엘라스토머적(elastomeric)이다. 영 계수(Young's modulus)는 10 내지 500 MPa의 범위로 낮은데 신장성(extensibility)은 200% 이상일 수 있고, 회복력이 있다. 엘라스틴, 레실린(resiline), 및 압덕틴(abductine)과 같은 다른 단백질 엘라스토머와 같이 족사 실은 매우 질기다. 질김과 에너지 방산(dissipation )은 흡착기관의 두 가지 중대한 속성이다. 주기적 압력(stress)-변형(strain)―분석에 관한 섬유의 에너지 방산은 흡수된 총에너지에 관하여 종종 표준화되며 이력현상(hysteresis) 또는 퍼센트 이력현상으로 보고된다.

하나의 실에 대한 압력-변형 순환은 실의 분리된 인접부 및 말단부의 기계적 기여로 나누어진다. 상기에서 언급했듯이 말단부는 좀더 단단하고 경직되고, 감폭(damping)에 우수한 반면, 인접부는 좀더 연하고 약하지만 더욱 상당한 이력현상 을 갖는다.

족사 실의 기계적 속성은 시간 및 변형 의존적 움직임(behavior)에 의해 좀더 복잡해진다. 항복점(yield point) 위의 변형을 받을 때, 말단부는 도식적인 압력 연화(softening)를 나타내는데, 예를 들면 두 번째 사이클의 시작 계수가 첫 번째 사이클(500-80 MPa)의 계수의 20% 정도 감소한다. 첫 번째 사이클의 계수의 완벽한 회복은 예를 들면 24 시간 보다 길지만 상당한 부분 회복(원래 값의 30%)이 1시간 내에 발생한 수 있다. 이 경우 35MPa의 시작 계수부터 50MPa의 점근(asymptotic) 수준으로 대략 40%의 증가된 변형-경직(strain-stiffening)이 있다.

마스콜로와 와이테(MASCOLO, WAITE, 1986)는 미틸러스(Mytilus)의 족사 실에서 화학적 경사도를 처음 동정했다. 펩신으로 실을 처리한 후 각각 50 kDa 및 60 kDa의 ColP 및 ColD라고 불리는 두개의 펩신 저항성 콜라겐 단편을 동정했다. ColP는 인접부에 우세하게 관찰되고, 말단부에서는 거의 발견되지 않는다. 반대로, ColD의 양은 말단부에서 대략 100%로 증가한다(LUCAS et al., 2002; QIN & WAITE, 1995). 홍합 발에서와 마찬가지로 족사 실에도 실 구조의 형성에 참여하는 콜라겐 유사 단백질이 있다. 이러한 부가적 단백질은 ColNG(NG, no gradient)라고 불리는데 ColD 및 ColP와는 달리 전체 실에 걸쳐 고르게 분포한다. 그 생리적 기능은 다른 두개의 실 콜라겐 사이에서 어댑터 역할을 하는 것이다(QIN & WAITE, 1998).

펩신-절단 단편인 ColD 및 ColP는 소위 프리콜라겐(precollagen) P 및 D에서 유래한다. 미틸러스 에듈리스(M. edulis)에서 유래한 두개의 프리콜라겐들은 히스티딘과 다이 히드록시 페닐알라닌(DOPA, dihydroxyphenylalanine)이 풍부한 말단으로 각각 끝나는 다른 측면 부위들로 측면 배열된 중앙 콜라겐 헬릭스(helix)의 공통 기본 구조를 특징으로 한다(도 1 참조).

족사 콜라겐을 섬유(fiber)로 조립하는 메커니즘은 족사 생화학의 어려운 측면이었다. 콜라겐이 가교 결합(cross-linking)을 통해 안정화된다는 것은 잘 알려져 있으나 그 화학적 성질은 여전히 잘 알려지지 않았다. 콜라겐의 가교 결합에는 두 가지 구별되는 가교 결합(cross-linking)의 가능성이 있는데, 이는 콜라겐 유닛 간의 금속 복합체 형성(complexation) 및 공유 결합 형성이다(Coombs T.L., Keller P.J., 1981, Mytilus byssal threads as an environmental marker for metal ions., Aquat., Toxicol., p291-300; Swann C.P., Adewole T., Waite J.H. 1998, Preferential manganese accumulation in dreissenid byssal threads, Comparative Biochemistry and Physiology, Part B, Biochemistry & Molecular Biology 119B, p755-759). 금속 복합체 형성은 족사에서 발견된 높은 수준의 철, 구리, 니켈 및 아연과 족사 단백질의 양쪽 말단에 금속 결합한 과-히스티딘(histidine-rich) 서열에 의해 제시된다. 더욱이 다이히드록시페닐알라닌(DOPA, dihydroxyphenylalanine)이 모든 프리콜라겐의 양쪽 말단에 있고, 펩타이드(peptidyl)-DOPA는 우수한 금속 결합 부위를 제공하며, 펩타이드-디 히드록시 페닐알라닌-Fe(III) 킬레이트는 해양 접합 플라크(marine adhesive plaque) Mefp-1 단백질에서 보고 된 바 있다(Taylor S.W., Chase D.B., Emptage M.H., Nelson M.J., 및 Waite J.H., 1996, Ferric Ion Complexes of a DOPA-Containing Adhesive Protein from Mytilus edulis., Inorganic Chemistry 35, p7572-7577). 더 나아가 족사 섬유(byssal fiber)에서 EDTA에 의한 금속 이온의 제거는 섬유의 항복 강도(yield strength)를 감소시키는 것으로 알려졌다. 공유 가교 결합은 티로신(tyrosine), DOPA, 및 시스테인(cysteine) 사이에서 산화적 커플링에 의해 일반적으로 형성된다. 높은 유속 및 폭기 조건에서 압력이 가해진 족사에 대한 실험에서 산화의 주요 산물은 5,5?-diDOPA으로 밝혀졌다(Sun C., Vaccaro E., 및 Waite J.H., 2001, Oxidative stress and the mechanical properties of naturally occurring chimeric collagen-containing fibers, Biophysical Journal 81, p3590-3595). 산화 DOPA에 라이신의 미챌-타입(Michael-type) 부가와 같은 다른 가능한 커플링 산물은 발견되지 않았다(Waite J.H., Qin X.-X., 및 Coyne K.J., 1998, The peculiar collagens of mussel byssus, Matrix Biology 17, p93-106).

보통 콜라겐과 같이 각각의 홍합 콜라겐은 세포질내 세망(endoplasmatic reticulum)으로 알파 체인의 수송을 보증하는 20개 아미노산 신호 서열(signal sequence)을 갖는다. 세포질내 세망에서 세 개의 동일한 알파체인은 호모 트라이머(homotrimer)로 조립된다. 펩신-절단된 프리콜라겐D(preColD)를 의미하는 콜라겐D 알파-체인은 SDS-PAGE 분석 시 60kDa, 말디토프 질량 분석기(MALDI-TOF mass spectometry)에 의한 분석 시 47 kDa의 분자량을 갖는다(QIN et al., 1997). 펩신-절단된 프리 콜라겐P(preColP)를 의미하는 콜라겐P(ColP) 알파-체인은 SDS-PAGE 분석 시 55kDa, 말디토프 질량 분석기에 의한 분석기 40 kDa의 분자량을 갖는다(COYNE et al., 1997). 알파-체인의 전구체는 프리 콜라겐 D 및 프리 콜라겐 P로 불리는데 각각 SDS-PAGE 분석에 의해 95 및 97 kDa의 분자량을 갖고, 말디토프 질량 분석기에 의한 분석 시 각각 75 및 80 kDa의 분자량을 갖는다(COYNE et al., 1997; QIN et al., 1997). 두 콜라겐 모두는 콜라겐 타입 I-III에서 전형적인 특징들을 갖는다. 두개 모두 34% 이상의 글리신의 양을 보이며, 콜라겐 도메인 안에 20%의 결합된 프롤린 및 히드록시 프롤린 함량을 함유한다.

플랭킹 부위(flanking region)는 엘라스틴(preColP) 및 실크-피브로인(preColD)과 같은 다른 구조 단백질에 전적으로 해당한다. 이러한 구조적 구성은 홍합 족사의 기계적 작용에 대해 설명한다. 이러한 이유에서 새로운 기술적 응용에 있어서 구성성분(building block)으로서 이렇게 훌륭한 자연 소재인 홍합 족사 콜라겐을 유전자 재조합으로 생산하는 것은 매우 적절한 것이다.

한정된 특징을 갖는 소재, 그 중에서도 과부하 또는 압력후에도 스스로 재생할 수 있는 소재의 개발은 오랫동안 소재과학 분야에서 높은 관심을 받아왔다. 혼성 구조는 특히 전기적 구성 성분 및 장치, 에너지 컨버터 그리고 다른 소재 기술분야에서 점증하는 관심을 받고 있다. 다른 기계적 특성을 갖는 소재의 조합에 의 해서 구조의 접점(structural interface)은 새로운 기술적 문제를 초래할 것이다.

따라서 많은 응용분야에서 소재의 총체적인 부하를 경감하기 위한 누진적 구조(graduated structure)를 제공하는 것은 매우 바람직할 것이다.

더 나아가, 의료분야에서 홍합 콜라겐의 응용과 사용은 높은 잠재적 생적합성(biocompatibility) 때문에 많은 관심을 일으킨다. 이에 근거하여 양질의 면역적합성을 갖는 의료적 이식 및 조직이 생성될 수 있다. 재조합 홍합 콜라겐의 생성은 매우 흥미로우며, 종래 기술적 응용에서 해결해야하는 중요한 과제가 고려될 수 있다.

따라서 본 발명의 주된 목적은 향상된 특성 특히 우량한 강도와 유연성 및 대량으로 발현되는 향상된 특성을 갖는 재조합 홍합 족사 단백질을 제공하는데 있다. 본 발명의 다른 목적은 누진적 구조를 제공하기 위해 근거한 빌딩 블록(building block)의 특이적 배열에 의해 필요한 용도에 특별히 적합한 재조합 홍합 족사 단백질을 제공하는데 있다. 더 나아가 본 발명의 다른 목적은 기존에 알려진 진핵 발현 시스템에서 간이하게 발현될 수 있는 재조합 홍합 족사 단백질을 암호화하는 발현 벡터를 제공하는데 있다. 추가적으로 본 발명의 다른 목적은 향상된 종이, 직물, 및 가죽 제품을 제공하는데 있다. 본 발명의 다른 목적은 새로운 단백질 과 바이오테크놀로지, 의료, 약학과 응용 식품, 화장품 분야 그리고 전자 장비 및 다른 상업적 응용 분야에서 사용을 위한 재조합 홍합 족사 단백질에서 유래한 구(sphere), 나노 섬유(fibril), 하이드로겔(hydrogel), 실(thread), 발포제(foam)와 같은 다른 소재를 제공하는데 있다. 본 발명의 다른 목적은 대량 및 양질의 콜라겐 유사 단백질, 특히 홍합 족사 단백질을 발현할 수 있는 숙주세포를 제공하는데 있다.

상기 목적들은 독립항의 주제어(subject-matter)에 의해 해결될 수 있다. 바람직한 구현예는 종속항에서 상세히 설명된다.

지금까지 재조합 홍합 족사 단백질의 발현은 보고 된 바 없다. 이것은 적어도 부분적으로 상기 단백질 및 그로부터 생산된 실의 발현에 있어 복잡한 과정에 기인하는 것 같다. 콜라겐 생합성의 복잡성은 재조합 콜라겐을 발현하려는 어떠한 시도에 대한 성과에 낮은 예측을 인도한다. 따라서 이러한 시도들은 아마도 부적절하게 접힌(folded) 단백질, 낮은 수율, 최악의 경우에는 콜라겐의 발현이 전혀 없도록 인도될 수 있다.

본 발명은 적절하게 접힌 콜라겐 유사 단백질, 특히 홍합 족사 단백질을 대량 생산하는 숙주 세포 시스템을 제공한다.

본 발명은 특히 하기의 양태 및 구현예에 따른다.

본 발명의 한 양태에 따르면, 본 발명은 재조합 콜라겐 유사 단백질 특히 재조합 홍합(mussel) 족사(byssus) 단백질을 생산하기 위한 하기 요소로 형질 전환된 효모 세포를 제공한다:

a) 상기 재조합 콜라겐 유사 단백질을 암호화하는 일차 발현 벡터; 및

b) 프롤릴-4-히드록실라제(P4H, prolyl-4-hydroxylase)의 유전자를 암호화하는 핵산을 포함하는 2차 벡터.

본 발명자들은 콜라겐 생합성의 복잡성 때문에 콜라겐 유사 단백질의 재조합 생산에 있어서 특정 인자들이 고려되어야 한다는 것을 발견했다. 가장 중요한 세포질내 세망에서의 알파-PH(P4HA) 및 PDI(P4HB) 두개의 서브 유닛으로 구성된 사단위체(tetrameric) 효소인 프롤릴-4 히드록실라제(prolyl-4 hydroxylase)에 의한 프롤린에서 히드록시프롤린(hydroxyproline)으로 전사 후 조절(post-translational modification)이 고려되어야 한다는 것을 발견하였다. 이러한 이유로 원핵 발현 시스템, 예를 들면 박테리아 발현 시스템은 본 발명에서 사용될 수 없을 수 있다.

반면에 효모는 콜라겐의 합성에 필요한 세포 분획(cell compartmentation)을 제공하나, 콜라겐의 합성에 필요한 프롤릴-4 히드록실라제 효소가 결함되어 있다. 이와 별개로 효모는 그 배양이 대량 배양 시스템에 있어서 상대적으로 달성하기 쉽고, 그로 인해 다른 발현 시스템에 비해 재조합 단백질의 수율이 우수하기 때문에 재조합 콜라겐에 대한 바람직한 발현 시스템이 될 수 있다. 따라서 효모에서의 발현은 재조합 콜라겐 유사 단백질, 특히 홍합 족사 단백질의 효과적인(또한 가격적인 측면에서도) 생산에 이를 수 있을 것이다. 그러나 상기 효소 세포의 결함의 결과로 효모세포에서의 상기 단백질의 발현은 현재까지 달성되지 않고 있다.

본 발명자들은 P4H를 갖지 않는 효모 세포에서 인간 P4H 서브유닛을 유전자 재조합 방법으로 생산할 수 있었고, 정확하게 접을(folding) 수 있음을 밝혀낼 수 있었다. 이와 별개로 이들 효모 품종에서 두개의 인간 P4H 서브유닛의 공동 발현에 의해서 홍합 족사 콜라겐의 합성이 가능하고, 안정한 콜라겐이 형성되는 것이 밝혀낼 수 있었다.

흥미롭게도, 두개의 P4H(알파-PH(P4HA) 및 PDI(P4HB)) 유전자의 공동발현은 효모에서 안정한 트리플 헬릭스(triple helix)의 형성으로 충분하고, 콜라겐 특이적 차페론(chaperone), 폴딩 촉진체들(folding promoters), 또는 다른 효소들 예를 들면 Hsp47과 같은 다른 효소들이 필요하지 않고, 다시 말하면 효모에 내재하는 차페론이 충분히 활성을 갖는다. 효모에서 유전자 조작으로 생산된 인간 콜라겐은 천연(native) 콜라겐과 같은 히드록시프롤린의 함량을 갖고, 또한 많은 다른 특성에서 살펴볼 때 동일하다.

효모의 세포질내 세망(ER)으로 효과적인 수송을 위하여 공동으로 발현되는 P4H 서브유닛의 신호 서열(signal sequence)은 중요한 역할을 한다. 국소화(localization)의 최대 충족(sufficiency)은 본 발명의 바람직한 구현예에서 치환에 의해 달성될 수 있는데, 효모의 신호서열, 예를 들면 사카로마이세스 세레비지에(S. cerevisae)의 페로몬 교배 인자 알파-1(mating factor alpha 1, MFa-1)로 사람의 유전자를 치환하여 달성될 수 있다. MFa-1 신호 서열에 의해 조작된 P4H 서브유닛들은 세포질내 세망의 루멘(lumen)으로 효과적으로 수송될 수 있다.

보다 바람직하게는 신호 서열은 서열번호 10에 따른 사카로마이세스 세레비지에의 교배 인자 알파-1(mating factor alpha 1, MFa-1)이다.

상기 효모 세포에 있어서 바람직하게는 사카로마이세스 세레비지에(Saccharomyces cerevisiae), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 피치아 파스토리스(Pichia pastoris), 칸디다 알비칸스(Candida albicans), 또는 한세눌라 폴리모프(Hansenula polymorph) 세포가 사용될 수 있다.

일차 발현 벡터는 바람직하게는 하나 또는 하나 이상의 조절인자를 더 포함할 수 있다. 상기 발현 벡터는 효모 세포에서 발현에 적합하여야 한다.

바람직하게 상기 조절인자는 유도성(inducible) 또는 항상성(constitutive) 프로모터에서 선택될 수 있으며, 더욱 상세하게 GPD, GAL4, CUP1, MET25, GAL1 또는 GAL1-10 유전자에서 선택될 수 있다.

본 발명의 다른 구현예에서 상기 발현벡터는 플라스미드이다.

바람직하게 상기 재조합 콜라겐 유사 단백질은 실크 피브로인 또는 엘라스틴이 플랭킹(flanking)된 콜라겐 도메인의 하나 이상의 단편을 포함하거나 그로 구성된 재조합 홍합 족사 단백질이다.

상기 재조합 홍합 족사 단백질은 형성된 단백질의 다른 특성을 제공하는 하나 이상의 빌딩 블록 타입으로 구성된다. 상기 언급한 것처럼, 엘라스틴과 실크 피브로인은 홍합 족사와 유전자 재조합으로 생산된 홍합 족사 단백질의 기계적 작용에 대해 설명해줄 수 있는 특정한 기계적 특성을 갖는다.

따라서 이들 단편들은 한 가지 유형의 단편으로만 사용되거나 또는 변형하여 재조합 단백질은 둘 이상의 다른 단편을 포함할 수도 있다. 예를 들면, 현저한 신축성(elasticity)이 필요하다면, 단백질은 엘라스틴이 플랭킹 된 콜라겐 단편만을 또는 단편들을 주된 구성요소로 포함할 수 있다. 현저한 강도와 단단함이 필요하다면 단백질은 실크 피브로인이 플랭킹 된 콜라겐 단편을 포함할 수 있다. 더 나아가 바람직한 변형으로서 상기 단백질은 단편들의 두 가지 타입의 혼합을 포함할 수 있는데 예를 들면, 한쪽 부위에서 다른 부위로 경사를 형성하여 두 가지 타입의 혼합을 포함할 수 있다. 따라서 단백질/실은 예를 들면 한쪽 부위에 높은 신축성을 갖고 다른 쪽 부위에 경직성을 가질 수 있는 등의 특별하게 적합한 구조를 갖고 형성될 수 있다.

용어 “플랭킹”은 엘라스틴(또는 실크-피브로인)이 콜라겐 도메인의 양쪽 측면에 위치하는 것을 의미한다.

상기 단편들은 자연적으로 얻을 수 있는데 예를 들면 상기 단편들은 미틸러스 속에 속한 종(Mytilus sp.)에서 얻을 수 있고, 바람직하게는 미틸러스 에듈리스(M. edulis), 미틸러스 갈로프로빈시알리스(M. galloprovincialis), 미틸러스 캘리포니안스(M. californians), 또는 제우케리아 데미싸(Geukeria demissa)에서 얻을 수 있다.

본 발명의 바람직한 구현예에 따르면, 본 발명의 상기 재조합 홍합 족사 단백질은 하나 이상의 프리콜라겐P(preColP) 및/또는 프리콜라겐D(preColD) 단편, 또는 그 유사체를 포함하거나 그들로 이루어진다. 상기 단편들은 상기에서 개설되었다. 두개의 프리콜라겐(예를 들면, D 또는 P)들은 미틸러스 에듈리스(M. edulis)에서 얻을 수 있고, 히스티딘과 다이 히드록시 페닐알라닌(DOPA, di hydroxy phenylalanine)이 풍부한 말단이 각각의 끝에 위치한 다른 플랭킹 부위에 의해 플랭킹 된 중앙 콜라겐 헬릭스(helix)의 공통된 기본 구조를 특징으로 한다(도 1 참조). 플랭킹 부위는 엘라스틴(preColP) 및 실크-피브로인(preColD) 같이 알려진 구조 단백질에 완전하게 부합한다.

프리콜라겐P(preColP)와 프리콜라겐D(preColD)의 서열은 각각의 핵산으로부터 번역(translation)된다. 따라서 본 발명은 하기에서 아미노산이 언급될 때마다 프리콜라겐P(preColP)와 프리콜라겐D(preColD)를 지시하며, 이들 서열은 상기 언급된 다양한 기술적 응용에서 사용될 수 있다. 본 발명의 처음에 언급된 핵산 서열은 프리콜라겐P(preColP)와 프리콜라겐D(preColD)를 암호화하는 서열을 지시한다.

본 발명의 다른 구현예에 따르면, 본 발명의 재조합 단백질은 서열번호 3 및/또는 4의 하나 이상의 단편 또는 그 변이체를 포함하거나, 서열번호 3 및/또는 4의 하나 이상의 단편으로 이루어진다. 상기 서열번호들은 프리콜라겐P(preColP)와 프리콜라겐D(preColD)의 서열을 나타낸다.

또한 상기 본 발명은 그 아미노산 서열의 변이체를 포함한다. 예를 들면 상기 변이체들은 상기 언급된 아미노산 서열과 비교할 때 하나 이상의 치환, 삽입, 및/또는 결실을 함유할 수 있다.

단백질의 특별한 변이체에서, 치환, 삽입, 및/또는 결실로 기인한 소위 사일런트 변이체(silent change)도 본 발명의 일부로 간주된다.

상기 아미노산 치환은 바람직하게는 보존적(conservative) 아미노산 치환과 같이 하나의 아미노산을 유사한 구조 및/또는 화학적 속성을 갖는 유사한 아미노산으로 치환한 결과이다.

아미노산 치환은 관련 잔기(involved residue)의 극성(polarity), 전하(charge), 가용성(solubility), 소수성, 친수성, 및/또는 양친매성(amphipathic, 또는 amphiphilic)의 성질의 유사성에 기초하여 수행될 수 있다. 소수성 아미노산의 예로 알라닌, 루신, 이소루신, 발린, 프롤린, 페닐알라닌, 트립토판, 및 메티오닌이 있다. 극성 및 중성 아미노산은 글리신, 세린, 트레오닌, 시스테인, 티로신, 아스파라진, 및 글루타민을 포함한다. 양성(positive) 전하(염기성)의 아미노산은 아르기닌, 라이신, 및 히스티딘을 포함하고, 음성(negative) 전하의 아미노산은 아스파르트 산(aspartic acid)과 글루탐 산(glutamic acid)을 포함한다.

삽입(Insertions) 또는 결실(deletion)은 통상 하나에서 다섯 개의 아미노산의 범위일 수 있다. 변이의 허용되는 정도는 재조합 DNA 기술을 이용하여 폴리펩티드 분자에서 조직적으로 적용된 삽입, 결실, 또는 치환으로 실험적으로 결정될 수 있다. 그 결과 생기는 변이체는 그들의 특성, 특히 그들의 물리적 특성에 대해 실험될 수 있다.

또한 본 발명에서 사용되는 용어 ‘변이체’는 처음의 오리지널 홍합 신호 서열에 포함된 19개 아미노산 서열이 다른 신호 서열로 치환된 프리콜라겐P(preColP)와 프리콜라겐D(preColD)의 상기 아미노산 서열을 포함할 수 있음을 유의해야 한다.

이것의 바람직한 예는 교배 인자 알파의 신호 서열(SEQ ID NO. 10: MRFPSIFTAV LFAASSALA)로 홍합 신호서열을 치환한 것이다. 상기 신호 서열은 특히 효소에서 핵산의 발현에 적합하다.

또한 본 발명은 상기 정의된 재조합 단백질을 암호화 하는 단리된 핵산을 제공한다. 본 발명에서 핵산과 관련하여 용어 “단리된(isolated)”은 그것이 유래된 개체의 자연 발생적인 유전체에서 즉시 인접하는(한쪽은 5’에 다른 한쪽은 3’에) 두개의 서열에 즉시 인접하지 않는 자연 발생적인 핵산을 가리킨다.

예를 들면, 이에 한정되는 것은 아니나, 단리된 핵산은 자연 발생적인 유전체에서 상기 재조합 DNA 분자를 즉시 플랭킹하는 것으로 보통 발견되는 핵산 서열의 하나가 제거되거나 없다면 어떠한 길이의 재조합 DNA 분자도 될 수 있다.

따라서, 단리된(isolated) 핵산은 이에 한정되는 것은 아니나, 분리된(separate) 분자(예를 들면 cDNA 또는 제한효소로 처리되거나 PCR에 의해 생산된 게놈 DNA의 단편)로 존재하는 재조합 DNA를 포함할 뿐만 아니라, 다른 서열들과 별개이고, 또한 자발적으로 복제 가능한 플라스미드, 바이러스(예를 들면, 레트로바이러스, 아데노바이러스, 또는 헤르페스 바이러스)등의 벡터에 통합된 재조합 DNA, 또는 원핵?진핵 세포의 게놈 DNA로 통합된 재조합 DNA를 포함한다. 게다가 단리된(isolated) 핵산은 하이브리드(hybrid) 또는 융합(fusion) 핵산 서열의 일부인 재조합 DNA 분자를 포함할 수 있다.

또한 비-자연발생적인 핵산 서열은 자연에서 발견되지 않고, 자연발생적인 유전체에서는 즉시 인접하는(contiguous) 서열을 갖기 않기 때문에 용어 “단리된”은 어떠한 비-자연발생적(non-naturally-occurring)인 핵산을 포함한다.

예를 들면, 조작된 핵산(engineered nucleic acid)과 같은 비-자연발생적인 핵산은 단리된 핵산으로 간주된다. 조작된 핵산은 통상의 분자 클로닝 또는 화학적 핵산 생산 테크닉에 의해 생산될 수 있다. 단리된 비-자연발생적 핵산은 다른 서열과 독립적이거나, 자발적으로 복제 가능한 플라스미드, 바이러스(예를 들면, 레트로바이러스, 아데노바이러스, 또는 헤르페스 바이러스)등의 벡터 또는 원핵 또는 진핵 세포의 게놈 DNA로 통합될 수 있다.

게다가, 비-자연발생적 핵산은 하이브리드 또는 융합 핵산 서열의 일부인 핵산 분자를 포함할 수 있다.

당업자들에게 있어서, cDNA, 유전체 라이브러리, 또는 유전체 DNA 제한 절단을 포함하는 겔 조각에 있는 다른 수없이 많은 핵산 분자들 가운데 존재하는 핵산은 단리된(isolated) 핵산으로 간주되지 않음은 명확하다.

상기 아미노산을 암호화 하는 핵산은 재조합 홍합 족사 단백질의 미성숙 또는 성숙 아미노산 서열을 암호화하는 핵산 서열일 수 있다.

본 발명의 바람직한 구현예에서, 단리된(isolated) 핵산은 서열번호 1 또는/ 및 서열번호 2, 또는 그 변이체의 핵산을 포함하거나 서열번호 1 또는/ 및 서열번호 2, 또는 그 변이체로 이루어진다. 상기 변이체가 보통 엄격한(moderately stringent) 또는 엄격한 조건에서 서열번호 1 또는 서열번호 2의 핵산 서열과 혼성화(hybridize)하거나, 서열번호 1 또는 서열번호 2의 핵산 서열과 같은 또는 기능적으로 동등의 아미노산을 암호화 하는 유전자 코드의 축퇴(degeneracy)로 인한 핵산 변화를 포함한다면, 상기 변이체는 서열번호 1 또는 서열번호 2의 서열과 비교할 때 각각 하나 이상의 치환, 삽입, 및/또는 결실을 갖는 것으로 정의된다.

또한 상기 언급했듯이, 본 발명은 상기 핵산의 변이체를 포함하는데 처음 19개의 아미노산(신호 서열)을 코딩하는 핵산이 바람직하게는 효모 신호 서열(교배 인자 알파, 서열번호 10)로 치환된 핵산의 변이체를 포함한다.

본 발명에 있어서, 혼성화의 엄격함(Stringency)은 폴리뉴클레오티드 중합체가 안정한 조건인 것을 말한다. 당업자에게 잘 알려졌듯이, 중합체의 안정성은 나트륨 이온 농도와 온도의 함수이다(Sambrook et al., Molecular Cloning, A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory, 1989). 혼성화에 사용되는 엄격함(Stringency) 레벨은 당업계에서 쉽게 변화될 수 있다.

엄격한 세척(stringent washing) 조건은 65°C에서 0.2 x SSC (0.03 M NaCl, 0.003 M sodium citrate, pH 7) 및 0.1% SDS의 용매를 사용하여 세척하는 것을 의미한다. 30 뉴클레오티드까지의 올리고뉴클레오티드 같은 작은 단편에 대한 혼성화 온도는 예를 들면 65℃ 이하에서 50℃, 바람직하게는 55℃ 이상 65℃ 이하이다. 엄격한 혼성화 온도는 각각의 핵산 및 핵산 조성의 크기 및 길이에 의존하는데, 당업계의 숙련된 기술자에 의해 실험적으로 결정될 수 있다. 보통 엄격한(moderate stringent) 혼성화 온도는 예를 들면 42℃이고, 세척조건은 42℃에서 0.2 x SSC 및 0.1% SDS의 용매를 사용하여 세척한다.

본 발명에서 사용되는 프롤릴-4-히드록실라제(P4H)는 바람직하게는 사람 또는 홍합의 프롤릴-4-히드록실라제(P4H)이다.

본 발명의 다른 양태에 따르면, 본 발명은 하기 요소를 포함하는 공동 발현 시스템 또는 그 부분의 키트를 제공 한다:

a) 본 발명에서 정의된 일차 발현 벡터; 및

b) 상기 정의된 이차 발현 벡터.

상기 공동 발현 시스템 또는 그 부분의 키트는 효모 세포에서 재조합 홍합 단백질을 발현시키는데 있어서 유용하게 사용될 수 있다.

본 발명의 다른 양태에 따르면, 본 발명은 하기 단계를 포함하는 재조합 콜라겐 유사 단백질 특히 홍합 족사단백질을 생산하는 방법을 제공 한다:

a) 상기 효모 세포를 준비하는 단계;

b) 상기 효모세포를 발현 벡터 또는 상기 공동 발현 시스템으로 형질 전환시키는 단계;

c) 적절한 조건에서 상기 효모 숙주세포로부터 재조합 단백질을 발현시키는 단계; 및

d) 상기 재조합 단백질을 회수(recovering)하는 단계.

더 나아가 본 발명은 하기 단계로 구성된 재조합 홍합 족사 단백질로부터 실을 생산하는 방법을 제공 한다:

a) 상기 방법에 따라 생산된 재조합 단백질을 준비하는 단계; 및

b) 상기 단백질을 적절한 방법에 의해 실(thread)로 방적(spinning)하거나 몰딩(molding)하는 단계.

상기 스피닝은 바람직하게는 전자기적 스피닝(electrospinning)이 될 수 있다. 전자기적 스피닝은 나노미터 지름의 섬유를 지속적으로 형성시키는데 전자기력을 사용하는 섬유 형성 기술이다. 천연 및 인공 폴리머의 다양한 종류는 용해 상(melt phase) 및 용액에서 전자기적 스피닝에 의해 제조되고, 높은 표면적 물질(여과 막 및 바이오 의료 장비)을 요구하는 응용 분야에서 중요하다.

본 발명의 다른 양태에 따르면, 본 발명은 상기 방법 중의 하나에 의해 얻을 수 있는 단백질 또는 실을 제공한다.

상기 본 발명의 단백질 및 실은 바람직하게는 바이오테크놀로지 및/또는 의료분야에 응용될 수 있다.

예를 들면, 상기 단백질 및 실은 봉합 물질(suture material), 피복 시스템(coverage system), 또는 상처 봉합(wound closure)에 사용될 수 있다. 더 나아가 상기 단백질 및 실은 바람직하게 대체 물질(replacement material), 바람직하게는 인공 연골 또는 건(tendon)의 제조에 사용될 수 있다.

또한 본 발명의 상기 단백질 및 실은 접착용 스트립(adhesive strip), 피부 이식조직(skin graft), 대체 인대(replacement ligament), 및 수술용 망(surgical mesh)과 같은 의료용 장비를 생산하는데 사용될 수 있다. 그리고, 의류 직물(clothing fabric), 방탄조끼 안감(bullet-proof vest lining), 컨테이너 직물(container fabric), 가방 또는 지갑 끈, 케이블, 로프, 접착 묶음 재료, 비-접착 묶음 재료, 끈 재료, 자동차 덮개 및 부품, 비행기 구조 재료, 레인코트(weatherproofing) 재료, 탄력적 칸막이 재료, 스포츠 장비등과 같은 상업적 또는 공업적으로 넓은 범위에서 사용될 수 있다. 그리고 사실상 높은 신장 강도 및 신축성이 필요한 어떠한 섬유나 옷감에 대해서도 사용할 수 있다. 또한 본 발명에서는 융통성 있게 다른 조성물과의 혼합사용으로 또는 건조 스프레이 코팅, 구슬 유사 입자(bead-like particle)와 같은 다른 형태의 안정한 섬유 산물로서 사용될 수 있다.

종이의 처리와 제조뿐 아니라 비행기 구조 재료, 자동차 덮개 및 부품, 또는 의류의 직물(fabric 또는 textile) 및 가죽의 처리와 제조에도 본 발명의 홍합 족사 콜라겐의 바람직한 응용이 있음은 명백하게 언급되었다.

본 발명의 재조합 홍합 족사 단백질은 셀룰로오스, 케라틴, 및 콜라겐 산물에 첨가될 수 있으며, 또한 본 발명은 셀룰로오스, 케라틴, 및/또는 콜라겐과 본 발명의 단백질을 포함하는 종이, 스킨케어(skin care) 제품, 또는 헤어케어 제품과 관련되어 있다. 본 발명의 단백질이 함유된 종이, 스킨케어(skin care) 제품, 또는 헤어케어 제품은 특히 향상된 신장강도(tensile strength 및 tear strength)의 향상된 특성을 보인다.

더 나아가 본 발명의 재조합 홍합 족사 단백질은 직물 및 가죽 제품에 대한 코팅용으로 사용될 수 있는데, 코팅된 제품의 내구성 및 안정성을 부여한다. 특히 단백질은 가죽 제품의 코팅에 적용가능성을 보이는데, 이런 경우에 무두질 및 환경에 대한 악영향은 피할 수 있거나 적어도 줄일 수 있다.

또한 본 발명은 상기 홍합 족사 단백질을 포함하는 제품에 관한 것이다. 예를 들면 상처 봉합(wound closure), 피복 시스템(coverage system), 봉합 재료(suture material), 대체 재료(replacement material)(바람직하게는 인공 연골 또는 건), 화장품(cosmetics), 약물 전달 물질(drug delivery vehicle), 직물, 옷감, 종이 제품, 가죽 제품, 자동차 부품 또는 비행기 부품에 관한 것이다. 일반적으로 본 발명은 구(sphere), 나노 섬유(fibril), 하이드로겔(hydrogel), 발포제(foam), 필름과 같은 재조합 홍합 족사 단백질에 근거한 재료에 관한 것이다.

다른 정의가 없다면, 본 발명에서 사용된 모든 기술적인, 과학적인 용어들은 본 발명이 속한 기술분야에서 통상의 기술을 갖는 자에 의해 보통 이해되는 의미와 같은 의미를 갖는다. 본 발명에서 언급된 모든 간행물, 특허 출원, 특허, 및 다른 참고문헌은 온전히 참고문헌으로 포함되었다. 다툼이 있는 경우에는, 본 발명의 정의를 포함하여 명세서가 우선한다. 또한 본 발명의 실시예는 단지 본 발명을 설명하고자 하는 것으로 이에 한정되는 것은 아니다.

지금부터 본 발명의 실시예 및 수반하는 다음을 나타내는 도면을 통하여 더 상술하기로 한다

도 1은 홍합 족사 콜라겐의 일반적인 구조를 설명하는 것이고;

도 2는 말단부에서 인접부 방향으로 족사 실의 전자현미경 이미지의 시리즈를 나타내는 것이고(a 말단부; b 중앙부; c 인접부로 표시된 부위는 각각 확대되어 나타낸다);

도 3은 홍합 족사의 구조를 나타내고;

도 4는 족사 실에 의해 고체 표면에 붙은 홍합을 나타내고;

도 5의 (a)는 실에 있어 프리콜라겐의 분포; (b)는 플랭킹 도메인과 콜라겐의 서브유닛의 개략도(Schematic)(다이아몬드로 표시된 말단부는 히스티딘이 풍부하며, DOPA는 Y로 표시되었다); (c)는 축(axial) 및 측면(lateral)의 프리콜라겐 사이의 가교 연결된 상호작용의 모델을 나타내고;

도 6은 프롤릴-4-히드록실라제(P4H)의 구조를 도시한 것이고;

도 7은 각각의 발현 플라스미드에 클로닝 될 교배 인자-α(MF-α) 신호 서열을 발생하기 위한 올리고뉴클레오티드를 도시한 것이고;

도 8은 α-PH에 대한 클로닝 전략을 나타낸 것이고;

도 9는 벡터의 개열지도를 도시한 것이다.

효모에서 홍합 족사의 콜라겐 단백질의 발현

일반적인 콜라겐의 합성은 복잡한 생화학 과정을 반영한다. 상기 과정은 세포질내 세망(ER)에서 예를 들면 각각 콜라겐의 특정 프롤린에서 4-히드록시프롤린(4-hydroxyproline)으로의 프롤릴 4-히드록실라제(P4H)에 의한 전사 후 조절(post-translational modification)을 요구한다. 척추동물에서 α₂β₂의 4단위체인 P4H는 콜라겐의 합성에 중요한 역할을 한다. P4H에 의해 발생되는 4-히드록시프롤린(4-hydroxyproline) 잔기(residue)는 새로 합성되는 콜라겐 펩타이드 체인의 트리플-헬릭스(triple-helical) 콜라겐으로 폴딩(folding)에 필수적이다(Prockop D.J., Kivirikko K.I., 1995, Annu. Rev., Biochem., 64, 403-434).

인간 P4H(Prolyl-4-Hydroxylase) 발현 구성(expression construct)

P4H의 구성에는 α-PH와 PDI의 P4H의 두 서브유닛에 대한 유전자 부근에 효소 벡터로 신호 서열의 클로닝이 필요하다. 두개의 유전자는 양방향(bi-directional) 프로모터의 조절 아래 위치하는데, 상기 프로모터는 갈락토오스(Gal1/10) 존재 시에 유도된다(도 6 참조). 신호 서열은 P4H의 서브유닛의 세포 질내 세망으로 이동에 필요하다. 이동의 최대 효율은 인간 신호 서열이 효모 자신의 신호서열인 교배 인자 α-MF로 치환될 때 달성되었다(Myllyharju J., Nokelainen M., Vuorela A., 및 Kivirikko K.I., 2000, Expression of recombinant human I-III collagens in the yeast Pichia pastoris, Biochem, Soc. Trans. 28, 353-357)(도 6 참조).

신호 서열 없는 α-PH에 대한 유전자는 HepG2 간세포(아담스키교수에 의해 제공됨, GSF Munich, Germany)에서 c-DNA 라이브러리에서 PCR에 의해 증폭될 수 있고, 신호 서열이 없는 β-서브유닛(PDI)의 c-DNA는 대장균 클로닝 벡터(네일 뷸레이드(Neil Bulleid) 교수에 의해 제공됨, University of Manchester, UK)에서 증폭 될 수 있다. 각각의 유전자에 대해 상응하는 교배 인자 α 신호 서열은 두개의 단일 가닥 올리고뉴클레오티드에 근거하여 설계될 것이다. 올리고 A와 올리고 B는 어닐링 후에 이중 가닥 DNA가 바로 각각의 벡터로 클로닝 될 수 있는 방법으로 설계되었다(도 7 참조).

α-PH의 클로닝 전략은 도 8의 예에 나타난다. PDI의 cDNA 클로닝은 동일한 방법으로 수행될 수 있다. 두개의 다른 효소 벡터를 사용할 수 있는데, 양방향 Gal1/10 프로모터를 함유하고, 하나의 플라스미드에서 두개 서브유닛의 동시 발현을 허용하는 pRS315(CEN, 싱글 카피 넘버 플라스미드를 반영하는)와 pRS425(2μ, 멀티 카피 넘버 플라스미드를 반영하는)의 효소 벡터이다.

프리콜라겐D(preColD)와 프리콜라겐P(preColP)의 재조합 생산

홍합 족사의 두 주요 단백질 구성요소인 프리콜리겐D(preColD)와 프리콜라겐P(preColP)의 재조합 합성은 본 발명의 실시예에 따른다. 대장균 클로닝 벡터에 있는 프리콜리겐D(preColD)와 프리콜라겐P(preColP)의 c-DNA를 와이테 교수(Prof. Waite, UCSB, USA)에게서 얻었다. 상기 c-DNA를 PCR에 의해 증폭한 후 다른 효소 발현 벡터로 클로닝 했다. 효소 발현 벡터는 세포 당 카피 넘버가 다를 뿐 아니라 활성제(activator)(유도성 프로모터 GAL4 또는 항상성 프로모터 GPD)의 선택에 있어서도 다르다. 또한 원래 신호 서열은 최대 이동 효율을 위해 효소의 교배인자 알파의 신호서열로 대체될 것이다.

재조합 합성과정 중에 콜라겐P(ColP)와 콜라겐D(ColD)의 탐지

홍합 콜라겐의 효율적인 재조합 합성에 대한 테스트는 홍합 콜라겐에 대한 다클론성(polyclonal) 항체의 효용성을 필요로 한다. 인간 콜라겐 유형 I-III에 대한 다클론성 항체의 예비 테스트는 홍합 족사로부터 화학적으로 변형된 콜라겐에 대한 매우 약한 교차-반응성(cross-reactivity)을 보여준다. 이 교차-반응성은 재조합 합성 동안에 존재하는 콜라겐의 레벨을 탐지하는데 충분하지 않다. 따라서 홍합 콜라겐에 대하여 항체를 증가할 필요가 있다. 항체를 증가시키기 위해서, 정제된 천연 홍합 콜라겐이 필요하다. 족사는 신선한 홍합에서 추출될 수 있고, 여러 크로마토그래피 방법(그 중에서도 특히 역 위상(reverse phase) 크로마토그래피)을 사용하여 정제될 수 있다.

프리콜라겐D(preColD)와 프리콜라겐P(preColP)를 포함한 정제된 단백질 샘플로 토끼를 면역화 시키는데 사용하고, 항체를 생산하였다.

재조합 콜라겐에 대한 생체물리학적 연구

각각의 프리콜라겐P 및 프리콜라겐D 단백질을 특성화하고 자기 조립(self-assembly)의 섬유 형성 효율을 측정하는데 다양한 물리적 방법을 사용할 수 있다. 이런 방법들은 원/근-자외선 원형 광이색성(far- and near-UV circular dichroism), 정지 및 이동 광산란 분석법(light scattering), 푸리에 변환 적외선 분광광도법(FTIR, fourier transformed infrared spectroscopy), 전자 현미경(electron microscopy, EM), 원자력 현미경(AFM, atomic force microscopy), 및 장 흐름 분획법(field flow fractionation)을 포함한다.

프리콜라겐 P 및 프리콜라겐 D의 특성

프리콜라겐P 및 프리콜라겐D의 이차 및 삼차 구조를 결정하기 위하여 원형 광이색성(circular dichroism) 및 푸리에 변환 적외선 분광광도법(FTIR, fourier transformed infrared spectroscopy)을 사용하였다. 또한 그들의 화학적 열역학적 안정성을 여러 가지 조건하에서 테스트하였다. 콜라겐의 형성에 관여하는 단백질의 형태에 대한 데이터는 광산란 분석법(light scattering), 원자력 현미경(atomic force microscopy), 및 장 흐름 분획법(field flow fractionation)에 의해 제공된다.

섬유 형성의 효율 및 속도의 평가

홍합 족사 콜라겐의 이차 및 삼차 구조를 원형 광이색성 및 푸리에 변환 적외선 분광광도법으로 분석할 수 있다. 원자력 현미경(atomic force microscopy)과 전자 현미경은 조립된 집합체와 섬유의 형태와 사차 구조에 대한 정보를 제공한다. 단일 상 매트릭스-프리 크로마토그래피(a one-phase matrix-free chromatography)의 장 흐름 분획법(FFF, field flow fractionation)은 콜라겐의 조립 동안에 형성된 다른 종류의 형태를 평가하는데 사용될 수 있다. 장 흐름 분획법은 매트릭스 프리 크로마토그래피 기법이므로, 다른 용해된 마크로 분자들, 특히 다른 전통적 크로마토그래피 기법에 의해 분리될 수 없는 특히 섬유(fiber)를 분리할 수 있다.

조립 과정의 반응속도(kinetics)는 섬유 형성 동안 이차 및 삼차 구조에 변화를 모니터링 하여 시간의 함수로서 수행될 수 있는 원형 광이색성 및 푸리에 변환 적외선 분광광도법으로 측정할 수 있다. 더 나아가 정지 광산란 분석법(light scattering), 이동 광산란 분석법, 및 시간 경과 원자력 현미경(time-lapse AFM)은 실시간으로 단백질의 조립을 모니터할 수 있게 한다.

형광 염료는 단백질 조립과 관련한 구조적 변화를 연구하는데 사용될 수 있 다. 3-클로로 6-메톡시 9 아미노아크리딘(3-chloro-6-methoxy-9 aminoacridine)과 아미노 나프탈렌 술폰 산(amino naphthalene sulfonic acid)의 N-벤질 유도체(N-benzyl derivative)와 같은 염료의 형광 특성은 단백질 환경의 극성에 따라 변화한다. 따라서 이들 염료로 콜라겐을 표지화(labeling)하는 것은 그 조립 과정을 연구하는데 사용될 수 있다.

콜라겐의 가교 결합과 조립에 금속의 역할에 대한 연구

다이 히드록시 페닐알라닌( DOPA , di hydroxy phenylalanine )과 티로신( tyrosine ) 가교 결합에 있어서 GGH 의 역할

아미노산 서열 GGH는 프리콜라겐P 와 프리콜라겐D 두개 단백질 모두의 카르복실 말단에서 관찰되었다. 트리펩티드인 NH2-Gly-Gly-His-COOH(GGH)는 니켈 아세테이트[Ni(OAc)₂]와 산화제인 마그네슘 모노퍼옥시프탈레이트(MMPP, monoperoxyphthalate)의 존재 하에 수용액에서 관련 단백질의 가교결합을 매개한다(Brown K.C., Kodadek T. 2001, Protein cross-linking mediated by metal ion complexes, Metal Ions in Biological Systems 38, 351-384; Fancy D.A., Denison C., Kim K., Xie Y., Holdeman T., Amini F., Kodadek T., 2000, Scope, limitations and mechanistic aspects of the photo-induced cross-linking of proteins by water-soluble metal complexes, Chemistry & Biology 7, 697-708). 상기 펩티드는 니켈 센터에 바람직한 배위(coordination) 환경을 제공하고, 추정의 니켈(III) 중간체는 접근 가능한 티로신의 방향족(aromatic) 링에서 전자를 추출하여 수소이온의 상실 후에 티로신 라디칼(tyrosyl radical)에 이르는 것으로 생각된다(도 5 참조). 매우 활성화된 라디칼 중간체는 근처의 티로신과 짝을 이루어 가교 결합한 부가물을 생성한다.

[티로신 가교결합 메커니즘]

홍합 콜라겐의 카르복시 말단에서 GGH의 가능한 역할은 활성 촉매 Ni-GGH를 형성하기 위하여 Ni(II)과 결합하는 것일 수 있다. 이 복합체는 가교 결합을 형성하기 위하여 티로신과 다이 히드록시 페닐알라닌의 공기 산화를 서서히 촉진시킨다. 티로신 및/또는 다이 히드록시 페닐알라닌에 대한 촉매의 접근성은 산화 속도를 상당히 증가시킨다. 이러한 가설을 테스트하기 위해 GGH 서열을 유전적으로 제거하거나 변형하여 니켈과 결합할 수 없게 할 수 있다. 가교 결합 및 조립의 속도는 전술한 것과 같이 모니터 할 수 있다.

콜라겐에서 가교 결합을 형성하기 위한 티로신의 화학적 산화

루테니움(II)(ruthenium(II)) 트리스(바이피리딜)(tris(bipyridyl)) 디캐타이온(dication)[Ru(bpy)₃ ²⁺] 및 암모늄 퍼설페이트(APS, ammonium persulfate)와 같은 전자 수용체의 존재 하에서 가시광선의 조사(irradiation)는 근접하는 단백질들 간에 매우 효과적인 가교 결합을 유도한다(Brown K.C., Kodadek T., 2001, Protein cross-linking mediated by metal ion complexes, Metal Ions in Biological Systems 38, 351-384; Burdine L., Gillette T.G., Lin H.-J., Kodadek T., 2004, Periodate-Triggered Cross-Linking of DOPA-Containing Peptide-Protein Complexes, Journal of the American Chemical Society 126, 11442-11443; Kim K., Fancy D.A., Carney D., Kodadek T., 1999, Photoinduced Protein Cross-Linking Mediated by Palladium Porphyrins, Journal of the American Chemical Society 121, 11896-11897). 이 과정은 매우 효과적이며, 이 과정의 메커니즘은 Ni/GGH/MMPP의 메커니즘과 유사하다고 추정되었다. 프리콜라겐P 및/또는 프리콜라겐D의 자기 조립(self-assembly)에 의해 형성되는 섬유는 암모늄 퍼설페이트의 존재 하에 [Ru(bpy)₃ ²⁺]와 조사(irradiation)를 받을 것이다. 이 과정은 족사 콜라겐에서 티로신과 DOPA의 향상된 가교 결합을 이끌어 낼 것이고, 상기 물리 화학적 성질에 의해 평가될 수 있는 변형된 기계적 속성을 갖는 섬유로 이끌 것이다.

다른 예와 서열:

홍합 콜라겐 preColP 및 proColD의 DNA 서열은 다음과 같이 제공된다. 두개 모두의 프리 콜라겐 단백질(P 및 D)을 pGEM-T 클로닝 벡터에 합병하였다. 시작물질을 검증하기 위하여, 두개의 cDNA를 완전히 서열분석하고, 표준화 프라이머로서 T7과 SP6를 사용하였다. 프리콜라겐(P 또는 D)의 내부(internal) 프라이머로서 T7/1 및 SP6/1을 각각 사용하였다. 얻어지는 DNA 서열은 두개의 프리콜라겐의 간행된 버전에 따라 차이점을 보이고, 적절히 비교된다.

preColP ( SEQ ID NO :1)

atggttcg gttctcccta gcatcggtac tattactggc agtcaccagc acagctttcg ctggaccagt tagtgattat ggtggtggtg gaatcaaagt agtaccctac cacggaggcg gaggtggaag cggcggcggt ggcggtggag gccatggcgg aagcggtatt ggtggtatcg gaggaggatc atcacatgca catgcccact cttcagcatc tgcccatgtg caccattttg gaccaggtgg atcttcacat gcatcagctg gttcatcatc ccatgcatcc gcatcccata acggtttagg aggtggcagt gctcatgcac atagcagttc cagcgccaac gctcattccg gtggattcgg tggattcggc ggtattggtg gtattggcgg tattggccca ggaggaagtg tcggaggcgg tattggccca ggaggaagtg tcggaggcgg cattggcggt attggcggta ttggcggcgg tggtggacca ggcggtaatg gcggtatcgg attcggacca ggattcggag gaggattcgg accaggttca tctgctagtg gatccggaag tggcagcgca ttcggtggtc caggaggttc aagcgcaagc gcaaacgcag ctgcacgtgc aaatgcaaat ggtggtggag gattcggtgg accaggtacc ccaggaaact caggaccacc aggccaaccc ggactaccag gagcaccagg ccaaccagga cgtccaggaa gtaccccacc aggtcgacca ggaaaccccg gaccaccagg tcaaccaggt aacccaggacgtccaggctc ttcaggaaga ccaggaggat ccggccaacc aggaggtcca ggacgtccag gaacccccgg caaaccagga aaccgaggac aaccaggaca gccaggcggc ccaggacaac caggtcaccc aggagcagga ggacaaccag gacgaaacgg aaatccagga aaccccggta aaccaggaac accaggtcac ccaggaacag caggatcacg aggaatgcca ggaaccccag gaaccccagg acaaccagga attccaggca ccgtcggagg acgaggacca agaggaccag ctggaatcat cggattaatt ggaccaaaag gaaatccagg agagccagga aatccaggtg caccaggagg cccaggatct acaggaccac aaggaccaca aggaccagcc ggaggaccag gagcatcagg cggaccagga gacaaaggcg caccaggtac accaggagga actggaccaa gaggaccaat cggaccatca ggaccatcag gagcaccagg ggaccaagga ccacaaggag gtagaggaac accaggactc gcaggcaaac caggacctaa aggactacaa ggatcaaatg gagaagttgg accccaagga ccatctggac ccgcaggacc acaaggccca caaggaaaga acggtgtcaa aggagcagca ggagatcaag gagctagggg accagaagga aaagccggac cagctggacc acaaggagaa acaggaccaa aaggaccaac aggagcacaa ggaccagccg gtccagccgg accatcagga gaacaaggac caggagggga aagaggaggc cagggaccac aaggagctga aggaccaagt ggaccagcag gaccaagagg accagcagga tcacaaggac caagtggtga acgcggagaa ccaggagcac caggtaaaaa aggaccaaat ggagaccgag gaaaccaagg atcaccagga gcaccaggca aaaacggagc acgaggaaat agaggatcaa gaggaagcaa cggatcaccc ggcagatcag gatcaccagg aagccgagga aaaccaggac cacaaggacc acatggacca agaggagcaa gaggatcacc aggacaaaaa ggaccacgtg gagaccaagg agcaccaggt gttattcgta ttgttatcga tgaccagaga acaggaccag aagttgcaga attcccagga tttggtggat tcggaggagc ttcagctaac gcagcaagtt cagcaaatgc atttgctggt ggacccggtg gttccgctgg agcaggttca tcatcaggag ctaacgcaaa cgcaggtgga ttcccattcg gaggaggacc attcggagga gcaggaggtg gtcccggagc agcaggaggc ccaggaggag caggaggccc aggaggagta ggaggaggag ttggaggtgg accaggagga gtaggaggtg gagtaggagg tggaccagga ggagtaggag gtggaccagg aggagcagga ccaggaggag caggaggatt tggaccagga ggagcaggag gatttggtgg atttggagga ggatctagcg ctggagcatc atcatcagga tcagcatctg catctaacgg tggaccattc ggagtactca atgtaggacc cggaggtaga atcggtggtg gaagcgcatc agcatctgca gcatctagag cacatgcaca cgcttttggt ggtctcggag ggggaagtgc ctcagctggt agtcattcct catctagctc acactcattt ggcggacacg tattccacag tgtgacccat catggaggtc catcacatgt ttcaagcgga ggtcacggag gtcatggagg aggtccatac aaacctggat attaa

유전자 코드의 축퇴현상 때문에 모든 염기의 교환이 아미노산의 교환에 이르는 것은 아니다. 따라서 DNA 서열을 아미노산 서열로 번역하고 비교하였다. 여기서 간행된 서열(COYNE et al., 1997)[gi:2386675](variant P38, (COYNE & WAITE, 2000))을 서열분석에 의해 얻어진 프리콜라겐P의 서열과 정렬한 것을 나타내었다. 데이터베이스 서열은 서열번호 9에 부합하며 서열 분석된 프리콜라겐P의 서열은 서열번호 3이다.

Database 1 MVRFSLASVLLLAVTSTAFAGPVSDYGGGGIKVVPYHGGGGGGGGGGGGG 50

||||||||||||||||||||||||||||||||||||||||||.|||||||

Sequencing 1 MVRFSLASVLLLAVTSTAFAGPVSDYGGGGIKVVPYHGGGGGSGGGGGGG 50

Database 51 HGGSFRNGRHGGIGGIGGGSSHAHAHSSASAHVHHFGPGGSSHASAGSSS 100

|||| |||||||||||||||||||||||||||||||||||||||

Sequencing 51 HGGS-------GIGGIGGGSSHAHAHSSASAHVHHFGPGGSSHASAGSSS 93

Database 101 HASASHNGLGGGSAHAHSSSSANAHSGGFGGFGGIGGIGGIGPGGSVGGG 150

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 94 HASASHNGLGGGSAHAHSSSSANAHSGGFGGFGGIGGIGGIGPGGSVGGG 143

Database 151 IGPGGSVGGGIGGIGGIGGGGGPGGNGGIGFGPGFGGGFGPGSSASGSGS 200

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 144 IGPGGSVGGGIGGIGGIGGGGGPGGNGGIGFGPGFGGGFGPGSSASGSGS 193

Database 201 GSAFGGPGGSSASANAAARANANGGGGFGGPGTPGNSGPPGQPGLPGAPG 250

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 194 GSAFGGPGGSSASANAAARANANGGGGFGGPGTPGNSGPPGQPGLPGAPG 243

Database 251 QPGRPGSTPPGRLGNPGPPGQPGNPGRPGSSGRPGGSGQPGGPGRPGTPG 300

||||||||||||.|||||||||||||||||||||||||||||||||||||

Sequencing 244 QPGRPGSTPPGRPGNPGPPGQPGNPGRPGSSGRPGGSGQPGGPGRPGTPG 293

Database 301 KPGNRGQPGQPGGPGQPGHPGAGGQPGRNGNPGNPGKPGTPGHPGTAGSR 350

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 294 KPGNRGQPGQPGGPGQPGHPGAGGQPGRNGNPGNPGKPGTPGHPGTAGSR 343

Database 351 GMPGTPGTPGQPGIPGTVGGRGPRGPAGIIGLIGPKGNPGEPGNPGAPGG 400

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 344 GMPGTPGTPGQPGIPGTVGGRGPRGPAGIIGLIGPKGNPGEPGNPGAPGG 393

Database 401 PGSTGPQGPQGPAGGPGASGGPGDKGAPGTPGGTGPRGPIGPSGPSGAPG 450

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 394 PGSTGPQGPQGPAGGPGASGGPGDKGAPGTPGGTGPRGPIGPSGPSGAPG 443

Database 451 DQGPQGGRGTPGLAGKPGPKGLQGSNGEVGPQGPSGPAGPQGPQGKNGVK 500

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 444 DQGPQGGRGTPGLAGKPGPKGLQGSNGEVGPQGPSGPAGPQGPQGKNGVK 493

Database 501 GAAGDQGARGPEGKAGPAGPQGETGPKGPTGAQGPAGPAGPSGEQGPGGE 550

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 494 GAAGDQGARGPEGKAGPAGPQGETGPKGPTGAQGPAGPAGPSGEQGPGGE 543

Database 551 RGGQGPQGAEGPSGPAGPRGPAGSQGPSGERGEPGAPGKKGPNGDRGNQG 600

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 544 RGGQGPQGAEGPSGPAGPRGPAGSQGPSGERGEPGAPGKKGPNGDRGNQG 593

Database 601 SPGAPGKNGARGNRGSRGSNGSPGRSGSPGSRGKPGPQGPHGPRGLRGSP 650

|||||||||||||||||||||||||||||||||||||||||||||.||||

Sequencing 594 SPGAPGKNGARGNRGSRGSNGSPGRSGSPGSRGKPGPQGPHGPRGARGSP 643

Database 651 GQKGPRGDQGAPGVIRIVIDDQRTGPEVAEFPGFGGFGGASANAASSANA 700

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 644 GQKGPRGDQGAPGVIRIVIDDQRTGPEVAEFPGFGGFGGASANAASSANA 693

Database 701 FAGGPGGSAGAGSSSGANANAGGF-----PFGGAGGGPGAAGGPGGAGGP 745

|||||||||||||||||||||||| |||||||||||||||||||||

Sequencing 694 FAGGPGGSAGAGSSSGANANAGGFPFGGGPFGGAGGGPGAAGGPGGAGGP 743

Database 746 GGVGGGVGGGPGGVGGGVGGGPGGVGGGPGGAGPGGAGGFGPGGAGGFGG 795

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 744 GGVGGGVGGGPGGVGGGVGGGPGGVGGGPGGAGPGGAGGFGPGGAGGFGG 793

Database 796 FGGGSSAGASSSGSASASNGGPFGVLNVGPGGRIGGGSASASAASRAHAH 845

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 794 FGGGSSAGASSSGSASASNGGPFGVLNVGPGGRIGGGSASASAASRAHAH 843

Database 846 AFGGLGGGSASAGSHSSSSSHSFGGHVFHSVTHHGGPSHVSSGGHGGHGG 895

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 844 AFGGLGGGSASAGSHSSSSSHSFGGHVFHSVTHHGGPSHVSSGGHGGHGG 893

Database 896 GPYKPGY 902

|||||||

Sequencing 894 GPYKPGY 900

코인과 와이테는 이미 그 cDNA 서열의 특정 부위에서 다른 프리콜라겐P 변이체(P22, P33 및 P38)의 존재를 밝혀내었다(COYNE & WAITE, 2000). 이들 짧고, 변이체 P22의 알려진 서열 부위를 프리콜라겐P의 DNA 서열과 비교하면, 100% 짝을 맞출 수 있다.

preColD ( SEQ ID NO :2)

atggtcta caaactcctg accgtgtgtc ttgtagcatc tcttctagag atttgcttag ctgactataa cggcaacaaa cagtatggcg gcagatacgg caacagatac ggaaacggtt taggaggcgg taatggtggt gcaggagccg tagcccatgc ccatgcccat gcccatgcca gtgccggagc aaacggaaga gcaagagcac atgcacgagc cttggcccat gcacatgccg gtggtggcgc tgcacatgga cacccaggat tcccagttgg tggtagcgca agcgcagccg cacgagcagc agcacgagca tcagcaggag gattaggtgg attcggatca gcagcagcca atgcagcagc agcagcaaga gcaggagcag gatttggtgg attcggtgga ttaggaggat tcggaggact cggaggagtt ggcggtccag gtcaaccagg acatgccggt aaacacggaa ccgcaggagc agcaggcaaa gcaggacgtc caggaccatg tggagataga ggggcaccag gagtaccagg caaacaagga ccagtaggag gacaaggacc agcaggacca cgaggaccac gaggagatga aggaccagtt ggaccaaagg gcgaaccagg agcaagagga gctgatggta aaccaggaga caaaggacct gatggagaaa ccggaccacaaggaccagct ggaccaaagg gacaagtagg agaccaaggc aaaccaggag caaagggaga aaccggagat caaggagcac gaggtgaagc aggaaaggcc ggcgaacaag gaccaggagg catccaagga ccaaagggac cagtaggagg acaaggacca gcaggaccag ccggaccact cggaccacaa ggaccaatgg gtgaacgagg accacaagga ccaacaggat cagaaggacc agttggagca ccaggaccaa agggatcagt cggagaccaa ggagcacaag gagaccaagg agcaactggc gctgatggca aaaagggaga accaggagag agaggacaac aaggagcagc aggaccagtc ggccgaccag gaccaagagg agatagagga gcaaagggaa ttcaaggaag ccgaggacga ccaggtggta tgggtagacg aggaaaccgt ggatcccaag gagcagtagg accacgagga gaaactggcc cagacggtaa ccaaggacaa cgtggagaac aaggagcacc aggagttatc acccttgtca ttgaagacct cagaacagcc ggagtagaaa gccccgtaga aacctttgac gcaggagcag gaaccggtgg accagcacca ggagtaggag cagcagcaac agcaggagca tttgcaggag caggaccagg aggagctaat gcaggaggaa acgcagccgc aggagcagga ccaggagtag gaccaggagg actcggagga ctaggaggac ttggtgcagg tggactcgga ggtggactcg gcggtggact cggaggatta ggaggagcag gaggtttagg tggtggactc ggaggattag gaggaggttt aggtggtgga ctcggaggtt taggaggtgg agcaggagga gcaggaggcg caggagcagg aggaaacggt ggagcaggag caggaggagc aggaggaaac ggtggaggat cagccgcagc acgagcagca gcacaagcag cagcagcagc aggaggaaac ggtggagcag cacaagcagc agcacaagca gcagcatcag cagcagcaaa ttcaggactt ggagcaggag cagcaagagc agcagcatca gcagccgcta gagcaaccgt agcaggacat ggaagtggaa ccgccgcagc agcagccaac gcagccgcac aagcacatgc agcaacacga ggacaaggag gatcacacgc acacgctgcc gccgcagctc acgcagccgc aagtagcgta atccatggtg gtgactatca cggaaacgat gccggctatc acaaaccagg atattaa

다음에서 간행된 서열(QIN et al., 1997) [gi:2772914]을 프리콜라겐D의 서열분석에 의해 얻어진 전체 서열과 정렬한 것을 나타내었다. DNA 서열을 단백질 서열로 번역하였다. 데이터베이스 서열은 서열번호 8이고, 서열 분석에 의해 얻어진 서열은 서열번호 4이다.

Database 1 MVYKLLTVCLVASLLEICLADYNGNKQYGGRYGNRYGNGLGGGNGGAGAV 50

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 1 MVYKLLTVCLVASLLEICLADYNGNKQYGGRYGNRYGNGLGGGNGGAGAV 50

Database 51 AHAHAHAHASAGANGRARAHARALAHAHAGGGAAHGHPGFPVGGSASAAA 100

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 51 AHAHAHAHASAGANGRARAHARALAHAHAGGGAAHGHPGFPVGGSASAAA 100

Database 101 RAAARASAGGLGGFGSAAANAAAAARAGAGFGGFGGLGGFGGLGGVGGPG 150

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 101 RAAARASAGGLGGFGSAAANAAAAARAGAGFGGFGGLGGFGGLGGVGGPG 150

Database 151 QPGGPGGPGGPGGPGGPGMPGGPGGPSGPGTGGPGQPGGPGGPGGPGGPG 200

|

Sequencing 151 Q------------------------------------------------- 151

Database 201 GPSMPGGPGGPGGPGMPGGPGGPGGPGGAGGIPGMTGPAGPPGPAGPQGP 250

Sequencing 151 -------------------------------------------------- 151

Database 251 EGEQGPRGRTPAGTPGPPGNPGEPGQGGAPGAPGAPGHAGKHGTAGAAGK 300

|||||||||||||||

Sequencing 152 -----------------------------------PGHAGKHGTAGAAGK 166

Database 301 AGRPGPXGQAGASGSSGQHGASGAPGRPGNPGSTGRPGATGDPGRPGATG 350

||||

Sequencing 167 AGRP---------------------------------------------- 170

Database 351 TTGRPGPSGAPGNPGAPGALGAPGPRGSPGFVGLPGPRGSPGEPGNQGPI 400

Sequencing 170 -------------------------------------------------- 170

Database 401 GGPGYPGPRGPQGPDGAMGPQGPCGDRGAPGVPGKQGPVGGQGPAGPRGP 450

|||||||||||||||||||||||||||||

Sequencing 171 ---------------------GPCGDRGAPGVPGKQGPVGGQGPAGPRGP 199

Database 451 RGDEGPVGPKGEPGARGADGKPGDKGPDGETGPQGPAGPKGQVGDQGKPG 500

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 200 RGDEGPVGPKGEPGARGADGKPGDKGPDGETGPQGPAGPKGQVGDQGKPG 249

Database 501 AKGETGDQGARGEAGKAGEQGPGGIQGPKGPVGGQGPAGPAGPLGPQGPM 550

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 250 AKGETGDQGARGEAGKAGEQGPGGIQGPKGPVGGQGPAGPAGPLGPQGPM 299

Database 551 GERGPQGPTGSEGPVGAPGPKGSVGDQGAQGDQGATGADGKKGEPGERGQ 600

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 300 GERGPQGPTGSEGPVGAPGPKGSVGDQGAQGDQGATGADGKKGEPGERGQ 349

Database 601 QGAAGPVGRPGPRGDRGAKGIQGSRGRPGGMGRRGNRGSQGAVGPRGETG 650

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 350 QGAAGPVGRPGPRGDRGAKGIQGSRGRPGGMGRRGNRGSQGAVGPRGETG 399

Database 651 PDGNQGQRGEQGAPGVITLVIEDLRTAGVESPVETFDAGAGTGGPAPGVG 700

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 400 PDGNQGQRGEQGAPGVITLVIEDLRTAGVESPVETFDAGAGTGGPAPGVG 449

Database 701 AAATAGAFAGAGPGGANAGGNAAAGAGPGVGPGGLGGLGGLGAGGLGGGL 750

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 450 AAATAGAFAGAGPGGANAGGNAAAGAGPGVGPGGLGGLGGLGAGGLGGGL 499

Database 751 GGGLGGLGGAGGLGGGLGGLGGGLGGGLGGLG---GGAGGAGAGGNGGAG 797

|||||||||||||||||||||||||||||||| |||||||||||||||

Sequencing 500 GGGLGGLGGAGGLGGGLGGLGGGLGGGLGGLGGGAGGAGGAGAGGNGGAG 549

Database 798 AGGAGGNGGGSAAARAAAQAAAAAGGNGGAAQAAAQAAASAAANSGLGAG 847

||||||||||||||||||||||||||||||||||||||||||||||||||

Sequencing 550 AGGAGGNGGGSAAARAAAQAAAAAGGNGGAAQAAAQAAASAAANSGLGAG 599

Database 848 AARAAASAAARATVTGHGSGTAAAAANAAAQAHAATRGQGGSHAHAAAAA 897

||||||||||||||.|||||||||||||||||||||||||||||||||||

Sequencing 600 AARAAASAAARATVAGHGSGTAAAAANAAAQAHAATRGQGGSHAHAAAAA 649

Database 898 HAAASSVIHGGDYHGNDAGYHKPGY 922

|||||||||||||||||||||||||

Sequencing 650 HAAASSVIHGGDYHGNDAGYHKPGY 674

두개의 서열 간에 상당한 차이가 있다. 프리콜라겐D 서열은 간행된 서열보다 250 아미노산만큼 짧게 사용되었다. 콜라겐 도메인에서 아미노산의 중요 부분이 소실되었다. 따라서 본 발명에서 공개된 프리콜라겐D는 지금까지 간행되지 않았고, 프리콜라겐D 유전자의 알려지지 않은 버전이다. 콜라겐 도메인의 절단은 총 단백질에서 실크 피브로인 도메인의 양을 증가시키고, 총 단백질의 습성이 달라지는 것을 주목해야 한다.

P4H 의 발현 구성( EXPRESSION CONSTRUCT )

다음으로 SacII에서 ApaI까지의 부위에서 P4H에 대한 발현 플라스미드에 따른 DNA 서열은 이중가닥으로 나타내었다. MFa/P4H 융합 구성의 시작과 끝은 두개 모두 프린트체로 표시되었다. 사용된 제한 효소 자리는 밑줄로 표시되었다.

SEQ ID NO : 7

1 ccgcggtcat tacagttcat ctttcacagc tttctgatca tcgtcttcct ccatgtctgg

1 ggcgcc agta atgtcaagta gaaagtgtcg aaagactagt agcagaagga ggtacagacc

SacII 2xStop

61 ctcctctgct tcttccaggt cctcgagatc gtcatcatcc cctgccccat cctggccacc

61 gaggagacga agaaggtcca ggagctctag cagtagtagg ggacggggta ggaccggtgg

121 cgagaggtcc ttaaagaatt ttggtaggtc gcacgcaagg ggcaacatta gttactggca

121 gctctccagg aatttcttaa aaccatccag cgtgcgttcc ccgttgtaat caatgaccgt

181 cctgtcggca ctggcaggaa agaacttgag tgtggggaag ctgtgcactt tgacggcctc

181 ggacagccgt gaccgtcctt tcttgaactc acaccccttc gacacgtgaa actgccggag

241 cacctcgttg gcagtcgagt ccatcttggc gatgacgatg ttctcatggt ccttgtacgt

241 gtggagcaac cgtcagctca ggtagaaccg ctactgctac aagagtacca ggaacatgca

301 ctctcccagt ttatcccaaa tgggagccaa ctgtttgcag tgaccacacc atggggcata

301 gagagggtca aatagggttt accctcggtt gacaaacgtc actggtgtgg taccccgtat

361 gaactccaca aagacgtttt ttttctcatc aaaagccacg tcttcaaagt tcttcccaac

361 cttgaggtgt ttctgcaaaa aaaagagtag ttttcggtgc agaagtttca agaagggttg

421 aagcaccttg acaggctgct tgtcccagtc ctccggcagc tcctggctca tcaggtgggg

421 ttcgtggaac tgtccgacga acagggtcag gaggccgtcg aggaccgagt agtccacccc

481 cttgattttg ccctccagga agcggtggca gaactctgtg atcctctctg ccgtcagctc

481 gaactaaaac gggaggtcct tcgccaccgt cttgagacac taggagagac ggcagtcgag

541 ctccgattcg ggcttgtact tggtcatctc ctcctccagg gtgatgaggc gcacggccgg

541 gaggctaagc ccgaacatga accagtagag gaggaggtcc cactactccg cgtgccggcc

601 gcactcttcc ttcttcaggc caaagaactc gaggatgcgc tggttgtcgg tgtggtcgct

601 cgtgagaagg aagaagtccg gtttcttgag ctcctacgcg accaacagcc acaccagcga

661 gtcgatgaag atgaacagga tcttgccctt gaagctctcg gctgctgttt tgaagttgct

661 cagctacttc tacttgtcct agaacgggaa cttcgagagc cgacgacaaa acttcaacga

721 cagtttgccg tcatagtcag acacactctt gggcaagaac agcaggatgt gagtcttgat

721 gtcaaacggc agtatcagtc tgtgtgagaa cccgttcttg tcgtcctaca ctcagaacta

781 ttcacctcca aaaatcttcg gggctgtctg ctcggtgaac tcgatgacaa ggggcagctg

781 aagtggaggt ttttagaagc cccgacagac gagccacttg agctactgtt ccccgtcgac

841 gttgtgtttg ataaagtcca gcaggttctc cttggtgacc tccccttcaa agttgttccg

841 caacacaaac tatttcaggt cgtccaagag gaaccactgg aggggaagtt tcaacaaggc

901 gccttcatca aacttcttaa agaggacaac cccatctttg tcgagctggt atttggagaa

901 cggaagtagt ttgaagaatt tctcctgttg gggtagaaac agctcgacca taaacctctt

961 cacgtcactg ttggaagtga tcccaaatgg tatgtcatcg atggcctctg ctgcctgcaa

961 gtgcagtgac aaccttcact agggtttacc atacagtagc taccggagac gacggacgtt

1021 aaactgcttg gcagagtccg actccacgtc cttgaagaag ccgatgacag ccacctcgct

1021 tttgacgaac cgtctcaggc tgaggtgcag gaacttcttc ggctactgtc ggtggagcga

1081 ggactccacc aaggactctg cagctgcgcc gtcaggcagg gtggtggcag ccgggcccgt

1081 cctgaggtgg ttcctgagac gtcgacgcgg cagtccgtcc caccaccgtc ggcccgggca

ApaI

1141 gcgcttcttc agccagttca cgatgtcatc agcctctctg ccagctgtat attccttggg

1141 cgcgaagaag tcggtcaagt gctacagtag tcggagagac ggtcgacata taaggaaccc

1201 ggaagccgtg tctccattcc tgaagaactt gatggtggga tagccgcgca cgccgtactg

1201 ccttcggcac agaggtaagg acttcttgaa ctaccaccct atcggcgcgt gcggcatgac

1261 ctgggccagg tcagactcct ccgtggcgtc caccttggcc aacctgatct cggaaccttc

1261 gacccggtcc agtctgagga ggcaccgcag gtggaaccgg ttggactaga gccttggaag

1321 tgccttcagc ttcccagcgg ctttggcata ctcaggggcc agagccttgc agtggccaca

1321 acggaagtcg aagggtcgcc gaaaccgtat gagtccccgg tctcggaacg tcaccggtgt

1381 ggttccccgt atcttgaggt ggtcgtccat gaacacccgg cggtcgcgga ggcgcttcaa

1381 ccaaggggca tagaactcca ccagcaggta cttgtgggcc gccagcgcct ccgcgaagtt

1441 gcttttccgc agcaccagga cgtggtcctc ctcctccgga gcgtcagcta atgcggagga

1441 cgaaaaggcg tcgtggtcct gcaccaggag gaggaggcct cgcagtcgat tacgcctcct

BspEI

1501 tgctgcgaat aaaactgcag taaaaattga aggaaatctc atggatccgg ggttttttct

1501 acgacgctta ttttgacgtc atttttaact tcctttagag ta cctaggcc ccaaaaaaga

Start BamHI

1561 ccttgacgtt aaagtataga ggtatattaa caattttttg ttgatacttt tattacattt

1561 ggaactgcaa tttcatatct ccatataatt gttaaaaaac aactatgaaa ataatgtaaa

1621 gaataagaag taatacaaac cgaaaatgtt gaaagtatta gttaaagtgg ttatgcagtt

1621 cttattcttc attatgtttg gcttttacaa ctttcataat caatttcacc aatacgtcaa

1681 tttgcattta tatatctgtt aatagatcaa aaatcatcgc ttcgctgatt aattacccca

1681 aaacgtaaat atatagacaa ttatctagtt tttagtagcg aagcgactaa ttaatggggt

1741 gaaataaggc taaaaaacta atcgcattat catcctatgg ttgttaattt gattcgttca

1741 ctttattccg attttttgat tagcgtaata gtaggatacc aacaattaaa ctaagcaagt

1801 tttgaaggtt tgtggggcca ggttactgcc aatttttcct cttcataacc ataaaagcta

1801 aaacttccaa acaccccggt ccaatgacgg ttaaaaagga gaagtattgg tattttcgat

1861 gtattgtaga atctttattg ttcggagcag tgcggcgcga ggcacatctg cgtttcagga

1861 cataacatct tagaaataac aagcctcgtc acgccgcgct ccgtgtagac gcaaagtcct

1921 acgcgaccgg tgaagacgag gacgcacgga ggagagtctt ccttcggagg gctgtcaccc

1921 tgcgctggcc acttctgctc ctgcgtgcct cctctcagaa ggaagcctcc cgacagtggg

1981 gctcggcggc ttctaatccg tacttcaata tagcaatgag cagttaagcg tattactgaa

1981 cgagccgccg aagattaggc atgaagttat atcgttactc gtcaattcgc ataatgactt

2041 agttccaaag agaaggtttt tttaggctaa gataatgggg ctctttacat ttccacaaca

2041 tcaaggtttc tcttccaaaa aaatccgatt ctattacccc gagaaatgta aaggtgttgt

2101 tataagtaag attagatatg gatatgtata tggatatgta tatggtggta atgccatgta

2101 atattcattc taatctatac ctatacatat acctatacat ataccaccat tacggtacat

2161 atatgattat taaacttctt tgcgtccatc caaaaaaaaa gtaagaattt ttgaaaattc

2161 tatactaata atttgaagaa acgcaggtag gttttttttt cattcttaaa aacttttaag

2221 aaggaattcg atatcaagct tatcgatacc gtcgacatga gatttccttc aatttttact

2221 ttccttaagc tatagttcga atagctatgg cagctg tact ctaaaggaag ttaaaaatga

EcoRI SalI Start

2281 gcagttttat tcgcagcatc ctccgcgcta gctcatccag gcttttttac ttcaattggt

2281 cgtcaaaata agcgtcgtag gaggcgcgat cgagtaggtc cgaaaaaatg aagttaacca

NheI

2341 cagatgactg atttgatcca tactgagaaa gatctggtga cttctctgaa agattatatt

2341 gtctactgac taaactaggt atgactcttt ctagaccact gaagagactt tctaatataa

2401 aaggcagaag aggacaagtt agaacaaata aaaaaatggg cagagaagtt agatcggcta

2401 ttccgtcttc tcctgttcaa tcttgtttat ttttttaccc gtctcttcaa tctagccgat

2461 actagtacag cgacaaaaga tccagaagga tttgttgggc atccagtaaa tgcattcaaa

2461 tgatcatgtc gctgttttct aggtcttcct aaacaacccg taggtcattt acgtaagttt

2521 ttaatgaaac gtctgaatac tgagtggagt gagttggaga atctggtcct taaggatatg

2521 aattactttg cagacttatg actcacctca ctcaacctct tagaccagga attcctatac

2581 tcagatggct ttatctctaa cctaaccatt cagagaccag tactttctaa tgatgaagat

2581 agtctaccga aatagagatt ggattggtaa gtctctggtc atgaaagatt actacttcta

2641 caggttgggg cagccaaagc tctgttacgt ctccaggata cctacaattt ggatacagat

2641 gtccaacccc gtcggtttcg agacaatgca gaggtcctat ggatgttaaa cctatgtcta

2701 accatctcaa agggtaatct tccaggagtg aaacacaaat cttttctaac ggctgaggac

2701 tggtagagtt tcccattaga aggtcctcac tttgtgttta gaaaagattg ccgactcctg

2761 tgctttgagt tgggcaaagt ggcctataca gaagcagatt attaccatac ggaactgtgg

2761 acgaaactca acccgtttca ccggatatgt cttcgtctaa taatggtatg ccttgacacc

2821 atggaacaag ccctaaggca actggatgaa ggcgagattt ctaccataga taaagtctct

2821 taccttgttc gggattccgt tgacctactt ccgctctaaa gatggtatct atttcagaga

2881 gttctagatt atttgagcta tgcggtatat cagcagggag acctggataa ggcacttttg

2881 caagatctaa taaactcgat acgccatata gtcgtccctc tggacctatt ccgtgaaaac

2941 ctcacaaaga agcttcttga actagatcct gaacatcaga gagctaatgg taacttaaaa

2941 gagtgtttct tcgaagaact tgatctagga cttgtagtct ctcgattacc attgaatttt

3001 tattttgagt atataatggc taaagaaaaa gatgtcaata agtctgcttc agatgaccaa

3001 ataaaactca tatattaccg atttcttttt ctacagttat tcagacgaag tctactggtt

3061 tctgatcaga aaactacacc aaagaaaaaa ggggttgctg tggattacct gccagagaga

3061 agactagtct tttgatgtgg tttctttttt ccccaacgac acctaatgga cggtctctct

3121 cagaagtacg aaatgctgtg ccgtggggag ggtatcaaaa tgacccctcg gagacagaaa

3121 gtcttcatgc tttacgacac ggcacccctc ccatagtttt actggggagc ctctgtcttt

3181 aaactctttt gccgctacca tgatggaaac cgtaatccta aatttattct ggctccagct

3181 tttgagaaaa cggcgatggt actacctttg gcattaggat ttaaataaga ccgaggtcga

3241 aaacaggagg atgaatggga caagcctcgt attattcgct tccatgatat tatttctgat

3241 tttgtcctcc tacttaccct gttcggagca taataagcga aggtactata ataaagacta

3301 gcagaaattg aaatcgtcaa agacctagca aaaccaaggc tgagccgagc tacagtacat

3301 cgtctttaac tttagcagtt tctggatcgt tttggttccg actcggctcg atgtcatgta

3361 gaccctgaga ctggaaaatt gaccacagca cagtacagag tatctaagag tgcctggctc

3361 ctgggactct gaccttttaa ctggtgtcgt gtcatgtctc atagattctc acggaccgag

3421 tctggctatg aaaatcctgt ggtgtctcga attaatatga gaatacaaga tctaacagga

3421 agaccgatac ttttaggaca ccacagagct taattatact cttatgttct agattgtcct

3481 ctagatgttt ccacagcaga ggaattacag gtagcaaatt atggagttgg aggacagtat

3481 gatctacaaa ggtgtcgtct ccttaatgtc catcgtttaa tacctcaacc tcctgtcata

3541 gaaccccatt ttgactttgc acggaaagat gagccagatg ctttcaaaga gctggggaca

3541 cttggggtaa aactgaaacg tgcctttcta ctcggtctac gaaagtttct cgacccctgt

3601 ggaaatagaa ttgctacatg gctgttttat atgagtgatg tgtctgcagg aggagccact

3601 cctttatctt aacgatgtac cgacaaaata tactcactac acagacgtcc tcctcggtga

3661 gtttttcctg aagttggagc tagtgtttgg cccaaaaaag gaactgctgt tttctggtat

3661 caaaaaggac ttcaacctcg atcacaaacc gggttttttc cttgacgaca aaagaccata

3721 aatctgtttg ccagtggaga aggagattat agtacacggc atgcagcctg tccagtgcta

3721 ttagacaaac ggtcacctct tcctctaata tcatgtgccg tacgtcggac aggtcacgat

3781 gttggcaaca aatgggtatc caataaatgg ctccatgaac gtggacaaga atttcgaaga

3781 caaccgttgt ttacccatag gttatttacc gaggtacttg cacctgttct taaagcttct

3841 ccttgtacgt tgtcagaatt ggaatgatga gggccc

3841 ggaacatgca acagtcttaa ccttactact cccggg

2xStop ApaI

단백질 서열

MFa P4HA 서열( SEQ ID NO :5)

MRFPSIFTAV LFAASSALAH PGFFTSIGQM TDLIHTEKDL VTSLKDYIKA EEDKLEQIKK WAEKLDRLTS TATKDPEGFV GHPVNAFKLM KRLNTEWSEL ENLVLKDMSD GFISNLTIQR PVLSNDEDQV GAAKALLRLQ DTYNLDTDTI SKGNLPGVKH KSFLTAEDCF ELGKVAYTEA DYYHTELWME QALRQLDEGE ISTIDKVSVL DYLSYAVYQQ GDLDKALLLT KKLLELDPEH QRANGNLKYF EYIMAKEKDV NKSASDDQSD QKTTPKKKGV AVDYLPERQK YEMLCRGEGI KMTPRRQKKL FCRYHDGNRN PKFILAPAKQ EDEWDKPRII RFHDIISDAE IEIVKDLAKP RLSRATVHDP ETGKLTTAQY RVSKSAWLSG YENPVVSRIN MRIQDLTGLD VSTAEELQVA NYGVGGQYEP HFDFARKDEP DAFKELGTGN RIATWLFYMS DVSAGGATVF PEVGASVWPK KGTAVFWYNL FASGEGDYST RHAACPVLVG NKWVSNKWLH ERGQEFRRPC TLSELE

MFa P4HB 서열( SEQ ID NO :6)

MRFPSIFTAV LFAASSALAD APEEEDHVLV LRKSNFAEAL AAHKYLLVEF YAPWCGHCKA LAPEYAKAAG KLKAEGSEIR LAKVDATEES DLAQQYGVRG YPTIKFFRNG DTASPKEYTA GREADDIVNW LKKRTGPAAT TLPDGAAAES LVESSEVAVI GFFKDVESDS AKQFLQAAEA IDDIPFGITS NSDVFSKYQL DKDGVVLFKK FDEGRNNFEG EVTKENLLDF IKHNQLPLVI EFTEQTAPKI FGGEIKTHIL LFLPKSVSDY DGKLSNFKTA AESFKGKILF IFIDSDHTDN QRILEFFGLK KEECPAVRLI TLEEEMTKYK PESEELTAER ITEFCHRFLE GKIKPHLMSQ ELPEDWDKQP VKVLVGKNFE DVAFDEKKNV FVEFYAPWCG HCKQLAPIWD KLGETYKDHE NIVIAKMDST ANEVEAVKVH SFPTLKFFPA SADRTVIDYN GERTLDGFKK FLESGGQDGA GDDDDLEDLE EAEEPDMEED DDQKAVKDEL

MFa 서열( SEQ ID NO : 10)

MRFPSIFTAV LFAASSALA

참고문헌

1. Yonge M., 1962, On the significance of the byssus in the bivalvia and its effects in evolution, J. Mar. Biol. Ass., U. K. 42, p113-125

2. Qin X.-X., Coyne K.J., & Waite J.H., 1997, Tough tendons, Mussel byssus has collagen with silk-like domains, Journal of Biological Chemistry 272, p32623-32627

3. Waite J.H., 1992, Results Probl. Cell Differ 19, p27

4. Qin X.-X., & Waite J.H., 1995, Exotic Collagen Gradients in the Byssus of ht eMussel Mytilus Edulia, The Journal of Experimental Biology 198, p633-644

5. Vaccaro E. & Waite J.H., 2001, Yield and Post-Yield Behavior of Mussel Byssal Thread: A Self-Healing Biomolecular Material, Biomacromolecules 2, p906-911

6. Coyne K.J., Qin X.-X., & Waite J.H. 1997, Extensible collagen in mussel byssus: a natural block copolymer, Science 277, p1830-1832

7. Waite J.H., Qin X.-X., & Coyne K.J., 1998, The peculiar collagens of mussel byssus, Matrix Biology 17, p93-106

8. Coombs T.L., & Keller P.J., 1981, Mytilus byssal threads as an environmental marker for metal ions, Aquat. Toxicol., 1981, p291-300

9. Swann C.P., Adewole T., & Waite J.H., 1998, Preferential manganese accumulation in dreissenid byssal threads, Comparative Biochemistry and Physiology Part B: Biochemistry & Molecular Biology 119B, p755-759

10. Taylor S.W., Chase D.B., Emptage M.H., Nelson M.J., & Waite J.H., 1996, Ferric Ion Complexes of a DOPA-Containing Adhesive Protein from Mytilus edulis, Inorganic Chemistry 35, p7572-7577

11. Sun C., Vaccaro E., & Waite J.H., 2001, Oxidative stress and the mechanical properties of naturally occurring chimeric collagen-containing fibers, Biophysical Journal 81, p3590-3595

12. Myllyharju J., Nokelainen M., Vuorela A., & Kivirikko K.I., 2000, Expression of recombinant human I-III collagens in the yeast Pichia pastoris, Biochem. Soc. Trans. 28, p353-357

13. Prockop D.J., & Kivirikko K.I., 1995, Annu. Rev. Biochem. 64, p403-434

14. Olsen D.R., Leigh S.D., Chang R., McMullin H., Ong W., Ernest T., Chisholm G., Birk D.E., Berg R.A., Hitzeman R.A., & Toman P.D., 2001, Production of Human Type 1 Collagen in Yeast Reveals Unexpected New Insights into Molecular assembly of Collagen Trimers., J. Biol. Chem. 276, p24038-24043.

15. Scheibel T., 2004, Spider silks: recombinant synthesis, assembly, spinning, and engineering of synthetic proteins, Microbial Cell Factories 3, No pp. given.

16. Huemmerich D., Scheibel T., Vollrath F., Cohen S., Gat U., & Ittah S., 2004, Novel Assembly Properties of Recombinant Spider Dragline Silk Proteins, Current Biology 14, p2070-2074.

17. Huemmerich, D., Helsen, C.W., Quedzuweit, S., Oschmann, J., Rudolph, R., & Scheibel, T., 2004, Primary Structure Elements of Spider Dragline Silks and Their Contribution to Protein Solubility, Biochemistry 43, p13604-13612.

18. Brown, K.C., & Kodadek, T., 2001, Protein cross-linking mediated by metal ion complexes, Metal Ions in Biological Systems 38, p351-384

19. Fancy, D.A., Denison, C., Kim, K., Xie, Y., Holdeman, T., Amini, F., & Kodadek, T., 2000, Scope, limitations and mechanistic aspects of the photo-induced cross-linking of proteins by water-soluble metal complexes, Chemistry & Biology 7, p697-708

20. Burdine, L., Gillette, T.G., Lin, H.-J., & Kodadek, T., 2004, Periodate-Triggered Cross-Linking of DOPA-Containing Peptide-Protein Complexes., Journal of the American Chemical Society 126, p11442-11443

21. Kim, K., Fancy, D.A., Carney, D., & Kodadek, T., 1999, Photoinduced Protein Cross-Linking Mediated by Palladium Porphyrins, Journal of the American Chemical Society 121, p11896-11897

기타 참고문헌:

Brake, A.J. (1990) Alpha-factor leader-directed secretion of heterologous proteins from yeast. Methods Enzymol. 185: 408-21

Bulleid, N.J., John, D.C. & Kadler, K.E. (2000) Recombinant expression systems for the production of collagen. Biochem. Soc. Trans. 28: 350-3

Coyne, K.J. & Waite, J.H. (2000) In search of molecular dovetails in mussel byssus: from the threads to the stem. J. Exp. Biol. 203: 1425-31

Keizer-Gunnink, I., Vuorela, A., Myllyharju, J., Pihlajaniemi, T., Kivirikko, K.I. & Veenhuis, M. (2000) Accumulation of properly folded human type III procollagen molecules in specific intracellular membranous compartments in the yeast Pichia pastoris. Matrix Biol. 19: 29-36

Lucas, J.M., Vaccaro, E. & Waite, J.H. (2002) A molecular, morphometric and mechanical comparison of the structural elements of byssus from Mytilus edulis and Mytilus galloprovincialis. J. Exp. Biol. 205: 1807-1

Mascolo, J.M. & Waite, J.H. (1986) Protein gradients in byssal threads of some marine bivalve molluscs. J. Exp. Zool. 240: 1-7

Qin, X.X. & Waite, J.H. (1998) A potential mediator of collagenous block copolymer gradients in mussel byssal threads. Proc. Natl. Acad. Sci. USA 95: 10517-22

Sikorski R.S. & Hieter P. (1989) A system of shuttle vectors and yeast host strains designed for efficient manipulation of DNA in Saccharomyces cerevisiae. Genetics 122, 19-27

Toman, P.D., Chisholm, G., McMullin, H., Giere, L.M., Olsen, D.R., Kovach, R.J., Leigh, S.D., Fong, B.E., Chang, R., Daniels, G.A., Berg, R.A. & Hitzeman, R.A. (2000) Production of recombinant human type I procollagen trimers using a four-gene expression system in the yeast Saccharomyces cerevisiae. J. Biol. Chem. 275: 23303-9

Vaughn, P.R., Galanis, M., Richards, K.M., Tebb, T.A., Ramshaw, J.A. & Werkmeister, J.A. (1998) Production of recombinant hydroxylated human type III collagen fragment in Saccharomyces cerevisiae. DNA Cell Biol. 17: 511-8

Vuorela, A., Myllyharju, J., Nissi, R., Pihlajaniemi, T. & Kivirikko, K.I. (1997) Assembly of human prolyl 4-hydroxylase and type III collagen in the yeast pichia pastoris: formation of a stable enzyme tetramer requires coexpression with collagen and assembly of a stable collagen requires coexpression with prolyl 4-hydroxylase. EMBO J. 16: 6702-12

Waite, J.H., Vaccaro, E., Sun, C. & Lucas, J.M. (2002) Elastomeric gradients: a hedge against stress concentration in marine holdfasts Philos. Trans. R. Soc. Lond B Biol. Sci. 357: 143-53

<110> Technische Universitaet Muenchen <120> Production of recombinant collagen like proteins <160> 10 <170> KopatentIn 1.71 <210> 1 <211> 2703 <212> DNA <213> Mytilus edulis <400> 1 atggttcggt tctccctagc atcggtacta ttactggcag tcaccagcac agctttcgct 60 ggaccagtta gtgattatgg tggtggtgga atcaaagtag taccctacca cggaggcgga 120 ggtggaagcg gcggcggtgg cggtggaggc catggcggaa gcggtattgg tggtatcgga 180 ggaggatcat cacatgcaca tgcccactct tcagcatctg cccatgtgca ccattttgga 240 ccaggtggat cttcacatgc atcagctggt tcatcatccc atgcatccgc atcccataac 300 ggtttaggag gtggcagtgc tcatgcacat agcagttcca gcgccaacgc tcattccggt 360 ggattcggtg gattcggcgg tattggtggt attggcggta ttggcccagg aggaagtgtc 420 ggaggcggta ttggcccagg aggaagtgtc ggaggcggca ttggcggtat tggcggtatt 480 ggcggcggtg gtggaccagg cggtaatggc ggtatcggat tcggaccagg attcggagga 540 ggattcggac caggttcatc tgctagtgga tccggaagtg gcagcgcatt cggtggtcca 600 ggaggttcaa gcgcaagcgc aaacgcagct gcacgtgcaa atgcaaatgg tggtggagga 660 ttcggtggac caggtacccc aggaaactca ggaccaccag gccaacccgg actaccagga 720 gcaccaggcc aaccaggacg tccaggaagt accccaccag gtcgaccagg aaaccccgga 780 ccaccaggtc aaccaggtaa cccaggacgt ccaggctctt caggaagacc aggaggatcc 840 ggccaaccag gaggtccagg acgtccagga acccccggca aaccaggaaa ccgaggacaa 900 ccaggacagc caggcggccc aggacaacca ggtcacccag gagcaggagg acaaccagga 960 cgaaacggaa atccaggaaa ccccggtaaa ccaggaacac caggtcaccc aggaacagca 1020 ggatcacgag gaatgccagg aaccccagga accccaggac aaccaggaat tccaggcacc 1080 gtcggaggac gaggaccaag aggaccagct ggaatcatcg gattaattgg accaaaagga 1140 aatccaggag agccaggaaa tccaggtgca ccaggaggcc caggatctac aggaccacaa 1200 ggaccacaag gaccagccgg aggaccagga gcatcaggcg gaccaggaga caaaggcgca 1260 ccaggtacac caggaggaac tggaccaaga ggaccaatcg gaccatcagg accatcagga 1320 gcaccagggg accaaggacc acaaggaggt agaggaacac caggactcgc aggcaaacca 1380 ggacctaaag gactacaagg atcaaatgga gaagttggac cccaaggacc atctggaccc 1440 gcaggaccac aaggcccaca aggaaagaac ggtgtcaaag gagcagcagg agatcaagga 1500 gctaggggac cagaaggaaa agccggacca gctggaccac aaggagaaac aggaccaaaa 1560 ggaccaacag gagcacaagg accagccggt ccagccggac catcaggaga acaaggacca 1620 ggaggggaaa gaggaggcca gggaccacaa ggagctgaag gaccaagtgg accagcagga 1680 ccaagaggac cagcaggatc acaaggacca agtggtgaac gcggagaacc aggagcacca 1740 ggtaaaaaag gaccaaatgg agaccgagga aaccaaggat caccaggagc accaggcaaa 1800 aacggagcac gaggaaatag aggatcaaga ggaagcaacg gatcacccgg cagatcagga 1860 tcaccaggaa gccgaggaaa accaggacca caaggaccac atggaccaag aggagcaaga 1920 ggatcaccag gacaaaaagg accacgtgga gaccaaggag caccaggtgt tattcgtatt 1980 gttatcgatg accagagaac aggaccagaa gttgcagaat tcccaggatt tggtggattc 2040 ggaggagctt cagctaacgc agcaagttca gcaaatgcat ttgctggtgg acccggtggt 2100 tccgctggag caggttcatc atcaggagct aacgcaaacg caggtggatt cccattcgga 2160 ggaggaccat tcggaggagc aggaggtggt cccggagcag caggaggccc aggaggagca 2220 ggaggcccag gaggagtagg aggaggagtt ggaggtggac caggaggagt aggaggtgga 2280 gtaggaggtg gaccaggagg agtaggaggt ggaccaggag gagcaggacc aggaggagca 2340 ggaggatttg gaccaggagg agcaggagga tttggtggat ttggaggagg atctagcgct 2400 ggagcatcat catcaggatc agcatctgca tctaacggtg gaccattcgg agtactcaat 2460 gtaggacccg gaggtagaat cggtggtgga agcgcatcag catctgcagc atctagagca 2520 catgcacacg cttttggtgg tctcggaggg ggaagtgcct cagctggtag tcattcctca 2580 tctagctcac actcatttgg cggacacgta ttccacagtg tgacccatca tggaggtcca 2640 tcacatgttt caagcggagg tcacggaggt catggaggag gtccatacaa acctggatat 2700 taa 2703 <210> 2 <211> 2025 <212> DNA <213> Mytilus edulis <400> 2 atggtctaca aactcctgac cgtgtgtctt gtagcatctc ttctagagat ttgcttagct 60 gactataacg gcaacaaaca gtatggcggc agatacggca acagatacgg aaacggttta 120 ggaggcggta atggtggtgc aggagccgta gcccatgccc atgcccatgc ccatgccagt 180 gccggagcaa acggaagagc aagagcacat gcacgagcct tggcccatgc acatgccggt 240 ggtggcgctg cacatggaca cccaggattc ccagttggtg gtagcgcaag cgcagccgca 300 cgagcagcag cacgagcatc agcaggagga ttaggtggat tcggatcagc agcagccaat 360 gcagcagcag cagcaagagc aggagcagga tttggtggat tcggtggatt aggaggattc 420 ggaggactcg gaggagttgg cggtccaggt caaccaggac atgccggtaa acacggaacc 480 gcaggagcag caggcaaagc aggacgtcca ggaccatgtg gagatagagg ggcaccagga 540 gtaccaggca aacaaggacc agtaggagga caaggaccag caggaccacg aggaccacga 600 ggagatgaag gaccagttgg accaaagggc gaaccaggag caagaggagc tgatggtaaa 660 ccaggagaca aaggacctga tggagaaacc ggaccacaag gaccagctgg accaaaggga 720 caagtaggag accaaggcaa accaggagca aagggagaaa ccggagatca aggagcacga 780 ggtgaagcag gaaaggccgg cgaacaagga ccaggaggca tccaaggacc aaagggacca 840 gtaggaggac aaggaccagc aggaccagcc ggaccactcg gaccacaagg accaatgggt 900 gaacgaggac cacaaggacc aacaggatca gaaggaccag ttggagcacc aggaccaaag 960 ggatcagtcg gagaccaagg agcacaagga gaccaaggag caactggcgc tgatggcaaa 1020 aagggagaac caggagagag aggacaacaa ggagcagcag gaccagtcgg ccgaccagga 1080 ccaagaggag atagaggagc aaagggaatt caaggaagcc gaggacgacc aggtggtatg 1140 ggtagacgag gaaaccgtgg atcccaagga gcagtaggac cacgaggaga aactggccca 1200 gacggtaacc aaggacaacg tggagaacaa ggagcaccag gagttatcac ccttgtcatt 1260 gaagacctca gaacagccgg agtagaaagc cccgtagaaa cctttgacgc aggagcagga 1320 accggtggac cagcaccagg agtaggagca gcagcaacag caggagcatt tgcaggagca 1380 ggaccaggag gagctaatgc aggaggaaac gcagccgcag gagcaggacc aggagtagga 1440 ccaggaggac tcggaggact aggaggactt ggtgcaggtg gactcggagg tggactcggc 1500 ggtggactcg gaggattagg aggagcagga ggtttaggtg gtggactcgg aggattagga 1560 ggaggtttag gtggtggact cggaggttta ggaggtggag caggaggagc aggaggcgca 1620 ggagcaggag gaaacggtgg agcaggagca ggaggagcag gaggaaacgg tggaggatca 1680 gccgcagcac gagcagcagc acaagcagca gcagcagcag gaggaaacgg tggagcagca 1740 caagcagcag cacaagcagc agcatcagca gcagcaaatt caggacttgg agcaggagca 1800 gcaagagcag cagcatcagc agccgctaga gcaaccgtag caggacatgg aagtggaacc 1860 gccgcagcag cagccaacgc agccgcacaa gcacatgcag caacacgagg acaaggagga 1920 tcacacgcac acgctgccgc cgcagctcac gcagccgcaa gtagcgtaat ccatggtggt 1980 gactatcacg gaaacgatgc cggctatcac aaaccaggat attaa 2025 <210> 3 <211> 900 <212> PRT <213> Mytilus edulis <400> 3 Met Val Arg Phe Ser Leu Ala Ser Val Leu Leu Leu Ala Val Thr Ser 1 5 10 15 Thr Ala Phe Ala Gly Pro Val Ser Asp Tyr Gly Gly Gly Gly Ile Lys 20 25 30 Val Val Pro Tyr His Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly 35 40 45 Gly Gly His Gly Gly Ser Gly Ile Gly Gly Ile Gly Gly Gly Ser Ser 50 55 60 His Ala His Ala His Ser Ser Ala Ser Ala His Val His His Phe Gly 65 70 75 80 Pro Gly Gly Ser Ser His Ala Ser Ala Gly Ser Ser Ser His Ala Ser 85 90 95 Ala Ser His Asn Gly Leu Gly Gly Gly Ser Ala His Ala His Ser Ser 100 105 110 Ser Ser Ala Asn Ala His Ser Gly Gly Phe Gly Gly Phe Gly Gly Ile 115 120 125 Gly Gly Ile Gly Gly Ile Gly Pro Gly Gly Ser Val Gly Gly Gly Ile 130 135 140 Gly Pro Gly Gly Ser Val Gly Gly Gly Ile Gly Gly Ile Gly Gly Ile 145 150 155 160 Gly Gly Gly Gly Gly Pro Gly Gly Asn Gly Gly Ile Gly Phe Gly Pro 165 170 175 Gly Phe Gly Gly Gly Phe Gly Pro Gly Ser Ser Ala Ser Gly Ser Gly 180 185 190 Ser Gly Ser Ala Phe Gly Gly Pro Gly Gly Ser Ser Ala Ser Ala Asn 195 200 205 Ala Ala Ala Arg Ala Asn Ala Asn Gly Gly Gly Gly Phe Gly Gly Pro 210 215 220 Gly Thr Pro Gly Asn Ser Gly Pro Pro Gly Gln Pro Gly Leu Pro Gly 225 230 235 240 Ala Pro Gly Gln Pro Gly Arg Pro Gly Ser Thr Pro Pro Gly Arg Pro 245 250 255 Gly Asn Pro Gly Pro Pro Gly Gln Pro Gly Asn Pro Gly Arg Pro Gly 260 265 270 Ser Ser Gly Arg Pro Gly Gly Ser Gly Gln Pro Gly Gly Pro Gly Arg 275 280 285 Pro Gly Thr Pro Gly Lys Pro Gly Asn Arg Gly Gln Pro Gly Gln Pro 290 295 300 Gly Gly Pro Gly Gln Pro Gly His Pro Gly Ala Gly Gly Gln Pro Gly 305 310 315 320 Arg Asn Gly Asn Pro Gly Asn Pro Gly Lys Pro Gly Thr Pro Gly His 325 330 335 Pro Gly Thr Ala Gly Ser Arg Gly Met Pro Gly Thr Pro Gly Thr Pro 340 345 350 Gly Gln Pro Gly Ile Pro Gly Thr Val Gly Gly Arg Gly Pro Arg Gly 355 360 365 Pro Ala Gly Ile Ile Gly Leu Ile Gly Pro Lys Gly Asn Pro Gly Glu 370 375 380 Pro Gly Asn Pro Gly Ala Pro Gly Gly Pro Gly Ser Thr Gly Pro Gln 385 390 395 400 Gly Pro Gln Gly Pro Ala Gly Gly Pro Gly Ala Ser Gly Gly Pro Gly 405 410 415 Asp Lys Gly Ala Pro Gly Thr Pro Gly Gly Thr Gly Pro Arg Gly Pro 420 425 430 Ile Gly Pro Ser Gly Pro Ser Gly Ala Pro Gly Asp Gln Gly Pro Gln 435 440 445 Gly Gly Arg Gly Thr Pro Gly Leu Ala Gly Lys Pro Gly Pro Lys Gly 450 455 460 Leu Gln Gly Ser Asn Gly Glu Val Gly Pro Gln Gly Pro Ser Gly Pro 465 470 475 480 Ala Gly Pro Gln Gly Pro Gln Gly Lys Asn Gly Val Lys Gly Ala Ala 485 490 495 Gly Asp Gln Gly Ala Arg Gly Pro Glu Gly Lys Ala Gly Pro Ala Gly 500 505 510 Pro Gln Gly Glu Thr Gly Pro Lys Gly Pro Thr Gly Ala Gln Gly Pro 515 520 525 Ala Gly Pro Ala Gly Pro Ser Gly Glu Gln Gly Pro Gly Gly Glu Arg 530 535 540 Gly Gly Gln Gly Pro Gln Gly Ala Glu Gly Pro Ser Gly Pro Ala Gly 545 550 555 560 Pro Arg Gly Pro Ala Gly Ser Gln Gly Pro Ser Gly Glu Arg Gly Glu 565 570 575 Pro Gly Ala Pro Gly Lys Lys Gly Pro Asn Gly Asp Arg Gly Asn Gln 580 585 590 Gly Ser Pro Gly Ala Pro Gly Lys Asn Gly Ala Arg Gly Asn Arg Gly 595 600 605 Ser Arg Gly Ser Asn Gly Ser Pro Gly Arg Ser Gly Ser Pro Gly Ser 610 615 620 Arg Gly Lys Pro Gly Pro Gln Gly Pro His Gly Pro Arg Gly Ala Arg 625 630 635 640 Gly Ser Pro Gly Gln Lys Gly Pro Arg Gly Asp Gln Gly Ala Pro Gly 645 650 655 Val Ile Arg Ile Val Ile Asp Asp Gln Arg Thr Gly Pro Glu Val Ala 660 665 670 Glu Phe Pro Gly Phe Gly Gly Phe Gly Gly Ala Ser Ala Asn Ala Ala 675 680 685 Ser Ser Ala Asn Ala Phe Ala Gly Gly Pro Gly Gly Ser Ala Gly Ala 690 695 700 Gly Ser Ser Ser Gly Ala Asn Ala Asn Ala Gly Gly Phe Pro Phe Gly 705 710 715 720 Gly Gly Pro Phe Gly Gly Ala Gly Gly Gly Pro Gly Ala Ala Gly Gly 725 730 735 Pro Gly Gly Ala Gly Gly Pro Gly Gly Val Gly Gly Gly Val Gly Gly 740 745 750 Gly Pro Gly Gly Val Gly Gly Gly Val Gly Gly Gly Pro Gly Gly Val 755 760 765 Gly Gly Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Gly Phe Gly 770 775 780 Pro Gly Gly Ala Gly Gly Phe Gly Gly Phe Gly Gly Gly Ser Ser Ala 785 790 795 800 Gly Ala Ser Ser Ser Gly Ser Ala Ser Ala Ser Asn Gly Gly Pro Phe 805 810 815 Gly Val Leu Asn Val Gly Pro Gly Gly Arg Ile Gly Gly Gly Ser Ala 820 825 830 Ser Ala Ser Ala Ala Ser Arg Ala His Ala His Ala Phe Gly Gly Leu 835 840 845 Gly Gly Gly Ser Ala Ser Ala Gly Ser His Ser Ser Ser Ser Ser His 850 855 860 Ser Phe Gly Gly His Val Phe His Ser Val Thr His His Gly Gly Pro 865 870 875 880 Ser His Val Ser Ser Gly Gly His Gly Gly His Gly Gly Gly Pro Tyr 885 890 895 Lys Pro Gly Tyr 900 <210> 4 <211> 674 <212> PRT <213> Mytilus edulis <400> 4 Met Val Tyr Lys Leu Leu Thr Val Cys Leu Val Ala Ser Leu Leu Glu 1 5 10 15 Ile Cys Leu Ala Asp Tyr Asn Gly Asn Lys Gln Tyr Gly Gly Arg Tyr 20 25 30 Gly Asn Arg Tyr Gly Asn Gly Leu Gly Gly Gly Asn Gly Gly Ala Gly 35 40 45 Ala Val Ala His Ala His Ala His Ala His Ala Ser Ala Gly Ala Asn 50 55 60 Gly Arg Ala Arg Ala His Ala Arg Ala Leu Ala His Ala His Ala Gly 65 70 75 80 Gly Gly Ala Ala His Gly His Pro Gly Phe Pro Val Gly Gly Ser Ala 85 90 95 Ser Ala Ala Ala Arg Ala Ala Ala Arg Ala Ser Ala Gly Gly Leu Gly 100 105 110 Gly Phe Gly Ser Ala Ala Ala Asn Ala Ala Ala Ala Ala Arg Ala Gly 115 120 125 Ala Gly Phe Gly Gly Phe Gly Gly Leu Gly Gly Phe Gly Gly Leu Gly 130 135 140 Gly Val Gly Gly Pro Gly Gln Pro Gly His Ala Gly Lys His Gly Thr 145 150 155 160 Ala Gly Ala Ala Gly Lys Ala Gly Arg Pro Gly Pro Cys Gly Asp Arg 165 170 175 Gly Ala Pro Gly Val Pro Gly Lys Gln Gly Pro Val Gly Gly Gln Gly 180 185 190 Pro Ala Gly Pro Arg Gly Pro Arg Gly Asp Glu Gly Pro Val Gly Pro 195 200 205 Lys Gly Glu Pro Gly Ala Arg Gly Ala Asp Gly Lys Pro Gly Asp Lys 210 215 220 Gly Pro Asp Gly Glu Thr Gly Pro Gln Gly Pro Ala Gly Pro Lys Gly 225 230 235 240 Gln Val Gly Asp Gln Gly Lys Pro Gly Ala Lys Gly Glu Thr Gly Asp 245 250 255 Gln Gly Ala Arg Gly Glu Ala Gly Lys Ala Gly Glu Gln Gly Pro Gly 260 265 270 Gly Ile Gln Gly Pro Lys Gly Pro Val Gly Gly Gln Gly Pro Ala Gly 275 280 285 Pro Ala Gly Pro Leu Gly Pro Gln Gly Pro Met Gly Glu Arg Gly Pro 290 295 300 Gln Gly Pro Thr Gly Ser Glu Gly Pro Val Gly Ala Pro Gly Pro Lys 305 310 315 320 Gly Ser Val Gly Asp Gln Gly Ala Gln Gly Asp Gln Gly Ala Thr Gly 325 330 335 Ala Asp Gly Lys Lys Gly Glu Pro Gly Glu Arg Gly Gln Gln Gly Ala 340 345 350 Ala Gly Pro Val Gly Arg Pro Gly Pro Arg Gly Asp Arg Gly Ala Lys 355 360 365 Gly Ile Gln Gly Ser Arg Gly Arg Pro Gly Gly Met Gly Arg Arg Gly 370 375 380 Asn Arg Gly Ser Gln Gly Ala Val Gly Pro Arg Gly Glu Thr Gly Pro 385 390 395 400 Asp Gly Asn Gln Gly Gln Arg Gly Glu Gln Gly Ala Pro Gly Val Ile 405 410 415 Thr Leu Val Ile Glu Asp Leu Arg Thr Ala Gly Val Glu Ser Pro Val 420 425 430 Glu Thr Phe Asp Ala Gly Ala Gly Thr Gly Gly Pro Ala Pro Gly Val 435 440 445 Gly Ala Ala Ala Thr Ala Gly Ala Phe Ala Gly Ala Gly Pro Gly Gly 450 455 460 Ala Asn Ala Gly Gly Asn Ala Ala Ala Gly Ala Gly Pro Gly Val Gly 465 470 475 480 Pro Gly Gly Leu Gly Gly Leu Gly Gly Leu Gly Ala Gly Gly Leu Gly 485 490 495 Gly Gly Leu Gly Gly Gly Leu Gly Gly Leu Gly Gly Ala Gly Gly Leu 500 505 510 Gly Gly Gly Leu Gly Gly Leu Gly Gly Gly Leu Gly Gly Gly Leu Gly 515 520 525 Gly Leu Gly Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly 530 535 540 Asn Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Asn Gly Gly Gly Ser 545 550 555 560 Ala Ala Ala Arg Ala Ala Ala Gln Ala Ala Ala Ala Ala Gly Gly Asn 565 570 575 Gly Gly Ala Ala Gln Ala Ala Ala Gln Ala Ala Ala Ser Ala Ala Ala 580 585 590 Asn Ser Gly Leu Gly Ala Gly Ala Ala Arg Ala Ala Ala Ser Ala Ala 595 600 605 Ala Arg Ala Thr Val Ala Gly His Gly Ser Gly Thr Ala Ala Ala Ala 610 615 620 Ala Asn Ala Ala Ala Gln Ala His Ala Ala Thr Arg Gly Gln Gly Gly 625 630 635 640 Ser His Ala His Ala Ala Ala Ala Ala His Ala Ala Ala Ser Ser Val 645 650 655 Ile His Gly Gly Asp Tyr His Gly Asn Asp Ala Gly Tyr His Lys Pro 660 665 670 Gly Tyr <210> 5 <211> 536 <212> PRT <213> Saccharomyces cerevisiae <400> 5 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala His Pro Gly Phe Phe Thr Ser Ile Gly Gln Met Thr Asp 20 25 30 Leu Ile His Thr Glu Lys Asp Leu Val Thr Ser Leu Lys Asp Tyr Ile 35 40 45 Lys Ala Glu Glu Asp Lys Leu Glu Gln Ile Lys Lys Trp Ala Glu Lys 50 55 60 Leu Asp Arg Leu Thr Ser Thr Ala Thr Lys Asp Pro Glu Gly Phe Val 65 70 75 80 Gly His Pro Val Asn Ala Phe Lys Leu Met Lys Arg Leu Asn Thr Glu 85 90 95 Trp Ser Glu Leu Glu Asn Leu Val Leu Lys Asp Met Ser Asp Gly Phe 100 105 110 Ile Ser Asn Leu Thr Ile Gln Arg Pro Val Leu Ser Asn Asp Glu Asp 115 120 125 Gln Val Gly Ala Ala Lys Ala Leu Leu Arg Leu Gln Asp Thr Tyr Asn 130 135 140 Leu Asp Thr Asp Thr Ile Ser Lys Gly Asn Leu Pro Gly Val Lys His 145 150 155 160 Lys Ser Phe Leu Thr Ala Glu Asp Cys Phe Glu Leu Gly Lys Val Ala 165 170 175 Tyr Thr Glu Ala Asp Tyr Tyr His Thr Glu Leu Trp Met Glu Gln Ala 180 185 190 Leu Arg Gln Leu Asp Glu Gly Glu Ile Ser Thr Ile Asp Lys Val Ser 195 200 205 Val Leu Asp Tyr Leu Ser Tyr Ala Val Tyr Gln Gln Gly Asp Leu Asp 210 215 220 Lys Ala Leu Leu Leu Thr Lys Lys Leu Leu Glu Leu Asp Pro Glu His 225 230 235 240 Gln Arg Ala Asn Gly Asn Leu Lys Tyr Phe Glu Tyr Ile Met Ala Lys 245 250 255 Glu Lys Asp Val Asn Lys Ser Ala Ser Asp Asp Gln Ser Asp Gln Lys 260 265 270 Thr Thr Pro Lys Lys Lys Gly Val Ala Val Asp Tyr Leu Pro Glu Arg 275 280 285 Gln Lys Tyr Glu Met Leu Cys Arg Gly Glu Gly Ile Lys Met Thr Pro 290 295 300 Arg Arg Gln Lys Lys Leu Phe Cys Arg Tyr His Asp Gly Asn Arg Asn 305 310 315 320 Pro Lys Phe Ile Leu Ala Pro Ala Lys Gln Glu Asp Glu Trp Asp Lys 325 330 335 Pro Arg Ile Ile Arg Phe His Asp Ile Ile Ser Asp Ala Glu Ile Glu 340 345 350 Ile Val Lys Asp Leu Ala Lys Pro Arg Leu Ser Arg Ala Thr Val His 355 360 365 Asp Pro Glu Thr Gly Lys Leu Thr Thr Ala Gln Tyr Arg Val Ser Lys 370 375 380 Ser Ala Trp Leu Ser Gly Tyr Glu Asn Pro Val Val Ser Arg Ile Asn 385 390 395 400 Met Arg Ile Gln Asp Leu Thr Gly Leu Asp Val Ser Thr Ala Glu Glu 405 410 415 Leu Gln Val Ala Asn Tyr Gly Val Gly Gly Gln Tyr Glu Pro His Phe 420 425 430 Asp Phe Ala Arg Lys Asp Glu Pro Asp Ala Phe Lys Glu Leu Gly Thr 435 440 445 Gly Asn Arg Ile Ala Thr Trp Leu Phe Tyr Met Ser Asp Val Ser Ala 450 455 460 Gly Gly Ala Thr Val Phe Pro Glu Val Gly Ala Ser Val Trp Pro Lys 465 470 475 480 Lys Gly Thr Ala Val Phe Trp Tyr Asn Leu Phe Ala Ser Gly Glu Gly 485 490 495 Asp Tyr Ser Thr Arg His Ala Ala Cys Pro Val Leu Val Gly Asn Lys 500 505 510 Trp Val Ser Asn Lys Trp Leu His Glu Arg Gly Gln Glu Phe Arg Arg 515 520 525 Pro Cys Thr Leu Ser Glu Leu Glu 530 535 <210> 6 <211> 510 <212> PRT <213> Saccharomyces cerevisiae <400> 6 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Asp Ala Pro Glu Glu Glu Asp His Val Leu Val Leu Arg 20 25 30 Lys Ser Asn Phe Ala Glu Ala Leu Ala Ala His Lys Tyr Leu Leu Val 35 40 45 Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Ala Leu Ala Pro Glu 50 55 60 Tyr Ala Lys Ala Ala Gly Lys Leu Lys Ala Glu Gly Ser Glu Ile Arg 65 70 75 80 Leu Ala Lys Val Asp Ala Thr Glu Glu Ser Asp Leu Ala Gln Gln Tyr 85 90 95 Gly Val Arg Gly Tyr Pro Thr Ile Lys Phe Phe Arg Asn Gly Asp Thr 100 105 110 Ala Ser Pro Lys Glu Tyr Thr Ala Gly Arg Glu Ala Asp Asp Ile Val 115 120 125 Asn Trp Leu Lys Lys Arg Thr Gly Pro Ala Ala Thr Thr Leu Pro Asp 130 135 140 Gly Ala Ala Ala Glu Ser Leu Val Glu Ser Ser Glu Val Ala Val Ile 145 150 155 160 Gly Phe Phe Lys Asp Val Glu Ser Asp Ser Ala Lys Gln Phe Leu Gln 165 170 175 Ala Ala Glu Ala Ile Asp Asp Ile Pro Phe Gly Ile Thr Ser Asn Ser 180 185 190 Asp Val Phe Ser Lys Tyr Gln Leu Asp Lys Asp Gly Val Val Leu Phe 195 200 205 Lys Lys Phe Asp Glu Gly Arg Asn Asn Phe Glu Gly Glu Val Thr Lys 210 215 220 Glu Asn Leu Leu Asp Phe Ile Lys His Asn Gln Leu Pro Leu Val Ile 225 230 235 240 Glu Phe Thr Glu Gln Thr Ala Pro Lys Ile Phe Gly Gly Glu Ile Lys 245 250 255 Thr His Ile Leu Leu Phe Leu Pro Lys Ser Val Ser Asp Tyr Asp Gly 260 265 270 Lys Leu Ser Asn Phe Lys Thr Ala Ala Glu Ser Phe Lys Gly Lys Ile 275 280 285 Leu Phe Ile Phe Ile Asp Ser Asp His Thr Asp Asn Gln Arg Ile Leu 290 295 300 Glu Phe Phe Gly Leu Lys Lys Glu Glu Cys Pro Ala Val Arg Leu Ile 305 310 315 320 Thr Leu Glu Glu Glu Met Thr Lys Tyr Lys Pro Glu Ser Glu Glu Leu 325 330 335 Thr Ala Glu Arg Ile Thr Glu Phe Cys His Arg Phe Leu Glu Gly Lys 340 345 350 Ile Lys Pro His Leu Met Ser Gln Glu Leu Pro Glu Asp Trp Asp Lys 355 360 365 Gln Pro Val Lys Val Leu Val Gly Lys Asn Phe Glu Asp Val Ala Phe 370 375 380 Asp Glu Lys Lys Asn Val Phe Val Glu Phe Tyr Ala Pro Trp Cys Gly 385 390 395 400 His Cys Lys Gln Leu Ala Pro Ile Trp Asp Lys Leu Gly Glu Thr Tyr 405 410 415 Lys Asp His Glu Asn Ile Val Ile Ala Lys Met Asp Ser Thr Ala Asn 420 425 430 Glu Val Glu Ala Val Lys Val His Ser Phe Pro Thr Leu Lys Phe Phe 435 440 445 Pro Ala Ser Ala Asp Arg Thr Val Ile Asp Tyr Asn Gly Glu Arg Thr 450 455 460 Leu Asp Gly Phe Lys Lys Phe Leu Glu Ser Gly Gly Gln Asp Gly Ala 465 470 475 480 Gly Asp Asp Asp Asp Leu Glu Asp Leu Glu Glu Ala Glu Glu Pro Asp 485 490 495 Met Glu Glu Asp Asp Asp Gln Lys Ala Val Lys Asp Glu Leu 500 505 510 <210> 7 <211> 3876 <212> DNA <213> Mytilus edulis <400> 7 ccgcggtcat tacagttcat ctttcacagc tttctgatca tcgtcttcct ccatgtctgg 60 ctcctctgct tcttccaggt cctcgagatc gtcatcatcc cctgccccat cctggccacc 120 cgagaggtcc ttaaagaatt ttggtaggtc gcacgcaagg ggcaacatta gttactggca 180 cctgtcggca ctggcaggaa agaacttgag tgtggggaag ctgtgcactt tgacggcctc 240 cacctcgttg gcagtcgagt ccatcttggc gatgacgatg ttctcatggt ccttgtacgt 300 ctctcccagt ttatcccaaa tgggagccaa ctgtttgcag tgaccacacc atggggcata 360 gaactccaca aagacgtttt ttttctcatc aaaagccacg tcttcaaagt tcttcccaac 420 aagcaccttg acaggctgct tgtcccagtc ctccggcagc tcctggctca tcaggtgggg 480 cttgattttg ccctccagga agcggtggca gaactctgtg atcctctctg ccgtcagctc 540 ctccgattcg ggcttgtact tggtcatctc ctcctccagg gtgatgaggc gcacggccgg 600 gcactcttcc ttcttcaggc caaagaactc gaggatgcgc tggttgtcgg tgtggtcgct 660 gtcgatgaag atgaacagga tcttgccctt gaagctctcg gctgctgttt tgaagttgct 720 cagtttgccg tcatagtcag acacactctt gggcaagaac agcaggatgt gagtcttgat 780 ttcacctcca aaaatcttcg gggctgtctg ctcggtgaac tcgatgacaa ggggcagctg 840 gttgtgtttg ataaagtcca gcaggttctc cttggtgacc tccccttcaa agttgttccg 900 gccttcatca aacttcttaa agaggacaac cccatctttg tcgagctggt atttggagaa 960 cacgtcactg ttggaagtga tcccaaatgg tatgtcatcg atggcctctg ctgcctgcaa 1020 aaactgcttg gcagagtccg actccacgtc cttgaagaag ccgatgacag ccacctcgct 1080 ggactccacc aaggactctg cagctgcgcc gtcaggcagg gtggtggcag ccgggcccgt 1140 gcgcttcttc agccagttca cgatgtcatc agcctctctg ccagctgtat attccttggg 1200 ggaagccgtg tctccattcc tgaagaactt gatggtggga tagccgcgca cgccgtactg 1260 ctgggccagg tcagactcct ccgtggcgtc caccttggcc aacctgatct cggaaccttc 1320 tgccttcagc ttcccagcgg ctttggcata ctcaggggcc agagccttgc agtggccaca 1380 ggttccccgt atcttgaggt ggtcgtccat gaacacccgg cggtcgcgga ggcgcttcaa 1440 gcttttccgc agcaccagga cgtggtcctc ctcctccgga gcgtcagcta atgcggagga 1500 tgctgcgaat aaaactgcag taaaaattga aggaaatctc atggatccgg ggttttttct 1560 ccttgacgtt aaagtataga ggtatattaa caattttttg ttgatacttt tattacattt 1620 gaataagaag taatacaaac cgaaaatgtt gaaagtatta gttaaagtgg ttatgcagtt 1680 tttgcattta tatatctgtt aatagatcaa aaatcatcgc ttcgctgatt aattacccca 1740 gaaataaggc taaaaaacta atcgcattat catcctatgg ttgttaattt gattcgttca 1800 tttgaaggtt tgtggggcca ggttactgcc aatttttcct cttcataacc ataaaagcta 1860 gtattgtaga atctttattg ttcggagcag tgcggcgcga ggcacatctg cgtttcagga 1920 acgcgaccgg tgaagacgag gacgcacgga ggagagtctt ccttcggagg gctgtcaccc 1980 gctcggcggc ttctaatccg tacttcaata tagcaatgag cagttaagcg tattactgaa 2040 agttccaaag agaaggtttt tttaggctaa gataatgggg ctctttacat ttccacaaca 2100 tataagtaag attagatatg gatatgtata tggatatgta tatggtggta atgccatgta 2160 atatgattat taaacttctt tgcgtccatc caaaaaaaaa gtaagaattt ttgaaaattc 2220 aaggaattcg atatcaagct tatcgatacc gtcgacatga gatttccttc aatttttact 2280 gcagttttat tcgcagcatc ctccgcgcta gctcatccag gcttttttac ttcaattggt 2340 cagatgactg atttgatcca tactgagaaa gatctggtga cttctctgaa agattatatt 2400 aaggcagaag aggacaagtt agaacaaata aaaaaatggg cagagaagtt agatcggcta 2460 actagtacag cgacaaaaga tccagaagga tttgttgggc atccagtaaa tgcattcaaa 2520 ttaatgaaac gtctgaatac tgagtggagt gagttggaga atctggtcct taaggatatg 2580 tcagatggct ttatctctaa cctaaccatt cagagaccag tactttctaa tgatgaagat 2640 caggttgggg cagccaaagc tctgttacgt ctccaggata cctacaattt ggatacagat 2700 accatctcaa agggtaatct tccaggagtg aaacacaaat cttttctaac ggctgaggac 2760 tgctttgagt tgggcaaagt ggcctataca gaagcagatt attaccatac ggaactgtgg 2820 atggaacaag ccctaaggca actggatgaa ggcgagattt ctaccataga taaagtctct 2880 gttctagatt atttgagcta tgcggtatat cagcagggag acctggataa ggcacttttg 2940 ctcacaaaga agcttcttga actagatcct gaacatcaga gagctaatgg taacttaaaa 3000 tattttgagt atataatggc taaagaaaaa gatgtcaata agtctgcttc agatgaccaa 3060 tctgatcaga aaactacacc aaagaaaaaa ggggttgctg tggattacct gccagagaga 3120 cagaagtacg aaatgctgtg ccgtggggag ggtatcaaaa tgacccctcg gagacagaaa 3180 aaactctttt gccgctacca tgatggaaac cgtaatccta aatttattct ggctccagct 3240 aaacaggagg atgaatggga caagcctcgt attattcgct tccatgatat tatttctgat 3300 gcagaaattg aaatcgtcaa agacctagca aaaccaaggc tgagccgagc tacagtacat 3360 gaccctgaga ctggaaaatt gaccacagca cagtacagag tatctaagag tgcctggctc 3420 tctggctatg aaaatcctgt ggtgtctcga attaatatga gaatacaaga tctaacagga 3480 ctagatgttt ccacagcaga ggaattacag gtagcaaatt atggagttgg aggacagtat 3540 gaaccccatt ttgactttgc acggaaagat gagccagatg ctttcaaaga gctggggaca 3600 ggaaatagaa ttgctacatg gctgttttat atgagtgatg tgtctgcagg aggagccact 3660 gtttttcctg aagttggagc tagtgtttgg cccaaaaaag gaactgctgt tttctggtat 3720 aatctgtttg ccagtggaga aggagattat agtacacggc atgcagcctg tccagtgcta 3780 gttggcaaca aatgggtatc caataaatgg ctccatgaac gtggacaaga atttcgaaga 3840 ccttgtacgt tgtcagaatt ggaatgatga gggccc 3876 <210> 8 <211> 922 <212> PRT <213> Mytilus edulis <400> 8 Met Val Tyr Lys Leu Leu Thr Val Cys Leu Val Ala Ser Leu Leu Glu 1 5 10 15 Ile Cys Leu Ala Asp Tyr Asn Gly Asn Lys Gln Tyr Gly Gly Arg Tyr 20 25 30 Gly Asn Arg Tyr Gly Asn Gly Leu Gly Gly Gly Asn Gly Gly Ala Gly 35 40 45 Ala Val Ala His Ala His Ala His Ala His Ala Ser Ala Gly Ala Asn 50 55 60 Gly Arg Ala Arg Ala His Ala Arg Ala Leu Ala His Ala His Ala Gly 65 70 75 80 Gly Gly Ala Ala His Gly His Pro Gly Phe Pro Val Gly Gly Ser Ala 85 90 95 Ser Ala Ala Ala Arg Ala Ala Ala Arg Ala Ser Ala Gly Gly Leu Gly 100 105 110 Gly Phe Gly Ser Ala Ala Ala Asn Ala Ala Ala Ala Ala Arg Ala Gly 115 120 125 Ala Gly Phe Gly Gly Phe Gly Gly Leu Gly Gly Phe Gly Gly Leu Gly 130 135 140 Gly Val Gly Gly Pro Gly Gln Pro Gly Gly Pro Gly Gly Pro Gly Gly 145 150 155 160 Pro Gly Gly Pro Gly Gly Pro Gly Met Pro Gly Gly Pro Gly Gly Pro 165 170 175 Ser Gly Pro Gly Thr Gly Gly Pro Gly Gln Pro Gly Gly Pro Gly Gly 180 185 190 Pro Gly Gly Pro Gly Gly Pro Gly Gly Pro Ser Met Pro Gly Gly Pro 195 200 205 Gly Gly Pro Gly Gly Pro Gly Met Pro Gly Gly Pro Gly Gly Pro Gly 210 215 220 Gly Pro Gly Gly Ala Gly Gly Ile Pro Gly Met Thr Gly Pro Ala Gly 225 230 235 240 Pro Pro Gly Pro Ala Gly Pro Gln Gly Pro Glu Gly Glu Gln Gly Pro 245 250 255 Arg Gly Arg Thr Pro Ala Gly Thr Pro Gly Pro Pro Gly Asn Pro Gly 260 265 270 Glu Pro Gly Gln Gly Gly Ala Pro Gly Ala Pro Gly Ala Pro Gly His 275 280 285 Ala Gly Lys His Gly Thr Ala Gly Ala Ala Gly Lys Ala Gly Arg Pro 290 295 300 Gly Pro Xaa Gly Gln Ala Gly Ala Ser Gly Ser Ser Gly Gln His Gly 305 310 315 320 Ala Ser Gly Ala Pro Gly Arg Pro Gly Asn Pro Gly Ser Thr Gly Arg 325 330 335 Pro Gly Ala Thr Gly Asp Pro Gly Arg Pro Gly Ala Thr Gly Thr Thr 340 345 350 Gly Arg Pro Gly Pro Ser Gly Ala Pro Gly Asn Pro Gly Ala Pro Gly 355 360 365 Ala Leu Gly Ala Pro Gly Pro Arg Gly Ser Pro Gly Phe Val Gly Leu 370 375 380 Pro Gly Pro Arg Gly Ser Pro Gly Glu Pro Gly Asn Gln Gly Pro Ile 385 390 395 400 Gly Gly Pro Gly Tyr Pro Gly Pro Arg Gly Pro Gln Gly Pro Asp Gly 405 410 415 Ala Met Gly Pro Gln Gly Pro Cys Gly Asp Arg Gly Ala Pro Gly Val 420 425 430 Pro Gly Lys Gln Gly Pro Val Gly Gly Gln Gly Pro Ala Gly Pro Arg 435 440 445 Gly Pro Arg Gly Asp Glu Gly Pro Val Gly Pro Lys Gly Glu Pro Gly 450 455 460 Ala Arg Gly Ala Asp Gly Lys Pro Gly Asp Lys Gly Pro Asp Gly Glu 465 470 475 480 Thr Gly Pro Gln Gly Pro Ala Gly Pro Lys Gly Gln Val Gly Asp Gln 485 490 495 Gly Lys Pro Gly Ala Lys Gly Glu Thr Gly Asp Gln Gly Ala Arg Gly 500 505 510 Glu Ala Gly Lys Ala Gly Glu Gln Gly Pro Gly Gly Ile Gln Gly Pro 515 520 525 Lys Gly Pro Val Gly Gly Gln Gly Pro Ala Gly Pro Ala Gly Pro Leu 530 535 540 Gly Pro Gln Gly Pro Met Gly Glu Arg Gly Pro Gln Gly Pro Thr Gly 545 550 555 560 Ser Glu Gly Pro Val Gly Ala Pro Gly Pro Lys Gly Ser Val Gly Asp 565 570 575 Gln Gly Ala Gln Gly Asp Gln Gly Ala Thr Gly Ala Asp Gly Lys Lys 580 585 590 Gly Glu Pro Gly Glu Arg Gly Gln Gln Gly Ala Ala Gly Pro Val Gly 595 600 605 Arg Pro Gly Pro Arg Gly Asp Arg Gly Ala Lys Gly Ile Gln Gly Ser 610 615 620 Arg Gly Arg Pro Gly Gly Met Gly Arg Arg Gly Asn Arg Gly Ser Gln 625 630 635 640 Gly Ala Val Gly Pro Arg Gly Glu Thr Gly Pro Asp Gly Asn Gln Gly 645 650 655 Gln Arg Gly Glu Gln Gly Ala Pro Gly Val Ile Thr Leu Val Ile Glu 660 665 670 Asp Leu Arg Thr Ala Gly Val Glu Ser Pro Val Glu Thr Phe Asp Ala 675 680 685 Gly Ala Gly Thr Gly Gly Pro Ala Pro Gly Val Gly Ala Ala Ala Thr 690 695 700 Ala Gly Ala Phe Ala Gly Ala Gly Pro Gly Gly Ala Asn Ala Gly Gly 705 710 715 720 Asn Ala Ala Ala Gly Ala Gly Pro Gly Val Gly Pro Gly Gly Leu Gly 725 730 735 Gly Leu Gly Gly Leu Gly Ala Gly Gly Leu Gly Gly Gly Leu Gly Gly 740 745 750 Gly Leu Gly Gly Leu Gly Gly Ala Gly Gly Leu Gly Gly Gly Leu Gly 755 760 765 Gly Leu Gly Gly Gly Leu Gly Gly Gly Leu Gly Gly Leu Gly Gly Gly 770 775 780 Ala Gly Gly Ala Gly Ala Gly Gly Asn Gly Gly Ala Gly Ala Gly Gly 785 790 795 800 Ala Gly Gly Asn Gly Gly Gly Ser Ala Ala Ala Arg Ala Ala Ala Gln 805 810 815 Ala Ala Ala Ala Ala Gly Gly Asn Gly Gly Ala Ala Gln Ala Ala Ala 820 825 830 Gln Ala Ala Ala Ser Ala Ala Ala Asn Ser Gly Leu Gly Ala Gly Ala 835 840 845 Ala Arg Ala Ala Ala Ser Ala Ala Ala Arg Ala Thr Val Thr Gly His 850 855 860 Gly Ser Gly Thr Ala Ala Ala Ala Ala Asn Ala Ala Ala Gln Ala His 865 870 875 880 Ala Ala Thr Arg Gly Gln Gly Gly Ser His Ala His Ala Ala Ala Ala 885 890 895 Ala His Ala Ala Ala Ser Ser Val Ile His Gly Gly Asp Tyr His Gly 900 905 910 Asn Asp Ala Gly Tyr His Lys Pro Gly Tyr 915 920 <210> 9 <211> 19 <212> PRT <213> Saccharomyces cerevisiae <400> 9 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala <210> 10 <211> 952 <212> PRT <213> Mytilus edulis <400> 10 Met Val Arg Phe Ser Leu Ala Ser Val Leu Leu Leu Ala Val Thr Ser 1 5 10 15 Thr Ala Phe Ala Gly Pro Val Ser Asp Tyr Gly Gly Gly Gly Ile Lys 20 25 30 Val Val Pro Tyr His Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly 35 40 45 Gly Gly His Gly Gly Ser Phe Arg Asn Gly Arg His Gly Gly Ile Gly 50 55 60 Gly Ile Gly Gly Gly Ser Ser His Ala His Ala His Ser Ser Ala Ser 65 70 75 80 Ala His Val His His Phe Gly Pro Gly Gly Ser Ser His Ala Ser Ala 85 90 95 Gly Ser Ser Ser His Ala Ser Ala Ser His Asn Gly Leu Gly Gly Gly 100 105 110 Ser Ala His Ala His Ser Ser Ser Ser Ala Asn Ala His Ser Gly Gly 115 120 125 Phe Gly Gly Phe Gly Gly Ile Gly Gly Ile Gly Gly Ile Gly Pro Gly 130 135 140 Gly Ser Val Gly Gly Gly Ile Gly Pro Gly Gly Ser Val Gly Gly Gly 145 150 155 160 Ile Gly Gly Ile Gly Gly Ile Gly Gly Gly Gly Gly Pro Gly Gly Asn 165 170 175 Gly Gly Ile Gly Phe Gly Pro Gly Phe Gly Gly Gly Phe Gly Pro Gly 180 185 190 Ser Ser Ala Ser Gly Ser Gly Ser Gly Ser Ala Phe Gly Gly Pro Gly 195 200 205 Gly Ser Ser Ala Ser Ala Asn Ala Ala Ala Arg Ala Asn Ala Asn Gly 210 215 220 Gly Gly Gly Phe Gly Gly Pro Gly Thr Pro Gly Asn Ser Gly Pro Pro 225 230 235 240 Gly Gln Pro Gly Leu Pro Gly Ala Pro Gly Gln Pro Gly Arg Pro Gly 245 250 255 Ser Thr Pro Pro Gly Arg Leu Gly Asn Pro Gly Pro Pro Gly Gln Pro 260 265 270 Gly Asn Pro Gly Arg Pro Gly Ser Ser Gly Arg Pro Gly Gly Ser Gly 275 280 285 Gln Pro Gly Gly Pro Gly Arg Pro Gly Thr Pro Gly Lys Pro Gly Asn 290 295 300 Arg Gly Gln Pro Gly Gln Pro Gly Gly Pro Gly Gln Pro Gly His Pro 305 310 315 320 Gly Ala Gly Gly Gln Pro Gly Arg Asn Gly Asn Pro Gly Asn Pro Gly 325 330 335 Lys Pro Gly Thr Pro Gly His Pro Gly Thr Ala Gly Ser Arg Gly Met 340 345 350 Pro Gly Thr Pro Gly Thr Pro Gly Gln Pro Gly Ile Pro Gly Thr Val 355 360 365 Gly Gly Arg Gly Pro Arg Gly Pro Ala Gly Ile Ile Gly Leu Ile Gly 370 375 380 Pro Lys Gly Asn Pro Gly Glu Pro Gly Asn Pro Gly Ala Pro Gly Gly 385 390 395 400 Pro Gly Ser Thr Gly Pro Gln Gly Pro Gln Gly Pro Ala Gly Gly Pro 405 410 415 Gly Ala Ser Gly Gly Pro Gly Asp Lys Gly Ala Pro Gly Thr Pro Gly 420 425 430 Gly Thr Gly Pro Arg Gly Pro Ile Gly Pro Ser Gly Pro Ser Gly Ala 435 440 445 Pro Gly Asp Gln Gly Pro Gln Gly Gly Arg Gly Thr Pro Gly Leu Ala 450 455 460 Gly Lys Pro Gly Pro Lys Gly Leu Gln Gly Ser Asn Gly Glu Val Gly 465 470 475 480 Pro Gln Gly Pro Ser Gly Pro Ala Gly Pro Gln Gly Pro Gln Gly Lys 485 490 495 Asn Gly Val Lys Gly Ala Ala Gly Asp Gln Gly Ala Arg Gly Pro Glu 500 505 510 Gly Lys Ala Gly Pro Ala Gly Pro Gln Gly Glu Thr Gly Pro Lys Gly 515 520 525 Pro Thr Gly Ala Gln Gly Pro Ala Gly Pro Ala Gly Pro Ser Gly Glu 530 535 540 Gln Gly Pro Gly Gly Glu Arg Gly Gly Gln Gly Pro Gln Gly Ala Glu 545 550 555 560 Gly Pro Ser Gly Pro Ala Gly Pro Arg Gly Pro Ala Gly Ser Gln Gly 565 570 575 Pro Ser Gly Glu Arg Gly Glu Pro Gly Ala Pro Gly Lys Lys Gly Pro 580 585 590 Asn Gly Asp Arg Gly Asn Gln Gly Ser Pro Gly Ala Pro Gly Lys Asn 595 600 605 Gly Ala Arg Gly Asn Arg Gly Ser Arg Gly Ser Asn Gly Ser Pro Gly 610 615 620 Arg Ser Gly Ser Pro Gly Ser Arg Gly Lys Pro Gly Pro Gln Gly Pro 625 630 635 640 His Gly Pro Arg Gly Leu Arg Gly Ser Pro Gly Gln Lys Gly Pro Arg 645 650 655 Gly Asp Gln Gly Ala Pro Gly Val Ile Arg Ile Val Ile Asp Asp Gln 660 665 670 Arg Thr Gly Pro Glu Val Ala Glu Phe Pro Gly Phe Gly Gly Phe Gly 675 680 685 Gly Ala Ser Ala Asn Ala Ala Ser Ser Ala Asn Ala Phe Ala Gly Gly 690 695 700 Pro Gly Gly Ser Ala Gly Ala Gly Ser Ser Ser Gly Ala Asn Ala Asn 705 710 715 720 Ala Gly Gly Phe Pro Phe Gly Gly Ala Gly Gly Gly Pro Gly Ala Ala 725 730 735 Gly Gly Pro Gly Gly Ala Gly Gly Pro Gly Gly Val Gly Gly Gly Val 740 745 750 Gly Gly Gly Pro Gly Gly Val Gly Gly Gly Val Gly Gly Gly Pro Gly 755 760 765 Gly Val Gly Gly Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Gly 770 775 780 Phe Gly Pro Gly Gly Ala Gly Gly Phe Gly Gly Phe Gly Gly Gly Ser 785 790 795 800 Ser Ala Gly Ala Ser Ser Ser Gly Ser Ala Ser Ala Ser Asn Gly Gly 805 810 815 Pro Phe Gly Val Leu Asn Val Gly Pro Gly Gly Arg Ile Gly Gly Gly 820 825 830 Ser Ala Ser Ala Ser Ala Ala Ser Arg Ala His Ala His Phe Gly Gly 835 840 845 Gly Ser Ser Ala Gly Ala Ser Ser Ser Gly Ser Ala Ser Ala Ser Asn 850 855 860 Gly Gly Pro Phe Gly Val Leu Asn Val Gly Pro Gly Gly Arg Ile Gly 865 870 875 880 Gly Gly Ser Ala Ser Ala Ser Ala Ala Ser Arg Ala His Ala His Ala 885 890 895 Phe Gly Gly Leu Gly Gly Gly Ser Ala Ser Ala Gly Ser His Ser Ser 900 905 910 Ser Ser Ser His Ser Phe Gly Gly His Val Phe His Ser Val Thr His 915 920 925 His Gly Gly Pro Ser His Val Ser Ser Gly Gly His Gly Gly His Gly 930 935 940 Gly Gly Pro Tyr Lys Pro Gly Tyr 945 950

Claims

재조합 콜라겐 유사 단백질 바람직하게는 재조합 홍합(mussel) 족사(byssus) 단백질을 생산하기 위한 하기 요소로 형질 전환된 효모 세포:

a) 상기 재조합 콜라겐 유사 단백질을 암호화하는 일차 발현 벡터; 및

b) 프롤릴-4-히드록실라제(P4H, prolyl-4-hydroxylase)를 암호화하는 핵산을 포함하는 2차 발현 벡터.
제1항에 있어서, 상기 프롤릴-4-히드록실라제의 서열은 상기 효모 세포의 세포질내 세망(endoplasmic reticulum)으로 상기 서열의 효과적인 수송을 위한 신호 서열이 연결된 것을 특징으로 하는 효모 세포.
제2항에 있어서, 상기 신호 서열은 서열번호 10의 사카로마이세스 세레비지에(Saccharomyces cerevisiae) 교배 인자 알파-1(MFa)의 신호서열인 것을 특징으로 하는 효모 세포.
제1항 내지 제3항 중 하나 이상의 항에 있어서, 상기 효모 세포는 사카로마이세스 세레비지에(Saccharomyces cerevisiae), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 피치아 파스토리스(Pichia pastoris), 칸디다 알비칸스(Candida albicans), 및 한세눌라 폴리모프(Hansenula polymorph) 세포로 이 루어진 군에서 선택된 어느 하나인 것을 특징으로 하는 효모 세포.
제1항 내지 제4항 중 하나 이상의 항에 있어서, 상기 1차 발현 벡터는 하나 이상의 조절인자(regulatory element)를 포함하는 것을 특징으로 하는 효모 세포.
제5항에 있어서, 상기 조절인자는 유도성(inducible) 또는 항상성(constitutive) 프로모터에서 선택된 프로모터를 함유하는 것을 특징으로 하는 효모 세포.
제6항에 있어서, 상기 프로모터는 GPD, GAL4, CUP1, MET25, GAL1 또는 GAL1-10에서 선택된 프로모터인 것을 특징으로 하는 효소 세포.
전술한 항 중 하나 이상의 항에 있어서, 상기 발현 벡터는 플라스미드인 것을 특징으로 하는 효소 세포.
전술한 항 중 하나 이상의 항에 있어서, 상기 재조합 콜라겐 유사 단백질은 홍합 엘라스틴(elastin) 또는 홍합 실크 피브로인(silk fibroin) 도메인이 측면 배치(flanking)된 하나 이상의 홍합 콜라겐 도메인 단편(fragment)으로 이루어지거나 포함하는 재조합 홍합 족사 단백질인 것을 특징으로 하는 효소 세포.
전술한 항 중 하나 이상의 항에 있어서, 상기 단편(fragment)은 미틸러스 속(Mytilus sp.)의 미틸러스 에듈리스(M. edulis), 미틸러스 갈로프로빈시알리스(M. galloprovincialis), 미틸러스 캘리포니안스(M. californians), 또는 제우케리아 데미싸(Geukeria demissa)에서 유래된 것을 특징으로 하는 효소 세포.
전술한 항 중 하나 이상의 항에 있어서, 상기 재조합 홍합(mussel) 족사(byssus) 단백질은 preColP 및/또는 preColD 또는 그 변이체의 하나 또는 하나 이상의 단편으로 이루어지거나 포함하는 것을 특징으로 하는 효소 세포.
전술한 항 중 하나 이상의 항에 있어서, 상기 재조합 단백질은 서열번호 3 및/또는 서열번호4, 또는 그 변이체의 아미노산 서열을 포함하거나 그 서열로 이루어진 것을 특징으로 하는 재조합 단백질인 것을 특징으로 하는 효소 세포.
전술한 항 중 하나 이상의 항에 있어서, 상기 재조합 단백질의 각 아미노산 서열의 신호 서열은 효모 특이적 신호 서열 바람직하게는 사카로마이세스 세레비지에(Saccharomyces cerevisiae)의 교배 인자 알파 1으로 치환된 것을 특징으로 하는 효모 세포.
전술한 항 중 하나 이상의 항에 있어서, 상기 프롤릴-4-히드록실라제(P4H, prolyl-4-hydroxylase)는 사람 또는 홍합의 프롤릴-4-히드록실라제(P4H, prolyl-4- hydroxylase)인 것을 특징으로 하는 효모 세포.
하기 구성요소를 포함하는 재조합 콜라겐 유사 단백질의 생산 용도를 위한 공동 발현 시스템 또는 그 부분 키트:

(a) 제1항 내지 제14항의 하나 이상의 항에서 정의된 일차 발현 벡터; 및

(b) 제1항 내지 제14항의 하나 이상의 항에서 정의된 이차 발현 벡터
하기 단계를 포함하는 재조합 콜라겐 유사 단백질, 바람직하게는 재조합 홍합 족사 단백질의 생산 방법:

a) 효모 세포를 준비하는 단계;

b) 상기 효모세포에 제15항의 공동 발현 시스템 또는 제1항 내지 제14항 중 하나 이상의 항에서 정의된 일차 및 이차 발현 벡터로 상기 효모세포를 형질 전환시키는 단계;

c) 적절한 조건에서 상기 효모 세포로부터 재조합 콜라겐 유사 단백질 바람직하게는 재조합 홍합 족사 단백질을 발현시키는 단계; 및

d) 상기 재조합 단백질을 회수하는 단계.
하기 단계를 포함하는 재조합 홍합 족사 단백질에서 실(thread)을 생산하는 방법:

a) 제16항에 따른 재조합 단백질을 생산하는 단계; 및

b) 적절한 방법에 의해 상기 단백질을 실(thread)로 (전자)방적(spinning)하거나 몰딩(molding)하는 단계.
제17항의 방법에 따라 생산되는 실 또는 제16항의 방법에 따라 생산되는 단백질.
제18항의 단백질/실의 바이오테크놀로지 또는 의약 분야에서의 용도.
제18항의 단백질/실의 상처 봉합 또는 피복 시스템(coverage system)의 제조를 위한 용도.
제20항에 있어서, 봉합 물질(suture material)의 제조를 위한 용도.
제21항에 있어서, 상기 봉합 물질은 신경외과 또는 안외과(ophthalmic surgery)에서 사용하기 위한 용도.
제18항에 따른 단백질/실의 대체물질 바람직하게는 인공 연골 또는 건(tendon) 물질의 제조를 위한 용도.
제18항의 단백질/실을 사용하여 얻을 수 있는 상처 봉합 또는 피복 시스템, 봉합 물질, 대체 물질, 바람직하게는 인공 연골 또는 건 물질.
제18항의 단백질/실을 포함하는 화장품, 약물 전단 운반체, 직물, 옷감, 종이 제품, 가죽 제품, 자동차 부품, 또는 항공기 부품.