KR20120014940A

KR20120014940A - 펩티드의 재조합 생산

Info

Publication number: KR20120014940A
Application number: KR1020127000053A
Authority: KR
Inventors: 다니엘 휘메리히; 부르그하르트 리브만; 마르쿠스 페르; 카르스텐 슈발브; 하이케 브뤼저
Original assignee: 바스프 에스이
Priority date: 2009-06-03
Filing date: 2010-06-02
Publication date: 2012-02-20
Also published as: BRPI1011144B1; ES2763168T3; CL2011003075A1; KR20140127344A; RU2011153757A; AR076977A1; AU2010255732A8; EP2437769B1; NZ596735A; PE20121033A1; AU2010255732A1; US20120088268A1; WO2010139736A3; TWI429750B; US9481719B2; IL216619A0; RU2548815C2; AU2010255732B8; CA2763626A1; ECSP12011577A

Abstract

본 발명은 반복되는 구조의 자기-조립 전구체 단백질, 그를 코딩하는 핵산 서열 및 발현 구조물, 및 상기 전구체 단백질을 사용함으로써 펩티드를 재조합적으로 생산하는 방법에 관한 것이다.

Description

펩티드의 재조합 생산{RECOMBINANT PRODUCTION OF PEPTIDES}

본 발명은 반복되는 구조의(repetitive) 자기-조립 전구체 단백질, 그를 코딩하는 핵산 서열 및 발현 구조물, 및 상기 전구체 단백질을 사용함으로써 펩티드를 재조합적으로 생산하는 방법에 관한 것이다.

생물공학적 수단에 의해 펩티드를 생산하는 상이한 방법들이 공지되어 있다. 보통 미생물 숙주 세포에서 단쇄 폴리펩티드의 안정성은 낮기 때문에, 그리고 유리 펩티드는 숙주 유기체에게 독성 효과를 미칠 가능성이 있기 때문에(예를 들어, 항미생물성 펩티드), 대부분의 방법은 전구체 단백질을 정제한 후, 그로부터 펩티드가 절단되는 것인, 보다 큰 전구체 단백질을 생산하는 것을 포함한다.

안정한 전구체 단백질을 수득할 수 있는 한가지 방법은 융합 단백질에 의해 안정한 단백질과 함께 펩티드를 발현시키는 것을 포함한다. 이어지는 후속 후처리 단계에도 큰 영향을 미치는, 상기 융합 단백질의 특성은 대개 펩티드 서열과는 상관없는 융합 파트너에 의해 측정되고, 이로써 상기와 같은 특성은 조절이 쉽고, 상이한 서열을 가진 펩티드를 생산하는 데 적합하다.

WO　2008/085543에는 융합 단백질의 도움을 통해 단백질과 펩티드를 생산하는 구체적인 방법이 기술되어 있다. 이러한 융합 단백질은 원하는 펩티드 서열 이외에도, 융합 단백질이 역상 전이 양상을 보일 수 있도록 하는 융합 파트너를 포함한다. 이러한 양상은 먼저 간단하고 저렴한 방식으로 세포 내용물로부터 정제되는 융합 단백질을 포함한다. 두번째로, 펩티드를 단백질분해성 절단에 의해 제거한 후, 융합 파트너를 간단하고 저렴한 방식으로 유사하게 제거할 수 있다. 융합 단백질은 빈번하게 우수한 수율로 수득될 수 있는 반면, 전구체 단백질의 펩티드 부분은 보통 작고, 따라서, 공정 효율도 차선적이다.

또 다른 접근법은 재조합적으로 생산된 원하는 펩티드를 다중 카피로 포함하는 반복되는 구조의 전구체 단백질을 포함한다. WO　03/089455에는 항미생물 특성을 가진 원하는 펩티드 서열을 산성 절단에 의해 다량체 전구체 단백질로부터 잘라 내는 것인, 다량체 전구체 단백질을 생산하는 것이 기술되어 있다.

추가의 접근법 다수가 공개되어 있는데 (예를 들어, 문헌 ([Metlitskaya et al., Biotechnol Appl. Biochem 39; 339-345 (2004)]; [Wang & Cai Appl. Biochem and Biotechnol. 141; 203-213 (2007)])), 이러한 방법은 펩티드 서열 또는 펩티드 서열 계열이 반복되는 구조의 전구체 단백질의 도움을 통해 특정 방법에 의해서 생산될 수 있음을 입증하는 데 사용되었다. 어느 정도까지는, 원하는 펩티드 서열의 반복부 사이에 위치하는 특별한 보조 서열의 사용이 기술되어 있다. 더욱 구체적으로, 반복되는 구조의 전구체 단백질내 양이온성의 항미생물성 펩티드 서열이 숙주 세포에게 미치는 유해한 작용을 음이온성 보조 서열이 명백하게 감소시켰다고 제안된 바 있다(예를 들어, WO　00/31279 및 US　2003/0219854 참조). 이러한 반복되는 구조의 접근법에서의 전구체 단백질은 융합 단백질의 경우보다 더 높은 비율로 원하는 펩티드 서열을 가지며, 반복되는 구조의 전구체 단백질의 특성은 원하는 양이온 펩티드의 서열에 의해 더 큰 영향을 받는다.

상기의 발명자들은 효율적인 방식으로 수행될 수 있는 간편하고 저렴한 프로토콜에 따라 반복되는 구조의 전구체 단백질의 도움을 통해 임의의 펩티드 서열을 생산할 수 있는 가능성을 포함한 어떤 종래 방법에 대해서도 알지 못했다.

각종의 항미생물성 펩티드가 문헌에 기술되어 있으며, 개관에 요약되어 있다 (문헌 ([Hancock, R.E.W. and Lehrer, R. 1998 in Trends in Biotechnology, 16: 82-88]; [Hancock, R.E.W. and Sahl, H.G. 2006 in Nature Biotechnology, 24: 1551-1557])).

2개의 활성 펩티드를 조합시킨 융합 펩티드 역시 문헌에 기술되어 있다. 웨이드(Wade) 등은 히알로포라 세크로피아(Hyalophora cecropia)로부터의 세크로핀 A 및 벌독 멜리틴의 다양한 융합물의 항균 작용에 대해 보고하였다 (문헌 [Wade, D. et al ., 1992, International Journal of Peptide and Protein Research, 40: 429-436]). 신(Shin) 등은 20개 아미노산으로 구성된, 히알로포라 세크로피아로부터의 세크로핀 A 및 제노푸스 라에비스(Xenopus laevis)로부터의 마가이닌 2의 융합 펩티드의 항균 작용을 기술하였다. 세크로핀 A는 37개 아미노산으로 구성되고, 그람-음성 세균에 대해 활성을 나타내지만, 그람-양성 세균에 대한 활성보다는 낮은 활성을 나타낸다. 마가이닌 2는 23개 아미노산으로 구성되고, 세균 뿐만 아니라, 종양 세포주에 대해서도 활성을 띤다. 세크로핀 A 및 멜리틴의 융합물과 비교하여, 이 융합물은 유사한 항균 작용과 함께 대해 상당히 더 낮은 용혈능을 나타낸다 (문헌 [Shin, S.Y. Kang, J.H., Lee, M.K., Kim, S.Y., Kim, Y., Hahm, K.S., 1998, Biochemistry and Molecular Biology International, 44: 1119-1126]). US 2003/0096745 A1 및 US 6,800,727 B2는 20개 아미노산으로 구성된 상기 융합 펩티드, 및 아미노산, 특히 양으로 하전된 아미노산 및 소수성 아미노산의 치환의 결과로서 보다 양으로 하전되고 보다 소수성인 상기 융합물의 변이체를 청구한다.

1999년 신 등은 상기 세크로핀 A-마가이닌 2 융합 펩티드의 추가 개발을 기술하였다. 서열 6을 가진 펩티드는 출발 융합물과 비교하여 더 낮은 용혈능을 갖지만, 에스케리키아 콜라이(Escherichia coli) 및 바실루스 서브틸리스(Bacillus subtilis)에 대한 항균 활성은 손상되지는 않았음이 입증되었다 (문헌 [Shin et al., 1999 Journal of Peptide Research, 53: 82-90]).

본 발명의 간단한 설명

따라서, 본 발명의 목적은 반복되는 구조의 전구체 단백질의 도움을 통해, 광범위하게 적용될 수 있는 펩티드 생산 방법을 제공하는 것이었다.

이러한 목적은, 생물공학적 수단에 의한 펩티드를 생산하는 신규한 접근법을 통해 높은 비율의 원하는 펩티드 서열을 포함하고, 예측가능한 방식으로 전구체 단백질의 특성을 지배하는 보조 서열을 포함하는 반복되는 구조의 전구체 단백질을 생산함으로써 달성되었다. 상기 방법은 기본적으로 전구체 분자의 발현을 위한 조건 또는 상이한 펩티드 각각에 대하여 이어지는 후속 절차를 재확립할 필요없이도 상이한 펩티드 서열을 제조하는 데 사용될 수 있다. 추가로, 그에 대해 사용되었던 종래 방법이 비효율적이었던 펩티드도 생산할 수 있다.

첨부하는 도면에서,
도　1은 알파-나선 구조에 투영하여 아미노산 서열을 나타낸 나선형 휠을 도시한 것이다. 반복되는 구조의 전구체 단백질, A1-A7에 포함된 아미노산 서열 (A)을 원 상에 도시하였다 (B). 이러한 정렬은 알파-나선 구조로 존재하는 아미노산의 위치를 시각화한 것이다;
도 2는 산성 절단 후의 펩티드 "ZnO"의 역상 크로마토그램을 도시한 것이다;
도　3은 산성 절단 및 역상 HPLC 이후 "ZnO" 펩티드의 질량 스펙트럼을 도시한 것이다; 기술된 수치는 특정 모노아이소토픽 피크의 m/z 값을 나타낸다;
도　4는 산성 절단 및 양이온 교환 크로마토그래피 후의 펩티드 "P18"의 역상 크로마토그램을 도시한 것이다;
도　5는 산성 절단, 양이온 교환 크로마토그래피 및 역상 HPLC 이후 "P18" 펩티드의 질량 스펙트럼을 도시한 것이다; 기술된 수치는 특정 모노아이소토픽 피크의 m/z 값을 나타낸다;
도　6은 산성 절단 후의 펩티드 "Min"의 역상 크로마토그램을 도시한 것이다;
도　7은 산성 절단 및 역상 HPLC 이후 "Min" 펩티드의 질량 스펙트럼을 도시한 것이다; 기술된 수치는 특정 모노아이소토픽 피크의 m/z 값을 나타낸다;
도　8은 산성 절단 및 양이온 교환 크로마토그래피 후의 펩티드 서열 6의 역상 크로마토그램을 도시한 것이다;
도　9는 산성 절단, 양이온 교환 크로마토그래피 및 역상 HPLC 이후 서열 6 펩티드의 질량 스펙트럼을 도시한 것이다; 기술된 수치는 특정 모노아이소토픽 피크의 m/z 값을 나타낸다;
도 10은 실시예 6에 따라 수행된 아미드화 이전 및 이후의 "P18" 펩티드의 HPLC 양이온 교환 크로마토그램을 도시한 것이다; 화학적으로 합성되고 아미드화된 참조 펩티드의 크로마토그램이 비교를 위해 "P18" 펩티드 서열과 함께 제시되어 있다;
도 11은 실시예 7에 따라 수행된 아미드화 이전 및 이후의 "P18" 펩티드의 HPLC 양이온 교환 크로마토그램을 도시한 것이다; 화학적으로 합성되고 아미드화된 참조 펩티드의 크로마토그램이 비교를 위해 "P18" 펩티드 서열과 함께 제시되어 있다.

바람직한 실시양태

본 발명은 특히 하기 실시양태에 관한 것이다:

1. 하기 일반식의 원하는 펩티드 (Pep) 요소 및 보조 펩티드 (Aux) 요소로 구성된 반복부로 이루어진, 효소적으로 및/또는 화학적으로 절단가능한 반복되는 구조의 서열을 포함하는 합성, 특히, 재조합적으로 제조된 전구체 단백질.

<일반식>

(Pep-Aux)_x 또는

(Aux-Pep)_x

상기 식에서, x는 >1이고,

여기서, Aux 요소는 동일하거나 상이하고, 상기 전구체 단백질에 자기-조립 특성을 부여하는 아미노산 서열 요소를 포함하고;

Pep 요소는 동일하거나 상이하고, 동일하거나 상이한 펩티드 분자의 아미노산 서열을 포함한다.

2. 제1 실시양태에 있어서, 요소 Pep 및 Aux가 서로 직접 또는 절단가능한 펩티드 서열을 통해 펩티드결합으로 연결되어 있고, 펩티드 연결이 화학적으로 또는 효소적으로 특이적으로 절단될 수 있으며, 즉, 정의된 아미노산 서열 또는 아미노산 서열 상에서 배타적으로 또는 본질적으로 절단될 수 있는 것인 전구체 단백질.

3. 제1 또는 제2 실시양태에 있어서, 실온에서 표준 조건하에, 예를 들어, 특히, 0.2 M NaOH에 의해 1시간 이내에 용해되지 못하거나, 각각 2 M 우레아 또는 1 M 구아니디늄 히드로클로라이드에 의해 10분 이내에 용해되지 못하는 안정한 비공유결합 회합물을 자발적으로, 즉, 그 스스로, 또는 유도적인 방식으로 형성할 수 있도록 하는 자기-조립 특성을 가진 전구체 단백질. 본 발명에 따른 안정한 회합물은 상기 언급한 상기 3가지 기준 중 적어도 하나를 만족하는 경우에 형성된다.

4. 제1 내지 제3 실시양태 중 어느 한 실시양태에 있어서, 적어도 하나의 Aux 요소가 자기-조립 펩티드 (SA) 요소를 포함하고, 여기서, 상기 SA 요소는 적어도 8개, 예를 들어, 8-10개, 8-12개, 8-14개, 8-16개, 8-18개 또는 8-20개의 연속 아미노산으로 구성된 적어도 하나의 서열 모티프를 포함하고, 이는 적어도 50%, 예를 들어, 50-100%, 60-90% 또는 70-80%의 알라닌 잔기, 적어도 50%, 예를 들어, 50-100%, 60-90% 또는 70-80%의 발린 잔기 또는 적어도 50%, 예를 들어, 50-100%, 60-90% 또는 70-80%의 글루타민 잔기를 포함하거나, 또는 그의 적어도 80%는 상기 잔기 중 적어도 하나로 구성되는 것이며; SA 요소가 예를 들어, 특히, 하기 서열 모티프 중 적어도 하나를 포함할 수 있는 것인 전구체 단백질.

A_n (모티프 1)

(GA)_m (모티프 2)

V_n (모티프 3)

(VA)_m (모티프 4)

(VVAA)_o(모티프 5)

상기 식에서, A는 알라닌이고, G는 글리신이고, V는 발린이고, n은 정수 2 내지 12이고, m은 정수 2 내지 10이고, o은 정수 1 내지 6이며, 여기서, 더욱 특히, n = 5-10이고, m = 4-8이고, 및 o = 2-4이고, 예를 들어, n = 7-9이고, m = 6-7이고, o = 2-3이다.

상기 SA 서열은 각각의 경우 추가의 1 내지 3개의 무작위 아미노산 잔기에 의해 C- 및/또는 N-말단에서 연장될 수 있다. 적합한 N-말단 연장부의 예로는 서열 모티프 "G-," "GS-," "GAG-," "GPG-," "GPS-," "GAS-," "GQQ-," 및 "GSS-,"가 있으며; 적합한 C-말단 연장부의 예로는 서열 모티프 "-SGP," "-GGA," "-GPG," "-SGA," "-GGQ," "-GGY" 및 "-GGL"을 포함한다.

5. 제4 실시양태에 있어서, SA 요소가 아미노산 서열 중 서열 1 내지 5, 또는 서열 73으로부터 선택되는 아미노산 서열을 포함하는 것인 전구체 단백질.

6. 제1 내지 제5 실시양태 중 어느 한 실시양태에 있어서, 적어도 하나의 Aux 펩티드가 보호 펩티드 (SU) 요소를 추가로 포함하는 것인 전구체 단백질.

7. 제6 실시양태에 있어서, SU 요소가 하전된 아미노산 잔기, 즉, (예를 들어, pH = 7에서) 전체 전하가 0이 아닌, 예를 들어, +20 내지 -20, 또는 +10 내지 -10, 또는 +5 내지 -5인 아미노산 잔기, 특히 음으로 하전된 아미노산 잔기, 예를 들어, pH = 7에서 전체 전하가 0이 아닌, 예를 들어, -1 내지 -20, 특히, - 4 내지 -10인 아미노산 잔기를 "높은 비율"로 갖는 것인 전구체 단백질.

8. 제7 실시양태에 있어서, 전구체 단백질 중의 SU 요소가 양친매성 나선 구조를 형성할 수 있는 것인 전구체 단백질.

9. 제8 실시양태에 있어서, SU 요소가 양친매성 알파-나선을 형성할 수 있는, 펩티드결합으로 연결된 적어도 7개의 아미노산으로 구성된 서열 절편을 포함하는 양친매성 펩티드이고, 여기서, 상기 나선의 아미노산 잔기는 그의 수직 투영에서 나선의 소수성 반쪽 및 친수성 반쪽으로 분리되고, 나선의 소수성 반쪽은 수직 투영에서 적어도 3개의 인접한, 예를 들어, 3 또는 4개의 동일하거나 상이한 소수성 아미노산 잔기를 포함하고, 나선의 친수성 반쪽은 수직 투영에서 적어도 3개의 인접한, 예를 들어, 3 또는 4개의 동일하거나 상이한 친수성 아미노산 잔기를 포함하는 것인 전구체 단백질.

10. 제7, 제8 또는 제9 실시양태에 있어서, SU 요소 중 하전된 아미노산 잔기의 비율이, 전구체 단백질의 전체 순전하가 pH=7에서 -10 초과 내지 +10 미만, 예를 들어, -8 초과 내지 +8 미만; -5 초과 내지 +5 미만, -2 초과 내지 +2 미만이 되도록 선택되는 것인 전구체 단백질.

11. 제7 내지 제10 실시양태 중 어느 한 실시양태에 있어서, SU 요소가 아미노산 서열 중 서열 16 내지 서열 19 및 서열 68로부터 선택되는 아미노산 서열을 포함하는 것인 전구체 단백질.

12. 제1 내지 제11 실시양태 중 어느 한 실시양태에 있어서, Pep 요소가, 전체 전하가 양인 양이온성의 항미생물성 펩티드 서열을 포함하는 것인 전구체 단백질.

13. 제12 실시양태에 있어서, Pep 요소가 양이온성 아미노산 서열 중 서열 6 내지 서열 15, 서열 23, 서열 26 및 서열 69 내지 서열 72 또는 하기 명시되는, 상기 서열의 C-말단 및/또는 N-말단에서 변형된 형태 중 어느 것으로부터 선택되는 아미노산 서열을 포함하는 것인 전구체 단백질.

14. 제1 내지 제5 실시양태 중 어느 한 실시양태에 있어서, Pep 펩티드가 서열 20 또는 서열 29 내지 67의 아미노산 서열 또는 하기 명시되는, 상기 서열의 C-말단 및/또는 N-말단에서 변형된 형태 중 어느 것으로부터 선택되는 아미노산 서열을 포함하는 것인 전구체 단백질.

15. 제1 내지 제14 실시양태 중 어느 한 실시양태에 있어서, Aux 요소가 서로 독립적으로 SA, SA-SU, SU-SA, SA-SU-SA 및 SU-SA-SU의 의미 중 임의의 것을 가지며, 여기서 요소 SA 및 SU는 펩티드결합으로 서로 연결되어 있고, Aux 요소가 말단에서 펩티드결합으로, 즉, 직접 또는 절단가능한 펩티드 서열을 통해 적어도 하나의 Pep 요소에 펩티드결합으로 연결되어 있고, 여기서, 적어도 Pep 요소에의 펩티드 연결이 화학적으로 또는 효소적으로 특이적으로 절단될 수 있는 것인 전구체 단백질.

16. 제1 내지 제15 실시양태 중 어느 한 실시양태에 따른 적어도 하나의 전구체 단백질을 코딩하는 핵산 서열.

17. 제16 실시양태에 있어서, 서열 21, 24; 27; 74 및 76의 적어도 하나의 코딩 서열을 포함하는 핵산 서열.

18. 적어도 하나의 조절 핵산 서열에 작동적으로 연결된, 제16 또는 제17 실시양태에 따른 적어도 하나의 핵산 서열을 포함하는 발현 카세트.

19. 제16 및 제17 실시양태 중 어느 한 실시양태에 따른 핵산 서열, 또는 제18 실시양태에 따른 발현 카세트를 포함하는, 진핵 또는 원핵 숙주를 형질전환시키기 위한 재조합 벡터.

20. a) 제1 내지 제15 실시양태 중 어느 한 실시양태에 따른 전구체 단백질을 생산하는 단계;

b) 전구체 단백질로부터 Pep 펩티드를 제거하는 단계; 및

c) 임의로 펩티드를 효소적으로 또는 화학적으로 변형시키거나, 예를 들어, 아미드화, 에스테르화, 산화, 알킬화시키거나, 펩티드를 (예를 들어, 천연 화학적 라이게이션에 의해 또는 마이클(Michael) 첨가에 의해) 또 다른 분자에 연결시키는 단계

를 포함하며; 여기서, 예를 들어, 펩티드는 상기 펩티드의 소수성을 증가시키는 분자로 변형되고, 예를 들어, 알킬 라디칼을 포함하는 분자로 변형되고; 여기서, 상기 변형은 첨부된 실시예에서도 또한 추가로 설명되는 바와 같이, 펩티드의 임의적 정제 이전 또는 이후에 수행될 수 있는 것인, 원하는 펩티드 (Pep)를 생산하는 방법. 적합한 알킬 라디칼의 예는 C₂-C₁₆-알킬 라디칼, 예를 들어, 에틸, 이소프로필 또는 n-프로필, n-부틸, 이소부틸, sec- 또는 tert-부틸, n-펜틸 또는 이소펜틸; 또한 n-헥실, n-헵틸, n-옥틸, n-노닐, n-데실, n-운데실, n-도데실, n-트리데실, n-테트라데실, n-펩타데실 및 n-헥사데실, 및 그의 단일 또는 다중 분지형 유사체, 및 하나 이상의, 예를 들어, 1, 2 또는 3개의 할로겐 (예를 들어, F, Cl, Br), 히드록실, 메르캅토, 아미노, C₁-C₄-알킬아미노 치환을 가질 수 있거나, 또는 알킬 쇄에 하나 이상의, 예를 들어, 1, 2 또는 3개의 헤테로원자, 예를 들어, O 또는 N이 개재될 수 있는, 그의 비치환된 또는 치환된 변형이다. 더욱 구체적으로, C₁-C₄-알킬은 메틸, 에틸, 이소프로필 또는 n-프로필, n-부틸, 이소부틸, sec- 또는 tert-부틸이다.

21. 제20 실시양태에 있어서, 전구체 단백질이 제19 실시양태에 따른 적어도 하나의 벡터를 보유하는 재조합 미생물에서 생산되는 것인 방법.

22. 제21 실시양태에 있어서, 전구체 단백질이 재조합 이. 콜라이(E. coli) 균주에서 생산되는 것인 방법.

23. 제20 내지 제22 실시양태 중 어느 한 실시양태에서, 발현된 전구체 단백질을, 임의로는 상기 단백질이 안정적으로 회합된 형태로 전환된 후에, 정제하고, 화학적으로 또는 효소적으로 절단하여 원하는 펩티드 (Pep)를 유리시키는 것인 방법.

24. 하기 일반식의 원하는 펩티드 (Pep) 요소 및 보조 펩티드 (Aux') 요소로 구성된 절단가능한 서열을 포함하는 전구체 단백질.

<일반식>

(Pep-Aux')_x 또는

(Aux'-Pep)_x

상기 식에서, x는 >1이고,

여기서, Aux' 요소는 동일하거나 상이하고, 양친매성의 알파-나선-형성 펩티드를 포함하고, 상기 양친매성 펩티드는 양친매성 알파-나선을 형성할 수 있는, 펩티드결합으로 연결된 적어도 7개의 아미노산으로 구성된 서열 절편을 포함하고, 여기서, 상기 나선의 아미노산 잔기는 그의 수직 투영에서 나선의 소수성 반쪽 및 친수성 반쪽으로 분리되고, 나선의 소수성 반쪽은 수직 투영에서 적어도 3개의 인접한, 예를 들어, 3 또는 4개의 동일하거나 상이한 소수성 아미노산 잔기를 포함하고, 나선의 친수성 반쪽은 수직 투영에서 적어도 3개의 인접한, 예를 들어, 3 또는 4개의 동일하거나 상이한 친수성 아미노산 잔기를 포함하고;

25. 제24 실시양태에 있어서, Aux' 요소가 제4 또는 제5 실시양태에서 정의된 바와 같은 적어도 하나의 자기-조립 펩티드 (SA) 요소를 포함하는 것인 전구체 단백질.

26. 제24 또는 제25 실시양태에 있어서, 원하는 펩티드 (Pep)가 양이온성의 항미생물성 펩티드이고, Aux' 요소가 양친매성 알파-나선을 형성하는 음이온성 펩티드인 전구체 단백질.

27. 양친매성 펩티드가 양친매성 알파-나선을 형성할 수 있는, 펩티드결합으로 연결된 적어도 7개의 아미노산으로 구성된 서열 섹션을 포함하고, 여기서, 상기 나선의 아미노산 잔기는 그의 수직 투영에서 나선의 소수성 반쪽 및 친수성 반쪽으로 분리되고, 나선의 소수성 반쪽은 (수직 투영에서) 적어도 3개의 인접한, 동일하거나 상이한 소수성 아미노산 잔기를 포함하고, 나선의 친수성 반쪽은 (수직 투영에서) 적어도 3개의 인접한, 동일하거나 상이한 친수성 아미노산 잔기를 포함하는 것인, 양친매성 펩티드와는 상이한 항미생물성의 원하는 펩티드를 재조합적으로 생산하기 위한, 보호 펩티드로서의 양친매성 펩티드의 용도.

28. 제27 실시양태에 있어서, 원하는 펩티드 (Pep)가 양이온성의 항미생물성 펩티드이고, Aux' 요소가 양친매성 알파-나선을 형성하는 음이온성 펩티드인 용도.

29. 제20 내지 제22 실시양태 중 어느 한 실시양태에서, 제12 또는 제13 실시양태에 따른 전구체 단백질, 예를 들어, 서열 23 또는 서열 6에 따른 P18 펩티드 빌딩 블록을 포함하는 전구체 단백질이 생산되는 것인 방법.

30. 제29 실시양태에 있어서, 하기 후처리 단계:

- 오염 단백질은 용해시키지만, 또는 전구체 단백질 회합물은 용해시키지 못하는, 또는 본질적으로 용해시키지 못하는 용매, 예를 들어, 0.1 M 내지 1.0 M NaOH로 전구체 단백질 회합물을 세척하는 단계,

- 원하는 펩티드, 예를 들어, P18이 산-절단가능한 기를 통해 전구체 단백질에 도입되어 있는 경우, 예를 들어, 산으로 전구체 단백질을 절단하는 단계

를 포함하는 방법.

31. 제30 실시양태에 있어서, 하기 추가의 후처리 단계:

- 예를 들어, 세포 파괴 후, 보조 침전제, 예를 들어, 인산으로 전구체 단백질 회합물을 처리하는 단계;

- 크로마토그래피 방법을 사용하여 펩티드 절단 반응 혼합물을 정제하는 단계;

- 산성 용매 또는 용매 혼합물로 정제 및 건조된 펩티드를 세척하는 단계

중 적어도 하나를 포함하는 방법.

32. 제20 내지 제23 및 제29 내지 제31 실시양태 중 어느 한 실시양태에서, 하기 후처리 단계:

- 세포 파괴 후, pH = 3까지 85% 농도의 인산을 첨가하여 전구체 단백질 회합물을 처리하는 단계,

- 수산화나트륨 용액, 예를 들어, 0.4 M NaOH로 전구체 단백질 회합물을 세척하는 단계,

- 인산 또는 포름산, 예를 들어, 2% 인산으로 전구체 단백질을 절단하는 단계,

- 임의로, 건조된 펩티드를 헥산산 또는 99부의 헥산 및 1부의 아세트산의 혼합물로 세척하는 단계

를 포함하는, 서열 23의 펩티드를 생산하는 방법.

33. 제20 내지 제23 및 제29 내지 제31 실시양태 중 어느 한 실시양태에서, 하기 후처리 단계:

- 예를 들어, 5% 농도의 H₃PO₄에 의해 펠릿을 가수분해하거나 절단하는 단계;

- 원심분리하는 단계;

- 예를 들어, 25% NaOH를 사용하여 상청액의 pH를 약 4.0으로 조정하는 단계;

- 양이온 교환 크로마토그래피를 사용하여 상청액을 정제하는 단계;

- 예를 들어, NaOH를 용리액에 첨가하여 원하는 펩티드를 침전시키는 단계;

- 원심분리하는 단계;

- 물 중에 펠릿을 재현탁시키는 단계;

- 예를 들어, 아세트산을 첨가하여 펩티드를 용해시키는 단계;

- 동결건조시키는 단계

를 포함하는, 서열 6의 펩티드를 생산하는 방법.

34. 본 발명은 추가로 본 발명에 따른 P18 펩티드 (서열 23) 및 펩티드 서열 6 및 그의 생산 방법, 및 비늘, 특히 비듬을 치료 또는 예방하기 위한; 또는 친유성 진균, 특히 말라세지아 종(Malassezia ssp .), 특히, 말라세지아 푸르푸르(Malassezia furfur)의 성장 및/또는 활성을 억제시키기 위한 화장품 또는 제약 수단에서의 그의 용도에 관한 것이다. 이는 또한 예를 들어, 종래 국제 출원 PCT/EP2008/010912 (2008년 12월 19일 출원) (그의 개시 내용이 본원에서 명백하게 참조된다)에 기술되어 있다.

본 발명의 개별 측면에 대한 상세한 설명

1. 펩티드

"원하는 펩티드" 또는 "표적 펩티드"로도 언급될 수 있는, 본 발명에 따른 펩티드 (Pep)는 2 내지 100개, 예를 들어, 5 내지 70개, 및 특히, 7 내지 50개, 예를 들어, 10 내지 40개, 12 내지 35개, 또는 15 내지 25개의 아미노산이 펩티드 겹합에 의해 연결된 아미노산 쇄이다. 펩티드는 임의의 α-아미노산, 특히, 단백질 구성 아미노산으로 구성될 수 있다.

펩티드는 특정의 원하는 생물학적 또는 화학적 특성, 특히, 또는 약리학상 이용가능한 특성을 가질 수 있다. 그러한 특성의 예로는 항미생물 활성, 특정 표면에서의 특이적인 결합, 결정화 과정 및 입자 형성에서 핵 형성 특성, 및 결정 구조 조절, 금속 또는 금속 이온 결합, 계면활성제 특성, 유화 특성, 기포-안정화 특성, 영향력이 있는 세포 흡착이 있다.

상기 펩티드는 이들 특성 중 하나 이상을 가질 수 있다.

한 실시양태에서, 본 발명은 항미생물성 펩티드를 생산하는 방법에 관한 것이다. 상기 "항미생물성 펩티드"는 농도가 ≤ 100 μM인 항미생물 펩티드의 존재하에서는 억제되는 그람-양성 또는 그람-음성 세균 중 적어도 한가지 유형 및/또는 효모 중 적어도 한가지 유형 및/또는 섬유상 진균 중 적어도 한가지 유형 및/또는 조류 중 적어도 한가지 유형의 성장 및/또는 증식, 및/또는 상기 펩티드의 존재하에서는 파괴되는 각 유기체 세포의 성장 및/또는 증식으로 구별된다.

한 실시양태에서, 본 발명은 양이온성의 항미생물성 펩티드를 제공하는 것에 관한 것이다. 양이온성의 항미생물성 펩티드는 상기 정의된 바와 같이 항미생물 작용을 가지고, 순전하가 pH　7에서 0을 초과하는 것으로 구별된다.

이러한 종류의 양이온성 펩티드는 예를 들어, 하기 서열, 및/또는 그의 돌연변이체 또는 유도체를 포함한다:

상기 식에서,

X₁₀은 펩티드 결합이거나, 또는 임의의 1개 또는 2개의 염기성 또는 소수성 아미노산 잔기, 또는 1개 또는 2개의 프롤린 잔기이고,

X₁ 내지 X₉는 프롤린 이외의 임의의 염기성 또는 소수성 아미노산 잔기이며;

여기서, 전구체 단백질에 존재하는 반복되는 구조의 서열 모티프는 동일하거나 상이할 수 있다.

추가의 구체적인 실시양태에서, 본 발명은 하기 서열, 및/또는 그의 돌연변이체 또는 유도체를 포함하는 펩티드를 생산하는 것에 관한 것이다:

상기 식에서,

X₁은 리신, 아르기닌 또는 페닐알라닌이고,

X₂는 리신 또는 트립토판이고,

X₃은 루신 또는 리신이고,

X₄는 페닐알라닌 또는 루신이고,

X₅는 루신 또는 리신이고,

X₆은 루신 또는 리신이고,

X₇은 히스티딘 또는 리신이고,

X₈은 알라닌, 루신, 발린 또는 세린이고,

X₉는 루신 또는 리신이고,

X₁₁은 프롤린 또는 화학 결합이고,

X₁₂는 프롤린 또는 화학 결합이며;

상기 서열 또는 반복되는 구조의 서열 모티프의 비제한적인 예는 서열 6, 서열 9-서열 15, 서열 23, 서열 69, 서열 71, 및/또는 그의 돌연변이체 또는 유도체이다.

다른 적합한 펩티드는 PCT/EP2008/010912 (2008년 12월 19일에 출원된, 본 출원인의 국제 출원, 이는 명백하게 참조된다)에 기술되어 있다.

2. 반복되는 구조의 전구체 단백질

본 발명에 따른 반복되는 구조의 전구체 단백질은 그의 아미노산 서열의 적어도 60%, 특히, 적어도 80%, 각 경우, 전체 서열 길이를 기준으로 하여 예를 들어, 60-99%, 70-95%, 75-85%가 (본원 하기에서 정의되는 바와 같은) 펩티드 반복부로 구성되는 것으로 구별된다. 나머지 부분은 예를 들어, 비-반복되는 구조의 펩티드, 예를 들어, 신호 펩티드, 태그 등을 포함할 수 있다.

3. 반 복부

펩티드 반복부는 본 발명에 따라 유리하게 제조된 적어도 하나의 펩티드를 포함하고, 기본적으로 하기와 같이 구조물을 형성한다:

(Pep-Aux)_x 또는

(Aux-Pep)_x

상기 식에서, x는 >1일 경우, Pep는 상기에서 언급한 펩티드이고, Aux는 본원에서 정의되는 바와 같다.

본 발명에 따른 반복부 (Pep-Aux, 또는 Aux-Pep)는 길이가 10-200, 예를 들어, 20-130 및/또는 30-80개의 아미노산으로 된 아미노산 서열이며, 이는 전구체 단백질 중에 복수회에 걸쳐 동일한 서열로서, 또는 적어도 70%, 예를 들어, 적어도 80% 및 특히, 적어도 약 90%의 동일성, 예를 들어, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 동일성을 가진, 특정 서열의 변이로서 존재한다. 따라서, 본 발명에 따른 반복되는 구조의 전구체 단백질은 단일 아미노산 서열의, 또는 다중의 상이한 아미노산 서열의, 예를 들어, Pep 및/또는 Aux 빌딩 블록의 동일한 카피, 또는 변이를 포함할 수 있다.

또한, 임의 개수의 상기 반복부, 예를 들어, 1-100, 1-50, 또는 2-32 및 특히, 4-16개의 반복부가 반복되는 구조의 전구체 단백질 중에 함께 결합되어 있을 수 있다.

반복부 중 본 발명에 따른 펩티드의 비율은 몰질량 기준은 20%-80%, 예를 들어, 30%-70%이다. 반복부의 나머지 부분은 상기와 같이 정의되는 Aux 서열, 특히, SA 및 SU 서열, 및 임의로 Pep 빌딩 블록을 선택적으로 제거하기 위한 특이적인 절단 서열로 구성된다.

4. 보조 서열

광범위한 의미에서 보조 서열은 전구체 단백질의 발현, 안정성 및/또는 후처리를 개선시키기 위해 상기 전구체 단백질의 특성에 영향을 미치는, 본 발명에 따른 전구체 단백질 중에 존재한 아미노산 서열이다. 반복되는 구조의 전구체 단백질 중의 보조 서열은 반복부의 일부분일 수 있거나 (상기 명시된 바와 같은 Aux 빌딩 블록), 또는 예를 들어, 6 x His 태그 (HHHHHH), T7 태그 (MASMTGGQQMG), S 태그 (KETAAAKFERQHMDS), c-Myc 태그 (EQKLISEEDL), 스트렙(Strep) 태그 (WSHPQFEK) 또는 HA 태그 (YPYDVPDYA), 글루타티온 S-트랜스퍼라제, 말토스 결합 단백질, 셀룰로스 결합 단백질과 같이 전구체 단백질의 아미노 말단 또는 카르복시 말단에 부착되어 있을 수 있다. 이러한 보조 서열 등은 문헌 [Terpe; Appl Microbiol Biotechnol; 60(5): 523-33 (2003)]에 기술되어 있다. 추가로, 보조 서열 CanA (문헌 [Mai "In Vitro Untersuchungen zum extrazellulaeren Netzwerk von Pyrodictium abyssi TAG11" [In Vitro Studies of the Extracellular Network of Pyrodictium abyssi TAG11], PhD Theses, Regensburg University (1998)]) 및 yaaD (문헌 [Wohlleben Eur Biophys J, (2009) online publication])는 전구체 단백질의 아미노 말단 또는 카르복시 말단에의 부착에 유용하다.

한 실시양태에서, 전구체 단백질은 상기 전구체 단백질의 가용성에 영향을 미치는 보조 서열을 포함한다.

바람직한 실시양태에서, 보조 서열은 전구체 단백질에 "자기-조립" 특성을 부여한다. 전구체 단백질의 상기 자기-조립 특성은 이미 발현되는 동안에 추가로 요구되는 어떤 조치없이도 "자발적으로," 즉, 그 스스로 안정한 회합물을 형성하는 상기 전구체 단백질로 구별되거나, 또는 가용성 전구체 단백질의 상기와 같은 안정한 회합물의 형성이 "유도적인" 방식으로, 즉, 유발제에 의해 개시되는 것으로 구별된다. 자기-조립 특성을 가진 전구체 단백질은 간단하고 효율적인 방식으로 정제될 수 있다는 점에서 다른 전구체 단백질보다 유리하다. 이러한 종류의 회합물은 보통 배타적으로 또는 본질적으로 비공유 결합, 예를 들어, 수소 결합, 이온 및/또는 소수성 상호작용의 형성을 포함한다.

자기-조립 서열의 길이는 예를 들어, 적어도 8개의 인접 아미노산일 수 있다. 적합한 서열은, 앞서 검출된 바 있는 고분자 회합물로 조립되는 것으로 자체 공지된 단백질에 위치할 수 있다. 그러한 회합물의 예로는 아밀로이드 피브릴, 액틴 또는 미오신 필라멘트, 단백질 섬유, 예를 들어, 엘라스틴 섬유, 콜라겐 섬유, 홍합 족사, 케라틴 섬유, 또는 실크사가 있다. 자기-조립 서열을 포함하는 이러한 단백질 등은 문헌 [Scheibel, Current Opinion in Biotechnology 16; 1-7 (2005)] (이는 명백하게 참조된다)에 기재되어 있다.

코스모트로픽 염 용액이 "유발제"로서 사용될 수 있다. 일례로 본원에서 언급될 수 있는 코스모트로픽 염은 "호프마이스터(Hofmeister)" 계열에 따라, 나트륨 또는 클로라이드 이온보다 코스모트로픽 특성이 더 큰 이온 유형을 적어도 한가지 포함하는 코스모트로픽 염이다. 그러한 염의 예로는 인산칼륨 및 황산암모늄이 있다. 그러한 염 용액의 예로는 0.5 M 인산칼륨 및 0.8 M 황산암모늄이 있다.

본 발명에 따른 전구체 단백질의 안정한 회합물은, 전형적으로 다수의 응집된 단백질을 가용화시키면서, 이러한 방식으로 단백질 오염물질로부터 이를 분리시킬 수 있는 용액으로 처리하는 동안 특정 기간에 걸쳐 그의 회합된 형태를 유지하는 것으로 구별된다. 상기와 같은 용액의 예로는 염기, 산, 우레아, 염, 및 계면활성제 용액이 있다. 더욱 구체적으로, 본 발명에 따른 안정한 회합물은 알칼리 금속 수산화물, 우레아, 구아니디늄 염 또는 하전된 계면활성제, 예를 들어, 알킬트리메틸암모늄 염 또는 알킬 술페이트 용액 중에서 특정 기간에 걸쳐 불용성이다.

더욱 구체적으로, 안정한 회합물은 ≥0.2 M 수산화나트륨, ≥2 M 우레아, ≥1 M 구아니디늄 히드로클로라이드, ≥1 M 구아니디늄 티오시아네이트 또는 ≥0.1% 도데실 황산나트륨 또는 ≥0.1% 세틸트리메틸암모늄 브로마이드 용액 중에서 특정 기간에 걸쳐 불용성이다. 더욱 구체적으로, 전구체 단백질의 안정한 회합물은 상기 용액 중에서 ≥10분, 예를 들어, ≥30분 및 특히, ≥60분 동안에 걸쳐 안정하다.

특히, 실온에서 (즉, 약 20℃)에서,

a) 0.2 M NaOH에 의해 1시간 이내에 용해되지 못한다면, 및/또는

b) 2 M 우레아에 의해 10분 이내에 용해되지 못한다면, 및/또는

c) 1 M 구아니디늄 히드로클로라이드에 의해 10분 이내에 용해되지 못한다면, 안정한 회합물로서 존재한다.

추가의 구체적인 실시양태에서, 전구체 단백질은 숙주 세포가 반복되는 구조의 전구체 단백질의 효과를 손상시키지 못하게 보호하는 보조 서열 (SU)을 포함한다.

특별한 실시양태에서, 전구체 단백질은 숙주 세포가 반복되는 구조의 전구체 단백질에 존재하는 양이온성의 항미생물성 펩티드 서열의 효과를 손상시키지 못하게 보호하는 보조 서열 SU를 포함한다. 더욱 구체적으로, 이러한 보호 서열은 음으로 하전된 아미노산 (Asp, Glu)을 포함한다. 더욱 구체적으로, 보조 서열은 다수의 음으로 하전된 글루타메이트 및/또는 아스파르테이트 아미노산을 포함하며, 이로써 반복되는 구조의 전구체 단백질내에서의 그의 순전하는 pH=7에서 -10 초과 내지 +10 미만, 특히, -5 초과 내지 +5 미만, 예를 들어, -2 초과 내지 +2 미만이 된다.

추가의 특정 실시양태에서, 음으로 하전된 보호 서열은 양친매성 나선을 형성한다. 본 발명에 따른 양친매성 나선은, 1차 구조의 7개의 연속 아미노산 서열 (A1-A7)이 하기 순서: A1-A5-A2-A6-A3-A7-A4 (도　1)로 정렬된 환형 정렬에서 (즉, (나선 축을 따른) 그의 나선 투영에서 또는 상면도에서의 환형 정렬에서), 상기 원 상의 적어도 3개의 인접한 아미노산이 소수성 아미노산 (Ala, Met, Cys, Phe, Leu, Val, Ile) 또는 글리신이고, 상기 원 상의 적어도 3개의 인접한 아미노산이 친수성 아미노산 (Thr, Ser, Trp, Tyr, Pro, His, Glu, Gln, Asp, Asn, Lys, Arg) 또는 글리신일 경우에 형성된다. 이러한 환형 정렬은 또한 "나선형 휠 투영"으로서 지칭된다.

바람직한 실시양태에서, 음으로 하전된 보호 서열은 서열 16 - 서열 19의 서열 중 임의의 것에 상응한다.

5. 절단 서열

절단 서열은 본 발명에 따라 원하는 펩티드 서열 (Pep)의 상류 및 하류에 정렬된 아미노산 서열이다. 이러한 서열을 통해 Pep 빌딩 블록은 "특이적인" 절단에 의해 반복되는 구조의 전구체 단백질로부터 제거될 수 있다. 이와 관련하여, "특이적"이라는 것은 상기 절단이 본질적으로는 전구체 단백질에서, 특히, 배타적으로 하나 이상의 정의된 위치에서 일어남으로써 원하는 펩티드 또는 그의 전구체가 제거되는 것을 의미한다.

예를 들어, "전구체"는 천연의 원래 펩티드 서열 부분은 아니지만, 천연의 원래 펩티드 서열 부분의 추가 사용 및 관능성을 간섭하지 않거나, 또는 필요한 경우, 종래 화학적 또는 생화학적 방법의 사용으로 절단에 의해 제거될 수 있는 아미노산 잔기를 아미노산 잔기의 한쪽 말단 상에 또는 양쪽 말단 모두에 포함하는 펩티드 쇄로 구성될 수 있다.

절단 서열은 상기 서열에 결합하여 두 특정 아미노산 사이의 펩티드 결합을 절단하는, 단백질분해 활성을 가진 효소에 대한 특이적인 인식 서열을 통해 작용할 수 있다. Arg-C 프로테이나제, Asp-N 엔도펩티다제, 카스파제, 키모트립신, 클로스트리파인, 엔테로키나제, 인자 Xa, 글루타밀 엔도펩티다제, 그란자임 B, LysC 리실엔도펩티다제 ((아크로모박터(Achromobacter) 프로테이나제 I), LysN 펩티딜-Lys 메탈로엔도펩티다제, 펩신, 프롤린 엔도펩티다제, 프로테이나제 K, 스타필로코커스(staphylococcal) 펩티다제 I, 써모리신, 트롬빈, 트립신에 대한 인식 서열이 그 예가 된다. 상응하는 인식 서열은 예를 들어, 문헌 [Keil, "Specificity of proteolysis" p. 335 Springer-Verlag (1992)]에 기재되어 있다.

별법으로, 특정 아미노산 서열을 통해 폴리펩티드 골격은 특정 화학 물질, 예를 들어, BNPS-스카톨 (2-(2'-니트로페닐술페닐)-3-메틸-3-브로모이놀레닌), 브롬시안, 산, 히드록실아민, 요오도소벤조산, NTCB (2-니트로-5-티오시아노벤조산)에 의해 선택적으로 절단될 수 있다.

더욱 구체적으로, 사용되는 절단 서열을 통해 반복되는 구조의 전구체 단백질은 화학 물질에 의해 절단될 수 있다. 특히 적합한 절단 서열은 히드록실아민을 통해 절단될 수 있는 서열 모티프 Asn-Gly, 또는 산을 통해 절단될 수 있는 서열 모티프 Asp-Pro 또는 Asp-Xxx (Xxx는 임의의 단백질 구성 아미노산이다)를 포함한다.

6. 본 발명에 따른 서열의 추가 개발

6.1 아미노산 서열

본원에서 구체적으로 개시된 펩티드 (Pep)에 대한 서열, 및 보조 서열 (Aux, SA, SU), 반복되는 구조의 서열, 절단 서열 및 반복되는 구조의 전구체 단백질에 대한 서열 이외에도, 본 발명은 또한 그의 기능적 등가물, 기능적 유도체 및 염에 관한 것이다.

본 발명에 따라, "기능적 등가물"은 특히 상기 언급된 아미노산 서열의 적어도 하나의 서열 위치에서 구체적으로 언급한 아미노산과는 상이한 아미노산을 가지지만, 원래의 비변형된 펩티드의 것과 동일한 특성을 여전히 갖는 돌연변이체 또한 의미한다. 따라서, "기능적 등가물"은 하나 이상의 아미노산의 부가, 치환, 결실 및/또는 역전에 의해 수득될 수 있는 돌연변이체를 포함하며, 상기 변형은 이를 통해 본 발명에 따른 특성 프로파일을 가진 돌연변이체를 수득할 수 있는 한, 임의의 서열 위치에서 일어날 수 있다. 더욱 구체적으로, 기능적 등가물은 특히 돌연변이체와 비변형된 폴리펩티드 사이의 반응성 패턴이 정질적으로 일치하는 경우에도 존재한다.

상기 의미에서 "기능적 등가물"은 또한 기재된 폴리펩티드의 "전구체" 및 또한 상기 폴리펩티드의 "기능적 유도체" 및 "염"이다.

여기서, "전구체"는 원하는 생물학적 활성을 가지거나 가지지지 않는, 상기 폴리펩티드의 천연 또는 합성 전구체이다.

적합한 아미노산의 치환 예를 하기 표에서 살펴볼 수 있다:

"염"이란 표현은 본 발명의 펩티드 분자의 카르복실 기의 염, 및 아미노 기의 산 부가염 둘 모두를 의미한다. 카르복실 기의 염은 그 자체로 공지된 방식으로 제조될 수 있고, 무기 염, 예를 들어, 나트륨, 칼슘, 암모늄, 철 및 아연 염, 및 또한 유기 염기, 예를 들어, 아민, 예를 들어, 트리에탄올아민, 아르기닌, 리신, 피페리딘 등과의 염을 포함한다. 본 발명은 또한 산 부가염, 예를 들어, 염산 또는 황산과 같은 무기 산과의 염, 및 아세트산 및 옥살산과 같은 유기 산과의 염에 관한 것이다.

본 발명에 따른 폴리펩티드의 "기능적 유도체" (또는 "유도체") 또한 공지된 기법을 사용하여 기능적 아미노산 측쇄기 상에서 또는 그의 N- 또는 C-말단 상에서 생산될 수 있다. 이러한 종류의 유도체는 카르복실산 기의 지방족 에스테르, 암모니아 또는 1급 또는 2급 아민과의 반응에 의해 수득될 수 있는 카르복실산 기의 아미드; 아실 기와의 반응에 의해 제조된, 유리 아미노 기의 N-아실 유도체; 또는 아실 기와의 반응에 의해 제조된, 유리 히드록실 기의 O-아실 유도체를 포함한다. 추가로, 1 내지 5개, 예를 들어, 2, 3 또는 4개의 무작위 D- 또는 L-아미노산 잔기는 추가로 N- 및/또는 C-말단에 공유적으로 (펩티드결합에 의해) 결합될 수 있다.

6.2 핵산, 발현 구조물, 벡터 및 그를 포함하는 미생물

핵산:

본 발명은 추가로 본 발명에 따라 사용되는 펩티드 및 단백질 서열을 코딩하는 핵산 분자를 포함한다.

본원에서 언급된 모든 핵산 서열 (단일- 및 이중-가닥 DNA 및 RNA 서열, 예를 들어, cDNA 및 mRNA)은 뉴클레오티드 빌딩 블록으로부터 화학적 합성에 의해, 예를 들어, 이중 나선의 각각의 중복된 상보적 핵산 빌딩 블록의 단편 융합에 의해 그 자체로 공지된 방식으로 제조될 수 있다. 예를 들어, 올리고뉴클레오티드는 포스포아미다이트 방법에 의해 공지된 방식으로 화학적으로 합성될 수 있다 (문헌 [Voet, Voet, 2nd edition, Wiley Press New York, pages 896-897]). DNA 폴리머라제의 클레나우(Klenow) 단편의 도움으로 합성 올리고뉴클레오티드를 어닐링하고 갭을 필링하는 것, 라이게이션 반응 뿐만 아니라, 일반적인 클로닝 방법이 문헌 [Sambrook et al., (1989), Molecular Cloning: A laboratory manual, Cold Spring Harbor Laboratory Press]에 기재되어 있다.

본 발명은 본 발명에 따른 폴리펩티드 또는 단백질을 코딩하는 단리된 핵산 분자 또는 그의 생물학적으로 활성인 절편, 및 예를 들어 본 발명에 따른 코딩 핵산의 확인 또는 증폭을 위한 혼성화 프로브 또는 프라이머로서 사용될 수 있는 핵산 단편, 이 둘 모두에 관한 것이다.

본 발명에 따른 핵산 분자는 유전자의 코딩 영역의 3'- 및/또는 5' 말단으로부터의 비번역 서열을 추가로 포함할 수 있다.

"단리된" 핵산 분자는 상기 핵산의 천연 공급원에 존재하는 다른 핵산 분자로부터 제거되고, 추가로 재조합 기술에 의해 제조된 경우에는 다른 세포 물질 또는 배양 배지를 본질적으로 함유하지 않을 수 있거나, 또는 화학적으로 합성된 경우에는 화학적 전구체 또는 다른 화학 물질을 함유하지 않을 수 있다.

본 발명에 따른 핵산 분자는 표준 분자생물학적 기법 및 본 발명에 따라 제공된 서열 정보에 의해 단리될 수 있다. 예를 들어, cDNA는 혼성화 프로브로서 구체적으로 개시된 완전 서열 또는 그의 임의의 절편 중 하나, 및 표준 혼성화 기법을 사용하여 적합한 cDNA 라이브러리로부터 단리될 수 있다 (예를 들어, 문헌 [Sambrook, J., Fritsch, E.F. and Maniatis, T. Molecular Cloning: A Laboratory Manual. 2nd edition, Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989]에 기술된 바와 같다). 또한, 상기 서열에 기초하여 생성된 올리고뉴클레오티드 프라이머를 사용하여 중합효소 연쇄 반응에 의해 단리된, 개시된 서열 중 임의의 것을 포함하는 핵산 분자 또는 그의 절편이 사용될 수 있다. 이러한 방식으로 증폭된 핵산은 적합한 벡터로 클로닝될 수 있고, DNA 서열 분석에 의해 특징이 규명될 수 있다. 본 발명에 따른 올리고뉴클레오티드는 또한 표준 합성 방법에 의해, 예를 들어, DNA 합성 장치를 사용하여 제조될 수 있다.

본 발명은 추가로 구체적으로 기술된 뉴클레오티드 서열에 상보적인 핵산 분자 또는 그의 절편을 포함한다.

본 발명에 따른 뉴클레오티드 서열을 통해 다른 세포 유형 및 유기체에서 상동성 서열을 확인 및/또는 클로닝하는 데 사용될 수 있는 프로브 및 프라이머가 생성될 수 있다. 이러한 프로브 및 프라이머는 통상적으로 엄격 조건하에서 본 발명에 따른 핵산 서열의 센스 가닥 또는 상응하는 안티센스 가닥의 적어도 약 12개, 바람직하게는 적어도 약 25개, 예를 들어, 약 40개, 50 개 또는 75개의 연속 뉴클레오티드와 혼성화하는 뉴클레오티드 서열 영역을 포함한다.

본 발명은 또한 "침묵 돌연변이"를 포함하거나, 구체적으로 언급된 서열과 비교하여, 특별한 원래의 유기체 또는 숙주 유기체의 코돈 선호도에 따라 변형된 핵산 서열 뿐만 아니라, 천연적으로 발생된 변이체, 예를 들어, 스플라이스 변이체 또는 그의 대립형질 변이체를 포함한다. 본 발명은 또한 보존적 뉴클레오티드 치환 (즉, 해당 아미노산이 동일한 전하, 크기, 극성 및/또는 가용성을 가진 아미노산으로 대체되는 것)에 의해 수득될 수 있는 서열에 관한 것이다.

본 발명은 또한 서열 다형성에 기인하여 구체적으로 개시된 핵산으로부터 유도된 분자에 관한 것이다. 이러한 유전적 다형성은 자연적 변이로 인해 단일 군집내의 개체 사이에 존재할 수 있다. 이러한 자연적 변이는 통상적으로 유전자의 뉴클레오티드 서열에서 1 내지 5%의 변이를 야기한다.

본 발명은 추가로 또한 상기 언급한 코딩 서열에 혼성화되거나, 또는 그에 상보성인 핵산 서열을 포함한다. 이러한 폴리뉴클레오티드는 게놈 또는 cDNA 라이브러리를 스크리닝함으로써 발견할 수 있고, 임의로는 적합한 프라이머를 사용하여 PCR에 의해 그로부터 증폭시킬 수 있고, 이후, 예를 들어, 적합한 프로브를 사용하여 단리시킬 수 있다. 또 다른 가능성은 본 발명에 따른 폴리뉴클레오티드 또는 벡터로 적합한 미생물을 형질전환시키고, 상기 미생물을 증식시켜 상기 폴리뉴클레오티드를 증폭시킨 후, 이를 단리시키는 것이다. 추가로, 본 발명에 따른 폴리뉴클레오티드는 또한 화학적으로 합성될 수 있다.

폴리뉴클레오티드에 "혼성화"할 수 있다는 특성은 엄격한 조건하에서 비상보적인 파트너 사이에는 비특이적인 결합 반응이 발생하지 않지만, 상기 조건하에서 실제로 상보적인 서열에는 결합할 수 있는 폴리- 또는 올리고뉴클레오티드의 능력을 의미한다. 이러한 목적을 위해, 서열은 70-100%, 바람직하게 90-100% 상보적이어야 한다. 서로 특이적으로 결합할 수 있는 상보적인 서열의 특성은 예를 들어, 노던 또는 써던 블롯 기법에서, 또는 PCR 또는 RT-PCR에서 프라이머와의 결합에 사용된다. 보통 이러한 목적을 위해서는 길이가 적어도 30개 염기쌍인 올리고뉴클레오티드가 사용된다. 엄격한 조건은 예를 들어, 노던 블롯 기법의 경우, 비특이적으로 혼성화하는 cDNA 프로브 또는 올리고뉴클레오티드를 용리시키기 위해 50-70℃, 바람직하게 60-65℃의 세척액, 예를 들어, 0.1% SDS를 함유하는 0.1　x　SSC 완충제 (20　x　SSC: 3 M NaCl, 0.3 M 시트르산나트륨(pH　7.0) 함유)를 사용하는 것을 의미한다. 상기 언급한 바와 같이, 이러한 경우 오직 고도로 상보적인 핵산만이 서로 부착된 상태로 남게 된다. 엄격한 조건을 조정하는 것은 당업자에게 공지되어 있으며, 이는 예를 들어, 문헌 [Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6]에 기재되어 있다.

두 핵산 사이의 "동일성"은 각각의 경우에서, 전장의 핵산 전역에 걸친 뉴클레오티드의 동일성을 의미하는데, 특히 동일성은 인포맥스(Informax: 미국)로부터 입수한 벡터 NTI 슈트 7.1 소프트웨어의 도움과 함께, 클러스탈(Clustal) 방법을 적용시키고 (문헌 [(Higgins DG, Sharp PM. Fast and sensitive multiple sequence alignments on a microcomputer. Comput Appl. Biosci. 1989 Apr;5(2):151-1)]), 하기 파라미터를 설정함으로써 비교하여 계산할 수 있다.

다중 정렬 파라미터:

갭 개방 패널티 10

갭 확장 패널티 10

갭 분리 패널티 범위 8

갭 분리 패널티 오프

정렬 지연에 대한 동일성(%) 40

잔기 특이성 갭 오프

친수성 잔기 갭 오프

전이 가중치 0

쌍별 정렬 파라미터:

FAST 알고리즘 온

K-튜플(tuple) 크기 1

갭 패널티 3

윈도우 크기 5

최적 진단 횟수 5

발현 구조물 및 벡터:

본 발명은 추가로 조절 핵산 서열의 유전적 제어하에 본 발명에 따른 펩티드 또는 전구체 단백질을 코딩하는 핵산 서열을 포함하는 발현 구조물, 및 적어도 하나의 상기 발현 구조물을 포함하는 벡터에 관한 것이다. 본 발명에 따른 상기 구조물은 특정 코딩 서열의 5' 상류에 프로모터, 및 서열 3' 하류의 종결 인자, 및 임의로 각 경우에 코딩 서열에 작동가능하게 연결된 추가의 통상적 조절 요소를 포함한다. "작동가능한 연결"은 조절 요소 각각이 코딩 서열의 발현 동안 그의 기능을 의도한 대로 수행할 수 있도록 프로모터, 코딩 서열, 종결 인자, 및 임의로 추가의 조절 요소를 순차적 배열하는 것을 의미한다. 작동가능하게 연결가능한 서열의 예는 표적화 서열 및 또한 인핸서, 폴리아데닐화 신호 등이다. 추가의 조절 요소는 선별가능한 마커, 증폭 신호, 복제 기점 등을 포함한다. 적합한 조절 서열은 예를 들어, 문헌 [Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990)]에 기재되어 있다.

인공 조절 서열 이외에, 천연 조절 서열도 여전히 실제 구조 유전자의 상류에 존재할 수 있다. 이러한 천연 조절은 임의로 유전적 변형을 통해 변경될 수 있고, 이로써 유전자의 발현은 증가 또는 감소하게 된다. 그러나, 유전자 구조물은 또한 보다 단순한 구조를 가질 수 있는데, 즉, 어떤 추가의 조절 신호도 구조 유전자의 상류에 삽입되지 않고, 상기 구조물을 조절하는 천연 프로모터는 제거되지 않은 구조를 가질 수 있다. 대신, 천연 조절 서열은 조절이 더 이상 일어나지 않고, 유전자 발현은 증가 또는 감소될 수 있도록 돌연변이된다. 유전자 구조물은 핵산 서열 카피를 하나 이상 포함할 수 있다.

사용될 수 있는 프로모터의 예는 cos, tac, trp, tet, trp-tet, lpp, lac, lpp-lac, lacIq, T7, T5, T3, gal, trc, ara, SP6, 그람-음성 세균에서 유리하게 사용되는 람다-PR 또는 람다-PL 프로모터; 및 또한 그람-양성 프로모터 amy 및 SPO2, 효모 프로모터 ADC1, MFa, AC, P-60, CYC1, GAPDH 또는 식물 프로모터 CaMV/35S, SSU, OCS, lib4, usp, STLS1, B33, not 또는 유비퀴틴 프로모터 또는 파세올린 프로모터이다. 유도성 프로모터, 예를, 광- 및 특히, 온도-유도성 프로모터, 예를 들어, P_rP_l 프로모터를 사용하는 것이 특히 바람직하다. 기본적으로, 조절 서열을 가진 임의의 천연 프로모터가 사용될 수 있다. 추가로, 합성 프로모터 또한 유리하게 사용될 수 있다.

상기 조절 서열은 핵산 서열 및 단백질이 특정 방식으로 발현될 수 있도록 의도된다. 숙주 유기체에 따라, 이는 예를 들어, 유전자가 오직 유도 후에만 발현 또는 과다발현되거나, 또는 즉시 발현 및/또는 과다발현되는 것을 의미할 수 있다.

여기서, 조절 서열 또는 인자는 발현에 대해 유리한 영향을 미쳐 이를 증가 또는 감소시킬 수 있는 것이 바람직하다. 따라서, 조절 요소는 유리하게는, 강한 전사 신호, 예를 들어, 프로모터 및/또는 "인핸서"를 사용함으로써 전사 수준을 증진시킬 수 있다. 그러나, 또한, 예를 들어, mRNA의 안정성을 개선시켜 번역을 증진시킬 수도 있다.

발현 카세트는 적합한 프로모터를 적합한 코딩 뉴클레오티드 서열에, 종결 또는 폴리아데닐화 신호에 융합시켜 제조한다. 이러한 목적을 위해, 예를 들어, 문헌 ([T. Maniatis, E.F. Fritsch and J. Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1989)] 및 [T.J. Silhavy, M.L. Berman and L.W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1984)] 및 [Ausubel, F.M. et al., Current Protocols in Molecular Biology, Greene Publishing Assoc. and Wiley Interscience (1987)])에 기재된 바와 같이, 통상적 재조합 및 클로닝 기법이 사용된다.

적합한 숙주 유기체에서 재조합 핵산 구조물 또는 유전자 구조물을 발현시키기 위해서는 유전자가 숙주에서 최적으로 발현될 수 있도록 숙주-특이적 벡터 내로 삽입되는 것이 유리하다. 벡터는 당업자에게 주지되어 있고, 예를 들어, 예를 들어, 문헌 ["Cloning Vectors" (Pouwels P. H. et al., eds., Elsevier, Amsterdam-New York-Oxford, 1985)]에서 살펴볼 수 있다. 플라스미드 이외에, 벡터는 또한 당업자에게 공지된 임의의 다른 벡터, 예를 들어, 파지, 바이러스, 예를 들어, SV40, CMV, 바쿨로바이러스 및 아데노바이러스, 트랜스포존, IS 요소, 플라스미드, 코스미드, 및 선형 또는 환형 DNA를 포함하는 것으로 이해된다. 이들 벡터는 숙주 유기체에서 자동 복제될 수 있거나, 또는 염색체에 의해 복제될 수 있다.

언급될 수 있는 적합한 발현 벡터의 예는 하기와 같다:

통상적 융합 발현 벡터, 예를 들어, pGEX (파마시아 바이오테크 인코포레이티드(Pharmacia Biotech Inc); 문헌 [Smith, D.B. and Johnson, K.S. (1988) Gene 67:31-40]), pMAL (뉴 잉글랜드 바이오랩스(New England Biolabs: 메사츄세츠주 베벌리)) 및 pRIT 5 (파마시아(뉴저지주 피스카타웨이)) (여기서, 글루타티온-S-트랜스퍼라제 (GST), 말토스 E-결합 단백질 또는 단백질 A가 각각 재조합 표적 단백질에 융합됨).

비-융합 단백질 발현 벡터, 예를 들어, pTrc (문헌 [Amann et al., (1988) Gene 69:301-315]) 및 pET 11d (문헌 [Studier et al., Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, California (1990) 60-89]).

효모 에스. 세레비시아에(S. cerevisiae)에서의 발현을 위한 효모 발현 벡터, 예를 들어, pYepSec1 (문헌 [Baldari et al., (1987) Embo J. 6:229-234]), pMFa (문헌 [Kurjan and Herskowitz (1982) Cell 30:933-943]), pJRY88 (문헌 [Schultz et al., (1987) Gene 54:113-123]) 및 pYES2 (비트로겐 코포레이션(Invitrogen Corporation: 캘리포니아주 샌디에고)). 다른 진균, 예를 들어, 섬유상 진균에서 사용하기에 적합한 벡터 및 벡터를 구조화시키는 방법은 문헌 [van den Hondel, C.A.M.J.J. & Punt, P.J. (1991) "Gene transfer systems and vector development for filamentous fungi" in: Applied Molecular Genetics of Fungi, J.F. Peberdy et al., eds., pp. 1-28, Cambridge University Press: Cambridge]에 상세하게 기재된 것을 포함한다.

배양된 곤충 세포 (예를 들어, Sf9 세포)에서 단백질의 발현에 대해 이용가능한 바쿨로바이러스 벡터는 pAc 시리즈 (문헌 [Smith et al., (1983) Mol. Cell Biol. 3:2156-2165]) 및 pVL 시리즈 (문헌 [Lucklow and Summers, (1989) Virology 170:31-39])를 포함한다.

식물 발현 벡터, 문헌 ([Becker, D., Kemper, E., Schell, J. and Masterson, R. (1992) "New plant binary vectors with selectable markers located proximal to the left border," Plant Mol. Biol. 20:1195-1197]; 및 [Bevan, M.W. (1984) "Binary Agrobacterium vector for plant transformation." Nucl. Acids Res. 12:8711-8721])에 상세하게 기재된 것.

포유동물 발현 벡터, 예를 들어, pCDM8 (문헌 [Seed, B. (1987) Nature 329:840]) 및 pMT2PC (문헌 [Kaufman et al., (1987) EMBO J. 6:187-195]).

원핵 및 진핵 세포에 대한 추가의 적합한 발현 시스템은 문헌 [Sambrook, J., Fritsch, E.F. and Maniatis, T., Molecular cloning: A Laboratory Manual, 2nd edition, Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989]의 제16장 및 제17장에 기재되어 있다.

재조합 미생물

본 발명에 따른 벡터의 도움으로, 예를 들어, 본 발명에 따른 적어도 하나의 벡터로 형질전환되고, 본 발명에 따른 폴리펩티드를 생산하는데 사용될 수 있는 재조합 미생물을 제조할 수 있다. 상기 기술된 본 발명에 따른 재조합 구조물은 적합한 숙주 시스템에 도입되고 발현되는 것이 유리하다. 예를 들어, 각 발현 시스템에서 상기 핵산을 발현시키기 위해, 당업자에게 익숙한 통상적 클로닝 및 형질감염 방법, 예를 들어, 동반침전, 원형질체 융합, 전기천공, 레트로바이러스 형질감염 등을 사용하는 것이 바람직하다. 적합한 시스템은 예를 들어, 문헌 ([Current Protocols in Molecular Biology, F. Ausubel et al., Hrsg., Wiley Interscience, New York 1997], 또는 [Sambrook et al., Molecular Cloning: A Laboratory Manual. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989])에 기술되어 있다.

본 발명에 따라, 상동성 재조합 미생물 또한 생산할 수 있다. 이러한 목적을 위해, 본 발명에 따른 유전자의, 또는 임의로, 본 발명에 따른 서열을 변형, 예를 들어, 기능적으로 파괴시키기 위해 적어도 하나의 아미노산 결실, 부가 또는 치환이 도입된 코딩 서열의 적어도 하나의 절편을 포함하는 벡터("넉아웃" 벡터)를 제조한다. 도입된 서열은 예를 들어, 관련 미생물로부터의 상동체일 수 있거나, 또는 포유 동물, 효모 또는 곤충 공급원으로부터 유래될 수 있다. 별법으로, 상동성 재조합에 사용되는 벡터는, 상동성 재조합시 내인성 유전자가 또 다른 방식으로 돌연변이되거나 변형될 수 있도록, 그러나, 기능적 단백질은 여전히 코딩할 수 있도록 디자인될 수 있다 (예를 들어, 상류 조절 영역은 이들이 내인성 단백질의 발현을 변경시킬 수 있도록 변형될 수 있다). 본 발명에 따른 유전자의 변형된 절편은 상동성 재조합 벡터 내에 존재한다. 상동성 재조합을 위해 적합한 벡터의 구조는 예를 들어, 문헌 [Thomas, K.R. and Capecchi, M.R. (1987) Cell 51:503]에 기재되어 있다.

적합한 숙주 유기체는 기본적으로, 본 발명에 따른 핵산, 그의 대립형질 변이체, 그의 기능적 등가물 또는 유도체가 발현될 수 있도록 하는 임의의 유기체이다. 숙주 유기체는 예를 들어, 세균, 진균, 효모, 식물 또는 동물 세포를 의미한다.

원핵성 발현 유기체의 비제한적인 예는 에스케리키아 콜라이, 바실루스 서브틸리스, 바실루스 메가테리움(Bacillus megaterium), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 등이다. 진핵성 발현 유기체의 비제한적인 예는 효모, 예를 들어, 사카로미세스 세레비지아에(Saccharomyces cerevisiae), 피치아 파스토리스(Pichia pastoris) 등, 섬유상 진균, 예를 들어, 아스페르길루스 니거(Aspergillus niger), 아스페르길루스 오리자에(Aspergillus oryzae), 아스페르길루스 니둘란스(Aspergillus nidulans), 트리코더마 레에세이(Trichoderma reesei), 아크레모니움 크리소게눔(Acremonium chrysogenum) 등, 포유 동물 세포, 예를 들어, Hela 세포, COS 세포, CHO 세포 등, 곤충 세포, 예를 들어, Sf9 세포, MEL 세포 등, 식물 또는 식물 세포, 예를 들어, 솔라눔 튜버로숨(Solanum tuberosum), 니코티아나(Nicotiana) 등이다.

성공적으로 형질전환된 유기체는 유사하게 벡터 또는 발현 카세트에 존재하는 마커 유전자에 의해 선별될 수 있다. 이러한 마커 유전자의 예는 항생제에 대한 내성을 나타내는 유전자, 및 발색 반응을 촉매화여 형질전환된 세포를 염색시키는 효소에 대한 유전자이다. 이어서, 이들은 자동 세포 분류에 의해 선별될 수 있다. 벡터로 성공적으로 형질전환되고, 적절한 항생제 내성 유전자 (예를 들어, G418 또는 히그로마이신)를 보유하는 미생물은 상응하는 항생제를 포함하는 액체 또는 고체 배양 배지에 의해 선별될 수 있다. 세포 표면 상에 존재하는 마커 단백질은 친화성 크로마토그래피에 의해 선별용으로 사용될 수 있다.

7. 전구체 단백질 및 펩티드의 재조합 생산

본 발명에 따라 사용되는 펩티드 및 전구체 단백질은 대체로 그 자체가 공지되어 있는 방식으로 재조합적으로 생산될 수 있는데, 이러한 방법은 펩티드/전구체 단백질-생산 미생물을 배양하고, 임의로 상기 폴리펩티드의 발현을 유도하고, 상기 배양물로부터 폴리펩티드를 단리시키는 것을 포함한다. 원하는 경우, 이러한 방식으로 펩티드 및 전구체 단백질을 산업적 규모로도 생산할 수 있다.

공지된 방법에 따라 재조합 미생물을 배양하고, 발효시킬 수 있다. 예를 들어, 세균을 pH 6 내지 9의 TB 또는 LB 배지 중에서 20 내지 40℃ 온도하에 증식시킬 수 있다. 적합한 배양 조건은 예를 들어, 문헌 [T. Maniatis, E.F. Fritsch and J. Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1989)]에 상세히 기재되어 있다.

펩티드 또는 전구체 단백질이 배양 배지로 분비되지 않은 경우, 이때는 세포를 파괴시키고, 공지의 단백질 단리 방법에 의해 용해물로부터 생성물을 회수한다. 세포는 임의로 고주파수 초음파, 고압 (예를 들어, 프렌치(French) 압력 세포에서), 삼투압, 계면활성제, 용해효소 또는 유기 용매의 작용, 균질화기, 또는 열거된 방법 중 2개 이상의 조합에 의해 파괴될 수 있다.

펩티드 또는 전구체 단백질은 공지된 크로마토그래피 방법, 예를 들어, 분자체 크로마토그래피 (겔 여과), 예를 들어, Q-세파로스 크로마토그래피, 이온 교환 크로마토그래피 및 소수성 크로마토그래피에 의해, 및 다른 통상적 방법, 예를 들어, 초미세 여과, 결정화, 염석, 투석 및 천연 겔 전기영동에 의해 정제될 수 있다. 적합한 방법은 예를 들어, 문헌 ([Cooper, F.G., Biochemische Arbeitsmethoden [original title: The Tools of Biochemistry], Verlag Walter de Gruyter, Berlin, New York] 또는 [Scopes, R., Protein Purification, Springer Verlag, New York, Heidelberg, Berlin]에 기재되어 있다.

추가로, 재조합 펩티드 또는 전구체 단백질은 특정 뉴클레오티드 서열에 의해 cDNA를 연장시키고, 이에 따라 예를 들어, 간단한 정제를 위해 사용되는, 변형된 폴리펩티드 또는 융합 단백질을 코딩하는 벡터 시스템 또는 올리고뉴클레오티드를 사용함으로써 단리될 수 있다. 이러한 유형의 적합한 변형체의 예로는 앵커(anchor)로서 작용하는 "태그," 예를 들어, 헥사-히스티딘 앵커로서 공지된 변형체, 또는 항체에 의해 항원으로서 인지될 수 있는 에피토프이다(예를 들어, 문헌 [Harlow, E. and Lane, D., 1988, Antibodies: A Laboratory Manual. Cold Spring Harbor (N.Y.) Press]에 기재). 상기 앵커는 예를 들어, 크로마토그래피 칼럼에 도입될 수 있는 고체 지지체, 예를 들어, 중합체 매트릭스에 단백질을 부착시키기 위해 사용될 수 있거나, 또는 마이크로티터 플레이트 또는 또 다른 지지체 상에서 사용될 수 있다.

동시에, 이들 앵커는 또한 단백질을 인식시키는 데 사용될 수 있다. 또한, 단백질은 통상적인 마커, 예를 들어, 형광 염료, 기질과의 반응시 검출가능한 반응 생성물을 형성하는 효소 마커, 또는 방사성 표지를 단독으로, 또는 단백질을 유도체화시키는 앵커와 조합하여 사용함으로써 인식될 수 있다.

더욱 구체적으로, 반복되는 구조의 전구체 단백질은 본 발명에 따른 반복되는 구조의 전구체 단백질을 코딩하는, 합성적으로 제조된 유전자 서열에 의해 제조된다. 합성 유전자 서열을 제조할 수 있는 가능한 방법은 문헌 [Hummerich et al., Biochemistry 43; 13604-13612 (2004)]에 기재되어 있다.

반복되는 구조의 전구체 단백질은 가용성 또는 불용성 형태로 숙주 세포에 존재할 수 있다. 이 두가지 모두의 경우에서, 세포를 파괴시킨다. 더욱 구체적으로, 1,000-1,500 bar의 고압 균질기를 수단으로 하여 파괴시킬 수 있다. 가용성의 반복되는 구조의 전구체 단백질 경우, 용해물을 60-100℃, 예를 들어, 70-90℃ 또는 75-85℃로 가열하여 대부분의 세포 단백질을 침전시키고, 적합한 분리 방법 (예를 들어, 침강 또는 여과)에 의해 반복되는 구조의 전구체 단백질로부터 제거한다. 이어서, (상기 기술된 바와 같이) 코스모트로픽 염을 첨가함으로써 반복되는 구조의 전구체 단백질을 침전시킨다. 반복되는 구조의 전구체 단백질은 상기 과정에서 안정한 회합물을 형성한다. 회합물에 따라, 첨가되는 코스모트로픽 염의 농도는 달라질 수 있고, 그 범위는 약 0.2-3 M 또는 예를 들어, 0.8-2 M이다. 최적의 농도는 단백질 화학자에게 익숙한 간단한 방법으로 결정될 수 있다.

반복되는 구조의 전구체 단백질은 또한 외부 유발제없이도 조립될 수 있다. 이러한 경우, 반복되는 구조의 전구체 단백질은 이미 숙주 세포에서 조립되어 상응하는 안정한 화합물을 제공한다. 세포 파괴 후, 적합한 분리 방법(예를 들어, 침강 또는 여과)에 의해 상기 회합물을 가용성 성분으로부터 분리한다.

세포 파괴 후, 보조 침전제를 첨가하여 회합물의 제거를 개선시킬 수 있다. 상기 보조 침전제는 회합물을 추가로 응고시켜, 그 결과, 예를 들어, 회합물을 수성 매질로부터 분리하기 위한 것과 같이, 침강에 필요한 가속도는 더 낮아지게 된다. 사용될 수 있는 보조 침전제는 산, 가성소다, 중합체 용액, 특히, 하전된 중합체 수용액이다. 보조 침전제의 예로는 인산 또는 폴리에틸렌이민 용액이 있다.

반복되는 구조의 전구체 단백질의 안정한 회합물은 추가로 정제될 수 있다. 이러한 목적을 위해, 안정한 회합물 경우에는 그 안에서 불용성이지만, 다른 오염물들의 경우에는 용해되는 용액이 정제를 위해 사용된다. 더욱 구체적으로, 염기, 산, 우레아, 염, 및 계면활성제 수용액이 사용된다. 알칼리 금속 수산화물, 우레아, 구아니디늄 염 또는 하전된 계면활성제, 예를 들어, 알킬트리메틸암모늄 염 또는 알킬 술페이트 용액을 사용하는 것이 특히 적합하다. ≥0.2 M 수산화나트륨, ≥2 M 우레아, ≥1 M 구아니디늄 히드로클로라이드, ≥1 M 구아니디늄 티오시아네이트 또는 ≥0.1% 도데실 황산나트륨 또는 ≥0.1% 세틸트리메틸암모늄 브로마이드 용액이 사용된다. 정제를 위해, 안정한 회합물을 상응하는 용액 중에 재현탁시킨 후, 간단한 분리 방법 (예를 들어, 침강 또는 여과)에 의해 상기 용액으로부터 분리한다. 이어서, 반복되는 구조의 전구체 단백질을 물로 세척하고, 당업자에게 익숙한 방법을 사용하여 건조시킨다.

반복되는 구조의 전구체 단백질로부터 펩티드를 회수하기 위해서는 이들 서열을 상기 전구체 단백질로부터 절단하고, 보조 서열로부터 분리하여야 한다. 절단은 반복되는 구조의 전구체 단백질에 존재하는 절단 서열에서 일어난다. 아미노산 쇄를 절단하는 구체적인 방법은 문헌에 기술되어 있다. 반복되는 구조의 전구체 단백질은 효소적으로 또는 화학적으로 절단될 수 있다. 아미노산 쇄를 특이적으로 절단하는 데 사용될 수 있는 효소의 예로는 Arg-C 프로테이나제, Asp-N 엔도펩티다제, 카스파제, 키모트립신, 클로스트리파인, 엔테로키나제, 인자 Xa, 글루타밀엔도 펩티다제, 그란자임 B, LysC 리실엔도펩티다제 (아크로모박터 프로테이나제 I), LysN 펩티딜-Lys 메탈로엔도펩티다제, 펩신, 프롤린 엔도펩티다제, 프로테이나제 K, 스타필로코커스 펩티다제 I, 써모리신, 트롬빈, 트립신이 있다. 아미노산 쇄를 특이적으로 절단하는 데 사용될 수 있는 화학 물질의 예로는 BNPS-스카톨 (2-(2'-니트로페닐술페닐)-3-메틸-3-브로모이놀레닌), 브롬시안, 산, 히드록실아민, 요오도소벤조산, NTCB (2-니트로-5-티오시아노벤조산)이 있다.

더욱 구체적으로, 반복되는 구조의 전구체 단백질은 화학적으로, 예를 들어, 히드록실아민 또는 산에 의한 절단에 의해서 절단된다. pK_s가 0 초과 내지 5 미만, 바람직하게, 1 초과 내지 4 미만인 임의의 무기 산 또는 유기 산이 산성 절단에 적합하다. 더욱 구체적으로, 1-5% 인산 또는 1-5% 포름산이 산성 절단에 사용된다. 산성 절단 조건에 따라, 아미노산 Asp와 Pro 사이, 또는 Asp와 Xxx 사이 (Xxx는 임의의 단백질 구성 아미노산이다)에서 간단하게 절단이 일어나거나, 또는 먼저 아미노산 Asp와 Pro 사이, 또는 Asp와 Xxx 사이에서 절단이 일어난 후, 이어서, 펩티드의 아미노산 서열 중 아스파르테이트의 상류쪽 N-말단에 있는 아미노산으로부터 상기 아스파르테이트가 완전하게 절단된다.

정제된 반복되는 구조의 전구체 단백질을 사용하거나, 반복되는 구조의 전구체 단백을 포함하는 세포 분획 (예를 들어, 숙주 세포의 가용성 성분 또는 숙주 세포의 불용성 성분)을 사용하거나, 또는 반복되는 구조의 전구체 단백질을 포함하는 온전한 숙주 세포를 사용함으로써 절단을 수행할 수 있다. 절단제는 절단 후에 불활성화되어야 한다. 이러한 목적을 위한 방법은 당업자에게 공지되어 있다.

불활성화 이후, 절단 반응 혼합물은 특히 원하는 펩티드, 절단된 보조 서열 및 불활성화된 절단제를 포함한다. 상기 용액 중에서, 펩티드는 이미 그의 원하는 활성을 가지고 있을 수 있다. 보다 큰 순도를 필요로 할 경우, 절단 후, 반복되는 구조의 전구체 단백질로부터 유래된 펩티드를 보조 서열로부터 제거할 수 있다. 자기-조립 보조 서열의 이점은 상기 보조 서열이 절단 중에, 또는 그 이후에 조립될 수 있다는 사실이다. 이는 선택된 절단 조건하에서 절단 중에 자발적으로 조립될 수 있거나, 또는 상기 보조 서열의 조립을 보조하는 물질의 첨가를 통해 조립될 수 있다. 이러한 조립-촉진 물질로는 예를 들어, 호프마이스터 계열에 따라, 나트륨 또는 클로라이드 이온보다 코스모트로픽 특성이 더 큰 이온 유형을 적어도 한가지 포함하는 코스모트로픽 염이 있다. 다른 조립-촉진 물질로는 예를 들어, 산 또는 가성소다, 물과 혼화성인 유기 용매, 예를 들어, 알콜이 있다. 조립된 보조 서열은 침강 또는 여과에 의해 가용성의 유리된 펩티드로부터 제거될 수 있다. 남은 단백질 또는 펩티드 오염물질 또는 염 또는 절단시 또는 그 이후에 첨가된 다른 물질을 원하는 펩티드로부터 제거하기 위해서는 추가의 정제 단계가 필요할 수 있다. 이러한 목적을 위해, 예를 들어, 크로마토그래피 방법, 침전, 투석, 2상 추출법 및 당업자에게 익숙한 다른 방법이 사용될 수 있다.

이어서, 펩티드-함유 용액을 원하는 바와 같이 적용시키기 위해 직접 사용할 수 있거나, 또는 상기 용액을 당업자에게 익숙한 방법(예를 들어, 분무 건조, 또는 동결 건조)에 의해 건조시켜 상응하는 건조 생성물을 수득하고, 이를 사용할 수 있다.

건조시킨 후, 펩티드가 물에 용해된다면, 상기 펩티드가 그에 대해 불용성인 용매로 세척하여 펩티드로부터 제거되지 못한 오염물질을 제거할 수 있다. 유기 용매, 예를 들어, n-헥산, N-메틸피롤리돈, 또는 용매 및 산의 혼합물, 예를 들어, n-헥산 및 아세트산의 혼합물, 또는 유기 산, 예를 들어, 아세트산 또는 헥산산이 적합하다. 이러한 정제 단계를 위해, 건조된 펩티드를 적절한 용매/용매 혼합물에 재현탁시킨 후, 침강 또는 여과에 의해 다시 제거한다. 남은 용매/용매 혼합물은 건조시켜 제거할 수 있다.

절단에 의해 수득한 형태의 원하는 펩티드는 원하는 활성을 가질 수 있다. 그러나, 절단 후 펩티드를 추가로 변형시켜야 할 수도 있다. 예를 들어, 펩티드를 아미드화, 에스테르화, 산화, 알킬화시킬 수 있거나, 또는 임의 분자에 화학적으로 연결시킬 수 있다. 상기 변형에 사용될 수 있는 분자의 예로는 알콜, 알콜 시스테인 에스테르, 카르복실산, 티오에스테르 또는 말레이미드가 있다. 더욱 특히, 상기 변형에 사용되는 분자는 펩티드의 소수성을 증가시키는 것이다. 그러한 분자는 상기 정의된 바와 같이, 변형된 또는 비변형된 알킬 라디칼을 포함할 수 있다. 그러한 분자로는 바람직하게 C₂-C₁₆-, 특히, C₆-C₁₄-알킬 라디칼을 포함한다. 상응하는 방법이 당업자에게 공지되어 있다. 변형은 언제든지 수행될 수 있고: 예를 들어, 세포 파괴 직후, 전구체 단백질 정제 후, 전구체 단백질 절단 후, 또는 펩티드 정제 후에 수행될 수 있다.

원하는 정도의 순도를 가진 펩티드 용액은 직접 사용될 수 있다. 별법으로, 장기간 보관을 위해 다른 저장 방법이 적용될 수 있다. 저장 방법의 예로는 냉각, 동결, 방부제 첨가가 있다. 별법으로 펩티드를 건조시킬 수 있다. 건조 방법의 예로는 동결건조 또는 분무 건조가 있다. 이어서, 건조된 펩티드를 보관할 수 있다. 펩티드를 사용하기 위해서는 건조된 물질을 적합한 용매, 바람직하게는 수용액에 용해시킨다. 상기 수용액은 염 또는 완충 물질을 포함할 수 있거나, 또는 어떤 물질도 추가로 첨가되지 않을 수 있다.

8. 다양한 다른 일반 용어들에 관한 정의

달리 언급하지 않는 한, 구체적으로 개시된 서열, 또는 그에 "상동성"인 서열로부터 "유도된" 서열, 예를 들어, 유도된 아미노산 또는 핵산 서열은 본 발명에 따라, 출발 서열과 적어도 80% 또는 적어도 90%, 특히, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 및 99% 동일한 서열을 의미한다.

실험부

본 발명에 기술된 임의의 펩티드 서열 (Pep)을 생산하는 방법의 일반적인 적용가능성은 상이한 서열 및 아미노산 조성을 가진 3가지 펩티드 (ZnO, P18, Min)를 생산하는 것에 기초하여 입증된다.

달리 언급하지 않는 한, 표준 유기 분석법 및 표준 생화학적 분석법, 및 표준 단백질 재조합 생산 방법 및 표준 미생물 배양 방법을 사용하였다.

실시예 1: 펩티드 ZnO (서열 20) 생산

펩티드 ZnO는 공개 서열로부터 유도된 펩티드로서, 이는 산화아연 입자 형성에 영향을 준다 (문헌 [Umetsu et al., Adv. Mat. 17: 2571-75 (2005)]). 제한 엔도뉴클레아제 BamHI 및 HindIII을 사용하여 합성 유전자 ZnO₄ (서열 21)를 문헌 [Hummerich et al., Biochemistry 43; 13604-13612 (2004)]에 기재되어 있는 벡터 pAZL로 클로닝하고, 상기 문헌에 기재되어 있는 프로토콜에 따라 이량체화한 후, 벡터로 pET21 (노바겐(Novagen))로 클로닝하였다. 상기 벡터 중에 연속적으로 존재하는 서열이 반복되는 구조의 전구체 단백질 ZnO₈ (서열 22)을 코딩하였다. 상기 반복되는 구조의 전구체 단백질은 8개의 반복부를 포함하였는데, 이들 각각은 ZnO 펩티드 및 보조 서열로 구성된 카피를 포함하였다. 상기 보조 서열은 폴리-알라닌 서열을 포함하였고, 이는 반복되는 구조의 전구체 단백질에 자기-조립 특성을 부여하였다. 산에 의해 ZnO 펩티드가 전구체 단백질로부터 선택적으로 절단될 수 있도록 의도된 아미노산 Asp-Pro를 보조 서열과 펩티드 서열 사이에 위치시켰다. 균주 이. 콜라이 BL21 [DE3] (노바겐)에서 발현을 수행하였다.

유가 배양식 방법으로 pO₂>20% 및 pH=6.8하에서 배양하고, 단백질 합성을 수행하였다.

배지:

미량 염 용액:

공급액:

기본 배지 중에서 존재하는 글리세롤이 고갈된 후에는 100　ml/h의 일정한 속도로 공급하기 시작하였다.

세균 배양물의 광학 밀도가 OD₆₀₀=60에 도달한 후, 1　mM 이소프로필 β-D-티오갈락토피라노시드를 첨가하여 단백질 합성을 유도하였다. 이 시점에서 배양물의 온도를 37℃에서 30℃로 하강시켰다. 유도 후 5 h 경과하였을 때, 세포를 수거하였다.

하기 프로토콜에 따라 ZnO₈을 정제하였다:

- 습식 매스 1 g당 세포 펠릿을 5　ml의 20　mM MOPS (3-(N-모르폴리노)프로판술폰산) (pH 7.0) 중에 재현탁시키고,

- 1,400 bar의 고압 균질기에서 세포를 파괴시키고,

- 30분 동안 5,000 x g로 원심분리하고,

- 30분 동안 80℃에서 상청액을 인큐베이션시키고,

- 30분 동안 5,000 x g로 원심분리하고,

- 4℃에서 밤새도록, 1.8 M 황산암모늄 (최종 농도)을 첨가하여 상청액으로부터 ZnO₈을 침전시키고,

- 펠릿을 8 M 우레아로 세척하고,

- 펠릿을 물로 2회에 걸쳐 세척하고,

- 동결건조시키고,

- 동결건조된 ZnO₈을 -20℃가 되게 만들었다.

각 1 ℓ의 배양 배지로부터 2.2　g의 순수한 ZnO₈을 회수하였다.

절단하기 위해, 250　mg의 동결건조된 ZnO₈ 전구체 단백질을 5　ml의 1% 포름산 중에 재현탁시키고, 6 h 동안 90℃에서 인큐베이션시켰다. 상기 인큐베이션 기간 동안, 동결건조물이 용해되었고, 이를 통해 겔-유사 물질이 형성되었다. 실온으로 냉각시킨 후, 18,000 x g로 침강시켜 가용성 성분으로부터 겔-유사 물질을 제거하였다. 남은 용액은 2 M NaOH로 중화시켰다. 이어서, 상기 용액을 동결건조시켰다. 동결건조물은 원하는 절단 생성물과, 포름산의 중화로부터 생성된 포름산나트륨을 포함하였다.

동결건조된 생성물을 HPLC로 분석하였다: 이를 위해 생성물을 물 중에 1　mg/ml의 농도로 용해시키고, 역상 크로마토그래피 칼럼 (주피터 프로테오(Jupiter Proteo) 4.6 x 250 mm; 페노메넥스(Phenomenex))을 사용하여 분석하였다. 사용된 용리제는 물 중 0.1% 트리플루오로아세트산이었고, 선형 구배를 사용하여 이를 아세토니트릴 중 0.1% 트리플루오로아세트산으로 대체하였다. 206　nm에서 검출을 수행하였다 (도 2). 추가 분석을 위해, 주요 피크 분획을 수집하고, 그 안에 존재하는 물질을 추가로 연구하였다. N-말단 서열 분석을 통해 상기 성분이 ZnO 펩티드임을 확인하였다. 질량 분석법 (MALDI-TOF)을 통해 연구함으로써 질량이 2,002임을 확립하였고, 이는 ZnO 펩티드의 이론상의 질량과 일치하였다 (도 3). HPLC 분석을 통해 순도는 UV 활성 성분 기준으로 62%인 것으로 밝혀졌다.

실시예 2: 펩티드 P18 (서열 23) 생산

펩티드 P18은 문헌 [Shin et al., J. Peptide Res. 58:504-14 (2001)]에 기재되어 있는, 고도로 활성인 항미생물성 펩티드 서열로부터 유도된 펩티드이다. 제한 엔도뉴클레아제 BamHI 및 HindIII을 사용하여 합성 유전자 AHeAP18₂ (서열 24)를 문헌 [Hummerich et al., Biochemistry 43; 13604-13612 (2004)]에 기재되어 있는 벡터 pAZL로 클로닝하고, 상기 문헌에 기재되어 있는 프로토콜에 따라 이량체화한 후, 벡터로 pET21 (노바겐)로 클로닝하였다. 상기 벡터에 연속적으로 존재하는 서열이 반복되는 구조의 전구체 단백질 AHeAP18₄ (서열 25)를 코딩하였다. 상기 반복되는 구조의 전구체 단백질은 4개의 반복부를 포함하였는데, 이들 각각은 P18 펩티드 및 보조 서열로 구성된 카피를 포함하였다. 상기 보조 서열은 2개의 폴리-알라닌 서열을 포함하였고, 이는 반복되는 구조의 전구체 단백질에 자기-조립 특성을 부여하였다. 또한, 보조 서열은 음으로 하전된 나선형의 보호 서열을 포함하였다. 산에 의해 P18 펩티드가 전구체 단백질로부터 선택적으로 절단될 수 있도록 의도된 아미노산 Asp-Pro를 보조 서열과 P18 펩티드 서열 사이에 위치시켰다. 균주 이. 콜라이 BL21 [DE3] (노바겐)에서 발현을 수행하였다.

유가 배양식 방법으로 pO₂>20% 및 pH=6.8하에서 배양하고, 단백질 합성을 수행하였다. 배지, 미량 염 용액 및 공급액은 실시예 1에 기술되어 있는 조성물을 가졌다.

세균 배양물의 광학 밀도가 OD₆₀₀=60에 도달한 후, 1　mM 이소프로필 β-D-티오갈락토피라노시드를 첨가하여 단백질 합성을 유도하였다. 유도 후 10 h 경과하였을 때, 30분 동안 5,000 x g로 침강시켜 세포를 수거하였다. 습식 바이오매스는 1,932 g이었다.

하기 프로토콜에 따라 습식 바이오매스를 정제하였다:

- 세포 펠릿을 재현탁시키는데; 바이오매스 각 1 g에 대해 6　g의 20　mM 인산나트륨 완충제 (pH 7.5)을 첨가하고, 철저히 혼합시키고,

- 1,500 bar의 고압 균질기에서 세포를 파괴시키고,

- pH = 3±0.5가 될 때까지 인산을 첨가하고,

- 10분 동안 23℃에서 교반하면서 인큐베이션시키고,

- 20분 동안 적어도 5,000 x g로 원심분리하고,

- 펠릿을 재현탁시키는데; 습식 매스 1 g당 25　ml의 0.2 M NaOH를 첨가하고, 균질화시키고, 4시간 동안 23℃에서 교반하면서 인큐베이션시키고,

- 85% 농도의 H₃PO₄를 사용하여 pH를 8.5±0.5로 조정하여 중화시키고,

- 20분 동안 적어도 5,000 x g로 원심분리하고,

- P18 전구체 단백질을 포함하는 세척된 봉입체로 구성된 펠릿을 가수분해시키거나, 2% 농도의 H₃PO₄를 사용하여 절단하였다.

절단 조건:

i. 펠릿 각 1g에 대해 5　ml의 H₃PO₄를 사용하고,

ii. 균질화시키고,

iii. 16시간 동안 90℃에서 진탕시키면서 인큐베이션시켰다.

- 절단 반응 혼합물을 냉각시키고,

- 20분 동안 적어도 5,000 x g로 원심분리하고,

- 10 M NaOH를 사용하여 pH를 5.5±0.5로 조정하여 중화시키고,

- 20분 동안 적어도 5,000 x g로 원심분리하고,

- 전도도가 10　mS/cm 미만이 될 때까지 상청액을 물로 희석시키고,

- 양이온 교환 크로마토그래피 (프락토겔(Fractogel) COO; 머크(Merck))를 통해 P18을 상청액으로부터 정제하는데; 450　mM NaCl를 사용하여 용리시키고,

- 펩티드 함유 분획을 풀링하고, 전도도가 10　mS/cm 미만이 될 때까지 물로 희석시키고,

- 양이온 교환 크로마토그래피 (프락토겔 COO; 머크)를 통해 P18을 풀링된 분획으로부터 정제하는데; 50　mM HCl을 사용하여 용리시키고,

- 용리액을 2 M NaOH로 중화시키고,

- 중화된 용액을 동결건조시켰다.

동결건조된 생성물을 HPLC로 분석하였다: 이를 위해 생성물을 물 중에 1　mg/ml의 농도로 용해시키고, 역상 크로마토그래피 칼럼 (주피터 프로테오 4.6 x 250 mm; 페노메넥스)을 사용하여 분석하였다. 사용된 용리제는 물 중 0.1% 트리플루오로아세트산이었고, 선형 구배를 사용하여 이를 아세토니트릴 중 0.1% 트리플루오로아세트산으로 대체하였다. 280　nm에서 검출을 수행하였다 (도 4). 추가 분석을 위해, 주요 피크 분획을 수집하고, 그 안에 존재하는 물질을 추가로 연구하였다. N-말단 서열 분석을 통해 상기 성분이 P18 펩티드임을 확인하였다.

질량 분석법 (MALDI-TOF)을 통해 연구함으로써 펩티드에 대한 질량이 2,512임을 확립하였고, 이는 P18 펩티드의 이론상의 질량과 일치하였다 (도 5). HPLC 분석을 통해 순도는 UV 활성 성분 기준으로 85%인 것으로 밝혀졌다. 30 g의 습식 바이오매스로부터 52　mg의 P18 펩티드를 수득하였다. 따라서, 각 1 ℓ의 발효 배양물로부터 대략 330　mg의 순수한 P18 펩티드를 회수할 수 있었다.

P18 펩티드의 활성을 조사하기 위해, 600　nm에서 측정하였을 때 배양물의 광학 밀도가 0.1인, LB 배지 (5　g/ℓ 효모 추출물; 10　g/ℓ 트립톤, 5　g/ℓ 염화나트륨) 중 이. 콜라이 B 배양물을 상이한 농도의 P18 펩티드와 함께 37℃에서 진탕시키면서 인큐베이션시켰다. 24 h 경과 후 광학 밀도를 측정함으로써 세균 성장을 모니터링하였다. 펩티드 농도 31　ppm으로부터 성장이 완전하게 억제되었다 (24 h 경과 후 600　nm에서의 광학 밀도 < 0.15). C-말단 카르복실 기를 추가로 아미드화시킴으로써 항미생물 활성을 개선시킬 수 있다. 이를 위해, 상기 카르복실 기를 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 히드로클로라이드 및 N-히드록시-술포숙신이미드로 활성화시키고, 이어서 암모니아를 첨가하여 아미드화시켰다.

실시예 3: 펩티드 Min (서열 26) 생산

제한 엔도뉴클레아제 BamHI 및 HindIII을 사용하여 합성 유전자 AEMin₄ (서열 27)를 문헌 [Hummerich et al., Biochemistry 43; 13604-13612 (2004)]에 기재되어 있는 벡터 pAZL로 클로닝하고, 상기 문헌에 기재되어 있는 프로토콜에 따라 이량체화한 후, 벡터로 pET21 (노바겐)로 클로닝하였다. 상기 벡터에 연속적으로 존재하는 서열이 반복되는 구조의 전구체 단백질 AEMin₈ (서열 28)을 코딩하였다. 상기 반복되는 구조의 전구체 단백질은 8개의 반복부를 포함하였는데, 이들 각각은 Min 펩티드 및 보조 서열로 구성된 카피를 포함하였다. 상기 보조 서열은 폴리알라닌 서열을 포함하였고, 이는 반복되는 구조의 전구체 단백질에 자기-조립 특성을 부여하였다. 또한, 보조 서열은 음으로 하전된 나선형의 보호 서열을 포함하였다. 산을 사용하여 P18 펩티드가 전구체 단백질로부터 선택적으로 절단될 수 있도록 의도된 아미노산 Asp-Pro를 보조 서열과 상기 펩티드 서열 사이에 위치시켰다. 균주 이. 콜라이 BL21 [DE3] (노바겐)에서 발현을 수행하였다.

하기 프로토콜에 따라 AEMin₈을 정제하였다:

- 1,400 bar의 고압 균질기에서 세포를 파괴시키고,

- 30분 동안 5,000 x g로 원심분리하고,

- 20분 동안 80℃에서 상청액을 인큐베이션시키고,

- 30분 동안 5,000 x g로 원심분리하고,

- 4℃에서 밤새도록, 2 M 황산암모늄 (최종 농도)를 첨가하여 상청액으로부터 AEMin₈을 침전시키고,

- 펠릿을 8 M 우레아로 세척하고,

- 펠릿을 물로 2회에 걸쳐 세척하고,

- 동결건조시키고,

- 동결건조된 AEMin₈을 -20℃가 되게 만들었다.

배양 배지 각 1 ℓ로부터 0.4 g의 순수한 AEMin₈을 회수하였다.

절단하기 위해, 250　mg의 동결건조된 AEMin₈ 전구체 단백질을 12.5　ml의 1% 인산 중에 재현탁시키고, 8 h 동안 90℃에서 인큐베이션시켰다. 실온으로 냉각시킨 후, 18,000 x g로 침강시켜 가용성 물질로부터 불용성 물질을 제거하였다. 남은 용액은 2 M NaOH로 중화시켰다. 이어서, 상기 용액을 동결건조시켰다. 동결건조물은 원하는 절단 생성물과, 인산의 중화로부터 생성된 인산수소나트륨을 포함하였다.

동결건조된 생성물을 HPLC로 분석하였다: 이를 위해 생성물을 물 중에 1　mg/ml의 농도로 용해시키고, 역상 크로마토그래피 칼럼 (주피터 프로테오 4.6 x 250 mm; 페노메넥스)을 사용하여 분석하였다. 사용된 용리제는 물 중 0.1% 트리플루오로아세트산이었고, 선형 구배를 사용하여 이를 아세토니트릴 중 0.1% 트리플루오로아세트산으로 대체하였다. 206　nm에서 검출을 수행하였다 (도 6). 추가 분석을 위해, 주요 피크 분획을 수집하고, 그 안에 존재하는 물질을 추가로 연구하였다. N-말단 서열 분석을 통해 상기 성분이 Min 펩티드임을 확인하였다. 질량 분석법 (MALDI-TOF)을 통해 연구함으로써 질량이 1,900임을 확립하였고, 이는 Min 펩티드의 이론상의 질량과 일치하였다 (도 7). HPLC 분석을 통해 순도는 UV 활성 성분 기준으로 68%인 것으로 밝혀졌다.

실시예 4: 펩티드 P18 (서열 23) 생산 최적화

실시예 2로부터의 펩티드 P18의 수율을 증가시키기 위해, 상이한 Aux 서열이 펩티드 수율에 미치는 영향에 대해 연구하였다. 실시예 2에 따른 pET21 벡터로 클로닝한 후, 서열 75를 가진 전구체 단백질을 코딩하는 합성 유전자 AHe2AP18₂ (서열 74)를 사용하였을 때, 발현율 및 총 수율은 현저하게 증가하였다. 실시예 2에 기술되어 있는 조건을 사용하여 발효를 수행하였다.

하기 프로토콜에 따라 습식 바이오매스를 정제하였다:

- 세포 펠릿을 재현탁시키는데; 바이오매스 각 1 g에 대해 6　g의 물을 첨가하고, 철저히 혼합시키고,

- 1,500 bar의 고압 균질기에서 세포를 파괴시키고,

- pH = 3±0.5가 될 때까지 인산을 첨가하고,

- 10분 동안 23℃에서 교반하면서 인큐베이션시키고,

- 20분 동안 적어도 5,000 x g로 원심분리하고,

- 펠릿을 재현탁시키는데; 습식 매스 각 1 g에 대해 20　ml의 0.4 M NaOH를 첨가하고, 균질화시키고, 1시간 동안 23℃에서 교반하면서 인큐베이션시키고,

- 1 M 인산칼륨 완충제 (pH 6.0)을 사용하여 pH를 8.5±0.5로 조정하여 중화시키고,

- 20분 동안 적어도 5,000 x g로 원심분리하고,

절단 조건:

i. 펠릿 각 1g에 대해 7　ml의 H₃PO₄를 사용하고,

ii. 균질화시키고,

iii. 16시간 동안 90℃에서 진탕시키면서 인큐베이션시켰다.

- 절단 반응 혼합물을 냉각시키고,

- 20분 동안 적어도 5,000 x g로 원심분리하고,

- 25% NaOH를 사용하여 pH를 4.0±0.5로 조정하여 중화시키고,

- 20분 동안 적어도 5,000 x g로 원심분리하고,

- 전도도가 30　mS/cm 미만이 될 때까지 상청액을 물로 희석시키고,

- 양이온 교환 크로마토그래피 (SP-세파로스 하이 퍼포먼스(SP-Sepharose High Performance); GE 헬스케어(GE Healthcare))를 통해 P18을 상청액으로부터 정제하는데; 세척 완충제는 10　mM 아세트산나트륨 완충제 (pH　4) + 450　mM NaCl이고; 용리 완충제는 10　mM 아세트산나트륨 완충제 (pH　4) + 1,100　mM NaCl이고,

- pH= 10.5±0.3이 될 때까지 25% NaOH를 용리액에 첨가하여 펩티드를 침전시키고,

- 20분 동안 적어도 5,000 x g로 원심분리하고,

- 습식 매스 각 1 g에 대해 5　ml의 물 중에 펠릿을 재현탁시키고,

- pH= 6.0 pH= 10.5±0.5가 될 때까지 아세트산을 첨가하여 펩티드를 용해시키고,

- 동결건조시켰다.

기술된 방식으로 각 1 ℓ의 발효 배양물로부터 대략 1 g의 순수한 P18 펩티드를 회수할 수 있었다.

실시예 5: 펩티드 서열 6 생산

실시예 1 내지 4에 열거된 펩티드를 산성 절단에 의해 반복되는 구조의 전구체 단백질로부터 유도하였다. 이는 아스파르테이트와 프롤린 사이의 펩티드 결합을 가수분해하는 것을 포함하였다. 따라서, 실시예 1에서 제시한 바와 같이, 펩티드 서열은 N-말단에서는 프롤린으로 출발하여, C-말단에서는 아스파르테이트로 종결되었다. 특정 환경하에서는 실시예 2 및 3에서 제시한 바와 같이, C-말단의 아스파르테이트 또한 절단될 수 있고, 이로써 C-말단 서열을 자유롭게 선택하면서 펩티드 서열을 생산할 수 있었다.

펩티드의 N 말단이 프롤린으로 출발하는 것이 아니라, 그의 첫번째 N-말단 아미노산은 자유롭게 선택될 수 있는 것인 펩티드를 생산하는 데에도 본 발명의 방법이 또한 사용될 수 있다는 것을 입증하기 위해 서열 6을 가진 펩티드를 생산하였다. 이를 위해, 실시예 4에 따라 합성 유전자 AHe2AP18₂-P-G (서열 76)을 사용하여 서열 77을 가진 전구체 단백질을 생산하였다. 상기 전구체 단백질은, 오직 P18 펩티드의 N-말단 아미노산인 Pro-Gly, 및 C-말단의 Gly가 결실되어 있다는 점에서만 실시예 4의 전구체 단백질 서열 75와 상이하였다. 실시예 4에 기술되어 있는 조건하에서 클로닝 및 발효를 수행하였다.

하기 프로토콜에 따라 습식 바이오매스를 정제하였다:

- 1,500 bar의 고압 균질기에서 세포를 파괴시키고,

- 20분 동안 적어도 5,000 x g로 원심분리하고,

- P18 전구체 단백질을 포함하는 세척된 봉입체로 구성된 펠릿을 가수분해시키거나, 5% 농도의 H₃PO₄를 사용하여 절단하였다.

절단 조건:

i. 펠릿 각 1g에 대해 5　ml의 H₃PO₄를 사용하고,

ii. 균질화시키고,

iii. 16시간 동안 90℃에서 진탕시키면서 인큐베이션시켰다.

- 절단 반응 혼합물을 냉각시키고,

- 20분 동안 적어도 5,000 x g로 원심분리하고,

- 25% NaOH를 사용하여 pH를 4.0±0.5로 조정하여 중화시키고,

- 20분 동안 적어도 5,000 x g로 원심분리하고,

- 양이온 교환 크로마토그래피 (SP-세파로스 하이 퍼포먼스; GE 헬스케어)를 통해 펩티드를 상청액으로부터 정제하는데; 세척 완충제는 10　mM 아세트산나트륨 완충제 (pH　4) + 450　mM NaCl이고; 용리 완충제는 10　mM 아세트산나트륨 완충제 (pH　4) + 1,100　mM NaCl이고,

- 20분 동안 적어도 5,000 x g로 원심분리하고,

- pH= 6.0±0.5가 될 때까지 아세트산을 첨가하여 펩티드를 용해시키고,

- 동결건조시켰다.

동결건조된 생성물을 HPLC로 분석하였다: 이를 위해 생성물을 물 중에 1　mg/ml의 농도로 용해시키고, 역상 크로마토그래피 칼럼 (주피터 프로테오 4.6 x 250 mm; 페노메넥스)을 사용하여 분석하였다. 사용된 용리제는 물 중 0.1% 트리플루오로아세트산이었고, 선형 구배를 사용하여 이를 아세토니트릴 중 0.1% 트리플루오로아세트산으로 대체하였다. 280　nm에서 검출을 수행하였다 (도 8). 추가 분석을 위해, 주요 피크 분획을 수집하고, 그 안에 존재하는 물질을 추가로 연구하였다. 질량 분석법 (MALDI-TOF)을 통해 연구함으로써 질량이 2,300.6임을 밝혀냈고, 이는 서열 6 펩티드의 이론상의 질량과 일치하였다 (도 9).

실시예 6: 동결건조된 펩티드 P18 (서열 23)의 아미드화

일부 경우에서는 C 말단이 아미드화되는 것이 유리 카르복실 기일 때보다 펩티드 활성에 이로울 수 있다. 이를 입증하기 위해, 실시예 4의 동결건조된 P18 펩티드를 하기 프로토콜에 따라 아미드화하였다:

o 10 mg/ml P18 펩티드

o 30% EtOH

o 10 mM 2-(N-모르폴리노)에탄술폰산 (pH 5.0)

o 3 M 염화암모늄

o 2.5 mM N-히드록시숙신이미드

o 50 mM 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드

o 2 h 동안 RT에서 인큐베이션

o NaOH (pH 7.0)로 중화

루나(Luna) SCX 5μ 100 A 크로마토그래피 칼럼 (페노메넥스: 미국 캘리포니아주 토런스)을 사용하여 HPLC에 의해 아미드화된 샘플을 분석하였다: 사용된 용리제는 25% 아세토니트릴 중 20 mM KH₂PO₄ (pH 2.5)이고, 선형 구배를 사용하여 이를 20 mM KH₂PO₄ (pH 2.5); 25% 아세토니트릴 및 1 M KCl로 대체하였다. 280　nm에서 검출을 수행하였다 (도 10). 도 10에는 비교를 위해 화학적으로 합성되고 아미드화된 참조 펩티드와 (바켐 아게(Bachem AG: 스위스 부벤도르프)에 의해 주문 생산된) "P18" 펩티드 서열의 크로마토그램을 함께 도시하였다.

실시예 4에 기술되어 있는 바와 같이, 추가로 양이온 교환 크로마토그래피에 의해 펩티드를 정제하였다.

실시예 7: 아미드화가 통합된 펩티드 P18 (서열 23) 생산

아미드화된 P18 펩티드의 생산비 효율을 개선시키기 위해, 아미드화를 실시예 6에서와 같이, 펩티드 정제 후 수행하기보다는 후처리 방법에 통합시켰다. 이를 위해, 실시예 4에 따라 발효시켜 전구체 단백질 서열 75를 수득하고, 산성 절단에 의해 전구체 단백질로부터 펩티드를 유리시켰다.

이어서, 하기 단계를 수행하였다:

- 절단 반응 혼합물을 냉각시키고,

- 20분 동안 적어도 5,000 x g로 원심분리하고,

- 25% NaOH를 사용하여 pH를 10.5±0.5로 조정하고,

- 20분 동안 적어도 5,000 x g로 원심분리하고,

- 습식 매스 각 1 g에 대해 3　ml의 에탄올 중에 펠릿을 용해시키고,

- 원심분리하고; (희석시키면서) 상청액 중 펩티드를 확인하고,

- 하기 성분들을 혼합하고:

a. 12.5 ml의, 에탄올 중에 용해된 펩티드

b. 4.2 ml의 물

c. 400 ㎕의 500 mM 2-(N-모르폴리노)에탄술폰산을 첨가하고,

d. HCl을 사용하여 pH를 5.0으로 조정하고,

e. 2.14 g의 염화암모늄을 첨가하고,

f. 200 ㎕의 500 mM N-히드록시숙신이미드

g. 1 ml 1 MY의 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드

- 2 h 동안 RT에서 인큐베이션시키고,

- 양이온 교환 크로마토그래피 (SP-세파로스 하이 퍼포먼스; GE 헬스케어)를 통해 변형된 P18 펩티드를 정제하는데; 세척 완충제는 10　mM 아세트산나트륨 완충제 (pH　4) + 450　mM NaCl이고; 용리 완충제는 10　mM 아세트산나트륨 완충제 (pH　4) + 1,100　mM NaCl이고,

- 20분 동안 적어도 5,000 x g로 원심분리하고,

- 동결건조시켰다.

루나 SCX 5μ 100 A 크로마토그래피 칼럼 (페노메넥스: 미국 캘리포니아주 토런스)을 사용하여 HPLC에 의해 아미드화된 샘플을 분석하였다: 사용된 용리제는 25% 아세토니트릴 중 20 mM KH₂PO₄ (pH 2.5)이고, 선형 구배를 사용하여 이를 20 mM KH₂PO₄ (pH 2.5); 25% 아세토니트릴 및 1 M KCl로 대체하였다. 280　nm에서 검출을 수행하였다 (도 11). 도 11에는 비교를 위해 화학적으로 합성되고 아미드화된 참조 펩티드와 (바켐 아게(스위스 부벤도르프)에 의해 주문 생산된) "P18" 펩티드 서열의 크로마토그램을 함께 도시하였다.

본 발명에 따른 서열에 관한 개요

상기 기술된 구체적인 Pep 아미노산 서열 이외에도, 열거된 서열은 (예를 들어, 산 절단을 위한 잔기 "DP" 사이; 또는 히드록실아민 절단을 위한 잔기 "NG" 사이에) 특이적인 절단 서열을 부가함으로 인해, 또는 상기 절단으로부터 형성되는 남은 아미노산 잔기로 인해 C-말단에서 및/또는 N-말단에서 변경될 수 있다. 임의로, 스페이서 잔기, 예를 들어, G 잔기는 또한 절단 서열과 Pep 서열 사이에 추가로 삽입될 수 있다. 본 발명에 따라 생산된 Pep 서열의 산 또는 히드록실아민 절단으로부터 형성될 수 있는, 상기 Pep 서열에 대한 하기와 같은 변경에 대해서도 특별히 언급하여야 한다:

N-말단에서: PG-, P- 또는 G-잔기 부가;

C-말단에서: GD-; GN-; G-; N- 또는 D-잔기 부가.

특히, 상기와 같은 변경은 상기 Pep 서열 중 모든 단일 서열에 적용될 수 있고, 특히, 서열 6 내지 15, 29 내지 67 및 72의 것에 적용될 수 있다.

본원에서 인용되는 문헌의 개시 내용이 명백하게 참고된다.

SEQUENCE LISTING <110> BASF SE <120> Recombinant production of peptides <130> M/49358-PCT <160> 77 <170> PatentIn version 3.3 <210> 1 <211> 14 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 1 Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro 1 5 10 <210> 2 <211> 15 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 2 Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro 1 5 10 15 <210> 3 <211> 13 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 3 Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro 1 5 10 <210> 4 <211> 13 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 4 Gly Ser Val Val Val Val Val Val Val Val Ser Gly Pro 1 5 10 <210> 5 <211> 13 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 5 Gly Ser Val Val Ala Ala Val Val Ala Ala Ser Gly Pro 1 5 10 <210> 6 <211> 18 <212> PRT <213> Artificial <220> <223> P18 Peptide <400> 6 Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu Ala Lys 1 5 10 15 Lys Phe <210> 7 <211> 19 <212> PRT <213> Artificial <220> <223> Sequence Motif 1 <220> <221> MISC_FEATURE <222> (1)..(1) <223> Xaa = basic amino acid or hydrophobic amino acid different from Pro <220> <221> MISC_FEATURE <222> (2)..(2) <223> Xaa = basic amino acid or hydrophobic amino acid different from Pro <220> <221> MISC_FEATURE <222> (4)..(4) <223> Xaa = basic amino acid or hydrophobic amino acid different from Pro <220> <221> MISC_FEATURE <222> (5)..(5) <223> Xaa = basic amino acid or hydrophobic amino acid different from Pro <220> <221> MISC_FEATURE <222> (6)..(6) <223> Xaa = basic amino acid or hydrophobic amino acid different from Pro <220> <221> MISC_FEATURE <222> (10)..(10) <223> Xaa = missing or is Pro or Pro-Pro <220> <221> MISC_FEATURE <222> (13)..(13) <223> Xaa = basic amino acid or hydrophobic amino acid different from Pro <220> <221> MISC_FEATURE <222> (14)..(14) <223> Xaa = basic amino acid or hydrophobic amino acid different from Pro <220> <221> MISC_FEATURE <222> (15)..(15) <223> Xaa = basic amino acid or hydrophobic amino acid different from Pro <220> <221> MISC_FEATURE <222> (17)..(17) <223> Xaa = basic amino acid or hydrophobic amino acid different from Pro <400> 7 Xaa Xaa Lys Xaa Xaa Xaa Lys Ile Pro Xaa Lys Phe Xaa Xaa Xaa Ala 1 5 10 15 Xaa Lys Phe <210> 8 <211> 20 <212> PRT <213> Artificial <220> <223> Sequence Motif 2 <220> <221> MISC_FEATURE <222> (1)..(1) <223> Xaa = Lys, Arg or Phe <220> <221> MISC_FEATURE <222> (2)..(2) <223> Xaa = Lys or Trp <220> <221> MISC_FEATURE <222> (4)..(4) <223> Xaa = Leu or Lys <220> <221> MISC_FEATURE <222> (5)..(5) <223> Xaa = Phe or Leu <220> <221> MISC_FEATURE <222> (6)..(6) <223> Xaa = Leu or Lys <220> <221> MISC_FEATURE <222> (10)..(10) <223> Xaa = Pro or missing <220> <221> MISC_FEATURE <222> (11)..(11) <223> Xaa = Pro or missing <220> <221> MISC_FEATURE <222> (14)..(14) <223> Xaa = Leu or Lys <220> <221> MISC_FEATURE <222> (15)..(15) <223> Xaa = His or Lys <220> <221> MISC_FEATURE <222> (16)..(16) <223> Xaa = Ala, Leu, Val or Ser <220> <221> MISC_FEATURE <222> (18)..(18) <223> Xaa = Leu or Lys <400> 8 Xaa Xaa Lys Xaa Xaa Xaa Lys Ile Pro Xaa Xaa Lys Phe Xaa Xaa Xaa 1 5 10 15 Ala Xaa Lys Phe 20 <210> 9 <211> 19 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 9 Lys Trp Lys Leu Phe Lys Lys Ile Pro Pro Lys Phe Leu His Leu Ala 1 5 10 15 Lys Lys Phe <210> 10 <211> 18 <212> PRT <213> Artificial <220> <223> RP18 Peptide <400> 10 Arg Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu Ala Lys 1 5 10 15 Lys Phe <210> 11 <211> 18 <212> PRT <213> Artificial <220> <223> KKFP18 Peptide <400> 11 Phe Lys Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Ala Ala Lys 1 5 10 15 Lys Phe <210> 12 <211> 18 <212> PRT <213> Artificial <220> <223> KKLP18 Peptide <400> 12 Lys Trp Lys Leu Leu Lys Lys Ile Pro Lys Phe Lys Lys Leu Ala Leu 1 5 10 15 Lys Phe <210> 13 <211> 18 <212> PRT <213> Artificial <220> <223> AP18 Peptide <400> 13 Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Ala Ala Lys 1 5 10 15 Lys Phe <210> 14 <211> 18 <212> PRT <213> Artificial <220> <223> KFLP18 Peptide <400> 14 Lys Trp Lys Lys Phe Leu Lys Ile Pro Lys Phe Leu His Ala Ala Lys 1 5 10 15 Lys Phe <210> 15 <211> 18 <212> PRT <213> Artificial <220> <223> KLLP18 Peptide <400> 15 Lys Trp Lys Lys Leu Leu Lys Ile Pro Lys Phe Leu His Ala Ala Lys 1 5 10 15 Lys Phe <210> 16 <211> 14 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 16 Phe Glu Glu Ile Ser Glu Phe Leu Gln Ser Leu Glu Glu Phe 1 5 10 <210> 17 <211> 18 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 17 Glu Trp Glu Leu Phe Glu Glu Ile Ser Glu Phe Leu Gln Ser Leu Glu 1 5 10 15 Glu Phe <210> 18 <211> 18 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 18 Glu Leu Phe Glu Glu Leu Ala Glu Phe Leu Gln Gln Leu Glu Glu Phe 1 5 10 15 Ile Glu <210> 19 <211> 30 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 19 Leu Phe Glu Glu Leu Gln Glu Phe Leu Gln Ala Leu Glu Glu Leu Ala 1 5 10 15 Gln Phe Ala Leu Gln Phe Leu Ala Ala Phe Leu Gln Phe Ser 20 25 30 <210> 20 <211> 20 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 20 Pro Glu Ala His Val Met His Lys Val Ala Pro Arg Pro Gly Gly Gly 1 5 10 15 Ser Cys Gly Asp 20 <210> 21 <211> 456 <212> DNA <213> Artificial <220> <223> Synthetic gene <400> 21 ggatccatgg gttccagcgc tgcggcagct gcagcggctg caagtggtcc ggacccggag 60 gcacacgtta tgcacaaagt agcgccgcgt ccgggtggcg gttcttgtgg tgatccgggt 120 agctctgcgg ctgcagctgc ggctgcagct tccggtccgg acccggaagc tcacgttatg 180 cacaaggttg ctccacgccc gggcggtggc agctgcggtg atccaggcag ctctgctgcg 240 gctgcggcag cggccgcttc tggcccggac ccggaagctc acgttatgca caaagtggct 300 ccgcgtccgg gtggcggttc ctgcggcgat ccgggttctt ccgctgcagc ggctgcggcc 360 gcagcgtctg gcccggaccc ggaagcacat gttatgcata aagtagcgcc gcgtccgggc 420 ggtggctctt gcggtgaccc gggctaatga aagctt 456 <210> 22 <211> 304 <212> PRT <213> Artificial <220> <223> Polypeptide <220> <221> MISC_FEATURE <222> (1)..(15) <223> T7-Tag <400> 22 Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser Met Gly 1 5 10 15 Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Asp Pro Glu 20 25 30 Ala His Val Met His Lys Val Ala Pro Arg Pro Gly Gly Gly Ser Cys 35 40 45 Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly 50 55 60 Pro Asp Pro Glu Ala His Val Met His Lys Val Ala Pro Arg Pro Gly 65 70 75 80 Gly Gly Ser Cys Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala 85 90 95 Ala Ala Ser Gly Pro Asp Pro Glu Ala His Val Met His Lys Val Ala 100 105 110 Pro Arg Pro Gly Gly Gly Ser Cys Gly Asp Pro Gly Ser Ser Ala Ala 115 120 125 Ala Ala Ala Ala Ala Ala Ser Gly Pro Asp Pro Glu Ala His Val Met 130 135 140 His Lys Val Ala Pro Arg Pro Gly Gly Gly Ser Cys Gly Asp Pro Gly 145 150 155 160 Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Asp Pro Glu 165 170 175 Ala His Val Met His Lys Val Ala Pro Arg Pro Gly Gly Gly Ser Cys 180 185 190 Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly 195 200 205 Pro Asp Pro Glu Ala His Val Met His Lys Val Ala Pro Arg Pro Gly 210 215 220 Gly Gly Ser Cys Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala 225 230 235 240 Ala Ala Ser Gly Pro Asp Pro Glu Ala His Val Met His Lys Val Ala 245 250 255 Pro Arg Pro Gly Gly Gly Ser Cys Gly Asp Pro Gly Ser Ser Ala Ala 260 265 270 Ala Ala Ala Ala Ala Ala Ser Gly Pro Asp Pro Glu Ala His Val Met 275 280 285 His Lys Val Ala Pro Arg Pro Gly Gly Gly Ser Cys Gly Asp Pro Gly 290 295 300 <210> 23 <211> 21 <212> PRT <213> Artificial <220> <223> P18 Peptide <400> 23 Pro Gly Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu 1 5 10 15 Ala Lys Lys Phe Gly 20 <210> 24 <211> 450 <212> DNA <213> Artificial <220> <223> Synthetic gene <400> 24 ggatccatgg gctctagcgc tgcagcggca gctgccgcgg cttctggtcc gggtctgttc 60 gaagagatct ccgaattcct gcagtctctg gaagagttcg gtggcccggg ttcctctgca 120 gctgcggctg cagctgcggc aagcggccct gacccaggta aatggaaact gtttaagaaa 180 attccgaaat tcctgcatct ggctaaaaaa ttcggtgacc cgggttcttc cgctgcggct 240 gcagctgcag ctgcgtccgg tccgggtctg ttcgaagaaa tctccgaatt cctgcagtct 300 ctggaagaat tcggcggtcc gggctctagc gctgccgctg cagcggcagc ggcttccggc 360 ccggacccgg gcaaatggaa actgtttaag aaaatcccga aatttctgca tctggctaaa 420 aagttcggcg atccgggcta atgaaagctt 450 <210> 25 <211> 300 <212> PRT <213> Artificial <220> <223> Polypeptide <220> <221> MISC_FEATURE <222> (1)..(15) <223> T7-Tag <400> 25 Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser Met Gly 1 5 10 15 Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Leu Phe 20 25 30 Glu Glu Ile Ser Glu Phe Leu Gln Ser Leu Glu Glu Phe Gly Gly Pro 35 40 45 Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Asp Pro 50 55 60 Gly Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu Ala 65 70 75 80 Lys Lys Phe Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala 85 90 95 Ala Ser Gly Pro Gly Leu Phe Glu Glu Ile Ser Glu Phe Leu Gln Ser 100 105 110 Leu Glu Glu Phe Gly Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala 115 120 125 Ala Ala Ser Gly Pro Asp Pro Gly Lys Trp Lys Leu Phe Lys Lys Ile 130 135 140 Pro Lys Phe Leu His Leu Ala Lys Lys Phe Gly Asp Pro Gly Ser Ser 145 150 155 160 Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Leu Phe Glu Glu 165 170 175 Ile Ser Glu Phe Leu Gln Ser Leu Glu Glu Phe Gly Gly Pro Gly Ser 180 185 190 Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Asp Pro Gly Lys 195 200 205 Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu Ala Lys Lys 210 215 220 Phe Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser 225 230 235 240 Gly Pro Gly Leu Phe Glu Glu Ile Ser Glu Phe Leu Gln Ser Leu Glu 245 250 255 Glu Phe Gly Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala 260 265 270 Ser Gly Pro Asp Pro Gly Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys 275 280 285 Phe Leu His Leu Ala Lys Lys Phe Gly Asp Pro Gly 290 295 300 <210> 26 <211> 18 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 26 Pro Gly Glu Arg Lys Arg Leu Ile Gly Cys Ser Val Met Thr Lys Pro 1 5 10 15 Ala Gly <210> 27 <211> 516 <212> DNA <213> Artificial <220> <223> Synthetic gene <400> 27 ggatccatgg gctcttccgc tgcagccgct gcagctgcgg ctgcatccgg tccggaggca 60 gagccggaag acccgggtga acgtaaacgt ctgatcggtt gttctgtaat gaccaaacct 120 gctggtgatc cgggctccag cgctgcggct gcggcagctg cagcggcctc tggtccggag 180 gcggaaccgg aggacccggg tgaacgtaag cgcctgatcg gctgcagcgt gatgaccaaa 240 ccggctggtg atccgggttc ttccgcggct gcagctgcgg cagctgcagc tagtggtcca 300 gaagcagaac cagaagaccc gggtgaacgt aaacgtctga ttggttgctc tgttatgact 360 aaaccggctg gtgacccggg ctcttccgcg gctgccgcgg ctgcggctgc agctagcggc 420 ccggaagctg aaccggaaga tccgggcgaa cgcaagcgtc tgatcggctg ctccgttatg 480 actaaaccgg ctggcgaccc gggctaatga aagctt 516 <210> 28 <211> 344 <212> PRT <213> Artificial <220> <223> Polypeptide <220> <221> MISC_FEATURE <222> (1)..(15) <223> T7-Tag <400> 28 Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser Met Gly 1 5 10 15 Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Glu Ala 20 25 30 Glu Pro Glu Asp Pro Gly Glu Arg Lys Arg Leu Ile Gly Cys Ser Val 35 40 45 Met Thr Lys Pro Ala Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala 50 55 60 Ala Ala Ala Ala Ser Gly Pro Glu Ala Glu Pro Glu Asp Pro Gly Glu 65 70 75 80 Arg Lys Arg Leu Ile Gly Cys Ser Val Met Thr Lys Pro Ala Gly Asp 85 90 95 Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro 100 105 110 Glu Ala Glu Pro Glu Asp Pro Gly Glu Arg Lys Arg Leu Ile Gly Cys 115 120 125 Ser Val Met Thr Lys Pro Ala Gly Asp Pro Gly Ser Ser Ala Ala Ala 130 135 140 Ala Ala Ala Ala Ala Ala Ser Gly Pro Glu Ala Glu Pro Glu Asp Pro 145 150 155 160 Gly Glu Arg Lys Arg Leu Ile Gly Cys Ser Val Met Thr Lys Pro Ala 165 170 175 Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ser 180 185 190 Gly Pro Glu Ala Glu Pro Glu Asp Pro Gly Glu Arg Lys Arg Leu Ile 195 200 205 Gly Cys Ser Val Met Thr Lys Pro Ala Gly Asp Pro Gly Ser Ser Ala 210 215 220 Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Glu Ala Glu Pro Glu 225 230 235 240 Asp Pro Gly Glu Arg Lys Arg Leu Ile Gly Cys Ser Val Met Thr Lys 245 250 255 Pro Ala Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala 260 265 270 Ala Ser Gly Pro Glu Ala Glu Pro Glu Asp Pro Gly Glu Arg Lys Arg 275 280 285 Leu Ile Gly Cys Ser Val Met Thr Lys Pro Ala Gly Asp Pro Gly Ser 290 295 300 Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Glu Ala Glu 305 310 315 320 Pro Glu Asp Pro Gly Glu Arg Lys Arg Leu Ile Gly Cys Ser Val Met 325 330 335 Thr Lys Pro Ala Gly Asp Pro Gly 340 <210> 29 <211> 12 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 29 Asn Pro Ser Ser Leu Phe Arg Tyr Leu Pro Ser Asp 1 5 10 <210> 30 <211> 12 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 30 His Gly Gly Gly His Gly His Gly Gly Gly His Gly 1 5 10 <210> 31 <211> 12 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 31 His Tyr Pro Thr Leu Pro Leu Gly Ser Ser Thr Tyr 1 5 10 <210> 32 <211> 12 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 32 Ala Leu Ser Pro His Ser Ala Pro Leu Thr Leu Tyr 1 5 10 <210> 33 <211> 7 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 33 Ser Ala Gly Arg Leu Ser Ala 1 5 <210> 34 <211> 7 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 34 Thr Leu Pro Asn His Thr Val 1 5 <210> 35 <211> 7 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 35 His Thr Ser Lys Leu Gly Ile 1 5 <210> 36 <211> 16 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 36 Met Ser Pro His Pro His Pro Arg His His His Thr Gly Gly Gly Lys 1 5 10 15 <210> 37 <211> 17 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 37 Glu Ala His Val Met His Lys Val Ala Pro Arg Pro Gly Gly Gly Ser 1 5 10 15 Cys <210> 38 <211> 18 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 38 Ser Ser Lys Lys Ser Gly Ser Tyr Ser Gly Ser Lys Gly Ser Arg Arg 1 5 10 15 Ile Leu <210> 39 <211> 27 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 39 Pro Tyr Ala Tyr Met Lys Ser Arg Asp Ile Glu Ser Ala Gln Ser Asp 1 5 10 15 Glu Glu Val Glu Leu Arg Asp Ala Leu Ala Asp 20 25 <210> 40 <211> 20 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 40 Pro Gly Tyr Gly Tyr Tyr Lys Asn Arg Asn Ala Glu Pro Ala Ala Ala 1 5 10 15 Glu Ala Val Asp 20 <210> 41 <211> 20 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 41 Pro Gly Lys Ser Arg Asp Ile Glu Ser Ala Gln Ser Asp Glu Glu Val 1 5 10 15 Glu Leu Arg Asp 20 <210> 42 <211> 17 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 42 Pro Gly Lys Ser Arg Asp Ala Glu Pro Ala Ala Ala Gly Glu Glu Val 1 5 10 15 Asp <210> 43 <211> 33 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 43 Ser Ser Lys Lys Ser Gly Ser Tyr Ser Gly Ser Lys Gly Ser Arg Arg 1 5 10 15 Ile Leu Gly Gly Gly Asn Pro Ser Ser Leu Phe Arg Tyr Leu Pro Ser 20 25 30 Asp <210> 44 <211> 27 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 44 Met Ser Pro His Pro His Pro Arg His His His Thr Gly Gly Gly Asn 1 5 10 15 Pro Ser Ser Leu Phe Arg Tyr Leu Pro Ser Asp 20 25 <210> 45 <211> 31 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 45 Asn Pro Ser Ser Leu Phe Arg Tyr Leu Pro Ser Asp Gly Gly Gly Arg 1 5 10 15 Arg Glu Glu Trp Trp Asp Asp Arg Arg Glu Glu Trp Trp Asp Asp 20 25 30 <210> 46 <211> 27 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 46 Met Ser Pro His Pro His Pro Arg His His His Thr Gly Gly Gly His 1 5 10 15 Gly Gly Gly His Gly His Gly Gly Gly His Gly 20 25 <210> 47 <211> 33 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 47 Ser Ser Lys Lys Ser Gly Ser Tyr Ser Gly Ser Lys Gly Ser Arg Arg 1 5 10 15 Ile Leu Gly Gly Gly His Gly Gly Gly His Gly His Gly Gly Gly His 20 25 30 Gly <210> 48 <211> 33 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 48 Ser Ser Lys Lys Ser Gly Ser Tyr Ser Gly Ser Lys Gly Ser Arg Arg 1 5 10 15 Ile Leu Gly Gly Gly His Tyr Pro Thr Leu Pro Leu Gly Ser Ser Thr 20 25 30 Tyr <210> 49 <211> 28 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 49 Ser Ser Lys Lys Ser Gly Ser Tyr Ser Gly Ser Lys Gly Ser Arg Arg 1 5 10 15 Ile Leu Gly Gly Gly Ser Ala Gly Arg Leu Ser Ala 20 25 <210> 50 <211> 16 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 50 Arg Arg Glu Glu Trp Trp Asp Asp Arg Arg Glu Glu Trp Trp Asp Asp 1 5 10 15 <210> 51 <211> 21 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 51 Met Lys Gln Leu Ala Asp Ser Leu Met Gln Leu Ala Arg Gln Val Ser 1 5 10 15 Arg Leu Glu Ser Ala 20 <210> 52 <211> 21 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 52 Met Lys Gln Leu Ala Asp Ser Leu His Gln Leu Ala Arg Gln Val Ser 1 5 10 15 Arg Leu Glu His Ala 20 <210> 53 <211> 28 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 53 Leu Met Gln Leu Ala Arg Gln Met Lys Gln Leu Ala Asp Ser Leu Met 1 5 10 15 Gln Leu Ala Arg Gln Val Ser Arg Leu Glu Ser Ala 20 25 <210> 54 <211> 21 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 54 Met Lys Glu Leu Ala Asp Ser Leu Met Gln Leu Ala Arg Gln Val Asp 1 5 10 15 Arg Leu Glu Ser Ala 20 <210> 55 <211> 21 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 55 Met Lys Gln Leu Ala Asp Ser Leu His Gln Leu Ala His Gln Val Ser 1 5 10 15 His Leu Glu His Ala 20 <210> 56 <211> 9 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 56 Pro His Phe Arg Phe Ser Phe Ser Pro 1 5 <210> 57 <211> 9 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 57 Pro His Phe Ser Phe Ser Phe Ser Pro 1 5 <210> 58 <211> 9 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 58 Pro Ser Phe Arg Phe Ser Phe Ser Pro 1 5 <210> 59 <211> 21 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 59 Met Glu Glu Leu Ala Asp Ser Leu Glu Glu Leu Ala Arg Gln Val Glu 1 5 10 15 Glu Leu Glu Ser Ala 20 <210> 60 <211> 21 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 60 Met Lys Lys Leu Ala Asp Ser Leu Lys Lys Leu Ala Arg Gln Val Lys 1 5 10 15 Lys Leu Glu Ser Ala 20 <210> 61 <211> 9 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 61 Pro His Phe His Phe Ser Phe Ser Pro 1 5 <210> 62 <211> 9 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 62 Pro His Phe Ser Phe His Phe Ser Pro 1 5 <210> 63 <211> 21 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 63 Met Lys Gln Leu Ala Asp Ser Leu His Gln Leu Ala His Lys Val Ser 1 5 10 15 His Leu Glu His Ala 20 <210> 64 <211> 21 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 64 Glu Ile Ser Ala Leu Glu Lys Glu Ile Ser Ala Leu Glu Lys Glu Ile 1 5 10 15 Ser Ala Leu Glu Lys 20 <210> 65 <211> 21 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 65 Lys Ile Ser Ala Leu Lys Glu Lys Ile Ser Ala Leu Lys Glu Lys Ile 1 5 10 15 Ser Ala Leu Lys Glu 20 <210> 66 <211> 16 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 66 Arg Ala Asp Ala Arg Ala Asp Ala Arg Ala Asp Ala Arg Ala Asp Ala 1 5 10 15 <210> 67 <211> 21 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 67 Val Lys Val Lys Val Lys Val Lys Val Gly Pro Pro Thr Lys Val Lys 1 5 10 15 Val Lys Val Lys Val 20 <210> 68 <211> 6 <212> PRT <213> Artificial <220> <223> Peptide <400> 68 Glu Ala Glu Pro Glu Asp 1 5 <210> 69 <211> 22 <212> PRT <213> Artificial <220> <223> Peptide <400> 69 Pro Gly Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu 1 5 10 15 Ala Lys Lys Phe Gly Asp 20 <210> 70 <211> 19 <212> PRT <213> Artificial <220> <223> Peptide <400> 70 Pro Gly Glu Arg Lys Arg Leu Ile Gly Cys Ser Val Met Thr Lys Pro 1 5 10 15 Ala Gly Asp <210> 71 <211> 22 <212> PRT <213> Artificial <220> <223> Peptide <400> 71 Pro Gly Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu 1 5 10 15 Ala Lys Lys Phe Gly Asn 20 <210> 72 <211> 15 <212> PRT <213> Artificial <220> <223> Peptide <400> 72 Glu Arg Lys Arg Leu Ile Gly Cys Ser Val Met Thr Lys Pro Ala 1 5 10 15 <210> 73 <211> 12 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 73 Gly Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro 1 5 10 <210> 74 <211> 456 <212> DNA <213> Artificial <220> <223> Synthetic gene <400> 74 ggatccatgg gcgctgcagc ggcagctgcc gcggcttctg gtccgggtga gtgggagctg 60 ttcgaagaga tcagcgaatt cctgcagtct ctggaagagt tcggtggccc gggttcctct 120 gctgctgcgg ctgcagctgc ggcaggcccg ggcgacccag gtaaatggaa actgtttaag 180 aaaattccga aattcctgca tctggctaaa aaattcggtg acccgggttc ctctgctgcg 240 gctgcagctg cagctgcgtc cggtccgggt gaatgggaac tgttcgaaga aatctccgaa 300 ttcctgcagt ctctggaaga attcggcggt ccgggcgctg ccgctgcagc ggcagcggct 360 ggtcctggcg acccgggcaa atggaaactg tttaagaaaa tcccgaaatt tctgcatctg 420 gctaaaaagt tcggcgatcc gggctaatga aagctt 456 <210> 75 <211> 304 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 75 Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser Met Gly 1 5 10 15 Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Glu Trp Glu Leu 20 25 30 Phe Glu Glu Ile Ser Glu Phe Leu Gln Ser Leu Glu Glu Phe Gly Gly 35 40 45 Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Asp 50 55 60 Pro Gly Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu 65 70 75 80 Ala Lys Lys Phe Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala 85 90 95 Ala Ala Ser Gly Pro Gly Glu Trp Glu Leu Phe Glu Glu Ile Ser Glu 100 105 110 Phe Leu Gln Ser Leu Glu Glu Phe Gly Gly Pro Gly Ala Ala Ala Ala 115 120 125 Ala Ala Ala Ala Gly Pro Gly Asp Pro Gly Lys Trp Lys Leu Phe Lys 130 135 140 Lys Ile Pro Lys Phe Leu His Leu Ala Lys Lys Phe Gly Asp Pro Gly 145 150 155 160 Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Glu Trp Glu Leu 165 170 175 Phe Glu Glu Ile Ser Glu Phe Leu Gln Ser Leu Glu Glu Phe Gly Gly 180 185 190 Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Asp 195 200 205 Pro Gly Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu 210 215 220 Ala Lys Lys Phe Gly Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala 225 230 235 240 Ala Ala Ser Gly Pro Gly Glu Trp Glu Leu Phe Glu Glu Ile Ser Glu 245 250 255 Phe Leu Gln Ser Leu Glu Glu Phe Gly Gly Pro Gly Ala Ala Ala Ala 260 265 270 Ala Ala Ala Ala Gly Pro Gly Asp Pro Gly Lys Trp Lys Leu Phe Lys 275 280 285 Lys Ile Pro Lys Phe Leu His Leu Ala Lys Lys Phe Gly Asp Pro Gly 290 295 300 <210> 76 <211> 438 <212> DNA <213> Artificial <220> <223> Synthetic gene <400> 76 ggatccatgg gcgctgcagc ggcagctgcc gcggcttctg gtccgggtga gtgggagctg 60 ttcgaagaga tcagcgaatt cctgcagtct ctggaagagt tcggtggccc gggttcctct 120 gctgctgcgg ctgcagctgc ggcaggccca ggcgacaaat ggaaactgtt taagaaaatt 180 ccgaaattcc tgcatctggc taaaaaattc gacccgggtt cctctgctgc ggctgcagct 240 gcagctgcgt ccggtccggg tgaatgggaa ctgttcgaag aaatctccga attcctgcag 300 tctctggaag aattcggcgg tccgggcgct gccgctgcag cggcagcggc tggtcctggc 360 gacaaatgga aactgtttaa gaaaatcccg aaatttctgc atctggctaa aaagttcgat 420 ccgggctaat gaaagctt 438 <210> 77 <211> 278 <212> PRT <213> Artificial <220> <223> Polypeptide <400> 77 Met Gly Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Glu Trp 1 5 10 15 Glu Leu Phe Glu Glu Ile Ser Glu Phe Leu Gln Ser Leu Glu Glu Phe 20 25 30 Gly Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro 35 40 45 Gly Asp Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu 50 55 60 Ala Lys Lys Phe Asp Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala 65 70 75 80 Ala Ser Gly Pro Gly Glu Trp Glu Leu Phe Glu Glu Ile Ser Glu Phe 85 90 95 Leu Gln Ser Leu Glu Glu Phe Gly Gly Pro Gly Ala Ala Ala Ala Ala 100 105 110 Ala Ala Ala Gly Pro Gly Asp Lys Trp Lys Leu Phe Lys Lys Ile Pro 115 120 125 Lys Phe Leu His Leu Ala Lys Lys Phe Asp Pro Gly Ala Ala Ala Ala 130 135 140 Ala Ala Ala Ala Ser Gly Pro Gly Glu Trp Glu Leu Phe Glu Glu Ile 145 150 155 160 Ser Glu Phe Leu Gln Ser Leu Glu Glu Phe Gly Gly Pro Gly Ser Ser 165 170 175 Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Asp Lys Trp Lys Leu 180 185 190 Phe Lys Lys Ile Pro Lys Phe Leu His Leu Ala Lys Lys Phe Asp Pro 195 200 205 Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Glu 210 215 220 Trp Glu Leu Phe Glu Glu Ile Ser Glu Phe Leu Gln Ser Leu Glu Glu 225 230 235 240 Phe Gly Gly Pro Gly Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly 245 250 255 Asp Lys Trp Lys Leu Phe Lys Lys Ile Pro Lys Phe Leu His Leu Ala 260 265 270 Lys Lys Phe Asp Pro Gly 275

Claims

하기 일반식의 원하는 펩티드 (Pep) 요소 및 보조 펩티드 (Aux) 요소로 구성된 절단가능한 반복 서열을 포함하는 전구체 단백질.
<일반식>
(Pep-Aux)_x 또는
(Aux-Pep)_x
상기 식에서, x는 >1이고,
여기서, Aux 요소는 동일하거나 상이하고, 상기 전구체 단백질에 자기-조립 특성을 부여하는 아미노산 서열 요소를 포함하고;
Pep 요소는 동일하거나 상이하고, 동일하거나 상이한 펩티드 분자의 아미노산 서열을 포함한다.
제1항에 있어서, 요소 Pep 및 Aux가 펩티드결합으로 서로 연결되어 있고, 펩티드 연결이 화학적으로 또는 효소적으로 특이적으로 절단될 수 있는 것인 전구체 단백질.
제1항 또는 제2항에 있어서, 실온에서 0.2 M NaOH에 의해 1시간 이내에 용해되지 못하거나, 또는 2 M 우레아 또는 1 M 구아니디늄 히드로클로라이드에 의해 10분 이내에 용해되지 못하는 안정한 회합물을 형성하는 전구체 단백질.
제1항 내지 제3항 중 어느 한 항에 있어서, 적어도 하나의 Aux 요소가 적어도 8개의 아미노산으로 구성된 적어도 하나의 서열을 포함하는 자기-조립 펩티드 (SA) 요소를 포함하며, 이는 적어도 50%의 알라닌 잔기, 적어도 50%의 발린 잔기 또는 적어도 50%의 글루타민 잔기를 포함하거나, 또는 그의 적어도 80%가 이들 잔기 중 적어도 하나로 이루어진 것인 전구체 단백질.
제4항에 있어서, SA 요소가 하기 서열 모티프 중 적어도 하나를 포함하는 것인 전구체 단백질.
A_n (모티프 1)
(GA)_m (모티프 2)
V_n (모티프 3)
(VA)_m (모티프 4) 및
(VVAA)_o(모티프 5)
여기서, A는 알라닌이고, G는 글리신이고, V는 발린이고, n은 정수 2 내지 12이고, m은 정수 2 내지 10이고, o은 정수 1 내지 6이다.
제4항 또는 제5항에 있어서, SA 요소가 아미노산 서열 중 서열 1 내지 5, 및 서열 73으로부터 선택되는 아미노산 서열을 포함하는 것인 전구체 단백질.
제1항 내지 제6항 중 어느 한 항에 있어서, 적어도 하나의 Aux 펩티드가 보호 펩티드 (SU) 요소를 추가로 포함하는 것인 전구체 단백질.
제7항에 있어서, SU 요소가 음으로 하전된 아미노산 잔기를 높은 비율로 갖는 것인 전구체 단백질.
제8항에 있어서, 전구체 단백질 중의 SU 요소가 양친매성 나선 구조를 형성할 수 있는 것인 전구체 단백질.
제9항에 있어서, SU 요소가, 양친매성 알파-나선을 형성할 수 있는, 펩티드결합으로 연결된 적어도 7개의 아미노산으로 구성된 서열 절편을 포함하는 양친매성 펩티드이고, 여기서, 상기 나선의 아미노산 잔기는 그의 수직 투영에서 나선의 소수성 반쪽 및 친수성 반쪽으로 분리되고, 나선의 소수성 반쪽은 (수직 투영에서) 적어도 3개의 인접한, 동일하거나 상이한 소수성 아미노산 잔기를 가지며, 나선의 친수성 반쪽은 (수직 투영에서) 적어도 3개의 인접한, 동일하거나 상이한 친수성 아미노산 잔기를 갖는 것인 전구체 단백질.
제8항 내지 제10항 중 어느 한 항에 있어서, SU 요소 중 하전된 아미노산 잔기의 비율이, 전구체 단백질의 전체 순전하가 pH=7에서 -10 초과 내지 +10 미만이 되도록 선택되는 것인 전구체 단백질.
제8항 내지 제11항 중 어느 한 항에 있어서, SU 요소가 아미노산 서열 중 서열 16 내지 서열 19 및 서열 68로부터 선택되는 아미노산 서열을 포함하는 것인 전구체 단백질.
제1항 내지 제12항 중 어느 한 항에 있어서, Pep 요소가 양이온성의 항미생물성 펩티드 서열을 포함하는 것인 전구체 단백질.
제13항에 있어서, Pep 요소가 양이온성 아미노산 서열 중 서열 6 내지 서열 15, 서열 23, 서열 26 및 서열 69 내지 서열 72로부터 선택되는 아미노산 서열을 포함하는 것인 전구체 단백질.
제1항 내지 제6항 중 어느 한 항에 있어서, Pep 요소가 아미노산 서열 중 서열 20 또는 서열 29 내지 67로부터 선택되는 아미노산 서열을 포함하는 것인 전구체 단백질.
제1항 내지 제15항 중 어느 한 항에 있어서, Aux 요소가 서로 독립적으로 SA, SA-SU, SU-SA, SA-SU-SA 및 SU-SA-SU의 의미 중 임의의 것을 가지며, 여기서 요소 SA 및 SU는 펩티드결합으로 서로 연결되어 있고, Aux 요소가 말단에서 적어도 하나의 Pep 요소에 펩티드결합으로 연결되어 있고, Pep 요소에의 상기 펩티드 연결이 화학적으로 또는 효소적으로 특이적으로 절단될 수 있는 것인 전구체 단백질.
제1항 내지 제16항 중 어느 한 항에 따른 적어도 하나의 전구체 단백질을 코딩하는 핵산 서열.
제17항에 있어서, 서열 21, 24, 27, 74 및 76의 서열인 적어도 하나의 코딩 서열을 포함하는 핵산 서열.
적어도 하나의 조절 핵산 서열에 작동적으로 연결된, 제17항 또는 제18항에 따른 적어도 하나의 핵산 서열을 포함하는 발현 카세트.
제17항 또는 제18항에 따른 핵산 서열 또는 제19항에 따른 발현 카세트를 포함하는, 진핵 또는 원핵 숙주를 형질전환시키기 위한 재조합 벡터.
a) 제1항 내지 제16항 중 어느 한 항에 따른 전구체 단백질을 생산하는 단계; 및
b) 전구체 단백질로부터 Pep 펩티드를 제거하는 단계
를 포함하는, 원하는 펩티드 (Pep)를 생산하는 방법.
제21항에 있어서, 전구체 단백질이 제19항에 따른 적어도 하나의 벡터를 보유하는 재조합 미생물에서 생산되는 것인 방법.
제22항에 있어서, 전구체 단백질이 재조합 이. 콜라이(E. coli) 균주에서 생산되는 것인 방법.
제21항 내지 제23항 중 어느 한 항에 있어서, 발현된 전구체 단백질을, 임의로는 상기 단백질이 안정적으로 회합된 형태로 전환된 후에, 정제하고, 화학적으로 또는 효소적으로 절단하여 원하는 펩티드 (Pep)를 유리시키는 것인 방법.
하기 일반식의 원하는 펩티드 (Pep) 요소 및 보조 펩티드 (Aux') 요소로 구성된 절단가능한 서열을 포함하는 전구체 단백질.
<일반식>
(Pep-Aux')_x 또는
(Aux'-Pep)_x
상기 식에서, x는 >1이고,
여기서, Aux' 요소는 동일하거나 상이하고, 양친매성의 알파-나선-형성 펩티드를 포함하고, 상기 양친매성 펩티드는 양친매성 알파-나선을 형성할 수 있는, 펩티드결합으로 연결된 적어도 7개의 아미노산으로 구성된 서열 절편을 포함하고, 여기서, 상기 나선의 아미노산 잔기는 그의 수직 투영에서 나선의 소수성 반쪽 및 친수성 반쪽으로 분리되고, 나선의 소수성 반쪽은 (수직 투영에서) 적어도 3개의 인접한, 동일하거나 상이한 소수성 아미노산 잔기를 가지며, 나선의 친수성 반쪽은 (수직 투영에서) 적어도 3개의 인접한, 동일하거나 상이한 친수성 아미노산 잔기를 갖고;
Pep 요소는 동일하거나 상이하고, 동일하거나 상이한 펩티드 분자의 아미노산 서열을 포함한다.
제25항에 있어서, Aux' 요소가 제4항 내지 제6항 중 어느 한 항에서 정의된 바와 같은 적어도 하나의 자기-조립 펩티드 (SA) 요소를 포함하는 것인 전구체 단백질.
제25항 또는 제26항에 있어서, 원하는 펩티드 (Pep)가 양이온성의 항미생물성 펩티드이고, Aux' 요소가 양친매성 알파-나선을 형성하는 음이온성 펩티드인 것인 전구체 단백질.
양친매성 펩티드가 양친매성 알파-나선을 형성할 수 있는, 펩티드결합으로 연결된 적어도 7개의 아미노산으로 구성된 서열 섹션을 포함하고, 여기서, 상기 나선의 아미노산 잔기는 그의 수직 투영에서 나선의 소수성 반쪽 및 친수성 반쪽으로 분리되고, 나선의 소수성 반쪽은 (수직 투영에서) 적어도 3개의 인접한, 동일하거나 상이한 소수성 아미노산 잔기를 가지며, 나선의 친수성 반쪽은 (수직 투영에서) 적어도 3개의 인접한, 동일하거나 상이한 친수성 아미노산 잔기를 갖는 것인, 양친매성 펩티드와는 상이한 항미생물성의 원하는 펩티드를 재조합적으로 생산하기 위한, 보호 펩티드로서의 양친매성 펩티드의 용도.
제28항에 있어서, 원하는 펩티드 (Pep)가 양이온성의 항미생물성 펩티드이고, Aux' 요소가 양친매성 알파-나선을 형성하는 음이온성 펩티드인 용도.