KR20220005566A - 에이에스엑스 특이성 단백질 리가제 및 그의 용도 - Google Patents

에이에스엑스 특이성 단백질 리가제 및 그의 용도 Download PDF

Info

Publication number
KR20220005566A
KR20220005566A KR1020217039897A KR20217039897A KR20220005566A KR 20220005566 A KR20220005566 A KR 20220005566A KR 1020217039897 A KR1020217039897 A KR 1020217039897A KR 20217039897 A KR20217039897 A KR 20217039897A KR 20220005566 A KR20220005566 A KR 20220005566A
Authority
KR
South Korea
Prior art keywords
gly
leu
ser
ala
val
Prior art date
Application number
KR1020217039897A
Other languages
English (en)
Inventor
제임스 피 탐
줄리엔 레스카
무신야 히
아바스 엘 사히리
추안 파 리우
사이드 후
Original Assignee
난양 테크놀러지컬 유니버시티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 난양 테크놀러지컬 유니버시티 filed Critical 난양 테크놀러지컬 유니버시티
Publication of KR20220005566A publication Critical patent/KR20220005566A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/63Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N11/00Carrier-bound or immobilised enzymes; Carrier-bound or immobilised microbial cells; Preparation thereof
    • C12N11/02Enzymes or microbial cells immobilised on or in an organic carrier
    • C12N11/06Enzymes or microbial cells immobilised on or in an organic carrier attached to the carrier via a bridging agent
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Botany (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

본 발명은 효소 기술의 기술 분야에 있으며 구체적으로 Asx-특이성 리가제 및 사이클라제 활성을 갖는 효소 및 이를 암호화하는 핵산뿐만 아니라 상기 효소의 제조 방법에 관한 것이다. Asx-특이성 리가제 및 사이클라제를 갖는 효소는 제비꽃과(Violaceae)의 식물로부터 단리된다. 또한 이들 효소의 방법 및 용도를 포함한다.

Description

에이에스엑스 특이성 단백질 리가제 및 그의 용도
관련 출원에 대한 상호참조
본원은 2019년 5월 7일자로 출원된 싱가포르 특허 출원 제 10201904085W 호 및 2019년 11월 19일자로 출원된 싱가포르 특허 출원 제 10201910861S 호의 우선권의 이득을 주장하며, 이들 출원의 내용은 모든 목적을 위해 전체가 본원에 참고로 인용된다.
발명의 분야
본 발명은 효소 기술의 기술 분야에 있으며 구체적으로 Asx-특이성 리가제 및 사이클라제 활성을 갖는 효소 및 이를 암호화하는 핵산뿐만 아니라 상기 효소의 제조 방법에 관한 것이다. 또한 이들 효소의 방법 및 용도를 포함한다.
펩티드와 단백질의 헤드-투-테일 거대고리(head-to-tail macrocyclization)화는 구조를 제한하고 단백질 분해에 대한 대사 안정성을 향상시키는 전략으로 사용되었다. 또한, 제한된 거대고리 형태는 약물학적 활성과 경구 생체이용률을 향상시킬 수도 있다. 대부분의 펩티드와 단백질은 선형 쇄로 생성되지만, 6 내지 78개 잔기의 원형 펩티드는 다양한 유기체에서 자연적으로 발생한다. 이러한 고리형 펩티드는 일반적으로 열 변성 및 단백질 분해에 대해 높은 저항성을 나타내며 사이토카인, 히스타틴, 유비퀴틴 C-말단 하이드롤라제, 코노톡신 및 브래디키닌-접목된 사이클로티드의 고리화에 대한 최근의 성공에 의해 입증된 바와 같이, 단백질 공학의 새로운 경향에 영감을 주었다. 또한, 발리노마이신, 그라미시딘 S 및 사이클로스포린을 포함한 고리형 펩티드가 치료제로서 사용되었다.
지금까지 펩티드의 고리화에는 일반적으로 화학적 방법이 사용된다. 한 가지 가능한 전략은 고유의 화학적 결찰(ligation)이다. 이 방법은 N-말단 시스테인 및 C-말단 티오에스테르를 필요로 하며, 이러한 요구는 시스테인을 함유하지 않는 펩티드에 대한 적용을 제한한다. 더욱 또한, 특히 큰 펩티드와 단백질의 경우 화학적 방법이 항상 가능한 것은 아니다.
천연 사이클라제를 사용하는 효소적 방법이 이상적이기는 하지만 현재 알려진 펩티드 사이클라제는 극소수에 불과하며 여러 가지 이유로 충분히 활용되지 못하고 있다.
최근에 사이클로티드-생산 식물인 클리토리아 테르나테아(Clitoria ternatea)에서 새로운 사이클라제인 부텔라제-1을 발견하여, 독특한 유형의 아스파라지닐 엔도펩티다제(AEP)가 사이클로티드의 선형 전구체를 고리화하는 가공 효소임이 입증되었다(Nguyen GKT, et al.(2014)). Nat Chem Biol 10(9):732-738). AEP(또는 레구메인)는 클랜 CD 하의 서브패밀리 C13(EC 3.4.22.34)에 속하는 시스테인 프로테아제이다. 하이드롤라제인 AEP와 비교하여, 부텔라제-1은 AEP의 효소적 방향을 역전시키고 아미노분해를 강하게 촉진하여 펩티드-결합 형성을 촉매화한다. 생물분석에 따르면 부텔라제-1은 사이클라제일 뿐만 아니라 Asn/Asp와, Pro를 제외한 모든 아미노산과의 사이에 펩티드 결합을 형성하여 생물분자를 결찰시킬 수 있는 효율적인 펩티드 리가제 효소이며, 1,340,000 M-1s-1의 현재까지 보고된 가장 높은 촉매 효율을 갖는다. 부텔라제-1은 단백질 및 펩티드 결찰, 변형, 고리화, 태깅 및 생세포 표지화를 위한 다용도 단백질 공학 도구이며, 이는 국제 특허 출원 WO 2015/163818 A1에 그 용도를 포함하여 자세히 기재되었다. 펩티드 아스파라지닐 리가제(PAL)로 지정된 이러한 부텔라제-1 유사 펩티드 리가제는 항체-약물 접합체와 같은 생물요법제의 연결-특이적 및 부위-특이적 단백질 변형 및 정밀 바이오제조에 유용한 생화학적 및 생물공학적 도구이다.
AEP 및 PAL은 일반적으로 ~10-kDa 프로-도메인, 5개의 α-나선으로 둘러싸인 6개의 β-가닥으로 형성된 활성 ~32-kDa 코어 도메인, 및 6개의 단단히 묶인 나선으로 형성된 15-kDa C-말단 캡 도메인으로 이루어지는 프로효소로 표현된다. AEP와 PAL은 모두 자가분해성 성숙화를 위해 산성 pH에서 본래적인 프로테아제 활성을 나타낸다. 그들의 생합성 과정은 유사하며, 리소솜 및 용해성 액포와 같은 산성 세포내 구획에서 자가분해 활성화를 수반한다. 시험관 내에서, 활성화는 대개 pH 4 내지 5에서 수행된다. 산성 활성화 후 주요한 구조적 변화는 C-말단 캡 도메인의 절단 및 해리이며, 이는 코어 도메인의 촉매 부위를 노출시킨다. 캡 및 코어 도메인의 재결찰은, 두 도메인이 손상되지 않고 절단 후 매우 근접하게 유지되는 거의 중성 pH에서 보고된다.
식물 AEP는 액포의 산성 환경에서 촉발되는 단백질 분해 활성을 통해 단백질 분해, 성숙화, 예정세포사 및 숙주 방어에서 중요한 역할을 한다. 부텔라제 2, OaAEP2 및 HaAEP1(해바라기 헬리안투스 안누우스(Helianthus annuus))과 같은 AEP는 중성 pH에서조차, 매우 낮은 수준의 리가제 활성과 함께 프로테아제 활성을 우세하게 나타낸다. 몇몇 AEP는 거의 중성 pH(6-7.5)에서 AEP 인식 신호를 전달하는 펩티드 기질의 결찰 및 가수분해 생성물을 모두 촉매화한다. 매우 드물게, AEP는 원형 순열을 매개함으로써, 콘카나발린 A의 성숙화에서와 같이 펩티드 결합 파괴 및 형성을 모두 수반하는 펩티드 이어맞추기를 매개한다. 이러한 "이중-기능성" 또는 "우세한" AEP와 대조적으로, 부텔라제 1 및 OaAEP1b와 같은 PAL은 거의 중성 pH에서 가수분해 생성물이 본질적으로 없는 결찰 생성물의 형성을 촉매화하고 이들의 리가제 활성은 약한 산성 조건하에서조차 우세하다(pH <6).
현재, 소수의 상기와 같은 PAL만이 식별되었다. 여기에는 원형 PAL 부텔라제-1, 및 각각 다른 사이클로티드-생산 식물 올덴란디아 아피니스(Oldenlandia affinis) 및 하이반투스 엔네아스페르무스(Hybanthus enneaspermus)로부터 식별된 후속적으로 발견된 부텔라제-1 유사 효소, OaAEP1b(Harris KS, et al.(2015) Nat Commun 6(1):10199) 및 HeAEP3(Jackson MA, et al.(2018) Nat Commun 9(1):241123)이 포함된다.
지금까지, AEP와 PAL을 구별하는 분자 기전은 공지되어 있지 않다. 프로효소 및 활성형태 모두를 포함하는 다수의 식물 AEP 결정 구조의 공개에도 불구하고, 프로테아제 또는 리가제로서의 특성을 뒷받침하는 구조적 결정인자는 여전히 해결되지 않고 있다. 두 극단의 효소는 r.m.s.d < 1 Å으로 동일한 구조를 공유한다(예를 들어 OaAEP1b 및 HaAEP1).
리가제/사이클라제 활성이 매우 바람직하며 펩티드 결찰 및 고리화를 위한 분자 도구로 안정적으로 사용될 수 있는 신규의 리가제/사이클라제가 당해 분야에 필요하기 때문에, PAL 및 AEP의 효소 방향성을 제어하는 결정인자를 식별하는 것이, 특정 요구에 대해 이러한 효소를 의도적으로 맞춤화할 수 있는 기회를 제공하기 때문에, 도움이 될 것이다.
본 발명의 발명자는 AEP 및 PAL의 효소 활성이 촉매 중심 부근의 핵심 위치의 미묘한 차이에 의해 조절됨을 발견하였다. 이들 국소적인 변경은 수 분자(가수분해로 이어짐) 또는 유입 친핵체(결찰로 이어짐)의 S-아실 효소 중간체로의 접근을 제어한다. 2개의 사이클로티드-생산 식물 비올라 예도엔시스(Viola yedoensis)(var. phillipica) 및 비올라 카나덴시스(Viola canadensis)로부터의 일련의 추정적인 AEP 및 PAL을 연구하고 재조합 효소를 사용하여 리가제 촉매 활성을 담당하는 분자 기전을 조사함으로써, 2개의 추정적인 리가제 활성 결정인자(LAD)를 식별할 수 있었으며, 구조 비교, MD 시뮬레이션 및 부위-지향된 돌연변이유발에 의해 검증하였다. 이러한 결과는 AEP의 PAL로의 전환을 허용하는 분자 기전을 설명하며 새로운 리가제의 발견 및 조작에 유용한 도구를 제공한다. 이러한 연구의 과정에서, 효율적인 재조합 발현을 허용하고 높은 고리화 활성을 보이는 추가의 유용한 PAL이 식별되었다.
따라서, 첫 번째 태양에서, 본 발명은
(i) 서열번호 1에 제시된 바와 같은 아미노산 서열;
(ii) 전체 길이에 걸쳐 서열번호 1에 제시된 아미노산 서열과 적어도 60, 바람직하게는 적어도 70, 보다 바람직하게는 적어도 80, 가장 바람직하게는 적어도 90% 서열 일치성을 공유하는 아미노산 서열;
(iii) 전체 길이에 걸쳐 서열번호 1에 제시된 아미노산 서열과 적어도 80, 바람직하게는 적어도 90, 보다 바람직하게는 적어도 95% 서열 상동성을 공유하는 아미노산 서열; 또는
(iv) (i) 내지 (iii) 중 어느 하나의 단편
을 포함하거나 또는 이들로 이루어지는 단백질 리가제, 바람직하게는 사이클라제 활성을 갖는 단리된 폴리펩티드에 관한 것이다.
서열번호 1로 이루어지는 폴리펩티드를 또한 본원에서 "VyPAL2" 또는 "VyPAL2 활성형/도메인"이라 칭한다.
또 다른 태양에서, 본 발명은 또한 본원에 기재된 폴리펩티드를 암호화하는 핵산 분자뿐만 아니라, 상기와 같은 핵산을 함유하는 벡터, 특히 복사용 벡터 또는 발현 벡터에 관한 것이다.
추가의 태양에서, 본 발명은 또한 본원에서 고려되는 바와 같은 핵산 또는 본원에서 고려되는 바와 같은 벡터를 함유하는 숙주 세포, 바람직하게는 비-인간 숙주 세포에 관한 것이다. 숙주 세포는 곤충 세포, 예를 들어 Sf9(스포도프테라 프루기페르다(Spodoptera frugiperda)) 세포일 수 있다.
본 발명의 더욱 추가의 태양은 본원에서 고려되는 숙주 세포를 배양하고; 배양 배지로부터 또는 숙주 세포로부터 폴리펩티드를 단리함을 포함하는, 본원에 기재된 바와 같은 폴리펩티드의 제조 방법이다.
더욱 추가의 태양에서, 본 발명은 단백질 결찰, 특히 하나 이상의 펩티드(들)의 고리화를 위한 본원에 기재된 폴리펩티드의 용도에 관한 것이다.
더욱 또 다른 태양에서, 본 발명은 펩티드의 고리화 방법에 관한 것이며, 방법은 상기 펩티드를 상기 펩티드의 고리화를 허용하는 조건하에서 본 발명의 용도와 관련하여 상술한 폴리펩티드와 배양함을 포함한다.
더욱 추가의 태양에서, 본 발명은 적어도 2개의 펩티드를 결찰하는 방법에 관한 것이며, 방법은 상기 펩티드를 상기 펩티드의 결찰을 허용하는 조건하에서 본 발명의 용도와 관련하여 상술한 폴리펩티드와 배양함을 포함한다.
또 다른 태양에서, 본 발명은 본 발명의 단리된 폴리펩티드가 고정화되는 고체 지지체 물질뿐만 아니라 그의 용도 및 상기와 같은 기질을 사용하는 방법에 관한 것이다.
또 다른 태양에서, 본 발명은 또한 본원에 기재된 바와 같은 단백질 리가제 및/또는 사이클라제 활성을 갖는 폴리펩티드를 암호화하는 핵산 분자를 포함하는 트랜스제닉 유기체, 예를 들어 식물을 포함한다. 폴리펩티드는 바람직하게는 상기 유기체 중에 자연적으로 존재하지 않는다. 상응하게, 본 발명은 또한 본 발명에 따른 이종 폴리펩티드를 발현하는 트랜스제닉 유기체, 바람직하게는 식물을 특징으로 한다.
더욱 또 다른 태양에서, 본 발명은 아스파라지닐 엔도펩티다제(AEP) 활성을 갖는 폴리펩티드의 단백질 리가제 활성을 증가시키는 방법을 또한 포함하며, 방법은 서열번호 1의 126번 위치에 상응하는 위치의 아미노산 잔기를 A 또는 G 잔기로 치환시키는 단계를 포함한다. 이들 구현예에서, 서열번호 1의 127번 위치에 상응하는 위치의 아미노산 잔기를 126/127번 위치의 서열이 GA 또는 AP 또는 AA, 바람직하게는 GA 또는 AP이도록 선택할 수 있다. 서열번호 1의 126번 위치에 상응하는 위치의 아미노산이 G인 경우, 서열번호 1의 127번 위치에 상응하는 위치의 아미노산은 P가 아닌 것이 바람직하다.
더욱 추가의 태양에서, 본 발명은 또한 단백질 리가제 활성을 갖는 폴리펩티드의 생성 방법에 관한 것이며, 방법은
(i) 아스파라지닐 엔도펩티다제(AEP) 활성을 갖는 폴리펩티드를 제공하고;
(ii) 아스파라지닐 엔도펩티다제(AEP) 활성을 갖는 폴리펩티드에 하나 이상의 아미노산 치환을 도입시키고; 여기에서 상기 치환이 서열번호 1의 126번 위치에 상응하는 위치의 아미노산 잔기를 A 또는 G 잔기로 치환시키고, 임의로 서열번호 1의 127번 위치에 상응하는 위치의 아미노산 잔기를 서열번호 1의 126/127번 위치에 상응하는 위치의 아미노산 서열이 GA, AA 또는 AP, 바람직하게는 GA 또는 AP이도록 P 또는 A 잔기로 치환시킴
을 포함한다.
도 1은 재조합 VyPAL1-3 및 VyAEP1의 효소 활성을 도시한다. (A) GN14-SL(서열번호 59)의 리가제-매개된 고리화의 반응식. (B) 상이한 반응 PH 값하에서 VyPAL2-매개된 고리화의 분석학적 HPLC 및 MALDI-TOF 질량 분광분석 데이터. *: 라셈화된 합성 GN14-SL. MALDI-TOF MS는 선형 종보다 고리형 cGN14에 더 민감함에 유의한다. (C) RP-HPLC를 사용하여 분석된 각 효소의 생성물 비 및 반응 수율의 정량적인 요약. 각각의 반응에 대해서, 1:500 몰비의 정제된 활성 효소:GN14-SL을 혼합하고 37℃에서 10분간 반응시켰다. 평균 수율 및 오차 막대를 3회 중복 수행된 실험으로부터 계산하였다.
도 2는 (A) 서열번호 48 및 59-77에 제시된 바와 같은 Vy 및 Ct 사이클로티드로부터 유래된 변성된 고유 인식 동기를 갖는 기질, (B) P1'번 위치에 20개의 상이한 아미노산을 갖는 기질(X = 20 AA; 서열번호 78), (C) P2'번 위치에 20개의 상이한 아미노산을 갖는 기질(서열번호 79)에 대한 VyPAL2의 기질 특이성을 도시한다. 모든 반응을 pH 6.5, 37℃에서 10분간 활성 VyPAL2:기질 = 1:500의 몰비로 수행하였다. 수율을 RP-HPLC를 사용하여 정량적으로 분석하였다.
도 3은 VyPAL2 및 부텔라제 1의 효소 반응속도론을 도시한다. 펩티드 기질: GISTKSIPPISYRNSLAN(서열번호 60)을 사용하는 HPLC-기반 반응속도론 연구. 다량의 50 nM 정제된 활성 VyPAL2(또는 식물(15)로부터 추출된 부텔라제 1)를 각각의 반응에 사용하였다. 매 시점에서 고리화 생성물의 양을 분석학적 RP-HPLC를 사용하여 측정하였다. 3회의 반복 실험의 평균 초기 속도(V0)를 미카엘리스-멘텐 곡선 플롯팅에 사용하였다.
도 4는 VyPAL3의 S1' 포켓에서 레트로-공학 실험을 묘사한다. 모든 반응을 pH 범위 4.5 내지 8.0에서 수행하였다. 가수분해산물 GN14(서열번호 48)의 MS 피크를 대시선으로 표시한다. (A) VyPAL3 야생형에 의해 촉매화된 반응의 MS 분석. (B) VyPAL3-Y175G에 의해 촉매화된 반응의 MS 스펙트럼. (C) VyPAL3 및 VyPAL3-Y175G에 의해 촉매화된 반응의 HPLC 프로파일. (D) VyPAL3-Y175G에 대한 RP-HPLC를 사용하여 분석된 생성물 비 및 반응 수율의 정량적인 요약.
도 5는 VcAEP 및 VcAEP-Y168A 돌연변이체(LAD2)의 활성을 도시한다. (A) VcAEP 야생형 및 (B) LAD2 영역을 표적화하는 VcAEP-Y168A 돌연변이체에 의해 촉매화된 반응의 MS 분석 및 HPLC-기반 정량적인 요약. 모든 반응을 4.5 내지 8.0 범위의 pH 값에서 수행하였다. 가수분해 생성물 GN14, 고리화 생성물 cGN14, 및 cGN14의 나트륨 이온 부가물의 MS 피크를 대시선으로 표시한다. VcAEP-Y168A 돌연변이체에 대한 리가제 활성의 극적인 개선을 분명히 볼 수 있다.
도 6은 PAL 및 제안된 촉매 기전의 리가제 활성 결정인자(LAD)를 도시한다. (A) 본 연구에서 연구된 PAL 및 AEP의 서열 정렬. 세작용기 촉매(catalytic triad) Asn-His-Cys는 검은색 음이다. S1 포켓에 속하는 잔기는 파란색 음영이다. 제안된 LAD 잔기는 붉은색 상자로 표시된다. LAD1 및 LAD2의 잔기를 나타낸다. LAD1 부근의 보존된 디설파이드 결합은 오렌지색으로 강조된다. 폴리-Pro 루프(PPL)는 녹색 상자로 표시되고 MLA 고리는 보라색으로 표시된다. 2차 구조의 명명법을 문헌[Trabi M, et al. (2004) J Nat Prod 67(5):806-810)]으로부터 VyPAL2(본 연구)의 결정 구조에 따라 변경시켜 적용하였다. 활성에 중요한 잔기 및 동기를 서열 정렬에 사용된 것과 동일한 색상 코드로 표지한다. 점선 아래의 잔기는 산소음이온 구멍에 상응하고 점선 위의 것은 제안된 활성 결정인자에 상응한다. (B) VyPAL2에 의한 결찰 및 가수분해, 및 LAD1 및 LAD2의 역할에 대해 제안된 반응식. 기전의 제1 단계는 가수분해 및 결찰에 대해 동일하여, S-아실 효소 중간체의 형성으로 이어지며 속도 제한 단계이다. 주요 결정인자는 LAD1이다. LAD2는 펩티드(결찰) 또는 수 분자(가수분해)에 의한 친핵성 공격에 유리하도록 활성의 성질을 조절한다. 모든 정렬된 폴리펩티드의 전체 서열은 서열번호 5-14, 18 및 80-87(VyPAL1 = 서열번호 5; VyPAL2 = 서열번호 6; VyPAL3 = 서열번호 7; VyPAL4 = 서열번호 8; VyPAL5 = 서열번호 9; VyAEP1 = 서열번호 10; VyAEP2 = 서열번호 11; VyAEP3 = 서열번호 12; VyAEP4 = 서열번호 13; VcAEP = 서열번호 14; 부텔라제-1 = 서열번호 88; 부텔라제 2 = 서열번호 80; OaAEP1b = 서열번호 81; OaAEP2 = 서열번호 82; HeAEP3 = 서열번호 83; PxAEP3b = 서열번호 84; CeAEP = 서열번호 85; HaAEP1 = 서열번호 86; AtLEGγ = 서열번호 87)에 제시된다.
도 7은 비-공유 친화성 결합 또는 공유 부착에 의한, PAL, 부텔라제-1 및 VyPAL2의 고정화를 도시한다. (A) ConA-PAL 1 및 ConA-Vy2 2를 제공하는 글리코실화된 PAL과 콘카나발린 A(ConA) 아가로스 비드의 친화성 결합. (B) NA-Bu1(b) 3 및 NA-Vy2(b) 4를 제공하는 비오틴화된 PAL과 뉴트라비딘(NeutrAvidin) 아가로스 비드의 친화성 결합. 비오틴화된 PAL은 숙신이미딜-6-(비오틴아미도)헥사노에이트(NHS-LC-비오틴)의, PLA의 아미노 기에의 커플링에 의해 제조되었다. (C) 아가로스-Bu1 5 및 아가로스-Vy2 6을 제공하는 PAL과, 아가로스 비드상의 활성 NHS-에스테르와의 공유 부착. 효소와 아가로스 비드간의 거리를 이격자 부분 및 예비-커플링된 친화성 결합 리간드의 크기에 의해 계산한다.
도 8은 고정화된 PAL 비드에 의한 펩티드 거대고리화를 도시한다. 각각의 반응에 대해서, 단백질 로딩에 기반하여 계산된 1 μM의 고정화된 PAL을 0.2 mM KN14-GL(서열번호 51)과 혼합하였다. 반응을 5분간 서서히 흔들면서 실온에서 pH 6.5에서 수행하였다. 생성물이 회전 컬럼으로부터 용출되었으며 이를 MALDI-TOF MS로 분석하였다. KN14-GL 7(계산 질량 1659.4 Da, 관측 질량 1660.0 Da). cKN14 8(계산 질량 1471.3 Da, 관측 질량 1471.9 Da).
도 9는 용해성 형태의 표준 활성 곡선과의 비교에 의한 고정화된 부텔라제-1 및 VyPAL2의 효율의 측정을 도시한다. 사용된 유리 효소 농도는 1 내지 8 nM의 범위였다. 반응 속도(V)를 초당 생성물 cKN14의 양에 의해 계산하였다. 통상적인 반응 완충제는 1 mM DTT 및 0.1 M NaCl을 함유하는 20 mM 나트륨 포스페이트 완충제(pH 6.5)를 지칭한다. ConA 반응 완충제는 추가적인 5 mM CaCl2 및 5 mM MgCl2를 갖는 반응 완충제를 지칭한다.
도 10은 고정화된 PAL의 작업 안정성을 도시한다. (A) 100개의 반복된 반응에서 5개의 고정화된 PAL 1, 3-6에 의한 KN14-GL의 cKN14로의 고리화에 대한 RP-HPLC 모니터링. 각각의 실험에 대해서, 0.1 mM KN14-GL(서열번호 51)을 함유하는 100 ㎕의 반응 혼합물(pH 6.5)을 제공하였다. 사용되는 비드의 양을 각 유형의 유효 농도에 상응하게 조절하여 유효한 효소:기질 = 1:350 ∼ 1:600의 몰비를 제공하였다. 반응을 실온에서 3-5분간 수행하였다. (B) 5개의 고정화된 PAL 1, 3-6의 작업 안정성의 요약.
도 11은 4℃에서 1, 29 및 64일 동안 보관 후 5개의 고정화된 PAL 1, 3-6, 부텔라제-1 및 VyPAL2의 안정성을 도시한다.
도 12는 실온에서 pH 6.5에서 10분간 서서히 진탕시키면서 NA-Bu1(b) 3에 의한 펩티드 및 단백질의 거대고리화를 도시한다. (A) MALDI-TOF MS에 의해 측정된 바와 같은 고리형 SFTI(D/N)의 95% 조 수율(*)을 제공하는 NA-Bu1(b) 3에 의한 SFTI(D/N)-HV(서열번호 54) 12(0.1 mM, 계산 질량 1767.9 Da, 관측 질량 1767.9 Da)의 SFTI(D/N) 13(계산 질량 1513.8 Da, 관측 질량 1513.3 Da)으로의 고리화. (B) HUPLC에 의해 측정된 바와 같은 83% 수율로 고리형 AS-48 15(계산 질량 7145.1 Da, 관측 질량 7148.1 Da)를 제공하는 NA-Bu1(b) 3에 의한 폴딩된 선형 박테리오신 전구체 AS-48K 14(50 μM, 계산 질량 7783.5 Da, 관측 질량 7779.1 Da)의 고리화.
도 13은 40분간 85% 고리이량체 c17(계산 질량 1404.8 Da, 관측 질량 1405.9 Da) 및 8% 고리삼량체 c18(계산 질량 2107.2 Da, 관측 질량 2109.3 Da)을 제공하는 NA-Bu1(b) 3에 의한 펩티드 RV7 16(서열번호 55; 0.2 mM, 계산 질량 956.5 Da, 관측 질량 957.7 Da)의 고리올리고머화를 도시한다.
도 14는 NA-Vy2(b) 4에 의한 연속-흐름 펩티드 및 단백질 결찰을 도시한다. (A) 결찰 생성물 Ac-RYANGLAK(FAM)RG 21(계산 질량 1506.0 Da, 관측 질량 1507.0 Da; 서열번호 58)을 생성시키는 NA-Vy2(b) 4에 의한 1:10 몰비의 Ac-RYANGI 19(계산 질량 735.4 Da, 관측 질량 734.3 Da; 서열번호 56) 및 GLAK(FAM)RG 20(계산 질량 958.7 Da, 관측 질량 959.6 Da; 서열번호 57)의 결찰. (B) 형광 단백질 DARPin9_26-NGLAK(FAM)RG 23(계산 질량 20728 Da, 관측 질량 20703 Da)을 제공하는 1:5 몰비의 GLAK(FAM)RG 20(서열번호 57)에 의한 재조합 단백질 DARPin9_26-NGL 22(계산 질량 19968 Da, 관측 질량 19950 Da; 서열번호 49)의 C-말단 형광 표지화. 반응 생성물을 양-이온 선형-모드의 MALDI-TOF MS에 의해 분석하고 조 수율을 피크 면적에 의해 계산하였다.
본 발명은 비올라 예도엔시스 및 비올라 카나덴시스로부터 단리된 펩티드 리가제/사이클라제 활성을 갖는 신규 효소의 발명자의 식별에 기반한다. 구체적으로, 발명자는 공지된 효소 부텔라제-1(WO 2015/163818 B1)과 같은 리가제 활성이 가능한 효소와 상동성을 갖는 비올라세아에 식물로부터 신규의 리가제를 성공적으로 식별하였다. 이들 효소는, 그의 특이적인 트랜스펩티다제 활성을 강조하고 AEP와 구별하기 위해서 펩티드 아스파라진 리가제(PAL)라 명명되었다. 상응하는 재조합 효소의 정제 및 시험에 의해, 유일하게 VyPAL2 만이 4.5 내지 8.0 범위의 광범위한 pH 값에서 리가제 활성을 가지며(이때 pH 6.5 내지 7.0에서 최대 촉매 속도를 가지며 부텔라제 1보다 효율이 단지 3.5배 작을 뿐이다), 오직 산성 pH(4.5)에서 최소의 하이드롤라제 활성을 나타내어, 상기를 생물공학적 용도에 귀중한 재조합 PAL이 되게함을 발견하였다. VyPAL1은 양호한 리가제임에도 불구하고, 산성 pH에서 약간의 가수분해와 함께 잡다한 활성을 보였다. VyPAL3은 낮은 pH에서 우세한 가수분해 활성과 함께 전반적으로 낮은 촉매 효율을 특징으로 하였다. 더욱이, 서열 상동성에 기반하여 프로테아제인 것으로 예측된 VyAEP1 단백질은 실제로 낮은 pH에서 프로테아제인 것으로 밝혀졌다(도 1). 이들 효소간의 활성 차이에 대한 분자 베이스를 밝히기 위해서, VyPAL2의 결정 구조를 획득하였으며 이를 주형으로서 사용하여 VyPAL 단백질 동형의 구조를 모델링하였다. 이러한 비교는 S1 활성 부위 포켓을 둘러싸는 2개의 영역: AEP와 PAL간의 미묘하지만 중요한 변화를 나타내는 S2 및 S1' 포켓을 지적하였다.
S2 포켓에 위치한 OaAEP1b의 하나의 잔기는 앞서, 효소 효율의 조절에 중요한 역할을 하는 것으로 밝혀진 것으로서 "게이트-키퍼"인 것으로 보고되었다(Yang, et al. (2017) JACS. Doi:10.1021/jacs.6b12637). 발명자는 상기 잔기가 통상적으로는 글리신이지만, PAL에서는 소수성 또는 벌키한 잔기, 예를 들어 부텔라제-1에서는 발린이고 OaAEP1b에서는 시스테인인 것으로 보이는 것을 발견하였다. 그러나, 유일한 기준으로서 "게이트-키퍼" 잔기의 성질을 사용하는 것은 VyPAL1-3 동형에서 관찰되는 활성 범위를 설명하기에 불충분하다: VyPAL2 매우 효율적인 PAL 및 VyPAL3, 매우 불량한 효소, 둘 다 유사한 게이트-키퍼 잔기: 예를 들어 각각 I 및 V를 갖는다(도 6A). 더욱이, 게이트-키퍼 잔기로서 Val(부텔라제 1 처럼)을 갖는 VcAEP는 프로테아제이다(도 5A). 발명자는 리가제 활성 결정인자로서 작용하는 VyPAL1-3의 2개 영역: (i) VyPAL2에서 잔기 W243, I244(게이트-키퍼) 및 T245를 포함하는 S2 포켓(LAD1) 및 (ii) 잔기 A174 및 P175를 포함하는 S2' 포켓(LAD2)의 서열 변화를 식별하였다(도 6). VyPAL1 및 VyPAL2의 LAD2 영역은 동일하지만, 이들의 게이트-키퍼 영역(LAD1)은 2개의 변화를 갖는다(도 6): T245A 치환은, 잔기 245의 측쇄가 기질 결합 영역에 반대로 배향되므로 영향이 거의 없는 것으로 가정되었다. 따라서, VyPAL1 및 2간에 관찰된 활성의 차이는, 효소를 가수분해에 "더 약하게" 만들고 보다 낮은 pH에서 VyPAL1의 하이드롤라제를 향한 약간의 이동을 설명하는 다른 W243L 치환에 기인한다는 결론을 내렸다.
VyPAL1 및 2 리가제와 비교하여, VyPAL3은 LAD1 및 LAD2 모두의 변화를 갖는다. 그러나, LAD1에서의 보존적 치환: Ile 게이트-키퍼 잔기 대신에 V245 및 Thr 대신에 V246은 관찰되는 급격한 활성 변화를 밝히지 못하는 듯하다(도 1C). 오히려, 활성 부위의 반대쪽인 LAD2에서, VyPAL1 및 2에 존재하는 AP 디펩티드가 보다 벌키한 YA 디펩티드에 의해 교체된다. 이러한 변화가, 상기 위치의 벌키한 Tyr 잔기가 아실-효소 중간체에의 펩티딜 친핵체의 접근을 방해할 수 있기 때문에, VyPAL1 및 VyPAL2에 비해 VyPAL3에서 관찰되는 보다 낮은 리가제 활성에 책임이 있는 것으로 밝혀졌다. 이를 확인하고서, 발명자는 보다 작은 소수성 측쇄, 예를 들어 Gly(또는 Ala)를 LAD2의 첫 번째 위치에 삽입함으로써 리가제 효율이 상응하는 VyPAL3 단일 Y175G 돌연변이체에서 나타나는 바와 같이(도 4), 현저하게 증가될 수 있음을 발견하였다. 중요하게, 발명자는 비올라 카나덴시스로부터의 VcAEP에 균등한 돌연변이를 도입시킴으로써 리가제 활성의 조절에서 LAD2 영역의 연루를 확인할 수 있었다(도 5AB를 비교하시오). VcAEP 중의 상기 위치에서 Y에 의해 점유된 부피는 이탈기의 해리를 가속화하고, 촉매 수 분자의 대체 및 따라서 가수분해에 비해 결찰에 유리한 필수 단계인 유입 펩티드의 결합을 늦추는 것과 같은 부작용을 일으키는 듯하다. 이는 조기 티오에스테르 가수분해를 방지함으로써 고리화를 촉진하기 위해 앞서 제안된 주된 쪽에서의 상호작용의 중요성과 일치한다. 다른 한편으로, Tyr175의 측쇄는 추정적인 촉매 수 분자를 방해하지 않아야 한다. 상기 수 분자는 AtLEG-감마 및 다른 레구메인의 경우에서 관찰되는 바와 같이, 추정상 VyPal3의 Gly174(촉매적 His에 바로 이어지는 엄격하게 보존된 잔기) 바로 위에 위치한다(Zauner, et al. (2018) J. Biol. Chem. Doi:10.1074/jbc.M117.817031)
발명자는 APE 및 PAL의 기전이 2개의 단계로 분해될 수 있음을 발견하였다: (i) 속도-제한 단계인 듯한 아실-효소 티오에스테르 중간체 형성 및 (ii) 아실-효소 중간체상의 수 분자(가수분해) 또는 친핵성 펩티드(결찰)에 의한 친핵성 공격. OaAEP1b상에서 수행된 게이트-키퍼 돌연변이유발에 대한 공지된 정보(상기 Yang)와 함께, 실시예에 제시된 획득된 결과는 상기 중심 위치의 소수성 잔기, 예를 들어 Val/Ile/Cys/Ala가 결찰에 유리한 반면, Gly의 존재는 단백질분해에 유리함을 보인다(도 16). S2 포켓 중의 LAD1은, 가능하게는 기질 중에 일부 특정한 입체형태적 변형을 유도함으로써, 효소 활성에 대한 영향과 함께 기질 위치지정에 영향을 미칠 수 있다. 게이트-키퍼의 변화는 주로 기질 결합 및 위치지정에 영향을 미치기 때문에, 중간체 형성 및 따라서 전체적인 반응 속도에 직접적인 영향을 미칠 것이다. 환언하면, LAD2의 변화는 친핵체의 성질 및 접근성에 영향을 미칠 것이며 결과적으로, 촉매화된 전체 반응의 성질에 결정적일 것이다.
LAD2는 VyPAL 및 VcAEP에 의해 촉매화된 활성의 성질에 중요한 결정인자인 것으로 밝혀졌다: 상기 활성 부위쪽의 벌키한 잔기, 예를 들어 VyPAL3에서 YA 디펩티드 및 VcAEP에서 YP의 첫 번째 위치의 Tyr은 절단된 펩티드기의 일탈을 촉진하고, 따라서 이는 촉매수의 보충 및 친핵성 수 분자에의 아실-효소 티오에스테르의 노출을 생성시킨다. 이러한 기전은 S1' 및 S2' 포켓 중에 남아있는 절단된 펩티드기가 친핵성 수 분자를 대체하고 따라서 가수분해보다 결찰에 유리하다는 선행 연구와 일치한다. 더욱이, 유입 친핵성 펩티드가 결합하는 방향으로 배향된 벌키한 잔기는 아실-효소 중간체에의 접근을 방해하고, 따라서 결찰 비율을 심하게 감소시킨다. 환언하면, LAD2 중의 GA/AA/AP와 같은 작은 소수성 디펩티드는, 또 다른 펩티드가 친핵체로서 작용하여 리가제 활성으로 이어질 때까지 일탈기를 유지한다(티오에스테르 결합에의 접근을 차단한다). 그러나, AEP를 조작하기 위한 VyPAL2의 양쪽 부위 모두의 돌연변이는 OaAEP2와 같은 프로테아제 또는 부텔라제 2로의 효율적이고 급격한 전환을 생성시키지 않았으며, 이는 LAD1 및 LAD2외에, 단백질분해에 대한 다른 결정인자의 존재를 암시한다(데이터 도시 안 됨). 하나의 매력적인 가능성은 LAD1(게이트키퍼) LAD2(본 연구) 및 MAL내의 잔기가 협력하여 프로테아제 대 리가제 활성을 결정하는 것이다. 이에 관하여서는, 절두된 MLA 단독의 존재(Chen et al. (1998) FEBS Lett 441(3):361-5)가 리가제 활성을 반드시 의미하는 것은 아님이 밝혀졌는데, 그 이유는 절두된 MLA를 갖는 VcAEP(도 6)가 주로 프로테아제 활성을 나타내기 때문이다(도 5).
요약하면 발명자는 아스파라지닐 엔도펩티다제 및 리가제 활성을 지배하는 분자 결정인자가 S1 포켓에 측면 인접하고 있는 기질-결합 홈, 특히 각각 S2 및 S1' 포켓 주변에 집중된 LAD1 및 LAD2의 아미노산 조성물에서 주로 발견됨을 발견하였다. 구조 분석 및 돌연변이유발 연구를 함께 고려했을 때, 효율적인 펩티드 아스파라지닐 리가제의 경우 LAD1의 첫 번째 위치가 바람직하게는 벌키하고 방향족, 예를 들어 W/Y이고, 두 번째 위치는 소수성, 예를 들어 V/I/C/A이나 G는 아닌 것으로 밝혀졌다. LAD2의 경우, GA/AA/AP 디펩티드가 유리한 것으로 밝혀졌다. Y와 같은 벌키한 잔기는, 기질의 결합 친화성에 영향을 미치고 수 분자의 접근성을 조절함으로써 및 N/D 잔기 뒤의 절단된 펩티드 꼬리의 해리 속도를 증가시킴으로써 아실-효소 중간체를 불안정하게 하는 듯하므로 LAD2의 첫 번째 위치에서 불리하다. 따라서, 상기 디펩티드의 첫 번째 위치에 G 또는 A와 같은 작은 잔기가 리가제 활성에, 항상 충분하지는 않지만, 필요하다. 이러한 조건을 충족시키는 한, 천연 AEP는 LAD1(게이트 키퍼)과 같은 다른 위치 또는 MLA와 같은 보다 먼 영역에서 돌연변이 또는 변화를 통해 PAL이 될 수 있다.
상기 발견에 기반하여, 본 발명은 첫 번째 태양에서, 단리된 형태의 펩티드 아스파라지닐 리가제(PAL)를 갖는 폴리펩티드를 포함하며, 보다 구체적으로 서열번호 1에 제시된 바와 같은 아미노산 서열을 포함하거나 상기 서열로 필수적으로 이루어지거나 또는 이루어지는 단리된 폴리펩티드에 관한 것이다. 서열번호 1에 제시된 아미노산 서열로 이루어지는 폴리펩티드를 또한 본원에서 "VyPAL2" 또는 "VyPAL2 활성형/도메인"이라 칭한다. 본원에 사용되는 바와 같은 "단리된"은 자연적으로 존재하거나 연관되는 다른 세포 성분과 적어도 부분적으로 분리된 형태의 폴리펩티드에 관한 것이다. 폴리펩티드는 재조합 폴리펩티드, 즉 상기 폴리펩티드를 자연적으로 생산하지 않는 유전자 조작된 유기체에서 생산된 폴리펩티드일 수 있다. 고유 및 재조합 폴리펩티드는 모두 N-연계된 글리코실화에 의해 번역-후 변형된다.
본 발명에 따른 폴리펩티드는 단백질 결찰 활성을 나타내며, 즉 2개의 아미노산 잔기 사이에 펩티드 결합을 형성할 수 있으며, 이때 이들 두 아미노산 잔기는 동일하거나 상이한 펩티드 또는 단백질상에, 바람직하게는 상기 결찰 활성이 상기 펩티드 또는 단백질을 고리화하도록 동일한 펩티드 또는 단백질상에 위치한다. 상응하게, 다양한 구현예에서, 본 발명의 폴리펩티드는 사이클라제 활성을 갖는다. 다양한 구현예에서, 상기 단백질 결찰 또는 사이클라제 활성은 엔도펩티다제 활성을 포함한다, 즉 폴리펩티드는 기존 펩티드 결합의 절단에 따른 2개 아미노산 잔기간에 펩티드 결합을 형성한다. 이는 주어진 펩티드의 말단 사이에 고리화가 발생할 필요는 없지만 내부 아미노산 잔기 사이에서는 발생할 수 있고, 이때 고리화에 사용되는 아미노산에 대해 C-말단 또는 N-말단 아미노산은 절단됨을 의미한다. 바람직한 구현예에서, 폴리펩티드는 내부 아미노산에 N-말단을 결찰시키고 남은 C-말단 아미노산은 절단시킴으로써 고리화된 펩티드를 형성한다.
본원에 개시된 바와 같은 폴리펩티드는 결찰이 일어나는 C-말단 아미노산, 즉 결찰되는 펩티드의 C-말단 단부가 아스파라진(Asn 또는 N) 또는 아스파트산(Asp 또는 D), 바람직하게는 아스파라진이라는 점에서 "Asx-특이성"이다.
본원에 사용되는 바와 같은 "폴리펩티드"는 펩티드 결합에 의해 연결된 아미노산으로부터 제조된 중합체를 지칭한다. 본원에 정의되는 바와 같은 폴리펩티드는 50개 이상의 아미노산, 바람직하게는 100개 이상의 아미노산을 포함할 수 있다. 본원에 사용되는 바와 같은 "펩티드"는 펩티드 결합에 의해 연결된 아미노산으로부터 제조된 중합체에 관한 것이다. 본원에 정의되는 바와 같은 펩티드는 2개 이상의 아미노산, 바람직하게는 5개 이상의 아미노산, 보다 바람직하게는 10개 이상의 아미노산, 예를 들어 10 내지 50개 아미노산을 포함할 수 있다.
다양한 구현예에서, 폴리펩티드는 전체 길이에 걸쳐 서열번호 1에 제시된 아미노산 서열에 적어도 60%, 65%, 70%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 90.5%, 91%, 91.5%, 92%, 92.5%, 93%, 93.5%, 94%, 94.5%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.25%, 또는 99.5% 일치하는 또는 상동성인 아미노산 서열을 포함하거나 또는 상기 서열로 이루어진다. 일부 구현예에서, 상기는 전체 길이에 걸쳐 서열번호 1에 제시된 아미노산 서열과 적어도 60, 바람직하게는 적어도 70, 보다 바람직하게는 적어도 80, 가장 바람직하게는 적어도 90% 서열 일치성을 공유하는 아미노산 서열을 갖거나 또는 전체 길이에 걸쳐 서열번호 1에 제시된 아미노산 서열과 적어도 80, 바람직하게는 적어도 90, 보다 바람직하게는 적어도 95% 서열 상동성을 공유하는 아미노산 서열을 갖는다.
다양한 구현예에서, 폴리펩티드는 성숙한 효소의 전구체일 수 있다. 상기와 같은 구현예에서, 상기는 서열번호 2 또는 서열번호 3에 제시된 아미노산 서열을 포함하거나 또는 상기로 이루어질 수 있다. 전체 길이에 걸쳐 서열번호 2 또는 서열번호 3에 제시된 아미노산 서열에 적어도 60%, 65%, 70%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 90.5%, 91%, 91.5%, 92%, 92.5%, 93%, 93.5%, 94%, 94.5%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.25%, 또는 99.5% 일치하거나 상동성인 아미노산 서열을 갖는 폴리펩티드가 또한 포함된다.
핵산 서열 또는 아미노산 서열의 일치성을 일반적으로는 서열 비교에 의해 결정한다. 상기 서열 비교는 기존의 기술에서 확립되고 통상적으로 사용되며(예를 들어 문헌[Altschul et al. (1990) "Basic local alignment search tool", J. Mol. Biol. 215:403-410], 및 문헌[Altschul et al. (1997): "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs"; Nucleic Acids Res., 25, p. 3389-3402]을 참조하시오) 원칙적으로 각각 핵산 서열 및 아미노산 서열 중의 뉴클레오티드 또는 아미노산의 유사한 연속을 상호 연관시킴으로써 수행되는 BLAST 알고리즘에 기반한다. 관련 위치의 표 형식 연결을 "정렬"이라고 한다. 서열 비교(정렬), 특히 다중 서열 비교는 통상적으로 이용가능하고 당업자에게 공지된 컴퓨터 프로그램을 사용하여 통상적으로 준비된다.
이러한 종류의 비교는 또한 비교되는 서열의 서로에 대한 유사성에 관한 진술을 허용한다. 이는 일반적으로 일치성 백분율, 즉 정렬에서 동일한 위치 또는 서로 상응하는 위치에서 일치하는 뉴클레오티드 또는 아미노산 잔기의 비율로 표시된다. 아미노산 서열과 관련하여 보다 광범위하게 해석되는 용어 "상동성"은 또한 보존된 아미노산 교환, 즉 유사한 화학적 활성을 갖는 아미노산에 대한 고려를 포함하는데, 이는 이들이 일반적으로 단백질 내에서 유사한 화학적 활성을 수행하기 때문이다. 따라서 비교된 서열의 유사성은 "상동성 백분율" 또는 "유사성 백분율"로 표시될 수도 있다. 일치성 및/또는 상동성의 표시는 전체 폴리펩티드 또는 유전자에 걸쳐 또는 단지 개별 영역에 걸쳐 접할 수 있다. 따라서 다양한 핵산 서열 또는 아미노산 서열의 상동 및 일치 영역은 서열의 합치에 의해 정의된다. 상기와 같은 영역은 종종 동일한 기능을 나타낸다. 이들 영역은 작을 수 있으며, 단지 몇 개의 뉴클레오티드 또는 아미노산을 포함할 수 있다. 이러한 종류의 작은 영역은 종종 단백질의 전반적인 활동에 필수적인 기능을 수행한다. 따라서 개별적인, 및 임의로 작은 영역에 대해서만 서열 합치를 참조하는 것이 유용할 수 있다. 그러나, 달리 표시되지 않는 한, 본원에서 일치성 및 상동성의 표시는 각각 표시된 핵산 서열 또는 아미노산 서열의 전체 길이를 지칭한다.
다양한 구현예에서, 본원에 기재된 폴리펩티드는 서열번호 1의 19번 위치에 상응하는 위치에 아미노산 잔기 N; 및/또는 서열번호 1의 124번 위치에 상응하는 위치에 아미노산 잔기 H; 및/또는 서열번호 1의 166번 위치에 상응하는 위치에 아미노산 잔기 C를 포함한다. 다양한 구현예에서, 적어도 서열번호1의 124번 위치에 상응하는 위치의 아미노산 잔기 H; 및/또는 서열번호 1의 166번 위치에 상응하는 위치의 아미노산 잔기 C에 의해 형성되는 이작용기 촉매가, 바람직하게는 서열번호 1의 19번 위치에 상응하는 위치의 아미노산 잔기 N과 함께 존재하며; 따라서 완전한 세작용기 촉매를 형성한다. 이들 아미노산 잔기는 폴리펩티드의 촉매 활성(리가제/사이클라제/엔도펩티다제 활성)에 필요하다. 따라서 바람직한 구현예에서, 폴리펩티드는 주어진 또는 상응하는 위치에서 상기 나타낸 잔기 중 적어도 2개, 보다 바람직하게는 3개를 모두 포함한다.
모든 아미노산 잔기를 일반적으로 본원에서 1문자 암호, 및 일부의 경우 3문자 암호를 참조하여 지칭한다. 상기 명명법은 당업자에게 주지되어 있으며 당해 분야에서 이해되는 바와 같이 본원에서 사용된다.
다양한 구현예에서, 본원에 기재된 폴리펩티드는 126번 위치에 상응하는 위치에 아미노산 잔기 A를 포함한다. 다양한 구현예에서, 본원에 기재된 폴리펩티드는 서열번호 1의 127번 위치에 상응하는 위치에 아미노산 잔기 A 또는 P, 바람직하게는 P를 포함한다. 한편으로, 서열번호 1의 126번 위치에 상응하는 위치에 아미노산 잔기는 G일 수 있다. 이들 구현예에서, 서열번호 1의 127번 위치에 상응하는 위치에 아미노산 잔기는 바람직하게는 A이다. 이들 동기 AP, AA 및 GA를 또한 본원에서 리가제 활성 결정인자 2(LAD2)로서 지칭하는데, 그 이유는 이들이 리가제 활성에 중요한 결정인자이고 이들 위치에서 다른 아미노산의 이들 동기로의 돌연변이가, 우세한 효소 활성이 전환된다는 점에서 엔도펩티다제를 리가제 효소로 전환시킬 수 있기 때문이다. 다양한 구현예에서 서열번호 1의 126번 및 127번 위치에 상응하는 위치의 동기는 GP가 아니고, AP, AA 또는 GA이다.
다양한 구현예에서, 본원에 기재된 폴리펩티드는 서열번호 1의 195번 위치에 상응하는 위치에 아미노산 잔기 W 또는 Y, 196번 위치에 상응하는 위치에 아미노산 잔기 I 또는 V, 및 197번 위치에 상응하는 위치에 아미노산 잔기 T, A 또는 V를 포함한다. 이들 동기 W-I/V-T/A/V(또한 본원에서 리가제 활성 결정인자 1(LAD1)이라 지칭된다)가 또한 리가제 활성에 중요한 결정인자인 것으로 밝혀졌다. 서열번호 1의 196번 위치에 상응하는 공지된 게이트키퍼 위치 외에, 또한 195 및 197번, 특히 195번 위치가 리가제/엔도펩티다제 활성을 결정하는데 관련있는 것으로 밝혀졌다. 다시, 이들 위치에서 다른 아미노산의 이들 동기로의 돌연변이는, 우세한 효소 활성이 전환되거나 혼합된 리가제/엔도펩티다제의 리가제 활성을 증가시킨다는 점에서 엔도펩티다제를 리가제 효소로 전환시킬 수 있다.
다양한 구현예에서, 본원에 기재된 폴리펩티드는 서열번호 1의 21번 위치에 상응하는 위치에 아미노산 잔기 R, 22번 위치에 상응하는 위치에 H, 123번 위치에 상응하는 위치에 D, 164번 위치에 상응하는 위치에 E, 194번 위치에 상응하는 위치에 S, 및 215번 위치에 상응하는 위치에 D를 포함한다. 이들 아미노산 잔기를 또한 본원에서 "S1 포켓"이라 칭한다.
다양한 구현예에서, 본원에 기재된 폴리펩티드는 서열번호 1의 199 및 212번 위치에 상응하는 위치에 아미노산 잔기 C를 포함한다. 이들 2개의 잔기는 전형적으로 성숙한 폴리펩티드 중에 디설파이드 가교를 형성한다.
본 발명의 폴리펩티드는 다양한 구현예에서 추가로 다소 불변의 서열 요소, 예를 들어 폴리-Pro 루프(PPL)를 포함한다. 상기 루프는 공통서열 P/A-G/T/S-X-X-P/E-G/D/P-V/F/A/P-P-L/P/A/E-E를 가지며 적어도 2 내지 최대 5개의 프롤린 잔기를 포함한다. 표시된 위치에서 2, 3, 4 또는 5개의 프롤린 잔기가 전형적이다. PPL은 서열번호 1의 200-208번 위치를 차지한다.
본 발명의 폴리펩티드 중에 존재할 수 있는 또 다른 동기는 서열번호 1의 244-249번 위치에 걸쳐 있는 소위 MLA 동기이다. 이는 서열 KKIAYA 또는 NKIAYA(서열번호 15 및 16)를 가질 수 있다.
다양한 구현예에서, 본 발명의 폴리펩티드는 상술한 바와 같은 LAD1 및 LAD2 동기를 포함한다. 추가의 구현예에서, 상기는 상기에 정의된 바와 같은 S1 포켓, SS 가교, PPL 및 MLA 동기 중 1, 2, 3 또는 4개 전부를 추가로 포함한다.
다양한 구현예에서, 본 발명의 단리된 폴리펩티드는 5.0 이하, 바람직하게는 4.5 이하의 pH에서 산 처리에 의해 활성화될 수 있다. 이를 C-말단 캡 서열 또는 활성화 도메인을 포함하는 폴리펩티드에 적용한다. 상기와 같은 C-말단 도메인은 예를 들어 서열번호 3에 제시된 아미노산 서열을 갖는 폴리펩티드 중에 존재한다. 상기 중에 사용되는 구체적인 서열(서열번호 17)은 VyPAL1의 캡 서열(서열번호 5)로부터 유래된다.
본 발명의 단리된 폴리펩티드는 바람직하게는 효소 활성, 특히 단백질 리가제, 바람직하게는 사이클라제 활성을 갖는다. 다양한 구현예에서, 이는 상기가 주어진 펩티드를 60% 이상, 바람직하게는 70% 이상, 보다 바람직하게는 80% 이상의 효율로 결찰시킬 수 있음을 의미한다. 효율은 상기 펩티드/폴리펩티드의 총량에 대해 고리화된 주어진 펩티드/폴리펩티드의 양(%)으로서 결정된다.
본 발명의 폴리펩티드는 서열번호 1의 아미노산 서열을 갖는 효소의 단백질 리가제 활성의 적어도 50%, 보다 바람직하게는 적어도 70, 가장 바람직하게는 적어도 90%를 갖는 것이 바람직하다.
다양한 구현예에서, 본 발명의 단리된 폴리펩티드는 바람직하게는 5.5 이상의 pH에서 60% 이상, 바람직하게는 80% 이상의 효율로 주어진 펩티드를 고리화할 수 있다. 고리화 활성을 또한 6.0, 6.5, 7.0, 7.5 이상의 pH 값에서 측정할 수 있다. 이는 낮은 pH 조건에서, 예를 들어 pH 5 이하에서 다수의 리가제가 일정한 정도의 엔도펩티다제 활성을 나타낼 수 있으므로 적절하다.
다양한 구현예에서, 본 발명의 폴리펩티드는 주어진 펩티드를 20% 이하, 바람직하게는 5% 이하의 효율로 가수분해한다. 효율은 상기 펩티드/폴리펩티드의 총량(%)에 대해 가수분해된 주어진 펩티드/폴리펩티드의 양으로서 측정된다. 다시, pH는 활성에 영향을 미칠 수 있으므로, 가수분해 활성을 바람직하게는 5.5 이상의 pH, 예를 들어 6.0, 6.5, 7.0, 7.5 이상의 pH 값에서 측정한다.
상술한 변형 외에, 본원에 기재된 구현예에 따른 폴리펩티드는 아미노산 변형, 특히 아미노산 치환, 삽입 또는 결실을 포함할 수 있다. 상기와 같은 폴리펩티드는 예를 들어 표적화된 유전자 변형에 의해, 즉 돌연변이유발 방법에 의해 추가로 개발되며, 특정한 목적을 위해서 또는 특별한 성질에 관하여(예를 들어 촉매 활성, 안정성 등에 관하여) 최적화된다. 상기와 같은 추가적인 변형을 본 발명의 폴리펩티드에 도입시키는 경우, 이들은 바람직하게는 상기 상세한 서열 동기, 즉 촉매 잔기, LAD1 및 LAD2 동기에 영향을 미치지 않거나, 변경시키지 않거나 역전시키지 않는다. 이는 이들 잔기/동기의 상기-정의된 특징이 상기에 정의된 것 이상으로 이들 추가적인 돌연변이에 의해 변하지 않음을 의미한다. 추가로 S1 포켓, SS 가교, PPL 및 MLA 동기 중 1, 2, 3 또는 4개 전부가 추가적인 변형, 즉 상기 상세한 변형을 벗어난 변형 없이 유지되는 것이 더욱 바람직할 수 있다. 또한, 본원에서 고려되는 핵산을 재조합 제형에 도입시키고 이에 의해 전적으로 새로운 단백질 리가제, 사이클라제 또는 다른 폴리펩티드를 생성시킬 수 있다.
다양한 구현예에서, 리가제/사이클라제 활성을 갖는 폴리펩티드를 번역-후 변형시킬 수 있다, 예를 들어 글리코실화시킬 수 있다. 상기와 같은 변형을 재조합 수단에 의해, 즉 생성시 숙주 세포에서 직접 수행하거나, 또는 예를 들어 시험관내에서 폴리펩티드의 합성 후에 화학적으로 또는 효소에 의해 성취할 수 있다.
예를 들어, 공지된 PAL 부텔라제-1(서열번호 18)을 N94 및 N286에서 벌키한 이종 글리칸으로 글리코실화시키며, 이는 약 6 kDa의 추가적인 질량 증가를 생성시킨다. 재조합 VyPAL2(서열번호 1-3)를 작은 글리칸으로, 서열번호 2의 넘버링을 사용하여 N102, N145 및 N237번 위치에서 글리코실화시키며, 이는 약 3 kDa의 추가적으로 증가된 질량을 생성시킨다. 따라서 본 발명의 폴리펩티드를, 예를 들어 서열번호 18의 N94 및 N286번 위치에 상응하는 위치에서 벌키한 이종 글리칸으로, 또는 서열번호 2의 N102, N145 및 N237번 위치에 상응하는 위치에서 작은 글리칸으로 글리코실화시킬 수 있다.
기재된 변형의 목적은 표적화된 돌연변이, 예를 들어 치환, 삽입 또는 결실을, 예를 들어 기질 특이성을 변경시키고/시키거나 촉매 활성을 개선시키기 위해서 공지된 분자에 도입시키는 것일 수 있다. 상기 목적을 위해서, 특히 분자의 표면 전하 및/또는 등전점, 및 이에 의해 기질과의 상호작용을 변형시킬 수 있다. 한편으로 또는 추가로, 폴리펩티드의 안정성을 하나 이상의 상응하는 돌연변이에 의해 향상시킬 수 있으며, 이에 의해 그의 촉매 성능을 개선시킬 수 있다. 개별적인 돌연변이, 예를 들어 개별적인 치환의 유리한 성질이 서로 보충될 수 있다.
다양한 구현예에서, 폴리펩티드는 상기가 단일 또는 다수의 보존적 아미노산 치환에 의해 초기 분자로서 상술한 바와 같은 폴리펩티드로부터 수득될 수 있다는 것을 특징으로 할 수 있다. "보존적 아미노산 치환"이란 용어는 하나의 아미노산 잔기의 또 다른 아미노산 잔기에 대한 교환(치환)을 의미하며, 이때 상기와 같은 교환은 교환된 아미노산의 위치에서 극성 또는 전하의 변화, 예를 들어 비극성 아미노산 잔기의 또 다른 비극성 아미노산 잔기에 대한 교환을 유도하지 않는다. 본 발명의 상황에서 보존적 아미노산 치환은 예를 들어 G=A=S, I=V=L=M, D=E, N=Q, K=R, Y=F, S=T, G=A=I=V=L=M=Y=F=W=P=S=T를 포함한다.
한편으로 또는 추가로, 폴리펩티드는 상기가 단편화에 의해 또는 결실, 삽입, 또는 치환 돌연변이유발에 의해 초기 분자로서 본원에서 고려되는 폴리펩티드로부터 수득될 수 있고, 적어도 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260 또는 265개의 연속적으로 연결된 아미노산의 길이에 걸쳐 서열번호 1-14에 제시된 바와 같은 초기 분자와 합치하는 아미노산 서열을 포함하는 것을 특징으로 할 수 있다. 상기와 같은 구현예에서, 바람직하게는 아미노산 N19, N124 및 C166뿐만 아니라 상기-정의된 LAD1, LAD2 및 임의로 또한 초기 분자 중에 함유된 S1 포켓, PPL, MLA 동기 및 디설파이드 가교 중 임의의 하나 이상이 여전히 존재한다.
따라서 다양한 구현예에서, 본 발명은 본원에 기재된 폴리펩티드의 단편에 관한 것이며, 상기 단편은 효소 활성을 유지한다. 상기는 초기 분자, 바람직하게는 서열번호 1의 아미노산 서열을 갖는 폴리펩티드의 단백질 리가제 및/또는 사이클라제 활성의 적어도 50%, 보다 바람직하게는 적어도 70, 가장 바람직하게는 적어도 90%를 갖는 것이 바람직하다. 단편은 바람직하게는 적어도 150 아미노산 길이, 보다 바람직하게는 적어도 200 또는 250 아미노산 길이이다. 이들 단편은 서열번호 1의 19, 124 및 166번 위치에 상응하는 위치에 아미노산 N, H 및 C뿐만 아니라 상기-정의된 LAD1, LAD2 및 임의로 또한 초기 분자 중에 함유된 S1 포켓, PPL, MLA 동기 및 디설파이드 가교 중 임의의 하나 이상을 포함하는 것이 더욱 바람직하다. 따라서 바람직한 단편은 서열번호 1에 제시된 아미노산 서열의 아미노산 19-197, 보다 바람직하게는 19-212, 가장 바람직하게는 19-246을 포함한다.
본원에 기재된 폴리펩티드를 암호화하는 핵산 분자뿐만 아니라 상기와 같은 핵산을 함유하는 벡터, 특히 복사용 벡터 또는 발현 벡터가 또한 본 발명의 부분을 형성한다.
이들은 DNA 분자 또는 RNA 분자일 수 있다. 이들은 개별적인 가닥으로서, 상기 개별적인 가닥에 상보성인 개별적인 가닥으로서, 또는 이중 가닥으로서 존재할 수 있다. 특히 DNA 분자의 경우, 3개의 가능한 판독 프레임 모두에서 2개의 상보성 가닥 모두의 서열이 각각의 경우에 고려되어야 한다. 또한 상이한 코돈, 즉 3 염기가 동일한 아미노산을 암호화할 수 있으며, 따라서 특정한 아미노산 서열이 다수의 상이한 핵산에 의해 암호화될 수 있다는 사실이 고려되어야 한다. 이러한 유전 암호의 축퇴 결과, 상술한 폴리펩티드 중 하나를 암호화할 수 있는 모든 핵산 서열이 본 발명의 주제에 포함된다. 당업자는 이러한 핵산 서열을 명백하게 결정할 수 있는데, 그 이유는 유전 암호의 축퇴성에도 불구하고, 한정된 아미노산은 개별적인 코돈과 연관되기 때문이다. 따라서 당업자는 아미노산 서열로부터 진행하여, 상기 아미노산 서열을 암호화하는 핵산을 쉽게 확인할 수 있다. 또한, 본 발명에 따른 핵산의 상황에서 하나 이상의 코돈을 유사한 코돈에 의해 교체할 수 있다. 상기 태양은 특히 본원에서 고려되는 효소의 이종 발현에 관한 것이다. 예를 들어 모든 유기체, 예를 들어 생산 균주의 숙주 세포는 특정한 코돈 사용을 갖는다. "코돈 사용"은 각각의 유기체에 의한 유전 암호의 아미노산으로의 번역으로서 이해된다. 핵산에 위치한 코돈이 유기체에서 비교적 적은 수의 로딩된 tRNA 분자와 직면하는 경우 단백질 생합성의 병목 현상이 발생할 수 있다. 또한 상기는 동일한 아미노산을 암호화하며, 결과적으로 동일한 아미노산을 암호화하는 코돈이 유사한 코돈보다 유기체에서 덜 효율적으로 번역된다. 유사한 코돈에 대해 더 많은 수의 tRNA 분자가 존재하기 때문에 후자가 유기체에서 보다 효율적으로 번역될 수 있다.
분자 생물학 또는 단백질 화학의 표준 방법과 조합된 화학적 합성 또는 폴리머라제 쇄 반응(PCR)과 같은 오늘날 일반적으로 알려진 방법을 통해, 당업자는 공지된 DNA 서열 및/또는 아미노산 서열을 기반으로, 유전자를 완성하는 모든 방법으로 상응하는 핵산을 제조할 수 있다. 상기와 같은 방법은 예를 들어 문헌[Sambrook, J., Fritsch, E.F. and Maniatis, T, 2001, Molecular cloning: a lab manual, 3rd edition, Cold Spring Laboratory Press]에 공지되어 있다.
"벡터"는 본원의 목적을 위해 본원에서 특성화 핵산 영역으로서 고려되는 핵산을 함유하는 요소(핵산으로 구성된)로서 이해된다. 벡터는 상기 핵산을 여러 세대 또는 세포 분열에 걸친 종 또는 세포주에서 안정한 유전 요소로서 확립될 수 있게 한다. 특히 세균에서 사용될 때, 벡터는 특수 플라스미드, 즉 원형 유전 요소이다. 본원의 상황에서, 본원에서 고려되는 바와 같은 핵산은 벡터내로 클로닝된다. 벡터 중에는, 예를 들어 세균 플라스미드, 바이러스 또는 박테리오파지 기원의 벡터, 또는 우세하게는 합성인 벡터 또는 광범위하게 다양한 유도체의 요소를 갖는 플라스미드가 포함된다. 각각의 경우에 존재하는 추가의 유전 요소를 사용하여, 벡터는 여러 세대에 걸쳐 관련 숙주 세포에서 안정한 단위로서 스스로 확립될 수 있다. 벡터는 별도의 단위로서 염색체외에 존재하거나 또는 각각 염색체내에, 염색체 DNA내에 통합될 수 있다.
발현 벡터는 숙주 세포에서, 상기 벡터를 함유하는 선호 미생물, 특히 바람직하게는 세균에 의해 복제가 가능하고 상기 중에서 함유된 핵산의 발현이 가능한 핵산 서열을 포함한다. 따라서, 다양한 구현예에서, 본원에 기재된 벡터는 본 발명의 폴리펩티드를 암호화하는 핵산의 발현을 조절하는 조절 요소를 함유한다. 발현은 특히 전사를 조절하는 프로모터 또는 프로모터들에 의해 영향을 받는다. 발현은 주로 발현하고자 하는 핵산의 앞에 원래 위치하는 천연 프로모터에 의해서뿐만 아니라, 발현 벡터에 공급된 숙주-세포 프로모터에 의해 또는 또 다른 유기체 또는 또 다른 숙주 세포의 변형된, 또는 완전히 상이한 프로모터에 의해 발생할 수 있다. 본 발명의 경우에 본원에서 고려되는 바와 같은 핵산의 발현에 적어도 하나의 프로모터가 이용될 수 있으며 그의 발현에 사용된다. 발현 벡터는 더욱 또한, 예를 들어 배양 조건의 변화에 의해 또는 상기를 함유하는 숙주 세포가 특정한 세포 밀도에 도달하는 경우에, 또는 특정한 물질, 특히 유전자 발현의 활성제의 첨가에 의해 조절될 수 있다. 상기와 같은 물질의 일례는 갈락토스 유도체 이소프로필-베타-D-티오갈락토피라노사이드(IPTG)이며, 이는 세균 락토스 오페론(lac 오페론)의 활성제로서 사용된다. 발현 벡터와 대조적으로, 함유된 핵산은 클로닝 벡터에서 발현되지 않는다.
추가의 태양에서, 본 발명은 또한 본원에서 고려되는 바와 같은 핵산 또는 본원에서 고려되는 바와 같은 벡터를 함유하는 숙주 세포, 바람직하게는 비-인간 숙주 세포에 관한 것이다. 본원에서 고려되는 바와 같은 핵산 또는 본원에서 고려되는 바와 같은 벡터는 바람직하게는 미생물로 형질전환되며, 미생물은 하나의 구현예에 따른 숙주 세포를 나타낸다. 세포의 형질전환 방법은 기존 분야에 확립되어 있으며 당업자에게 충분히 공지되어 있다. 모든 세포, 즉 원핵생물 또는 진핵생물 세포가 대체로 숙주 세포로서 적합하다. 유전학적으로, 예를 들어 핵산 또는 벡터를 사용하는 형질전환 및 그의 안정한 확립에 관하여 유리한 방식으로 조작될 수 있는 숙주 세포, 예를 들어 단세포 진균 또는 세균이 바람직하다. 또한, 바람직한 숙주 세포는 미생물학적 및 생물공학적 조건으로 쉽게 조작되는 것으로 유명하다. 이는 예를 들어 용이한 배양성, 높은 증식률, 발효 배지에 관한 낮은 요구, 및 외부 단백질에 대한 양호한 생산 및 분비율을 지칭한다. 더욱 또한 폴리펩티드를 그의 제조 후에, 상기를 생산하는 세포에 의해, 예를 들어 당 분자의 첨가, 포르밀화, 아민화 등에 의해 변형시킬 수 있다. 이러한 종류의 번역-후 변형은 폴리펩티드에 기능적으로 영향을 미칠 수 있다.
추가의 구현예를, 예를 들어 벡터 상에서 이용가능하게 만들어진 유전자 조절 요소에 기초하여 조절될 수 있지만 또한 그러한 세포에 선험적으로 존재할 수 있는 활성을 갖는 숙주 세포에 의해 나타낸다. 예를 들어, 활성화제로서 작용하는 화학적 화합물의 조절된 첨가에 의해, 배양 조건 수정에 의해, 또는 특정 세포 밀도에 도달했을 때 발현을 자극할 수 있다. 이는 본원에서 고려되는 단백질의 경제적인 생산을 가능하게 한다. 이러한 화합물의 일례는 앞서 기재한 바와 같은 IPTG이다.
바람직한 숙주 세포는 원핵생물 또는 세균 세포, 예를 들어 이 콜라이 세포이다. 세균은 생성 시간이 짧고 배양 조건 측면에서 요구 사항이 적다. 결과적으로, 경제적인 배양 방법 및 제조 방법을 확립할 수 있다. 또한, 당업자는 발효 기술에 있어서 세균과 관련된 풍부한 경험을 가지고 있다. 그람-음성 또는 그람-양성 세균은 영양 공급원, 생성물 형성 속도, 시간 요구 사항 등과 같은 개별적인 경우에 실험적으로 확인되어야 하는 매우 다양한 이유로 인해 특정한 생산 사례에 적합할 수 있다. 다양한 구현예에서, 숙주 세포는 이 콜라이 세포일 수 있다.
본원에서 고려되는 숙주 세포는 배양 조건에 대한 그의 필요조건에 관하여 변형되거나, 다른 또는 추가적인 선택 마커를 포함하거나, 또는 다른 또는 추가적인 단백질을 또한 발현할 수 있다. 상기는 특히 다수의 단백질 또는 효소를 트랜스제닉하게 발현하는 숙주 세포일 수 있다.
그러나, 숙주 세포는 또한 세포 핵을 가짐을 특징으로 하는 진핵생물 세포일 수 있다. 따라서 추가의 구현예를 세포 핵을 가짐을 특징으로 하는 숙주 세포에 의해 나타낸다. 원핵생물 세포와 대조적으로, 진핵생물 세포는 형성되는 단백질을 번역-후 변형시킬 수 있다. 그의 예는 진균, 예를 들어 방선균, 또는 효모, 예를 들어 사카로마이세스 또는 클루이베로마이세스 또는 곤충 세포, 예를 들어 Sf9 세포이다. 이는 예를 들어 단백질이 그의 합성과 관련하여 상기와 같은 시스템에 의해 가능해지는 특정한 변형을 경험하고자 하는 경우 특히 유리할 수 있다. 진핵생물계가 특히 단백질 합성과 관련하여 수행하는 변형 중에는 예를 들어 저분자량 화합물, 예를 들어 막 앵커 또는 올리고사카라이드의 결합이 있다. 따라서, 다양한 구현예에서, 숙주 세포는 진핵생물 세포, 예를 들어 곤충 세포, 예를 들어 Sf9 세포이다.
본원에서 고려되는 숙주 세포를 통상적인 방식으로, 예를 들어 불연속 또는 연속 시스템으로 배양하고 발효시킨다. 전자의 경우에 적합한 영양 배지에 숙주 세포를 접종하고, 실험적으로 확인하고자 하는 기간 후에 배지로부터 생성물을 수확한다. 비교적 오랜 기간에 걸쳐 세포가 부분적으로 죽고 또한 부분적으로 새로 교체되며, 형성된 단백질을 배지로부터 동시에 수득할 수 있는 연속 발효가 흐름 평형의 성취로 유명하다.
본원에서 고려되는 숙주 세포는 본원에 기재된 폴리펩티드의 제조에 바람직하게 사용된다.
따라서 본 발명의 추가의 태양은 본원에 기재된 바와 같은 폴리펩티드의 제조 방법이며, 본원에서 고려되는 숙주 세포를 배양하고; 배양 배지로부터 또는 숙주 세포로부터 폴리펩티드를 단리함을 포함한다. 배양 조건 및 배지는 당해 분야에 공지된 일반적인 지식 및 기법에 따라, 사용된 숙주 유기체에 기초하여 당업자에 의해 선택될 수 있다.
더욱 추가의 태양에서, 본 발명은 단백질 결찰을 위한, 특히 하나 이상의 펩티드(들)의 고리화를 위한 상술한 폴리펩티드의 용도에 관한 것이다.
본원에 기재된 효소의 용도를 하기의 펩티드 기질을 참조하여 기재하지만, 이를 상응하는 폴리펩티드 또는 단백질에 유사하게 사용할 수 있음을 이해한다. 따라서 본 발명은 또한 폴리펩티드 또는 단백질이 기질로서 사용되는 구현예를 포함한다. 이들 폴리펩티드 또는 단백질은 펩티드 기질의 상황에서 하기에 기재하는 바와 같은 구조 동기를 포함할 수 있다. 또한, 펩티드 단편, 예를 들어 기능성을 유지하는 인간 펩티드 호르몬의 단편, 또는 (주쇄) 변형된 펩티드와 같은 펩티드 유도체, 예를 들어 티오뎁시펩티드가 사용되는 구현예가 포함된다. 상응하게, 본 발명은 또한 본원에 개시된 펩티드 기질의 단편 및 유도체를 포함한다.
다양한 구현예에서 결찰되거나 고리화되는 펩티드는 리가제/사이클라제에 의해 인식되고, 결합되고 결찰되는 인식 및 결찰 서열을 함유하는 한 임의의 펩티드, 전형적으로는 적어도 10 아미노산 길이의 펩티드일 수 있다. 결찰되거나 고리화되는 펩티드의 상기 아미노산 서열은 아미노산 잔기 N 또는 D, 바람직하게는 N을 포함할 수 있다. 다양한 구현예에서, 고리화되거나 결찰되는 펩티드는 아미노산 서열 (X)oN/D(X)p (이때 X는 임의의 아미노산이고, o는 1 이상, 바람직하게는 2 이상의 정수이고, p는 1 이상, 바람직하게는 2 이상의 정수이다)을 포함한다. 바람직한 구현예에서, (X)p 는 X3X4(X)r, H(X)r 또는 HV(X)r 이고, 이때 X3은 P를 제외한 임의의 아미노산, 바람직하게는 H, G 또는 S이고, X4 는 소수성 또는 방향족 아미노산이고, 바람직하게는 L, I, V, F, C, W, Y 및 M 중에서 선택되고, r은 0 또는 1 이상의 정수이다. 다양한 구현예에서, 펩티드는 아미노산 서열 (X)oNH 또는 (X)oNHV 또는 (X)oNGL 또는 (X)oNSL을 포함한다. 상기 아미노산 서열은, N에 대한 C-말단의 모든 아미노산이 결찰/고리화 중에 절단될 것이므로, 바람직하게는 결찰되거나 고리화되는 펩티드의 C-말단 또는 그 부근에 위치한다. 상응하게, 상기 언급한 모든 구현예에서, p 또는 r은 바람직하게는 20 이하, 바람직하게는 5 이하의 정수이다. p가 2이고, 이때 (X)p 가 바람직하게는 상기 정의된 바와 같은 X3X4(X)r 이며, r이 임의로 0인 구현예가 특히 바람직하다.
대안의 구현예에서, 결찰되거나 고리화되는 펩티드는 아미노산 서열 (X)oN*/D*을 가지며, 여기에서 X는 임의의 아미노산이고, o는 적어도 2의 정수이며, C-말단 카복시 기(N 또는 D 잔기의)는 화학식 -C(O)-N(R')2의 기에 의해 교체되고, 이때 R'는 임의의 잔기, 예를 들어 알킬이다. 상기와 같은 구현예에서, N 또는 D 잔기의 말단 -C(O)OH 기, 바람직하게는 D의 경우에 알파-카복시 기는 -C(O)-N(R')2 기를 형성하도록 변형된다. 이들 C-말단 아미드화된 D 또는 N 잔기를 본원에서는 각각 D* 및 N*로 나타낸다. 본원에 개시된 효소는 아미드 기를 절단하고 상기 N 또는 D 잔기를 또 다른 관심 펩티드의 N-말단, 또는 N 또는 D 잔기를 포함하는 동일한 펩티드의 N-말단에 결찰시킬 수 있는 것으로 밝혀졌다.
결찰되는 펩티드의 N-말단 부분은 바람직하게는 아미노산 서열 X1X2(X)q을 포함하며, 여기에서 X는 임의의 아미노산일 수 있고; X1은 Pro를 제외한 임의의 아미노산일 수 있고; X2는 임의의 아미노산일 수는 있으나, 바람직하게는 소수성 아미노산, 예를 들어 Val, Ile 또는 Leu, 또는 Cys이고; q는 0 또는 1 이상의 정수이다. X1 위치는 하기의 순으로 바람직하다: G = H >M = W = F = R = A = I = K = L = N = S = Q = C>T = V = Y>D = E. "="는 각각의 아미노산이 유사하게 바람직함을 가리키는 반면, ">"는 기호 뒤에 나열된 것들에 비해 기호 앞에 나열된 아미노산이 바람직함을 가리킨다. X2 위치에서 하기의 순서가 바람직하다: L > V > I > C > T > W > A = F > Y > M > Q > S. X2 위치에서 덜 바람직한 것은 P, D, E, G, K, R, N 및 H이다. X1 위치에서 특히 바람직한 것은 G 및 H이고 X2 위치에서는 L, V, I 및 C이다, 예를 들어 디펩티드 서열 GL, GV, GI, GC, HL, HV, HI 및 HC이다.
따라서 바람직한 구현예에서, 결찰되거나 고리화되는 펩티드는 -N에서 C-말단 방향으로, 아미노산 서열 X1X2(X)q(X)oN/D(X)p을 포함하며, 여기에서 X, X1, X2, o, p, 및 q는 상기와 같이 정의되고, 이때 o는 바람직하게는 적어도 7이다. 다양한 구현예에서, (1) q는 0이고 o는 적어도 7의 정수이며; 및/또는 (2) X1은 G 또는 H이고; 및/또는 (3) X2 는 L, V, I 또는 C이고; 및/또는 (4) p는 2 이상 22 이하, 바람직하게는 2 내지 7이고, 보다 바람직하게는 H(X)r 또는 HV(X)r, 가장 바람직하게는 HX 또는 HV이다. 다양한 구현예에서, (1) q는 0이고 o는 적어도 7의 정수이고; (2) X1은 G 또는 H이고; (3) X2는 L, V, I 또는 C이고; (4) p는 2 이상 22 이하, 바람직하게는 2 내지 7이고, 보다 바람직하게는 (X)p는 X3X4(X)r, H(X)r 또는 HV(X)r, 가장 바람직하게는 HX 또는 HV 또는 XL 또는 GL 또는 XS 또는 LS이다.
다양한 구현예에서, 고리화되는 펩티드는 고리형 시스틴 매듭 폴리펩티드, 특히 사이클로티드의 선형 전구체 형태이다. 사이클로티드는 대단히 안정한 식물 단백질의 위상학적으로 독특한 패밀리이다. 상기는 6개의 보존된 시스테인 잔기와 연관된 시스틴 매듭 동기에 의해 추가로 억제되는 헤드-투-테일 고리화된 펩티드 주쇄로 배열된 ∼30 아미노산을 포함한다. 시스틴 매듭은 2개의 디설파이드 결합, 및 제3 디설파이드 결합에 의해 나사산이 연결된 구조에서 내부 고리를 형성하는 연결 주쇄 분절로부터 형성되어 맞물리고 교차하여 버티는 구조를 형성한다. 이러한 시스틴 매듭 코어 동기 위에, 잘-한정된 베타 시트와 짧은 표면 노출된 루프를 나타내는 일련의 회전이 겹쳐놓인다.
사이클로티드는 그의 주쇄 루프내에서 다양한 펩티드 서열을 발현하며 광범위한 생물학적 활성을 갖는다. 따라서 상기는 약학적 용도에 대단히 중요하다. 상기가 유래되는 일부 식물은, 원형 사이클로티드 칼라타 B1(kB1)을 함유하는, 아프리카에서 출산 촉진에 사용되는 올덴란디아 아피니스(Oldenlandia affinis) 식물의 차인 칼라타-칼라타를 포함하여 토착 의약품에 사용된다. 이들의 탁월한 안정성은 펩티드 기반 약물 설계 용도에서 잠재적인 주형으로서 주목받고 있음을 의미한다. 특히, 생물활성 펩티드 서열을 사이클로티드 프레임워크에 접목시키는 것은 펩티드-기반 요법을 안정화시키고, 이에 의해 약물로서 펩티드의 용도에 대한 주요 한계 중 하나를 극복하는 새로운 접근 방식을 약속한다.
따라서 다양한 구현예에서, 고리화되는 펩티드는 10 이상의 아미노산 길이, 바람직하게는 50 이하의 아미노산, 일부 구현예에서 약 25 내지 35의 아미노산 길이이다. 고리화되는 펩티드는 서열번호 20에 제시된 바와 같은 올덴란디아 아피니스로부터의 사이클로티드 칼라타 B1의 전구체의 아미노산을 포함하거나 상기 아미노산으로 이루어질 수 있다.
다양한 구현예에서, 고리화되는 펩티드는 아미노산 서열 (X)nC(X)nC(X)nC(X)nC(X)nC(X)nC(X)nNHV(X)n을 포함하거나 또는 상기 서열로 이루어지며, 여기에서 각각의 n은 1 내지 6 중에서 독립적으로 선택된 정수이고, X는 임의의 아미노산일 수 있다. 상기와 같은 펩티드는 상술한 바와 같이, 6개의 시스테인 잔기들간에 시스틴 결합을 형성하고, C-말단 HV(X)n 서열을 절단하고 (이어서 C-말단) N 잔기를 N-말단 잔기에 결찰시킴으로써 본원에 기재된 효소에 의해 고리화될 수 있는 고리형 시스틴 매듭 폴리펩티드의 전구체이다.
고리화되는 펩티드는 다양한 구현예에서 US2012/0244575에 개시된 선형 전구체를 포함할 수 있다. 상기 문서는 상기 목적을 위해 내용 전체가 본원에 참고로 인용된다.
다양한 추가의 구현예에서, 고리화되는 펩티드는 비제한적으로 펩티드 독소 및 항균 펩티드, 예를 들어 박테리오신, 예를 들어 박테리오신 AS-48(서열번호 19), 코노톡신, 타나틴(곤충 항균 펩티드) 및 히스타틴(인간 타액 항균 펩티드)의 선형 전구체를 포함한다. 고리화될 수 있는 다른 펩티드는 비제한적으로 뉴로메딘, 살루신 알파, 아펠린 및 갈라닌을 포함하는, 고리형 인간 또는 동물 펩티드 호르몬의 전구체이다. 예시적인 펩티드는 서열번호 21-31에 제시된 아미노산 서열 중 어느 하나를 포함하거나 또는 이들로 이루어진다.
본원에 개시된 효소 및 방법을 사용하여 결찰되거나 고리화될 수 있는 추가의 펩티드는 비제한적으로 부신피질 자극 호르몬(ACTH), 아드레노메둘린, 인터메딘, 프로아드레노메둘린, 아드로핀, 아젤레닌, AGRP, 알라린, 인슐린 유사 성장 인자 결합 단백질 5, 아밀린, 아밀로이드 b-단백질, 양친매성 펩티드 항생제, LAH4, 안지오텐신 I, 안지오텐신 II, A-유형(심방) 나트륨뇨 펩티드(ANP), 아파민, 아펠린, 비발리루딘, 봄베신, 리실-브래디키닌, B형(뇌) 나트륨뇨 펩티드, C-펩티드(인슐린 전구체), 칼시토닌, 코카인 및 암페타민 조절 전사체(CART), 칼시토닌 유전자 관련 펩티드(CGRP), 콜레시스토키닌(CCK)-33, 사이토카인 유도 호중구 화학 유인 물질-1/성장 관련 종양 유전자(CINC), 콜리벨린, 부신피질 자극 호르몬 방출 인자(CRF), 코르티스타틴, C형 나트륨뇨 펩티드(CNP), 데코신, 인간 호중구 펩티드-1(HNP-1), HNP-2, HNP-3, HNP-4, 인간 디펜신 HD5, HD6, 인간 베타 디펜신-1(hbd1), hbd2, hbd3, hbd4, 델타 수면-유도 펩티드(DSIP), 덤시딘-1L, 다이노르핀 A, 엘라핀, 엔도키닌 C, 엔도키닌 D, b-리포트로핀, g-엔돌핀, 엔도텔린-1, 엔도텔린-2, 엔도텔린-3, 큰-엔도텔린-1, 큰-엔도텔린-2, 큰-엔도텔린-3, 엔푸비리티드, 엑센딘-4, MBP, 마이엘린 올리고덴드로사이트 단백질(MOG), Glu-피브리노펩티드 B, 갈라닌, 갈라닌-유사 펩티드, 큰 가스트린(인간), 위 억제성 폴리펩티드(GIP), 가스트린 방출 펩티드, 그렐린, 글루카곤, 글루카곤-유사 펩티드-1(GLP-1), GLP-2, 성장 호르몬 방출 인자(GRF, GHRF), 구아닐린, 유로구아닐린, 유로구아닐린 이성질체 A, 유로구아닐린 이성질체 B, 헵시딘, 간-발현된 항균 펩티드(LEAP-2), 휴머닌, 결합 펩티드(rJP), 키스펩틴-10, 키스펩틴-54, 리라글루티드, LL-37(인간 카텔리시딘), 황체형성호르몬 방출 호르몬(LHRH), 마가이닌 1, 마스토파란, 알파교배인자, 비만세포탈과립(MCD) 펩티드, 멜라닌-농축 호르몬(MCH), 알파-멜라닌세포 자극호르몬(알파-MSH), 미드카인, 모틸린, 신경내분비 조절 펩티드 1(NERP1), NERP2, 뉴로키닌 A, 뉴로키닌 B, 뉴로메딘 B, 뉴로메딘 C, 뉴로메딘 S, 뉴로메딘 U8, 뉴로노스타틴-13, 뉴로펩티드 B-29, 뉴로펩티드 S(NPS), 뉴로펩티드 W-30, 뉴로펩티드 Y(NPY), 뉴로텐신, 노시셉틴, 노시스타틴, 오베스타틴, 오렉신-A, 오스테오칼신, 옥시토신, 카테스타틴, 크로모그라닌 A, 부갑상선 호르몬 (PTH), 펩티드 YY, 뇌하수체 아데닐레이트 사이클라제 활성화 폴리펩티드 38(PACAP-38), 혈소판 인자-4, 플렉타신, 플레이오트로핀, 프로락틴 방출 펩티드, 피로글루타밀화 RF아미드 펩티드(QRFP), RF아미드 관련 펩티드-1, 세크레틴, 혈청 흉선 인자(FTS), 나트륨 칼륨 ATPase 억제제-1(SPAI-1), 소마토스타틴, 소마토스타틴-28, 스트레스코핀, 유로코르틴, 물질 P, 에키스타틴, 엔테로톡신 STp, 광시톡신-1E, 유로텐신 II, 혈관 활성 장 펩티드(VIP), 및 바소프레신뿐만 아니라 이들의 단편 및 유도체를 포함한다. 상기 언급한 펩티드는 인간 또는 동물, 예를 들어 래트, 마우스, 돼지 기원의 것일 수 있다. 이들은 모두 당업자에게 주지되어 있으며 이들의 아미노산 서열은 쉽게 입수가능하다.
다양한 다른 구현예에서, 50 아미노산 초과 길이의 폴리펩티드 또는 단백질이 고리화 물질로서 사용된다. 상기와 같은 반응에서, 폴리펩티드/단백질은 그의 C-말단을 그의 N-말단에 결찰함으로써 고리화될 수 있다.
다양한 구현예에서, 2개 이상의 펩티드를 본 발명의 효소에 의해 결찰한다. 이는 2개 이상의 펩티드로 이루어지는 거대고리, 바람직하게는 거대고리 이량체의 형성을 포함할 수 있다. 결찰되는 펩티드는, 상기 중 적어도 하나가 리가제/사이클라제에 의해 인식되고 결합되고 결찰되는 인식 및 결찰 서열을 함유하는 한, 임의의 펩티드일 수 있다. 적합한 펩티드는 고리화 전략과 관련하여 상기에 기재되었다. 동일한 펩티드를 또한 동일하거나 상이할 수 있는 또 다른 펩티드에의 결찰에 사용할 수 있다. 결찰되는 펩티드 중 하나는 예를 들어 효소 활성 또는 또 다른 생물학적 기능을 갖는 폴리펩티드일 수 있다. 결찰되는 펩티드는 또한 마커 펩티드, 또는 검출가능한 마커, 예를 들어 형광 마커 또는 비오틴을 포함하는 펩티드를 포함할 수 있다. 상기와 같은 구현예에 따라, 생물활성을 갖는 폴리펩티드를 검출가능한 마커에 융합시킬 수 있다. 다양한 구현예에서, 결찰되는 펩티드 중 적어도 하나는 25 아미노산 이상, 바람직하게는 50 아미노산 이상의 길이를 갖는다(따라서 본 발명의 의미에서 "폴리펩티드"일 수 있다).
결찰되는 펩티드는 서열번호 32 내지 42에 제시된 아미노산 서열 중 어느 하나를 포함하거나 또는 상기 서열로 이루어질 수 있다. 결찰되어 (거대고리) 이량체를 형성하는 바람직한 펩티드는 서열번호 32 내지 36 중 어느 하나에 제시된 아미노산 서열을 갖는 펩티드를 포함한다. 결찰되어(하나의 C-말단 펩티드와 함께) 선형 융합 펩티드를 형성하는 바람직한 N-말단 펩티드는 서열번호 22, 25 및 32 중 어느 하나에 제시된 아미노산 서열을 갖는 펩티드를 포함한다. 결찰되어(하나의 N-말단 펩티드와 함께) 선형 융합 펩티드를 형성하는 바람직한 C-말단 펩티드는 서열번호 23, 24 및 26 중 어느 하나에 제시된 아미노산 서열을 갖는 펩티드를 포함한다.
결찰되거나 고리화되는 펩티드는 또한 Asx-함유 태그가, 결찰되거나 융합시키고자 하는 관심 펩티드에 C-말단 융합된 융합 펩티드 또는 폴리펩티드일 수 있다. Asx-함유 태그는 바람직하게는, 다양한 구현예를 포함하여 상기에서 정의된 바와 같은 아미노산 서열 N/D(X)p을 갖는다. 한편으로, 아미드화된 N 또는 D(상기에 정의된 바와 같은 N* 또는 D*)를 결찰되거나 융합되는 펩티드 또는 폴리펩티드의 C-말단 단부에 융합시킬 수 있다. 상기 융합 펩티드 또는 폴리펩티드가 결찰되는 다른 펩티드는 상기에 정의된 바와 같을 수 있다. 한편으로, 융합 펩티드 또는 폴리펩티드를 그의 C- 및 N-말단 사이에 결합을 형성시킴으로써 고리화될 수 있다. 하나의 구현예에서, 융합 펩티드 또는 폴리펩티드는 아미노산 서열 NHV(서열번호 43)의 C-말단 태그에 융합된 녹색 형광 단백질(GFP)일 수 있으며, 결찰된 펩티드는 아미노산 서열 GIGK(비오틴화된)R(서열번호 44)의 비오틴화된 펩티드일 수 있다. 일반적으로, 펩티드, 예를 들어 신호전달 또는 검출가능한 부분을 갖는 펩티드에 결찰되거나 또는 본원에 기재된 방법 및 용도를 사용하여 고리화될 수 있는 폴리펩티드 및 단백질은 비제한적으로 항체, 항체 단편, 항체-유사 분자, 항체 모방물질, 펩티드 앱타머, 호르몬, 다양한 치료학적 단백질 등을 포함한다.
다양한 구현예에서, 리가제 활성을 사용하여 검출가능한 부분, 예를 들어 플루오레세인을 포함하는 형광 그룹, 예를 들어 플루오레세인 이소티오시아네이트(FITC) 또는 쿠마린, 예를 들어 7-아미노-4-메틸쿠마린을 갖는 펩티드를 폴리펩티드 또는 단백질, 예를 들어 상기에 언급된 것들에 융합시킨다. 다양한 구현예에서, 단백질은 예를 들어 서열번호 45에 제시된 아미노산 서열을 갖는 항체 단편, 예를 들어 인간 항-ABL scFv, 또는 예를 들어 서열번호 46에 제시된 아미노산 서열을 갖는 달핀(darpin)(설계된 안키린 반복 단백질), 예를 들어 인간 ERK에 특이적인 달핀일 수 있다.
검출가능한 마커, 예를 들어 플루오레세인 또는 그의 유도체 및/또는 원소 I-125 또는 I-131로 쉽게 방사성표지될 수 있는 펩티드의 사용은 PET 또는 SPECT를 사용하는 생체내 종양의 단일 시약 영상화에 이은 기관 섹션 또는 생검 중의 형광 검출의 사용을 허용한다.
더욱 또 다른 태양에서, 본 발명은 펩티드, 폴리펩티드 또는 단백질의 고리화 방법에 관한 것이며, 상기 방법은 상기 펩티드, 폴리펩티드 또는 단백질을 상기 펩티드의 고리화를 허용하는 조건하에서 발명의 용도와 관련하여 상술한 리가제/사이클라제 활성을 갖는 폴리펩티드와 배양함을 포함한다.
더욱 추가의 태양에서, 본 발명은 적어도 2개의 펩티드, 폴리펩티드 또는 단백질의 결찰 방법에 관한 것이며, 상기 방법은 상기 펩티드, 폴리펩티드 또는 단백질을 상기 펩티드의 결찰을 허용하는 조건하에서 발명의 용도와 관련하여 상술한 폴리펩티드와 배양함을 포함한다.
이들 방법에 따라 고리화되고 결찰되는 펩티드, 폴리펩티드 및 단백질은 다양한 구현예에서 상술한 용도에 따라 고리화되고 결찰되는 펩티드, 폴리펩티드 및 단백질로서 유사하게 정의된다.
본원에 기재된 방법 및 용도에서, 효소 및 기질을 1:100 이상, 바람직하게는 1:400 이상, 보다 바람직하게는 적어도 1:1000의 몰비로 사용할 수 있다.
반응을 전형적으로는 최적의 효소 활성을 허용하는 온도에서, 대개는 주변 온도(20℃) 내지 40℃에서 적합한 완충제 시스템에서 수행한다.
고체 지지체상에 효소를 고정화시키는 것은 동일한 배치의 효소를 반복적으로 사용함으로써 효소 소비를 낮추는 1차적인 목적을 갖는 오랜 역사를 지니고 있다. 또한, 고상 고정화의 부위-분리는 응집을 감소시켜 생물촉매의 증가된 안정성과 활성으로 이어지며, 효소에 의한 생성물의 오염을 피함으로써 정제를 단순화한다. 결과적으로, 고정화된 생물촉매는 식품 산업의 고정화된 락타제 및 바이오디젤 생산의 고정화된 리파제와 같은 10억 규모의 시장에 산업용으로 개발되었다. 화학 촉매를 사용하는 기존의 산업 공정과 비교할 때 고정화 효소는 경제적으로 매력적이고 환경 친화적이다.
공유 또는 비공유 담체에 대한 부착, 물리적 포획 및 자기-가교를 포함하는 3가지 주요 고정화 기술이 존재한다. 생물분자-기반 기질에 대해 노출된 기질 결합 표면이 있는 PAL과 같은 생물촉매의 경우, 공유-결합 및 친화성-결합 방법에 의한 친수성 다공성 수지에 대한 부착을 기반으로 하는 전략은 직접적이고 편리하며 수성 조건에서 성능을 촉진할 수 있다.
따라서 고정화된 펩티드 리가제는 안정적이고 재사용 가능하며 거대고리화 및 부위-특이적 결찰 반응을 매개하는데 매우 효율적이다.
발명자는 천연 부텔라제-1 및 재조합 발현된 아스파라지닐 리가제 VyPAL2를 고정화시키는 다양한 방법을 비교하였다. 놀랍게도, PAL의 고정화는 중성 pH에 가까운 pH에서 매우 느린 속도임에도 불구하고, 덜 활성인 형태로의 응집 및 자가분해를 포함한 용해성 효소의 한계를 극복한다는 것이 발견되었다. 고체 지지체에의 고정화의 주요 이점은 부위 분리 및 유사 희석을 제공하여 트랜스 자가분해 분해를 방지하고 안정성을 향상시킨다. 본 발명자들은 고정화된 리가제의 이러한 주요 이점을 확인하였다: 감소되지 않은 효소 활성, 향상된 안정성 및 연장된 저장 수명, 더 간단한 하류 정제 공정으로 재사용 가능한 >100회 실행. 더 중요한 것은, 고정화된 효소의 부위 분리가 높은 효소 농도의 사용을 허용하여 고리화, 고리올리고머화 및 결찰 반응과 같은 결찰 반응을 몇 분 안에 완료할 수 있도록 하는 것으로 밝혀졌다. 이러한 이점은 리가제의 양을 줄이고, 산업적 규모를 위한 확장 사용 및 나노 장치에 대한 적응에 좋은 징조이다.
상응하게, 본 발명의 하나의 태양에서, 상술한 방법 및 용도에서 리가제/사이클라제 활성을 갖는 폴리펩티드를 적합한 지지체 물질상에 고정화시킬 수 있다. 적합한 지지체 물질은 크로마토그래피 컬럼 등에 사용되는 다양한 수지 및 중합체를 포함한다. 지지체는 비드의 형태를 갖거나 보다 큰 구조의 표면을 가질 수 있다, 예를 들어 미세적정 플레이트일 수 있다. 고정화는 기질과의 매우 용이하고 간단한 접촉뿐만 아니라 합성후 효소와 기질의 용이한 분리를 허용한다. 효소 기능을 갖는 폴리펩티드가 고체 컬럼 물질상에 고정화되는 경우, 결찰/고리화가 연속 공정이고/이거나 기질/생성물 용액을 컬럼상에서 순환시킬 수 있다.
상응하게, 본 발명은 하나의 태양에서 본 발명에 따른 단리된 폴리펩티드가 표면에 고정화된 고체 지지체 물질을 또한 포함한다. 고체 지지체 물질은 바람직하게는 미립자 형태의 중합체 수지, 예를 들어 상기에 언급한 것을 포함할 수 있다. 단리된 폴리펩티드를 공유 또는 비-공유 상호작용에 의해 고체 지지체 물질상에 고정화시킬 수 있다. 고체 지지체는 예를 들어 아가로스 비드일 수 있다.
예시적인 구현예에서, 리가제/사이클라제 활성을 갖는 폴리펩티드를 글리코실화하며 콘카나발린 A(Con A), 렉틴(탄수화물-결합 단백질)(카나발리아 엔시포르미스(Canavalia ensiformis)(작두콩)로부터 단리된다)에 의해 고정화시킬 수 있다. 상기는 당단백질 및 당지질을 포함하여, α-D-만노스 및 α-D-글루코스 함유 생물분자에 특이적으로 결합한다. 상기 ConA 단백질은 친화성 컬럼에 고정화된 형태로 사용되어 당단백질 및 당지질을 고정화시킨다. 상응하게, 다양한 구현예에서, 리가제/사이클라제 활성을 갖는 단리된 폴리펩티드를 글리코실화하고, 고체 지지체 물질 표면상에 커플링된 탄수화물-결합 부분, 바람직하게는 콘카나발린 A에 비-공유 결합시킨다. 본 발명의 글리코실화된 폴리펩티드의 구현예는 상기에 기재되었다.
상술한 고체 지지체 물질을 적어도 하나의 기질 펩티드의 컬럼-상 고리화 및/또는 결찰 또는 적어도 하나의 기질 펩티드의 고리화 또는 결찰 방법에 사용할 수 있으며, 방법은 적어도 하나의 기질 펩티드를 포함하는 용액을 적어도 하나의 기질 펩티드의 고리화 및/또는 결찰을 허용하는 조건하에서 상술한 고체 지지체 물질과 접촉시킴을 포함한다. 기질 펩티드는 상기에 기재된 것이며 상기 폴리펩티드 기질을 또한 포함한다.
다양한 구현예에서, 리가제 또는 사이클라제 활성을 갖는 폴리펩티드를 글리코실화하고 고정화를 고체 지지체와 공유적으로 연결된 탄수화물-결합 부분, 바람직하게는 콘카나발린 A 부분 또는 그의 변체와의 상호작용에 의해 촉진한다. 상기와 같은 구현예에서, 본 발명의 폴리펩티드는 부텔라제-1(서열번호 18(활성 단편) 또는 서열번호 88(완전길이 서열)의 아미노산 서열을 포함한다)일 수 있으며 고체 지지체는 아가로스 비드일 수 있다.
다양한 다른 구현예에서, 리가제 또는 사이클라제 활성을 갖는 폴리펩티드를 비오틴화하고 고정화를 고체 지지체에 공유적으로 연결된 비오틴-결합 부분, 바람직하게는 스트렙트아비딘, 아비딘 또는 뉴트라비딘 부분 또는 그의 변체와의 상호작용에 의해 촉진한다. 비오틴에 의한 폴리펩티드의 기능화는 당해 분야에 공지된 방법, 예를 들어 N-하이드록시숙신이미드(NHS)를 갖는 비오틴 에스테르, 예를 들어 숙신이미딜-6-(비오틴아미도)헥사노에이트에 의한 기능화를 사용하여 성취될 수 있다. 상기와 같은 구현예에서, 폴리펩티드는 서열번호 1 또는 2의 아미노산 서열을 갖는 VyPAL2 또는 본원에 정의된 바와 같은 그의 변체일 수 있다. 고체 지지체는 아가로스 비드일 수 있으며 비오틴-결합 부분은 아비딘 변체, 예를 들어 뉴트라비딘(데글리코실화된 아비딘)일 수 있다.
다양한 구현예에서, 리가제 또는 사이클라제 활성을 갖는 폴리펩티드를, 폴리펩티드 중의, 예를 들어 리신 측쇄로부터의 유리 아미노기와 고체 지지체 표면상의 N-하이드록시숙신이미드 작용기와의 반응에 의해 고체 지지체상에 고정화시킨다. 고체 지지체는 아가로스 비드일 수 있으며 폴리펩티드는 서열번호 1 또는 2의 아미노산 서열을 갖는 VyPAL2 또는 본원에 정의된 바와 같은 그의 변체일 수 있다.
다양한 추가의 태양에서, 본 발명은 또한 아스파라지닐 엔도펩티다제(AEP) 활성을 갖는 폴리펩티드의 단백질 리가제 활성을 증가시키는 방법을 특징으로 하며, 방법은 서열번호 1의 126번 위치에 상응하는 위치의 아미노산 잔기를 작은 소수성 잔기 또는 G 잔기, 바람직하게는 A 또는 G 잔기로 치환시키는 단계를 포함한다. 다양한 구현예에서, 서열번호 1의 127번 위치에 상응하는 위치의 아미노산 잔기는, 특히 서열번호 1의 126번 위치에 상응하는 위치가 G인 경우, A이다. 다양한 구현예에서, 서열번호 1의 127번 위치에 상응하는 위치의 아미노산 잔기는, 특히 서열번호 1의 126번 위치에 상응하는 위치가 A인 경우, P이다. 다양한 구현예에서, 서열번호 1의 126 및 127번 위치에 상응하는 위치의 동기는 GP가 아니고, AP, AA 또는 GA이다. 서열번호 1의 127번 위치에 상응하는 위치의 아미노산이 동기 AP, AA 또는 GA가 획득되도록 하지 않는 경우에도 치환될 수 있다. 상술한 바와 같이, LAD2 동기내의 상기 위치(들)는 효소 방향성에 중요한 결정인자이며, 이때 GA 및 AP가 일반적으로 우세하거나 독점적인 리가제 기능성을 갖는 효소를 생성시키는 것으로 밝혀졌다.
다양한 구현예에서, 상기 방법은 또한 단백질 리가제 활성을 갖는 폴리펩티드의 생성 방법일 수 있으며, 방법은
(i) 아스파라지닐 엔도펩티다제(AEP) 활성을 갖는 폴리펩티드를 제공하고;
(ii) 아스파라지닐 엔도펩티다제(APE) 활성을 갖는 폴리펩티드에 하나 이상의 아미노산 치환을 도입시키고, 여기에서 상기 치환은 서열번호 1의 126번 위치에 상응하는 위치의 아미노산 잔기를 A 또는 G 잔기로 치환시키고 임의로 서열번호 1의 127번 위치에 상응하는 위치의 아미노산 잔기를, 서열번호 1의 126/127번 위치에 상응하는 위치의 아미노산 서열이 GA, AA 또는 AP, 바람직하게는 GA 또는 AP이도록 P 또는 A 잔기로 치환시킴을 포함한다.
다시, 상기와 같은 방법에서, 서열번호 1의 126번 위치에 상응하는 위치의 아미노산 잔기는, 특히 서열번호 1의 126번 위치에 상응하는 위치가 G인 경우, A이거나, 또는 서열번호 1의 127번 위치에 상응하는 위치의 아미노산 잔기는, 특히 서열번호 1의 126번 위치에 상응하는 위치가 A인 경우, P이며, 이때 서열번호 1의 126 및 127번 위치에 상응하는 위치의 동기는 GP가 아니고, 바람직하게는 AP, AA 또는 GA이다. 서열번호 1의 127번 위치에 상응하는 위치의 아미노산이 동기 AP, AA 또는 GA가 획득되도록 하지 않는 경우에, 방법은 단계 (ii)에서 상기 위치를 치환시킴을 포함할 수 있다.
리가제/사이클라제 활성을 증가시키기 위해 상기 방법이 가해지는 폴리펩티드는 아스파라지닐 엔도펩티다제(AEP)이며, 다양한 구현예에서 전체 길이에 걸쳐 서열번호 10-14 중 어느 하나에 제시된 아미노산 서열(VyAEP1-4; VcAEP)과 적어도 60, 바람직하게는 적어도 70, 보다 바람직하게는 적어도 80, 가장 바람직하게는 적어도 90% 서열 상동성 또는 서열 일치성을 공유하는 아미노산 서열을 포함하거나 상기 서열로 이루어질 수 있다. 다양한 구현예에서, 돌연변이될 폴리펩티드는 서열번호 1의 126번 위치에 상응하는 위치에 G도 A도 아닌 아미노산 잔기를 가지며, 따라서 서열번호 1의 126 및 127번 위치에 상응하는 위치는 서열 동기 GA 또는 AP를 갖지 않는다. 그러나, 동기 GP는 가질 수 있으며, 이어서 이는 기재된 방법에서 GA, AA 또는 AP에 의해 치환될 수 있다.
본 발명은 또한 본원에 기재된 바와 같은 단백질 리가제 및/또는 사이클라제 활성을 갖는 폴리펩티드를 암호화하는 핵산 분자를 포함하는 트랜스제닉 유기체, 예를 들어 식물을 포함한다. 폴리펩티드는 바람직하게는 상기 숙주 유기체 또는 숙주 식물 중에 자연적으로 존재하지 않는다. 상응하게, 본 발명은 인간을 제외한, 본 발명에 따른 이종 폴리펩티드를 발현하는 트랜스제닉 유기체/식물을 또한 특징으로 한다.
다양한 구현예에서 상기와 같은 트랜스제닉 유기체/식물은 고리화되는 하나 이상의 펩티드 또는 결찰되는 하나 이상의 펩티드를 암호화하는 적어도 하나의 핵산 분자를 추가로 포함할 수 있다. 이들은 본 발명의 용도 및 방법과 관련하여 상기에 정의된 바와 같은 펩티드일 수 있다. 하나의 구현예에서, 고리화되는 펩티드는 고리형 시스틴 매듭 폴리펩티드의 선형 전구체 형태, 예를 들어 상기에 정의된 것이다. 고리화되는 펩티드 또는 폴리펩티드의 이들 전구체는 상기 유기체/식물에 자연적으로 존재할 수 있지만, 바람직하게는 또한 인공적으로 도입된다, 즉 이들을 암호화하는 핵산은 이종이다.
따라서, 상기와 같은 트랜스제닉 유기체/식물은 효소 및 그의 기질의 동시-발현으로 인해, 관심의 고리화된 펩티드를 직접 생산할 수 있다.
폴리펩티드 및 핵산과 관련하여 본원에 개시된 모든 구현예를 본원에 기재된 용도 및 방법에 유사하게 적용할 수 있으며 이와 역으로도 마찬가지이다.
본 발명을 하기의 비제한적인 실시예 및 첨부된 청구범위에 의해 추가로 예시한다.
실시예
물질 및 방법
Vy 전사체의 RNA 추출 및 구성 및 AEP 유사체의 검색
이른 9월에 수확한 신선한 호제비꽃 열매에 트리졸(Trizol) 방법에 의해 RNA 추출을 가하고 RNA 샘플에 Illumina Hiseq 서열분석(Beijing Genetic Institute에 제공된 서비스)을 수행하였다. 서열분석된 데이터베이스는 NCBI SRA 데이터베이스에 수탁번호 PRJNA494974로 기탁되었다. 트리니티(Trinity)를 사용하여 조립 후에, 14.69 GB 염기를 함유하는 데이터를 생성시켜 86,674 Unigene을 제공하였다. blastp 서버를 사용하는 상동성 검색에 부텔라제 1 프로효소 아미노산 서열을 사용하여, 개시 및 정지 코돈을 함유하는 6개의 완전한 서열, 완전기능 코어 도메인을 갖는 3개의 부분 서열 및 N- 또는 C-말단 누락 서열 및 불완전 코어 도메인을 갖는 2개의 절두된 서열을 포함하는, 1 e-103 미만의 E 값을 갖는 11개의 AEP-유사 mRNA 서열을 식별하였다. 서열 정렬을 BioEdit의 ClustalW를 사용하여 수행하였다. 부텔라제 1 프로효소 서열을 사용하는 검색은 >60% 서열 일치성 및 >90% 서열 커버리지로 500 이상의 적중을 생성시켰다.
세균에서 Vy AEP/PAL 및 VcAEP의 클로닝, 재조합 발현 및 정제
예측된 신호 펩티드가 없는 VyAEP1(Vy = 비올라 예도엔시스), VyPAL1-3 및 VcAEP(Vc = 비올라 카나덴시스) cDNA 서열을 합성하고 N-말단 His6-태그와 인-프레임으로 Ndel/Xhol 제한 효소로 pET28a(+)(GenScript, Beijing, China)에 클로닝하였다(Hemu et al. (2019) PNAS, June 11, 2019, vol. 116, no. 24, 11737-11746). Q5 돌연변이유발 키트(NEB)를 사용하여 점 돌연변이를 구성하였다. 플라스미드를 DsbC를 구성적으로 발현하는 SHuffle T7 이 콜라이로 형질전환시키고 Erv1p 발현 플라스미드 pMJS9로 예비-형질전환시켰다. OD600 = 0.4를 갖는 형질전환된 세포의 신선한 배양물을 1h 동안 0.1% 아라비노스로 처리하여 Erv1p의 생성을 유도한 다음 16℃에서 18-24h 동안 0.1 mM IPTG로 처리하여 표적 단백질의 발현을 유도하였다. 1 L 부피의 유도된 세포 배양물의 세균 세포를 6000 g에서 15분간 원심분리에 의해 수확하였다. 10 ㎖ 부피의 용해 완충제(50 mM Na HEPE, 0.1 M NaCl, 1 mM EDTA, 5 mM β-머캅토-에탄올, 0.1% 트리톤X-100, pH 7.5)를 가하여 모든 1 g 세포 펠릿을 재현탁시켰다. 얼음상에서 20분간 5s/5s 펄스의 50% 진폭으로 초음파처리하여 세포 용해를 수행하였다. 용해성 단백질을 함유하는 등명화된 세포 용해물을, 냉각된 결합 완충제(50 mM Na HEPES, 0.1 M NaCl, 1 mM EDTA, 5 mM β-ME, pH 7.5)로 예비-평형화된 1 ㎖ COmplete 니켈 비드(Roche)를 함유하는 자기-충전된 컬럼상에 로딩하였다. 20 ㎖ 세척 완충제(50 mM HEPES, 50 mM 이미다졸, 0.1 M NaCl, 1 mM EDTA, 5 mM β-ME, pH 7.5)로 세척한 후에, His6-단백질을 4x2 ㎖ 용출 완충제(50 mM HEPES, 500 mM 이미다졸, 0.1 M NaCl, 1 mM EDTA, 5 mM β-머캅토-에탄올, pH 7.5)로 용출시켰다. 용출된 단백질의 10x 희석액을, 이온-교환(IEX) 완충제 A(20 mM 나트륨 포스페이트 완충제, pH 7.5, 1 mM EDTA, 5 mM 머캅토-에탄올)로 평형화된 GE HiTrap Q 5 ㎖ 컬럼(GE life sciences)에 로딩하였다. 단백질을 IEX 완충제 B(20 mM 나트륨 포스페이트 완충제 중의 1 M NaCl, pH 7.5, 1 mM EDTA, 5 mM β-머캅토-에탄올)의 구배로 용출시켰다. 이어서 표적 단백질을 함유하는 분획을 4회 농축시킨 후에, 20 mM 나트륨 포스페이트 완충제 pH 7.55, 0.1 M NaCl, 5% 글리세롤, 1 mM EDTA, 5 mM β-머캅토-에탄올 중에서 평형화된 크기 배제 크로마토그래피(SEC) 컬럼(S75 16/60)상에 주입하였다. 이어서 단백질을 약 1 ㎎/㎖(20 μM과 동등한)으로 농축시키고 20% 슈크로스 및 0.1% 트윈-20 첨가 후에 4℃ 또는 -80℃에서 보관하였다.
곤충 세포에서 Vy AEP/PAL의 클로닝, 재조합 발현 및 정제
cDNA를 N-말단 His6-TEV 태그와 인-프레임으로 pFB-Sec-NH(Amp+) 공여자 벡터에 클로닝하고 이 콜라이 DH10Bac 수용성 세포(Invitrogen)에 형질전환시켰다(Shrestha Bet al. (2008) Methods in Molecular Biology (Clifton, N.J.), pp 269-289). X-gal 청색/백색 선택(37℃, 48h) 후에 백색 콜로니를 M13/FBAC2 프라이머 믹스 및 서열분석을 사용하여 콜로니-PCR을 위해 채집하였다. 양성 콜로니를 QIAprep 키트(Qiagen)의 재현탁, 용해 및 중화 완충제를 사용하여 bacmid 생성을 위해 증폭시킨 다음 이소프로판올 침전시켰다. 추출된 bacmid를 셀펙틴 및 그레이스 곤충 배지(Gibco, Thermo Fisher Scientific)를 사용하여 바이러스 패키징을 위해 Sf9(스포도프테라 프루기페르다(Spodoptera frugiperda)) 곤충 세포에 형질감염시켰다. 72h 후에, P0 바이러스를 함유하는 상등액을 감염을 위해 수확하였다. 3 라운드의 바이러스 감염 및 증폭 후에, 1 L SF9 곤충 세포를 2.5 x 106 세포/㎖의 농도로 25 ㎖ P3 바이러스로 감염시키고 27℃, 120 rpm에서 72시간 동안 배양하였다. 분비된 단백질을 함유하는 배지를 4000 g에서 20분간 원심분리에 의해 수집하였다. 이어서 상등액의 pH를 7.5로 설정한 후에 GE excel 친화성 정제 컬럼(GE life sciences)상에 주입하였다. 결합 후에, 비드를 완충제 A(20 mM Na HEPES pH 7.5, 150 mM NaCl 및 5 mM β-머캅토-에탄올)를 사용하여 세척하였다. 표적 단백질의 용출을 500 mM 이미다졸이 보충된 완충제 A로 성취하였으며 단백질을 함유하는 분획을 상술한 바와 같이 10배 희석하고 IEX 및 SEC 정제시켰다.
산-유도된 자가-활성화
활성화를 0.5 간격의 4 내지 7 범위의 pH 완충제, 50 mM 나트륨 시트레이트 완충제 또는 50 mM 나트륨 포스페이트 완충제, 1 mM EDTA 및 5 mM β-머캅토-에탄올), 4개의 온도(4, 16, 25 및 37℃), 시간(15분 내지 16h)의 다양한 조건하에서, 다수의 계면활성제 첨가제(트윈-20, 트리톤X-100, N-라우로일사르코신, 및 Brij35, 0.05 mM 내지 1 mM의 농도)를 사용하여 수행하였다. 활성화된 샘플을 SDS-PAGE 및 활성 시험 모두로 분석하였다(50 nM 프로효소, 20 μM GN14-SL, 20 mM 나트륨 포스페이트 완충제, pH 6.5, 1 mM DTT, 1 mM EDTA와 균등한 활성화된 효소 용액의 양, 37℃에서 5분간 배양한 다음 MALDI-TOF 질량 분광분석에 의해 생성물 형성). 이는 최적의 활성화 조건이 pH 4.5(50 mM 나트륨 시트레이트 완충제, 1 mM DTT, 1 mM EDTA, 0.1 M NaCl), 4℃에서 12-16시간 동안 0.5 mM N-라우로일사르코신에 의한 산성화임을 결정하게 하였다. 후속적으로, 활성 효소를 SEC 완충제(20 mM 나트륨 시트레이트 완충제, 1 mM EDTA, 5 mM β-머캅토-에탄올, 5% 글리세롤, 0.1 M NaCl) 중에서 pH 4.0에서 예비-평형화된 크기 배제 크로마토그래피 컬럼(S100 16/60)상에서 정제하였다. 표적 단백질을 함유하는 분획을 용출 후 pH 5.0-6.5에서 중화시키고 추후의 사용시까지 20% 슈크로스 첨가 후에 4℃ 또는 -80℃에서 보관하였다.
자가-활성화 부위의 결정
활성화된 효소에 SDS-PAGE를 수행하고 활성 단백질을 함유하는 젤 밴드(33-35 kD 부근에서 이동)를 젤-내 절단을 위해 얇은 조각으로 절단하였다. 디설파이드 결합의 환원 및 알킬화를 하나의 용기에서 1 M 트리스-HCl, pH 8.6을 함유하는 완충제 중의 5 mM DTT 및 10 mM 브로모에틸아민의 첨가에 의해, 55℃에서 30분간 가열함으로써 수행하였다. 트립신 절단을 pH 7.8에서 37℃에서 밤새 10 ㎍/㎖ 량의 트립신(Pierce, MS grade, Thermo Scientific)으로 수행하여, 주로 Arg, Lys 및 Cys-에틸아민 뒤에서 펩티드 결합 절단을 생성시켰다. 절단된 펩티드를 50% 아세토니트릴(0.1% 포름산)로 젤 조각으로부터 추출하고 용매를 Speedvac에 의해 제거하였다. 절단된 펩티드를 1% 포름산에 재용해시키고 앞서 기재된 바와 같이(Hemu X, et al. (2018) Methods Mol Biol. 2018;1719:379-393; Serra A, et al. (2016) Sci Rep 6(1): 23005) Orbitrap Elite 질량 분광계(Thermo Scientific Inc., Bremen, Germany)에 연결된 Dionex UltiMate 3000 UHPLC 시스템(Thermo Scientific Inc., Bremen, Germany)상에서 LC-MS/MS 서열분석을 수행하였다. 펩티드를 보다 고-에너지의 충돌 용해(HCD)를 사용하여 단편화하였다. 트립신 절단으로부터 생성된 스펙트럼을 PEAKS 스튜디오(버전 7.5, Bioinformatics Solutions, Waterloo, Canada)(10 ppm MS 및 0.05 Da MS/MS 공차가 적용되었다)를 사용하여 분석하였다. 펩티드 스펙트럼의 질을 수동으로 평가하였다.
다양한 pH 값에서 효소 활성의 특성화
A280㎚ 흡광도(NanoDropTM 2000 분광광도계, Thermo Fisher Scientific)에 의해 측정된 단백질 농도를 갖는 정제된 활성 효소를 사용하여 효소 활성을 조사하였다. pH 값이 4.5-8.0인 반응 완충제(20 mM 시트르산나트륨 완충제 또는 20mM 나트륨 포스페이트 완충제, 1 mM EDTA, 5mM β-머캅토-에탄올 포함) 중에 40 nM 활성 효소, 20 μM 기질 GN14-SL을 함유하는 반응 혼합물을 37℃에서 10분 동안 배양하고 10x 부피의 0.2% 트리플루오로아세트산(TFA)을 가하여 pH를 <2의 값으로 감소시켜 반응을 급냉시켰다. 반응 결과를 미리 MALDI-TOF 질량 분광분석을 사용하여 확인하고 반응 생성물을 C4 분석 컬럼(Aries widepore 150 x 4.6 ㎜, Phenomenex)상에서 RP-HPLC에 의해 정량분석하였다. LC 용액 실행 후 분석 소프트웨어(Shimadzu)에서 피크 면적을 획득하였다.
기질 특이성 및 효소 반응속도론
펩티드 라이브러리 1은 합성 펩티드 GN14-X(n) 및 GD14-X(n)(GN14 = 서열번호 48)를 포함하며, 이 중 X(n)(n = 0-4 잔기)는 비올라세아에(Violaceae) 및 파바세아에(Fabaceae) 종의 천연 사이클로티드 전구체로부터 유래되었다. 펩티드 라이브러리 2는 20개의 합성 펩티드 GN12-XL(GN12 = GLYRRGRLYRRN; 서열 번호 47)을 함유하고 펩티드 라이브러리 3은 20개의 합성 펩티드 GN12-GX(X는 20개의 천연 아미노산 각각에 대한 것이다)를 함유한다. VyPAL2-매개된 고리화 반응은 활성 효소:기질(1:500)의 고정 몰비로 pH 6.5, 37℃에서 10분 동안 수행되었으며 0.2% TFA로 반응을 급냉시켰다. 각각의 기질을 3회 중복 시험하고 RP-HPLC를 사용하여 정량적으로 분석하였다.
반응속도론 연구를 위해서, 고리화 반응을 고정된 농도(10 nM)의 활성 효소 및 다양한 농도(2-20 μM)의 기질 GN14-SLAN(서열번호 48 + SLAN)을 사용하여 37℃에서 pH 6.5에서 수행하였다. 고리화 생성물 cGN14의 수율을 매 20초 간격으로 RP-HPLC에 의해 정량화하였으며, 각각의 효소(GraphPad Prism)에 대한 동역학적 매개변수(kcat 및 KM)를 분석하기 위해서 초기 속도 V0(μM/s)를 기질 농도 [S](μM)에 대해 플롯팅하여 미카엘-멘텐 곡선을 획득하였다.
Vy PAL2의 결정화, 데이터 수집 및 구조 결정
VyPAL2를 10 ㎎/㎖의 농도로 결정화를 위해 선별하였다. X선 결정학에 적합한 결정은 20% PEG 3350 및 0.2 M 마그네슘 포르메이트 디하이드레이트 중에서 3-7일 후에 나타났다. 이어서 결정을 크라이오-루프(cryo-loop)에 올려놓고 액체 질소에서 급속 냉동시켰다. 회절 데이터를 Australian Synchrotron의 MX2 Beamline상에서 100 K에서 수집하였다. 데이터 처리는 XDS 소프트웨어를 사용하여 수행되었다(Kabsch W (2010) Xds. Acta Crystallogr Sect D Biol Crystallogr 66(2):125-132). 데이터 수집 통계를 하기 표 S1에 나타낸다. 구조를, 검색 탐침으로서 OaAEP-C247A(PDB 액세스 코드: 5H0I(Yang R, et al. (2017) J Am Chem Soc 139(15):5351-5358)) 단량체 구조를 사용하여 분자 교체 방법으로 분석하였다. Molrep 프로그램(CCP4 프로그램 제품군에서)을 사용하여 비대칭 유닛에 2개의 독립적인 분자를 함유하는 등명한 용액을 수득하였다. Buster/TNT(GlobalPhasing Ltd)를 사용하여 정제(refinement)를 수행하였으며 모델의 수동 보정은 분자 그래픽에 대한 Coot 프로그램(CCP4)을 사용하여 수행되었다. 구조 분석 및 그림 생성은 PyMol(Schrodinger)을 사용하여 구현되었다. 정제 통계를 표 S1에 나타낸다.
[표 S1]
VyPAL2의 데이터 수집 및 정제 통계
PDB 코드: 6IDV
결정화 조건 20% PEG 3350, 0.2M Mg 2+
포르메이트 트리하이드레이트
파장(
Figure pct00001
)
0.953723
분해능(
Figure pct00002
)
50-2.4 (2.54-2.4)
이격기 C 2
단위 셀 156.8/69.8/104.4
90/110.2/90
측정된 반사 159400 (15614)
특유의 반사 41528 (4039)
다중도 3.8 (3.8)
완전성(%) 99.54 (97.63)
평균 I/signa I (I) 5.78 (1.26)
R병합 (%)a 21.9 (124.5)
CC1/2 (%)b 98.3 (48.4)
R-workc 19.50 (29.87)
R-freed 23.63 (37.81)
비-수소 원자의 수
거대분자 7199
리간드 177
427
단백질 잔기
RMS(결합,
Figure pct00003
)
0.009
RMS(각도, °)
Ramachandran 선호치 (%) 99.5
Ramachandran 이상치 (%) 0.5
평균 B-인자(
Figure pct00004
2)
거대분자 45.9
리간드 47.3
용매 49.1
괄호 안의 값은 마지막 쉘의 값이다
aRmerge = ∑|Ij - < I > |/∑Ij, 여기에서 Ij는 개별 반사의 강도이고, < I >는 해당 반사의 평균 강도이다. bCC1/2= 무작위 절반-데이터세트로부터의 강도간의 상관성 백분율(PA Karplus, K. Diederich, Science 2012, 336, 1030-1033). cRwork = ∑||F0| - |Fc||/∑|Fc|, 여기에서 Fo는 관찰된 구조 인자 진폭을 나타내고 Fc는 모델에서 계산된 구조 인자 진폭을 나타낸다. dRfree는 Rwork와 같지만 정제에서 생략된 무작위로 선택된 반사의 5%로 계산된다.
분자 동역학(MD) 시뮬레이션
VyPAL2에 결합된 모델링된 펩티드 기질의 평형 위치를 획득하기 위해 참고문헌(Schechter I, Berger A(1967) Biochem Biophys Res Commun 27(2):157-162)으로부터 모델링된 초기 VyPAL2-펩티드 복합체에 NAMD 2.12를 사용하는 모든-원자, 명시적인-용매 분자 동역학 시뮬레이션(Phillips JC, et al.(2005) J Comput Chem 26(16):1781-1802)을 수행하였다. VyPAL2의 고리화된 아스파트산은 정규 아스파트산으로 교체되었다. 복합체는, 용질과 상자 경계 사이의 최소 거리가 세 축 모두를 따라 10 Å인 수 상자로 시뮬레이션되었다. 용매화된 시스템의 전하를 대-이온으로 중화시키고 VMD를 사용하여 용매의 이온 강도를 150 mM NaCl로 설정하였다(Humphrey W, Dalke A, Schulten K(1996) J Mol Graph 14(1):33-8, 27-8). 완전히 용매화된 시스템에 10,000 단계 동안 접합체-구배 최소화를 수행하고, 후속적으로 5ps의 단계로 310K로 가열하였다. 시스템은 식 U(x) = k(x-xref)2 (여기에서 k는 1 kcal mol-1-2이고 xref는 초기 원자 좌표이다)의 조화 전위를 사용하여, 단백질 리가제의 주쇄 원자뿐만 아니라 펩티드의 N343의 Cα 원자가 구속된 총 20 ns 동안 시뮬레이션되었다. 이러한 구속으로 인해 VyPAL2의 측쇄와 나머지 펩티드 기질이 자유롭게 이동할 수 있다. 모든 시뮬레이션은 단백질에 대한 CHARMM36 힘의 장(Best RB, et al. (2012) J Chem Theory Comput 8(9):3257-3273)을 가정하고 수 분자에 대한 TIP3P 모델을 가정하여 NPT 앙상블하에서 수행되었다.
효소, 비드 및 기질
부텔라제-1을 지역 허브 정원에서 재배한 클리토리아 테르나테아(Clitoria ternatea)의 식물 물질로부터 추출하였다. 선행 프로토콜(Nguyen et al., Nat Protoc 2016, 11 (10), 1977-1988)에 기재된 바와 같이 HPLC(Shimadzu)상에서 수회 라운드의 크기-배제 및 음이온 교환 크로마토그래피 후에, 정제된 부텔라제-1을 수득하고 4℃ 내지 -80℃에서 20 mM 나트륨 포스페이트, 0.15 M NaCl, 5 mM β-머캅토에탄올(β-ME) 및 20% 슈크로스를 함유하는 pH 6.0 완충제 중에 보관하였다. 재조합 VyPAL2를 앞서 기재된 바와 같이(Hemu et al., Proc. Natl. Acad. Sci. U. S. A. 2019, 116 (24), 11737-11746) N-말단 GP64 신호 펩티드에 의해 지배되는 분비 경로를 통해 Sf9 곤충 세포에서 Bac-to-Bac® 바큘로바이러스 시스템(Thermo Fisher Scientific)을 사용하여 발현시켰다. 발현된 프로효소를 NGC-FPLC 시스템(Bio-Rad)을 사용하여 HisTrap Excel 컬럼(GE Healthcare)상의 니켈-친화성 결합, HiTrap Q 컬럼(GE Healthcare)상의 이온-교환 크로마토그래피 및 HiLoad Superdex 75 컬럼(GE Healthcare)상의 크기 배제 크로마토그래피에 의해 정제시켰다. 산-유도된 자가활성화를 1 mM 디티오쓰레이톨(DTT) 및 0.5 mM N-라우로일사르코신의 존재하에 4℃에서 밤새 pH 4.5에서 수행하였다. 약 35 kDa의 분자량을 갖는 활성화된 효소를 pH 4.0 시트레이트 완충제로 크기-배제 크로마토그래피에 의해 다시 정제시켰다. 정제된 활성 효소를 4℃ 또는 -80℃에서 20 mM 나트륨 포스페이트, 0.1 M NaCl, 5 mM β-ME 및 20% 슈크로스를 함유하는 pH 6.5 완충제 중에서 보관하였다.
모든 비드는 상업적인 공급원으로부터 유래한다. PierceTM NHS-활성화된 아가로스 비드(Thermo Fisher Scientific)는 ㎖당 1-20 ㎎ 단백질의 단백질 로딩을 갖는다. PierceTM NeutrAvidinTM 아가로스 비드(Thermo Fisher Scientific)는 ㎖당 >8 ㎎ 비오틴화된 단백질의 단백질 로딩을 갖는다. 콘카나발린 A(ConA) 아가로스 비드(G-Biosciences)는 ㎖당 15-30 ㎎ ConA의 단백질 로딩을 갖는다.
KN14-GL, GN14-HV, GN14-GL, GN14-SLAN, SFTI(D/N)-HV, RV7, 및 GLAK(FAM)RG(FAM, 플루오레세인 아미다이트)를 포함하여, 활성 분석에 사용된 모든 펩티드 기질을 상술한 프로토콜(Hemu, X.; Zhang, X.; Tam, J. P., Org. Lett. 2019)을 사용하여 Liberty-1 극초단파 합성기(CEM)상에서 Fmoc 화학에 의해 합성하였다. 단백질 기질 AS-48K(서열번호 19)를 또한 화학적으로 합성하였다. 정제된 AS-48K를 8 M 우레아에 용해시키고 투석에 의해 리폴딩을 수행하였다(Hemu et al. J. Am. Chem. Soc. Comm. 2016, 138 (22), 6968-71). 단백질 기질 DARPin9_26-NGL을 N-말단 His6-TEV-GLGSG 서열 및 C-말단 GSGSNGL 꼬리(서열번호 49)를 갖는 pET28a(+) 벡터내에 클로닝하였다. 재조합 발현을 16℃에서 0.1 mM IPTG에 의해 24h 유도 후에 Shuffle® T7 이 콜라이(New England Biolabs)에서 수행하였다. 용해성 단백질을 세포 용해물로부터 추출하고 NGC-FPLC System(Bio-Rad)을 사용하여 HisTrap HP 5 ㎖ 컬럼(GE Life Sciences) 상에서 Ni-NTA 친화성 크로마토그래피 및 HiTrap Q 5 ㎖ 컬럼(GE Life Sciences) 상에서 이온-교환 크로마토그래피에 의해 정제하였다.
PAL의 열안정성
1 ㎍ 효소를 8x SYPRO 오렌지 형광 염료(Thermo Fisher Scientific)와 혼합하고 96-웰 플레이트에서 5 내지 8 범위의 pH를 갖는 일련의 완충제(50 mM 나트륨 포스페이트, 0.1 M NaCl, 5 mM β-ME)로 25 ㎕의 최종 부피로 희석하였다. pH 완충제 ThermoFluor 분석을, 온도를 25에서 85℃로 증가시키면서 실시간 PCR 검출 시스템(Bio-Rad)에서 수행하였다. 용융 온도를 온도에 대해 1도당 RFU의 변화를 플롯팅하여 계산하였다.
용해성 및 고정화된 PAL에 의해 매개된 반응
용해성 또는 고정화된 PAL에 의한 모든 반응을 ConA-Bu1을 제외하고, 포스페이트 반응 완충제(20 mM 나트륨 포스페이트, pH 6.5, 0.1 M NaCl, 1 mM DTT)를 사용하여 수행하였으며, 이중 ConA-반응 완충제는 추가로 5 mM CaCl2 및 5 mM MgCl2을 함유하였다. 반응 pH를 효소 활성을 최대화하기 위해 6.5에서 유지시켰다. 환원제 DTT를 사용 전에 새로 가하였다. 반응을 재사용된 효소의 분해를 방지하기 위해 가열 없이 실온에서 수행하였다. 반응 혼합물을 MALDI-TOF 질량 분광분석 또는 역상(RP) HPLC에 의해 분석하였다.
NHS-활성화된 아가로스 비드상에서 고정화
효소 용액을 저온 PBS(pH 7.4)로 10 μM의 농도로 제조하고 NHS-활성화된 아가로스 건조 수지(75 ㎎은 1 ㎖ 용액을 요한다)에 가하고 제제를 4℃에서 3h 동안 서서히 진탕시켰다. 이어서 혼합물을 냉각된 회전 컬럼에 로딩하고 통과물을 수집하였다. 비드를 2x 비드-부피의 세척 완충제(20 mM 나트륨 포스페이트, 1 mM DTT, 5% 글리세롤, pH 6.0 또는 6.5)로 세척하고 통과물을 결합 및 세척 후에 수집하였다. 과잉의 NHS 기를 4℃에서 서서히 진탕시키면서 1h 동안 급냉 완충제(1 M 트리스-HCl, pH 7.4)에 비드를 담가 차단시켰다. 비드를 다시 반응 완충제로 세척한 다음, 20% 에탄올과 함께 2x 비드-부피의 반응 완충제를 가하고 슬러리를 4℃에서 유지시켰다.
비오틴화 및 뉴트라비딘 아가로스 비드상에서 고정화
효소 용액을 5 mM β-ME를 함유하는 저온 PBS(pH 7.4)로 10 μM의 농도로 제조하고 DMF(모액 농도 10 mM)에 용해된 20배 몰 당량의 Ezlink® NHS-LC-비오틴(숙신이미딜-6-(비오틴아미도)헥사노에이트, 이격자 길이 ∼2.2 ㎚, Thermo Fisher Scientific)과 혼합하였다. 비오틴화를 4℃에서 밤새 수행하였다. 과잉의 NHS-LC-비오틴을 Vivaspin 10 kDa MWCO 원심분리 농축기(Sartorius, Germany)를 사용하여 PBS(pH 7.4)에 의한 완충제 교환에 의해 제거하였다. 완충제 교환 후에, 비오틴화된 효소의 활성을 처리되지 않은 효소와 비교하여 활성 상실이 없음을 입증하였다. NA 아가로스 비드를 pH 6.5 반응 완충제로 평형화하였다. 1 ㎖ 비오틴화된 효소(5 μM)와 평형화된 비드 0.2 ㎖의 혼합물을 4℃에서 3h 동안 서서히 진탕시켜 제조한 다음, 냉각된 회전 컬럼에 로딩하고 통과물을 수집하였다. 비드를 20x 비드-부피의 반응 완충제로 세척하고, 5 mM β-ME 및 20% 에탄올과 함께 2x 비드-부피의 반응 완충제의 존재하에 4℃에서 슬러리로서 유지시켰다.
콘카나발린 A 아가로스 비드상의 고정화
ConA 비드를 10 비드-부피의 저온 평형화 완충제(1 M NaCl, 5 mM MgCl2, 5 mM CaCl2, pH 7.2, 여기에서 Mg 이온을 사용하여 Mn 이온을 치환시켰다)로 평형화하였다(Young, N. M., FEBS Lett 1983, 161, 247-250). 효소 용액을 ConA 반응 완충제로 5 μM의 농도로 제조하였다. 1 밀리리터의 효소 용액을 1 ㎖의 평형화된 ConA 비드와 4℃에서 3h 동안 서서히 진탕하면서 혼합하였다. 혼합물을 냉각된 저온 컬럼에 로딩하고 통과물을 수집하였다. 비드를 20x 비드-부피의 ConA 반응 완충제로 세척하고 20% 에탄올과 함께 2x 비드-부피의 ConA 반응 완충제에서 4℃에서 슬러리로서 유지하였다. 에탄올과 함께 또는 에탄올 없이 보관된 고정화된 효소의 활성은 유의미한 차이가 없었다.
고정화 수율의 측정
결합 및 세척 후 통과물 중의 결합되지 않은 단백질의 농도를 280 ㎚에서 UV 흡광도를 측정함으로써 Nanodrop 2000 분광광도계(Thermo Fisher Scientific)를 사용하여 측정하였다. 세척 후 통과물의 경우, 원심분리기 필터(Vivaspin 10 kDa MWCO, Sartorius)를 사용하는 농축 단계를 수행하여, 280 ㎚에서 0.008의 감도 한계를 갖는 분광광도계에 의해 판독가능한 단백질 농도를 가져왔다.
고정화된 PAL의 활성의 측정
유리 부텔라제-1(서열번호 18) 및 VyPAL2(서열번호 2)를 1 내지 8 μ 범위의 모액 농도로 제조하였다. 각각의 반응에서, 1 ㎕ 효소 모액을 100 ㎕ 0.2 mM KN14-GL에 가하였으며 따라서 최종 효소 농도의 범위는 10 내지 80 nM이었다. 실온에서 5분 배양 후에, 0.5% TFA를 가하여 pH를 2로 낮춤으로써 반응을 급냉시키고 모든 반응 용액을 분석 RP-HPLC(Aries-C18, 150x4.6 ㎜, 3 u, Shimadzu)에 주입하였다. cKN14의 양을 HPLC 프로파일에서 220 ㎚의 피크 면적에 의해 계산하였다. 이어서 초기 반응속도 V를 초당 cKN14 농도의 증가에 의해 계산하였다. 효소 농도에 대한 반응속도의 표준 곡선을 각각의 PAL에 대해 플롯팅하였으며, 이는 시험된 시스템에서 유리 효소의 턴오버율을 반영한다. 계산을 용이하게 하기 위해서, 효소 농도 및 상응하는 반응속도의 단위를 유리 효소의 모액 농도에 기반하여 각각 (μM) 및 (μM/s)로 전환시켰다. 고정화된 PAL의 활성을 동일한 실험 설정으로 1 ㎖ 시스템에서 10 ㎕ 비드를 사용하여 검사하였다. 1 ㎖ 반응 용액 중 100 ㎕를 생성물 정량분석을 위해 RP-HPLC에 주입하였다. 각각의 고정화된 PAL의 반응속도를 또한 (μM/s)로 전환시키고 실제 유효 농도를 계산하기 위해 표준 곡선과 비교하였다. 활성 비를, 용해성 PAL의 비율에 대한 고정화된 PAL의 비율에 의해 계산하였다.
수탁 코드. 부텔라제 1에 대한 뉴클레오티드 서열은 수탁번호 KF918345로 GenBank 데이터베이스에 기탁되었다.
실시예 1: 비올라세아에 전사체에서 AEP 마이닝 및 "게이트-키퍼" 잔기를 사용한 초기 분류
비올라세아에는, 게놈 중 PAL의 존재를 암시하는 주요 사이클로티드-생산 식물과의 하나이다. PAL을 식별하기 위해 이 과로부터 2개의 식물, 비올라 예도엔시스(Vy) 및 비올라 카나덴시스(Vc)에 대한 데이터 마이닝을 수행하였다.
브이. 예도엔시스의 전사체를 수득하기 위해서, 신선한 과일로부터 전체 RNA를 추출하고 서열분석한 후 데이터베이스를 조립하였다(NCBI SRA 수탁번호 PRJNA494974). 부텔라제 1 및 OaAEP1b의 전구체 서열을 사용하여 AEP에 상동성인 서열을 검색하였다. 6개의 완전한 서열, 온전한 코어 도메인을 포함하는 3개의 부분 서열 및 폐기된 불완전한 코어 도메인을 갖는 2개의 절두된 서열을 포함하여 브이. 예도엔시스 전사체에서 총 11개의 AEP 전구체가 발견되었다. Vc의 전사체는 1KP 데이터베이스에서 쉽게 입수할 수 있으며 VcAEP라 명명하는 AEP 상동체(NJLF-2006002)는 부텔라제 1 서열을 사용하여 BLASTp에 의해 획득되었다. 9개의 Vy 서열과 VcAEP를 클러스터링하기 위해, 기준으로서 게이트-키퍼 잔기의 특성을 사용하는 것이 선택되었다. OaAEP1b(PDB 액세스 코드: 5H0I)의 활성 부위 부근의 Cys 잔기(Cys-247)의, 더 큰 아미노산(Thr, Met, Val, Leu, Ile)으로의 돌연변이는 결찰 촉매 효율을 감소시킨 반면, Ala와 같은 더 작은 잔기로의 돌연변이는 결찰 효율을 100배 이상 개선시키는 것이 앞서 관찰되었다(Yang R, et al.(2017) J Am Chem Soc 139(15):5351-5358). 더욱이, 상기 "게이트-키퍼" 잔기의 Gly로의 돌연변이는 가수분해 생성물의 양을 증가시켰는데, 이는 S2 기질-결합 포켓에 위치한 이 부위가 효소 기능을 조절하는 데 중요한 역할을 한다는 것을 시사한다. 부텔라제 1 아미노산 서열을 사용하여 NCBI 데이터 뱅크에서 상동체를 검색한 결과 60% 이상의 서열 일치성과 90%의 서열 커버리지를 공유하는 500개 이상의 적중이 돌아왔다. 그 중 95% 이상의 서열은 프로테아제와 "이중 기능" 리가제를 모두 포함하여 게이트-키퍼 부위에서 Gly를 운반하며, 이는 PAL이 식물 AEP에서 드물다는 사실과 일치하였다.
상기 기준을 사용하여, 4개의 브이. 예도엔시스 서열은 게이트-키퍼로서 Gly의 존재에 기인한 추정적인 VyAEP로서 분류되었으며 VyAEP1-4(서열번호 10-13)로 지정되었다. 브이. 카나덴시스로부터의 VcAEP(서열번호 14)뿐만 아니라 다른 5개의 지정된 VyPAL1-5(서열번호 5-9)가 게이트-키퍼 잔기로서 Val(부텔라제 1과 유사) 또는 Ile를 함유하므로 추정적인 VyPAL로서 분류되었다.
실시예 2: 활성 재조합 VyAEP 및 VyPAL의 생성
서열 일치성에 기반하여, 이들 추정적인 AEP 및 PAL을 4개의 그룹으로 분할할 수 있었다: VyAEP1 및 2(98.9%), VyAEP3 및 4(96.2%), VyPAL1,2,4 및 5(>99%) 및 VyPAL3. VyPAL3은 다른 추정적인 VyPAL과 단지 <70% 코어 서열 일치성을 공유하지만, VcAEP에는 94% 일치한다. VyAEP1, VyPAL1-3 및 VcAEP를 추가의 연구를 위해 발현시켰다. 재조합 발현을 세균 및 곤충 세포계 모두를 사용하여 수행하였으며, 완전한 아미노산 서열을 암호화하는 유전자를 발현 벡터내에 클로닝하였고, 이때 신호 펩티드를 친화성 정제를 위해 His-태그에 의해 치환시켰다. 금속-친화성, 이온-교환, 및 크기-배제 크로마토그래피(방법을 참조하시오)에 따르면, 세균 및 곤충 세포계는 각각 ∼0.5 ㎎/L 내지 10-20 ㎎/L의 정제된 프로효소를 생성시켰다.
정제에 이어서, 프로효소를 0.5 mM N-라우로일사르코신, 5 mM β-머캅토에탄올, 및 1 mM EDTA의 존재하에 4℃, pH 4.5에서 12-16h 활성화시켰다. 상기와 같은 순하지만 연장된 처리는 캡 도메인의 절단 및 분해를 허용하여, 캡 도메인의 재-결찰을 방지한다. 활성화된 효소를 크기-배제 크로마토그래피를 사용하여 추가로 정제하였다. 정제된 활성 VyPAL2의 자가-활성화 부위를 트립신 절단된 활성 형태의 LC-MS/MS 서열분석에 의해 측정하였다. 코어 도메인 양쪽 단부의 Asn/Asp 절단 부위는 N-말단 프로-도메인 영역에서 N43/N46/D48이고, 링커 영역에서 D320/N333인 것으로 밝혀졌다. 이는 다중 부위에서 단백질 가공을 통한 억제성 캡 도메인의 완전한 제거 및 활성 형태를 함유하는 혼합물의 생성을 입증하였다.
실시예 3: VyAEP1 및 VyPAL1-3의 리가제 대 프로테아제 활성
VyAEP/PAL의 활성을 측정하기 위해서, 1733 Da의 MW를 갖는 "GN14-SL" GISTKSIPPISYRNSL(서열번호 59)이라 칭하는 모델 펩티드 기질을 제조하였다. GN14-SLVy 사이클로티드의 전구체 및 SFTl-1의 유사체로부터 유래된 그의 C-말단에 트리펩티드 인식 동기 "NSL"을 함유한다(도 1A). 고정된 효소:기질 몰비(1:500)를 모든 결찰 반응에 사용하였으며, 상기 반응을 37℃에서 10분간, 4.5 내지 8.0 범위(0.5 간격)의 pH 값에서 수행하였다. GN14-SL의 고리화를 MALDI-TOF 질량 분광분석을 사용하여 모니터링하였다. 고리형 생성물 cGN14(MW: 1515 Da) 및 선형 생성물 GN14(MW: 1533 Da)의 수율을 RP-HPLC를 사용하여 정량분석하였다(도 1B).
시험된 4개의 PAL 효소 중에서, VyPAL2가 가장 큰 리가제 활성을 나타내었으며, pH 5.5-8.0에서 어떠한 가수분해 산물도 생성시키지 않았다. 6.5의 최적 pH에서, 80%가 넘는 고리화 수율이 관찰되었다(도 1C). VyPAL1은 또한 pH 6-8에서 순수한 고리화를 생성시켰으며, 7.0의 최적 pH에서 약 80%의 고리화 수율이 획득된다. VyPAL3은 pH 4.5-5.5에서 우세한 가수분해 활성 및 pH 6.0-7.0에서 우세한 리가제 활성을 나타내었다. 그의 촉매화 효율은, 단지 20%의 기질만이 10분 후에 최적의 pH 7.0에서 고리화된 생성물로 전환되었기 때문에 3개의 추정적이 VyPAL 중에서 최저였다. 예상대로, 추정적인 프로테아제 VyPAL1이 4.5-8의 시험된 pH 범위에서 가수분해 활성을 나타내었지만, 6.5-8의 거의 중성 및 염기성 pH에서 고리화가 현저하게 되었다. 4개의 효소 모두 5.0 미만의 pH에서 다양한 정도(2 내지 40%, 도 1C)의 프로테아제 활성을 나타내었으며, 이는 산-유도된 자가-활성화에 필요한 본래적인 단백질분해 활성을 반영한다.
이어서, 세 세트의 펩티드 라이브러리를 사용하여 VyPAL2의 기질 특이성을 연구하였다(도 2). 효율적인 고리화는 C-말단 인식 신호 Asn-P1'-P2'(Schechter와 Berger의 명명법 사용(49))로서 최소 3개의 잔기를 필요로 하였다. P1'에서, 작은 아미노산, 특히 Gly 및 Ser이 유리하지만, Pro는 아니다. P2' 위치는 소수성 또는 방향족 잔기, 예를 들어 Leu/Ile/Phe가 유리하다. VyPAL2의 촉매 효율을 37℃, pH 6.5에서 수행시 274,325 M-1s-1(이는 부텔라제 1(971,936 M-1s-1)보다 3.5배 적다)를 제공하는 기질 GN14-SLAN (GISTKSIPPISYRNSLAN; 서열번호 60)을 사용하여 검사하였다(도 3).
실시예 4: VyPAL2의 결정 구조
여기에서 확인된 PAL과 AEP 사이의 성질과 효율성의 차이에 책임이 있는 분자 기전을 이해하기 위해서, 2.4 Å의 분해능에서 VyPAL2 프로효소의 결정 구조를 획득하였다. 예상대로 구조는 N-말단에 활성 도메인(잔기 51 내지 320)과 C-말단에 캡 도메인(잔기 344 내지 483)이 있는 프로-레구메인 폴딩을 나타낸다. 이 두 도메인은 유연한 링커(잔기 321 내지 343)에 의해 연결된다. 비대칭 단위는 동종이량체를 형성하는 2개의 VyPAL2 단량체를 함유한다. 용액 중에서, 이 올리고머 형태의 VyPAL은 젤 여과 결과에서 추론된 바와 같이 높은 단백질 농도(>5 ㎎/㎖)에서만 존재한다. 단백질이 곤충 세포에서 발현됨에 따라 단백질 표면의 여러 아스파라진 잔기는 각각 Asn102, Asn145 및 Asn237에서 1 내지 3개의 N-결합 당(N-아세틸글루코스아민(GlcNac) 1개, GlcNac 2개 또는 GlcNac 2개 및 푸코스 1개)으로 글리코실화된다. C13 서브패밀리의 구성원은 잘-정의된 산소음이온 구멍에 위치한 보존된 α-β-α 샌드위치 구조와 His172-Cys214 이작용기 촉매를 공유한다. 펩티드 결합 절단은 Asn-(S)-Cys 티오에스테르 중간체를 제공하기 위해 N-to-S 아실 이동을 매개하는 Cys 티올에 의해 촉매화된다. His의 이미다졸 고리는 촉매 Cys로부터 양성자를 수용하는 일반 염기로 작용한다.
구조는 OaAEP1b(PDB 코드: 5H0I), AtLEGγ(5NIJ, 5OBT), HaAEP1(6AZT) 또는 부텔라제 1(6DHI)과 같은 다른 PAL 및 AEP와 유사하며 1.0 Å의 평균 제곱근-편차(r.m.s.d)가 있다. 또한 활성 도메인만 비교하면 평균 0.7 Å에 가까운 r.m.s.d 값으로 반환되며, 이는 코어 도메인 구조가 강하게 보존되어 있음을 보여준다. 이것은 또한 효소 특이성이 S-아실 중간체의 안정성과 촉매 수 분자의 접근성에 영향을 미치는 기질 결합 포켓의 미묘한 변화로 인한 것임을 나타낸다. 본 발명의 프로-효소 형태에서 나선 α6(캡 도메인의 첫 번째 나선)은 링커 펩티드와 약 90˚의 각도를 이룬다. 링커 영역과 α6 나선 사이의 접합부에서 Gln343은 산소음이온 구멍(또는 S1 포켓) 내부에 고정된다. 최근 활성 형태의 HaAEP1 및 AtLEGγ의 구조에서, 결합된 기질 또는 억제제는 링커 영역에 비해 약 2.5 Å의 거리만큼 이동하고 티오에스테르 결합을 통해 촉매 시스테인에 공유적으로 연결된다.
실시예 5: 에너지 최소화를 사용하는 기질-효소 상호작용의 모델링
HaAEP1(PDB 액세스 코드: 5OBT) 및 AtLEGγ(6AZT) 모두의 리간드 결합 활성 형태의 구조는 단백질의 활성화 및 캡 방출 후에 작은 형태적 변화만 발생함을 나타낸다. 따라서, 본 발명의 VyPAL2 결정 구조를 사용하는 VyPAL2 리가제의 활성 형태를 모델링하고 전자 밀도에서 명확하게 보이는 잔기 Gly52 내지 Asn326을 포함시켰다. 이것은 또한 LC-MS를 사용하여 측정된 VyPAL2 활성 형태, 즉 N43/N46/D48 및 D320/N333의 경계와 일치한다. 활성 형태의 VyPAL2에 결합된 펩티드 기질의 초기 모델을 얻기 위해 서열 NH2-LKVIH-NSL-COOH(서열번호 50)을 갖는 AtLEGγ와 펩티드 억제제 사이의 복합체 구조(Zauner et al. (2018) J Biol Chem 293(23):8934-8946)를 사용하였다. 이 펩티드의 N-말단 서열은 원래의 링커 서열에 해당하고 C-말단 디펩티드는 도 2에 제공된 기질 특이성 연구를 기반으로 한다. 이어서 펩티드와 생성된 복합체의 에너지 최소화를 수행하여, 활성 단백질의 Cα 원자만을 구속하였다. P1 Asn 잔기의 알파-탄소 원자는 AtLEGγ에서 발견된 위치에 고정되었고 S1 포켓에서 기질을 유지하기 위한 앵커로 사용되었다. 20 ns 동안 시스템의 MD 평형화 시, 기질 "LKVIHN"의 N-말단 부분(서열번호 50의 일부)은 VyPAL2로부터의 I244와 기질 간의 반발로 인해 이동되었다. 그 결과, 기질 P3 위치에 있는 Ile의 알파-탄소 원자는 3 Å만큼 변위된다. 반면에 C-말단 "SL" 디펩티드는 더 확장되어 펩티드가 기질 결합 포켓에 더 잘 맞도록 한다. 모델링된 기질에 대한 이러한 보다 안정적이고 에너지적으로 유리한 위치는 프로테아제 및 리가제 활성 모두에 대한 인식 동기를 한정하는 S1' 및 S2' 포켓을 맵핑하는데 사용되었다. 모델 기질과의 계면을 분석함으로써, S4-S2' 포켓 내층의 활성 형태의 VyPAL2의 잔기가 정의되었다. S4의 조성은 AtLEGγ에 대한 선행 연구와 일치하였으며 카스파제-1의 c341 루프에 해당하는 디설파이드-고정된 폴리-Pro 루프(PPL)와 MLA 영역(카스파제-1의 c381 루프에 해당)의 잔기를 수반하였다. S1 포켓의 다른 쪽에서 S1' 포켓은 펩티드의 P1' 및 P2' 잔기의 주쇄 원자를 수용하는 H172, G173 및 A174의 아미드 기에 의해 형성된다. S2' 포켓은 Y185와 G179 및 M180의 주쇄 원자로 둘러싸여 있으며, 이는 P'2 위치에서 소수성 잔기의 결합에 유리하다. MD 시뮬레이션은 펩티드의 소수성 Leu 측쇄와 Y185의 페놀 고리 사이의 상호 작용이 선호됨을 보여주며, 이는 특이성 연구에서 관찰된 P2'에서 Ile/Val/Phe에 대한 선호도와 일치한다(도 2C).
실시예 6: S2 및 S1' 포켓에서 리가제-활성 결정인자의 식별
VyPAL1-3은 PAL로서 분류되고 확인되지만, 고리화/가수분해 비 및 촉매 효율 모두의 면에서 다양한 수준의 리가제 활성을 나타내었다. 따라서, VyPAL1 및 VyPAL3의 구조를, 주형으로서 VyPAL2의 실험적인 결정 구조를 사용하여 모델링하였다. 생성되는 모델은 이들 3개 단백질간의 서열 일치성을 고려할 때 정확할 듯하다. VyPAL1-3 구조상의 다형성 잔기의 맵핑은 S2 및 S1' 포켓 중에 위치한 기질-상호작용 표면의 변화를 가리킨다. 하나의 변화는 VyPAL2 및 VyPAL3 모두 중에 존재하는 방향족이고 벌키한 Trp 대신에 VyPAL1 중의 S2의 첫 번째 잔기: Leu243에 있다. 동일한 영역에서, VyPAL2의 244번 위치는 Ile 또는 val이며, 이는 국소적인 소수성에 거의 변화를 도입하지 않는다. 최종적으로, 245번 위치의 잔기의 측쇄는 S1 포켓과 반대 방향을 향하고 있으며(VyPAL1-3의 주쇄 원자가 완전히 겹친다), 이는 이 잔기가 촉매 작용에 거의 영향을 미치지 않음을 암시한다. 그러나, S1 포켓의 다른 쪽에서는 S'1 및 S'2 부근에서 더 큰 차이가 관찰된다: VyPAL1 및 2 모두의 Ala174-Pro175가 VyPAL3의 Tyr175-Ala176으로 교체되었다.
실시예 7: VyPAL3 및 VcAEP의 리가제 활성을 개선시키는 선택성
이러한 구조적 관찰을 실험적으로 검증하기 위해 VyPAL3을 먼저 표적화하였다: S1' 영역의 "YA" 디펩티드를 부텔라제 1 서열에서 발견되는 바와 같이 "GA"로 돌연변이시켰다. 예상대로, 상기 Y175G 점 돌연변이는 야생형 VyPAL3과 비교할 때 더 낮은 pH(4.5-6)에서 관찰되는 강하고 선택적인 결찰 활성의 증가를 초래하였다(도 4). 또한 최대 고리화 수율이 20%에서 80%로 증가하여 촉매 효율도 현저하게 향상되었다(도 4C1C 비교).
리가제 활성을 결정하는데 있어서 S1' 영역의 중요한 역할에 대한 우리의 가설을 추가로 검증하기 위해 주로 프로테아제 활성을 갖고 리가제 활성이 실질적으로 없는 VcAEP를 표적화하였다(도 5A). S1' 영역의 돌연변이 Y168P169 → A168P169(VyPAL3의 Y175A176과 동등함)가 도입되었다. Y168A 돌연변이는 GN14-SLDI 기질에 대한 효소 활성 유형과 촉매 효율(도 5B) 모두에 크게 영향을 미쳤다. 야생형 VcAEP와의 반응을 효소 대 GN14-SLDI 몰비 1:200을 사용하여 5시간 동안 수행하였다. 대조적으로, VcAEP-Y168A의 경우 비율은 1:2000이었고 반응을 37℃에서 2분 배양 후 급냉시켰다. 거의 중성 pH에서, VcAEP-Y168A는 60% 이상의 기질을 그의 순환 형태로 전환할 수 있었으며, 이때 5% 미만의 가수분해 생성물이 형성되었다(도 5B).
실시예 8: 활성 부텔라제-1 및 VyPAL2의 제조
PAL의 2개의 상이한 공급원, 식물로부터 단리된 천연 및 활성화된 부텔라제-1(Nguyen et al. Nat. Chem. Biol. 2014, 10 (9), 732-738) 및 활성화되기 위해 산-유도 단계를 요하는 곤충-세포 발현된 VyPAL2 지모겐(Hemu et al. Proc. Natl. Acad. Sci. U. S. A. 2019, 116 (24), 11737-11746)을 사용하였다. 본 연구에 사용된 부텔라제-1을 앞서 기재된 바와 같이 클리토리아 테르나테아의 신선한 식물 조직에서 추출하고 음이온-교환 및 크기-배제 크로마토그래피를 통해 정제하였다(Nguyen et al. Nat Protoc 2016, 11 (10), 1977-1988). 재조합 VyPAL2를 곤충 세포를 사용하는 분비 경로에서(상기 Hemu et al.) 바큘로바이러스 발현 시스템에 의해 프로효소 형태로 발현시켰다(Shrestha et al. In Genomics Protocols, Starkey, M.; Elaswarapu, R., Eds. Humana Press: Totowa, NJ, 2008; pp 269-289). VyPAL2의 활성화된 형태는 pH 4.5에서 산-유도된 자가-활성화에 의해 획득되었으며, 이를 pH 4에서 나트륨 시트레이트 완충제를 사용하여 크기-배제 크로마토그래피에 의해 정제시켰다. 부텔라제-1 및 발현된 VyPAL2 지모겐은 모두 글리코실화되었으며, 이들의 글리코실화된 형태는 SDS-PAGE에서 계산된 단백질 중량보다 큰 진한 밴드로서 나타난다(데이터 도시 안 됨).
실시예 9: 활성 PAL의 비-공유 고정화
부텔라제-1을 선행 연구에 기반하여 벌키한 이종 글리칸으로 N94 및 N286에서 글리코실화하였으며, 이는 약 6 kDa의 추가적인 질량 증가를 초래하였다. 재조합 VyPAL2를 작은 글리칸으로 N102, N145 및 N237에서 글리코실화시키고, 약 3 kDa의 추가로 증가된 질량이 생성된다(데이터 도시 안 됨). 따라서, 렉틴-비드는 명백한 첫 번째 선택이며, 이들 2개의 글리코실화된 PAL을 친화성 부착을 통해 고정화시키는 가장 직접적인 방법이다. ConA는 가장 통상적이고 광범위하게 사용되는 식물 렉틴 중 하나이다(Saleemuddin & Husain Enzyme Microb. Technol. 1991, 13 (4), 290-295; Rudiger & Gabius Glycoconjugate J. 2001, 18, 589-613). ConA-부착은 가역적이어서, 만노실 및 글루코실 모노사카라이드를 함유하는 용출 완충제를 사용하는 당효소의 회수를 허용한다(Dulaney Mol. Cell. Biochem. 1978, 21 (1), 43-63)(도 1A). 불용성 지지체의 경우, 6% 가교결합된 아가로스 비드가, 고도로 다공성이고 친수성이며 안정성이고 화학적, 물리적 변형에 불활성이며 화합물 <4000 kDa의 자유 확산을 허용하는 비교적 큰 기공 크기로 인해 사용되었다(Zucca et al. Molecules 2016, 21 (11)).
당효소의 ConA 비드와의 친화성 결합을, 1 ㎎의 새로 제조된 리가제 및 pH 6.5 ConA-반응 완충제로 예비-평형화시킨 1 ㎖ 비드를 혼합하고 4℃에서 3h 동안 서서히 진탕시킴으로써 수행하였다. 1 ㎎/㎖(∼27 μM의 리가제와 동등함)의 낮은 효소 로딩 및 부드러운 진탕은 용질의 확산을 촉진할 수 있었다. 비드를 결합 후 ConA 반응 완충제로 세척하였다. ConA-비드상에 고정화된 부텔라제-1은 ConA-Bu1 1을 39% 수율로 제공하였으며, 효소의 61%는 용액 중에 남았다. 대조적으로, ConA-결합된 VyPAL2는 수회 라운드의 세척 후에 바로 비드로부터 용해되었다. 결과적으로, ConA-Vy2 2가 후속적인 모든 실험에서 배제되었다.
부텔라제-1 및 VyPAL2에 대해 관찰된 ConA 친화성의 차이는 그들의 글리코실화된 형태에 기인할 수 있다. 식물-유래된 부텔라제-1은 높은 친화성으로 ConA에 결합하는 복잡한 고-만노스 N-글리칸을 함유한다(Wilson Curr. Opin. Struct. Biol. 2002, 12 (4), 569-577; Strasser Front Plant Sci 2014, 5, 363). 대조적으로, 곤충 세포-발현된 VyPAL2는 낮은 친화성으로 ConA에 결합하는 단순한 N-글리칸을 함유한다(Shi & Jarvis, Curr Drug Targets. 2007, 8 (10), 1116-1125). VyPAL2의 결정 구조에서, 확인된 글리칸은 트리-사카라이드보다 더 크지 않다. 또한, ConA-고정화된 PAL은, ConA에 결합할 수 있고 고정화된 PAL과 교환할 수 있는 용해성 당 또는 당단백질을 함유하는 반응을 촉매화하기에 적합하지 않다.
비교를 위해서, 제2 비-공유 고정화를 비오틴과 아비딘간의 대단히 높은 결합을 활용하여 실험적으로 시험하였다. 아비딘-비오틴 결합은 10-15 M의 범위의 용해 상수와 함께 실제적으로 비가역적인 것으로 간주된다. 비-특이적인 렉틴 결합을 제거하기 위해서, 아비딘의 데글리코실화된 형태인, 글리코실화된 아비딘으로서 아민-연결된 비오틴의 강한 친화성 결합을 유지하는 뉴트라비딘(NeutrAvidin)(NA)을 사용하였다(도 7B). 상기 방법은 비오틴에 의한 PAL의 1차 아민 중 일부의 변형을 필요로 하였다. 활성 부텔라제-1 및 VyPAL2 모두의 서열은, 촉매 부위 또는 기질 결합 표면에 가깝게 위치하지 않은 다수의 Lys 잔기를 함유한다. 따라서, Lys-NH2를 수반하는 PAL의 고정화는 PAL의 촉매 부위를 방해하지 않을 것으로 예상되었다.
리신 측쇄를 비오틴화하기 위해서, 숙신이미딜-6-(비오틴아미도)헥사노에이트(NHS-LC-비오틴)를 활성 부텔라제-1 및 VyPAL2의 비오틴화에 사용하였다. N-하이드록시 숙신이미드 에스테르(NHS-에스테르)의, 리가제상의 1차 아민에의 커플링 반응을 일반적으로는 7.2 내지 9.0 범위의 pH의 염기성 조건에서 수행한다. 활성 PAL은, 식물-생성되든지 곤충-세포 발현되든지 간에, 염기성 조건에서 열적으로 덜 안정성이므로, 우리는 리가제의 분해를 최소화하기 위해 비오틴화를 pH 7.4, 4℃에서 수행하였다. 비오틴화된 효소는 활성의 상실을 보이지 않음이 실험적으로 확인되었다. 비오틴화된 부텔라제-1, Bu1(b), 및 비오틴화된 VyPAL2, Vy2(b)와 NA 비드와의 친화성 결합을 pH 6.5, 4℃에서 3h 동안 수행하였다. 고정화 후에, 비드를 냉각된 pH 6.5 반응 완충제로 세척하였다. 이 방법은 각각 49% 및 45% 고정화 수율을 생성시켜 NA-Bu1(b) 3 및 NA-Vy2(b) 4를 제공하였다.
실시예 10: 직접적인 커플링에 의한 활성 PAL의 공유 고정화
공유적 접근법은 비가역적인 안정한 고정화를 부여한다. 우리는 NHS-에스테르에 대한 PAL의 N-말단 또는 Lys-측쇄상의 1차 아민의 커플링에 의한 잘-확립된 공유 고정화 방법을 선택하였다(도 7C; Anderson et al. J Am Chem Soc 1964, 86 (9), 1839-1842; Cuatrecasas & Parikh Biochemistry 1972, 11 (12), 2291-2299). 앞서 기재된 NHS-LC-비오틴에 의한 리가제의 비오틴화와 유사하게, NHS-활성화된 아가로스 비드상의 직접적인 고정화를 pH 7.4, 4℃에서 밤새 수행하여 아가로스-Bu1 5 및 아가로스-Vy2 6을 제공하였다. 이어서 비드를 냉각된 pH 6.5 반응 완충제로 세척하였다. 결과는 상기 방법이 활성 부틸라제-1 및 VyPAL2를 각각 83% 및 81% 수율로 직접 고정화함을 보였다.
실시예 11: 고정화된 PAL의 활성
고정화된 PLA의 활성을, 고정화된 PAL에 의해 촉매화된 초기 반응속도를 그의 용해성 대응물에 의해 촉매화된 속도와 비교함으로써 측정하였다. 유리 부텔라제-1 또는 VyPAL2의 리가제 활성을, 모델 펩티드 기질 KN14-GL(KLGTSPGRLRYAGN-GL; 서열번호 51) 7, 천연 시스테인-풍부 펩티드 블레오젠 pB144로부터 유래된 서열을 C-말단 PAL-인식 신호 트리펩티드 NGL로 거대고리화시켜 단부끼리 붙은 고리형 생성물 cKN14 8을 제공하여 측정하였다(도 8). 우리는 반응속도를 최대화하기 위해 0.2 mM의 기질 농도를 사용하였는데, 이는 상기 농도가 부텔라제-1 및 VyPAL2의 공지된 미카엘리스 상수 Kw보다 훨씬 높기 때문이다. 반응을 5분 후에 급냉시키고 각각의 반응에서 생성된 cKN14의 양을 RP-HPLC에 의해 측정하였다. 유리 효소의 농도에 대한 반응속도의 표준 곡선을 플롯팅하여 턴오버율을 계산하였다(도 9). 고정화된 PAL의 유효 농도를, 표준 곡선상에 고정화된 PAL의 측정된 반응속도를 내삽함으로써 측정하였다.
표 2는 ConA-Bu1 1 및 NA-연결된 비오틴화 효소 NA-Bu1(b) 3 및 NA-Vy2(b) 4의 비공유 부착이 각각 이들의 용해성 효소의 50% 및 20-30% 활성을 유지함을 보여주는 결과를 요약한다. 아가로스-Bu1 5와 아가로스-Vy2 6의 공유 결합은 용해성 효소의 약 5% 활성을 유지하였다. 오직 아가로스-Bu1 및 아가로스-Vy2에서만 약 1 ㎚인 것으로 계산된 테트라노 이격자를 통한 아가로스 비드에의 직접 부착은 아마도 너무 짧다(도 7). 대조적으로, ConA-Bu1은 8 ㎚(ConA 사량체 + 글리칸)보다 긴 이격자를 가지며(Becker et al. J Bio Chem 1975, 250(4), 1513-1524) 뉴트라비딘-고정화된 NA-연결된 비오틴화 효소는 약 8 ㎚ 길이의 이격자를 갖는다(뉴트라비딘 사량체 + NHS-LC-비오틴)(Livnah et al. Proc Natl Acad Sci USA 1993, 90, 5076-5080). 효소와 고체 지지체 사이의 거리와 고정화된 PAL의 활성간의 상관관계는 짧은 이격자가 효소 이동성과 기질의 접근성을 감소시킬 수 있음을 시사하였다. 직접 부착 방법을 통해 고정화된 효소의 활성을 향상시키기 위해서는 더 긴 이격자를 사용해야 한다.
[표 2]
고정화된 PAL의 고정화 수율 및 유효 농도에 대한 요약
PAL 로딩
Obs. Conc (μM) 수율
(%)
유효
농도
(μM)

(%)
비-공유
ConA-Bu1 1 10.5 39 4.6 44
NA-Bu1(b) 3 13.2 49 3.3 25
NA-Vy2(b) 4 12.1 45 2.8 23
공유
아가로스-Bu1 5 22.4 83 1.1 5
아가로스-Vy2 6 21.8 81 0.6 3
비드상의 예상된 최대 PAL 농도는 1 ㎎/㎖
Figure pct00005
27 μM이다.
Obs. Conc = 비드상의 PAL의 관찰된 단백질 로딩.
수율 = 관찰된 농도/예상된 최대 농도.
비 = V(고정화된 효소)/V(유리 효소) = 유효 농도/Obs. Conc.
ConA = 콘카나발린 A.
NA = 뉴트라비딘.
(b) = 비오틴.
실시예 12: 고정화된 PAL은 높은 작업 안정성 및 연장된 보관 안정성을 나타낸다
PAL의 고상 고정화는 자기-응집 및 자가-단백질분해를 최소화하고, 차례로 안정성을 증대시킬 것이다. 작업 안정성 및 재사용 가능성을 입증하기 위해서, 각각의 고정화된 PAL을 10회 재사용하고 선형 펩티드 KN14-GL 7의 고리화에서 그의 효능을 분석하였다. 각각의 실행에서, 동일한 배치의 고정화된-PAL 아가로스 비드를 사용하였으며, 반응 혼합물을 C18 역상 HPLC를 사용하여 분석하였다(도 10A). 도 10B는 5개의 고정화된 PAL의 생성물 분석을 요약하며, 이들은 모두 >90% 촉매 활성이 100회 실행 후에 유지됨을 보였다.
4℃에서 보관된 고정화된 PAL의 연장된 저장수명을 입증하기 위해서, cGN14 11을 생성시키는 펩티드 기질 GN14-HV(서열번호 52; GISTKSIPPISYRN-HV, 9) 또는 GN14-SLAN(서열번호 53; GISTKSIPPISYRN-SLAN, 10)의 순환에서 2개월의 기간 동안 매주 리가제 활성을 MALDI-TOF 질량 분광분석에 의해 모니터링하였다. 도 11은 고정화된 PAL이 연장된 보관시 그의 용해성 대응물보다 더 안정성임을 보인다. 5개의 모든 고정화된 PAL은 9주 후에 >90% 활성을 유지하였다. 대조적으로, 부텔라제-1 또는 VyPAL2가 동일한 보관 조건하에서 2개월 보관 후에 약 30% 활성을 상실하였다.
환원제, 예를 들어 트리스(2-카복시에틸)포스핀(TCEP), 디티오쓰레이톨(DTT) 또는 β-머캅토에탄올(β-ME)의 첨가가 활성 PAL의 촉매 Cys를 환원된 형태로 유지시키는데 중요함을 발견하였다. 비-환원 완충제 중에서 보관된 용해성 및 고정화된 PAL은 모두 촉매적 시스테이닐 설프히드릴의 산화로 인해 2주 후에 활성을 상실하였다. 설프히드릴이 일단 산화되어 불활성화로 이어지면, 때때로, 항상은 아니지만, 하나 이상의 환원 시약을 함유하는 완충제로 처리 후에 리가제 활성이 복원될 수 있다. 또한, 고정화된 부텔라제-1은 고정화된 VyPAL2보다 약간 더 안정성임이 관찰되었으며, 이는 식물-유래된 PAL이 단백질분해적 분해로부터 그의 분자 안정성을 증대시키는 보다 높은 수준의 글리코실화로부터 이익을 얻을 수 있음을 시사한다.
실시예 13: 결찰 반응을 위한 고정화된 PAL의 용도
고정화된 PAL의 재사용 가능성으로 인해 용해성 대응물보다 훨씬 높은 효소 농도를 사용하여 촉매적 결찰 반응을 가속화할 수 있다. 다음의 5가지 예에서 뉴트라비딘-고정화된 NA-Bu1(b) 3 및 NA-Vy2(b) 4가 고리화 및 결찰을 위한 고정화된 PAL의 이점과 연속 흐름 시스템에서의 용도를 보여주기 위해 사용되었다.
첫 번째 예는 P2 위치에서 입체 장애가 있는 Pro를 포함하는 SFTI 기질의 고리화 반응으로, 이는 동일한 P2 위치를 차지하는 방해가 덜한 아미노산을 가진 기질보다 더 느린 결찰 반응을 일으킨다. 도 12A는 14-잔기 디설파이드-함유 펩티드 SFTI 유사체, GRCTKSIPPICFPN-HV 12(서열번호 54)의 부텔라제-1-매개된 고리화가 30분 후에 고리 SFTI 13을 생성시키기에 50% 완전함을 보여준다. 대조적으로, 뉴트라비딘-고정화된 부텔라제-1 NA-Bu1(b) 3의 유효 농도를 5배 증가시키면 고리화 결찰이 가속화되어 10분 이내에 완료되었다.
두 번째 예에서, 용해성 및 뉴트라비딘-고정화된 부텔라제 1을 70-잔기 단백질인 환상 박테리오신 AS-48을 고리화하기 위해 비교하였다. 상기 원형 박테리오신은 광범위한 미생물을 사멸시키는 능력 때문에 인기있는 유산균에 의해 생성되는 식품 보존제이다. AS-48은 공지된 두 번째로 큰 천연의 헤드-투-테일 거대고리이다. 유리 부텔라제-1은 부텔라제-1 인식을 위한 N-말단 디펩티드 및 C-말단 헥사펩티드 서열을 포함하는 폴딩된 AS-48K 14(서열 번호 19)를 고리화하는데 사용되었다. 37℃에서 1:100의 효소:기질 비를 사용하면, 반응이 1시간 내에 완료되는 반면, 유리 부텔라제-1의 5배의 NA-Bu1(b)의 유효 농도의 증가는 고리형 AS-48 15의 83% 단리 수율로 10분 내에 고리화 완료를 가속화하였다(도 12B).
세 번째 예는 펩티드의 PAL-매개된 고리올리고머화였다. 이 반응은 초기 올리고머의 올리고머화 및 헤드-투-테일 고리화를 모두 수반한다. 이러한 접근 방식을 사용하여, 간단한 펩티딜 단량체를 구성 블록으로 사용하는 생물활성 고리-올리고머 펩티드의 형성을 입증하였다. 효소:기질 비가 1:100인 뉴트라비딘-고정화된 부텔라제 NA-Bu1(b)를 사용하여 RV7(RLYRNHV, 16; 서열번호 55)의 고리올리고머화를 40분 이내에 완료하여 RLYRN의 83% 고리이량체 c17 및 8% 고리삼량체 c18(도 13)를 생성시켰다. 대조적으로, 용해성 형태의 유효 농도가 고정화된 형태의 5배 더 낮은 1:500의 효소:기질 비를 갖는 부텔라제-1을 사용한 반응은 4시간 후에 완료되지 않았다(데이터 표시 안 됨).
최종 2개의 예에서, PAL-매개된 분자간 결찰이 연속-흐름 시스템에 사용되었다. 높은 유효 농도의 장점을 갖는 고리화 반응과 달리, 분자간 결찰은 높은 농도의 기질과 효소를 모두 필요로 할 것이며, 따라서 고정화된 PAL을 고농도로 재사용하여 상기 한계를 극복할 수 있다. NA-Yv2(b) 4 비드와 함께 자가-충전된 컬럼(내부 직경 4 ㎜)을 사용하여, Ac-RYANGI 19(10 μM; 서열번호 56)를 0.05 내지 0.5 ㎖/분의 상이한 유량하에서 합성 형광 펩티드 GLAK(FAM)RG 20(100 μM; 서열번호 57)으로 수행하였다(도 14A). 0.05 ㎖/분의 유량에서, 우리는 Ac-RYANGLAK(FAM)RG 21(서열번호 58)을 생성시키는 완전한 결찰 반응을 관찰하였다. 최종적으로, 우리는 이러한 NA-Vy2(b)의 충전된-베드 컬럼을 사용하여 193-잔기 재조합 단백질, 항-Her2 DARPin9_26-NGL 22(서열번호 49)를 GLAK(FAM)RG 20으로 표지하였다. 1 μM DARPin9_26-NGL 및 5 μM GLAK(FAM)RG를 함유하는 반응은 20 ㎕/분의 유량으로 78% 수율의 DARPin9_26-NGLAK(FAM)RG 23을 제공하였다(도 14B). 반응하지 않은 펩티드는 투석 또는 >3 kDa의 분자량 컷오프를 갖는 원심분리 필터에 의해 결찰 생성물로부터 쉽게 제거되었다.
SEQUENCE LISTING <110> Nanyang Technological University <120> P117907 <130> ASX SPECIFIC LIGASES AND USES THEREOF <160> 88 <170> PatentIn version 3.5 <210> 1 <211> 269 <212> PRT <213> Artificial <220> <223> core domain of VyPAL2 <400> 1 Asp Ser Ile Gly Thr Arg Trp Ala Val Leu Ile Ala Gly Ser Lys Gly 1 5 10 15 Tyr His Asn Tyr Arg His Gln Ala Asp Val Cys His Met Tyr Gln Ile 20 25 30 Leu Arg Lys Gly Gly Val Lys Asp Glu Asn Ile Ile Val Phe Met Tyr 35 40 45 Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Phe Pro Gly Ile Ile Ile 50 55 60 Asn Lys Pro Gly Gly Glu Asn Val Tyr Lys Gly Val Pro Lys Asp Tyr 65 70 75 80 Thr Gly Glu Asp Ile Asn Asn Val Asn Phe Leu Ala Ala Ile Leu Gly 85 90 95 Asn Lys Ser Ala Ile Ile Gly Gly Ser Gly Lys Val Leu Asp Thr Ser 100 105 110 Pro Asn Asp His Ile Phe Ile Tyr Tyr Ala Asp His Gly Ala Pro Gly 115 120 125 Lys Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp Asp Leu Val 130 135 140 Asp Thr Leu Lys Gln Lys Ala Ala Thr Gly Thr Tyr Lys Ser Met Val 145 150 155 160 Phe Tyr Val Glu Ala Cys Asn Ala Gly Ser Met Phe Glu Gly Leu Leu 165 170 175 Pro Glu Gly Thr Asn Ile Tyr Ala Met Ala Ala Ser Asn Ser Thr Glu 180 185 190 Gly Ser Trp Ile Thr Tyr Cys Pro Gly Thr Pro Asp Phe Pro Pro Glu 195 200 205 Phe Asp Val Cys Leu Gly Asp Leu Trp Ser Ile Thr Phe Leu Glu Asp 210 215 220 Cys Asp Ala His Asn Leu Arg Thr Glu Thr Val His Gln Gln Phe Glu 225 230 235 240 Leu Val Lys Lys Lys Ile Ala Tyr Ala Ser Thr Val Ser Gln Tyr Gly 245 250 255 Asp Ile Pro Ile Ser Lys Asp Ser Leu Ser Val Tyr Met 260 265 <210> 2 <211> 332 <212> PRT <213> Artificial <220> <223> VyPAL2/1 chimeric protein <400> 2 Met Gln Leu Phe Ala Ala Gly Val Ile Leu Phe Phe Leu Leu Ala Leu 1 5 10 15 Ser Gly Thr Ile Ala Gly Gly Leu Asp Val Asp Ser Leu Gln Leu Pro 20 25 30 Ser Glu Ala Ala Lys Phe Phe His Asn Asp Asn Ser Thr Asn Asp Asp 35 40 45 Asp Ser Ile Gly Thr Arg Trp Ala Val Leu Ile Ala Gly Ser Lys Gly 50 55 60 Tyr His Asn Tyr Arg His Gln Ala Asp Val Cys His Met Tyr Gln Ile 65 70 75 80 Leu Arg Lys Gly Gly Val Lys Asp Glu Asn Ile Ile Val Phe Met Tyr 85 90 95 Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Phe Pro Gly Ile Ile Ile 100 105 110 Asn Lys Pro Gly Gly Glu Asn Val Tyr Lys Gly Val Pro Lys Asp Tyr 115 120 125 Thr Gly Glu Asp Ile Asn Asn Val Asn Phe Leu Ala Ala Ile Leu Gly 130 135 140 Asn Lys Ser Ala Ile Ile Gly Gly Ser Gly Lys Val Leu Asp Thr Ser 145 150 155 160 Pro Asn Asp His Ile Phe Ile Tyr Tyr Ala Asp His Gly Ala Pro Gly 165 170 175 Lys Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp Asp Leu Val 180 185 190 Asp Thr Leu Lys Gln Lys Ala Ala Thr Gly Thr Tyr Lys Ser Met Val 195 200 205 Phe Tyr Val Glu Ala Cys Asn Ala Gly Ser Met Phe Glu Gly Leu Leu 210 215 220 Pro Glu Gly Thr Asn Ile Tyr Ala Met Ala Ala Ser Asn Ser Thr Glu 225 230 235 240 Gly Ser Trp Ile Thr Tyr Cys Pro Gly Thr Pro Asp Phe Pro Pro Glu 245 250 255 Phe Asp Val Cys Leu Gly Asp Leu Trp Ser Ile Thr Phe Leu Glu Asp 260 265 270 Cys Asp Ala His Asn Leu Arg Thr Glu Thr Val His Gln Gln Phe Glu 275 280 285 Leu Val Lys Lys Lys Ile Ala Tyr Ala Ser Thr Val Ser Gln Tyr Gly 290 295 300 Asp Ile Pro Ile Ser Lys Asp Ser Leu Ser Val Tyr Met Gly Thr Asp 305 310 315 320 Pro Ala Asn Asp Asn Arg Thr Phe Val Asp Glu Asn 325 330 <210> 3 <211> 483 <212> PRT <213> Artificial <220> <223> VyPAL2/1 chimeric protein proenzyme <400> 3 Met Gln Leu Phe Ala Ala Gly Val Ile Leu Phe Phe Leu Leu Ala Leu 1 5 10 15 Ser Gly Thr Ile Ala Gly Gly Leu Asp Val Asp Ser Leu Gln Leu Pro 20 25 30 Ser Glu Ala Ala Lys Phe Phe His Asn Asp Asn Ser Thr Asn Asp Asp 35 40 45 Asp Ser Ile Gly Thr Arg Trp Ala Val Leu Ile Ala Gly Ser Lys Gly 50 55 60 Tyr His Asn Tyr Arg His Gln Ala Asp Val Cys His Met Tyr Gln Ile 65 70 75 80 Leu Arg Lys Gly Gly Val Lys Asp Glu Asn Ile Ile Val Phe Met Tyr 85 90 95 Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Phe Pro Gly Ile Ile Ile 100 105 110 Asn Lys Pro Gly Gly Glu Asn Val Tyr Lys Gly Val Pro Lys Asp Tyr 115 120 125 Thr Gly Glu Asp Ile Asn Asn Val Asn Phe Leu Ala Ala Ile Leu Gly 130 135 140 Asn Lys Ser Ala Ile Ile Gly Gly Ser Gly Lys Val Leu Asp Thr Ser 145 150 155 160 Pro Asn Asp His Ile Phe Ile Tyr Tyr Ala Asp His Gly Ala Pro Gly 165 170 175 Lys Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp Asp Leu Val 180 185 190 Asp Thr Leu Lys Gln Lys Ala Ala Thr Gly Thr Tyr Lys Ser Met Val 195 200 205 Phe Tyr Val Glu Ala Cys Asn Ala Gly Ser Met Phe Glu Gly Leu Leu 210 215 220 Pro Glu Gly Thr Asn Ile Tyr Ala Met Ala Ala Ser Asn Ser Thr Glu 225 230 235 240 Gly Ser Trp Ile Thr Tyr Cys Pro Gly Thr Pro Asp Phe Pro Pro Glu 245 250 255 Phe Asp Val Cys Leu Gly Asp Leu Trp Ser Ile Thr Phe Leu Glu Asp 260 265 270 Cys Asp Ala His Asn Leu Arg Thr Glu Thr Val His Gln Gln Phe Glu 275 280 285 Leu Val Lys Lys Lys Ile Ala Tyr Ala Ser Thr Val Ser Gln Tyr Gly 290 295 300 Asp Ile Pro Ile Ser Lys Asp Ser Leu Ser Val Tyr Met Gly Thr Asp 305 310 315 320 Pro Ala Asn Asp Asn Arg Thr Phe Val Asp Glu Asn Ser Leu Arg Pro 325 330 335 Pro Leu Lys Val Ile His Gln His Asp Ala Asp Leu Tyr His Ile Trp 340 345 350 Cys Lys Tyr Asn Met Ala Pro Glu Gly Ser Ser Lys Lys Ile Glu Ala 355 360 365 Gln Lys Gln Leu Leu Glu Leu Met Ser His Arg Ala His Val Asp Asn 370 375 380 Ser Ile Thr Leu Ile Gly Lys Leu Leu Phe Gly Val Asn Lys Ala Ser 385 390 395 400 Lys Val Leu Asn Thr Val Arg Pro Val Gly Gln Pro Leu Val Asp Asp 405 410 415 Trp Gln Cys Leu Lys Ala Met Ile Arg Thr Phe Glu Thr His Cys Gly 420 425 430 Ser Leu Ser Glu Tyr Gly Met Lys His Thr Leu Ser Phe Ala Asn Met 435 440 445 Cys Asn Ala Gly Ile Gln Lys Glu Gln Leu Ala Glu Ala Ala Ala Gln 450 455 460 Ala Cys Val Thr Phe Pro Ser Asn Pro Tyr Ser Ser Leu Ala Glu Gly 465 470 475 480 Phe Ser Ala <210> 4 <211> 16 <212> PRT <213> Artificial <220> <223> Peptide substrate <400> 4 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn Ser Leu 1 5 10 15 <210> 5 <211> 484 <212> PRT <213> Viola yedoensis <400> 5 Met Gln Leu Phe Ala Ala Gly Val Ile Leu Phe Phe Leu Leu Ala Leu 1 5 10 15 Ser Gly Thr Ile Ala Gly Gly Leu Asp Val Asp Ser Leu Gln Leu Pro 20 25 30 Ser Glu Ala Ala Lys Phe Phe His Asn Asp Asn Ser Thr Asn Asp Asp 35 40 45 Asp Ser Ile Gly Thr Arg Trp Ala Val Leu Ile Ala Gly Ser Lys Gly 50 55 60 Tyr His Asn Tyr Arg His Gln Ala Asp Val Cys His Met Tyr Gln Ile 65 70 75 80 Leu Arg Lys Gly Gly Val Lys Asp Glu Asn Ile Ile Val Phe Met Tyr 85 90 95 Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Phe Pro Gly Ile Ile Ile 100 105 110 Asn Lys Pro Gly Gly Glu Asn Val Tyr Lys Gly Val Pro Lys Asp Tyr 115 120 125 Thr Gly Glu Asp Ile Asn Asn Val Asn Phe Leu Ala Ala Ile Leu Gly 130 135 140 Asn Lys Ser Ala Ile Ile Gly Gly Ser Gly Lys Val Leu Asp Thr Ser 145 150 155 160 Pro Asn Asp His Ile Phe Ile Tyr Tyr Ala Asp His Gly Ala Pro Gly 165 170 175 Lys Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp Asp Leu Val 180 185 190 Asp Thr Leu Lys Gln Lys Ala Ala Ala Gly Thr Tyr Lys Ser Met Val 195 200 205 Phe Tyr Val Glu Ala Cys Asn Ala Gly Ser Met Phe Glu Gly Leu Leu 210 215 220 Pro Glu Gly Met Asn Ile Tyr Ala Met Thr Ala Ser Asn Ser Thr Glu 225 230 235 240 Gly Ser Leu Ile Ala Tyr Cys Ala Gly Val Thr Pro Gly Val Pro Leu 245 250 255 Glu Ile Val Thr Cys Leu Gly Asp Leu Trp Ser Ile Thr Phe Leu Glu 260 265 270 Asp Cys Asp Ala His Asn Leu Arg Thr Glu Thr Val His Gln Gln Phe 275 280 285 Glu Leu Val Lys Lys Lys Ile Ala Tyr Ala Ser Thr Val Ser Gln Tyr 290 295 300 Gly Asp Ile Pro Ile Ser Lys Asp Ser Leu Ser Val Tyr Met Gly Thr 305 310 315 320 Asp Pro Ala Asn Asp Asn Arg Thr Phe Val Asp Glu Asn Ser Leu Arg 325 330 335 Pro Pro Leu Lys Val Ile His Gln His Asp Ala Asp Leu Tyr His Ile 340 345 350 Trp Cys Lys Tyr Asn Met Ala Pro Glu Gly Ser Ser Lys Lys Ile Glu 355 360 365 Ala Gln Lys Gln Leu Leu Glu Leu Met Ser His Arg Ala His Val Asp 370 375 380 Asn Ser Ile Thr Leu Ile Gly Lys Leu Leu Phe Gly Val Asn Lys Ala 385 390 395 400 Ser Lys Val Leu Asn Thr Val Arg Pro Val Gly Gln Pro Leu Val Asp 405 410 415 Asp Trp Gln Cys Leu Lys Ala Met Ile Arg Thr Phe Glu Thr His Cys 420 425 430 Gly Ser Leu Ser Glu Tyr Gly Met Lys His Thr Leu Ser Phe Ala Asn 435 440 445 Met Cys Asn Ala Gly Ile Gln Lys Glu Gln Leu Ala Glu Ala Ala Ala 450 455 460 Gln Ala Cys Val Thr Phe Pro Ser Asn Pro Tyr Ser Ser Leu Ala Glu 465 470 475 480 Gly Phe Ser Ala <210> 6 <211> 483 <212> PRT <213> Viola yedoensis <400> 6 Met Gln Leu Phe Ala Ala Gly Val Ile Leu Phe Phe Leu Leu Ala Leu 1 5 10 15 Ser Gly Thr Ile Ala Gly Gly Leu Asp Val Asp Ser Leu Gln Leu Pro 20 25 30 Ser Glu Ala Ala Lys Phe Phe His Asn Asp Asn Ser Thr Asn Asp Asp 35 40 45 Asp Ser Ile Gly Thr Arg Trp Ala Val Leu Ile Ala Gly Ser Lys Gly 50 55 60 Tyr His Asn Tyr Arg His Gln Ala Asp Val Cys His Met Tyr Gln Ile 65 70 75 80 Leu Arg Lys Gly Gly Val Lys Asp Glu Asn Ile Ile Val Phe Met Tyr 85 90 95 Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Phe Pro Gly Ile Ile Ile 100 105 110 Asn Lys Pro Gly Gly Glu Asn Val Tyr Lys Gly Val Pro Lys Asp Tyr 115 120 125 Thr Gly Glu Asp Ile Asn Asn Val Asn Phe Leu Ala Ala Ile Leu Gly 130 135 140 Asn Lys Ser Ala Ile Ile Gly Gly Ser Gly Lys Val Leu Asp Thr Ser 145 150 155 160 Pro Asn Asp His Ile Phe Ile Tyr Tyr Ala Asp His Gly Ala Pro Gly 165 170 175 Lys Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp Asp Leu Val 180 185 190 Asp Thr Leu Lys Gln Lys Ala Ala Thr Gly Thr Tyr Lys Ser Met Val 195 200 205 Phe Tyr Val Glu Ala Cys Asn Ala Gly Ser Met Phe Glu Gly Leu Leu 210 215 220 Pro Glu Gly Thr Asn Ile Tyr Ala Met Ala Ala Ser Asn Ser Thr Glu 225 230 235 240 Gly Ser Trp Ile Thr Tyr Cys Pro Gly Thr Pro Asp Phe Pro Pro Glu 245 250 255 Phe Asp Val Cys Leu Gly Asp Leu Trp Ser Ile Thr Phe Leu Glu Asp 260 265 270 Cys Asp Ala His Asn Leu Arg Thr Glu Thr Val His Gln Gln Phe Glu 275 280 285 Leu Val Lys Lys Lys Ile Ala Tyr Ala Ser Thr Val Ser Gln Tyr Gly 290 295 300 Asp Ile Pro Ile Ser Lys Asp Ser Leu Ser Val Tyr Met Gly Thr Asp 305 310 315 320 Pro Ala Asn Asp Asn Arg Thr Phe Val Asp Glu Asn Ser Leu Arg Pro 325 330 335 Pro Leu Lys Val Ile His Gln His Asp Ala Asp Leu Tyr His Ile Trp 340 345 350 Cys Lys Tyr Asn Met Ala Pro Glu Gly Ser Ser Lys Lys Ile Glu Ala 355 360 365 Gln Lys Gln Leu Leu Glu Leu Met Ser His Arg Ala His Val Asp Asn 370 375 380 Ser Ile Thr Leu Ile Gly Lys Leu Leu Phe Gly Val Asn Lys Ala Ser 385 390 395 400 Lys Val Leu Asn Thr Val Arg Pro Val Gly Gln Pro Leu Val Asp Asp 405 410 415 Trp Gln Cys Leu Lys Ala Met Ile Arg Thr Phe Glu Thr His Cys Gly 420 425 430 Ser Leu Ser Glu Tyr Gly Met Lys His Thr Leu Ser Phe Ala Asn Met 435 440 445 Cys Asn Ala Gly Ile Gln Lys Glu Gln Leu Ala Glu Ala Ala Ala Gln 450 455 460 Ala Cys Val Thr Phe Pro Ser Asn Pro Tyr Ser Ser Leu Ala Glu Gly 465 470 475 480 Phe Ser Ala <210> 7 <211> 487 <212> PRT <213> Viola yedoensis <400> 7 Met Gln Leu Phe Ala Ala Gly Val Ile Leu Phe Phe Leu Leu Ala Leu 1 5 10 15 Ser Gly Thr Ile Ala Gly Gly Leu Asp Val Asp Ser Leu Gln Leu Pro 20 25 30 Ser Glu Ala Ala Lys Phe Phe His Asn Asp Asn Ser Thr Asn Asp Asp 35 40 45 Asp Ser Ser Ala Gly Thr Lys Trp Ala Val Leu Ile Ala Gly Ser Lys 50 55 60 Gly Tyr Gln Asn Tyr Arg His Gln Ala Asp Val Cys His Ala Tyr Gln 65 70 75 80 Ile Leu Arg Arg Gly Gly Val Lys Asp Glu Asn Ile Ile Val Phe Met 85 90 95 Tyr Asp Asp Ile Ala Tyr Asp Ile Arg Asn Pro Tyr Pro Gly Thr Ile 100 105 110 Thr Asn Ser Pro Asp Lys Lys Asp Val Tyr Lys Gly Val Pro Lys Asp 115 120 125 Tyr Thr Gly Glu Asp Val Asn Val Gln Asn Phe Leu Ala Val Ile Leu 130 135 140 Gly Asn Lys Thr Ala Leu Thr Gly Gly Ser Gly Lys Val Leu Asp Thr 145 150 155 160 Arg Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly Tyr Ala 165 170 175 Gly Val Leu Gly Met Pro Thr Gln Pro Tyr Leu Tyr Ala Asn Asp Leu 180 185 190 Ile Asp Thr Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Glu Ser Leu 195 200 205 Val Phe Tyr Val Glu Ala Cys Glu Ser Ala Ser Ile Phe Glu Gly Leu 210 215 220 Leu Pro Asp Gly Leu Asn Ile Tyr Val Ser Thr Ala Ala Lys Ala Gly 225 230 235 240 Glu Gly Ser Trp Val Val Tyr Cys Pro Thr Gln Gln Pro Pro Val Pro 245 250 255 Ala Glu Tyr Gly Thr Cys Val Gly Asp Leu Tyr Ser Val Thr Trp Met 260 265 270 Glu Asp Cys Asp Leu Tyr Asn Leu Arg Thr Gln Thr Leu His Gln Gln 275 280 285 Tyr Glu Met Val Lys Lys Lys Ile Ala Tyr Ala Ser Thr Val Ser Gln 290 295 300 Phe Gly Asp Leu Thr Ile Thr Lys Asp Ser Leu Phe Glu Tyr Met Gly 305 310 315 320 Thr Asp Pro Ala Asn Glu Lys His His Tyr Glu Asp Gln Glu Asn Ser 325 330 335 Leu Arg Pro His Val Asp Ala Val His Gln Arg Glu Ala Asp Leu Tyr 340 345 350 His Phe Trp Asp Lys Tyr Gln Lys Ala Ser Glu Gly Ser Arg Asn Lys 355 360 365 Val Ala Ala Arg Lys Gln Leu Val Glu Val Met Leu His Arg Met His 370 375 380 Val Asp Asp Ser Ile Glu Ser Ile Ala Lys Leu Leu Phe Gly Ser Asp 385 390 395 400 Ala Lys Ala Ser Glu Met Met Asn Thr Ile Arg Pro Pro Gly Gln Pro 405 410 415 Leu Val Ser Asp Trp Asp Cys Leu Lys Thr Met Val Arg Thr Phe Glu 420 425 430 Thr His Cys Gly Ser Leu Ser Glu Tyr Gly Met Lys Tyr Thr Arg Phe 435 440 445 Leu Ala Asn Met Cys Asn Ala Gly Ile Arg Lys Glu Gln Leu Ala Glu 450 455 460 Ala Ala Ala Gln Ala Cys Val Thr Phe Pro Ser Asn Ser Tyr Ser Ser 465 470 475 480 Leu Ala Glu Gly Phe Ser Ala 485 <210> 8 <211> 488 <212> PRT <213> Viola yedoensis <400> 8 Met Lys Leu Leu Ala Ala Gly Val Ile Leu Val Ser Leu Leu Ala Leu 1 5 10 15 Ser Gly Thr Val Ala Val Ala Val Ala Gly Gly Leu Asp Val Asp Pro 20 25 30 Leu Arg Leu Pro Ser Glu Ala Ala Lys Phe Phe His Asn Asp Asn Ser 35 40 45 Thr Asn Asp Asp Asp Ser Ile Gly Thr Thr Trp Ala Val Leu Ile Ala 50 55 60 Gly Ser Lys Gly Tyr His Asn Tyr Arg His Gln Ala Asp Val Cys His 65 70 75 80 Met Tyr Gln Ile Leu Arg Lys Gly Gly Val Lys Asp Glu Asn Ile Ile 85 90 95 Val Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Phe Pro 100 105 110 Gly Ile Ile Ile Asn Lys Pro Gly Gly Glu Asn Val Tyr Lys Gly Val 115 120 125 Pro Lys Asp Tyr Thr Gly Glu Asp Ile Asn Asn Val Asn Phe Leu Ala 130 135 140 Ala Ile Leu Gly Asn Lys Ser Ala Ile Ile Gly Gly Ser Gly Lys Val 145 150 155 160 Leu Asp Thr Ser Pro Asn Asp His Ile Phe Ile Tyr Tyr Ala Asp His 165 170 175 Gly Ala Pro Gly Lys Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala 180 185 190 Asp Asp Leu Val Asp Thr Leu Lys Gln Lys Ala Ala Ala Gly Thr Tyr 195 200 205 Lys Ser Met Val Phe Tyr Val Glu Ala Cys Asn Ala Gly Ser Met Phe 210 215 220 Glu Gly Leu Leu Pro Glu Gly Met Asn Ile Tyr Ala Met Thr Ala Ser 225 230 235 240 Asn Ser Thr Glu Gly Ser Leu Ile Ala Tyr Cys Ala Gly Val Thr Pro 245 250 255 Gly Val Pro Leu Glu Ile Val Thr Cys Leu Gly Asp Leu Trp Ser Ile 260 265 270 Thr Phe Leu Glu Asp Cys Asp Ala His Asn Leu Arg Thr Glu Thr Val 275 280 285 His Gln Gln Phe Glu Leu Val Lys Lys Lys Ile Ala Tyr Ala Ser Thr 290 295 300 Val Ser Gln Tyr Gly Asp Ile Pro Ile Ser Lys Asp Ser Leu Ser Val 305 310 315 320 Tyr Met Gly Thr Asp Pro Ala Asn Asp Asn Arg Thr Phe Val Asp Glu 325 330 335 Asn Ser Leu Arg Pro Pro Leu Lys Val Ile His Gln Arg Asp Ala Tyr 340 345 350 Leu Tyr His Leu Trp Tyr Lys Tyr Gln Asn Thr Pro Glu Gly Ser Ser 355 360 365 Lys Lys Ile Glu Ala Gln Lys Gln Leu Leu Glu Met Met Ser His Arg 370 375 380 Ala His Val Asp Asn Ser Ile Thr Leu Ile Gly Lys Leu Leu Phe Gly 385 390 395 400 Met Asp Lys Ala Ser Lys Met Leu Asn Ser Val Arg Pro Ala Gly Gln 405 410 415 Pro Leu Val Asp Asp Trp Gln Cys Leu Lys Thr Met Ile Arg Thr Phe 420 425 430 Glu Arg His Cys Gly Ser Leu Ser Glu Tyr Gly Met Lys His Thr Leu 435 440 445 Ser Phe Ala Asn Met Cys Asn Ala Gly Ile Arg Lys Glu Gln Leu Ala 450 455 460 Glu Ala Ala Ala Gln Ala Cys Val Thr Phe Pro Ser Asn Ser Tyr Ser 465 470 475 480 Ser Leu Ala Glu Gly Phe Ser Ala 485 <210> 9 <211> 487 <212> PRT <213> Viola yedoensis <400> 9 Met Lys Leu Leu Ala Ala Gly Val Ile Leu Val Ser Leu Leu Ala Leu 1 5 10 15 Ser Gly Thr Val Ala Val Ala Val Ala Gly Gly Leu Asp Val Asp Pro 20 25 30 Leu Arg Leu Pro Ser Glu Ala Ala Lys Phe Phe His Asn Asp Asn Ser 35 40 45 Thr Asn Asp Asp Asp Ser Ile Gly Thr Thr Trp Ala Val Leu Ile Ala 50 55 60 Gly Ser Lys Gly Tyr His Asn Tyr Arg His Gln Ala Asp Val Cys His 65 70 75 80 Met Tyr Gln Ile Leu Arg Lys Gly Gly Val Lys Asp Glu Asn Ile Ile 85 90 95 Val Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Phe Pro 100 105 110 Gly Ile Ile Ile Asn Lys Pro Gly Gly Glu Asn Val Tyr Lys Gly Val 115 120 125 Pro Lys Asp Tyr Thr Gly Glu Asp Ile Asn Asn Val Asn Phe Leu Ala 130 135 140 Ala Ile Leu Gly Asn Lys Ser Ala Ile Ile Gly Gly Ser Gly Lys Val 145 150 155 160 Leu Asp Thr Ser Pro Asn Asp His Ile Phe Ile Tyr Tyr Ala Asp His 165 170 175 Gly Ala Pro Gly Lys Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala 180 185 190 Asp Asp Leu Val Asp Thr Leu Lys Gln Lys Ala Ala Thr Gly Thr Tyr 195 200 205 Lys Ser Met Val Phe Tyr Val Glu Ala Cys Asn Ala Gly Ser Met Phe 210 215 220 Glu Gly Leu Leu Pro Glu Gly Thr Asn Ile Tyr Ala Met Ala Ala Ser 225 230 235 240 Asn Ser Thr Glu Gly Ser Trp Ile Thr Tyr Cys Pro Gly Thr Pro Asp 245 250 255 Phe Pro Pro Glu Phe Asp Val Cys Leu Gly Asp Leu Trp Ser Ile Thr 260 265 270 Phe Leu Glu Asp Cys Asp Ala His Asn Leu Arg Thr Glu Thr Val His 275 280 285 Gln Gln Phe Glu Leu Val Lys Lys Lys Ile Ala Tyr Ala Ser Thr Val 290 295 300 Ser Gln Tyr Gly Asp Ile Pro Ile Ser Lys Asp Ser Leu Ser Val Tyr 305 310 315 320 Met Gly Thr Asp Pro Ala Asn Asp Asn Arg Thr Phe Val Asp Glu Asn 325 330 335 Ser Leu Arg Pro Pro Leu Lys Val Ile His Gln Arg Asp Ala Tyr Leu 340 345 350 Tyr His Leu Trp Tyr Lys Tyr Gln Asn Thr Pro Glu Gly Ser Ser Lys 355 360 365 Lys Ile Glu Ala Gln Lys Gln Leu Leu Glu Met Met Ser His Arg Ala 370 375 380 His Val Asp Asn Ser Ile Thr Leu Ile Gly Lys Leu Leu Phe Gly Met 385 390 395 400 Asp Lys Ala Ser Lys Met Leu Asn Ser Val Arg Pro Ala Gly Gln Pro 405 410 415 Leu Val Asp Asp Trp Gln Cys Leu Lys Thr Met Ile Arg Thr Phe Glu 420 425 430 Arg His Cys Gly Ser Leu Ser Glu Tyr Gly Met Lys His Thr Leu Ser 435 440 445 Phe Ala Asn Met Cys Asn Ala Gly Ile Arg Lys Glu Gln Leu Ala Glu 450 455 460 Ala Ala Ala Gln Ala Cys Val Thr Phe Pro Ser Asn Ser Tyr Ser Ser 465 470 475 480 Leu Ala Glu Gly Phe Ser Ala 485 <210> 10 <211> 493 <212> PRT <213> Viola yedoensis <400> 10 Met Glu Ala Tyr Arg Ser Phe Phe Asn Tyr Val Ile Phe Phe Ser Val 1 5 10 15 Val Leu Cys Leu Phe Gly Ala Gln Ala Thr Arg Val Ser Arg Pro Phe 20 25 30 Val Pro Gly Ile Leu Met Pro Thr Asp Arg Val Gly Thr Glu Pro Asp 35 40 45 Gln Ala Asp Asp Val Asp Gly Asp Glu Ile Gly Thr Arg Trp Ala Val 50 55 60 Leu Val Ala Gly Ser Asn Gly Phe Gly Asn Tyr Arg His Gln Ala Asp 65 70 75 80 Val Cys His Ala Tyr Gln Leu Leu Arg Lys Gly Gly Leu Lys Glu Glu 85 90 95 Asn Ile Val Val Phe Met Tyr Asp Asp Ile Ala Thr Asn Gln Leu Asn 100 105 110 Pro Arg Pro Gly Ile Ile Ile Asn His Pro Gln Gly Glu Asp Val Tyr 115 120 125 His Gly Val Pro Lys Asp Tyr Thr Gly Ala Glu Val Asn Ala His Asn 130 135 140 Leu Tyr Ala Val Leu Leu Gly Asp Lys Ser Ala Val Lys Gly Gly Ser 145 150 155 160 Gly Lys Val Val Asn Ser Lys Pro Asp Asp Arg Ile Phe Val Tyr Tyr 165 170 175 Ser Asp His Gly Gly Pro Gly Val Leu Gly Met Pro Asn Leu Pro Tyr 180 185 190 Val Tyr Ala Met Asp Phe Ile Asp Thr Leu Lys Lys Lys His Ala Ala 195 200 205 Asn Ser Tyr Arg Glu Met Val Val Tyr Val Glu Ala Cys Glu Ser Gly 210 215 220 Ser Leu Phe Glu Gly Val Met Pro Lys Asp Leu Asn Ile Tyr Val Thr 225 230 235 240 Thr Ala Ser Asn Ala Gln Glu Asn Ser Trp Gly Thr Tyr Cys Pro Gly 245 250 255 Glu Gly Ala Pro Pro Glu Tyr Asn Thr Cys Leu Gly Asp Leu Tyr Ser 260 265 270 Val Ala Trp Met Glu Asp Ser Glu Ser His Asn Leu Lys Lys Glu Ala 275 280 285 Ile Lys Asp Gln Tyr Lys Thr Val Lys Ala Arg Thr Ser Asp Ser Ser 290 295 300 Thr Tyr His Ser Gly Ser His Val Met Glu Tyr Gly Asn Arg Ser Ile 305 310 315 320 Arg Ala Glu Lys Leu Tyr Leu Tyr Gln Gly Phe Asp Pro Ala Thr Val 325 330 335 Asn Phe Pro Pro Asn Asn Gly Leu Leu Lys Pro Met Glu Val Val Asn 340 345 350 Gln Arg Asp Ala Glu Leu Val Phe Met Trp Gln Met Tyr Lys Lys Ser 355 360 365 Glu Glu Gly Ser Glu Glu Lys Thr Glu Ile Leu Asn Leu Ile Lys Glu 370 375 380 Thr Met Arg His Arg Asn His Leu Asp Gly Ser Ile Lys Leu Ile Gly 385 390 395 400 Thr Leu Leu Phe Gly Pro Lys Glu Gly Ser Ser Val Leu Gln Ser Val 405 410 415 Arg Lys Pro Gly Ser Pro Leu Val Asp Asp Trp Lys Cys Leu Lys Ser 420 425 430 Met Val Arg Ser Phe Glu Arg His Cys Gly Ser Leu Thr Gln Tyr Gly 435 440 445 Met Lys His Met Arg Ala Phe Ala Asn Ile Cys Asn Ser Gly Ile Pro 450 455 460 Arg Ala Ser Met Glu Glu Ala Cys Gly Val Ala Cys Ser Gly His Asp 465 470 475 480 Val Gly Glu Trp Asn Pro Phe Ile Arg Gly Tyr Ser Ala 485 490 <210> 11 <211> 493 <212> PRT <213> Viola yedoensis <400> 11 Met Glu Ala Tyr Arg Ser Phe Phe Asn Tyr Val Ile Phe Phe Ser Val 1 5 10 15 Val Leu Cys Leu Phe Gly Ala Gln Ala Thr Arg Val Ser Arg Pro Phe 20 25 30 Val Pro Gly Ile Leu Met Pro Thr Asp Arg Val Gly Thr Glu Pro Asp 35 40 45 Gln Ala Asp Asp Val Asp Gly Asp Glu Ile Gly Thr Arg Trp Ala Val 50 55 60 Leu Val Ala Gly Ser Asn Gly Phe Gly Asn Tyr Arg His Gln Ala Asp 65 70 75 80 Val Cys His Ala Tyr Gln Leu Leu Arg Lys Gly Gly Leu Lys Glu Glu 85 90 95 Asn Ile Val Val Phe Met Tyr Asp Asp Ile Ala Thr Asn Gln Leu Asn 100 105 110 Pro Arg Pro Gly Ile Ile Ile Asn His Pro Gln Gly Glu Asp Val Tyr 115 120 125 His Gly Val Pro Lys Asp Tyr Thr Gly Ala Glu Val Asn Ala His Asn 130 135 140 Leu Tyr Ala Val Leu Leu Gly Asp Lys Ser Ala Val Lys Gly Gly Ser 145 150 155 160 Gly Lys Val Val Asn Ser Lys Pro Asp Asp Arg Ile Phe Val Tyr Tyr 165 170 175 Ser Asp His Gly Gly Pro Gly Val Leu Gly Met Pro Asn Leu Pro Tyr 180 185 190 Val Tyr Ala Met Asp Phe Ile Asp Thr Leu Lys Lys Lys His Ala Ala 195 200 205 Asn Ser Tyr Arg Glu Met Val Val Tyr Val Glu Ala Cys Glu Ser Gly 210 215 220 Ser Asn Phe Glu Gly Val Met Pro Glu Asp Leu Asn Ile Tyr Val Thr 225 230 235 240 Thr Ala Ser Asn Ala Gln Glu Asn Ser Trp Gly Thr Tyr Cys Pro Gly 245 250 255 Glu Gly Ala Pro Pro Glu Tyr Asn Thr Cys Leu Gly Asp Leu Tyr Ser 260 265 270 Val Ala Trp Met Glu Asp Ser Glu Ser His Asn Leu Lys Lys Glu Ala 275 280 285 Ile Lys Asp Gln Tyr Lys Thr Val Lys Ala Arg Thr Ser Asp Ser Ser 290 295 300 Thr Tyr His Ser Gly Ser His Val Met Glu Tyr Gly Asn Arg Ser Ile 305 310 315 320 Arg Gly Glu Lys Leu Tyr Leu Tyr Gln Gly Phe Asp Pro Ala Thr Val 325 330 335 Asn Phe Pro Pro Asn Asn Gly Leu Pro Lys Pro Met Glu Val Val Asn 340 345 350 Gln Arg Asp Ala Glu Leu Val Phe Met Trp Gln Met Tyr Lys Lys Ser 355 360 365 Lys Glu Gly Ser Glu Glu Lys Thr Glu Ile Leu Asn Gln Ile Lys Glu 370 375 380 Thr Met Arg His Arg Asn His Leu Asp Gly Ser Ile Lys Leu Ile Gly 385 390 395 400 Thr Leu Leu Phe Gly Pro Lys Lys Gly Ser Ser Ile Leu Gln Ser Val 405 410 415 Arg Thr Pro Gly Ser Pro Leu Val Asp Asp Trp Lys Cys Leu Lys Ser 420 425 430 Met Val Arg Ser Phe Glu Arg His Cys Gly Ser Leu Thr Gln Tyr Gly 435 440 445 Met Lys His Met Arg Ala Phe Ala Asn Ile Cys Asn Tyr Gly Ile Ser 450 455 460 Gln Ala Ser Met Glu Glu Ala Cys Gly Val Ala Cys Gly Gly His Asp 465 470 475 480 Val Gly Glu Ser His Pro Phe Ile Arg Gly Tyr Ser Ala 485 490 <210> 12 <211> 499 <212> PRT <213> Viola yedoensis <400> 12 Met Thr Arg Val Ala Thr Gly Ala Ile Leu Leu Phe Met Val Ala Leu 1 5 10 15 Ala Gly Ile Glu Ala Gly Arg Gln Asp Ile Asp His Asp Val Leu Arg 20 25 30 Leu Pro Thr Glu Val Ser Asn Phe Phe Arg Asn Asn Asn Asn Asn Lys 35 40 45 Asn Lys Asn Asp Lys Asn Asp Asn Gly Val Asp Ser Thr Gly Thr Arg 50 55 60 Trp Ala Val Leu Ile Ala Gly Ser Asn Gly Tyr Trp Asn Tyr Arg His 65 70 75 80 Gln Ala Asp Val Cys His Ala Tyr Gln Ile Leu Lys Lys Gly Gly Leu 85 90 95 Lys Asp Glu Asn Ile Ile Val Phe Met Tyr Asp Asp Ile Ala Asn Asp 100 105 110 Ile Glu Asn Pro Arg Pro Gly Ile Ile Ile Asn Asn Pro Lys Gly Glu 115 120 125 Asp Val Tyr Lys Gly Val Pro Lys Asp Tyr Thr Gly Glu Gln Val Thr 130 135 140 Ala Gly Asn Phe Phe Asn Val Ile Leu Gly Asn Lys Thr Gly Leu Thr 145 150 155 160 Gly Gly Ser Gly Lys Val Val Asn Ser Gly Pro Asn Asp His Ile Phe 165 170 175 Ile Tyr Tyr Thr Asp His Gly Gly Pro Gly Ile Leu Gly Met Pro Thr 180 185 190 Ser Pro Tyr Ile Tyr Ala Asp Asp Leu Val Asp Val Leu Lys Lys Lys 195 200 205 His Ala Ser Gly Thr Tyr Lys Ser Leu Val Phe Tyr Val Glu Ala Cys 210 215 220 Glu Ser Gly Ser Ile Phe Glu Gly Ile Leu Pro Lys Gly Leu Asn Ile 225 230 235 240 Tyr Ala Thr Thr Ala Ser Asn Ala Val Glu Ser Ser Trp Gly Thr Tyr 245 250 255 Cys Pro Gly Glu Asn Pro Gly Pro Pro Glu Glu Tyr Asp Thr Cys Leu 260 265 270 Gly Asp Leu Tyr Ser Val Ala Trp Met Glu Asp Ser Asp Val His Asn 275 280 285 Leu Gln Thr Glu Thr Leu His Gln Gln Tyr Gln Leu Val Lys Asp Arg 290 295 300 Thr Gly Lys Arg Asn Asn Gly Tyr Gly Ser His Val Met Gln Tyr Gly 305 310 315 320 Asp Val Pro Leu Ser Lys Asp Ser Leu Phe Val Tyr Met Gly Thr Asn 325 330 335 Pro Ala Asn Asp Asn Tyr Thr Phe Met Asp Asn Asn Ala Leu Arg Gln 340 345 350 Pro Ser Lys Ala Val Asn Gln Arg Asp Ala Asp Leu Leu His Phe Trp 355 360 365 His Lys Tyr Arg Lys Ala Pro Glu Gly Ser Pro Arg Lys Met Glu Ala 370 375 380 Gln Lys Gln Phe Val Glu Met Met Ser His Arg Leu His Leu Asp Gln 385 390 395 400 Ser Ile Lys Phe Ile Gly Arg Leu Leu Phe Gly Ile Asp Lys Ala Ser 405 410 415 Glu Val Leu Ser Thr Val Arg Pro Ala Gly Gln Pro Leu Val Asp Asp 420 425 430 Trp Asp Cys Leu Lys Thr Leu Val Arg Thr Phe Glu Thr His Cys Gly 435 440 445 Ser Leu Ser Gln Tyr Gly Met Lys His Met Arg Ser Leu Ala Asn Leu 450 455 460 Cys Asn Ala Gly Ile Arg Lys Glu Lys Met Ala Glu Ala Ser Val Gln 465 470 475 480 Ala Cys Ala Thr Val Pro Ser Asn Pro Trp Ser Ser Leu Lys Lys Gly 485 490 495 Phe Ser Ala <210> 13 <211> 498 <212> PRT <213> Viola yedoensis <400> 13 Met Thr Arg Leu Ala Ser Gly Ala Ile Leu Leu Phe Leu Phe Ala Val 1 5 10 15 Ala Gly Ile Glu Ala Gly Arg Gln Asp Ile Asp Asp Val Leu Arg Leu 20 25 30 Pro Thr Glu Val Ser Asn Phe Phe Arg Asn Asn Asn Asn Asn Lys Asn 35 40 45 Asn Asn Asp Lys Asn Ala Asn Gly Asp Asp Ser Thr Gly Thr Arg Trp 50 55 60 Ala Val Leu Ile Ala Gly Ser Asn Gly Tyr Trp Asn Tyr Arg His Gln 65 70 75 80 Ala Asp Val Cys His Ala Tyr Gln Ile Leu Lys Lys Gly Gly Leu Lys 85 90 95 Asp Glu Asn Ile Ile Val Phe Met Tyr Asp Asp Ile Ala Asn Asp Ile 100 105 110 Glu Asn Pro Arg Pro Gly Ile Ile Ile Asn Asn Pro Lys Gly Glu Asp 115 120 125 Val Tyr Ile Gly Val Pro Lys Asp Tyr Thr Gly Glu Gln Val Thr Ala 130 135 140 Gly Asn Phe Tyr Asn Val Ile Leu Gly Asn Lys Thr Gly Leu Thr Gly 145 150 155 160 Gly Ser Gly Lys Val Val Asn Ser Gly Pro Asn Asp His Ile Phe Ile 165 170 175 Tyr Tyr Thr Asp His Gly Gly Pro Gly Ile Leu Gly Met Pro Thr Ser 180 185 190 Pro Tyr Ile Tyr Ala Asp Asp Leu Val Asp Val Leu Lys Lys Lys His 195 200 205 Ala Ser Gly Thr Tyr Lys Ser Leu Val Phe Tyr Val Glu Ala Cys Glu 210 215 220 Ser Gly Ser Ile Phe Glu Gly Ile Leu Pro Lys Gly Leu Asn Ile Tyr 225 230 235 240 Ala Thr Thr Ala Ser Asn Ala Val Glu Ser Ser Trp Gly Thr Tyr Cys 245 250 255 Pro Gly Glu His Pro Ser Pro Pro Gln Glu Tyr Asp Thr Cys Leu Gly 260 265 270 Asp Leu Tyr Ser Val Ala Trp Met Glu Asp Ser Asp Val His Asn Leu 275 280 285 Gln Thr Glu Thr Leu His Gln Gln Tyr Gln Leu Val Lys Asp Arg Thr 290 295 300 Gly Asn Gly Tyr Asn Gly Tyr Gly Ser His Val Met Gln Tyr Gly Asp 305 310 315 320 Val Pro Leu Ser Lys Asp Asn Leu Phe Glu Tyr Met Gly Thr Asn Pro 325 330 335 Ala Asn Asp Asn Tyr Thr Phe Met Asp Asp Asn Ala Leu Arg Gln Pro 340 345 350 Ser Lys Ala Val Asn Gln Arg Asp Ala Asp Leu Leu His Phe Trp His 355 360 365 Lys Tyr Arg Lys Ala Pro Glu Gly Ser Pro Arg Lys Met Glu Ala Gln 370 375 380 Lys Gln Phe Ile Glu Met Met Thr His Arg Leu His Leu Asp Gln Ser 385 390 395 400 Ile Lys Phe Ile Gly Arg Leu Leu Phe Gly Ile Asp Lys Ala Ser Glu 405 410 415 Val Leu Ser Thr Val Arg Pro Ala Gly Gln Pro Leu Val Asp Asp Trp 420 425 430 Asn Cys Leu Lys Thr Leu Val Arg Thr Phe Glu Thr His Cys Gly Ser 435 440 445 Leu Ser Gln Tyr Gly Met Lys His Met Arg Ser Leu Ala Asn Leu Cys 450 455 460 Asn Ala Gly Ile Arg Lys Glu Lys Met Ala Glu Ala Ser Ala Gln Ala 465 470 475 480 Cys Ala Thr Val Pro Ser Asn Pro Trp Ser Ser Leu Lys Lys Gly Phe 485 490 495 Ser Ala <210> 14 <211> 467 <212> PRT <213> Viola canadensis <400> 14 Met Ala Thr Leu Val Leu Leu Phe Leu Leu Ala Phe Ser Gly Phe Ala 1 5 10 15 Ala Gly Gly Arg Asp Ile Thr Gly Asp Gly Phe Leu Arg Leu Pro Ser 20 25 30 His Gly Asn Gly Asn Ser Gly Asp Val Asp Ser Lys Ala Gly Thr Lys 35 40 45 Trp Ala Val Leu Ile Ala Gly Ser Lys Gly Tyr Gln Asn Tyr Arg His 50 55 60 Gln Ala Asp Val Cys His Ala Tyr Gln Ile Leu Arg Lys Gly Gly Val 65 70 75 80 Lys Asp Glu Asn Ile Ile Val Phe Met Tyr Asp Asp Ile Ala Tyr Asp 85 90 95 Ile Arg Asn Pro Tyr Pro Gly Thr Ile Ile Asn Ser Pro Asp Lys Lys 100 105 110 Asp Val Tyr Lys Gly Val Pro Lys Asp Tyr Thr Gly Glu Asp Val Asn 115 120 125 Val Gln Asn Phe Leu Ala Val Ile Leu Gly Asn Lys Thr Ala Leu Thr 130 135 140 Gly Gly Ser Gly Lys Val Leu Asp Thr Arg Pro Asn Asp His Ile Phe 145 150 155 160 Ile Tyr Tyr Thr Asp His Gly Tyr Pro Gly Val Leu Gly Met Pro Thr 165 170 175 Glu Pro Tyr Leu Tyr Ala Asn Asp Leu Ile Asp Thr Leu Lys Lys Lys 180 185 190 His Ala Leu Gly Thr Tyr Glu Gly Leu Val Phe Tyr Val Glu Ala Cys 195 200 205 Glu Ser Ala Ser Ile Phe Glu Gly Leu Leu Pro Asp Gly Leu Asn Ile 210 215 220 Tyr Val Ser Thr Ala Ala Lys Ala Gly Glu Gly Ser Trp Val Ala Tyr 225 230 235 240 Cys Pro Ser Gln Glu Pro Pro Val Pro Ala Glu Tyr Gly Thr Cys Val 245 250 255 Gly Asp Leu Tyr Ser Val Thr Trp Met Glu Asp Ser Asp Val Tyr Asn 260 265 270 Leu Arg Thr Gln Thr Leu His Gln Gln Tyr Glu Leu Val Lys Asn Lys 275 280 285 Ile Ala Tyr Ala Ser Thr Val Ser Gln Phe Gly Asp Phe Pro Ile Ser 290 295 300 Lys Asp Ser Leu Phe Glu Tyr Met Gly Thr Asp Pro Ala Asn Glu Lys 305 310 315 320 Arg Gln Tyr Glu Asp Glu Glu Lys Ser Ser Ser Pro His Val Gly Ala 325 330 335 Val His Gln Arg Glu Ala Asp Leu His His Phe Trp Asp Lys Tyr Gln 340 345 350 Lys Ala Ser Glu Gly Ser Arg Asn Lys Val Asp Ala Arg Lys Gln Leu 355 360 365 Val Glu Val Met Leu His Arg Met His Val Asp Asp Ser Ile Glu Ser 370 375 380 Ile Ala Lys Leu Leu Phe Gly Ser Gly Ala Lys Ala Ser Glu Met Met 385 390 395 400 Asn Thr Ile Arg Pro Pro Gly Gln Pro Leu Val Ser Asp Trp Asp Cys 405 410 415 Leu Lys Thr Met Val Arg Thr Phe Glu Thr His Cys Gly Ser Leu Ser 420 425 430 Glu Tyr Gly Met Lys Tyr Thr Arg Phe Leu Ala Asn Ile Cys Asn Ser 435 440 445 Gly Ile Gln Lys Glu Lys Met Gly Glu Ala Ser Ala Gln Val Cys Leu 450 455 460 Asn Phe Pro 465 <210> 15 <211> 6 <212> PRT <213> Artificial <220> <223> MLA motif <400> 15 Lys Lys Ile Ala Tyr Ala 1 5 <210> 16 <211> 6 <212> PRT <213> Artificial <220> <223> MLA motif <400> 16 Asn Lys Ile Ala Tyr Ala 1 5 <210> 17 <211> 166 <212> PRT <213> Artificial <220> <223> VyPAL1 cap sequence <400> 17 Gly Thr Asp Pro Ala Asn Asp Asn Arg Thr Phe Val Asp Glu Asn Ser 1 5 10 15 Leu Arg Pro Pro Leu Lys Val Ile His Gln His Asp Ala Asp Leu Tyr 20 25 30 His Ile Trp Cys Lys Tyr Asn Met Ala Pro Glu Gly Ser Ser Lys Lys 35 40 45 Ile Glu Ala Gln Lys Gln Leu Leu Glu Leu Met Ser His Arg Ala His 50 55 60 Val Asp Asn Ser Ile Thr Leu Ile Gly Lys Leu Leu Phe Gly Val Asn 65 70 75 80 Lys Ala Ser Lys Val Leu Asn Thr Val Arg Pro Val Gly Gln Pro Leu 85 90 95 Val Asp Asp Trp Gln Cys Leu Lys Ala Met Ile Arg Thr Phe Glu Thr 100 105 110 His Cys Gly Ser Leu Ser Glu Tyr Gly Met Lys His Thr Leu Ser Phe 115 120 125 Ala Asn Met Cys Asn Ala Gly Ile Gln Lys Glu Gln Leu Ala Glu Ala 130 135 140 Ala Ala Gln Ala Cys Val Thr Phe Pro Ser Asn Pro Tyr Ser Ser Leu 145 150 155 160 Ala Glu Gly Phe Ser Ala 165 <210> 18 <211> 281 <212> PRT <213> Artificial <220> <223> active fragment of Clitoria ternatea butelase-1 <400> 18 Val Glu Gly Thr Arg Trp Ala Val Leu Val Ala Gly Ser Lys Gly Tyr 1 5 10 15 Val Asn Tyr Arg His Gln Ala Asp Val Cys His Ala Tyr Gln Ile Leu 20 25 30 Lys Lys Gly Gly Leu Lys Asp Glu Asn Ile Ile Val Phe Met Tyr Asp 35 40 45 Asp Ile Ala Tyr Asn Glu Ser Asn Pro His Pro Gly Val Ile Ile Asn 50 55 60 His Pro Tyr Gly Ser Asp Val Tyr Lys Gly Val Pro Lys Asp Tyr Val 65 70 75 80 Gly Glu Asp Ile Asn Pro Pro Asn Phe Tyr Ala Val Leu Leu Ala Asn 85 90 95 Lys Ser Ala Leu Thr Gly Thr Gly Ser Gly Lys Val Leu Asp Ser Gly 100 105 110 Pro Asn Asp His Val Phe Ile Tyr Tyr Thr Asp His Gly Gly Ala Gly 115 120 125 Val Leu Gly Met Pro Ser Lys Pro Tyr Ile Ala Ala Ser Asp Leu Asn 130 135 140 Asp Val Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys Ser Ile Val 145 150 155 160 Phe Tyr Val Glu Ser Cys Glu Ser Gly Ser Met Phe Asp Gly Leu Leu 165 170 175 Pro Glu Asp His Asn Ile Tyr Val Met Gly Ala Ser Asp Thr Gly Glu 180 185 190 Ser Ser Trp Val Thr Tyr Cys Pro Leu Gln His Pro Ser Pro Pro Pro 195 200 205 Glu Tyr Asp Val Cys Val Gly Asp Leu Phe Ser Val Ala Trp Leu Glu 210 215 220 Asp Cys Asp Val His Asn Leu Gln Thr Glu Thr Phe Gln Gln Gln Tyr 225 230 235 240 Glu Val Val Lys Asn Lys Thr Ile Val Ala Leu Ile Glu Asp Gly Thr 245 250 255 His Val Val Gln Tyr Gly Asp Val Gly Leu Ser Lys Gln Thr Leu Phe 260 265 270 Val Tyr Met Gly Thr Asp Pro Ala Asn 275 280 <210> 19 <211> 75 <212> PRT <213> Artificial <220> <223> Modified Bacteriocin AS-48K <400> 19 Val Val Glu Ala Gly Gly Trp Val Thr Thr Ile Val Ser Ile Leu Thr 1 5 10 15 Ala Val Gly Ser Gly Gly Leu Ser Leu Leu Ala Ala Ala Gly Arg Glu 20 25 30 Ser Ile Lys Ala Tyr Leu Lys Lys Glu Ile Lys Lys Lys Gly Lys Arg 35 40 45 Ala Val Ile Ala Trp Met Ala Lys Glu Phe Gly Ile Pro Ala Ala Val 50 55 60 Ala Gly Thr Val Leu Asn His Val Lys Lys Lys 65 70 75 <210> 20 <211> 31 <212> PRT <213> Oldenlandia affinis <400> 20 Gly Leu Pro Val Cys Gly Glu Thr Cys Val Gly Gly Thr Cys Asn Thr 1 5 10 15 Pro Gly Cys Thr Cys Ser Trp Pro Val Cys Thr Arg Asn Gly Leu 20 25 30 <210> 21 <211> 16 <212> PRT <213> Conus sp. <400> 21 Gly Val Cys Cys Gly Tyr Lys Leu Cys His Pro Cys Ala Gly Asn His 1 5 10 15 <210> 22 <211> 25 <212> PRT <213> Artificial <220> <223> Thanatin analog <400> 22 Gly Ile Ser Lys Lys Pro Val Pro Ile Ile Tyr Cys Asn Arg Arg Thr 1 5 10 15 Gly Lys Cys Gln Arg Met Asn His Val 20 25 <210> 23 <211> 42 <212> PRT <213> Homo sapiens <400> 23 Ser Ala Asp Ser His Glu Lys Arg His His Gly Tyr Arg Arg Lys Phe 1 5 10 15 His Glu Lys His His Ser His Arg Glu Phe Pro Phe Tyr Gly Asp Tyr 20 25 30 Gly Ser Asn Tyr Leu Tyr Asp Asn His Val 35 40 <210> 24 <211> 43 <212> PRT <213> Homo sapiens <400> 24 Gly Leu Pro Asp Ser His Glu Lys Arg His His Gly Tyr Arg Arg Lys 1 5 10 15 Phe His Glu Lys His His Ser His Arg Glu Phe Pro Phe Tyr Gly Asp 20 25 30 Tyr Gly Ser Asn Tyr Leu Tyr Asp Asn His Val 35 40 <210> 25 <211> 36 <212> PRT <213> Homo sapiens <400> 25 Gly Ala Asp Ser His Ala Lys Arg His His Gly Tyr Lys Arg Lys Phe 1 5 10 15 His Glu Lys His His Ser His Arg Gly Tyr Arg Ser Asn Tyr Leu Tyr 20 25 30 Asp Asn His Val 35 <210> 26 <211> 36 <212> PRT <213> Homo sapiens <400> 26 Gly Leu Asp Ser His Ala Lys Arg His His Gly Tyr Lys Arg Lys Phe 1 5 10 15 His Glu Lys His His Ser His Arg Gly Tyr Arg Ser Asn Tyr Leu Tyr 20 25 30 Asp Asn His Val 35 <210> 27 <211> 26 <212> PRT <213> Artificial <220> <223> modified human neuromedin U <400> 27 Arg Val Asp Glu Glu Phe Gln Ser Pro Phe Ala Ser Gln Ser Arg Gly 1 5 10 15 Tyr Phe Leu Phe Arg Pro Arg Asn His Val 20 25 <210> 28 <211> 33 <212> PRT <213> Artificial <220> <223> modified human salusin alpha <400> 28 Gly Ile Ser Gly Ala Leu Pro Pro Ala Pro Ala Ala Pro Arg Pro Ala 1 5 10 15 Leu Arg Ala Gln Arg Ala Gly Pro Ala Gly Pro Gly Ala Lys Asn His 20 25 30 Val <210> 29 <211> 28 <212> PRT <213> Artificial <220> <223> modified rat neuromedin U <400> 29 Gly Ile Lys Tyr Lys Val Asn Glu Tyr Gln Gly Pro Val Ala Pro Ser 1 5 10 15 Gly Gly Phe Phe Leu Phe Arg Pro Arg Asn His Val 20 25 <210> 30 <211> 40 <212> PRT <213> Artificial <220> <223> modified human apelin <400> 30 Gly Leu Val Gln Pro Arg Gly Ser Arg Asn Gly Pro Gly Pro Trp Gln 1 5 10 15 Gly Gly Arg Arg Lys Phe Arg Arg Gln Arg Pro Arg Leu Ser His Lys 20 25 30 Gly Pro Met Pro Phe Asn His Val 35 40 <210> 31 <211> 32 <212> PRT <213> Artificial <220> <223> modified human galanin <400> 31 Gly Leu Thr Ser Gly Trp Thr Leu Asn Ser Ala Gly Tyr Leu Leu Gly 1 5 10 15 Pro His Ala Val Gly Asn His Arg Ser Phe Ser Asp Lys Asn His Val 20 25 30 <210> 32 <211> 10 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 32 Gly Leu Pro Pro Pro Ile Phe Asn His Val 1 5 10 <210> 33 <211> 10 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 33 Ser Leu Pro Pro Pro Ile Phe Asn His Val 1 5 10 <210> 34 <211> 10 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 34 His Leu Pro Pro Pro Ile Phe Asn His Val 1 5 10 <210> 35 <211> 10 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 35 Glu Ile Asn Ser Thr Glu Ile Asn His Val 1 5 10 <210> 36 <211> 9 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 36 Arg Val Thr Arg Pro Val Asn His Val 1 5 <210> 37 <211> 8 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 37 Lys Ala Leu Val Ile Asn His Val 1 5 <210> 38 <211> 6 <212> PRT <213> Artificial <220> <223> Artificial peptide <220> <221> misc_feature <222> (1)..(1) <223> Xaa can be any naturally occurring amino acid <400> 38 Xaa Ile Gly Gly Ile Arg 1 5 <210> 39 <211> 6 <212> PRT <213> Artificial <220> <223> Artificial peptide <220> <221> misc_feature <222> (2)..(2) <223> Xaa can be any naturally occurring amino acid <400> 39 Leu Xaa Gly Gly Ile Arg 1 5 <210> 40 <211> 5 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 40 Tyr Arg Asn His Val 1 5 <210> 41 <211> 5 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 41 Gly Leu Pro Val Arg 1 5 <210> 42 <211> 5 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 42 Thr Arg Asn His Val 1 5 <210> 43 <211> 263 <212> PRT <213> Artificial <220> <223> peptide construct GFP + NHV <400> 43 Met His His His His His His Ser Ser Gly Val Asp Leu Gly Thr Glu 1 5 10 15 Asn Leu Tyr Phe Gln Ser Met Ser Lys Gly Glu Glu Leu Phe Thr Gly 20 25 30 Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys 35 40 45 Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu 50 55 60 Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro 65 70 75 80 Thr Leu Val Thr Thr Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr 85 90 95 Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu 100 105 110 Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr 115 120 125 Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg 130 135 140 Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly 145 150 155 160 His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala 165 170 175 Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn 180 185 190 Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr 195 200 205 Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser 210 215 220 Thr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met 225 230 235 240 Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp 245 250 255 Glu Leu Tyr Lys Asn His Val 260 <210> 44 <211> 5 <212> PRT <213> Artificial <220> <223> Artificial peptide with K at position 4 being biotinylated <400> 44 Gly Ile Gly Lys Arg 1 5 <210> 45 <211> 129 <212> PRT <213> Artificial <220> <223> human anti-ABL scFv fragment <400> 45 Met His His His His His His Ser Ser Gly Val Asp Leu Gly Thr Glu 1 5 10 15 Asn Leu Tyr Phe Gln Ser Met Gly Gly Ser Gly Ser Ser Val Ser Ser 20 25 30 Val Pro Thr Lys Leu Glu Val Val Asp Ala Thr Pro Thr Ser Leu Lys 35 40 45 Ile Ser Trp Asp Ala Tyr Tyr Ser Ser Trp Gln Asn Val Lys Tyr Tyr 50 55 60 Arg Ile Thr Tyr Gly Glu Thr Gly Gly Asp Ser Pro Val Gln Glu Phe 65 70 75 80 Thr Val Pro Gly Tyr Tyr Ser Thr Ala Thr Ile Ser Gly Leu Lys Pro 85 90 95 Gly Val Asp Tyr Thr Ile Thr Val Tyr Ala Tyr Asp Thr Phe Phe Pro 100 105 110 Gly Tyr Glu Pro Asn Ser Pro Ile Ser Ile Asn Tyr Arg Thr Asn His 115 120 125 Val <210> 46 <211> 184 <212> PRT <213> Artificial <220> <223> darpin specific for ERK <400> 46 Met His His His His His His Ser Ser Gly Val Asp Leu Gly Thr Glu 1 5 10 15 Asn Leu Tyr Phe Gln Ser Met Gly Ser Asp Leu Gly Lys Lys Leu Leu 20 25 30 Glu Ala Ala Arg Ala Gly Gln Asp Asp Glu Val Arg Ile Leu Met Ala 35 40 45 Asn Gly Ala Asp Val Asn Ala His Asp Asp Gln Gly Ser Thr Pro Leu 50 55 60 His Leu Ala Ala Trp Ile Gly His Pro Glu Ile Val Glu Val Leu Leu 65 70 75 80 Lys His Gly Ala Asp Val Asn Ala Arg Asp Thr Asp Gly Trp Thr Pro 85 90 95 Leu His Leu Ala Ala Asp Asn Gly His Leu Glu Ile Val Glu Val Leu 100 105 110 Leu Lys Tyr Gly Ala Asp Val Asn Ala Gln Asp Ala Tyr Gly Leu Thr 115 120 125 Pro Leu His Leu Ala Ala Asp Arg Gly His Leu Glu Ile Val Glu Val 130 135 140 Leu Leu Lys His Gly Ala Asp Val Asn Ala Gln Asp Lys Phe Gly Lys 145 150 155 160 Thr Ala Phe Asp Ile Ser Ile Asp Asn Gly Asn Glu Asp Leu Ala Glu 165 170 175 Ile Leu Gln Lys Leu Asn His Val 180 <210> 47 <211> 12 <212> PRT <213> Artificial <220> <223> Synthetic peptide <400> 47 Gly Leu Tyr Arg Arg Gly Arg Leu Tyr Arg Arg Asn 1 5 10 <210> 48 <211> 14 <212> PRT <213> Artificial <220> <223> Synthetic peptide <400> 48 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn 1 5 10 <210> 49 <211> 187 <212> PRT <213> Artificial <220> <223> Synthetic peptide 6xHis-TEV-GLGSG-DARPin9_26-GSGS-NGL <400> 49 Gly His His His His His His Gly Thr Glu Asn Leu Tyr Phe Gln Gly 1 5 10 15 Leu Gly Ser Gly Ser Asp Leu Gly Lys Lys Leu Leu Glu Ala Ala Arg 20 25 30 Ala Gly Gln Asp Asp Glu Val Arg Ile Leu Met Ala Asn Gly Ala Asp 35 40 45 Val Asn Ala Lys Asp Phe Tyr Gly Ile Thr Pro Leu His Leu Ala Ala 50 55 60 Ala Tyr Gly His Leu Glu Ile Val Glu Val Leu Leu Lys His Gly Ala 65 70 75 80 Asp Val Asn Ala His Asp Trp Asn Gly Trp Thr Pro Leu His Leu Ala 85 90 95 Ala Lys Tyr Gly His Leu Glu Ile Val Glu Val Leu Leu Lys His Gly 100 105 110 Ala Asp Val Asn Ala Ile Asp Asn Ala Gly Lys Thr Pro Leu His Leu 115 120 125 Ala Ala Ala His Gly His Leu Glu Ile Val Glu Val Leu Leu Lys Tyr 130 135 140 Gly Ala Asp Val Asn Ala Gln Asp Lys Phe Gly Lys Thr Pro Phe Asp 145 150 155 160 Leu Ala Ile Asp Asn Gly Asn Glu Asp Ile Ala Glu Val Leu Gln Lys 165 170 175 Ala Ala Lys Leu Gly Ser Gly Ser Asn Gly Leu 180 185 <210> 50 <211> 8 <212> PRT <213> Artificial <220> <223> Peptide inhibitor <400> 50 Leu Lys Val Ile His Asn Ser Leu 1 5 <210> 51 <211> 16 <212> PRT <213> Artificial <220> <223> Peptide substrate <400> 51 Lys Leu Gly Thr Ser Pro Gly Arg Leu Arg Tyr Ala Gly Asn Gly Leu 1 5 10 15 <210> 52 <211> 16 <212> PRT <213> Artificial <220> <223> GN14-HV <400> 52 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn His Val 1 5 10 15 <210> 53 <211> 18 <212> PRT <213> Artificial <220> <223> GN14-SLAN <400> 53 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn Ser Leu 1 5 10 15 Ala Asn <210> 54 <211> 16 <212> PRT <213> Artificial <220> <223> SFTI analog <400> 54 Gly Arg Cys Thr Lys Ser Ile Pro Pro Ile Cys Phe Pro Asn His Val 1 5 10 15 <210> 55 <211> 7 <212> PRT <213> Artificial <220> <223> RV7 peptide <400> 55 Arg Leu Tyr Arg Asn His Val 1 5 <210> 56 <211> 6 <212> PRT <213> Artificial <220> <223> Peptide substrate <400> 56 Arg Tyr Ala Asn Gly Ile 1 5 <210> 57 <211> 6 <212> PRT <213> Artificial <220> <223> synthetic peptide, K labeled with FAM <400> 57 Gly Leu Ala Lys Arg Gly 1 5 <210> 58 <211> 10 <212> PRT <213> Artificial <220> <223> ligated peptide, K labeled with FAM <400> 58 Arg Tyr Ala Asn Gly Leu Ala Lys Arg Gly 1 5 10 <210> 59 <211> 16 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 59 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn Ser Leu 1 5 10 15 <210> 60 <211> 18 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 60 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn Ser Leu 1 5 10 15 Ala Asn <210> 61 <211> 18 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 61 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn Ser Ile 1 5 10 15 Gln Gln <210> 62 <211> 17 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 62 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn Ser Ile 1 5 10 15 Gln <210> 63 <211> 16 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 63 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn Ser Ile 1 5 10 15 <210> 64 <211> 18 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 64 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn Ser Leu 1 5 10 15 Ala Met <210> 65 <211> 17 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 65 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn Ser Leu 1 5 10 15 Ala <210> 66 <211> 18 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 66 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn Ser Leu 1 5 10 15 Asp Asn <210> 67 <211> 18 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 67 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn Ser Leu 1 5 10 15 Asp Ile <210> 68 <211> 17 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 68 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn Ser Leu 1 5 10 15 Asp <210> 69 <211> 18 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 69 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn Ser Leu 1 5 10 15 Ser Gly <210> 70 <211> 17 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 70 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn Ser Leu 1 5 10 15 Ser <210> 71 <211> 15 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 71 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn Ser 1 5 10 15 <210> 72 <211> 18 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 72 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn His Val 1 5 10 15 Ile Ala <210> 73 <211> 17 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 73 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn His Val 1 5 10 15 Ile <210> 74 <211> 16 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 74 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn His Val 1 5 10 15 <210> 75 <211> 15 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 75 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asn His 1 5 10 15 <210> 76 <211> 16 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 76 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asp Gly Ile 1 5 10 15 <210> 77 <211> 16 <212> PRT <213> Artificial <220> <223> Artificial peptide <400> 77 Gly Ile Ser Thr Lys Ser Ile Pro Pro Ile Ser Tyr Arg Asp Ser Leu 1 5 10 15 <210> 78 <211> 14 <212> PRT <213> Artificial <220> <223> Artificial peptide <220> <221> misc_feature <222> (13)..(13) <223> Xaa can be any naturally occurring amino acid <400> 78 Gly Leu Tyr Arg Arg Gly Arg Leu Tyr Arg Arg Asn Xaa Leu 1 5 10 <210> 79 <211> 14 <212> PRT <213> Artificial <220> <223> Artificial peptide <220> <221> misc_feature <222> (14)..(14) <223> Xaa can be any naturally occurring amino acid <400> 79 Gly Leu Tyr Arg Arg Gly Arg Leu Tyr Arg Arg Asn Gly Xaa 1 5 10 <210> 80 <211> 488 <212> PRT <213> Clitoria ternatea <400> 80 Met Ala Val Asp His Cys Phe Leu Lys Lys Lys Thr Cys Tyr Tyr Gly 1 5 10 15 Phe Val Leu Trp Ser Trp Met Leu Met Met Ser Leu His Ser Lys Ala 20 25 30 Ala Arg Leu Asn Pro Gln Lys Glu Trp Asp Ser Val Ile Arg Leu Pro 35 40 45 Thr Glu Pro Val Asp Ala Asp Thr Asp Glu Val Gly Thr Arg Trp Ala 50 55 60 Val Leu Val Ala Gly Ser Asn Gly Tyr Glu Asn Tyr Arg His Gln Ala 65 70 75 80 Asp Val Cys His Ala Tyr Gln Leu Leu Ile Lys Gly Gly Leu Lys Glu 85 90 95 Glu Asn Ile Val Val Phe Met Tyr Asp Asp Ile Ala Trp His Glu Leu 100 105 110 Asn Pro Arg Pro Gly Val Ile Ile Asn Asn Pro Arg Gly Glu Asp Val 115 120 125 Tyr Ala Gly Val Pro Lys Asp Tyr Thr Gly Glu Asp Val Thr Ala Glu 130 135 140 Asn Leu Phe Ala Val Ile Leu Gly Asp Arg Ser Lys Val Lys Gly Gly 145 150 155 160 Ser Gly Lys Val Ile Asn Ser Lys Pro Glu Asp Arg Ile Phe Ile Phe 165 170 175 Tyr Ser Asp His Gly Gly Pro Gly Val Leu Gly Met Pro Asn Glu Gln 180 185 190 Ile Leu Tyr Ala Met Asp Phe Ile Asp Val Leu Lys Lys Lys His Ala 195 200 205 Ser Gly Gly Tyr Arg Glu Met Val Ile Tyr Val Glu Ala Cys Glu Ser 210 215 220 Gly Ser Leu Phe Glu Gly Ile Met Pro Lys Asp Leu Asn Val Phe Val 225 230 235 240 Thr Thr Ala Ser Asn Ala Gln Glu Asn Ser Trp Gly Thr Tyr Cys Pro 245 250 255 Gly Thr Glu Pro Ser Pro Pro Pro Glu Tyr Thr Thr Cys Leu Gly Asp 260 265 270 Leu Tyr Ser Val Ala Trp Met Glu Asp Ser Glu Ser His Asn Leu Arg 275 280 285 Arg Glu Thr Val Asn Gln Gln Tyr Arg Ser Val Lys Glu Arg Thr Ser 290 295 300 Asn Phe Lys Asp Tyr Ala Met Gly Ser His Val Met Gln Tyr Gly Asp 305 310 315 320 Thr Asn Ile Thr Ala Glu Lys Leu Tyr Leu Phe Gln Gly Phe Asp Pro 325 330 335 Ala Thr Val Asn Leu Pro Pro His Asn Gly Arg Ile Glu Ala Lys Met 340 345 350 Glu Val Val His Gln Arg Asp Ala Glu Leu Leu Phe Met Trp Gln Met 355 360 365 Tyr Gln Arg Ser Asn His Leu Leu Gly Lys Lys Thr His Ile Leu Lys 370 375 380 Gln Ile Ala Glu Thr Val Lys His Arg Asn His Leu Asp Gly Ser Val 385 390 395 400 Glu Leu Ile Gly Val Leu Leu Tyr Gly Pro Gly Lys Gly Ser Pro Val 405 410 415 Leu Gln Ser Val Arg Asp Pro Gly Leu Pro Leu Val Asp Asn Trp Ala 420 425 430 Cys Leu Lys Ser Met Val Arg Val Phe Glu Ser His Cys Gly Ser Leu 435 440 445 Thr Gln Tyr Gly Met Lys His Met Arg Ala Phe Ala Asn Ile Cys Asn 450 455 460 Ser Gly Val Ser Glu Ser Ser Met Glu Glu Ala Cys Met Val Ala Cys 465 470 475 480 Gly Gly His Asp Ala Gly His Leu 485 <210> 81 <211> 474 <212> PRT <213> Oldenlandia affinis <400> 81 Met Val Arg Tyr Leu Ala Gly Ala Val Leu Leu Leu Val Val Leu Ser 1 5 10 15 Val Ala Ala Ala Val Ser Gly Ala Arg Asp Gly Asp Tyr Leu His Leu 20 25 30 Pro Ser Glu Val Ser Arg Phe Phe Arg Pro Gln Glu Thr Asn Asp Asp 35 40 45 His Gly Glu Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly 50 55 60 Ser Lys Gly Tyr Ala Asn Tyr Arg His Gln Ala Gly Val Cys His Ala 65 70 75 80 Tyr Gln Ile Leu Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val 85 90 95 Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Arg Pro Gly 100 105 110 Val Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro 115 120 125 Lys Asp Tyr Thr Gly Glu Glu Val Asn Ala Lys Asn Phe Leu Ala Ala 130 135 140 Ile Leu Gly Asn Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val 145 150 155 160 Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly 165 170 175 Ala Ala Gly Val Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp 180 185 190 Glu Leu Asn Asp Ala Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys 195 200 205 Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu 210 215 220 Gly Ile Leu Pro Glu Asp Leu Asn Ile Tyr Ala Leu Thr Ser Thr Asn 225 230 235 240 Thr Thr Glu Ser Ser Trp Cys Tyr Tyr Cys Pro Ala Gln Glu Asn Pro 245 250 255 Pro Pro Pro Glu Tyr Asn Val Cys Leu Gly Asp Leu Phe Ser Val Ala 260 265 270 Trp Leu Glu Asp Ser Asp Val Gln Asn Ser Trp Tyr Glu Thr Leu Asn 275 280 285 Gln Gln Tyr His His Val Asp Lys Arg Ile Ser His Ala Ser His Ala 290 295 300 Thr Gln Tyr Gly Asn Leu Lys Leu Gly Glu Glu Gly Leu Phe Val Tyr 305 310 315 320 Met Gly Ser Asn Pro Ala Asn Asp Asn Tyr Thr Ser Leu Asp Gly Asn 325 330 335 Ala Leu Thr Pro Ser Ser Ile Val Val Asn Gln Arg Asp Ala Asp Leu 340 345 350 Leu His Leu Trp Glu Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala Arg 355 360 365 Lys Glu Glu Ala Gln Thr Gln Ile Phe Lys Ala Met Ser His Arg Val 370 375 380 His Ile Asp Ser Ser Ile Lys Leu Ile Gly Lys Leu Leu Phe Gly Ile 385 390 395 400 Glu Lys Cys Thr Glu Ile Leu Asn Ala Val Arg Pro Ala Gly Gln Pro 405 410 415 Leu Val Asp Asp Trp Ala Cys Leu Arg Ser Leu Val Gly Thr Phe Glu 420 425 430 Thr His Cys Gly Ser Leu Ser Glu Tyr Gly Met Arg His Thr Arg Thr 435 440 445 Ile Ala Asn Ile Cys Asn Ala Gly Ile Ser Glu Glu Gln Met Ala Glu 450 455 460 Ala Ala Ser Gln Ala Cys Ala Ser Ile Pro 465 470 <210> 82 <211> 488 <212> PRT <213> Oldenlandia affinis <400> 82 Met Val Arg Tyr Pro Ala Gly Ala Val Leu Leu Leu Val Val Leu Ser 1 5 10 15 Val Val Ala Val Asp Gly Ala Arg Asp Gly Tyr Leu Lys Leu Pro Ser 20 25 30 Glu Val Ser Asp Phe Phe Arg Pro Arg Asn Thr Asn Asp Gly Asp Asp 35 40 45 Ser Val Gly Thr Arg Trp Ala Val Leu Leu Ala Gly Ser Asn Gly Tyr 50 55 60 Trp Asn Tyr Arg His Gln Ala Asp Leu Cys His Ala Tyr Gln Ile Leu 65 70 75 80 Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val Phe Met Tyr Asp 85 90 95 Asp Ile Ala Tyr Asn Glu Glu Asn Pro Arg Pro Gly Val Ile Ile Asn 100 105 110 Ser Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro Lys Asp Tyr Thr 115 120 125 Gly Asp Gln Val Asn Ala Lys Asn Phe Leu Ala Ala Ile Leu Gly Asn 130 135 140 Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val Asn Ser Gly Pro 145 150 155 160 Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly Gly Pro Gly Val 165 170 175 Leu Gly Met Pro Val Gly Pro Tyr Ile Tyr Ala Asp Asp Leu Ile Asp 180 185 190 Thr Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys Ser Leu Val Phe 195 200 205 Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu Gly Leu Leu Pro 210 215 220 Glu Gly Leu Asn Ile Tyr Ala Thr Thr Ala Ser Asn Ala Glu Glu Ser 225 230 235 240 Ser Trp Gly Thr Tyr Cys Pro Gly Glu Tyr Pro Ser Pro Pro Pro Glu 245 250 255 Tyr Asp Thr Cys Leu Gly Asp Leu Tyr Ser Val Ala Trp Met Glu Asp 260 265 270 Ser Glu Val His Asn Leu Arg Ser Glu Thr Leu Lys Gln Gln Tyr His 275 280 285 Leu Val Lys Ala Arg Thr Ser Asn Gly Asn Ser Ala Tyr Gly Ser His 290 295 300 Val Met Gln Tyr Gly Asp Leu Lys Leu Ser Val Asp Asn Leu Phe Leu 305 310 315 320 Tyr Met Gly Thr Asn Pro Ala Asn Asp Asn Tyr Thr Phe Val Asp Asp 325 330 335 Asn Ala Leu Arg Pro Ser Ser Lys Ala Val Asn Gln Arg Asp Ala Asp 340 345 350 Leu Leu His Phe Trp Asp Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala 355 360 365 Arg Lys Glu Glu Ala Arg Lys Gln Val Phe Glu Ala Met Ser His Arg 370 375 380 Met His Ile Asp Asn Ser Ile Lys Leu Val Gly Lys Leu Leu Phe Gly 385 390 395 400 Ile Glu Arg Gly Ala Glu Ile Leu Asp Ala Val Arg Pro Ala Gly Gln 405 410 415 Pro Leu Ala Asp Asp Trp Thr Cys Leu Lys Ser Leu Val Arg Thr Phe 420 425 430 Glu Thr His Cys Gly Ser Leu Ser Gln Tyr Gly Met Lys His Met Arg 435 440 445 Thr Ile Ala Asn Ile Cys Asn Ala Gly Ile Thr Lys Glu Gln Met Ala 450 455 460 Glu Ala Ser Ala Gln Ala Cys Ser Ser Val Pro Ser Asn Pro Trp Ser 465 470 475 480 Ser Leu His Lys Gly Phe Ser Ala 485 <210> 83 <211> 481 <212> PRT <213> Hybanthus enneaspermus <400> 83 Met Lys Leu Leu Val Pro Gly Val Leu Leu Leu Phe Leu Leu Ala Leu 1 5 10 15 Ser Gly Ile Ala Ala Gly Arg Pro Asp Asp Phe Leu Arg Leu Pro Ser 20 25 30 Glu Ala Ala Lys Ser Phe Leu His Asn Asp Asp Asp Ser Val Gly Thr 35 40 45 Arg Trp Ala Val Leu Ile Ala Gly Ser Lys Gly Trp Gln Asn Tyr Arg 50 55 60 His Gln Ala Asp Val Cys His Ala Tyr Gln Ile Leu Lys Lys Gly Gly 65 70 75 80 Leu Lys Asp Glu Asn Ile Ile Val Phe Met Tyr Asp Asp Ile Ala Tyr 85 90 95 Asn Glu Ser Asn Pro Arg Pro Gly Ile Val Ile Asn Lys Pro Lys Gly 100 105 110 Glu Asp Val Tyr Lys Gly Val Pro Lys Asp Tyr Thr Gly Glu Asn Val 115 120 125 Asn Ala Val Asn Phe Leu Ala Val Leu Leu Ala Asn Arg Ser Ala Leu 130 135 140 Thr Gly Gly Ser Gly Lys Val Leu Asp Ser Gly Pro Asn Asp Arg Ile 145 150 155 160 Phe Ile Tyr Tyr Thr Asp His Gly Ala Pro Val Thr Ile Gly Met Pro 165 170 175 Ser Lys Pro Tyr Leu Val Ala Lys Asp Leu Val Asp Thr Leu Lys Lys 180 185 190 Lys His Ala Ala Gly Thr Tyr Lys Ser Met Val Phe Tyr Ile Glu Ser 195 200 205 Cys Glu Ser Gly Ser Met Phe Asp Gly Leu Leu Pro Glu Asp Ala Asn 210 215 220 Ile Tyr Gly Met Thr Ala Thr Asn Ser Thr Glu Gly Ser Trp Val Thr 225 230 235 240 Tyr Cys Pro Gly Gln Thr Asp Asp Tyr Pro Glu Asp Asp Glu Tyr Asp 245 250 255 Val Cys Phe Gly Asp Leu Trp Ser Val Ala Trp Leu Glu Asp Cys Asp 260 265 270 Ala His Asn Leu Arg Thr Glu Thr Leu Asp Gln Gln Tyr Glu Val Val 275 280 285 Lys Lys Lys Ile Glu Tyr Ala His Ile Pro Ala Gln Tyr Gly Asn Val 290 295 300 Ser Leu Ala Lys Asp Ser Leu Phe Val Tyr Met Gly Thr Asp Pro Ala 305 310 315 320 Asn Asp Asn Lys Thr Phe Val Glu Glu Asn Thr Leu Arg Arg Pro Leu 325 330 335 Lys Ala Val His Ser Arg Asp Ala Asp Leu Leu His Phe Trp His Lys 340 345 350 Tyr His Lys Ala Pro Glu Gly Thr Ser Arg Lys Ile Asp Ala Gln Lys 355 360 365 Gln Leu Val Glu Val Leu Ser His Arg Thr His Val Asp Asn Ser Ile 370 375 380 Lys Leu Val Gly Glu Leu Leu Phe Gly Val Gly Lys Ala Ser Glu Val 385 390 395 400 Leu Asn Thr Ile Arg Pro Ala Gly Gln Pro Leu Val Asp Asp Trp Asp 405 410 415 Cys Leu Lys Thr Met Val Arg Thr Phe Glu Thr His Cys Gly Ser Leu 420 425 430 Ser Glu Tyr Gly Met Lys His Met Arg Ser Phe Ala Asn Met Cys Asn 435 440 445 Ala Gly Val Gln Lys Glu Gln Met Ala Val Ala Ala Gly Gln Ala Cys 450 455 460 Val Thr Phe Pro Ser Asn Pro Trp Ser Ser Leu Asp Glu Gly Phe Ser 465 470 475 480 Val <210> 84 <211> 478 <212> PRT <213> Petunia x hybrida <400> 84 Met Ile Ser His Val Ala Gly Ile Leu Ile Leu Val Gly Phe Ser Ile 1 5 10 15 Leu Gly Ala Gly Glu Gly Arg Asn Val Leu Lys Leu Pro Ser Glu Ala 20 25 30 Ser Arg Phe Phe Lys Lys Gly Glu Asp Asp Asp Ser Val Gly Thr Arg 35 40 45 Trp Ala Val Leu Leu Ala Gly Ser Asn Ser Tyr Trp Asn Tyr Arg His 50 55 60 Gln Ala Asp Val Cys His Ala Tyr Gln Leu Leu Arg Lys Gly Gly Leu 65 70 75 80 Lys Asp Glu Asn Ile Val Val Leu Met Tyr Asp Asp Ile Ala Tyr Asn 85 90 95 Glu Glu Asn Pro Arg Lys Gly Val Ile Ile Asn Asn Pro Ala Gly Glu 100 105 110 Asp Val Tyr Lys Gly Val Pro Lys Asp Tyr Thr Gly Asp Asp Val Asn 115 120 125 Val Asp Asn Phe Leu Ala Val Leu Leu Gly Asn Lys Thr Ala Ile Thr 130 135 140 Gly Gly Ser Gly Lys Val Val Asp Ser Gly Pro Asn Asp His Ile Phe 145 150 155 160 Ile Phe Tyr Thr Asp His Gly Gly Pro Gly Val Leu Gly Met Pro Thr 165 170 175 Lys Pro Tyr Leu Tyr Ala Ser Asp Leu Ile Gly Ala Leu Lys Lys Lys 180 185 190 His Ala Ser Gly Thr Tyr Lys Ser Leu Val Leu Tyr Val Glu Ala Cys 195 200 205 Glu Ala Gly Ser Ile Phe Glu Gly Leu Leu Pro Glu Gly Leu Asn Val 210 215 220 Tyr Ala Thr Thr Ala Ser Asp Ala Val Glu Gly Ser Trp Val Thr Tyr 225 230 235 240 Cys Pro Gly Gln Asn Pro Ser Pro Pro Pro Glu Tyr Thr Thr Cys Leu 245 250 255 Gly Asp Leu Tyr Ser Val Ser Trp Met Glu Asp Ser Glu Lys His Asn 260 265 270 Leu Gln Thr Glu Ser Leu Arg Gln Gln Tyr His Leu Val Lys Glu Lys 275 280 285 Ile Ala Tyr Ala Ser His Val Met Gln Tyr Gly Asp Leu Lys Leu Ser 290 295 300 Met Asp Ser Leu Ser Met Tyr Met Gly Thr Asp Pro Ala Asn Asp Asn 305 310 315 320 Tyr Thr Phe Val Asp Asp Asn Ser Leu Gly Thr Ser Ser Lys Ala Val 325 330 335 Asn Gln Arg Asp Ala Asp Leu Leu His Phe Ser Asp Lys Phe Leu Lys 340 345 350 Ala Pro Glu Gly Ser Ala Arg Lys Val Glu Ala Gln Lys Gln Phe Ala 355 360 365 Glu Ala Met Ser His Arg Leu His Leu Asp Asn Ser Met Ala Leu Val 370 375 380 Gly Lys Leu Leu Phe Gly Ile Lys Lys Gly Pro Glu Val Leu Lys Arg 385 390 395 400 Val Arg Ser Asp Gly Gln Leu Leu Val Asp Asp Trp Ala Cys Leu Lys 405 410 415 Ser Phe Val Arg Thr Phe Glu Thr His Cys Gly Ser Leu Ser Gln Tyr 420 425 430 Gly Met Lys His Met Arg Ser Phe Ala Asn Ile Cys Asn Ala Gly Ile 435 440 445 Lys Val Glu Gln Met Val Glu Ala Ser Ser Gln Ala Cys Pro Ser Val 450 455 460 Pro Ser Asn Thr Trp Ser Ser Leu His Arg Gly Phe Ser Ala 465 470 475 <210> 85 <211> 475 <212> PRT <213> Cannavalia ensiformis <400> 85 Met Val Met Met Leu Val Met Leu Ser Leu His Gly Thr Ala Ala Arg 1 5 10 15 Leu Asn Arg Arg Glu Trp Asp Ser Val Ile Gln Leu Pro Thr Glu Pro 20 25 30 Val Asp Asp Glu Val Gly Thr Arg Trp Ala Val Leu Val Ala Gly Ser 35 40 45 Asn Gly Tyr Gly Asn Tyr Arg His Gln Ala Asp Val Cys His Ala Tyr 50 55 60 Gln Leu Leu Ile Lys Gly Gly Val Lys Glu Glu Asn Ile Val Val Phe 65 70 75 80 Met Tyr Asp Asp Ile Ala Tyr Asn Ala Met Asn Pro Arg Pro Gly Val 85 90 95 Ile Ile Asn His Pro Gln Gly Pro Asp Val Tyr Ala Gly Val Pro Lys 100 105 110 Asp Tyr Thr Gly Glu Asp Val Thr Pro Glu Asn Leu Tyr Ala Val Ile 115 120 125 Leu Gly Asp Lys Ser Lys Val Lys Gly Gly Ser Gly Lys Val Ile Asn 130 135 140 Ser Asn Pro Glu Asp Arg Ile Phe Ile Phe Tyr Ser Asp His Gly Gly 145 150 155 160 Pro Gly Val Leu Gly Met Pro Asn Ala Pro Phe Val Tyr Ala Met Asp 165 170 175 Phe Ile Asp Val Leu Lys Lys Lys His Ala Ser Gly Gly Tyr Lys Glu 180 185 190 Met Val Ile Tyr Ile Glu Ala Cys Glu Ser Gly Ser Ile Phe Glu Gly 195 200 205 Ile Met Pro Lys Asp Leu Asn Ile Tyr Val Thr Thr Ala Ser Asn Ala 210 215 220 Gln Glu Asn Ser Phe Gly Thr Tyr Cys Pro Gly Met Asn Pro Pro Pro 225 230 235 240 Pro Glu Glu Tyr Val Thr Cys Leu Gly Asp Leu Tyr Ser Val Ser Trp 245 250 255 Met Glu Asp Ser Glu Thr His Asn Leu Lys Arg Glu Thr Val Gln Gln 260 265 270 Gln Tyr Gln Ser Val Arg Lys Arg Thr Ser Asn Ser Asn Ser Tyr Arg 275 280 285 Phe Gly Ser His Val Met Gln Tyr Gly Asp Thr Asn Ile Thr Ala Glu 290 295 300 Lys Leu Tyr Leu Tyr His Gly Phe Asp Pro Ala Thr Val Asn Phe Pro 305 310 315 320 Pro His Asn Gly Asn Leu Glu Ala Lys Met Glu Val Val Asn Gln Arg 325 330 335 Asp Ala Glu Leu Leu Phe Met Trp Gln Met Tyr Gln Arg Ser Asn His 340 345 350 Gln Pro Glu Lys Lys Thr His Ile Leu Glu Gln Ile Thr Glu Thr Val 355 360 365 Lys His Arg Asn His Leu Asp Gly Ser Val Glu Leu Ile Gly Val Leu 370 375 380 Leu Tyr Gly Pro Gly Lys Ser Ser Ser Val Leu His Ser Val Arg Ala 385 390 395 400 Pro Gly Leu Pro Leu Val Asp Asp Trp Thr Cys Leu Lys Ser Met Val 405 410 415 Arg Val Phe Glu Thr His Cys Gly Ser Leu Thr Gln Tyr Gly Met Lys 420 425 430 His Met Arg Ala Phe Gly Asn Val Cys Asn Ser Gly Val Ser Lys Ala 435 440 445 Ser Met Glu Glu Ala Cys Lys Ala Ala Cys Gly Gly Tyr Asp Ala Gly 450 455 460 Leu Leu Tyr Pro Ser Asn Thr Gly Tyr Ser Ala 465 470 475 <210> 86 <211> 491 <212> PRT <213> Helianthus annuus <400> 86 Met Val Ser Arg Ile Ile Cys Phe Thr Leu Val Leu Val Thr Val Val 1 5 10 15 Ala Leu Ser Tyr Gly Ala Ala Gly Arg Glu Ser Ser Gly Gly Gln Lys 20 25 30 Trp Arg Trp Gly Trp Asp Pro Leu Ile Arg Ser Pro Val Asp Ala Glu 35 40 45 Gln Glu Val Asp Glu Gln Met Thr Asn Gly Thr Lys Trp Ala Val Leu 50 55 60 Val Ala Gly Ser Lys Gly Tyr Gly Asn Tyr Arg His Gln Ala Asp Val 65 70 75 80 Cys His Ala Tyr Gln Val Leu Lys Lys Gly Gly Leu Lys Asp Glu Asn 85 90 95 Ile Val Val Phe Met Tyr Asp Asp Ile Ala Lys Ser Glu Met Asn Pro 100 105 110 Arg Pro Gly Ile Ile Ile Asn Ser Pro Lys Gly Glu Asp Val Tyr Ala 115 120 125 Gly Val Pro Lys Asp Tyr Thr Gly Lys Asn Val Thr Val Asp Asn Leu 130 135 140 Ser Ala Val Leu Leu Gly Asp Arg Ser Ala Val Lys Gly Gly Ser Gly 145 150 155 160 Lys Val Val Asp Ser Lys Pro Glu Asp Arg Ile Phe Leu Phe Tyr Ser 165 170 175 Asp His Gly Gly Pro Gly Val Leu Gly Met Pro Asn Glu Pro His Leu 180 185 190 Val Ala Lys Asp Leu Val Asp Val Leu Lys Lys Lys His Ala Met Gly 195 200 205 Thr Tyr Lys Glu Met Val Ile Tyr Leu Glu Ala Cys Glu Ser Gly Ser 210 215 220 Ile Phe Glu Gly Ile Leu Pro Glu Asp Leu Asn Ile Tyr Ala Thr Thr 225 230 235 240 Ala Ser Gly Ala Gln Glu Asn Ser Tyr Gly Thr Tyr Cys Pro Gly Thr 245 250 255 Glu Pro Ser Pro Pro Pro Glu Tyr Ile Thr Cys Leu Gly Asp Leu Tyr 260 265 270 Ser Val Ala Trp Met Glu Asp Ser Glu Thr His Asn Leu Lys Lys Glu 275 280 285 Ser Leu Glu Gln Gln Phe Asn Lys Val Lys Lys Arg Thr Ser Asn Ser 290 295 300 Asn Thr Tyr Asn Thr Gly Ser His Val Met Glu Tyr Gly Ser Lys Asp 305 310 315 320 Ile Lys Pro Glu Lys Val Tyr Leu Tyr Leu Gly Phe Asp Pro Ala Thr 325 330 335 Val Asn Leu Pro Ala Asn Gln Ile His Phe Asp Lys Leu Asp Gly Val 340 345 350 Asn Gln Arg Asp Ala Asp Leu Ile Phe Leu Trp Gln Arg Tyr Lys Lys 355 360 365 Ser Ser Glu Ser Thr Arg Pro Glu Ile Leu Arg Glu Ile Thr Glu Thr 370 375 380 Leu Thr His Arg Gly His Leu Asp Ser Ser Ile Asp Met Ile Gly Val 385 390 395 400 Leu Leu Phe Gly Pro Gln Asn Gly Arg Ser Thr Leu His Ser Ala Arg 405 410 415 Ala Pro Gly Leu Pro Leu Val Asp Asp Trp Glu Cys Phe Lys Ser Thr 420 425 430 Ala Arg Leu Phe Glu Lys His Cys Gly Leu Leu Thr Gln Tyr Gly Met 435 440 445 Lys His Met Arg Ala Phe Ala Asn Ile Cys Asn Ser Ser Val Glu Lys 450 455 460 Ser Lys Val Glu Glu Val Phe Ile Ala Thr Cys Gly Gly Lys Asn Ile 465 470 475 480 Gly Pro Tyr Gly Thr Phe Gly Ala Tyr Ser Val 485 490 <210> 87 <211> 494 <212> PRT <213> Arabidopsis thaliana <400> 87 Met Ala Thr Thr Met Thr Arg Val Ser Val Gly Val Val Leu Phe Val 1 5 10 15 Leu Leu Val Ser Leu Val Ala Val Ser Ala Ala Arg Ser Gly Pro Asp 20 25 30 Asp Val Ile Lys Leu Pro Ser Gln Ala Ser Arg Phe Phe Arg Pro Ala 35 40 45 Glu Asn Asp Asp Asp Ser Asn Ser Gly Thr Arg Trp Ala Val Leu Val 50 55 60 Ala Gly Ser Ser Gly Tyr Trp Asn Tyr Arg His Gln Ala Asp Ile Cys 65 70 75 80 His Ala Tyr Gln Leu Leu Arg Lys Gly Gly Leu Lys Glu Glu Asn Ile 85 90 95 Val Val Phe Met Tyr Asp Asp Ile Ala Asn Asn Tyr Glu Asn Pro Arg 100 105 110 Pro Gly Thr Ile Ile Asn Ser Pro His Gly Lys Asp Val Tyr Gln Gly 115 120 125 Val Pro Lys Asp Tyr Thr Gly Asp Asp Val Asn Val Asp Asn Leu Phe 130 135 140 Ala Val Ile Leu Gly Asp Lys Thr Ala Val Lys Gly Gly Ser Gly Lys 145 150 155 160 Val Val Asp Ser Gly Pro Asn Asp His Ile Phe Ile Phe Tyr Ser Asp 165 170 175 His Gly Gly Pro Gly Val Leu Gly Met Pro Thr Ser Pro Tyr Leu Tyr 180 185 190 Ala Asn Asp Leu Asn Asp Val Leu Lys Lys Lys His Ala Leu Gly Thr 195 200 205 Tyr Lys Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Ile 210 215 220 Phe Glu Gly Leu Leu Pro Glu Gly Leu Asn Ile Tyr Ala Thr Thr Ala 225 230 235 240 Ser Asn Ala Glu Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly Glu Glu 245 250 255 Pro Ser Pro Pro Pro Glu Tyr Glu Thr Cys Leu Gly Asp Leu Tyr Ser 260 265 270 Val Ala Trp Met Glu Asp Ser Gly Met His Asn Leu Gln Thr Glu Thr 275 280 285 Leu His Gln Gln Tyr Glu Leu Val Lys Arg Arg Thr Ala Pro Val Gly 290 295 300 Tyr Ser Tyr Gly Ser His Val Met Gln Tyr Gly Asp Val Gly Ile Ser 305 310 315 320 Lys Asp Asn Leu Asp Leu Tyr Met Gly Thr Asn Pro Ala Asn Asp Asn 325 330 335 Phe Thr Phe Ala Asp Ala Asn Ser Leu Lys Pro Pro Ser Arg Val Thr 340 345 350 Asn Gln Arg Asp Ala Asp Leu Val His Phe Trp Glu Lys Tyr Arg Lys 355 360 365 Ala Pro Glu Gly Ser Ala Arg Lys Thr Glu Ala Gln Lys Gln Val Leu 370 375 380 Glu Ala Met Ser His Arg Leu His Ile Asp Asn Ser Val Ile Leu Val 385 390 395 400 Gly Lys Ile Leu Phe Gly Ile Ser Arg Gly Pro Glu Val Leu Asn Lys 405 410 415 Val Arg Ser Ala Gly Gln Pro Leu Val Asp Asp Trp Asn Cys Leu Lys 420 425 430 Asn Gln Val Arg Ala Phe Glu Arg His Cys Gly Ser Leu Ser Gln Tyr 435 440 445 Gly Ile Lys His Met Arg Ser Phe Ala Asn Ile Cys Asn Ala Gly Ile 450 455 460 Gln Met Glu Gln Met Glu Glu Ala Ala Ser Gln Ala Cys Thr Thr Leu 465 470 475 480 Pro Thr Gly Pro Trp Ser Ser Leu Asn Arg Gly Phe Ser Ala 485 490 <210> 88 <211> 482 <212> PRT <213> Clitoria ternatea <400> 88 Met Lys Asn Pro Leu Ala Ile Leu Phe Leu Ile Ala Thr Val Val Ala 1 5 10 15 Val Val Ser Gly Ile Arg Asp Asp Phe Leu Arg Leu Pro Ser Gln Ala 20 25 30 Ser Lys Phe Phe Gln Ala Asp Asp Asn Val Glu Gly Thr Arg Trp Ala 35 40 45 Val Leu Val Ala Gly Ser Lys Gly Tyr Val Asn Tyr Arg His Gln Ala 50 55 60 Asp Val Cys His Ala Tyr Gln Ile Leu Lys Lys Gly Gly Leu Lys Asp 65 70 75 80 Glu Asn Ile Ile Val Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser 85 90 95 Asn Pro His Pro Gly Val Ile Ile Asn His Pro Tyr Gly Ser Asp Val 100 105 110 Tyr Lys Gly Val Pro Lys Asp Tyr Val Gly Glu Asp Ile Asn Pro Pro 115 120 125 Asn Phe Tyr Ala Val Leu Leu Ala Asn Lys Ser Ala Leu Thr Gly Thr 130 135 140 Gly Ser Gly Lys Val Leu Asp Ser Gly Pro Asn Asp His Val Phe Ile 145 150 155 160 Tyr Tyr Thr Asp His Gly Gly Ala Gly Val Leu Gly Met Pro Ser Lys 165 170 175 Pro Tyr Ile Ala Ala Ser Asp Leu Asn Asp Val Leu Lys Lys Lys His 180 185 190 Ala Ser Gly Thr Tyr Lys Ser Ile Val Phe Tyr Val Glu Ser Cys Glu 195 200 205 Ser Gly Ser Met Phe Asp Gly Leu Leu Pro Glu Asp His Asn Ile Tyr 210 215 220 Val Met Gly Ala Ser Asp Thr Gly Glu Ser Ser Trp Val Thr Tyr Cys 225 230 235 240 Pro Leu Gln His Pro Ser Pro Pro Pro Glu Tyr Asp Val Cys Val Gly 245 250 255 Asp Leu Phe Ser Val Ala Trp Leu Glu Asp Cys Asp Val His Asn Leu 260 265 270 Gln Thr Glu Thr Phe Gln Gln Gln Tyr Glu Val Val Lys Asn Lys Thr 275 280 285 Ile Val Ala Leu Ile Glu Asp Gly Thr His Val Val Gln Tyr Gly Asp 290 295 300 Val Gly Leu Ser Lys Gln Thr Leu Phe Val Tyr Met Gly Thr Asp Pro 305 310 315 320 Ala Asn Asp Asn Asn Thr Phe Thr Asp Lys Asn Ser Leu Gly Thr Pro 325 330 335 Arg Lys Ala Val Ser Gln Arg Asp Ala Asp Leu Ile His Tyr Trp Glu 340 345 350 Lys Tyr Arg Arg Ala Pro Glu Gly Ser Ser Arg Lys Ala Glu Ala Lys 355 360 365 Lys Gln Leu Arg Glu Val Met Ala His Arg Met His Ile Asp Asn Ser 370 375 380 Val Lys His Ile Gly Lys Leu Leu Phe Gly Ile Glu Lys Gly His Lys 385 390 395 400 Met Leu Asn Asn Val Arg Pro Ala Gly Leu Pro Val Val Asp Asp Trp 405 410 415 Asp Cys Phe Lys Thr Leu Ile Arg Thr Phe Glu Thr His Cys Gly Ser 420 425 430 Leu Ser Glu Tyr Gly Met Lys His Met Arg Ser Phe Ala Asn Leu Cys 435 440 445 Asn Ala Gly Ile Arg Lys Glu Gln Met Ala Glu Ala Ser Ala Gln Ala 450 455 460 Cys Val Ser Ile Pro Asp Asn Pro Trp Ser Ser Leu His Ala Gly Phe 465 470 475 480 Ser Val

Claims (35)

  1. (v) 서열번호 1에 제시된 바와 같은 아미노산 서열(VyPAL2);
    (vi) 전체 길이에 걸쳐 서열번호 1에 제시된 아미노산 서열과 적어도 60, 바람직하게는 적어도 70, 보다 바람직하게는 적어도 80, 가장 바람직하게는 적어도 90% 서열 일치성을 공유하는 아미노산 서열;
    (vii) 전체 길이에 걸쳐 서열번호 1에 제시된 아미노산 서열과 적어도 80, 바람직하게는 적어도 90, 보다 바람직하게는 적어도 95% 서열 상동성을 공유하는 아미노산 서열; 또는
    (viii) (i) 내지 (iii) 중 어느 하나의 단편
    을 포함하거나 또는 이들로 이루어지는 단백질 리가제, 바람직하게는 사이클라제 활성을 갖는 단리된 폴리펩티드.
  2. 제1항에 있어서,
    (i) 서열번호 2(VyPAL2 + N-말단 + 캡 나머지) 또는 서열번호 3(VyPAL2 프로효소)에 제시된 아미노산 서열;
    (ii) 전체 길이에 걸쳐 서열번호 2 또는 3에 제시된 아미노산 서열과 적어도 60, 바람직하게는 적어도 70, 보다 바람직하게는 적어도 80, 가장 바람직하게는 적어도 90% 서열 일치성을 공유하는 아미노산 서열;
    (iii) 전체 길이에 걸쳐 서열번호 2 또는 3에 제시된 아미노산 서열과 적어도 80, 바람직하게는 적어도 90, 보다 바람직하게는 적어도 95% 서열 상동성을 공유하는 아미노산 서열; 또는
    (iv) (i) 내지 (iii) 중 어느 하나의 단편
    을 포함하거나 또는 이들로 이루어지는 단리된 폴리펩티드.
  3. 제1항 또는 제2항에 있어서,
    (i) 서열번호 1의 19번 위치에 상응하는 위치에 아미노산 잔기 N; 및/또는
    (ii) 서열번호 1의 124번 위치에 상응하는 위치에 아미노산 잔기 H; 및/또는
    (iii) 서열번호 1의 166번 위치에 상응하는 위치에 아미노산 잔기 C
    를 포함하는 단리된 폴리펩티드.
  4. 제1항 또는 제2항에 있어서,
    (i) 서열번호 1의 126번 위치에 상응하는 위치에 아미노산 잔기 A, 및 임의로 127번 위치에 상응하는 위치에 아미노산 A 또는 P, 바람직하게는 P(LAD2); 및/또는
    (ii) 서열번호 1의 126번 위치에 상응하는 위치에 아미노산 잔기 G, 및 127번 위치에 상응하는 위치에 아미노산 A(LAD2);
    (iii) 서열번호 1의 195번 위치에 상응하는 위치에 아미노산 잔기 W 또는 Y, 196번 위치에 상응하는 위치에 아미노산 잔기 I 또는 V, 및 197번 위치에 상응하는 위치에 아미노산 잔기 T, A 또는 V(LAD1);
    (iv) 서열번호 1의 21번 위치에 상응하는 위치에 아미노산 잔기 R, 22번 위치에 상응하는 위치에 H, 123번 위치에 상응하는 위치에 D, 164번 위치에 상응하는 위치에 E, 194번 위치에 상응하는 위치에 S, 215번 위치에 상응하는 위치에 D(S1 포켓); 및/또는
    (v) 서열번호 1의 199 및 212번 위치에 상응하는 위치에 아미노산 잔기 C(디설파이드 가교)
    를 포함하는 단리된 폴리펩티드.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    5.0 이하, 바람직하게는 4.0 이하의 pH에서 산 처리에 의해 활성화될 수 있는 단리된 폴리펩티드.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    (i) 바람직하게는 5.5 이상의 pH에서 60% 이상, 바람직하게는 80% 이상의 효율로 주어진 펩티드를 고리화할 수 있고; 및/또는
    (ii) 바람직하게는 5.5 이상의 pH에서 20% 이하, 바람직하게는 5% 이하의 효율로 주어진 펩티드를 가수분해할 수 있는
    단리된 폴리펩티드.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    글리코실화되는 단리된 폴리펩티드.
  8. 제1항 내지 제6항 중 어느 한 항에 따른 폴리펩티드를 암호화하는 핵산 분자.
  9. 제8항에 있어서,
    벡터 중에 포함되는 핵산 분자.
  10. 제9항에 있어서,
    벡터가 핵산 분자의 발현을 조절하기 위한 조절 요소를 또한 포함하는 핵산 분자.
  11. 제8항 내지 제10항 중 어느 한 항의 핵산 분자를 포함하는 숙주 세포로, 바람직하게는 곤충 세포, 보다 바람직하게는 Sf9 세포인 숙주 세포.
  12. 폴리펩티드의 발현을 허용하는 조건하에서 제11항에 따른 숙주 세포를 배양하고, 상기 숙주 세포 또는 배양 배지로부터 상기 폴리펩티드를 단리함을 포함하는, 제1항 내지 제6항 중 어느 한 항의 폴리펩티드의 생성 방법.
  13. 적어도 2개의 펩티드를 결찰하거나 또는 펩티드를 고리화하기 위한 리가제 또는 사이클라제 활성을 갖는 폴리펩티드의 용도로, 상기 사이클라제 활성을 갖는 폴리펩티드가 제1항 내지 제6항 중 어느 한 항의 단리된 폴리펩티드인 용도.
  14. 제13항에 있어서,
    고리화되는 펩티드 또는 결찰되는 펩티드 중 적어도 하나가
    (i) 바람직하게는 C-말단의, 아미노산 서열 (X)oN/D(X)p(여기에서 X는 임의의 아미노산이고, o 및 p는 서로 독립적으로 적어도 2의 정수이다), 바람직하게는 아미노산 서열 (X)0NX3X4(X)r(여기에서 X3은 P를 제외한 임의의 아미노산, 바람직하게는 H, G 또는 S이고, X4 는 소수성 또는 방향족 아미노산이고, 바람직하게는 L, I, V, F, C, W, Y 및 M 중에서 선택되고, r은 0 또는 1 이상의 정수이다); 또는
    (ii) C-말단 아미노산 서열 (X)oN*/D*(여기에서 X는 임의의 아미노산이고, o는 적어도 2의 정수이며, C-말단 N/D 잔기는 C-말단 카복시 기, 바람직하게는 D의 경우에 α-카복시 기가 화학식 -C(O)-N(R')2의 아미드 기에 의해 교체된다는 점에서 아미드화되고, 이때 R'는 임의의 잔기이다)
    를 포함하는 용도.
  15. 제13항 또는 제14항에 있어서,
    고리화되는 펩티드 또는 결찰되는 펩티드 중 적어도 하나가 N-말단 아미노산 서열 X1X2(X)q을 포함하고, 여기에서 X가 임의의 아미노산일 수 있고; X1이 P를 제외한 임의의 아미노산일 수 있으며; X2가 임의의 아미노산일 수는 있으나, 바람직하게는 소수성 아미노산, 보다 바람직하게는 V, I 또는 L이고; q가 0 또는 1 이상의 정수인 용도.
  16. 제13항 내지 제15항 중 어느 한 항에 있어서,
    고리화되는 펩티드가 고리형 시스틴 매듭 폴리펩티드, 고리형 펩티드 독소, 고리형 항균 펩티드, 고리형 히스타틴, 또는 인간 또는 동물 고리형 펩티드 호르몬의 선형 전구체 형태인 용도.
  17. 제13항 내지 제16항 중 어느 한 항에 있어서,
    (i) 고리화되는 펩티드가 10 이상 아미노산의 길이이거나; 또는
    (ii) 결찰되는 펩티드 중 적어도 하나가 25 이상, 바람직하게는 50 이상 아미노산의 길이인 용도.
  18. 제13항 내지 제17항 중 어느 한 항에 있어서,
    고리화되는 펩티드가
    (i) 서열번호 19 및 21-42 중 어느 하나에 제시된 아미노산; 또는
    (ii) 아미노산 서열 (X)nC(X)nC(X)nC(X)nC(X)nC(X)nC(X)nNHV(X)n(여기에서 각각의 n은 1 내지 6 중에서 독립적으로 선택된 정수이고 X는 임의의 아미노산일 수 있다)
    을 포함하거나 또는 이들로 이루어지는 용도.
  19. 제13항 내지 제15항 중 어느 한 항에 있어서,
    결찰되는 펩티드 중 적어도 하나가 검출가능한 마커, 바람직하게는 형광 마커 또는 비오틴을 포함하는 용도.
  20. 펩티드의 고리화 방법으로, 상기 펩티드를 상기 펩티드의 고리화를 허용하는 조건하에서 제1항 내지 제6항 중 어느 한 항의 단리된 폴리펩티드와 배양함을 포함하는 방법.
  21. 적어도 2개의 펩티드를 결찰하는 방법으로, 상기 적어도 2개의 펩티드를 상기 펩티드의 결찰을 허용하는 조건하에서 제1항 내지 제6항 중 어느 한 항의 단리된 폴리펩티드와 배양함을 포함하는 방법.
  22. 제20항 또는 제21항에 있어서,
    고리화되는 펩티드 또는 결찰되는 적어도 하나의 펩티드가
    (i) 바람직하게는 C-말단의, 아미노산 서열 (X)oN/D(X)p(여기에서 X는 임의의 아미노산이고, o 및 p는 서로 독립적으로 적어도 2의 정수이다), 바람직하게는 아미노산 서열 (X)0NX3X4(X)r(여기에서 X3은 P를 제외한 임의의 아미노산, 바람직하게는 H, G 또는 S이고, X4 는 소수성 또는 방향족 아미노산이고, 바람직하게는 L, I, V, F, C, W, Y 및 M 중에서 선택되고, r은 0 또는 1 이상의 정수이다); 또는
    (ii) C-말단 아미노산 서열 (X)oN*/D*(여기에서 X는 임의의 아미노산이고, o는 적어도 2의 정수이며, C-말단 N/D 잔기는 C-말단 카복시 기, 바람직하게는 D의 경우에 α-카복시 기가 화학식 -C(O)-N(R')2의 아미드 기에 의해 교체된다는 점에서 아미드화되고, 이때 R'는 임의의 잔기이다)
    를 포함하는 방법.
  23. 제22항에 있어서,
    고리화되는 펩티드 또는 결찰되는 적어도 하나의 펩티드가 아미노산 서열 N/D(X)p, 바람직하게는 아미노산 서열 (X)0NX3X4(X)r(여기에서 X3은 P를 제외한 임의의 아미노산, 바람직하게는 H, G 또는 S이고, X4 는 소수성 또는 방향족 아미노산이고, 바람직하게는 L, I, V, F, C, W, Y 및 M 중에서 선택되고, r은 0 또는 1 이상의 정수이다)에 N-말단 융합된 관심 펩티드의 융합 펩티드인 방법.
  24. 제20항 내지 제23항 중 어느 한 항에 있어서,
    고리화되는 펩티드 또는 결찰되는 적어도 하나의 펩티드가 N-말단 아미노산 서열 X1X2(X)q을 포함하며, 여기에서 X가 임의의 아미노산일 수 있고; X1이 P를 제외한 임의의 아미노산일 수 있으며; X2가 임의의 아미노산일 수는 있으나, 바람직하게는 소수성 아미노산, 보다 바람직하게는 V, I 또는 L이고; q는 0 또는 1 이상의 정수인 방법.
  25. 제13항 내지 제24항 중 어느 한 항에 있어서,
    리가제 또는 사이클라제 활성을 갖는 폴리펩티드가 고체 지지체상에 고정화되는 용도 또는 방법.
  26. 제25항에 있어서,
    고정화가 고체 지지체에의 비-공유 또는 공유 결합에 의한 것인 용도 또는 방법.
  27. 제26항에 있어서,
    (i) 리가제 또는 사이클라제 활성을 갖는 폴리펩티드가 글리코실화되고, 고정화가 고체 지지체에 공유 결합된 탄수화물-결합 부분, 바람직하게는 콘카발린 A 부분 또는 그의 변체와의 상호작용에 의해 촉진되거나;
    (ii) 리가제 또는 사이클라제 활성을 갖는 폴리펩티드가 비오틴화되고, 고정화가 고체 지지체에 공유 결합된 비오틴-결합 부분, 바람직하게는 스트렙트아비딘, 아비딘 또는 뉴트라비딘 부분 또는 그의 변체와의 상호작용에 의해 촉진되거나; 또는
    (iii) 리가제 또는 사이클라제 활성을 갖는 폴리펩티드가 고체 지지체 표면상의 N-하이드록시숙신이미드 작용기와의 반응에 의해 상기 고체 지지체상에 고정화되는
    용도 또는 방법.
  28. 제1항 내지 제6항 중 어느 한 항에 따른 단리된 폴리펩티드가 표면상에 고정화된 고체 지지체 물질.
  29. 제28항에 있어서,
    바람직하게는 미립자 형태의, 중합체 수지, 예를 들어 아가로스를 포함하는 고체 지지체 물질.
  30. 제28항 또는 제29항에 있어서,
    단리된 폴리펩티드가 공유 또는 비-공유 상호작용에 의해 고체 지지체 물질상에 고정화된 고체 지지체 물질.
  31. 제28항 내지 제30항 중 어느 한 항에 있어서,
    크로마토그래피 컬럼용 미립자 수지 물질인 고체 지지체 물질.
  32. 제28항 내지 제31항 중 어느 한 항에 있어서,
    (i) 리가제 또는 사이클라제 활성을 갖는 폴리펩티드가 글리코실화되고, 고정화가 고체 지지체에 공유 결합된 탄수화물-결합 부분, 바람직하게는 콘카나발린 A 부분 또는 그의 변체와의 상호작용에 의해 촉진되거나;
    (ii) 리가제 또는 사이클라제 활성을 갖는 폴리펩티드가 비오틴화되고, 고정화가 고체 지지체에 공유 결합된 비오틴-결합 부분, 바람직하게는 스트렙트아비딘, 아비딘 또는 뉴트라비딘 부분 또는 그의 변체와의 상호작용에 의해 촉진되거나; 또는
    (iii) 리가제 또는 사이클라제 활성을 갖는 폴리펩티드가 고체 지지체 표면상의 N-하이드록시숙신이미드 작용기와의 반응에 의해 상기 고체 지지체상에 고정화되는
    고체 지지체 물질.
  33. 아스파라지닐 엔도펩티다제(AEP) 활성을 갖는 폴리펩티드의 단백질 리가제 활성을 증가시키는 방법으로, 서열번호 1의 126번 위치에 상응하는 위치의 아미노산 잔기를 작은 소수성 잔기 또는 G 잔기, 바람직하게는 A 또는 G 잔기로 치환시키는 단계를 포함하는 방법.
  34. 단백질 리가제 활성을 갖는 폴리펩티드의 생성 방법으로,
    (i) 아스파라지닐 엔도펩티다제(AEP) 활성을 갖는 폴리펩티드를 제공하고;
    (ii) 상기 아스파라지닐 엔도펩티다제(AEP) 활성을 갖는 폴리펩티드에 하나 이상의 아미노산 치환을 도입시키고; 여기에서 상기 치환이 서열번호 1의 126번 위치에 상응하는 위치의 아미노산 잔기를 A 또는 G 잔기로 치환시키고, 임의로 서열번호 1의 127번 위치에 상응하는 위치의 아미노산 잔기를, 서열번호 1의 126/127번 위치에 상응하는 위치의 아미노산 서열이 GA, AA 또는 AP, 바람직하게는 GA 또는 AP이도록 P 또는 A 잔기로 치환시킴
    을 포함하는 방법.
  35. 제33항 또는 제34항에 있어서,
    아스파라지닐 엔도펩티다제 활성을 갖는 폴리펩티드가
    (i) 전체 길이에 걸쳐 서열번호 10-14 중 어느 하나에 제시된 아미노산 서열(VyAEP1-4; VcAEP)과 적어도 60, 바람직하게는 적어도 70, 보다 바람직하게는 적어도 80, 가장 바람직하게는 적어도 90% 서열 상동성 또는 서열 일치성을 공유하는 아미노산 서열; 및/또는
    (ii) 서열번호 1의 126번 위치에 상응하는 위치에 G도 아니고 A도 아닌 아미노산 잔기
    를 포함하는 방법.
KR1020217039897A 2019-05-07 2020-05-06 에이에스엑스 특이성 단백질 리가제 및 그의 용도 KR20220005566A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
SG10201904085W 2019-05-07
SG10201904085W 2019-05-07
SG10201910861S 2019-11-19
SG10201910861S 2019-11-19
PCT/SG2020/050267 WO2020226572A1 (en) 2019-05-07 2020-05-06 Asx-specific protein ligases and uses thereof

Publications (1)

Publication Number Publication Date
KR20220005566A true KR20220005566A (ko) 2022-01-13

Family

ID=73051360

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217039897A KR20220005566A (ko) 2019-05-07 2020-05-06 에이에스엑스 특이성 단백질 리가제 및 그의 용도

Country Status (7)

Country Link
US (1) US20220213461A1 (ko)
EP (1) EP3966321A4 (ko)
JP (1) JP2022533545A (ko)
KR (1) KR20220005566A (ko)
CN (1) CN113811606A (ko)
SG (1) SG11202111462VA (ko)
WO (1) WO2020226572A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116888272A (zh) * 2021-02-10 2023-10-13 南洋理工大学 多肽串联连接和环化的方法
WO2023191726A1 (en) * 2022-03-31 2023-10-05 Nanyang Technological University Improving the efficiency of pal-catalyzed protein ligation by a cascade enzymatic scheme

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1002113B1 (en) * 1997-06-12 2009-03-11 E.I. Du Pont De Nemours And Company Plant amino acid biosynthetic enzymes
CA2680273C (en) * 2007-03-09 2017-02-28 Novozymes A/S Thermostable asparaginases
EP3134427B1 (en) * 2014-04-24 2020-06-03 Nanyang Technological University Asx-specific protein ligase
WO2017049362A1 (en) * 2015-09-25 2017-03-30 Hexima Limited Generation of peptides

Also Published As

Publication number Publication date
CN113811606A (zh) 2021-12-17
EP3966321A4 (en) 2023-09-06
SG11202111462VA (en) 2021-11-29
WO2020226572A1 (en) 2020-11-12
EP3966321A1 (en) 2022-03-16
US20220213461A1 (en) 2022-07-07
JP2022533545A (ja) 2022-07-25

Similar Documents

Publication Publication Date Title
US11124788B2 (en) Asx-specific protein ligase
EP3046932B1 (en) Evolved sortases and uses thereof
AU2020242724B2 (en) Aminoacyl-tRNA synthetase for efficiently introducing lysine derivative in protein
CN110408636B (zh) 多重标签串联的dna序列及其在蛋白质表达纯化系统的应用
Tam et al. Peptide asparaginyl ligases—renegade peptide bond makers
KR20220005566A (ko) 에이에스엑스 특이성 단백질 리가제 및 그의 용도
Dahl et al. Carica papaya glutamine cyclotransferase belongs to a novel plant enzyme subfamily: cloning and characterization of the recombinant enzyme
US20160304571A1 (en) Synthesis of Site Specifically-Linked Ubiquitin
CN113667685B (zh) 信号肽相关序列及其在蛋白质合成中的应用
US7238513B2 (en) Nucleic acid sequences encoding Conus protein disulfide isomerase
Greimann et al. Reconstitution of RNA exosomes from human and Saccharomyces cerevisiae: cloning, expression, purification, and activity assays
CN111989401A (zh) 猪胰蛋白酶变体
AU2016327453A1 (en) Generation of peptides
WO2023204770A2 (en) Truncated polypeptides having protein ligase activity and methods of production thereof
JP2004509973A (ja) ペプチドおよびタンパク質の選択的修飾方法
KR20220061126A (ko) 카스파제-2 변이체