KR20230159855A - 다가 단백질 및 스크리닝 방법 - Google Patents

다가 단백질 및 스크리닝 방법 Download PDF

Info

Publication number
KR20230159855A
KR20230159855A KR1020237035825A KR20237035825A KR20230159855A KR 20230159855 A KR20230159855 A KR 20230159855A KR 1020237035825 A KR1020237035825 A KR 1020237035825A KR 20237035825 A KR20237035825 A KR 20237035825A KR 20230159855 A KR20230159855 A KR 20230159855A
Authority
KR
South Korea
Prior art keywords
protein
seq
domain
binding site
binding
Prior art date
Application number
KR1020237035825A
Other languages
English (en)
Inventor
아르네 하겐 아우구스트 쇼이
아누아르 이르시아드 누르 아바디 빈 카이릴
잉 팅 쉐릴 림
Original Assignee
릴리움엑스 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 릴리움엑스 리미티드 filed Critical 릴리움엑스 리미티드
Publication of KR20230159855A publication Critical patent/KR20230159855A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/78Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/315Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Streptococcus (G), e.g. Enterococci
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6845Methods of identifying protein-protein interactions in protein mixtures
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Hematology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Genetics & Genomics (AREA)
  • Urology & Nephrology (AREA)
  • Toxicology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Pathology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

본원은 치료제로서 유용하고, 신규의 치료 화합물을 식별하는데 유용한 다가 단백질 스캐폴드를 제공한다. 본 발명은 또한 다중 결합 도메인 및 구조 도메인을 갖는 다중-도메인 폴리펩타이드 구성체에 관한 것이다. 또한, 본원은 신규의 후보 치료제를 식별하기 위해 상기 제공된 다가 단백질 스캐폴드를 사용하는 방법, 및 이에 의해 식별된 신규의 치료제를 제공한다.

Description

다가 단백질 및 스크리닝 방법
본 발명은, 다가 단백질 스캐폴드, 및 표적 분자 조합의 표현형 스크리닝을 위한 모듈 시스템으로서 및 치료제로서의 이의 용도에 관한 것이다. 본 발명은 또한 다중 결합 도메인 및 구조 도메인을 포함하는 다중-도메인 폴리펩타이드 구성체(construct)에 관한 것이다. 본 발명은 또한, 기재된 단백질 스캐폴드를 사용하여 신규의 치료제를 식별하는 방법 및 이러한 방식으로 식별될 수 있는 치료제에 관한 것이다.
많은 병리학적 상태에 대한 신규 치료법을 식별하려는 지속적인 요구가 존재한다.
단백질-기반 치료법은 많은 일반적인 질병을 해결하는 데 매력적인 접근 방식을 제공하였다. 이러한 치료제는 높은 임상 성공률을 보이는 것으로 입증되었으며 많은 단백질 치료제가 전 세계적으로 임상 사용을 위해 규제 기관의 승인을 받았다.
단백질-기반 치료제는 다양한 방식: 예를 들어, 결핍되거나 비정상적인 단백질을 대체하거나; 기존 경로를 보강함으로써; 치료적 유용성을 갖는 새로운 기능이나 활동을 제공함으로써; 분자나 유기체를 방해함으로써; 및 방사성 핵종, 세포 독성 약물 또는 효과기(effector) 단백질과 같은 다른 화합물이나 단백질을 전달함으로써 작용할 수 있다. 치료 단백질은 물리적 및 구조적 특성을 기준으로 분류될 수 있으며, 예를 들어 항체-기반 약물, Fc 융합 단백질, 항응고제, 혈액 인자, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 효소, 성장 인자, 호르몬, 인터페론, 인터류킨, 혈전용해제 등으로 나뉠 수 있다. 치료 단백질은 분자 활성 기전에 따라 분류될 수도 있다. 예를 들어, 단클론 항체는 일반적으로 표적에 비-공유결합적으로 결합함으로써 작용한다. 효소는 표적의 공유 결합에 영향을 미칠 수 있다. 다른 단백질(예를 들어, 혈청 알부민)은 특별한 상호작용 없이 활성을 발휘할 수 있다.
임상적 성공을 거둔 단백질-기반 치료제의 한 종류는 치료용 항체이다. 면역글로불린(Ig)으로 공지된 항체는 다양한 질병 상태에 대한 잠재적인 치료로서 평가되었다. 예를 들어, 류마티스 관절염, 다발성 경화증, 건선 및 다양한 형태의 암을 포함한 질병을 치료하기 위해 단클론 항체 요법이 사용되었다. 시판되는 항체 치료제에는 무로모맙, 아브식시맙, 리툭시맙, 다클리주맙, 바실릭시맙, 팔리비주맙, 인플릭시맙, 트라스투주맙, 에타네르셉트, 젬투주맙, 알렘투주맙, 이브리토모맙, 아달리무맙, 알레파셉트, 오말리주맙, 토시투모맙, 에팔리주맙, 세툭시맙, 베바시주맙, 나탈리주맙, 라니비주맙, 파니투무맙, 에쿨리주맙, 및 세르톨리주맙이 포함된다.
항체는 전형적으로 Fc 영역과 2개의 항원-결합(Fab) 영역을 형성하는 4개의 폴리펩타이드 쇄를 포함한다. 각 Fab 영역에는 파라토프를 형성하고 항원과 접촉하는 가변 영역(Fv)이 포함되어 있다. 자연 발생 항체는 전형적으로 가변 영역에서 대칭 결합을 나타낸다. 그러나 이러한 제한은 전형적으로 단일 수용체 유형(또는 다른 표적)만이 가변 영역에서 주어진 항체에 의해 표적화될 수 있음을 의미한다.
이를 해결하기 위해서 최근 이중특이성 항체에 많은 관심이 쏠리고 있다. 이중특이성 항체는 두 Fab 부위 각각이 2개의 서로 다른 항원에 결합한다는 점에서 기존의 단일특이성 항체와 다르다. 이중특이성 항체는 종종 Ig-유사 항체 또는 비-Ig-유사 항체로 분류되며, 후자는 화학적으로 연결된 Fab 영역으로 이루어질 수 있다.
이중특이성 항체는 임상적 활용을 위해 활발히 연구가 진행되고 있다. 시판되는 이중특이성 항체의 2가지 예로, 상표명 Blincyto로 판매되고 T 세포 표적화를 위한 CD3 부위와 B 세포 표적화를 위한 CD19 부위를 모두 포함하며 필라델피아 염색체 음성 재발성 또는 불응성 급성 림프구성 백혈병 치료에 유용한 블리나투모맙(Blinatumomab); 및 응고 인자 IXa와 X를 모두 표적화하고 혈우병 A의 치료에 사용되는 에미시주맙(Emicizumab)(상표명 Hemlibra로 판매됨)이 있다. 이중특이성 항체는 통상적으로, 예를 들어 동시에 종양 세포 수용체에 결합하고 세포 독성 면역 세포를 모집함으로써 여러 세포 유형에 동시에 결합하는데 사용된다.
일부 이중특이성 항체가 제공하는 가능성에도 불구하고 문제는 여전히 남아 있다. 항체 치료제는 특히 그 크기와 복잡한 글리코실화 패턴을 포함한 복잡한 번역 후 변형 화학으로 인해 높은 생산 비용과 연관된다. 항체 생산은 매우 큰 규모의 포유동물 세포 배양에 이은 광범위한 정제 단계의 사용을 필요로 하며, 이는 대단히 높은 생산 비용과 이들 약물의 광범위한 사용의 제한으로 이어진다. 항체는 또한 불량한 종양 표적화와 연관되어 암 치료에서의 사용이 제한된다(예를 들어 연구에 따르면 쥐 이종이식 모델에서 투여된 항체의 20% 미만이 전형적으로 종양과 상호작용하는 것으로 나타났다). 항체의 Fc 부분, 예를 들어 IgG 항체는 여러 세포 유형의 표면에 발현된 다양한 수용체와 상호작용할 수 있으며, 이는 순환계에서 수용체의 유지를 증가시킨다. 이들의 큰 크기는 또한 생체 내 느린 확산으로 이어질 수 있다. IgG-유사 항체는 면역원성이 있어서 Fc 수용체 활성화를 통해 해로운 하류 면역 반응을 일으킬 수 있다. 특히 이중특이성 항체와 관련하여 이전에 설명한 "구멍에 손잡이"의 Ig-유사 접근 방식은 모듈성이 부족하기 때문에 복수의 항원-결합 도메인을 스크리닝하는데 쉽게 적용할 수 없다. 더욱이, 이중특이성 항체 접근방식은 실제로 Fv/Fab 영역의 스크리닝으로 제한되며, 따라서 다른 비-면역글로불린 단백질 도메인의 치료 가능성을 조사하는데 사용되지 않는다. 비-Ig-유사 탠덤 융합 접근 방식은 적응력이 더 뛰어나지만 쉽게 확장될 수 없다.
문헌[Blanco-Toribio et al., MAbs. 2013 Jan 1; 5(1): 70-79]은 단일특이성 및 이중특이성 6가 삼량체의 생성 및 특성화를 기재한다. "삼량체"라고 불리는 이 분자는 삼량체화 스캐폴드로서 2개의 유연한 링커가 측면에 있는 인간 콜라겐 XVIII 비-콜라겐성 1(NC1) 도메인의 N-말단 삼량체화 영역의 변형된 버전을 사용한다. 삼량체화 스캐폴드 도메인의 N-말단과 C-말단 모두에 대해 동일하거나 상이한 특이성을 갖는 단쇄 가변 단편(scFv)을 융합시킴으로써, 저자는 형질감염된 포유동물 세포에 의해 가용성 단백질로 효율적으로 분비되는 단일특이성 또는 이중특이성 6가 분자를 생성시켰다. 이중특이성 항-라미닌 x 항-CD3 N-/C-삼량체가 용액 중에서 삼량체인 것으로 밝혀졌다. 이 방법의 한 가지 단점은 필요한 형질감염 사용이 항상 편리한 생산 방법은 아니라는 것이다.
WO-A-2020/0188346은 2개의 항원-결합 도메인("ABD")이 항원-결합 단백질과 이소펩타이드 연결을 형성하는 2개 이상의 도메인으로 형성된 융합 단백질에 공유 결합되는 이중특이적 항원-결합 단백질을 기재하고 있다. 이소펩타이드 연결 형성 도메인은 일반적으로 Spycatcher("SC")와 같은 캐처(catcher) 도메인이고, 생성된 이중특이적 단백질은 ABD-SC-SC-ABD 포맷이다.
문헌[Brune et al 2017, Bioconjugate Chem. 2017, 28, 5, 1544-1551]은 쌍둥이 항원 면역화를 위해 직교 반응성 단백질을 사용하는 플러그-앤-디스플레이 합성 조립체를 기재한다. 저자는 다량체화 이중나선 IMX313과 2개의 직교 반응성 분할 단백질을 조작하여 이중으로 주소지정 가능한 합성 나노입자를 제조하였다. 구성체는 SpyCatcher-IMX-SnoopCatcher 포맷이며 모듈식 플랫폼을 제공하므로, SpyTag-항원과 SnoopTag-항원은 혼합 시 간단히 입자의 대향면에서 다량체화될 수 있다.
따라서, 이러한 문제의 일부 또는 전부를 극복하는 신규의 단백질 치료제의 신속하고 확장 가능하며 적응 가능한 식별 및 설계를 가능하게 하는 새로운 패러다임이 필요하다. 특히 기존 항체 플랫폼과 경쟁할 수 있는 신규의 플랫폼 기법이 필요하다.
본 발명자들은 전술한 문제를 인식하였다. 본 발명에 이르러, 비-항체 조립체 플랫폼을 사용하여 신규 요법의 스크리닝, 식별 및 개발을 위한 맞춤형의 재현가능한 확장성 및 적응성 스캐폴드를 제공할 수 있다는 것이 인식되었다. 본원에 기재된 접근방식은 복수의 상이한 단백질의 기하학적 구조, 결합가 및/또는 기능성을 잠재적인 치료 이익에 대해 평가할 수 있게 한다.
본 발명자들의 접근방식 중 일부는 유리한 특성을 갖는 단백질 구성체를 개발하는 것이었다. 이들 구성체는 융합 단백질로서의 발현에 의해 재조합적으로 제조될 수 있거나, 성분 도메인을 화학적 접합과 같은 당업계에 공지된 다른 수단에 의해 결합시킬 수 있다. 특히, 본 발명자들은, 폴리펩타이드가 2개의 변형된 말단을 갖는 폴리펩타이드를 제공하기 위해 N 및 C 말단 모두에서 유리하게 변형될 수 있음을 확인하였다. 변형은 일반적으로 각각 표적 분자, 예를 들어 항원-결합 영역 또는 이소펩타이드 결합 형성 영역에 결합할 수 있는 폴리펩타이드 도메인의 추가이다. 소위 이중특이성 결합 구성체를 제공하기 위해서, 상이한 표적 분자를 N 및 C 말단에 의해 결합시킬 수 있다. 생성된 단백질 구성체는 변형된 N 말단과 변형된 C 말단에서 표적 분자에 결합할 수 있다. 특히, 본 발명자들은, N 말단과 C 말단이 동일한 일반 배향을 갖고, 생성된 구성체가, 결합 상대가 동일한 일반 공간 및 배향에 있을 때, 예를 들어 플레이트나 비드와 같은 고체 표면이나 세포 표면에 결합되었을 때, 각 말단의 결합 상대에 결합할 수 있는 조작된 단백질 구성체를 갖는다. 이는 "시스" 배향으로 단일 폴리펩타이드 쇄의 변형된 N 및 C 말단을 제공하는 것으로 지칭될 수 있다. 일반적으로 시스-배향된 이중특이성 구성체가 제공된다. 이들 단백질 구성체 중 2개 이상이 결합하여 올리고머 단백질을 형성할 수 있다.
이러한 단백질 구성체는 결합 영역(예를 들어, 항원 결합 영역)과 같은 효과기 부분의 유용한 조합을 스크리닝하는데 사용될 수 있는 조합 시스템의 생성을 허용한다. 더욱이, 일단 유용한 조합이 식별되었으면, 조합 스크린에 필요한 특징을 제거(또는 예를 들어 링커로 대체)하기 위해 구성체를 변형시킬 수 있으며, 이로써 상기 식별된 결합 영역의 유리한 조합을 갖는 보다 단순한 단백질 구성체를 제공할 수 있다. 이들 구성체는 치료, 진단 또는 분석제로서, 단량체로서 또는 하나 초과의 구성체의 올리고머로서 특별한 유용성을 찾을 수 있다.
따라서, 본원에서는,
- 복수의 서브유닛 단량체를 포함하는 올리고머성 코어; 및
- 적어도 2개의 제2 결합 부위에 직교하는 적어도 2개의 제1 결합 부위
를 포함하는 다가 단백질 스캐폴드가 제공되며, 여기서 상기 제1 결합 부위및 상기 제2 결합 부위는 스캐폴드의 동일 면 상에 위치한다.
또한,
- 복수의 서브유닛 단량체를 포함하는 올리고머성 코어;
- 적어도 하나의 제2 결합 부위에 직교하는 적어도 하나의 제1 결합 부위
를 포함하는 다가 단백질 스캐폴드가 제공되며, 여기서 상기 제1 결합 부위(들) 및 상기 제2 결합 부위(들)는 스캐폴드의 동일 면 상에 위치하고;
상기 제1 결합 부위는 제1 폴리펩타이드 표적에 공유 결합을 형성할 수 있는 제1 단백질 도메인을 포함하고; 상기 제2 결합 부위는 제2 폴리펩타이드 표적에 공유 결합을 형성할 수 있는 제2 단백질 도메인을 포함한다.
추가로,
- 복수의 서브유닛 단량체를 포함하는 올리고머성 코어;
- 적어도 하나의 제2 결합 부위에 직교하는 적어도 하나의 제1 결합 부위
를 포함하는 다가 단백질 스캐폴드가 제공되며, 여기서 상기 제1 결합 부위(들) 및 상기 제2 결합 부위(들)는 스캐폴드의 동일 면 상에 위치하고;
상기 올리고머성 코어는 항체의 Fc 영역을 포함하지 않는다.
바람직하게, 올리고머성 코어는 적어도 3개의 서브유닛 단량체를 포함한다. 더욱 바람직하게, 올리고머성 코어는 3 내지 6개의 서브유닛 단량체를 포함한다.
바람직하게, 하나의 실시양태에서 서브유닛 단량체는 비-공유결합적으로 함께 부착된다. 바람직하게, 또 다른 실시양태에서 서브유닛 단량체는 공유결합적으로 함께 부착된다. 바람직하게, 서브유닛 단량체가 함께 공유결합적으로 부착될 때, 서브유닛 단량체는 유전적으로 함께 융합된다. 일부 실시양태에서, 서브유닛 단량체는 재조합 핵산으로부터 단일 폴리펩타이드 쇄로서 발현된다.
하나의 실시양태에서 올리고머성 코어는 바람직하게는 동종올리고머성 코어이다. 이러한 실시양태에서, 바람직하게 올리고머성 코어 내의 각각의 단량체는 적어도 하나의 제1 결합 부위 및 적어도 하나의 제2 결합 부위를 포함하고, 여기서 적어도 하나의 제1 결합 부위는 적어도 하나의 제2 결합 부위에 직교한다. 바람직하게, 하나의 양태에서 각각의 단량체는 상기 단량체의 제1 말단에 부착된 제1 결합 부위 및 상기 단량체의 제2 말단의 제2 결합 부위를 포함한다. 바람직하게 각 단량체의 제1 말단 및 제2 말단은 상기 단량체의 동일 면 상에 위치한다. 바람직하게, 또 다른 양태에서, 각각의 단량체는 상기 단량체의 제1 말단에 부착된 제1 결합 부위 및 상기 제1 결합 부위에 부착된 제2 결합 부위를 포함한다.
또 다른 실시양태에서, 올리고머성 코어는 바람직하게는 이종올리고머성 코어이다. 바람직하게는, 이러한 실시양태에서 상기 코어는 제1 결합 부위를 포함하는 적어도 하나의 제1 서브유닛 단량체, 및 제2 결합 부위를 포함하는 적어도 하나의 제2 서브유닛 단량체를 포함하고, 여기서 제1 결합 부위는 제2 결합 부위에 직교한다.
바람직하게는, 본 발명에서, 본원에 제공된 단백질 스캐폴드는 전형적으로 각각의 서브유닛 단량체가 300개 미만의 아미노산; 바람직하게는 200개 미만의 아미노산; 더욱 바람직하게는 150개 미만의 아미노산을 포함하도록 구성된다. 바람직하게, 올리고머성 코어는 약 150 kDa 미만, 바람직하게는 약 100 kDa 미만; 더욱 바람직하게는 약 70 kDa 미만의 분자량을 갖는다.
일부 실시양태에서, 올리고머성 코어는 항체의 Fc 영역을 포함하지 않는다. 일부 실시양태에서, 올리고머성 코어는 CH2 도메인을 포함하지 않는다. 일부 실시양태에서, 올리고머성 코어는 CH3 도메인을 포함하지 않는다. 일부 실시양태에서, 올리고머성 코어는 CH2 도메인을 포함하지 않고 CH3 도메인을 포함하지 않는다.
바람직하게, 올리고머성 코어 및/또는 스캐폴드는 인간 피험자에게 투여될 때 면역 반응을 생성하지 않는다. 이를 본원에서 보다 상세히 기재한다.
일부 실시양태에서, 올리고머성 코어 및/또는 스캐폴드, 또는 구조 도메인은 인간 피험자에게 투여될 때 유해한 면역 반응을 생성시키지 않는다. 예를 들어, 활성 B 세포 또는 T 세포 반응이 구조 도메인에 대해 발생하지 않고/않거나, 구조 도메인이 면역글로불린 수용체에 특이적으로 결합하지 않거나 항체-의존성 세포 매개된 독성(ADCC)을 활성화하지 않는다.
바람직하게, 올리고머성 코어는 다량체 단백질의 가용성 다량체화 구조 요소를 포함한다. 바람직하게, 다량체 단백질은 콜라겐 NC(비-콜라겐성) 도메인(예를 들어, NC1 도메인), CutA1, C1q 헤드 도메인, TNF, p53, 피브리노겐, C4, 바실러스 서브틸러스(Bacillus subtillus) AbrB 또는 이의 상동체(homolog) 또는 동종간 상동체(paralog)를 포함한다.
바람직하게, 다량체 단백질은 콜라겐 VIII NC1(비-콜라겐성) 도메인, 콜라겐 X NC1(비-콜라겐성) 도메인, C1q 헤드 도메인, CutA1 단백질, 대식세포 이동 억제 인자(MIF) 또는 대식세포 이동 억제 인자 2(MIF-2), 종양 괴사 인자(TNF), TL1A 또는 CD40L을 포함하는 TNF 패밀리 구성원, 또는 이의 상동체 또는 동종간 상동체를 포함한다.
바람직하게, 다량체화 구조 요소는 서열번호 1, 서열번호 2, 서열번호 3, 서열번호 29, 서열번호 60, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 42, 서열번호 31, 서열번호 58 또는 서열번호 19에 대해 적어도 30% 또는 적어도 50% 아미노산 동일성을 갖는 폴리펩타이드를 포함한다.
바람직하게, 제1 결합 부위 및/또는 상기 제2 결합 부위는 단백질 도메인을 포함한다. 전형적으로, 상기 제1 결합 부위는 제1 단백질 도메인을 포함하고, 상기 제2 결합 부위는 제2 단백질 도메인을 포함한다. 바람직하게는, 제1 결합 부위 및/또는 제2 결합 부위는 이들이 부착되어 단일 폴리펩타이드 쇄를 형성하는 서브유닛 단량체(들)에 유전적으로 융합된다.
바람직하게, 제1 결합 부위는 제1 폴리펩타이드 표적에 공유 결합을 형성할 수 있는 제1 단백질 도메인을 포함한다. 바람직하게, 상기 제2 결합 부위는 제2 폴리펩타이드 표적에 공유 결합을 형성할 수 있는 제2 단백질 도메인을 포함한다. 보다 바람직하게, 제1 결합 부위는 제1 폴리펩타이드 표적에 공유 결합을 형성할 수 있는 제1 단백질 도메인을 포함하고, 상기 제2 결합 부위는 제2 폴리펩타이드 표적에 공유 결합을 형성할 수 있는 제2 단백질 도메인을 포함한다. 바람직하게, 상기 제1 단백질 도메인은 상기 제1 폴리펩타이드 표적과 이소펩타이드 결합을 형성할 수 있고, 상기 제2 단백질 도메인은 상기 제2 결합 표적과 이소펩타이드 결합을 형성할 수 있다.
바람직하게, 상기 제1 결합 부위 및 상기 제2 결합 부위는 각각 상이한 분할된 리간드-결합 단백질 도메인을 포함한다. 더욱 바람직하게, 상기 제1 결합 부위 및 상기 제2 결합 부위 중 하나는 분할된 스트렙토코커스 파이오게네스(Streptococcus pyogenes) 피브로넥틴-결합 단백질 도메인을 포함하고, 상기 제1 결합 부위 및 상기 제2 결합 부위 중 나머지 하나는 분할된 스트렙토코커스 뉴모니에(Streptococcus pneumoniae) 부착소(adhesin) 도메인을 포함한다.
바람직하게, 상기 제1 결합 부위 및 상기 제2 결합 부위는 각각 독립적으로 서열 번호 4 내지 9, 11 내지 13, 23 또는 15 내지 18 중 어느 하나에 대해 적어도 50%의 아미노산 동일성을 갖는다. 일부 실시양태에서, 상기 제1 및 상기 제2 결합 부위는 각각 독립적으로 서열 번호 4 내지 9, 11 내지 13, 23 또는 15 내지 18 중 어느 하나에 대해 적어도 60%, 적어도 70%, 적어도 80% 또는 적어도 90%의 아미노산 동일성을 갖는다.
또한 본원에서는, 본원에 기재된 바와 같은 단백질 스캐폴드를 포함하는 단백질 복합체가 제공되며, 여기서 제1 결합 부위는 효과기 모이어티(moiety)에 부착된 제 1 폴리펩타이드 표적에 결합되고, 제 2 결합 부위는 제 2 효과기 모이어티에 부착된 제 2 폴리펩타이드 표적에 결합된다.
바람직하게, 상기 복합체에서 제1 결합 부위/폴리펩타이드 표적 쌍 및 제2 결합 부위/폴리펩타이드 표적 쌍은 각각 독립적으로 하기의 조합으로부터 선택된다: (i) 서열번호 4, 6 또는 8 중 어느 하나와 서열번호 5, 7 또는 9 중 어느 하나; (ii) 서열번호 12와 서열번호 13 또는 15; (iii) 서열번호 5와 서열번호 11; (iv) 서열번호 15와 서열번호 16); (v) 서열번호 17과 서열번호 18; 또는 (vi) 서열번호 23과 서열번호 16).
또한, 라이브러리를 포함하는 스크리닝 플랫폼이 제공되며, 여기서 상기 라이브러리는 복수의 본원에 기재된 바와 같은 단백질 복합체 집단을 포함하고, 단백질 복합체 집단은 각각 제1 효과기 모이어티, 제2 효과기 모이어티 및/또는 올리고머성 코어의 상이한 조합을 포함한다.
또한, 치료 약물 또는 약물 유사체(analog)를 식별하는 방법이 제공되며, 상기 방법은,
본원에 기재된 바와 같은 단백질 복합체를 제공하는 단계;
상기 단백질 복합체를 생물학적 시스템과 접촉시키는 단계; 및
상기 단백질 복합체가 상기 생물학적 시스템의 특성에 목적하는 변화를 유도하는지 여부를 측정하는 단계
를 포함하고, 임의로,
상기 생물학적 시스템의 특성에 목적하는 변화를 유도하는 단백질 복합체를 선택하는 단계
를 추가로 포함한다.
상기 방법은,
상기 단백질 복합체의 제1 및 제2 효과기 모이어티에 부착된 식별된 치료 약물 유사체의 단백질 복합체의 스캐폴드의 올리고머성 코어를 포함하는 치료 약물 또는 약물 후보를 합성하는 단계
를 추가로 포함할 수 있다.
또한, 본원에 기재된 방법에 따라 수득될 수 있는 치료 약물 후보가 제공된다.
또한, 본원에 기재된 방법에 따라 수득될 수 있는 치료 약물이 제공된다.
또한, 본원에 기재된 하나 이상의 구성체 또는 폴리펩타이드를 포함하거나 이들로 이루어지는 치료 약물 또는 약물 후보가 제공된다.
또한, 하나 이상의 제1 효과기 모이어티 및 하나 이상의 제2 효과기 모이어티에 부착된 복수의 서브유닛 단량체를 포함하는 올리고머성 코어를 포함하는 치료 약물 또는 약물 후보가 제공되며; 여기서 상기 하나 이상의 제1 효과기 모이어티와 상기 하나 이상의 제2 효과기 모이어티는 올리고머성 코어의 동일 면 상에 위치하며; (i) 상기 하나 이상의 제1 효과기 모이어티는 2개 이상의 제1 효과기 모이어티를 포함하고 상기 하나 이상의 제2 효과기 모이어티는 2개 이상의 제2 효과기 모이어티를 포함하고/하거나; (ii) 상기 올리고머성 코어는 항체 또는 항체 단편을 포함하지 않는다. 바람직하게, 치료 약물 대응물의 올리고머성 코어는 본원에 더욱 상세히 기재된 바와 같다.
바람직하게, 제공된 치료 약물 후보에서, 올리고머성 코어는 복수의 서브유닛 단량체를 포함하고: (i) 각각의 서브유닛 단량체는 콜라겐 NC1 도메인, CutA1, C1q 도메인, TNF, p53, 피브리노겐, C4, 바실러스 서브틸러스 AbrB 또는 이의 상동체 또는 동종간 상동체를 포함하고/하거나; (ii) 각각의 서브유닛 단량체는 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 19에 대해 적어도 50%의 아미노산 동일성을 갖는 폴리펩타이드를 포함하는 다량체화 구조 요소를 포함한다.
바람직하게, 상기 제공된 치료 약물 또는 약물 후보에서 올리고머성 코어는 복수의 서브유닛 단량체를 포함하고: (i) 각 서브유닛 단량체는 콜라겐 VIII NC1(비-콜라겐성) 도메인, 콜라겐 X NC1(비-콜라겐성) 도메인, C1q 헤드 도메인, CutA1 단백질, 대식세포 이동 억제 인자(MIF) 또는 대식세포 이동 억제 인자 2(MIF-2), 종양 괴사 인자(TNF), TL1A 또는 CD40L을 포함하는 TNF 패밀리 구성원 또는 이들의 상동체 또는 동종간 상동체를 포함하고/하거나; (ii) 각각의 서브유닛 단량체는 서열번호 1, 서열번호 2, 서열번호 3, 서열번호 29, 서열번호 60, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 42, 서열번호 31, 서열번호 58 또는 서열번호 19에 대해 적어도 50%의 아미노산 동일성을 갖는 폴리펩타이드를 포함하는 다량체화 구조 요소를 포함한다.
특정 양태에서, 본 발명은, N 말단에 제1 결합 도메인 및 C 말단에 제2 결합 도메인을 포함하는 폴리펩타이드를 제공하며, 여기서 제1 결합 도메인과 제2 결합 도메인은 구조 도메인에 의해 분리된다. 폴리펩타이드는 전형적으로 재조합 핵산의 융합 단백질로서 발현되는 단일 조작된 폴리펩타이드 쇄이다. 전형적으로, 제1 결합 도메인 및 제2 결합 도메인은, 표적 분자가 단일 세포에서 발현되거나 플레이트 또는 단일 비드에 고정화될 때 그들의 표적에 결합할 수 있다. 이는 때때로 "시스" 배향으로 제1 및 제2 결합 도메인을 제공하는 것으로 본원에서 기재된다.
일부 실시양태에서, 제1 결합 도메인과 제2 결합 도메인은 상이한 항원-결합 도메인이다. 이때 구성체는 이중특이성 구성체가다.
일부 실시양태에서, 제1 결합 도메인 및/또는 제2 결합 도메인은 생물학적 분자와 특이적 결합이 가능한 단백질 또는 펩타이드이다. 이는 p 단백질이나 펩타이드 리간드 또는 수용체, 예를 들어 사이토카인 또는 세포 표면 수용체와 같은 결합 상대와 특이적으로 상호작용할 수 있는 신호전달 분자일 수 있다.
다른 실시양태에서, 제1 결합 도메인 및 제2 결합 도메인은, 각각 동족(cognate) 펩타이드와 이소펩타이드 연결을 형성할 수 있는 캐처(catcher) 도메인(즉, 분할 리간드-결합 단백질 도메인)이다. 이러한 동족 펩타이드는 종종 태그(tag) 펩타이드로서 지칭되며, 예를 들어 SpyTag는 당업계에 공지되고 하기에서 논의되는 바와 같이 SpyCatcher 도메인과 이소펩타이드 결합을 형성한다. 전형적으로, 제1 결합 도메인에 대한 동족 펩타이드는 제2 결합 도메인에 대한 동족 펩타이드와 상이하다. 그러나 일부 실시양태에서 동족 펩타이드는 제1 결합 도메인과 제2 결합 도메인 모두에 대해 동일할 수 있다. 각 말단에 캐처가 있는 폴리펩타이드는 태그를 포함하는 분자(예를 들어, 단백질)와 별도로, 예를 들어 키트의 일부로 제공될 수 있다. 일부 실시양태에서, 각각의 태그 펩타이드는 그의 동족 캐처 도메인에 공유결합적으로 부착되고, 임의로 동족 펩타이드 중 하나 또는 둘 다는 이소펩타이드 결합에 의해 제1 및/또는 제2 캐처 도메인에 연결된다. 일부 실시양태에서, 동족 펩타이드 태그 중 하나 또는 둘 다는 효과기 모이어티, 전형적으로 항원-결합 도메인과의 융합 폴리펩타이드로서 존재한다. 따라서 동족 펩타이드 태그에 대한 캐처의 연결은 효과기 모이어티(예를 들어, 항원-결합 도메인)를 그의 결합 도메인에 연결한다.
일부 실시양태에서, 폴리펩타이드는 N 말단에 제1 결합 도메인 및 C 말단에 제2 결합 도메인을 포함하며, 여기서 제1 및 제2 결합 도메인은 구조 도메인에 의해 분리되고, 제1 결합 도메인 및 제2 결합 도메인은, 각각 동족 펩타이드와 이소펩타이드 결합을 형성할 수 있는 캐처 도메인이며, 여기서 제1 캐처 도메인은 이소펩타이드 결합에 의해 그의 동족 펩타이드 태그에 연결되고, 제2 캐처 도메인은 이소펩타이드 결합에 의해 그의 동족 펩타이드 태그에 연결된다. 일부 실시양태에서, 각각의 펩타이드 태그는 항원-결합 도메인에 부착된다.
선행 네 단락의 폴리펩타이드는 단량체로서 유용하거나, 또는 결합되어 올리고머를 형성하는 데 유용하다.
일부 양태에서, 상기 및 본원의 다른 곳에서 정의된 바와 같은 2개 이상의 폴리펩타이드를 포함하는 올리고머가 제공된다.
일부 양태에서, 선행 단락에서 정의된 폴리펩타이드 또는 올리고머는 본원의 다른 곳에 기재된 특징을 포함한다. 예를 들어, 폴리펩타이드 구성체의 구조 도메인은 전형적으로 본원에 광범위하게 기재된 "서브유닛 단량체"이므로, 서브유닛 단량체의 정의 및 설명은 구조 도메인에 적용된다. 유사하게, 제1 결합 도메인 및 제2 결합 도메인은 전형적으로 본원의 다른 곳에 기재된 바와 같은 제1 결합 부위 및 제2 결합 부위이므로, 제1 및 제2 결합 부위의 정의 및 설명은 폴리펩타이드 구성체의 제1 결합 도메인 및 제2 결합 도메인에 적용된다.
본 발명은 복수의 효과기 모이어티의 고도로 적응가능한 스크리닝을 가능하게 한다. 효과기 모이어티는 임의의 단백질 도메인일 수 있으며 Fab/Fv 영역 또는 기타 항원-결합 도메인에 제한되지 않는다. 본 발명은 또한 기존의 이중특이성 항체 또는 다른 접근방식을 사용하여 관찰할 수 없는 더 높은 결합가 상호작용에 의해 달성된 분자의 효과를 조사하는데 사용될 수도 있다. 따라서, 본 발명은 더 높은 결합가 상호작용을 통해서만 관찰되는 효과를 포착할 수 있는 분자의 이중특이적 조합의 높은 처리량 스크리닝을 위한 시스템을 제공한다. 본 발명은 또한 본원에 제공된 방법에 따라 식별될 수 있는 신규의 치료 후보를 제공한다. 치료 후보는 다양한 기능성과 증가된 결합가의 이점을 제공한다.
다가 단백질 스캐폴드의 제한된 사용이 관련 기술분야에 기재되어 있다. 문헌[Brune et al., Bioconjugate Chemistry, 28(5), pp.1544-1551]에 기재된 한 가지 시도는 잠재적인 말라리아 백신으로서 IMX313 칠량체 코어의 대향면에 항원이 조립된 칠량체 조립체의 사용에 관한 것이다. 그러나 이러한 구성체는 부착된 항원의 대향된 디스플레이로 인해 동일-세포 다중-수용체 관여에 적합하지 않으며, 암 및 자가면역 장애와 같은 장애를 치료하기 위한 동일-세포 결합에서의 적용 가능성이 제한된다.
따라서, 효과기 모이어티(본원에서는 리간드라고도 함) 조합의 표현형 스크리닝을 위한 신규 및/또는 개선된 방법 및 새로운 치료제를 개발하는 방법이 필요하다. 이전의 방법은 조사된 기능성 조합의 결합가 증가를 허용하지 않고/않거나, 단백질 스캐폴드의 동일 면 상에 항원을 제시하는 상승적 이점을 인식하지 못한다. 또한, 본 개시내용에 따라 설계되고 식별될 수 있는 본원에 제공된 치료제를 포함하는 신규 및/또는 개선된 치료제에 대한 필요성이 존재한다.
도 1은 제1 결합 부위 및 제2 결합 부위가 올리고머성 코어의 동일 면 상에 위치하여 다가 단백질 스캐폴드의 동일 면 상에 위치하는, 본원에 기재된 바와 같은 다가 단백질 스캐폴드를 도시하는 개략도이다.
도 2는 제1 결합 부위 및 제2 결합 부위가 올리고머성 코어의 대향면에 위치하여 다가 단백질 스캐폴드의 대향면에 위치하는, 본원에 기재된 바와 같은 다가 단백질 스캐폴드를 도시하는 개략도이다.
도 3은 복수의 제1 결합 부위 및 복수의 제2 결합 부위가 올리고머성 코어의 동일 면 상에 위치하여, 표면과의 맞물림을 위해 다가 단백질 스캐폴드의 동일 면 상에 위치하는, 본원에 기재된 바와 같은 다가 단백질 스캐폴드를 도시하는 개략도이다.
도 4는 복수의 제1 결합 부위 및 복수의 제2 결합 부위가 올리고머성 코어의 대향면에 위치하여 다가 단백질 스캐폴드의 대향면에 위치하므로 표면과 동시에 맞물릴 수 없는, 본원에 기재된 바와 같은 다가 단백질 스캐폴드를 도시하는 개략도이다.
도 5는 제1 결합 부위 및 제2 결합 부위가 올리고머성 코어의 동일 면 상에 위치하여 정면-정면 배향으로 다가 단백질 스캐폴드의 동일 면 상에 위치하는, 본원에 기재된 바와 같은 다가 단백질 스캐폴드를 도시하는 개략도이다.
도 6은 제1 결합 부위 및 제2 결합 부위가 올리고머성 코어의 동일 면 상에 위치하여 정면-측면 배향으로 다가 단백질 스캐폴드의 동일 면 상에 위치하는, 본원에 기재된 바와 같은 다가 단백질 스캐폴드를 도시하는 개략도이다.
도 7은 제1 결합 부위와 제2 결합 부위가 올리고머성 코어의 동일 면 상에 위치하여 정면-정면 배향과 정면-측면 배향 사이의 중간 배향으로 다가 단백질 스캐폴드의 동일 면 상에 위치하는, 본원에 기재된 바와 같은 다가 단백질 스캐폴드를 도시하는 개략도이다.
도 8은 본원에 기재된 바와 같은 다가 단백질 스캐폴드의 올리고머성 코어의 서브유닛 단량체에 부착된 제1 결합 부위와 제2 결합 부위 사이에 형성되는 각도(X)를 도시하는 개략도이다.
도 9는 제1 결합 부위와 제2 결합 부위의 탠덤 융합이 본원에 기재된 바와 같은 올리고머성 코어에 부착되어 다가 단백질 스캐폴드의 생성을 허용하는 본 발명의 실시양태를 도시하는 개략도이다. 본원에 개시된 방법을 사용하여 다양한 서로 다른 기하학적 구조 및 화학량론이 생성될 수 있다.
도 10은 "시스"의 융합 부위에 대한 2D 설명을 예시한다. a) 주어진 표적면에 대해, 해당 표적면으로부터 작성된 직교선을 통해 코어 단백질의 가장 긴 횡단면이 결정되며, 거리 dc를 특징으로 한다. 이 횡단면의 중간점을 가로지르는 평행면이 표시된다. 여기서, 모든 접합 부위에 대해, 접합 부위로부터 단백질 표면과 교차하지 않는 표적면까지의 최단 경로 거리가 거리 dc의 특정%, 예를 들어 dc의 50% 미만인 경우 단백질 접합을 위한 부위(별, 원)는 우선적으로 "시스"인 것으로 간주된다. b) 모든 결합 부위가 시스인 예시적인 단백질. c) 모든 두 번째 결합 부위(원)가 50% dc의 임계값 바로 아래에 있는 최소 경로 길이를 특징으로 하므로, a)에 따라 모든 결합 부위가 서로 시스인 예시적인 단백질. d) 모든 결합 부위로부터 표적면까지의 돌출부 거리(단백질 횡단)가 c)에서와 동일하더라도, 이 단백질은 모든 두 번째 결합 부위(원)로부터 최단 경로를 차단하는 기하학적 구조를 특징으로 하며, 따라서 이들 결합 부위는 스캐폴드의 같은 쪽에 접근할 수 없거나 같은 쪽에 있을 수 없다. e,f) 결합 부위가 서로 너무 멀리 떨어져 있어 어떠한 표적면에 대해서도 시스로 간주되지 않는다.
도 11은 본원에서 지칭된 단백질 구조의 개요를 제공한다. 주어진 PDB ID에 대한 단백질 구조는 다양한 색상의 쇄와 함께, 카툰으로서 시각화된다. N-말단 및 C-말단은 각각 단일 단량체에 대해 주석이 달리고, 대략적으로 결합 표면을 향해 배향된다. 단백질 구조의 대칭은 괄호 안에 표시된다(예를 들어, 사이클릭 C3 대칭, 사이클릭 C4 대칭, 및 2면체 D2 대칭). *: 단백질 대칭은 NMR 구조로부터 추정된다. †1PK6은 C1 대칭을 특징으로 하는 이형중합체(heteromer)이지만, 도메인은 동형중합체(homomeric)이고 이들의 배열은 C3 대칭과 유사하다. 적합한 단량체 형태를 갖는 다량체성 단백질 코어를 선택함으로써, 단량체당 다중 결합 부위가 돌출되어 단일 결합 표면을 형성할 수 있다. 재조합 융합 외에도 이러한 단백질은 예를 들어 SpyCatcher 및 SnoopCatcher 또는 DogCatcher와의 N-말단 및 C-말단에서의 재조합 융합에 의해, 예를 들어 올리고머성 코어 단백질 단량체의 N-말단에 있는 SpyCatcher와 C-말단에 있는 SnoopCatcher의 재조합 융합을 통해 모듈식 조립에 활용되어, 적합하게 변형된 펩타이드 또는 단백질에 다가원성(multivalency) 또는 기타 특성을 신속하게 부여할 수 있다. 예로서 하기를 포함한다: (1) 열안정성이 높은 인간 구리-결합 단백질인 HsCutA1은 서로 근접하여, 조립된 삼량체(PDB ID 2ZFH)에 단일면상에 돌출되는, 각 단량체의 N-말단과 C-말단을 모두 갖는 C3 기하학적 구조를 특징으로 한다. (2) HsCutA1에 대해 높은 구조적 유사성을 갖는 파이로코커스 호리코시이(Pyrococcus horikoshii)(PDB ID 4NYO)로부터의 초-내열성 상동체 PhCutA1. (3) 콜라겐 X의 NC1-도메인(PDB ID: 1GR3), (4) 콜라겐 VIII의 NC1-도메인(PDB ID: 1O91), (5) 대식세포 이동 억제 인자 2(PDB ID: 7MSE), (6) 종양 괴사 인자(PDB ID: 1TNF), (7) TNF-유사 단백질 TL1A(PDB ID : 2RE9).
도 12는 시스-배향된 다량체성 단백질 복합체가 표준 단백질 정제 방법에 의해 쉽게 발현되고 제조될 수 있음을 도시한다. a) H6-SpC-PhCutA1-SnC[서열번호 21]의 Ni-NTA 정제. H6-SpC-PhCutA1-SnC는 에스케리키아 콜라이(E. coli) BL21(DE3)에서 쉽게 발현되며 SDS-PAGE 로딩 완충제와 함께 비등한 후에조차 초-안정한 PhCutA1의 특징인 온전한 삼량체 구조를 유지한다. 세척 1 및 2를 10 컬럼 부피의 평형 완충제(50 mM Tris, pH 7.8; 300 mM NaCl; 10 mM 이미다졸)로 수행하였다. 세척 3 및 4를 10 컬럼 부피의 세척 완충제(50 mM Tris, pH 7.8; 300 mM NaCl; 30 mM 이미다졸)로 수행하였다. 모든 용출 단계를 2 컬럼 부피의 용출 완충제(50 mM Tris, pH 7.8; 300 mM NaCl; 200 mM 이미다졸)로 수행하였다. 샘플을 쿠마씨 염색(Coomassie staining)과 함께 12% SDS-PAGE 젤을 사용하여 분석하였다. P - 용해물 펠릿; CL - 명확한 용해물; FT - 통과액; W - 세척; E - 용출. b,c) H6-SpC-PhCutA1-SnC에 대해 HiLoad 16/600 Superdex 200 pg를 사용한 크기 배제 크로마토그래피의 결과. b) H6-SpC-PhCutA1-SnC 피크가 강조 표시된 UV A280 흡광도 크로마토그램. c) 상기 크로마토그램에서 강조 표시된 영역으로부터의 H6-SpC-PhCutA1-SnC 2 ㎖ 분획의 SDS-PAGE.
도 13은 시스-배향된 디스플레이를 위한, 2면체 육량체로부터 원형 대칭성 삼량체 코어 단백질로의 이행을 도시한다. a) 동종-육량체성 역평행 이중나선은 단백질 조립체의 2개의 대향면상의 N-말단 및 C-말단을 특징으로 한다(PDB ID: 5W0J). b) 이형중합체성 조립체는 점 돌연변이 유발에 의해, 예를 들어 염-가교 형성의 도입 또는 변형에 의해 상기 조립체를 한 방향으로 "잠금"으로써 동형중합체 조립체로부터 유도될 수 있다(PDB ID: 5VTE). c) 이형중합체성 조립체의 말단을 연결함으로써, 시스-배향된 디스플레이에 적합한 동형중합체성 조립체가 유도될 수 있다(HIV GP41, PDB ID: 1I5Y와 비교). 검은색에서 흰색(구조, 도식) 및 화살표 방향(도식): N-말단에서 C-말단으로. PyMOL에서 시각화된 구조.
도 14는 SpC-PhCutA1-SnC가 매우 안정한 삼량체 단백질임을 나타낸다. a) SDS 로딩 염료를 첨가하기 전에 SpC-PhCutA1-SnC 샘플을 PBS 외에 0%, 0.5% 또는 1% SDS에서 97℃에서 2시간 동안 가열하였다. 샘플을 12% SDS-PAGE에서 분리하고 쿠마씨로 염색하였다. 가열되지 않고 SDS가 존재하지 않는 대조용 샘플이 첫 번째 레인에 표시된다. SDS 농도가 증가하면 삼량체의 부분적인 단량체화가 관찰되어 삼량체가 공유결합적으로 가교결합되지 않음을 확인하였다. b) SpC-PhCutA1-SnC는 장기간 보관 후에도 유지되었다. 단백질 분액을, SDS 로딩 완충제로 샘플을 제조하고 SDS-PAGE에서 분석하기 전에 7일 동안 4℃, 주변 온도(21℃) 또는 37℃에서 보관하였다. 4℃에서 보관한 것과 비교하여, 단백질은 21℃ 내지 37℃에서 분해의 징후가 거의 나타나지 않았다. 임의로, 유사한 효과를 갖는 프로테아제 억제제 PMSF를 첨가하였다.
도 15는 플랫폼 단백질로 모듈식 조립을 위한 SpyTagged 및 SnoopTagged 리간드 성분의 제조를 도시한다. a) Ni-NTA 크로마토그래피를 사용하여 200 ㎖ BL21(DE3) 배양물로부터 SnT-L1을 정제한다. 각 세척 단계를 5 ㎖ Ni-NTA 세척 완충제를 사용하여 수행하였다. 각 용출 단계를 2 ㎖의 Ni-NTA 용출 완충제를 사용하여 수행하였다. 샘플을 쿠마씨 염색과 함께 12% SDS-PAGE 젤을 사용하여 분석하였다. Pel. - 용해물 펠릿; FT - 통과액; W - 세척; E - 용출; L - 사다리. b) a)에서와 같은 L2-SpT의 정제. c) Ni-NTA 정제 후 SnT-L1의 크기 배제 크로마토그래피. HiLoad Superdex 16/600 75pg 컬럼을 사용하는 AKTA Pure 25로부터의 SnT-L1에 대한 UV A280 흡광도 크로마토그램. 삽입물: 크로마토그램에서 강조 표시된 영역의 SnT-L1 2 ㎖ 분획에 대한 SDS-PAGE. d) c)에서와 같은 L2-SpT의 크기 배제 크로마토그래피.
도 16은 SpC-PhCutA1-SnC가 SpyTagged 및 SnoopTagged 단백질의 안정한 삼량체화를 촉진한다는 것을 도시한다. a) H6-SpC-PhCutA1-SnC를 지정된 시간 동안 1:2:2 몰 과잉의 SnT-L1 또는 L2-SpT와 접합시킨 후 샘플에 SDS 로딩 완충제를 보충하고 모든 샘플을 95℃에서 5분간 비등시켜 변성시켰다. 샘플을 8% 및 16% SDS-PAGE 젤에서 분석 후 쿠마씨 염색하였다. 우리는 리간드 성분의 소비와 함께 SpC-PhCutA1-SnC와 SnT-L1 또는 L2-SpT의 시간 의존적 접합을 관찰하였다. b) a)에서와 같은 SpC-PC-SnC와 SnT-L1 및 L2-SpT의 접합. c) SpC-PhCutA1-SnC와 SnT-L1 및 L2-SpT의 접합. SpC-PhCutA1-SnC를 SnT-L1 및/또는 L2-SpT와 1:2:2 몰 과잉으로 배양하고 샘플을 25℃에서 64시간 동안 배양하였다. 샘플을 쿠마씨 염색과 함께 16% SDS-PAGE 젤을 사용하여 분석하였다. 특히, PhCutA1의 특징적인 초-내열성을 유지하면서, SpC-PhCutA1-SnC 및 SnT-L1/L2-SpT 접합체를 완료하였다. d) c)에서와 같은 SpC-PC-SnC와 SnT-L1 및 L2-SpT의 접합. SpC-PC-SnC 및 SnT-L1/L2-SpT 접합을 완료될 때까지 수행하였다.
도 17은 고분자량 스캐폴드가 투석을 통해 조립-후 정제를 가능하게 함을 도시한다. a) Ni-NTA 정제된 SpC-PhCutA1-SnC 및 b) SpC-PhCutA1-SnC:SnT-L1:L2-SpT 조립체를 96-웰 포맷을 사용하여 투석하였다. a) SpC-P2-SnC를 Ni-NTA 크로마토그래피를 사용하여 정제하고 용출 분획을 합하고 농축시켰다. b) SpC-PhCutA1-SnC, SnT-L1 및 L2-SpT에 대해 25℃에서 2시간 동안 단백질 접합을 수행하였다. 투석을 HTDialysis 96-웰 블록에서 1:1의 샘플 대 투석 완충제 비로 100 kDa MWCO 멤브레인을 사용하여 수행하였다. 투석을 주위 온도에서 궤도 진탕으로 수행하였다. PBS 투석액을 30분마다 최대 90분까지 교체하였다. 24시간의 투석은 단백질 불순물(a-b)과 접합되지 않은 리간드(b)가 평형 상태(샘플과 투석 완충액의 1:1 비)로 제거되는 것을 나타낸다. 샘플을 환원 SDS-로딩 염료와 함께 비등시키고, 12% SDS-PAGE 상에서 분석하고, 쿠마씨 염색에 의해 시각화하였다. c) 대안적으로, SpC-PhCutA1-SnC:SnT-L1:L2-SpT 접합체를, 1:30의 샘플 대 투석 완충제 비를 특징으로 하는 12-웰 플레이트 포맷으로 투석을 통해 정제하였다. 25℃에서 24시간 동안 SpC-PhCutA1-SnC, SnT-L1 및 L2-SpT에 대한 1:1 접합을 설정하였다. 투석을 HTDialysis 12-웰 블록과 100 kDa MWCO 셀룰로스 멤브레인을 사용하여 주변 온도에서 16시간에 걸쳐 교반 없이 수행하였다. 100 ㎕의 샘플 용량과 3 ㎖의 PBS 투석액 부피가 사용되었으며, 둘 다 1× PMSF를 함유하였다. 샘플과 투석액을 하기의 시점에서 채취하였다: 2시간, 4시간, 8시간 및 16시간. 샘플을 14% SDS-PAGE 젤과 쿠마씨 염색을 사용하여 분석하였다. S = 투석된 샘플, D = 투석액(PBS).
도 18은 종 코어 성분(PhCutA1에서 MIF2m 또는 HsCutA1로), 접합을 위한 단백질 성분(SpC/SnC에서 SpC3/DgC로)의 변화 및 가변적인 링커 길이(MIF2m의 경우 GGGGSGGGGSGGGGS 및 HsCutA의 경우 GGGGS)를 도시하며, 신속한 프로토타이핑의 가능성을 강조한다 a,b) H6-SpC3-HsCutA1-DgC 또는 H6-SpC3-MIF2m-DgC의 Ni-NTA 정제로부터의 샘플. TL - 총 용해물; P - 용해물 펠릿; CL - 등명화된 용해물; FT - 통과액; W - 세척; E - 용출. 샘플을 쿠마씨 염색과 함께 SDS-PAGE 젤을 사용하여 분석하였다. c) SpC3-MIF2m-DgC 및 SpC3-HsCutA1-DgC는 모두 DogTagged 또는 SpyTagged 단백질에 빠르게 접합할 수 있다. 플랫폼 단백질을 1:1.5:1.5 몰비로 25℃에서 16시간 동안 배양하였다. d) H6-SpC3-HsCutA1-DgC와 0.1% 글루타르알데하이드와의 배양은 용액 중 삼량체성 단백질의 가교결합을 입증한다. 10 μM H6-SpC3-HsCutA1-DgC를 0.1% 글루타르알데하이드를 사용하여 0-20분 동안 가교결합시켰다. 반응을 37℃에서 배양하고 100 mM Tris, pH 8.8을 첨가하여 중단시켰다. 삼량체 가교결합된 종이 빠르게 형성되며; 연장된 배양 시, 단량체성 H6-SpC3-HsCutA1-DgC가 소비되며, 이때 두 삼량체 간의 가교결합에 대해 예상되는 분자량에서 가교결합된 종의 일부가 형성된다. e) SpC3-HsCutA1-DgC를 L1-SpT 및 L3-DgT와 1:2:2 몰비로 25℃에서 16시간 동안 반응시켰다. 이어서 SpC3-HsCutA1-DgC 단독, L1-SpT:SpC3-HsCutA1-DgC, SpC3-HsCutA1-DgC:L3-DgT 및 L1-SpT: SpC3-HsCutA1-DgC: L3-DgT의 각 샘플을 Superose 6 Increase 5/150 GL 컬럼을 사용하여 크기 배제 크로마토그래피하였으며, 이는 각 단백질 스캐폴드 또는 단백질 조립체의 유체역학적 반경 증가를 보였다. 음영 처리된 영역의 각 크로마토그램 피크의 피크 분획을 SDS page 젤에 로딩하여, 과잉의 리간드가 제거된 스캐폴드 및 조립 단백질만을 나타내었다. 이 샘플을 도 20c에 대한 입력으로서 사용하였다.
도 19는 융합 단백질의 시스-배향을 예측하기 위해 Alphafold v2.0이 어떻게 활용되었는지를 도시한다. PyMOL에서 시각화된 각 SpC3-스캐폴드-DgC 조립체의 최고 순위 모델이다. SpyCatcher3(중간 회색), 스캐폴드(진한 회색) 및 DogCatcher(밝은 회색)를 나타내는 단일 쇄가 강조 표시된다. 추가적인 쇄는 흰색 카툰으로 투명한 표면으로서 표시된다. 모든 시뮬레이션에서 캐처와 스캐폴드 사이에 GSGS 링커가 사용되었다. 콜라겐 XV NC1의 경우 GSGS 링커를 사용하여 구조 예측이 붕괴되었다. 따라서 (GGGGS)2 링커를 사용하여 예측을 반복하였으며 이 구조를 여기에 나타낸다. Alphafold 예측에 사용된 단량체 서열: TL1A - 서열번호 32; Col XV NC1 - 서열번호 33; MIF2m - 서열번호 34; HsCutA1 - 서열번호 54; PhCutA1 - 서열번호 55; Col X NC1 - 서열번호 56; TNF - 서열번호 57.
도 20은 시험관 내 시험을 위한 스캐폴드의 적합성을 도시한다. a) H6-SpC-PhCutA1-SnC를 2개의 상이한 리간드인 SnT-L1 및 L2-SpT와 접합시켰다. 혈청-결핍된 NCI-N87 세포를 관련된 성장 인자 및 이중-접합된 조립체(H6-SpC-PhCutA1-SnC:SnT-L1:L2-SpT), 단일-접합된 조립체(H6-SpC-PhCutA1-SnC:SnT-L1, H6-SpC-PhCutA1-SnC:L2-SpT)뿐만 아니라 리간드 단독 대조군(SnT-L1, L2-SpT, SnT-L1 + L2-SpT)의 존재 하에서 7일 동안 증식시킨 다음, MTT 세포 생존율을 측정하였다. 10 nM에서 L1, L2 및 L1+L2에 대한 대조용 항체를 대조군으로 사용하였으며(데이터는 도시되지 않음) 단일- 및 이중-접합된 조립체 샘플과 비교하여 유사한 결과를 얻었다; 오차 막대는 n=3의 기술적 복제를 나타낸다. b) 완전히 조립된 스캐폴드 H6-SpC-PhCutA1-SnC:SnT-L1:L2-SpT는 Akt 및 Erk1/2의 활성화를 억제한다. NCI-N87 세포를 스캐폴드 단독(S; H6-SpC-PhCutA1-SnC), 리간드 단독(L1; SnT-L1 및 L2; L2-SpT) 및 단일-(SxL1, SxL2) 및 이중-접합된(SxL1xL2) 조립체로 1시간 동안 처리하였으며, 전체 조립체 H6-SpC-PhCutA1-SnC:SnT-L1:L2-SpT에 의한 Akt/ERK 신호 전달의 하류 활성화의 억제를 나타냈다. c) H6-SpC-HsCutA1-SnC를 2개의 상이한 리간드인 SnT-L1 및 L3-SpT와 접합시켰다. 혈청-결핍된 NCI-N87 세포를 이중-접합된 조립체(H6-SpC-HsCutA1-SnC:SnT-L1:L3-SpT), 단일-접합된 조립체(H6-SpC-HsCutA1-SnC:SnT-L1, H6-SpC-HsCutA1-SnC:L3-SpT)뿐만 아니라 리간드 단독 대조군(SnT-L1, L3-SpT, SnT-L1 + L3-SpT)으로 2일 동안 처리한 다음, MTT 세포 생존율을 측정하였다; 오차 막대는 n=3의 기술적 복제를 나타낸다.
도 21은 Ni-NTA 및 크기 배제 크로마토그래피 모두에 의한 직접 융합 다중-도메인 폴리펩타이드로서 L1-PhCutA1-L2의 정제를 도시한다. a) L1-PhCutA1-L2는 에스케리키아 콜라이 BL21(DE3)에서 쉽게 발현되며 HisPur 수지(ThermoFisher)를 사용하여 Ni-NTA 크로마토그래피에 의해 정제된다. 세척 1 및 2를 10 컬럼 부피의 평형 완충제(50 mM Tris, pH 7.8, 300 mM NaCl, 10mM 이미다졸)를 사용하여 수행하였다. 세척 3 및 4를 2 컬럼 부피의 세척 완충제(50 mM Tris, pH 7.8, 300 mM NaCl, 30 mM 이미다졸)를 사용하여 수행하였다. 모든 용출 단계를 2 컬럼 부피의 용출 완충제(50 mM Tris, pH 7.8, 300 mM NaCl, 200 mM 이미다졸)를 사용하여 수행하였다. 샘플을 12% SDS-PAGE 젤상에서 분석하고 쿠마씨로 염색하였다. P - 용해물 펠릿, CL - 등명화된 용해물, FT - 통과액, W - 세척, E - 용출. b) L1-PhCutA1-L2에 대해 HiLoad 16/600 Superdex 200 pg를 사용한 크기 배제 크로마토그래피의 결과 b) L1-PhCutA1-L2 피크가 강조 표시된 UV A280 흡광도 크로마토그램. 삽입물: 상기 크로마토그램에서 강조 표시된 영역의 L1-PhCutA1-L2 2 ㎖ 분획의 SDS-PAGE.
본 발명을 특정 실시양태 및 특정 도면을 참조하여 설명할 것이지만, 본 발명은 이에 제한되지 않고 청구범위에 의해서만 제한된다. 청구항의 모든 참조 기호는 범위를 제한하는 것으로 해석되어서는 안 된다. 물론, 본 발명의 임의의 특정 실시양태에 따라 반드시 모든 양태 또는 이점이 달성될 수 있는 것은 아니라는 점을 이해해야 한다. 따라서, 예를 들어 당업자는 본원에 교시되거나 제안될 수 있는 다른 양태 또는 이점을 반드시 달성하지 않고도 본원에 교시된 하나의 이점 또는 일단의 이점을 달성하거나 최적화하는 방식으로 본 발명이 구현되거나 수행될 수 있다는 것을 인식할 것이다.
또한, 본 명세서 및 첨부된 청구범위에 사용된 단수형은, 내용상 달리 명시되지 않는 한, 복수형을 포함한다. 따라서, 예를 들어 "스캐폴드"에 대한 언급은 2개 이상의 스캐폴드를 포함하고, "올리고머"에 대한 언급은 2개 이상의 이러한 올리고머를 포함하는 등이다.
상기 또는 하기에 인용된 모든 간행물, 특허 및 특허 출원은 그 전체가 참조로 포함된다.
정의
하기의 용어 또는 정의는 단지 본 발명의 이해를 돕기 위해 제공된다. 본원에서 구체적으로 정의되지 않는 한, 본원에 사용되는 모든 용어는 본 발명의 기술분야에서 통상의 지식을 가진 자에게 부여되는 것과 동일한 의미를 갖는다. 실무자는 당해 분야의 정의 및 용어에 대해서 특히 하기의 문헌을 지시한다: Sambrook et al., Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Press, Plainsview, New York (2012); 및 Ausubel et al., Current Protocols in Molecular Biology (Supplement 114), John Wiley & Sons, New York (2016). 본원에 제공된 정의는 당업자가 이해하는 것보다 낮은 범위를 갖는 것으로 해석되어서는 안 된다.
본원에 사용되는 바와 같은 "약"은 양, 시간적 지속 등과 같은 측정가능한 값을 언급할 때 명시된 값으로부터 ±20% 또는 ±10%, 바람직하게는 ±5%, 훨씬 더 바람직하게는 ±1%, 더욱 더 바람직하게는 0.1%의 변동을 포함하는 것을 의미하는데, 이러한 변화가 개시된 방법을 수행하기에 적절하기 때문이다.
본 개시내용과 관련하여 "아미노산"이라는 용어는 가장 넓은 의미로 사용되며 각 아미노산에 특이적인 측쇄(예를 들어, R 기)와 함께, 아민(NH2) 및 카복실(COOH) 작용기를 함유하는 유기 화합물을 포함함을 의미한다. 일부 실시양태에서, 아미노산은 자연 발생 Lα-아미노산 또는 잔기를 지칭한다. 자연 발생 아미노산에 대해 통상적으로 사용되는 1자 및 3자 약어가 본원에서 사용된다: A=Ala; C=Cys; D=Asp; E=Glu; F=Phe; G=Gly; H=His; I=Ile; K=Lys; L=Leu; M=Met; N=Asn; P=Pro; Q=Gln; R=Arg; S=Ser; T=Thr; V=Val; W=Trp; 및 Y=Tyr(문헌[Lehninger, A. L., (1975) Biochemistry, 2d ed., pp. 71-92, Worth Publishers, New York]). 일반 용어 "아미노산"은 D-아미노산, 레트로-인버소(retro-inverso) 아미노산뿐만 아니라 아미노산 유사체와 같은 화학적으로 변형된 아미노산, 노르류신과 같이 일반적으로 단백질에 통합되지 않고 화학적으로 합성되는 자연 발생 아미노산, 및 β-아미노산과 같이, 아미노산의 특징인 것으로 당업계에 공지된 특성을 갖는 화학적으로 합성된 화합물을 추가로 포함한다. 예를 들어, 천연 Phe 또는 Pro와 마찬가지로 펩타이드 화합물의 동일한 구조적 제한을 허용하는 페닐알라닌 또는 프롤린의 유사체 또는 모방체가 아미노산의 정의에 포함된다. 이러한 유사체 및 모방체는 본원에서 각각의 아미노산의 "기능적 등가물"로서 지칭된다. 아미노산의 다른 예는 하기의 문헌에 나열되어 있다: Roberts and Vellaccio, The Peptides: Analysis, Synthesis, Biology, Gross and Meiehofer, eds., Vol. 5 p. 341, Academic Press, Inc., N.Y. 1983(본원에 참고로 포함됨).
"폴리펩타이드" 및 "펩타이드"라는 용어는 아미노산 잔기의 중합체 및 그의 변이체 및 합성 유사체를 지칭하기 위해 본원에서 상호교환적으로 사용된다. 따라서, 이들 용어는 하나 이상의 아미노산 잔기가 상응하는 자연 발생 아미노산의 화학적 유사체와 같은 합성 비-천연 발생 아미노산인 아미노산 중합체뿐만 아니라 자연 발생 아미노산 중합체에도 적용된다. 폴리펩타이드는 또한 글리코실화, 단백질 분해 절단, 지질화, 신호 펩타이드 절단, 프로펩타이드 절단, 인산화 등을 포함할 수 있지만 이에 제한되지 않는 성숙화 또는 번역-후 변형 과정을 겪을 수 있다. 예를 들어, 재조합 또는 합성 폴리뉴클레오타이드의 발현을 통해 재조합 기술을 사용하여 펩타이드를 제조할 수 있다. 재조합적으로 생성된 펩타이드는 전형적으로 배양 배지가 실질적으로 없다, 예를 들어 배양 배지는 단백질 제제 부피의 약 20% 미만, 보다 바람직하게는 약 10% 미만, 가장 바람직하게는 약 5% 미만을 나타낸다.
"단백질"이라는 용어는 2차 또는 3차 구조를 갖는 폴딩된 폴리펩타이드를 기재하는데 사용된다. 단백질은 단일 폴리펩타이드로 구성될 수 있거나, 조립되어 다량체를 형성하는 다중 폴리펩타이드를 포함할 수 있다. 다량체는 동종올리고머 또는 이종올리고머일 수 있다. 단백질은 자연 발생 단백질이거나 야생형 단백질일 수도 있고, 변형되거나 비자연적으로 발생하는 단백질일 수도 있다. 예를 들어, 단백질은 하나 이상의 아미노산의 첨가, 치환 또는 결실에 의해 야생형 단백질과 상이할 수 있다.
단백질의 "변이체"에는 문제의 변형되지 않은 또는 야생형 단백질에 비해 아미노산 치환, 결실 및/또는 삽입이 있고, 유래된 변형되지 않은 단백질과 유사한 생물학적 및 기능적 활성을 갖는 펩타이드, 올리고펩타이드, 폴리펩타이드, 단백질 및 효소가 포함된다. 본원에 사용된 바와 같은 "아미노산 동일성"이라는 용어는 비교 창에 걸쳐 아미노산 대 아미노산 기준으로 영향이 동일한 정도를 지칭한다. 따라서, "서열 동일성 백분율"은 비교 창을 통해 최적으로 정렬된 2개의 서열을 비교하고, 일치하는 아미노산 잔기(예를 들어, Ala, Pro, Ser, Thr, Gly, Val, Leu, Ile, Phe, Tyr, Trp, Lys, Arg, His, Asp, Glu, Asn, Gln, Cys 및 Met)가 두 서열 모두에 존재하여 합치된 위치의 수를 산출하고, 합치된 위치의 수를 비교창 중의 위치의 총 수(즉 창 크기)로 나누고, 결과에 100을 곱하여 서열 동일성의 백분율을 산출함으로써 계산된다.
본 발명의 모든 양태 및 실시양태에 대해서, "변이체"는 상응하는 야생형 단백질의 아미노산 서열에 전형적으로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% 또는 99% 완전한 서열 동일성을 갖는다. 서열 동일성은 또한 전장 폴리뉴클레오타이드 또는 폴리펩타이드의 단편 또는 부분에 대한 것일 수 있다. 따라서, 서열은 전체 길이 참조 서열과 단지 50%의 전체 서열 동일성을 가질 수 있지만, 특정 영역, 도메인 또는 서브유닛의 서열은 참조 서열과 80%, 90% 또는 99% 정도의 서열 동일성을 공유할 수 있다.
"야생형"이라는 용어는 자연 발생 공급원으로부터 단리된 유전자 또는 유전자 산물을 지칭한다. 야생형 유전자는 집단에서 가장 빈번하게 관찰되는 유전자이므로 유전자의 "정상" 또는 "야생형" 형태로 임의로 설계된다. 대조적으로, "변형된", "돌연변이체" 또는 "변이체"라는 용어는 야생형 유전자 또는 유전자 산물과 비교 시 서열 변형(예를 들어, 치환, 절단 또는 삽입), 번역 후 변형 및/또는 기능적 특성(예를 들어, 변경된 특징)을 나타내는 유전자 또는 유전자 산물을 지칭한다. 자연 발생 돌연변이체가 단리될 수 있다는 점에 유의한다; 이는 야생형 유전자 또는 유전자 산물과 비교할 때 특성이 변경되었다는 사실로 식별된다. 자연 발생 아미노산을 도입하거나 치환하는 방법은 해당 분야에 주지되어 있다. 예를 들어, 메티오닌(M)은 돌연변이체 단량체를 암호화하는 폴리뉴클레오타이드의 관련 위치에서 메티오닌에 대한 코돈(ATG)을 아르기닌에 대한 코돈(CGT)으로 대체함으로써 아르기닌(R)으로 치환될 수 있다. 비-자연 발생 아미노산을 도입하거나 치환하는 방법도 해당 분야에 주지되어 있다. 예를 들어, 돌연변이 단량체를 발현하는데 사용되는 IVTT 시스템에 합성 아미노아실-tRNA를 포함시켜 비-자연 발생 아미노산을 도입시킬 수 있다. 대안적으로, 특정 아미노산의 합성(즉, 비-자연 발생) 유사체의 존재 하에서 특정 아미노산에 대해 영양요구성인 돌연변이체 단량체를 에스케리키아 콜라이에서 발현시킴으로써 도입시킬 수 있다. 또한 돌연변이체 단량체가 부분적 펩타이드 합성을 사용하여 생성되는 경우, 이를 네이키드 결찰(naked ligation)을 통해 생성시킬 수도 있다. 보존적 치환은 아미노산을 유사한 화학 구조, 유사한 화학적 특성 또는 유사한 측쇄 부피의 다른 아미노산으로 대체시킨다. 도입된 아미노산은 상기가 대체하는 아미노산과 유사한 극성, 친수성, 소수성, 염기성, 산성도, 중성 또는 전하를 가질 수 있다. 대안적으로, 보존적 치환은 기존의 방향족 또는 지방족 아미노산 대신 방향족 또는 지방족인 또 다른 아미노산을 도입시킬 수 있다. 보존적 아미노산 변화는 당업계에 주지되어 있으며, 하기 표 1에 정의된 바와 같은 20개 주요 아미노산의 특성에 따라 선택될 수 있다. 아미노산이 유사한 극성을 갖는 경우, 이는 표 2의 아미노산 측쇄에 대한 소수성(hydropathy) 척도를 참조하여 결정될 수도 있다.
표 1. 아미노산의 화학적 특성
Figure pct00001
표 2. 소수성 척도
돌연변이 또는 변형된 단백질, 단량체 또는 펩타이드는 어떤 방식으로든 어떤 부위에서든 화학적으로 변형될 수 있다. 돌연변이체 또는 변형된 단량체 또는 펩타이드는 하나 이상의 시스테인에 대한 분자의 부착(시스테인 결합), 하나 이상의 리신에 대한 분자의 부착, 하나 이상의 비-천연 아미노산에 대한 분자의 부착, 에피토프의 효소 변형 또는 말단의 변형에 의해 화학적으로 변형될 수 있다. 이러한 변형을 수행하기 위한 적합한 방법은 해당 분야에 주지되어 있다. 변형된 단백질, 단량체 또는 펩타이드의 돌연변이체는 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 예를 들어, 변형된 단백질, 단량체 또는 펩타이드의 돌연변이체는 염료 또는 형광단의 부착에 의해 화학적으로 변형될 수 있다.
폴리펩타이드 구성체
본 발명은 부분적으로, 2개 이상이 조합되어 올리고머 단백질을 형성할 때 유용하고, 일부 실시양태에서는 단량체로도 유용할 수 있는 다중-도메인 폴리펩타이드 구성체에 관한 것이다. 다중-도메인 폴리펩타이드는 일반적으로 자연에서 함께 존재하지 않는 도메인을 조합하도록 조작된다. 일부 실시양태에서, 3, 4, 5 또는 6개의 폴리펩타이드 구성체가 조합되어 올리고머를 형성한다. 일부 실시양태에서, 3개의 구성체가 조합되어 삼량체, 예를 들어 동종삼량체를 형성한다.
본원에 제공된 설명은 서브유닛 단량체의 올리고머성 코어를 기재한다. 서브유닛 단량체는 일반적으로 다중-도메인 폴리펩타이드 구성체의 구조 도메인이다. 이러한 구조 도메인의 올리고머화는 차례로 다가 단백질 스캐폴드의 코어를 형성할 수 있다.
따라서, 서브유닛 단량체의 특징에 대한 논의는 개별 폴리펩타이드 구성체의 구조 도메인의 개시 및 정의에도 적용된다.
유사하게, 폴리펩타이드 구성체의 제1 결합 도메인 및 제2 결합 도메인은 문맥에 따라 본원의 다른 곳에서 기재된 바와 같이 제1 결합 부위 및 제2 결합 부위를 형성할 수 있거나, 또는 본원의 다른 곳에서 기재된 바와 같이 제1 효과기 모이어티 및 제2 효과기 모이어티를 형성할 수 있다. 예를 들어, 결합 도메인이 이소펩타이드 결합-형성 "캐처" 도메인(또는 본원에 기재된 다른 결합 부위)인 경우, 이는 하기 다른 곳에 기재된 바와 같은 결합 부위이다. 결합 도메인이 예를 들어 항체, 항원-결합 단편, 항체 모방체, 단백질 또는 펩타이드 리간드, 단백질 또는 펩타이드 신호전달 분자(예를 들어 사이토카인), 생물학적 수용체 또는 본원에서 효과기 모이어티로 기재된 다른 분자인 경우, 결합 도메인은 본원의 다른 곳에 기재된 바와 같은 효과기 모이어티이다.
따라서, 제1 및 제2 결합 부위, 또는 제1 및 제2 효과기 모이어티의 정의 및 설명은 폴리펩타이드 구성체의 제1 결합 도메인 및 제2 결합 도메인에 적절하게 적용된다.
일부 실시양태에서, 폴리펩타이드 구성체는 N 말단에 제1 결합 도메인 및 C 말단에 제2 결합 도메인을 포함하며, 여기서 제1 결합 도메인과 제2 결합 도메인은 구조 도메인에 의해 분리된다. N 말단은 폴리펩타이드의 아미노 말단에 있는 말단 아미노산 잔기를 지칭한다. C 말단은 폴리펩타이드의 카복시 말단에 있는 말단 아미노산 잔기를 지칭한다. 전형적으로, 제1 결합 도메인 및 제2 결합 도메인은 표적 분자가 단일 세포에서 발현되거나 플레이트 또는 단일 비드에 고정화될 때 그들의 표적에 결합할 수 있다. 이는 때때로 "시스" 배향으로 제1 및 제2 결합 도메인을 제공하는 것으로 본원에서 기재된다. 전형적으로, 제1 결합 도메인 및 제2 결합 도메인은 단일 세포 표면의 세포 표적에 결합할 수 있고, 두 표적 모두 세포막에 클러스터링될 수 있다. 따라서 시스 배향은 일부 시스 작용제(즉, 단일 세포에 작용할 수 있음)에 우선적일 수 있다. 이중특이성 항체의 시스 배향은 역 "트랜스" 배향과 함께 문헌[Dickopf et al, Computational and Structural Biotechnology Journal, Volume 18, 2020, Pages 1221-1227]에 논의되어 있다.
기하학의 맥락에서, "시스-배향"은 "트랜스" 또는 "트랜스-배향"과 반대로 두 구성 요소가 평면의 "같은 면에"(라틴어에서) 있는 공간 배열을 나타내기 위해 본원에서 사용된다. 두 구성 요소가 "가로질러"(라틴어에서), 즉 평면의 서로 다른 면에 있는 기하학의 맥락에서 시스-트랜스-이성질화 현상과 유사하며 이전에 이중특이성 항체 구조를 설명하는 데 사용되었다. 이 기하학적 정의는 단일 이중특이성 분자가 단일 또는 인접한 세포(시스) 또는 별개의 세포 집단(트랜스)에 작용하는 생물학적 효과(예를 들어, 효과기 세포를 표적에 모집함)의 맥락에서 "시스-작용" 및 "트랜스-작용"과 별개이다. 상이한 포맷의 기하학적 구조를 탐색하려는 적극적인 관심과 노력이 있다(예를 들어, 문헌[Dengl et al Nat Commun. 2020; 11: 4974]을 참조하시오). "시스-배향"은 또한 특정 "트랜스-작용" 이중특이체에도, 예를 들어 분자간 거리를 감소시킴으로써 이로울 수 있다(문헌[Dickopf et al, Computational and Structural Biotechnology Journal, Volume 18, 2020, pp.1221-1227]). 시스-배향은 단일 세포에서 표적의 다가 결합 또는 클러스터링을 통한 시스-작용 이중특이체를 향한 다가 시스-배향에서 특히 흥미롭다(예를 들어 문헌[Veggiani et al Biochemistry January 19, 2016, 113 (5) 1202-1207]에 기재된 이중특이성 탠덤-융합, 또는 문헌[Khairil Anuar et al, Nature Communications volume 10, Article number: 1734 (2019)]의 보다 고차 단일특이성 클러스터링과 비교하여).
구조 도메인의 기능은 결합 도메인에 대해 정의된 구조적 지원을 제공하는 것이다. 유리하게는, 구조 도메인은 결합 도메인이 목적하는 배향을 가지도록 보장하여 전형적으로 두 결합 도메인 모두 시스 방향으로 표적과 결합할 수 있도록 할 수 있다. 따라서 구성체는 단일 결합 표면을 나타낼 수 있다.
특정 실시양태에서, 구조 도메인(올리고머성 코어) 상의 결합 도메인에 대한 부착 부위는 심지어 짧은 링커에 대해서도 결합을 허용한다.
구조 도메인은 정의된 2차 구조, 일반적으로 알파 나선 또는 베타 시트를 포함하는 임의의 폴리펩타이드 도메인일 수 있다. 일부 특히 유리한 실시양태에서, 구조 도메인은 동일한 공간 영역, 예를 들어 서로 실질적으로 인접하거나 또는 인접한 N 및 C 말단을 갖는다. 결합 도메인을 구조 도메인의 말단에 부착시키면 3차원 구조에서 실질적으로 인접한 2개의 결합 도메인이 제공된다. 일부 실시양태에서, N 및 C 말단은 실질적으로 동일한 방향을 향하도록 배향된다. 본원의 다른 곳에 기재된 바와 같이, 공간적으로 인접한 N 및 C 말단의 제공은 결합 도메인이 구성체의 동일한 면, 또는 다중 구성체를 포함하는 올리고머의 동일 면 상에 위치하게 할 수 있다. 따라서 구성체는 일반적으로 단일 결합 표면을 나타낸다. 구성체는 전형적으로 시스 배향의 결합 영역을 나타낸다.
구조 도메인은 단일 폴리펩타이드 쇄를 포함할 수 있거나, 결합하여 단일 구조 도메인을 형성하는 2개 이상의 별도의 폴리펩타이드 쇄, 예를 들어 결합하는 2개의 역평행(N-C C-N) 알파 나선, 또는 회합하여 베타 시트를 형성하는 2개 이상의 베타 가닥으로 형성될 수 있다. 일부 실시양태에서, 적절한 특징을 갖는 2개 이상의 폴리펩타이드 쇄가 식별되고, 이어서 전형적으로 단일 폴리펩타이드 쇄(즉, 융합 단백질)를 형성하기 위한 재조합 수단뿐만 아니라, 단일 공유 분자를 형성하기 위한 화학적 접합 또는 결합에 의해서 융합된다.
구조 도메인은 2개의 결합 도메인과 상이하다. 따라서 결합 도메인이 SpyCatcher, DogCatcher 또는 SnoopCatcher와 같은 캐처 폴리펩타이드인 경우, 구조 도메인은 캐처 폴리펩타이드가 아니다.
전형적으로, 구조 도메인은 CH2 도메인을 포함하지 않는다. 전형적으로 구조 도메인은 CH3 도메인을 포함하지 않는다. 일부 실시양태에서, 구조 도메인은 CH2 도메인을 포함하지 않고 CH3 도메인도 포함하지 않는다.
하기 및 실시예에서 논의되는 바와 같이, 복수의 예시적인 구조 도메인이 본 발명자들에 의해 식별되었다. 일부 실시양태에서, 구조 도메인은 콜라겐 X NC1 도메인(서열번호 2), 또는 이에 대해 적어도 50%, 적어도 60%, 적어도 70% 또는 적어도 80%, 예를 들어 적어도 90% 또는 적어도 95% 동일성을 갖는 폴리펩타이드를 포함하거나 이들로 이루어진다. 일부 실시양태에서, 구조 도메인은 콜라겐 VIII NC1 도메인(서열번호 3), 또는 이에 대해 적어도 50%, 적어도 60%, 적어도 70% 또는 적어도 80%, 예를 들어 적어도 90% 또는 적어도 95% 동일성을 갖는 폴리펩타이드를 포함하거나 이들로 이루어진다. 일부 실시양태에서, 구조 도메인은 CutA1 폴리펩타이드(예를 들어 서열번호 1 또는 서열번호 19), 또는 이에 대해 적어도 50%, 적어도 60%, 적어도 70% 또는 적어도 80%, 예를 들어 적어도 90% 또는 적어도 95% 동일성을 갖는 폴리펩타이드를 포함하거나 이들로 이루어진다.
특정 실시양태에서, 구조 요소는 서열번호 1, 서열번호 2, 서열번호 3, 서열번호 19, 서열번호 29, 서열번호 60, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 42, 서열번호 31, 또는 서열번호 58에 대해 적어도 50% 아미노산 동일성, 예를 들어 적어도 90% 동일성을 갖는 폴리펩타이드를 포함하거나 이들로 이루어진다.
콜라겐 IV C4 도메인(콜라겐 IV NC1 도메인으로도 공지됨)(PDB ID: 1m3d, 서열번호 49)은 적합한 구조 도메인이거나, 또는 이에 대해 적어도 50%, 적어도 60%, 적어도 70% 또는 적어도 80%, 예를 들어 적어도 90% 또는 적어도 95% 동일성을 갖는 폴리펩타이드이다.
콜라겐 NC1 도메인은 일반적으로 콜라겐 IV, 콜라겐 VIII 및 콜라겐 X로부터의 NC1 도메인을 포함하여, 본 발명에 따른 구조 도메인으로 사용될 수 있다.
그러나, 모든 콜라겐 NC1 도메인이 구조 도메인으로 적합한 것은 아니다. 특히 콜라겐 XV 및 콜라겐 XVIII의 NC1 도메인은 요구되는 배향을 갖지 않는다.
특정 실시양태에서, 구조 도메인은 인간 대식세포 이동 억제 인자(MIF)(PDB ID: 1CA7, 또는 서열번호 25, 또는 Y99G 돌연변이 PDB ID: 6OY8) 또는 인간 대식세포 이동 억제 인자 2(MIF2)(PDB ID: 7MSE, 또는 서열번호 26, 또는 S62A 및 F99A 돌연변이 서열번호 27) 또는 이의 상동체 또는 동종간 상동체를 포함한다.
특정 실시양태에서, 구조 도메인은 TNF(PDB ID: 1TNF, 서열번호 42), TL1A(PDB ID: 2re9, 서열번호 31) 또는 CD40L(PDB ID: 3lkj, 서열번호 58)을 포함하는 TNF 패밀리 단백질을 포함한다.
구조 도메인의 추가 예에는 적합하게 변형된 역평행 이중나선 육량체(PDB ID: 5W0J, 실시예 4 참조, 서열번호 43), HIV-1 GP41 코어(PDB ID: 1I5Y 또는 서열번호 44), 시토크롬 c555(PDB ID: 5Z25 또는 서열번호 45), MHC 부류 II 관련된 샤페로닌 및 표적화 단백질 불변 쇄(Ii)(PDB ID: 1iie 또는 서열번호 46), p53(PDB ID: 1C26 또는 서열번호 47); 피브리노겐 유사 도메인(PDB ID: 4M7F 또는 서열번호 48), 바실러스 서브틸리스 AbrB(PDB ID: 1YFB 또는 서열번호 50), 박테리오파지 람다 헤드 단백질 D(예를 들어, PDB ID: 1C5E 또는 PDB ID: 1C5E 또는 서열번호 51); HCRBPII의 도메인-교환 삼량체 변이체(PDB ID: 6VIS 또는 서열번호 52); T1L 레오바이러스 부착 단백질 시그마1(PDB ID: 4ODB의 쇄 A,B,C 또는 서열번호 53)이 포함된다.
본 발명에 따른 폴리펩타이드 구성체는 구조 도메인에 더하여 제1 결합 도메인 및 제2 결합 도메인을 포함한다.
특정 실시양태에서, 결합 도메인은 동족 펩타이드, 예를 들어 당업계에 주지된 다양한 캐처 도메인과 이소펩타이드 연결을 형성할 수 있다. 이러한 이소펩타이드 결합 형성 도메인을 포함하는 구성체는 항원-결합 단백질과 같은 다양한 쌍의 효과기 분자를 스크리닝하는데 특히 적합하다. 본원의 다른 곳에서 논의된 바와 같이, 효과기 분자의 많은 조합은 이소펩타이드 형성 펩타이드 태그를 통해 이소펩타이드 결합 형성 결합 도메인을 포함하는 구성체에 연결될 수 있다. 따라서, 동족 펩타이드와 이소펩타이드 연결을 형성할 수 있는 결합 도메인을 포함하는 구성체는 약물 발견 플랫폼으로서 특히 유용하다.
이소펩타이드 결합 형성에 관한 본 발명의 양태는 일반적으로 구조 도메인에 부착된 더 큰 분자(도메인)(일반적으로 캐처라고 함), 및 관심 결합 영역(예를 들어, 항원-결합 도메인)의 일부를 형성하는 더 작은 폴리펩타이드 또는 펩타이드(일반적으로 태그라고 함)를 참조하여 예시된다. 그러나 모든 양태와 실시양태는 더 큰(예를 들어 캐처) 분자가 관심 결합 영역(예를 들어 항원-결합 도메인)의 일부를 형성하고 더 작은 태그 펩타이드가 구조 도메인에 부착된 결합 도메인을 형성하는 역배향으로 수행될 수 있다.
일부 실시양태에서, 폴리펩타이드 구성체 내의 제1 결합 도메인 및 제2 결합 도메인은 항원-결합 도메인과 같은 효과기 분자이다. 이들 실시양태에서, 구성체는 진단제, 분석제 또는 치료제로서 사용하기에 특히 적합하다.
일부 실시양태에서, 흥미롭거나 유효한 항원-결합 영역 쌍은 본 발명의 약물 발견 플랫폼을 사용하여 식별되고(예를 들어, 구성체는 이소펩타이드 결합 형성 결합 도메인을 포함함), 이어서 구성체는 이소펩타이드 결합-형성 결합 영역 없이, 및 구조 도메인 상의 중간 캐처 도메인 없이 및 항원-결합 도메인 상의 펩타이드 태그 없이 구조 도메인에 직접 연결된 항원-결합 도메인(또는 다른 효과기 모이어티)의 식별된 조합과 함께 발현된다. 의심을 피하기 위해, 이들 직접 융합 구성체는 본원의 다른 곳에서 상세히 기재된 바와 같이 구조 도메인의 말단 잔기와 각 효과기 부분(예를 들어 항원-결합 영역)의 말단 잔기 사이의 링커 영역을 여전히 포함할 수 있다.
따라서, 본 발명의 한 양태는 태그된 효과기 단백질의 조합 쌍을 사용하여 효과기 분자의 많은 가능한 조합의 대규모-고처리량 스크리닝을 위한 시스템을 제공하며, 유용한 것으로 식별된 조합은, 약물 발견 플랫폼에서 사용된 것과 동일한 구조 도메인상에 효과기 분자(예를 들어, 항원-결합 영역)의 직접-융합을 생성시킴으로써 스크리닝 구성체에 제공되거나 더 간단한 포맷(예를 들어, 치료제 후보의 경우)으로 전환된 형태로 사용될 수 있다. 이는 이중특이성 및 다중특이성 작용제를 식별하고 개발하기 위한 간단하고 빠르며 신뢰할 수 있는 기술을 제공한다.
항원-결합 도메인은 본 발명에 따라 사용되고 적용될 수 있는 전형적인 도메인이다. 본 발명의 특정 양태에서, 항원-결합 도메인은 이소펩타이드 결합, 예를 들어 SpyTag 또는 SnoopTag를 형성할 수 있는 펩타이드 태그를 포함하고, 이소펩타이드 결합에 의해 동족 캐처 도메인을 포함하는 구성체에 결합되어, 예를 들어 조합형 또는 모듈형 스크린을 위한 플랫폼을 생성시킨다. 본 발명의 다른 양태에서, 본 발명의 구성체는 N 말단에 제1 항원-결합 도메인 및 C 말단에 제2 항원-결합 도메인을 포함하며, 여기서 제1 결합 도메인과 제2 결합 도메인은 구조 도메인에 의해 분리된다. 항원-결합 도메인 중 하나 또는 각각과 구조 도메인 사이에 링커 서열이 임의로 존재할 수 있다. 하기에 논의된 바와 같이, 결합 도메인(결합 부위)을 구조 도메인(단량체 서브유닛)에 연결하는데 사용하기에 적합한 펩타이드 링커는 전형적으로 1 내지 100, 1 내지 50, 1 내지 25, 1 내지 20, 1 내지 15, 또는 1 내지 10 아미노산 길이이다. 링커 서열의 예는 GSGS, GGGGS, GGGGSGGGGS 또는 GGGGSGGGGSGGGGS이다.
항원-결합 도메인은 전형적으로 항체의 항원-결합 단편이다. 항원-결합 항체 단편은 전장의 온전한 항체가 아니며, 전형적으로 적어도 CH2 및/또는 CH3 도메인이 결여되어 있다. 이러한 항원-결합 단편은 주지되어 있으며 Fab, F(ab')2, Fv 또는 단쇄 Fv 단편(scFv)을 포함한다. 항원 결합 단편은 전형적으로 항원 결합에 필요한 CDR(일반적으로 6개의 CDR)과 올바른 CDR 구조에 필요한 프레임워크 잔기를 포함한다. 일부 실시양태에서, 항원-결합 도메인은 중(H) 쇄 가변 도메인 서열(VH) 및 경(L) 쇄 가변 도메인 서열(VL)을 포함한다.
일부 실시양태에서, 항원-결합 영역은 단일 도메인 항체일 수 있다. 단일 도메인 항체(sdAb)는 상보적 결정 영역이 단일 도메인 폴리펩타이드의 일부인 항체를 포함할 수 있다. 예에는 중쇄 항체, 자연적으로 경쇄가 결여된 항체, 통상적인 4-쇄 항체로부터 유래된 단일 도메인 항체, 조작된 항체, 및 항체로부터 유래된 것 이외의 단일 도메인 스캐폴드가 포함되나 이에 제한되지는 않는다. 단일 도메인 항체는 당해 분야의 임의의 것이거나, 임의의 추후 단일 도메인 항체일 수도 있다. 단일 도메인 항체는 마우스, 인간, 낙타, 라마, 어류, 상어, 염소, 토끼 및 소를 포함하나 이에 제한되지 않는 종으로부터 유래될 수 있다. 단일 도메인 항체는 경쇄가 없는 중쇄 항체로 알려진 자연 발생 단일 도메인 항체일 수 있다. 이러한 단일 도메인 항체는 예를 들어 WO-A-94/04678에 개시되어 있다. 명확성을 위해, 자연적으로 경쇄가 없는 중쇄 항체로부터 유래된 이 가변 도메인은 4쇄 면역글로불린의 통상적인 VH와 구별하기 위해 때때로 VHH 또는 나노바디로 지칭된다. 이러한 VHH 분자는 낙타과 종, 예를 들어 낙타, 라마, 단봉낙타, 알파카 및 구아나코에서 생성된 항체로부터 유래될 수 있다. 낙타과 이외의 다른 종이 자연적으로 경쇄가 없는 중쇄 항체를 생산할 수 있으며; 이러한 VHH는 본 발명의 범위 내에 있다.
항원-결합 도메인은 또한 어피바디(affibody) 또는 DARPin과 같은 항체 모방체를 포함하거나 이들로 이루어질 수 있다. 어피바디는 당업계에 공지된 바와 같이, 전형적으로 약 58개의 아미노산을 갖고 약 6 kDa의 분자 질량을 갖는 3개의 알파 나선을 함유하는 작은 폴리펩타이드이다. 당업계에 공지된 바와 같이, DARPIN(설계된 안키린 반복 단백질)은 전형적으로 고도로 특이적이고 고-친화도 표적 단백질 결합을 나타내는 유전적으로 조작된 항체 모방 단백질이다.
결합 도메인은 항원-결합 도메인에 대한 대안으로서 사이토카인과 같은 자연 발생 리간드를 포함할 수 있다.
2개의 상이한 항원-결합 도메인이 이중특이성 분자에 존재하는 경우, 이들은 일반적으로 서로 다른 에피토프에 결합한다. 이는 동일한 표적 분자의 다른 에피토프일 수도 있고, 다른 표적 분자의 다른 에피토프일 수도 있다. 일부 실시양태에서, 에피토프는 둘 다 치료 표적상에 있고, 치료 표적에 대한 항원-결합 도메인의 결합은 치료 이익을 위해 생물학적 기전, 전형적으로 병리학적 기전을 변형시킨다.
일부 실시양태에서, 항원-결합 도메인은 각각 생물학적 표적에 작용할 수 있다. 일부 실시양태에서, 항원-결합 도메인은 각각 생물학적 표적을 길항할 수 있다. 일부 실시양태에서, 하나의 항원-결합 도메인은 제1 표적에 작용할 수 있고, 다른 항원-결합 도메인은 제2 표적을 길항할 수 있다.
일부 실시양태에서, 구성체는 동일한 에피토프에 결합하지만 해당 에피토프에 대해 서로 다른 친화성을 갖는 2개의 결합 영역을 포함할 수 있다. 일부 실시양태에서, 구성체는 임의로 상이한 친화도로, 동일한 에피토프에 결합하는 2개의 결합 영역을 포함할 수 있으며, 2개의 결합 영역은 상이한 포맷을 갖는다. 예를 들어 하나의 항원-결합 영역은 scFv이고 두 번째는 Fab이다.
본 발명의 다중-도메인 폴리펩타이드 구성체는 전형적으로 통상의 규약에 따라 N에서 C 배향으로 묘사된 하기의 포맷을 갖는다:
(결합 도메인 1)-링커1-구조 도메인-링커2-(결합 도메인 2)
여기서 링커1 및 링커2는 임의로 1 내지 20개 아미노산의 임의의 링커 서열, 예를 들어 GSGS이다. 임의의 정제 태그, 예를 들어 His 태그, 예를 들어 6xHis를 구성체의 양쪽 끝에 통합시킬 수 있다.
결합 도메인은 동일할 수도 있으며 전형적으로 상이하다. 결합 도메인은 전형적으로 캐처 폴리펩타이드, 또는 항원-결합 도메인일 수 있다. 복수의 예시적인 구성체가 하기에 제공된다:
SpC-링커1-CutA1-링커2-SpC,
SnC-링커1-CutA1-링커2-SnC,
SnC-링커1-CutA1-링커2-SpC,
SpC-링커1-CutA1-링커2-SnC,
SpC3-링커1-CutA1-링커2-DgC,
scFv-링커1-CutA1-링커2-ScFv,
Fab-링커1-CutA1-링커2-Fab,
ScFv-링커1-CutA1-링커2-Fab,
Fab-링커1-CutA1-링커2-ScFv,
나노바디1-링커1-CutA1-링커2-나노바디2,
나노바디-링커1-CutA1-링커2-DgC,
SpC3-링커1-CutA1-링커2-나노바디
(여기서 SpC는 SpyCatcher이고, SpC3은 SpyCatcher003이고, SnC는 SnoopCatcher이고, Fab는 항체 "단편 항원 결합"이고 scFv는 단쇄 Fv임)
각각의 경우에, 링커1 및 링커2 링커는 임의적이다. CutA1 서열은 인간이거나 파이로코커스 호리코시이로부터 유래하거나, 또는 또 다른 종으로부터의 상동체일 수 있거나, 또는 인간 또는 파이로코커스 호리코시이 서열에 대해 적어도 30%, 적어도 50%, 적어도 70% 또는 적어도 90% 동일성을 가질 수 있다.
추가의 예시적인 구성체는 하기와 같다:
SpC-링커1-NC1-링커2-SpC,
SnC-링커1-NC1-링커2-SnC,
SnC-링커1-NC1-링커2-SpC,
SpC-링커1-NC1-링커2-SnC,
scFv-링커1-NC1-링커2-ScFv,
Fab-링커1-NC1-링커2-Fab,
ScFv-링커1-NC1-링커2-Fab,
Fab-링커1-NC1-링커2-ScFv,
나노바디1-링커1-NC1-링커2-나노바디2,
나노바디-링커1-NC1-링커2-DgC,
SpC3-링커1-NC1-링커2-나노바디
(여기서 NC1은 콜라겐 VIII 또는 콜라겐 X로부터의 콜라겐 NC1 도메인이다. 각각의 경우에, 링커1 및 링커2 링커는 임의적임).
추가의 예시적인 구성체는 하기를 포함하여, 구조 도메인으로서 대식세포 이동 억제 인자(MIF)(서열번호 25) 또는 대식세포 이동 억제 인자 2(MIF2)(서열번호 26) 또는 MIF2의 S62A F99A 돌연변이체(MIF2m, 서열번호 27)를 포함한다:
SpC-링커1-MIF2-링커2-SpC,
SnC-링커1-MIF2-링커2-SnC,
SnC-링커1-MIF2-링커2-SpC,
SpC-링커1-MIF2-링커2-SnC,
scFv- 링커1-MIF2-링커2-ScFv,
Fab- 링커1-MIF2-링커2-Fab,
ScFv-링커1-MIF2-링커2-Fab,
Fab- 링커1-MIF2-링커2-ScFv,
나노바디1- 링커1-MIF2-링커2-나노바디2,
나노바디-링커1-MIF2-링커2-DgC,
SpC3-링커1-MIF2-링커2-나노바디.
임의의 적합한 구조 도메인, 특히 본원에 기재된 임의의 구조 도메인은 상기에 제공된 예시적인 구조 도메인 대신 이들 구성체에서 사용될 수 있다. 따라서, 이들 예시적인 포맷은 일반적으로 구조 도메인 및 본원에 기재된 구조 도메인과 함께 사용하기 위해 기재된다.
다중-도메인 구성체에서 단량체 또는 올리고머 형태의 결합 도메인의 배향은 다양한 분석을 사용하여 기능적으로 평가될 수 있다. 예시적인 분석의 선택이 하기에 기재되어 있다.
FRET: 비-시스 배향 단백질과 비교하여 선택된 스캐폴드의 시스 배향을 입증하기 위해서, FRET 분석을 수행할 수 있다. Catcher 성분, 예를 들어 SpC3-HsCutA1-DgC가 있는 스캐폴드 폴리펩타이드를 각각의 태그 쌍, 예를 들어 mCherry(6+)-SpT3-H6 및 H6-DgT-mCitrine(4-)에 융합된 형광 단백질 FRET 쌍에 접합시킬 수 있다. 태그된 FRET 쌍이 스캐폴드 단백질에 접합시, 수용자 FRET 단백질의 방출을 표준 형광 판독을 통해 측정하고 공여자 FRET 단백질의 감작된 방출과 비교할 수 있다. 우선적인 시스-배향을 나타내는 단백질 스캐폴드는 더 높은 수용자 방출을 나타낼 것인 반면, 우선적인 트랜스-배향을 나타내는 단백질 스캐폴드는 더 높은 공여자 감작된 방출을 나타낼 것이다.
SPR: 적합한 리간드에 접합된 시스-배향된 스캐폴드가 비-시스-배향된 단백질에 비해 동일한 평면의 표적에 우선적으로 결합할 수 있음을 입증하기 위해서, SPR 실험을 수행할 수 있다. 스캐폴드-접합된 리간드에 대한 표적 단백질, 예를 들어 SpC-PhCutA1-SnC: SnT-L1: L2-SpT의 L1 및 L2에 대한 표적을 SPR 센서 칩의 표면에 함께, 또는 대조를 위해 L1-표적 단독 또는 L2-표적 단독으로서 별도로 고정화시킬 수 있다. 이어서, L1 및 L2에 접합된 시스-배향된 또는 비-시스-배향된 스캐폴드를 L1- 및/또는 L2-표적과 함께 SPR 센서 칩에 로딩하고, 상기 칩상에 고정화된 표적에의 상기 접합된 조립체의 결합을 결정한다. 시스-배향된 조립체는 두 표적이 모두 동일한 칩에 고정화되어 있을 때 L1- 및 L2-표적 모두에 대해 매우 측정 가능한 결합을 보여줄 것으로 예상되는 반면, 비-시스-배향된 조립체는 이러한 칩에 대해 그다지 측정 가능한 결합이 없을 것으로 예상된다. 두 조립체 유형 모두 고정화된 L1- 또는 L2-표적 단독에 고도로 측정 가능한 결합을 가질 것으로 예상된다.
SEC-MALS: 용액 중 스캐폴드 및 조립 단백질의 고유 올리고머 상태를 입증하기 위해서, SEC-MALS 실험을 수행할 수 있다. 스캐폴드 및 조립체 단백질을 방법 섹션에 설명된 대로 제조할 수 있다. 이어서 샘플을 MALS 기계 및 검출기에 연결된 FPLC 기계에 주입하여 샘플을 크기별로 분리하고 광산란 계산을 통해 고유 단백질 질량을 근사화한다. 이어서 단백질의 올리고머 상태를 ProtParam과 같은 소프트웨어를 통해 계산된 예측된 단량체 질량으로 고유 단백질 질량을 나누어 유도할 수 있다. 예를 들어 SpC-PhCutA1-SnC 및 SpC-PhCutA1-SnC:SnT-L1:L2-SpT와 같은 스캐폴드 및 조립체 단백질은 모두 3의 올리고머 상태를 나타낼 것으로 예상된다.
가교결합 및 LC-MS/MS: 시스-배향된 접합된 조립체에 의한 2개 표적, 예를 들어 L1 및 L2에 대한 표적의 동시 결합을 입증하기 위해서, 표적-발현 세포를 접합 조립체의 비오틴화된 버전인 비오틴-SpC-PhCutA1-SnC:SnT-L1:L2-SpT와 배양할 수 있으며, 후속적으로 표적과 비오틴화된-조립체간의 결합을 BS3(비스(설포숙신이미딜)수베레이트)와 가교결합시킨 다음, 세포 용해시키고, 스트렙트아비딘을 통해 상기 가교결합된 표적-조립체 복합체를 추출할 수 있다. 이어서 이 복합체를 트립신-절단하여 LC-MS/MS에 공급하여 L1 및 L2의 이들 각각의 표적에의 결합을 확인한다. 동일한 방법론을 비-시스-배향된 조립체에 대해 실행할 수 있으며, 이를 통해 LC-MS/MS 데이터의 출력을 두 단백질 조립체 간에 비교할 수 있다. 시스-배향된 조립체는 L1- 및 L2-표적 모두에 우선적으로 결합할 수 있는 반면, 비-시스-배향된 조립체는 L1- 또는 L2-표적 단독에만 우선적으로 결합할 수 있다.
다가 단백질 스캐폴드
본 발명의 한 양태는 표적 분자를 스크리닝하기 위한 모듈형 시스템에 관한 것이다. 이 시스템은 표적 분자의 다가 제시를 허용한다. 하나의 양태에서, 다가 단백질 스캐폴드가 제공된다. 다가 단백질 스캐폴드는 복수의 서브유닛 단량체를 포함하는 올리고머성 코어를 포함한다. 다가 단백질 스캐폴드는 또한 적어도 하나의 제2 결합 부위에 직교하는 적어도 하나의 제1 결합 부위를 포함한다. 적합한 결합 부위는 본원에 더 자세히 기재되어 있다.
스캐폴드는 다른 분자가 결합될 수 있는 플랫폼 역할을 한다. 다양한 분자 조합이 모듈 방식으로 스캐폴드에 결합될 수 있다. 스캐폴드는 분자의 다가 결합을 허용한다. 일반적으로, 스캐폴드에 결합된 분자는 잠재적인 치료 이점을 가지며, 분자에 결합된 스캐폴드는 다양한 분자의 다가 조립체가 목적하는 효과를 가질 수 있는지 여부를 조사하는 데 사용될 수 있다. 예를 들어, 잠재적인 항암 폴리펩타이드의 다양한 조합을 스캐폴드에 부착시킬 수 있고, 이어서 생성된 조립체를, 예를 들어 상기 조합이 암 세포에 결합하여 사망을 유발하는 지에 대해 효과가 있는지 확인하기 위한 스크리닝 분석에 사용할 수 있다. 분자의 조합이 식별되었으면, 모듈 시스템을 사용하는 대신 다가 단백질 스캐폴드를 식별된 분자에 직접 부착되도록 변형시켜 치료 약물 후보를 생성시킬 수 있다. 다가 단백질 스캐폴드는 스캐폴드의 동일 면 상에 분자를 '제시'하여 모든 분자가 잠재적으로 표적 세포와 상호작용할 수 있게 한다.
제공된 스캐폴드는 전형적으로 적어도 2개의 제1 결합 부위 및 적어도 2개의 제2 결합 부위를 포함한다. 적어도 2개의 제1 결합 부위 및 적어도 2개의 제2 결합 부위의 존재는 스캐폴드를 사용하여 다가 상호작용을 스크리닝할 수 있게 하는데, 이는 예를 들어 이중특이성 항체 포맷을 사용하여 스크리닝하는 경우에는 반드시 볼 수 없을 수도 있는 것이다. 또한 이는 동일한 조합에 대해 "도구상자"로서 상이한 스캐폴드를 시험하게 할 수 있게 한다.
따라서, 본원에서는,
- 복수의 서브유닛 단량체를 포함하는 올리고머성 코어; 및
- 적어도 2개의 제2 결합 부위에 직교하는 적어도 2개의 제1 결합 부위
를 포함하는 다가 단백질 스캐폴드가 제공되며; 여기서 상기 제1 결합 부위 및 상기 제2 결합 부위는 스캐폴드의 동일 면 상에 위치한다.
제공된 스캐폴드는 전형적으로 각각의 표적에 대해 공유 결합을 형성할 수 있는 결합 부위를 포함한다. 공유 결합은 강력한 비가역적 결합으로 이어진다. 본 발명의 스캐폴드를 결합 부위의 표적에 공유결합적으로 부착시킴으로써 생성된 복합체는 물리적으로 견고하며 쉽게 생산될 수 있다. 이러한 복합체는 높은 수율과 높은 균일성으로 생산될 수 있다. 따라서, 이러한 복합체가 본원에 기재된 바와 같은 생물학적 시스템, 예를 들어 피험자에게 투여될 때 생성되는 생물학적 반응은 재현 가능하고 제어 가능하다.
따라서, 또한 본원에서는,
- 복수의 서브유닛 단량체를 포함하는 올리고머성 코어;
- 적어도 하나의 제2 결합 부위에 직교하는 적어도 하나의 제1 결합 부위
를 포함하는 다가 단백질 스캐폴드가 제공되며; 여기서 제1 결합 부위(들) 및 상기 제2 결합 부위(들)는 스캐폴드의 동일 면 상에 위치하고; 상기 제1 결합 부위는 제1 폴리펩타이드 표적에 공유 결합을 형성할 수 있는 제1 단백질 도메인을 포함하며; 상기 제2 결합 부위는 제2 폴리펩타이드 표적에 공유 결합을 형성할 수 있는 제2 단백질 도메인을 포함한다.
본원에 설명된 바와 같이, 본원에 제공된 스캐폴드는 이중특이성 항체를 포함하는 기존 항체에 비해 상당한 이점을 갖는다. 제공된 스캐폴드의 올리고머성 코어는 일반적으로 항체의 Fc 영역을 포함하지 않는다. 일부 실시양태에서, 올리고머성 코어는 CH2 영역을 포함하지 않는다. 일부 실시양태에서, 올리고머성 코어는 CH3 영역을 포함하지 않는다. 일부 실시양태에서, 올리고머성 코어는 CH2 영역 및 CH3 영역을 포함하지 않는다. 항체의 면역글로불린 도메인, 전형적으로 Fc 영역에서와 같은 불변 도메인의 사용은 일반적으로 본원에 기재된 제공된 스캐폴드의 이점을 나타내지 않을 수 있다. 예를 들어, 이중특이성 항체는 본 발명의 모듈성이 결여되어 있으며 다가 상호작용을 조사하는 데 유용하지 않을 수도 있다.
따라서, 또한 본원에서는,
- 복수의 서브유닛 단량체를 포함하는 올리고머성 코어;
- 적어도 하나의 제2 결합 부위에 직교하는 적어도 하나의 제1 결합 부위
를 포함하는 다가 단백질 스캐폴드가 제공되며, 여기서 상기 제1 결합 부위(들) 및 상기 제2 결합 부위(들)는 스캐폴드의 동일 면 상에 위치하고; 상기 올리고머성 코어는 항체의 Fc 영역을 포함하지 않는다.
또한, 본원에서는,
- 복수의 서브유닛 단량체를 포함하는 올리고머성 코어;
- 적어도 하나의 제2 결합 부위에 직교하는 적어도 하나의 제1 결합 부위
를 포함하는 다가 단백질 스캐폴드가 제공되며, 여기서 상기 제1 결합 부위(들) 및 상기 제2 결합 부위(들)는 스캐폴드의 동일 면 상에 위치하고; 상기 올리고머성 코어는 항체의 CH2 도메인을 포함하지 않거나, 항체의 CH3 도메인을 포함하지 않거나, CH2 도메인을 포함하지 않고 CH3 도메인을 포함하지 않는다.
다가 단백질 스캐폴드는 올리고머성 코어와 적어도 하나의 제1 결합 부위 및 적어도 하나의 제2 결합 부위를 포함한다. 다가 단백질 스캐폴드는 또한 본원에 더욱 상세히 기재된 바와 같은 다른 특징, 예를 들어 링커, 도메인 삽입 및/또는 작용기를 포함할 수 있다.
바람직하게, 다가 단백질 스캐폴드의 직경은 약 100 ㎚ 미만, 예를 들어 약 50 ㎚ 미만, 예를 들어 약 25 ㎚ 미만, 예를 들어 약 10 ㎚ 미만이다. 바람직하게는, 다가 단백질 스캐폴드의 높이는 약 100 ㎚ 미만, 예를 들어 약 50 ㎚ 미만, 예를 들어 약 30 ㎚ 미만, 예를 들어 약 20 ㎚ 미만, 예를 들어 약 10 ㎚ 미만이다. 다가 단백질 스캐폴드는 바람직하게는 크기가 1 내지 500 Å, 예를 들어 2 내지 250 Å, 예를 들어 약 10 내지 약 100 Å, 예를 들어 약 20 내지 약 80 Å이다.
바람직하게는, 다가 단백질 스캐폴드 자체는 바람직하게는 본질적으로 생물학적 시스템, 세포 배양물 또는 인간 피험자와 같은 피험자에서 면역 반응을 유도하지 않는다. 즉, 전형적으로 올리고머성 코어상의 결합 부위 및/또는 단백질 스캐폴드의 결합 부위에 부착된 효과기 모이어티에 결합 부위가 없으면, 상기 단백질 스캐폴드가 인간 피험자와 같은 생물학적 시스템에 투여될 때 면역 반응을 유도하지 않는다(또는 본질적으로 면역 반응이 없다; 예를 들어 면역 반응이 비-면역원성 단백질을 투여하는 경우보다 크지 않다). 예를 들어, 생물학적 시스템(예를 들어, 본원에 정의된 바와 같은 피험자)에 대한 단백질 스캐폴드(다가 단백질 스캐폴드상의 결합 부위 및/또는 다가 단백질 스캐폴드의 결합 부위에 부착된 효과기 모이어티의 부재)의 투여는 전형적으로 생물학적 시스템의 선천 또는 적응 면역을 유도하지 않는다. 예를 들어, 단백질 스캐폴드는 전형적으로 보체 시스템, B 세포, T 세포, 자연 살해 세포, 비만 세포, 호염기구, 호산구, 호중구, 수지상 세포 또는 대식세포의 활성화를 유도하지 않는다.
다가 단백질 스캐폴드는 바람직하게는 항체 또는 항체 단편을 포함하지 않지만; 본원에 추가로 기재된 바와 같이 항체 및/또는 항체 단편을 효과기 모이어티로서 스캐폴드에 부착시킬 수 있다. 다가 단백질 스캐폴드(예를 들어 임의의 효과기 모이어티가 없음)는 더욱 바람직하게는 항체의 Fc 영역을 포함하지 않는다. Fc 영역은 Fc 수용체라고 불리는 세포 표면 수용체 및 보체 시스템의 일부 단백질과 상호작용하는 항체의 꼬리 영역이다. 일부 경우에, 다가 단백질 스캐폴드는 면역글로불린 불변 영역을 포함하지 않는다. 일부 실시양태에서, 다가 단백질 스캐폴드는 CH2 도메인을 포함하지 않는다. 일부 실시양태에서, 다가 단백질 스캐폴드는 CH3 도메인을 포함하지 않는다. 일부 실시양태에서, 다가 단백질 스캐폴드는 CH2 도메인 및 CH3 도메인을 포함하지 않는다.
바람직하게는 다가 단백질 스캐폴드는 열역학적으로 안정하다. 바람직하게 다가 단백질 스캐폴드는 약 0 내지 약 100℃, 예를 들어 약 4℃ 내지 약 90℃, 예를 들어 약 10℃ 내지 약 50℃, 예를 들어 약 20 내지 약 38℃, 예를 들어 약 25℃ 내지 약 37℃의 온도에서 안정하다. 달리 말하면, 바람직하게 다가 단백질 스캐폴드는 그의 치환체 서브유닛 단량체로 해리되지 않고/않거나, 결합 부위는 약 0 내지 약 100℃(예를 들어, 약 4℃ 내지 약 90℃, 예를 들어 약 10℃ 내지 약 50℃, 예를 들어 약 20 내지 약 38℃, 예를 들어 약 25 내지 약 37℃)의 온도에서 수용액에 있을 때 올리고머성 코어로부터 해리되지 않는다; 예를 들어, 다가 단백질 스캐폴드의 적어도 90%, 예를 들어 적어도 95%, 예를 들어 적어도 99%, 적어도 99.9%, 예를 들어 적어도 99.99% 또는 99.999%는 그의 치환 서브유닛 단량체로 해리되지 않고/않거나, 결합 부위는 이러한 온도의 수용액에 있을 때 올리고머성 코어로부터 해리되지 않는다. 더욱 바람직하게 다가 단백질 스캐폴드는 약 0℃ 내지 약 100℃, 예를 들어 약 4℃ 내지 약 90℃, 예를 들어 약 10℃ 내지 약 50℃, 예를 들어 약 20℃ 내지 약 38℃, 예를 들어 약 25 내지 약 37℃의 온도에서 안정하다. 다가 단백질 스캐폴드는 약 0℃ 내지 약 100℃, 예를 들어 약 4℃ 내지 약 90℃, 예를 들어 약 10℃ 내지 약 50℃, 예를 들어 약 20 내지 약 38℃, 예를 들어 약 25℃ 약 37℃의 온도에서 결정될 때 바람직하게는 적어도 10분, 보다 바람직하게는 적어도 1시간, 예를 들어 적어도 하루, 예를 들어 적어도 1주일, 예를 들어 적어도 1개월 또는 적어도 1년의 수명을 갖는다.
바람직하게, 다가 단백질 스캐폴드의 구성성분 사이의 상호작용은 약한 일시적 상호작용이 아니다. 약한 일시적 복합체는 생체내에서 상이한 올리고머 상태의 동적 혼합물을 보이는 반면, 강한 일시적 복합체는 예를 들어 리간드 결합에 의해 촉발될 때만 그의 4차 상태를 변화시킨다. 약한 일시적 상호작용은 마이크로몰 범위의 해리 상수(KD)와 수 초의 수명을 특징으로 한다. 효과기 분자의 결합에 의해 안정화된 강력한 일시적 상호작용은 수명이 더 길고 나노몰 범위에서 더 낮은 KD를 가질 수 있다. 다가 단백질 스캐폴드의 구성성분은 바람직하게는 적어도 강한 일시적 반응과 상호작용하고, 더욱 바람직하게는 다가 단백질 스캐폴드의 구성성분은 영구적인 상호작용을 형성한다. 영구적인 상호작용은 다가 단백질 스캐폴드가 통상적인 조건(예를 들어, 20℃ 내지 40℃, 및 pH 6 내지 pH 8)에서 그의 구성성분으로 해리되지 않음을 의미한다. 구성부분이 영구적인 상호 작용을 형성하는 다가 단백질 스캐폴드는, 전형적으로 서브유닛 단량체 자체의 3차 구조를 변성시키는 변성 조건 하에서만 해리된다.
따라서 바람직하게, 다가 단백질 스캐폴드의 구성성분은 약 0℃ 내지 약 100℃, 예를 들어 약 4℃ 내지 약 90℃, 예를 들어 약 10℃ 내지 약 50℃, 예를 들어 약 20 내지 약 38℃, 예를 들어 약 25 내지 약 37℃의 온도에서 1 μM 미만, 예를 들어 100 nM 미만, 더욱 바람직하게는 10 nM 미만의 KD로 상호작용한다.
바람직하게, 다가 단백질 스캐폴드 및 이의 구성부분은 프로테아제에 대해 안정하다. 예를 들어, 다가 단백질 스캐폴드 및 다가 단백질 스캐폴드의 구성성분은 스캐폴드의 3차 또는 4차 구조의 손실 없이 트립신과 같은 프로테아제에 노출될 수 있다. 다가 단백질 스캐폴드 및 다가 단백질 스캐폴드의 구성부분은 약 10 내지 약 40℃, 예를 들어 약 20 내지 약 38℃, 예를 들어 약 25 내지 약 37℃의 온도에서 적어도 1시간, 예를 들어 적어도 2시간, 예를 들어 적어도 4시간, 예를 들어 적어도 8시간, 예를 들어 적어도 24시간 이상 동안 프로테아제에 대해 안정하다.
올리고머성 코어
상기에서 설명된 바와 같이, 본원에 제공된 다가 단백질 스캐폴드는 복수의 서브유닛 단량체를 포함하는 올리고머성 코어를 포함한다. 올리고머성 코어의 서브유닛 단량체는 전형적으로 본원의 다른 곳에 기재된 바와 같은 폴리펩타이드 구성체의 구조 도메인이다.
임의의 적합한 수의 서브유닛 단량체가 사용될 수 있다. 예를 들어, 올리고머성 코어는 약 2 내지 약 20개의 서브유닛 단량체, 예를 들어 약 2 내지 약 10개의 서브유닛 단량체, 더욱 바람직하게는 3 내지 7개의 서브유닛 단량체, 더욱 바람직하게는 3 내지 6개의 서브유닛 단량체를 포함할 수 있다. 예를 들어, 올리고머성 코어는 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 서브유닛 단량체를 포함할 수 있다. 바람직하게는, 올리고머성 코어는 적어도 3개의 서브유닛 단량체를 포함한다. 가장 바람직하게는 올리고머성 코어는 3개의 서브유닛 단량체를 포함한다. 바람직하게, 올리고머성 코어는 7개의 서브유닛 단량체를 포함하거나 이들로 이루어지지 않는다.
바람직하게, 서브유닛 단량체는 다량체화될 때 회전 대칭, 예를 들어 3겹 회전 대칭, 4겹 회전 대칭, 5겹 회전 대칭, 6겹 회전 대칭, 또는 7겹 회전 대칭을 갖는다. 올리고머성 코어는 C2, C3, C4, D2, C5, C6, D3, C7, C8, D4, C9, C10, D5, C11, C12, D6 또는 T 대칭을 가질 수 있다.
올리고머성 코어의 서브유닛 단량체 중 일부 또는 전부는 비-공유결합적으로 함께 부착될 수 있다. 올리고머성 코어의 서브유닛 단량체 중 일부 또는 전부는 함께 공유결합적으로 부착될 수 있다. 올리고머성 코어는 공유 및 비-공유결합적으로 부착된 서브유닛 단량체의 혼합물을 포함할 수 있다. 예를 들어, 올리고머성 코어는 이종이량체를 형성하기 위해 제2 단량체에 공유 결합된 제1 단량체를 포함할 수 있다. 올리고머성 코어는 서로 비-공유결합적으로 결합된 적어도 2개의 이러한 이종이량체를 포함할 수 있다. 예를 들어, 올리고머성 코어는 비-공유결합적으로 함께 부착된 3개의 비-이종이량체를 포함할 수 있으며, 여기서 각각의 이종이량체는 함께 공유결합적으로 결합된 2개의 단량체를 포함한다.
올리고머성 코어의 서브유닛 단량체 중 일부 또는 전부는 비-공유 상호작용에 의해 부착될 수 있다. 적합한 비-공유 상호작용에는 이온 결합, 수소 결합 및 할로겐 결합과 같은 정전기적 상호작용, 쌍극자-쌍극자 상호작용과 같은 반 데르 발스력, π-π 스태킹, 양이온-π 상호작용, 음이온-π 상호작용 또는 극성-π 상호작용 등이 포함되지만 이에 제한되지는 않는다.
올리고머성 코어의 서브유닛 단량체 중 일부 또는 전부는 함께 공유결합적으로 부착될 수 있다. 서브유닛 단량체가 함께 공유 결합되는 경우, 단량체는 전형적으로 원래 또는 자연 발생 단량체 도메인에 해당하는 아미노산 서열이다.
2개 이상의 서브유닛 단량체는 다이설파이드 결합에 의해 공유결합적으로 연결될 수 있다. 다이설파이드 결합은 일반적으로 폴리펩타이드의 시스테인 잔기 사이에 형성된다. 유리 티올기를 갖는 인공 아미노산도 다이설파이드 결합 형성에 참여할 수 있다.
2개 이상의 서브유닛 단량체는 화학적 가교결합을 통해 공유결합적으로 부착될 수 있다. 가교결합 시약에는 동종이작용성 가교결합 시약, 이종이작용성 가교결합 시약 및 광반응성 가교결합 시약이 포함된다. 동종이작용성 가교결합 시약은 양쪽 끝에 동일한 반응기를 갖고 있다. 동종이작용성 가교결합 시약의 예에는 디숙신이미딜 수베레이트(DSS), 디숙신이미딜 타르트레이트(DST) 및 디티오비스 숙신이미딜 프로피오네이트(DSP)가 포함된다. 설프하이드릴-설프하이드릴 가교결합제의 일부 통상적인 예로는 BMOE 및 DTME가 있다. 이종이작용성 가교결합 시약은 2개의 상이한 반응기를 가지며 유사하지 않은 작용기를 연결하는 데 사용될 수 있다. 이종이작용성 가교결합 시약의 예에는 MDS(m-말레이미도벤조일-N-하이드록시숙신이미드 에스터), GMBS(N-γ-말레이미도부티릴옥시숙신이미드 에스터), EMCS(N-(ε-말레이미도카프로일옥시) 숙신이미드 에스터) 및 설포-EMCS(N-(ε-말레이미도카프로일옥시)설포 숙신이미드 에스터)가 있다. 광반응성 가교결합 시약은 자외선 또는 가시광선에 노출된 경우에만 반응성으로 되는 이종이작용성 가교결합제이다. 일반적인 광반응성 화학기의 2가지 부류는 아릴-아지드와 디아지린이다. 아릴 아지드 (N-((2-피리딜다이티오)에틸)-4-아지도살리실아미드)가 널리 사용된다. 250-350 ㎚ UV 광에 노출시, 이들 시약은 이중 결합과의 추가 반응을 시작할 수 있는 나이트렌 기의 형성을 촉진할 수 있다. 추가적으로, 이러한 가교결합제는 C-H 삽입 생성물의 생성을 개시하거나 친핵체와 반응할 수 있다. 이 그룹에 속하는 일부 통상적인 가교결합 시약에는 ANB-NOS(N-5-아지도-2-나이트로벤질옥시숙신이미드) 및 설포-SANPAH가 포함된다. NHS-에스터 디아지린 또는 아지펜타노에이트는 광활성화 가능한 디아지린 고리와 N-하이드록시숙신이미드(NHS) 에스터를 함유하고 있으며 이는 중성 내지 염기성 완충제의 1차 아미노기와 효율적으로 반응하여 안정적인 아미드 결합을 형성한다. 이는 페닐 아지드 그룹에 비해 양호한 광안정성을 나타내며 장파 자외선(330 내지 370 ㎚)으로 쉽게 활성화되어 이격자 가지 거리 내의 모든 펩타이드 주쇄 또는 아미노산 측쇄와 공유 결합을 형성하는 카르벤 중간체를 생성할 수 있다.
보다 바람직하게, 올리고머성 코어 내의 2개 이상의 서브유닛 단량체는 유전적으로 함께 융합될 수 있다. 서브유닛 단량체는, 발현되면 단일 폴리뉴클레오타이드 쇄로 발현되도록 단일 폴리뉴클레오타이드 서열로 암호화되는 경우, 유전적으로 함께 융합된다. 따라서, 서브유닛 단량체가 유전적으로 함께 융합되는 경우, 올리고머성 코어는 단일 폴리펩타이드 쇄를 포함할 수 있다.
유전적으로 융합된 서브유닛 단량체는 펩타이드 링커를 통해 유전적으로 함께 융합될 수 있다. 서브유닛 단량체를 연결하는데 사용하기에 적합한 펩타이드 링커는, 서브유닛 단량체 사이의 힌지 영역으로서 작용하여 서로 독립적으로 폴딩될 수 있게 하고 서브유닛 단량체가 다량체화 능력을 유지할 수 있기에 충분한 유연성을 제공하는 것들을 포함하는 아미노산 서열이다. 펩타이드 링커의 길이, 유연성 및 친수성은 전형적으로 서브유닛 단량체가 쉽게 조립되어 올리고머성 코어를 형성할 수 있도록 설계된다. 바람직하게는, 펩타이드 링커에 의해 연결된 서브유닛 단량체는 조립되어 올리고머성 코어를 형성할 수 있으며, 여기서 인접한 서브유닛 단량체 사이의 상호작용은, 그렇지 않은 경우 동일한 서브유닛 단량체 사이의 상호작용과 실질적으로 동일하다.
올리고머성 코어의 단량체 서브유닛을 연결하는데 사용하기에 적합한 펩타이드 링커는 전형적으로 길이가 1 내지 100, 1 내지 50, 1 내지 25, 1 내지 20, 1 내지 15, 또는 1 내지 10개 아미노산이다. 링커는 예를 들어 리신, 세린, 아르기닌, 프롤린, 글리신 및 알라닌 중 하나 이상으로 구성될 수 있다. 적합한 유연성 펩타이드 링커의 예는 2 내지 20개, 예를 들어 4, 6, 8, 10 또는 16개의 세린 및/또는 글리신 아미노산의 스트레치이다. 경질 링커의 예로는 2 내지 30개, 예를 들어 4, 6, 8, 16 또는 24개 프롤린 아미노산의 스트레치가 있다. 적합한 링커의 예는 하기를 포함하지만 이에 제한되지는 않는다: GGGS, PGGS, PGGG, RPPPPP, RPPPP, VGG, RPPG, PPPP, RPPG, PPPPPPPPP, PPPPPPPPPPPP, RPPG, GG, GGG, SG, SGSG, SGSGSG, SGSGSGSG, SGSGSGSGSG 및 SGSGSGSGSGSGSGSG, 여기서 G는 글리신이고, P는 프롤린이고, R은 아르기닌이고, S는 세린이고, V는 발린이다. 추가의 예시적인 링커는 GSGS, GGGGS, GGGGSGGGGS 및 GGGGSGGGGSGGGGS를 포함한다. 적절한 링커 기는 기존 모델링 기법을 사용하여 설계될 수 있다. 링커는 전형적으로 단량체 또는 이의 서브유닛이 이들 각각의 단백질 올리고머로 조립될 수 있도록 충분히 유연하다.
바람직하게는, 올리고머성 코어의 총 분자량은 약 1000 kDa 미만, 예를 들어 약 500 kDa 미만, 예를 들어 약 250 kDa 미만이다. 올리고머성 코어의 총 분자량은 바람직하게는 약 10 kDa 내지 약 1000 kDa, 예를 들어 약 10 kDa 내지 약 500 kDa, 예를 들어 약 10 kDa 내지 약 250 kDa, 예를 들어 약 10 kDa 내지 약 150 kDa이다. 올리고머성 코어의 총 분자량은 더욱 바람직하게는 약 20 kDa 내지 약 150 kDa이다.
바람직하게는, 올리고머성 코어의 직경은 약 100 ㎚ 미만, 예를 들어 약 50 ㎚ 미만, 예를 들어 약 30 ㎚ 미만, 예를 들어 약 20 ㎚ 미만, 예를 들어 약 10 ㎚ 미만이다. 바람직하게는, 올리고머성 코어의 높이는 약 100 ㎚ 미만, 예를 들어 약 50 ㎚ 미만, 예를 들어 약 30 ㎚ 미만, 예를 들어 약 20 ㎚ 미만, 예를 들어 약 10 ㎚ 미만이다. 올리고머성 코어의 크기는 바람직하게는 1 내지 50 ㎚, 예를 들어 2 내지 40 ㎚, 예를 들어 약 2 내지 약 20 ㎚, 예를 들어 약 5 내지 약 10 ㎚이다.
바람직하게는 올리고머성 코어는 열역학적으로 안정하다. 바람직하게는 올리고머성 코어는 약 0 내지 약 50℃의 온도에서 안정하다. 달리 말하면, 바람직하게는 올리고머성 코어는 약 0 내지 약 50℃의 온도에서 용액 중에 있을 때 그의 치환체 단량체로 자발적으로 해리되지 않는다. 더욱 바람직하게는 올리고머성 코어는 약 10 내지 약 40℃, 예를 들어 약 20 내지 약 38℃, 예를 들어 약 25 내지 약 37℃의 온도에서 안정하다.
바람직하게, 서브유닛 단량체는 안정적으로 상호작용하여 올리고머성 코어를 형성한다. 서브유닛 단량체 사이의 상호작용은 약한 일시적인 상호작용이 아닌 것이 바람직하다. 약한 일시적 복합체는 전형적으로 생체 내에서 상이한 올리고머 상태의 동적 혼합물을 보이는 반면, 강한 일시적 복합체는, 예를 들어 리간드 결합에 의해 촉발될 때만 그의 4차 상태가 변하고, 단일의 우세한 올리고머 상태로 존재한다(예를 들어, 복합체의 적어도 90%, 예를 들어 적어도 95%, 예를 들어 적어도 99%, 예를 들어 적어도 99.9%, 예를 들어 적어도 99.99% 또는 99.999%가 표준 조건 하에서 안정한 올리고머 상태로 존재할 수 있음). 약한 일시적 상호작용은 마이크로몰 범위의 해리 상수(KD) 및 수 초의 수명을 특징으로 한다. 효과기 분자의 결합에 의해 안정화되는 강력한 일시적 상호작용은 일반적으로 수명이 더 길고 나노몰 범위에서 더 낮은 KD를 갖는다. 서브유닛 단량체는 더욱 바람직하게는 적어도 강한 일시적 반응과 상호작용하고, 더욱 바람직하게는 영구적인 상호작용을 형성한다. 영구적인 상호작용은 올리고머가 통상적인 조건 하에서 그의 구성성분 서브유닛 단량체로 해리되지 않거나 실질적으로 해리되지 않으며(예를 들어 약 0 내지 100℃ 온도의 수용액 중에 있을 때; 이러한 조건 하에서 전형적으로 올리고머성 코어의 적어도 90%, 예를 들어 적어도 95%, 예를 들어 적어도 99%, 적어도 99.9%, 예를 들어 적어도 99.99% 또는 99.999%가 해리되지 않는다), 대개 올리고머성 코어는 오직 서브유닛 단량체 자체의 3차 구조를 변성시키는 변성 조건이 사용되는 경우에만 해리된다. 따라서, 바람직하게, 서브유닛 단량체는 1 μM 미만, 예를 들어 100 nM 미만, 더 바람직하게는 10 nM 미만의 KD로 다량체화된다. 올리고머성 코어는 전형적으로 적어도 10분, 보다 바람직하게는 적어도 1시간, 예를 들어 적어도 하루, 예를 들어 적어도 1주일, 예를 들어 적어도 1개월 또는 적어도 1년의 수명을 갖는다. 수명은 약 0℃ 내지 약 100℃, 예를 들어 약 4℃ 내지 약 90℃, 예를 들어 약 10℃ 내지 약 50℃, 예를 들어 약 20℃ 내지 약 38℃, 예를 들어 약 25 내지 약 37℃와 같은 임의의 적합한 온도에서 결정될 수 있다.
바람직하게, 올리고머성 코어는 프로테아제에 대해 안정하다. 예를 들어, 올리고머성 코어는 올리고머성 코어의 3차 또는 4차 구조의 손실 없이 제한된 기간, 예를 들어 4시간 동안 묽은 농도의 프로테아제, 예를 들어 트립신에 노출될 수 있다.
바람직하게는 올리고머성 코어는 인간이거나 인간화된다. 인간 올리고머성 코어는 인간 단백질의 다량체 영역이다. 인간화된 올리고머성 코어는 비-인간 단백질의 다량체 영역인 올리고머성 코어이며, 이는 인간 단백질의 상응하는 다량체 영역과 더 밀접하게 유사하도록 변형되었다. 인간화된 올리고머성 코어는 상응하는 인간 단백질의 다량체 영역의 아미노산 서열에 대해 적어도 50%의 아미노산 동일성, 예를 들어 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 아미노산 동일성을 포함할 수 있다. 인간 단백질의 상응하는 다량체 영역 은 인간화된 올리고머성 코어에 대해 가장 큰 아미노산 서열 동일성을 갖는 인간 단백질의 다량체 영역이다. 이 정보는 Blast 검색(blast.ncbi.nlm.nih.gov)을 사용하고 검색 결과를 호모 사피엔스(homo sapiens)로 제한하여 확인할 수 있다.
바람직하게, 다가 단백질 스캐폴드의 올리고머성 코어 자체는 생물학적 시스템, 세포 배양 또는 피험자(예를 들어, 비-인간 또는 인간 피험자)에서 면역 반응을 유도하지 않는다. 즉, 전형적으로 올리고머성 코어의 결합 부위 및/또는 올리고머성 코어의 결합 부위에 부착된 효과기 모이어티가 없는 경우, 올리고머성 코어가 생물학적 시스템에 투여될 때 면역 반응이 유도되지 않는다. 예를 들어, 올리고머성 코어(올리고머성 코어의 결합 부위 및/또는 올리고머성 코어의 결합 부위에 부착된 효과기 모이어티의 부재 하에서)를 생물학적 시스템(예를 들어, 본원에 정의된 피험자)에 투여하는 것은 전형적으로 생물학적 시스템의 선천 또는 적응 면역을 유도하지 않는다. 예를 들어, 올리고머성 코어는 전형적으로 보체 시스템, B 세포, T 세포, 자연 살해 세포, 비만 세포, 호염기구, 호산구, 호중구, 수지상 세포 또는 대식세포의 활성화를 유도하지 않는다. 그러나 올리고머성 코어에 부착된 분자는 인간 피험자에서 면역 반응을 생성하도록 특별히 설계될 수 있다.
바람직하게, 단백질 스캐폴드의 올리고머성 코어는 항체 또는 항체 단편을 포함하지 않으며; 본원에 추가로 기재된 바와 같이 항체 및/또는 항체 단편은 효과기 모이어티로서 올리고머성 코어에 부착될 수 있다. 올리고머성 코어(예를 들어 임의의 효과기 모이어티가 없음)는 더욱 바람직하게는 항체의 Fc 영역을 포함하지 않는다. 일부의 경우, 올리고머성 코어는 면역글로불린 불변 영역을 포함하지 않는다.
일부 실시양태에서 다가 단백질 스캐폴드의 올리고머성 코어는 동종올리고머성 코어일 수 있다, 즉 올리고머성 코어는 하나 초과 유형의 단량체를 포함할 수 있다. 동종올리고머성 코어는 2개 이상, 예를 들어 3개 이상, 4개 이상, 5개 이상, 6개 이상, 또는 7개 이상의 동일한 서브유닛 단량체를 포함할 수 있다.
일부 다른 실시양태에서, 다가 단백질 스캐폴드의 올리고머성 코어는 이종올리고머성 코어일 수 있다, 즉 올리고머성 코어는 하나 초과 유형의 단량체를 포함할 수 있다. 상이한 유형의 서브유닛 단량체는 올리고머성 코어를 형성할 수 있다. 즉, 서브유닛 단량체는 함께 부착될 수 있다. 이종올리고머성 코어는 2개 이상, 예를 들어 3개 이상, 4개 이상, 5개 이상, 6개 이상, 또는 7개 이상의 상이한 서브유닛 단량체를 포함할 수 있다. 예를 들어, 이종올리고머성 코어가 3개의 단량체를 포함하는 경우, 이는 2개의 제1 단량체와 하나의 제2 단량체를 포함하거나; 또는 하나의 제1 단량체, 하나의 제2 단량체, 및 하나의 제3 단량체를 포함할 수 있다. 이종올리고머성 코어가 4개의 단량체를 포함하는 경우, 이는 2개의 제1 단량체 및 2개의 제2 단량체; 2개의 제1 단량체, 1개의 제2 단량체 및 1개의 제3 단량체; 또는 1개의 제1 단량체, 1개의 제2 단량체, 1개의 제3 단량체 및 1개의 제4 단량체를 포함할 수 있다. 바람직하게는, 올리고머성 코어가 이종올리고머성 코어인 경우, 올리고머성 코어는 2가지 유형의 서브유닛 단량체를 포함한다; 즉, 유형 A 및 유형 B의 단량체를 포함하고 총 n개의 서브유닛 단량체를 갖는 이종올리고머성 코어의 경우, 상기 이종올리고머성 코어는 (AaBb)의 화학량론을 가질 수 있으며, 여기서 a + b = n이다. 올리고머성 코어가 이종올리고머성 코어인 경우, 그 안에 포함된 서브유닛 단량체는, 제1 유형의 서브유닛 단량체가 제1 유형의 또 다른 단량체보다는 제2 유형의 서브유닛 단량체에 우선적으로 결합하도록 변형될 수 있다(즉, A 유형의 단량체와 B 유형의 단량체를 포함하는 이종올리고머성 코어의 경우, 이종올리고머성 코어는 AAABBB…가 아닌 ABABAB…의 형태이다).
추가 실시양태에서 올리고머성 코어는 복수의 다량체 서브유닛을 포함할 수 있다. 예를 들어, 2개의 단량체가 융합될 수 있고(예를 들어 탠덤 융합으로) 단량체 융합물이 조립되어 올리고머성 코어를 형성할 수 있다. 이와 관련하여, 융합된 단량체는 동일하거나 상이할 수 있다.
예를 들어, 2개 이상의 동일한 단량체가 융합될 수 있으며, 융합 생성물은 추가의 동일한 융합 생성물과 조립되어 동종올리고머성 코어를 형성할 수 있다. 올리고머성 코어는 복수의 동종이량체를 포함할 수 있으며, 예를 들어 동종이량체는 'AA'이고, 올리고머성 코어는 'AA', 'AAAA' 또는 'AAAAAA' 등을 포함할 수 있다.
대안적으로, 2개 이상의 상이한 단량체가 함께 융합될 수 있으며, 융합 생성물은 추가의 동일한 융합 생성물과 조립되어 올리고머성 코어를 형성할 수 있다. 본원에 사용된 바와 같이, 이러한 코어는 전형적으로 각 융합 생성물이 단량체 서브유닛으로 간주되는 동종올리고머성 코어로 간주된다. 올리고머성 코어는 복수의 이종이량체를 포함할 수 있으며, 예를 들어 이종이량체는 'AB'이고, 올리고머성 코어는 'AB', 'ABAB' 또는 'ABABAB' 등을 포함할 수 있습니다.
대안적으로, 2개 이상의 동일한 단량체가 융합될 수 있으며, 이때 융합 생성물은 추가의 동일하지 않은 융합 생성물과 조립되어 이종올리고머성 코어를 형성할 수 있다. 올리고머성 코어는 복수의 동종이량체를 포함할 수 있으며, 예를 들어 첫 번째 동종이량체는 'AA'이고 두 번째 동종이량체는 'BB'이고, 올리고머성 코어는 'AABB' 등을 포함할 수 있다.
대안적으로, 2개 이상의 상이한 단량체가 함께 융합될 수 있으며, 융합 생성물은 추가의 동일하지 않은 융합 생성물과 조립되어 이종올리고머성 코어를 형성할 수 있다. 올리고머성 코어는 복수의 이종이량체를 포함할 수 있으며, 예를 들어 첫 번째 이종이량체는 'AB'이고 두 번째 이종이량체는 'CD'이고, 올리고머성 코어는 'ABCD' 등을 포함할 수 있다.
동종올리고머성 코어는 복수의 서브유닛 단량체를 포함하며, 여기서 각 단량체는 적어도 하나의 제1 결합 부위 및 적어도 하나의 제2 결합 부위를 포함한다. 예를 들어, 동종올리고머성 코어가 3개의 서브유닛 단량체를 포함하는 경우, 올리고머성 코어는 적어도 3개의 제1 결합 부위 및 적어도 3개의 제2 결합 부위를 포함할 것이다. 동종올리고머성 코어가 4개, 5개, 6개 또는 7개의 서브유닛 단량체를 포함하는 경우, 올리고머성 코어는 각각 적어도 4개의 제1 결합 부위 및 적어도 4개의 제2 결합 부위; 적어도 5개의 제1 결합 부위 및 적어도 5개의 제2 결합 부위; 적어도 6개의 제1 결합 부위 및 적어도 6개의 제2 결합 부위; 또는 적어도 7개의 제1 결합 부위 및 적어도 7개의 제2 결합 부위를 포함할 것이다. 따라서, 다가 단백질 스캐폴드는 바람직하게는 적어도 2개의 제1 결합 부위 및 적어도 2개의 제2 결합 부위를 포함한다, 즉 모든 제1 결합 부위는 다른 제1 결합 부위와 동일하고 모든 제2 결합 부위는 다른 제2 결합 부위와 동일하다. 다가 단백질 스캐폴드는 더욱 바람직하게는 적어도 3개의 제1 결합 부위 및 적어도 3개의 제2 결합 부위를 포함한다. 일부 실시양태에서 다가 단백질 스캐폴드는 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 또는 적어도 8개의 각각의 제1 결합 부위 및 제2 결합 부위를 포함한다.
이종올리고머성 코어는 적어도 2가지 유형의 서브유닛 단량체를 포함하는 복수의 서브유닛 단량체를 포함하며, 여기서 한 유형의 서브유닛 단량체는 적어도 1개의 제1 결합 부위를 포함하고 제2 유형의 서브유닛 단량체는 적어도 1개의 제2 결합 부위를 포함한다. 예를 들어, 이종올리고머성 코어가 3개의 서브유닛 단량체를 포함하는 경우, 이는 3개의 상이한 결합 부위를 포함할 수 있거나, 2개의 제1 결합 부위 및 1개의 제2 결합 부위를 포함할 수 있다. 이종올리고머성 코어가 4개의 서브유닛 단량체를 포함하는 경우, 이는 4개의 상이한 결합 부위를 포함할 수 있거나, 2개의 제1 결합 부위와 1개의 제2 결합 부위 및 1개의 제3 결합 부위, 또는 2개의 제1 결합 부위 및 2개의 제2 결합 부위를 포함할 수 있다.
결합 부위는 본원에 더욱 상세히 기재되어 있다.
단량체
본원에 기재된 바와 같이, 본원에 제공된 다가 단백질 스캐폴드는 복수의 서브유닛 단량체를 포함하는 올리고머성 코어를 포함한다. 서브유닛 단량체는 전형적으로 본원의 다른 곳에서 기재된 다중-도메인 폴리펩타이드 구성체의 구조 도메인이다.
각각의 서브유닛 단량체(본원에 더 상세히 기재된 바와 같이 이에 부착된 임의의 결합 부위는 제외)는 바람직하게는 300개 미만의 아미노산, 바람직하게는 200개 미만의 아미노산, 더욱 바람직하게는 150개 미만의 아미노산을 포함한다. 예를 들어, 각각의 서브유닛 단량체(이에 부착된 임의의 결합 부위(들)는 제외)는 바람직하게는 40 kDa 미만, 예를 들어 30 kDa 미만, 예를 들어 20 kDa 미만의 분자량을 갖는다. 이러한 단량체를 포함하는 본원에 기재된 단백질 스캐폴드는 상대적으로 질량이 낮아 생체 내에서 효율적인 확산을 가능하게 할 수 있다. 이들은 전형적으로 세균 세포 발현 또는 효모 세포 발현 시스템에서 발현되고 올바르게 폴딩될 수 있다. 이러한 발현 시스템은 종종 항체 생산에 전형적으로 요구되는 포유동물 세포 배양보다 훨씬 더 높은 수율을 생성시킬 수 있다.
서브유닛 단량체는 바람직하게는 항체 또는 항체 단편을 포함하거나 이들로 이루어지지 않는다. 올리고머성 코어 또는 서브유닛 단량체는 바람직하게는 항체의 Fc 영역을 포함하거나 이들로 이루어지지 않는다. 일부 실시양태에서, 서브유닛 단량체는 CH2 도메인을 포함하거나 이들로 이루어지지 않는다. 일부 실시양태에서, 서브유닛 단량체는 CH3 도메인을 포함하거나 이들로 이루어지지 않는다. 일부 실시양태에서, 서브유닛 단량체는 CH2 도메인을 포함하지 않고 CH3 도메인도 포함하지 않는다.
바람직하게는 올리고머성 코어의 각각의 단량체 서브유닛은 인간이거나 인간화된다. 인간 단량체는 인간 올리고머 단백질의 단량체이다. 인간화된 단량체는 비-인간 올리고머 단백질의 단량체로, 상응하는 인간 단백질의 단량체와 더욱 유사하도록 변형되었다. 따라서 인간화된 단량체는 상응하는 인간 단백질의 아미노산 서열에 대해 적어도 50%의 아미노산 동일성, 예를 들어 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 아미노산 동일성을 포함할 수 있다. 전형적으로 인간 또는 인간화된 단백질은 투여 대상 환자에게 유해한 면역 반응을 일으키지 않는다.
올리고머성 코어에 포함된 서브유닛 단량체는 바람직하게는 각각 서브유닛 단량체가 다량화되도록 하는 서브유닛 단량체의 구조적 및/또는 기능적 특징인 다량체화 구조 요소를 포함한다.
다량체화 구조 요소는 단백질 도메인일 수 있다. 올리고머성 코어의 다량체화 구조 요소는 자연-발생 다량체화 단백질의 다량체화 도메인, 또는 드노보 다량체 도메인일 수 있다. 단백질 도메인은 단백질의 자율적으로 폴딩되는 유닛이다. 다량체화 도메인은 전형적으로 또 다른 단백질 도메인과의 단백질-단백질 상호작용에 관여하는 단백질 도메인이다. 다량체 구조 요소는 바람직하게는 가용성이며, 따라서 단량체 및 올리고머성 코어가 가용성이다.
본원의 개시내용을 고려하여, 당업자는 본 발명에 사용하기에 적합한 다량체화 구조 요소를 식별할 수 있을 것이다. 예를 들어, 숙련가는 다량체 단백질을 식별할 수 있다. 예를 들어, 회전 대칭축을 갖는 다량체 단백질을 검색할 수 있는 NCBI 데이터베이스(www.ncbi.nlm.nih.gov) 및 Protein Data Bank(PDB, www.rscb.org)와 같은 데이터베이스에 수많은 다량체 단백질이 나열되어 있다.
바람직하게, 식별된 다량체 단백질은 동종이량체, 동종삼량체, 동종사량체, 동종오량체, 동종육량체, 동종칠량체 등과 같은 동종올리고머이다. 다량체 단백질은 이종이량체, 이종삼량체, 이종사량체, 이종오량체, 이종육량체, 이종칠량체 등과 같은 이종올리고머일 수 있다. 기능적 및/또는 구조적 정보는 다량체 단백질의 어느 도메인이 다량체화를 담당하는지, 즉 다량체화 도메인인지를 식별하는 데 사용될 수 있다.
다량체화 구조 요소는 바람직하게는 다량체화 도메인의 다량체화 계면(즉, 도메인이 다량화되도록 하는 다량체화 도메인의 구조적 또는 기능적 요소)을 포함한다. 다량체화 도메인의 다른 양태는 서브유닛 단량체의 다량체화에 영향을 주지 않고 변형될 수 있다. 따라서, 올리고머성 코어의 서브유닛 단량체는 바람직하게는 다량체화 구조 요소를 포함한다. 서브유닛 단량체는 상기가 유래된 다량체화 도메인에 대해, 바람직하게는 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성을 포함한다. 서브유닛 단량체는 다량체(즉, 올리고머성 코어)를 형성하는 능력을 유지한다.
바람직하게, 올리고머성 코어의 서브유닛 단량체는 다량체 단백질의 가용성 다량체화 구조 요소를 포함한다. 예를 들어 막 내에서 발견되는 다량체화 도메인보다 가용성 도메인이 바람직하다. 바람직하게는, 올리고머성 코어의 각각의 서브유닛 단량체는 가용성 다량체 단백질의 가용성 다량체화 구조 요소를 포함한다.
다량체화 구조 요소는 콜라겐(예를 들어, 콜라겐 NC1 도메인), CutA, TNF, p53, 피브리노겐, C4, 바실러스 서브틸러스 AbrB 또는 이의 상동체 또는 동종간 상동체와 같은 적합한 대칭(예를 들어 본원에 보다 상세히 기재된 바와 같은, 회전 또는 이면체 대칭)의 임의의 다량체 단백질로부터 유래될 수 있다.
바람직하게, 서브유닛 단량체는 콜라겐 X(PDB ID: 1GR3)(예를 들어, 그의 NC1 도메인), 콜라겐 VIII(PDB ID: 1o91)(예를 들어, 그의 NC1 도메인), C1q 헤드 도메인(예를 들어, PDB ID: 1PK6은 인간 C1q의 구상 헤드이다), 또는 CutA(구리 내성 A) 단백질, 예를 들어 파이로코커스 호리코시이, 호모 사피엔스(PDB ID: 2ZFH), 써무스 써모필레스(Thermus thermophiles)(PDB ID: 1V6H); 오리자 사티바(Oryza sativa)(PDB ID: 2ZOM); 또는 쉐와넬라 스페시즈(Shewanella sp.) SIB1(PDB ID: 3AHP)로부터의 CutA1 단백질; 또는 선행 폴리펩타이드 중 어느 하나에 대해 적어도 30% 또는 적어도 50% 아미노산 서열 동일성; 보다 바람직하게는 선행 폴리펩타이드 중 어느 하나에 대해 적어도 60% 아미노산 서열 동일성, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95% 또는 적어도 97%, 적어도 98% 또는 적어도 99% 아미노산 서열 동일성을 갖는 폴리펩타이드로부터 선택된 단백질의 단량체 또는 다량체화 도메인을 포함할 수 있다.
일부 구현예에서, 서브유닛 단량체는 콜라겐 X(PDB ID: 1GR3, 또는 서열번호 2)(예를 들어, 그의 NC1 도메인), 콜라겐 VIII(PDB ID: 1o91, 또는 서열번호 3)(예를 들어, 그의 NC1 도메인), 이형중합체 C1q 헤드 도메인(예를 들어, PDB ID: 1PK6은 인간 C1q의 구상 헤드이다, 서열번호 36-38 참조), 또는 CutA(구리 내성 A) 단백질, 예를 들어 파이로코커스 호리코시이(PDB ID: 4YNO, 또는 서열번호 1), 호모 사피엔스(PDB ID: 2ZFH, 또는 서열번호 19), 써무스 써모필루스(PDB ID: 1V6H, 또는 서열번호 39), 오리자 사티바(PDB ID: 2ZOM, 또는 서열번호 40); 또는 쉐와넬라 스페시즈 SIB1(PDB ID: 3AHP, 또는 서열번호 41)로부터의 CutA1 단백질; TNF-유사 단백질 TL1A(PDB ID: 2RE9, 또는 서열번호 31); TNF(PDB ID: 1TNF, 또는 서열번호 42); TNF 패밀리 단백질 CD40L(PDB ID: 3LKJ, 또는 서열번호 58); 인간 대식세포 이동 억제 인자(MIF)(PDB ID: 1CA7, 또는 서열번호 25, Y99G 돌연변이를 가짐 PDB ID: 6OY8); 인간 대식세포 이동 억제 인자 2 (MIF2)(PDB ID: 7MSE, 또는 서열번호 26, 또는 S62A 및 F99A 돌연변이 서열번호 27) 또는 이의 상동체 또는 동종간 상동체를 포함하거나 또는 이들로 이루어진다.
다른 다량체화 도메인은 역평행 이중나선 육량체(PDB ID: 5W0J, 실시예 4, 서열번호 43 참조), HIV-1 GP41 코어(PDB ID: 1I5Y 또는 서열번호 44), 시토크롬 c555(PDB ID: 5Z25 또는 서열번호 45), MHC 부류 II 관련된 샤페로닌 및 표적화 단백질 불변 쇄 (Ii)(PDB ID: 1iie 또는 서열번호 46); p53(PDB ID: 1C26 또는 서열번호 47); 피브리노겐-유사 도메인(PDB ID: 4M7F 또는 서열번호 48); 콜라겐 IV C4(PDB ID: 1LI1 또는 서열번호 49); 바실러스 서브틸리스 AbrB(PDB ID: 1YFB 또는 서열번호 50); 또는 선행 폴리펩타이드 중 어느 하나에 대해 적어도 50% 아미노산 서열 동일성; 보다 바람직하게는 선행 폴리펩타이드 중 어느 하나에 대해 적어도 60% 아미노산 서열 동일성, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95% 또는 적어도 97%, 적어도 98% 또는 적어도 99% 아미노산 서열 동일성을 갖는 폴리펩타이드의 다량체화 도메인을 포함한다.
다른 다량체화 도메인은 박테리오파지 람다 헤드 단백질 D(예를 들어, PDB ID: 1C5E 또는 PDB ID: 1C5E 또는 서열번호 51); HCRBPII의 도메인-교환 삼량체 변이체(PDB ID: 6VIS 또는 서열번호 52); T1L 레오바이러스 부착 단백질 시그마1(PDB ID의 쇄 A,B,C: 4ODB 또는 서열번호 53); 또는 선행 단백질 중 어느 하나에 대해 적어도 50% 아미노산 서열 동일성; 보다 바람직하게는 선행 단백질 중 어느 하나에 대해 적어도 60% 아미노산 서열 동일성, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95% 또는 적어도 97%, 적어도 98% 또는 적어도 99% 아미노산 서열 동일성을 갖는 폴리펩타이드의 다량체화 도메인을 포함한다.
바람직하게는, 하나의 실시양태에서, 올리고머성 코어는 파이로코커스 호리코시이 CutA1의 다량체화 구조 요소로부터 유래된 단량체를 포함할 수 있다. 따라서, 각각의 서브유닛 단량체는 서열번호 1의 아미노산 서열에 대해 적어도 30%, 예를 들어 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성을 갖는 폴리펩타이드를 포함하거나 이로 이루어질 수 있다.
상기 및 본원의 다른 곳에서 논의된 바와 같이, CutA1(예를 들어 파이로코커스 호리코시이)은 다중-도메인 폴리펩타이드 구성체의 전형적인 구조 도메인이다.
바람직하게, 다른 실시양태에서, 올리고머성 코어는 콜라겐 X NC1의 다량체화 구조 요소로부터 유래된 단량체를 포함할 수 있다. 따라서, 각각의 서브유닛 단량체는 서열번호 2의 아미노산 서열에 대해 적어도 30%, 예를 들어 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성을 갖는 폴리펩타이드를 포함하거나 이로 이루어질 수 있다.
상기 및 본원의 다른 곳에서 논의된 바와 같이, 콜라겐 X NC1은 다중-도메인 폴리펩타이드 구성체의 전형적인 구조 도메인이다.
바람직하게는, 다른 실시양태에서, 올리고머성 코어는 콜라겐 VIII NC1의 다량체화 구조 요소로부터 유래된 단량체를 포함할 수 있다. 따라서, 각각의 서브유닛 단량체는 서열번호 3의 아미노산 서열에 대해 적어도 30%, 예를 들어 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성을 갖는 폴리펩타이드를 포함하거나 이로 이루어질 수 있다.
상기 및 본원의 다른 곳에서 논의된 바와 같이, 콜라겐 VIII NC1은 다중-도메인 폴리펩타이드 구성체의 전형적인 구조 도메인이다.
바람직하게는, 다른 실시양태에서, 올리고머성 코어는 호모 사피엔스로부터의 CutA1의 다량체화 구조 요소로부터 유래된 단량체를 포함할 수 있다. 따라서, 각각의 서브유닛 단량체는 서열번호 19의 아미노산 서열에 대해 적어도 30%, 예를 들어 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성을 갖는 폴리펩타이드를 포함하거나 이로 이루어질 수 있다.
상기 및 본원의 다른 곳에서 논의된 바와 같이, CutA1(예를 들어, 인간)은 다중-도메인 폴리펩타이드 구성체의 전형적인 구조 도메인이다.
바람직하게는, 다른 실시양태에서, 올리고머성 코어는 MIF 또는 MIF-2의 다량체화 구조 요소로부터 유래된 단량체를 포함할 수 있다. 따라서, 각각의 서브유닛 단량체는 서열번호 25 또는 서열번호 26 또는 서열번호 27의 아미노산 서열에 대해 적어도 30%, 예를 들어 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성을 갖는 폴리펩타이드를 포함하거나 이로 이루어질 수 있다.
상기 및 본원의 다른 곳에서 논의된 바와 같이, MIF는 다중-도메인 폴리펩타이드 구성체의 전형적인 구조 도메인이다. 상기 및 본원의 다른 곳에서 논의된 바와 같이, MIF-2는 다중-도메인 폴리펩타이드 구성체의 전형적인 구조 요소이다.
바람직하게는, 다른 실시양태에서, 올리고머성 코어는 TNF 및 TNF-유사 TL1A 또는 CD40L을 포함한 다량체화 구조 요소 TNF 패밀리 단백질로부터 유래된 단량체를 포함할 수 있다. 따라서, 각각의 서브유닛 단량체는 서열번호 42 또는 서열번호 31 또는 서열번호 58의 아미노산 서열에 대해 적어도 30%, 예를 들어 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성을 갖는 폴리펩타이드를 포함하거나 이로 이루어질 수 있다.
상기 및 본원의 다른 곳에서 논의된 바와 같이, TNF는 다중-도메인 폴리펩타이드 구성체의 전형적인 구조 도메인이다. 상기 및 본원의 다른 곳에서 논의된 바와 같이, TNF-유사 단백질은 다중-도메인 폴리펩타이드 구성체의 전형적인 구조 도메인이다.
올리고머성 코어가 이종올리고머성 코어인 경우, 올리고머성 코어의 각 단량체는 동일한 단백질로부터 유래될 수 있다. 예를 들어, 올리고머성 코어의 각 단량체는 상기에서 설명한 단백질 중 하나로부터 유래할 수 있다. 올리고머성 코어는 각 단량체 서브유닛의 다량체화 도메인이 동일하더라도 단량체 서브유닛에 부착된 결합 부위의 차이로 인해 이형중합체일 수 있다. 모든 단량체 서브유닛이 동일한 단백질로부터 유래되는 경우에조차, 올리고머성 코어는 단량체 서브유닛의 다량체화 도메인의 차이로 인해 이형중합체일 수 있다.
당업자는 본원에 제공된 다가 단백질 스캐폴드의 올리고머성 코어의 단량체 서브유닛이 추가적인 기능성 또는 유익한 특성을 제공하기 위해 추가로 변경될 수 있음을 이해할 것이다.
예를 들어, 단량체는 본원에 기재된 단량체 또는 다량체화 구조 요소의 단편, 유도체 또는 변이체일 수 있다. 당업자가 인지하는 바와 같이, 아미노산 서열의 단편은 하나 이상, 예를 들어 적어도 1, 2, 5, 10, 20, 50 또는 100개의 아미노산이 결실된 그러한 서열의 결실 변이체를 포함한다. 결실은 고유 서열의 C-말단 또는 N-말단에서 또는 고유 서열 내에서 발생할 수 있다. 전형적으로, 하나 이상의 아미노산의 결실은 서브유닛 단량체의 다량체화 구조 요소를 바로 둘러싸는 잔기에 영향을 미치지 않는다.
아미노산 서열의 유도체는 생체내 또는 생체외에서 변형되는 서열을 포함하는 번역-후 변형된 서열을 포함한다. 많은 다양한 단백질 변형이 당업자에게 공지되어 있으며, 아미노산 잔기에 새로운 기능을 도입하기 위한 변형, 반응성 아미노산 잔기를 보호하기 위한 변형, 또는 아미노산 잔기를 그러한 아미노산 잔기에의 부착을 위해 링커 또는 기질(표면)상의 반응성 작용기와 같은 화학적 모이어티에 결합시키기 위한 변형을 포함한다.
아미노산 서열의 유도체는 또한 하나 이상, 예를 들어 적어도 1, 2, 5, 10, 20, 50 또는 100개의 아미노산이 고유 서열에 부가되거나 도입되는 이러한 서열의 부가 변이체를 포함한다. 부가는 고유 서열의 C-말단 또는 N-말단에서 또는 고유 서열 내에서 일어날 수 있다. 전형적으로, 하나 이상의 아미노산의 부가는 서브유닛 단량체의 다량체화 구조 요소를 바로 둘러싸는 잔기에 영향을 미치지 않는다.
아미노산 서열의 변이체에는 고유 서열의 적어도 1, 2, 5, 10, 20, 50 또는 100개 아미노산 잔기와 같은 하나 이상의 아미노산이 하나 이상의 비-고유 잔기로 교환되는 서열이 포함된다. 따라서 이러한 변이체는 점 돌연변이를 포함할 수 있거나 더 심오할 수 있다, 예를 들어 고유의 화학적 결찰을 사용하여 비-고유 아미노산 서열을 부분 고유 서열로 스플라이싱하여 고유 효소의 변이체를 생성시킬 수 있다. 아미노산 서열의 변이체에는 자연 발생 아미노산 및/또는 비천연 아미노산을 운반하는 서열이 포함된다.
상기 언급한 아미노산 서열의 변이체, 유도체 및 기능적 단편은 전형적으로 야생형 서열의 올리고머화 능력을 유지한다. 바람직하게, 상기 언급된 서열의 변이체, 유도체 및 기능적 단편은 야생형 또는 고유 서열과 비교하여 안정성 증가, 독성 감소, 결합 부위를 포함한 추가적인 기능성 등과 같은 개선된 특성을 갖는다.
결합 부위
다가 단백질 스캐폴드는 적어도 하나의 제1 결합 부위 및 적어도 하나의 제2 결합 부위를 포함한다. 일부 실시양태에서, 전형적으로 모듈식 시스템은 약물 발견에서 효과기 분자의 유용한 조합을 식별하는 데 유용하다. 적어도 하나의 제1 결합 부위는 적어도 하나의 제2 결합 부위에 직교한다. 즉, 제1 결합 부위가 그의 표적(제1 표적)에 결합하는 화학은 제2 결합 부위가 그의 표적(제2 표적)에 결합하는 화학과 직교한다. 따라서 제1 표적은 제1 결합 부위에는 결합하지만 제2 결합 부위에는 결합하지 않는다. 제2 표적은 제2 결합 부위에는 결합하지만 제1 결합 부위에는 결합하지 않는다. 따라서, 직교라는 용어는 단백질-단백질 상호작용 분야에서 통상의 의미를 가지며, 제1 결합 상호작용(즉, 제1 결합 부위와 제1 리간드)은 제2 결합 상호작용(즉, 제2 결합 부위와 제2 리간드)과 독립적이다.
다가 단백질 스캐폴드의 결합 부위는 스캐폴드가 효과기 부분에 결합하는 모듈식 시스템으로 사용될 수 있게 한다. 제1 및 제2 결합 부위는 효과기 부분의 동족 표적에 결합한다.
제1 및 제2 결합 부위는 임의의 적합한 방식으로 본원에 제공된 다가 단백질 스캐폴드에 통합될 수 있다. 한 실시양태에서, 제1 및 제2 결합 부위는 본원에 기재된 바와 같이 올리고머성 코어의 하나 또는 각각의 단량체에 부착되어 다가 단백질 스캐폴드를 형성하는 탠덤 융합물로서 제공된다. 비교를 위해, 서열번호 22는 αH 링커에 의해 연결된 융합물로서 제공된 2개의 결합 부위(본원에 기재됨)의 예이다.
결합 부위는 하기에 보다 상세히 기재된다.
결합 부위와 그의 표적 간의 상호작용은 비-공유 상호작용일 수 있다. 바람직하게, 결합 부위 또는 각각의 결합 부위는 각각의 표적에 대한 공유 결합을 형성할 수 있다. 반응성 작용기는 서브유닛 단량체 또는 효과기 모이어티에 자연적으로 존재할 수 있거나, 예를 들어 유전자 조작 또는 단량체의 화학적 변형에 의해 도입될 수 있다. 반응기는 합성 또는 발현 동안, 예를 들어 무세포 발현 동안, 예를 들어 시험관내 전사/번역을 통해 단량체에 통합된 비-천연 아미노산으로부터 유래할 수 있다.
다가 단백질 스캐폴드의 결합 부위는 반응기를 통해 표적에 결합할 수 있다. 임의의 적합한 반응기가 사용될 수 있다. 예를 들어, 반응기는 아민-반응기; 카복실 반응기; 설프하이드릴 반응기 또는 카보닐 반응기일 수 있다. 반응기는 시스테인 반응기를 포함할 수 있다. 반응기는 말레이미드, 아지드, 티올, 알킨, NHS 에스터 또는 할로아세트아미드를 포함할 수 있다.
반응기는 4-아지도-L-페닐알라닌(Faz)과 같은 비-천연 아미노산과 문헌[Liu C. C. and Schultz P. G., Annu. Rev. Biochem., 2010, 79, 413-444]의 도 1의 아미노산 1-71번 중 어느 하나와 반응할 수 있는 기일 수 있다. 이러한 기는 상응하는 비-천연 아미노산이 결합 부위 및 동족 표적에 포함될 때 특히 유용하다.
반응기는 클릭 화학 그룹일 수 있다. 클릭 화학(Click chemistry)은 2001년에 Kolb 등에 의해 처음 소개된 용어로, 소규모 및 대규모 응용 분야 모두에서 안정적으로 작동하는 강력하고 선택적인 모듈식 빌딩 블록의 확장 세트를 설명한다(문헌[Kolb HC, Finn, MG, Sharpless KB, Click chemistry: diverse chemical function from a few good reactions, Angew. Chem. Int. Ed. 40 (2001) 2004-2021]). 이들은 클릭 화학에 대한 일련의 엄격한 기준을 하기와 같이 정의하였다: “반응은 모듈식이어야 하고, 범위가 넓어야 하며, 매우 높은 수율을 제공하고, 비-크로마토그래피 방법으로 제거될 수 있는 유해한 부산물만을 생성해야 하며, 입체특이적이어야 한다(그러나 반드시 거울상이성질체선택적이지는 않다). 필요한 공정 특성에는 간단한 반응 조건(이상적으로는 공정이 산소와 물에 민감하지 않아야 함), 쉽게 사용할 수 있는 출발 물질 및 시약, 용매를 사용하지 않거나 양성이거나 쉽게 제거되는 용매(예를 들어, 물)를 사용하는 것, 및 간단한 생성물 단리가 포함된다. 필요한 경우 정제는 결정화나 증류 등 크로마토그래피가 아닌 방법으로 이루어져야 하며 생성물은 생리학적 조건에서 안정해야 한다."
예를 들어, 제1 및 제2 결합 부위는 직교 클릭 화학 시약을 포함할 수 있다. 클릭 화학의 적절한 예는 하기를 포함하지만 이에 제한되지는 않는다:
(a) 1,3 이극성 가환 반응의 무-구리 변형, 여기서 아지드는 예를 들어 사이클로옥탄 고리에서 압력 하에 알킨과 반응한다;
(b) 하나의 링커 상의 산소 친핵체와 다른 링커상의 에폭사이드 또는 아지리딘 반응성 모이어티와의의 반응;
(c) Staudinger 결찰(여기서 알킨 모이어티는 아릴 포스핀으로 대체되어, 아지드와 특정 반응을 일으켜 아미드 결합을 제공할 수 있음);
(d) 나이트론 쌍극자 가환;
(e) 노보넨 가환;
(f) 옥사노보나디엔 가환;
(g) 테트라진 결찰;
(h) [4+1] 가환;
(i) 테트라졸 포토클릭 화학; 및
(j) 쿼드리사이클란 결찰.
반응기는 할로아세트아미드, 예를 들어 요오도아세트아미드, 브로모아세트아미드 또는 클로로아세트아미드일 수 있다.
반응기는 비닐기, TCO, 테트라진 및 변형된 알킨; DBCO; 활성화된 산, 예를 들어 산 염화물; 및 피페라진 및 반응성 아민으로부터 선택될 수 있다.
호스트-게스트 화학을 또한 사용하여 결합 부위와 그의 표적 간의 반응을 제공할 수도 있다. 예를 들어, 결합 부위는 금속 착체에 결합하기 위한 리간드를 포함할 수 있고, 표적은 금속 착체를 포함하거나 그 반대의 경우도 마찬가지이다. 따라서, 결합 부위는 안정한 결합을 형성함으로써 변형제 분자와 복합체를 형성하는 리간드로서 작용할 수 있는 부위를 함유하는 표적과 킬레이트화 또는 초분자 결합을 통해 비-공유결합적으로 상호작용하거나, 또는 이와 역으로 작용할 수 있는 금속 착체를 포함할 수 있다.
반응기는 하기의 문헌에 개시된 것 중 어느 하나일 수 있다: Sakamoto and Hamachi, "Recent progress in chemical modification of proteins", Anal. Sci 2019 (35) 5-27; 또는 McKay and Finn, "Click chemistry in complex mixtures: bioorthogonal bioconjugation", Chem. Biol. 2014, 21(9) 1075-1101(이들 두 문헌은 모두 내용 전체가 본원에 참고로 포함된다).
다가 단백질 스캐폴드의 결합 부위는 바람직하게는 단백질 도메인과 같은 폴리펩타이드를 포함한다. 더욱 바람직하게, 제1 결합 부위는 제1 단백질 도메인을 포함하고, 상기 제2 결합 부위는 제2 단백질 도메인을 포함한다.
제1 결합 부위가 제1 단백질 도메인을 포함하고 제2 결합 부위가 제2 단백질 도메인을 포함하는 경우, 제1 결합 부위 및/또는 제2 결합 부위는 바람직하게는 이들이 부착되어 있는 서브유닛 단량체(들)에 유전적으로 융합되어 단일 폴리펩타이드 쇄를 형성한다. 전형적으로, 제1 결합 부위 및/또는 제2 결합 부위는 이들이 부착된 서브유닛 단량체(들)를 갖는 단일 폴리펩타이드 쇄, 예를 들어 재조합 핵산 분자로부터의 융합 단백질로서 발현된다. 이는 예를 들어 클릭 화학 시약을 부착하는 데 필요한 추가의 화학적 변형 없이 효과기 모이어티에 결합하기 위해 다가 단백질 스캐폴드가 즉시 발현될 수 있다는 점에서 유리할 수 있다. 단백질 결합 부위와 이것이 부착되는 단백질, 예를 들어 다가 단백질 스캐폴드의 올리고머성 코어의 단량체 서브유닛 사이의 부착이 하기에 기재된다.
제1 결합 부위는 제1 폴리펩타이드 표적에 대한 비-공유 결합을 형성할 수 있는 제1 단백질 도메인을 포함할 수 있고; 상기 제2 결합 부위는 제2 폴리펩타이드 표적에 대한 비-공유 결합을 형성할 수 있는 제2 단백질 도메인을 포함할 수 있다. 보다 바람직하게, 제1 결합 부위는 제1 폴리펩타이드 표적에 공유 결합을 형성할 수 있는 제1 단백질 도메인을 포함하고; 상기 제2 결합 부위는 제2 폴리펩타이드 표적에 공유 결합을 형성할 수 있는 제2 단백질 도메인을 포함한다. 상기 예와 같이 임의의 적합한 공유 결합이 형성될 수 있다. 바람직하게, 제1 단백질 도메인은 제1 폴리펩타이드 표적과 이소펩타이드 결합을 형성할 수 있고, 제2 단백질 도메인은 제2 결합 표적과 이소펩타이드 결합을 형성할 수 있다. 이소펩타이드 결합은 예를 들어 한 아미노산의 카복실기와 다른 아미노산의 아미노기 사이에 형성될 수 있는 아미드 결합이다. 이러한 연결기 중 적어도 하나는 전형적으로 이러한 아미노산 중 하나의 측쇄의 일부이다.
바람직하게, 제1 결합 부위 및 제2 결합 부위는 각각 분할된 리간드-결합 단백질 도메인과 같은 상이한 분할된 단백질 도메인을 포함한다. 본원에 사용된 리간드-결합 단백질 도메인은 단백질-결합 리간드의 도메인이다. 임의의 적합한 단백질이 사용될 수 있지만, 이소펩타이드 결합과 같은 가닥 내 공유 결합에 의해 본래 안정화되는 단백질이 특히 이롭다. 이러한 경우, 이소펩타이드 결합 공여체 잔기를 함유하는 단백질의 일부는 이소펩타이드 결합 수용체 잔기를 함유하는 펩타이드 부분으로부터 분할된다. 2개의 단백질 단편은 예를 들어 유전적 융합에 의해 올리고머성 코어의 단량체 및/또는 본원에 기재된 폴리펩타이드 표적과 같은 추가의 폴리펩타이드에 부착될 수 있다. 2개의 분리된 단편을 접촉시키면 전형적으로 두 단편을 비가역적으로 함께 부착시키는 이소펩타이드 결합이 생성된다. 따라서 결합 부위와 상보적 태그를 생성시키기 위한 분할 단백질 접근법이 특히 유용하다. 이러한 결합 부위/태그 쌍은 일반적으로 한 단백질의 단편이 다른 잠재적 상대보다 그의 고유의 상대(즉, 그것이 유래된 단백질의 상보적인 부분)에만 우선적으로 또는 단독으로 결합하기 때문에 직교한다. 이러한 원리는 예를 들어 문헌[Reddington & Howarth, Curr. Op. Chem. Biol. 29, 94-99 (2015)] 및 문헌[Keeble et al, PNAS 2019 116(52) 26523]에 논의되어 있다.
바람직하게, 상기 제1 결합 부위 및 상기 제2 결합 부위 중 하나는 분할된 스트렙토코커스 파이오게네스(Streptococcus pyogenes) 피브로넥틴-결합 단백질 도메인을 포함하고, 상기 제1 결합 부위 및 상기 제2 결합 부위 중 나머지 하나는 분할된 스트렙토코커스 뉴모니에(Streptococcus pneumoniae) 부착소 도메인을 포함한다.
바람직하게, 제1 단백질 도메인 및 제1 폴리펩타이드 표적, 및 제2 단백질 도메인 및 제2 폴리펩타이드 표적은 각각 WO 2016/193746 A1, WO 2018/197854 A1, WO 2018/189517 A1, 문헌[Keeble et al. (PNAS 116(52), 2019: 26523-26533)], 문헌[Fierer et al. (PNAS 111(13), 2014: E1176-E1181]에 개시된 것과 같은 펩타이드 링커 쌍을 포함할 수 있다.
바람직하게, 상기 제1 결합 부위와 상기 제2 결합 부위는 각각 독립적으로 서열번호 4 내지 9, 11 내지 13, 23 또는 15 내지 18 중 어느 하나에 대해 적어도 50%의 아미노산 동일성을 갖는다.
바람직하게는, 상기 제1 결합 부위/폴리펩타이드 표적 쌍 및 제2 결합 부위/폴리펩타이드 표적 쌍은 각각 독립적으로 하기의 조합으로부터 선택된다: (i) 서열번호 4, 6 또는 8 중 어느 하나와 서열번호 5, 7 또는 9 중 어느 하나; (ii) 서열번호 12와 서열번호 13 또는 15; (iii) 서열번호 5와 서열번호 11; (iv) 서열번호 15와 서열번호 16); (v) 서열번호 17과 서열번호 18; 또는 (vi) 서열번호 23과 서열번호 16).
보다 바람직하게, 제1 단백질 도메인 및 제1 폴리펩타이드 표적, 및 제2 단백질 도메인 및 제2 폴리펩타이드 표적은 각각 독립적으로 하기의 쌍으로부터 선택된다.
단백질 도메인 및 표적화 도메인은, 표적화 도메인에 특이적으로 결합하는 단백질 도메인의 능력을 유지하면서, 상기 제시된 서열과 적어도 50% 아미노산 동일성, 예를 들어 적어도 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99% 또는 100% 아미노산 동일성을 가질 수 있다.
일부 실시양태에서, 제1 결합 부위는 단백질 도메인이고, 제1 표적은 제1 단백질 도메인에 결합하는 태그이고; 제2 결합 부위는 단백질 도메인이고, 제2 표적은 제2 단백질 도메인에 결합하는 태그이다. 일부 실시양태에서, 제1 결합 부위는 태그이고, 제1 표적은 제1 태그에 결합하는 단백질 도메인이고; 제2 결합 부위는 태그이고, 제2 표적은 제2 태그에 결합하는 단백질 도메인이다. 일부 실시양태에서, 제1 결합 부위는 단백질 도메인이고, 제1 표적은 제1 단백질 도메인에 결합하는 태그이고; 제2 결합 부위는 태그이고, 제2 표적은 제2 태그에 결합하는 단백질 도메인이다. 바람직하게는, 제1 및 제2 결합 부위 둘 다는 단백질 도메인이고, 제1 및 제2 표적은 각각 제1 및 제2 단백질 도메인에 특이적으로 결합하는 태그이다.
더욱 바람직하게 제1 단백질 도메인 및 제1 폴리펩타이드 표적, 및 제2 단백질 도메인 및 제2 폴리펩타이드 표적은 각각 독립적으로 하기의 쌍으로부터 선택된다.
단백질 도메인 및 표적화 도메인은, 표적화 도메인에 특이적으로 결합하는 단백질 도메인의 능력을 유지하면서, 상기 제시된 서열과 적어도 50% 아미노산 동일성, 예를 들어 적어도 60%, 70%, 80%, 90%, 95%, 97%, 98%, 99% 또는 100% 아미노산 동일성을 가질 수 있다.
상기 결합 그룹 및 표적은 하기의 하위 그룹으로 나뉠 수 있다:
하위그룹 A:
- SpyCatcher(서열번호 4)/SpyTag(서열번호 5);
- SpyCatcher(서열번호 4)/SpyTag002(서열번호 7);
- SpyCatcher(서열번호 4)/SpyTag003(서열번호 9);
- SpyCatcher002(서열번호 6)/SpyTag(서열번호 5);
- SpyCatcher002(서열번호 6)/SpyTag002(서열번호 7);
- SpyCatcher002(서열번호 6)/SpyTag003(서열번호 9);
- SpyCatcher003(서열번호 6)/SpyTag003(서열번호 5);
- SpyCatcher003(서열번호 6)/SpyTag003(서열번호 7);
- SpyCatcher003(서열번호 8)/SpyTag003(서열번호 9);
- SpyTag(서열번호5)/K-tag(서열번호 11)(SpyLigase: (서열번호 10)에 의해 매개됨).
하위그룹 B:
- SnoopCatcher(서열번호 12)/SnoopTag(서열번호 13);
- SnoopCatcher(서열번호 12)/SnoopTagJr(서열번호 15);
- SnoopTagJr(서열번호 15)/DogTag(서열번호 16)(SnoopLigase(서열번호 14)에 의해 매개됨);
- DogCatcher(서열번호 23)/DogTag(서열번호 16).
하위그룹 C:
- Pilin-C(서열번호 17)/IsopepTag(서열번호 18).
바람직하게, 제1 결합 부위/표적 쌍은 하위그룹 A로부터 선택되고, 제2 결합 부위/표적 쌍은 하위그룹 B 및 하위그룹 C로부터 선택되거나; 또는 제1 결합 부위/표적 쌍은 하위그룹 B로부터 선택되고, 제2 결합 부위/표적 쌍은 하위그룹 A 및 하위그룹 C로부터 선택되거나; 또는 제1 결합 부위/표적 쌍은 하위그룹 C로부터 선택되고 제2 결합 부위/표적 쌍은 하위그룹 A 및 하위그룹 B로부터 선택된다.
더욱 더 바람직하게, 제1 단백질 도메인 - 폴리펩타이드 표적 쌍 및 제2 단백질 도메인 - 폴리펩타이드 표적은 (i) SpyCatcher/SpyTag 및 SnoopCatcher/SnoopTag; (ii) SpyCatcher002/SpyTag002 및 SnoopCatcher/SnoopTag; (iii) SpyCatcher003/SpyTag003 및 SnoopCatcher/SnoopTag; (iv) SpyCatcher/SpyTag 및 Pilin-C/Isopeptag; (v) SpyCatcher002/SpyTag002 및 Pilin-C/Isopeptag; (vi) SpyCatcher003/SpyTag003 및 Pilin-C/Isopeptag; (vii) Pilin-C/Isopeptag 및 SnoopCatcher/SnoopTag; (viii) SpyCatcher/SpyTag 및 SnoopTagJr/DogTag; (ix) SpyCatcher002/SpyTag002 및 SnoopTagJr/DogTag; (x) SpyTag/K-tag 및 SnoopCatcher/SnoopTag; (xi) SpyTag/K-tag 및 SnoopTagJr/DogTag; (xii) SpyTag/K-tag 및 Pilin-C/Isopeptag; 및 (xiii) SnoopTagJr/DogTag 및 Pilin-C/Isopeptag; 및 (xiv) SpyCatcher003/SpyTag003 및 DogCatcher/DogTag; 및 (xv) SpyCatcher003/SpyTag002 및 DogCatcher/DogTag; 및 (xvi) SpyCatcher003/SpyTag 및 DogCatcher/DogTag; (xvii) SpyCatcher003/SpyTag003 및 SnoopCatcher/SnoopTagJr; 및 (xviii) SpyCatcher003/SpyTag002 및 SnoopCatcher/SnoopTagJr; 및 (xix) SpyCatcher003/SpyTag 및 SnoopCatcher/SnoopTagJr로 이루어지는 그룹으로부터 선택될 수 있다.
당업자는 SpyLigase/SpyTag/K-tag, 또는 SnoopLigase/SnoopTagJr/DogTag가 사용될 때 '리가제'가 상기 두 태그의 부착을 촉매화한다는 것을 이해할 것이다. 따라서, 제1 결합 부위와 제1 폴리펩타이드 표적, 및 제2 결합 부위와 제2 폴리펩타이드 표적은 상기 2개의 '태그'로부터 선택된다. 리가제는 상기 2개의 '태그'의 부착을 촉매화하기 위해 외부적으로 첨가될 수 있거나, 다가 단백질 스캐폴드와 유전적으로 융합되는 것과 같이 비-공유결합적으로 또는 공유결합적으로 다가 단백질 스캐폴드와 연관될 수 있다. 태그 중 어느 것이 다가 단백질 스캐폴드 내에 포함되는지는 상호 교환 가능하다.
다른 결합 부위/태그 쌍은 SdyTag/SdyCatcher(문헌[Tan et al, PLOS One 11(1) e0165704)]) 및 클로스트리디움 페르프린젠스(Clostridium perfringens) 세포-표면 부착 단백질 Cpe0147로부터 유래된 Cpe0147 439-563/Cpe0147 565-587 쌍(문헌[Young et al, Chem Comm.53(9) 1502])을 포함한다.
결합 부위와 그의 표적 사이의 결합과 관련하여 본원에서 사용된 바와 같은 "특이적으로 결합한다"는 결합 부위가 관련되지 않은 대조군에 결합하는 것보다 더 큰 친화력으로 상보적인 결합 부위에 결합하는 능력을 지칭한다. 관련되지 않은 대조군은 관련되지 않은 대조군 단백질일 수 있다. 예를 들어, SnoopCatcher는 관련되지 않은 조절 단백질에 결합하는 것보다 더 큰 친화력으로 SnoopTag에 특이적으로 결합한다. 결합은 바람직하게는 이소펩타이드 결합의 형성과 같은 공유결합이다. 바람직하게는, 대조용 단백질은 소 혈청 알부민이고, 결합 부위는 대조용 단백질보다 적어도 10배, 적어도 50배, 적어도 100배, 적어도 500배 또는 적어도 1000배 더 큰 친화도로 상보적 결합 부위에 결합한다. 친화도는 당업계에 공지된 방법에 의해 결정될 수 있다. 예를 들어, 친화도는 ELISA 분석, 생물층 간섭법, 표면 플라스몬 공명, 동역학 방법 또는 평형/용액 방법에 의해 결정될 수 있다. 당업자는 본 발명의 방법에 사용될 수 있는 단백질 복합체를 생성하기 위해 특이적으로 결합하는 결합 부위 쌍을 인식할 것이다.
적어도 하나의 제1 결합 부위(들) 및 적어도 하나의 제2 결합 부위(들)는 바람직하게는 항체 또는 항체 단편을 포함하지 않는다. 적어도 하나의 제1 결합 부위(들) 및 적어도 하나의 제2 결합 부위(들)는 더욱 바람직하게는 Fab 또는 Fc 영역과 같은 항체의 항원-결합 단편을 포함하지 않는다.
본원의 '표적'에 결합하는 '결합 부위'에 관한 모든 논의에서, 당업자는 화학적 결합 그룹이 가역적이라는 것을 쉽게 이해할 것이다. 즉, 상기의 결합은 결합 부위의 반응기 A와 해당 결합 부위에 대한 표적의 상응하는 반응기 B의 반응 측면에서 설명된 반면, 결합 부위의 반응기 B가 표적의 반응기 A와 반응하는 등가 화학이 가능하다.
다가 단백질 스캐폴드가 단백질 도메인, 예를 들어 다가 단백질 스캐폴드의 올리고머성 코어의 단량체 서브유닛에 부착된 단백질 도메인인 하나 이상의 결합 부위를 포함하는 경우, 단백질 도메인은 임의의 적합한 수단에 의해 다가 단백질 스캐폴드에 부착될 수 있다(예를 들어, 다가 단백질 스캐폴드의 올리고머성 코어의 단량체 서브유닛에 부착될 수 있음).
결합 부위는 링커에 의해 다가 단백질 스캐폴드에 부착될 수 있다(예를 들어 다가 단백질 스캐폴드의 올리고머성 코어의 단량체 서브유닛에 부착될 수 있음). 한 실시양태에서, 동일한 링커가 올리고머성 코어의 서브유닛 단량체의 각 말단에 사용될 수 있다. 다른 실시양태에서, 올리고머성 코어의 서브유닛 단량체의 각 말단에 상이한 링커가 사용될 수 있다.
결합 부위는 바람직하게는 올리고머성 코어(또는 서브유닛 단량체)에 공유결합적으로 부착된다. 공유 결합은 예를 들어 펩타이드 결합, 다이설파이드 결합 또는 클릭 화학 결합일 수 있다. 더욱 바람직하게, 공유 결합은 적어도 하나의 아미노산, 즉 펩타이드 링커를 포함하고, 결합 부위에서 서브유닛 단량체와 동일한 폴리펩타이드 쇄의 일부를 형성한다.
다가 단백질 스캐폴드의 올리고머성 코어의 단량체 서브유닛에 결합 부위를 부착하는 데 사용되는 펩타이드 링커는 서브유닛 단량체 및/또는 결합 부위에 유전적으로 융합될 수 있다. 링커가 서브유닛 단량체 및/또는 단일 폴리뉴클레오타이드 암호화 서열로부터의 결합 부위를 갖는 단일 구성체로서 발현된다면 링커는 유전적으로 융합된 것이다. 펩타이드 링커의 길이, 유연성 및 친수성은 전형적으로 결합 부위가 올리고머성 코어 또는 다가 단백질 스캐폴드의 동일 면 상에 위치할 수 있도록 설계된다. 펩타이드 링커는 전형적으로 결합 부위의 방향성 테더링을 허용한다.
결합 부위를 단량체 서브유닛에 연결하는데 사용하기에 적합한 펩타이드 링커는 전형적으로 길이가 1 내지 100, 1 내지 50, 1 내지 25, 1 내지 20, 1 내지 15, 또는 1 내지 10개 아미노산이다. 링커는 예를 들어 하기의 아미노산 중 하나 이상으로 구성될 수 있다: 리신, 세린, 아르기닌, 프롤린, 글리신 및 알라닌. 적합한 유연성 펩타이드 링커의 예는 2 내지 20개, 예를 들어 4, 6, 8, 10 또는 16개의 세린 및/또는 글리신 아미노산의 스트레치이다. 강성 링커의 예는 2 내지 30, 예를 들어 4, 6, 8, 16 또는 24개 프롤린 아미노산의 스트레치이다. 적합한 링커의 예는 하기를 포함하지만 이에 제한되지는 않는다: GGGS, PGGS, PGGG, RPPPPP, RPPPP, VGG, RPPG, PPPP, RPPG, PPPPPPPPP, PPPPPPPPPPPP, RPPG, GG, GGG, SG, SGSG, SGSGSG, SGSGSGSG, SGSGSGSGSG 및 SGSGSGSGSGSGSGSG(여기서 G는 글리신이고, P는 프롤린이고, R은 아르기닌이고, S는 세린이고, V는 발린이다). 다른 예시적인 링커는 GSGS, GGGGS, GGGGSGGGGS 및 GGGGSGGGGSGGGGS를 포함한다. 적절한 연결 그룹은 기존 모델링 기술을 사용하여 설계될 수 있다. 링커는 전형적으로 결합 부위와 단량체 서브유닛이 각각의 단백질 올리고머로 조립될 수 있도록 충분히 유연하다.
다가 단백질 스캐폴드의 올리고머성 코어는 바람직하게는 서브유닛 단량체의 말단에 적어도 하나의 제1 결합 부위, 및 서브유닛 단량체의 말단에 적어도 하나의 제2 결합 부위를 포함한다. 예를 들어, 제1 결합 부위는 서브유닛 단량체의 제1 말단에 위치할 수 있고, 제2 결합 부위는 서브유닛 단량체의 제2 말단에 위치할 수 있다.
말단은 바람직하게는 임의의 링커 또는 결합 부위를 포함하지 않고 올리고머성 코어의 서브유닛 단량체의 말단을 참조하여 결정된다. 더욱 바람직하게, 서브유닛 단량체의 말단은 서브유닛 단량체의 N-말단 및/또는 C-말단으로부터 선택된다. 결합 부위(예를 들어, 단백질 도메인)가 서브유닛 단량체와 동일한 폴리펩타이드의 일부를 형성하는 경우, N-말단 및 C-말단은 바람직하게는 결합 부위가 없는 단량체의 각 말단에 해당하는 아미노산에 관련된다. 유사하게, 링커가 서브유닛 단량체와 동일한 폴리펩타이드의 일부를 형성하는 경우, N-말단 및 C-말단은 바람직하게는 링커가 없는 단량체의 각각의 말단에 상응하는 아미노산과 관련된다.
바람직하게는, 결합 부위가 부착되는 서브유닛 단량체의 말단은 상기에서 더 상세히 정의된 바와 같이 올리고머성 코어 또는 다량체 단백질 스캐폴드의 동일 면 상에 있다.
일부의 경우, 올리고머성 코어는 단지 주어진 면 상의 각 서브유닛 단량체의 단일 말단만을 포함한다. 이 경우, 적어도 하나의 제1 결합 부위 및 적어도 하나의 제2 결합 부위는 전형적으로 둘 다 동일한 말단에 부착되어 다가 단백질 스캐폴드의 동일 면 상에 존재한다. 예를 들어, 올리고머성 코어는 복수의 서브유닛 단량체를 포함할 수 있고, 각각의 서브유닛 단량체는 상기 단량체의 제1 말단에 부착된 제1 결합 부위 및 상기 제1 결합 부위에 부착된 제2 결합 부위를 포함한다. 올리고머성 코어는 복수의 서브유닛 단량체를 포함할 수 있으며, 여기서 적어도 하나의 제1 결합 부위(들)는 제1 서브유닛 단량체의 제1 말단에 부착되고 적어도 하나의 제2 결합 부위(들)는 제2 서브유닛 단량체(예를 들어, 이종올리고머성 코어)의 제2 말단에 부착된다. 올리고머성 코어는 상기에서 설명한 부착 방법의 조합을 포함할 수 있다.
다가 단백질 스캐폴드의 올리고머성 코어 내의 서브유닛 단량체는 바람직하게는 각각 단량체의 단일 면(및 이에 의해 올리고머성 코어 및 다가 단백질 스캐폴드의 단일 면)에 2개의 말단을 포함한다. 2개의 말단은 바람직하게는 단량체 폴리펩타이드의 N-말단 및 C-말단이다. 각각의 단량체는 더욱 바람직하게는 상기 단량체의 제1 말단에 부착된 제1 결합 부위 및 상기 단량체의 제2 말단의 제2 결합 부위를 포함한다. 제1 및 제2 결합 부위는 각각 N-말단 및 C-말단이거나, 각각 C-말단 및 N-말단일 수 있다.
때때로, 단량체는 각 말단에 하나 초과의 결합 부위를 포함할 수 있다. 예를 들어, 서브유닛 단량체는 각 말단에 하기를 포함할 수 있다: (i) 상기 단량체의 말단에 부착된 제1 결합 부위 및 상기 제1 결합 부위에 부착된 제2 결합 부위, 또는 이와 역으로, (ii) 상기 단량체의 말단에 부착된 제1 결합 부위 및 상기 제1 결합 부위에 부착된 적어도 하나의 추가의 제1 결합 부위, (iii) 상기 단량체의 말단에 부착된 제2 결합 부위 및 상기 제2 결합 부위에 부착된 적어도 하나의 추가의 제2 결합 부위, (iv) 상기 단량체의 말단에 부착된 단일의 제1 또는 제2 결합 부위.
다가 단백질 스캐폴드의 결합 부위 위치 지정
상기에서 설명한 바와 같이, 본원에 제공된 다가 단백질 스캐폴드에서 적어도 하나의 제1 결합 부위(들) 및 적어도 하나의 제2 결합 부위(들)는 스캐폴드의 동일 면 상에 위치한다. 마찬가지로, 다중-도메인 폴리펩타이드 구성체의 전형적인 실시양태에서, 제1 결합 도메인과 제2 결합 도메인은 폴리펩타이드 구성체의 동일 면 상에 위치한다.
다가 단백질 스캐폴드(또는 다중-도메인 폴리펩타이드 구성체)의 동일 면 상에 위치함으로써, 적어도 하나의 제1 결합 부위(들) 및 적어도 하나의 제2 결합 부위(들)는 효과기 모이어티가 궁극적으로 결합되도록 배열된다. 결합 부위를 통해 다가 단백질 스캐폴드에 결합된 단백질은 단일 표면 또는 평면에서 각각의 생물학적 표적(예를 들어, 세포 표면의 수용체)과 상호작용할 수 있다.
적어도 하나의 제1 결합 부위(들) 및 적어도 하나의 제2 결합 부위(들)는 다가 단백질 스캐폴드(또는 다중-도메인 폴리펩타이드 구성체)의 동일 면 상에 위치한다. 바람직하게는, 적어도 하나의 제1 결합 부위(들) 및 적어도 하나의 제2 결합 부위(들)는 올리고머성 코어의 동일 면 상에 위치한다. 바람직하게, 적어도 하나의 제1 결합 부위(들) 및 적어도 하나의 제2 결합 부위(들)는 이들이 부착되는 서브유닛 단량체(들)의 동일 면 상에 위치한다. 본원에 기재된 바와 같이, 서브유닛 단량체는 전형적으로 다중-도메인 폴리펩타이드 구성체의 구조 도메인이다.
"적어도 하나의 제1 결합 부위(들) 및 적어도 하나의 제2 결합 부위(들)는 스캐폴드의 동일 면 상에 위치한다"라는 용어는 도 1 및 2를 참조하여, 하기와 같이 이해될 수 있다.
다가 단백질 스캐폴드(1) 또는 올리고머성 코어(10)는 코어의 단량체 수에 해당하는 개념적 회전 대칭축(20)을 포함한다. 예를 들어, 동종삼량체 코어는 C3 대칭축을 포함한다. 예를 들어, 동종 올리고머 오량체 코어는 C5 대칭축을 포함한다. 유사하게 이종올리고머성 코어는 올리고머성 코어의 중심을 통과하고 각 서브유닛 사이의 경계면에 평행한 개념적 회전축을 포함한다, 예를 들어 이종이량체의 회전축은 올리고머성 코어를 통과하고 단량체 간 계면의 길이에 평행하고; 이종삼량체의 회전축은 올리고머성 코어를 통과하며 단량체 사이의 적어도 2개 계면의 길이에 가능한 한 평행하다. 평면(21)은 회전축에 수직 또는 대략 수직(예를 들어, 약 80°내지 약 100°, 예를 들어 약 85°내지 약 95°, 예를 들어 약 88°내지 약 92°, 예를 들어 약 90°)이고 올리고머성 코어의 중심을 통과하는 것으로서 정의될 수 있다. 적어도 하나의 제1 결합 부위(들)(11) 및 적어도 하나의 제2 결합 부위(들)(12)는 해당 평면의 동일한 측면에 위치하므로 다가 단백질 스캐폴드(1)의 동일 면 상에 위치한다. 이는 도 1에 개략적으로 예시되어 있으며, 도면은 삼량체 올리고머성 코어를 묘사하고 명확성을 위해 단지 하나의 제1 결합 부위와 하나의 제2 결합 부위만 도시하고 있다. 대조적으로, 도 2는 적어도 하나의 제1 결합 부위(들)(11) 및 적어도 하나의 제2 결합 부위(들)(12)가 평면(21)의 대향면에 위치하고, 따라서 다가 단백질 스캐폴드(1)의 대향면 상에 위치한다.
당업자는 올리고머성 코어의 단량체가 예를 들어 본원에 기재된 바와 같이 공유결합적으로 융합되어 연결되는 경우에도 개념적 대칭축이 유지된다는 것을 인식할 것이다.
따라서, "단백질 스캐폴드의 동일한 면"은 다가 단백질 스캐폴드의 올리고머성 코어의 최고차 회전 대칭축에 수직이고 다가 단백질 스캐폴드의 중심을 통과하는 평면의 한쪽 면에 있는 다가 단백질 스캐폴드의 용매 접근 가능 표면일 수 있다. 유사하게, 올리고머성 코어의 면은 올리고머성 코어의 최고차 회전 대칭축에 수직이고 올리고머성 코어의 중심을 통과하는 평면의 한쪽 면에 있는 올리고머성 코어의 용매 접근 가능한 표면(바람직하게는 상기에 부착된 결합 부위가 없는 경우에 정의됨)일 수 있다.
바람직하게, 다가 단백질 스캐폴드의 면은 단일 표면, 예를 들어 세포벽, 세포막 또는 단백질 복합체와 같은 세포 표면과 접촉하는 다가 단백질 스캐폴드의 용매-접근 가능한 부분이다. 따라서, 도 3의 개략도(명확성을 위해 다가 단백질 스캐폴드(1)의 올리고머성 코어(10)에 부착된 복수의 제1 및 제2 결합 부위(11, 12)를 도시함)를 참조하면, 적어도 하나의 제1 결합 부위(들)(11) 및 적어도 하나의 제2 결합 부위(들)(12)는 바람직하게는 둘 다 상기 표면(30)과 접촉할 수 있도록 다가 단백질 스캐폴드(1) 상에 위치한다. 이는 도 4에 개략적으로 도시된 바와 같이, 적어도 하나의 제1 결합 부위(들)(11) 및 적어도 하나의 제2 결합 부위(들)(12)가 다가 단백질 스캐폴드(1)의 반대면에 위치하는 경우에는 불가능하다. 예를 들어, 제1 결합 부위(들)는 표면(30)과 접촉할 수 있지만 제2 결합 부위는 표면(30)과 접촉할 수 없을 수 있다.
적어도 하나의 제1 결합 부위(들) 및 적어도 하나의 제2 결합 부위(들)는 바람직하게는 정면-정면 배향 또는 측면-정면 배향, 또는 그 사이의 임의의 위치로 배열된다. 본원에 사용된 바와 같이, 정면-정면 배향은 제1 결합 부위(들) 및 제2 결합 부위(들) 모두가 단백질 스캐폴드의 동일 면 상에 위치하여 다가 단백질 스캐폴드를 통해 회전 대칭축에 실질적으로 평행하게 부착되는 것을 지칭한다. 이는 도 5에 도식적으로 예시되어 있다. 측면-정면 배향은 제1 결합 부위(들) 및 제2 결합 부위(들) 중 하나가 다가 단백질 스캐폴드를 통한 회전 대칭 축에 실질적으로 평행하게 부착된 다가 단백질 스캐폴드의 면에 위치하고; 제1 결합 부위(들) 및 제2 결합 부위(들) 중 나머지 하나는 모두 다가 단백질 스캐폴드를 통해 회전 대칭축에 실질적으로 수직으로 부착된(즉, 평면(21)에 실질적으로 평행하게) 다가 단백질 스캐폴드의 동일 면 상에 위치한다. 이는 도 6에 도식적으로 예시되어 있다. 물론, 이들 극단 사이의 임의의 위치가 사용될 수 있다, 예를 들어 제1 결합 부위(들) 및/또는 제2 결합 부위(들)가 다가 단백질 스캐폴드를 통해 회전 대칭축에 약 45°로 부착된 다가 단백질의 동일 면 상에 위치하는 경우. 이는 도 7에 개략적으로 묘사되어 있다.
당업자는 하나 이상의 제1 결합 부위(들)(11)과 축(20) 사이의 각도 및 하나 이상의 제2 결합 부위(들)(12)와 축(20) 사이의 각도가 동일할 필요는 없음을 이해할 것이다. 예를 들어, 하나 이상의 제1 결합 부위(들)(11)는 다가 단백질 스캐폴드의 "정면"에 있을 수 있고, 하나 이상의 제2 결합 부위(들)(12)는 다가 단백질 스캐폴드의 "측면"에 있을 수 있다(즉, 상기에서 설명한 대로 정면-측면 배향). 대안적으로, 하나 이상의 제1 결합 부위(들)(11)는 다가 단백질 스캐폴드의 "측면"에 있을 수 있고 하나 이상의 제2 결합 부위(들)(12)는 다가 단백질 스캐폴드의 "정면"에 있을 수 있다(즉, 상기에서 설명한 대로 측면-정면 배향). 하나 이상의 제1 결합 부위(들)(11) 및 하나 이상의 제2 결합 부위(들)(12)는 모두 다가 단백질 스캐폴드의 "정면"에 있을 수 있다(즉, 상기에서 설명한 대로 정면-정면 배향).
제1 및 제2 결합 부위(들)가 모두 다가 단백질 스캐폴드의 동일 면 상에 존재한다는 조건하에서, 제1 및 제2 결합 부위 모두가 주어진 서브유닛 단량체(2)에 부착되는 경우, 전형적으로 제1 및 제2 결합 부위(들)와 해당 단량체 중심 사이에 형성된 각도(도 8에서 X로 표시됨)는 최대 160°각도, 예를 들어 최대 140°각도, 예를 들어 최대 120°각도, 예를 들어 최대 100°각도 또는 최대 90°각도이다. 전형적으로, 제1 및 제2 결합 부위(들)와 해당 단량체의 중심 사이에 형성된 각도는 적어도 10°각도, 예를 들어 적어도 20°각도, 예를 들어 적어도 30°각도, 예를 들어 적어도 45°각도 또는 최소 60°각도이다.
구조를 또한 단백질 구조 데이터(NMR, X-Ray) 또는 구조 예측에서 결정된 바와 같이 올리고머성 코어의 표면과 교차하지 않도록, 임의의 위치에 3D 좌표계의 평평한 표적 평면을 배치하여 시각화할 수 있다. 각각의 융합 부위에 대해, (원래의 융합 부위 이외의) 올리고머성 코어의 표면과 교차하지 않는 표적 평면까지의 최단 경로 거리를 결정할 수 있다. 바람직하게는, 주어진 구조에 대해, 이러한 최단 경로가 모두 표적 평면에 직교하는 가장 긴 단백질 단면의 50%, 45% 또는 40% 미만이 되도록 표적 평면의 위치를 찾을 수 있다.
일부 실시양태에서, 동일한 평면과 접촉하는 최대 최단 경로 길이는 100 ㎚ 미만, 예를 들어 50 ㎚ 미만, 예를 들어 20 ㎚ 미만, 예를 들어 10 ㎚ 미만, 예를 들어 5 ㎚ 미만, 예를 들어 2 ㎚ 미만이다. 바람직한 상황에서, 표적 평면까지의 모든 최단 경로 길이는 50 ㎚ 미만, 예를 들어 25 ㎚ 미만, 예를 들어 10 ㎚ 미만, 예를 들어 5 ㎚ 미만의 반경을 갖는 표적 평면상의 원형 영역 내에서 끝난다.
일부 실시양태에서, 스캐폴드 코어에 융합된 단백질의 시스-배향은 구조 예측을 통해 결정될 수 있다. Alphafold는 거리뿐 아니라 링커 기하 구조 및 융합된 결합 도메인과 스캐폴드 코어 단백질 간의 상호작용도 고려할 수 있다. 바람직하게는, 스캐폴드 코어는 링커를 통해, 바람직하게는 짧은 링커를 통해, 예를 들어 GSGS를 통해, 예를 들어 GGGGS를 통해, 예를 들어 GGGGSGGGGS를 통해, 예를 들어 GGGGSGGGGSGGGGS를 통해 바람직한 결합 부위에 융합한 후에조차 그의 올리고머화 특성을 유지할 것으로 예상되며, 결합 부위는 대략 시스 기하학으로 표시될 것으로 예상된다.
도메인 삽입
다가 단백질 스캐폴드는 복수의 서브유닛 단량체를 포함하는 올리고머성 코어, 및 적어도 하나의 제2 결합 부위에 직교하는 적어도 하나의 제1 결합 부위를 포함하며, 바람직하게는 적어도 하나의 제1 결합 부위 및 적어도 하나의 제2 결합 부위는 다가 단백질 스캐폴드의 같은 면에 위치한다. 다가 단백질 스캐폴드는 도메인 삽입을 추가로 포함할 수 있다. 도메인 삽입은 단백질 도메인이다. 도메인 삽입은 결합 부위와 동일한 다가 단백질 스캐폴드의 면에 위치하거나 다른 면에 위치할 수 있다.
올리고머성 코어 및/또는 서브유닛 단량체가 결합 부위에 부착되지 않은 적어도 하나의 자유 말단을 포함하는 일부 경우에, 다가 단백질 스캐폴드는 자유 말단에 도메인 삽입을 포함한다. 도메인 삽입은 또한 올리고머성 코어의 루프 영역 내에 위치할 수 있으므로, 다수가 서브유닛 단량체의 루프 영역 내에 위치한다. 바람직하게, 다량체 단백질 스캐폴드는 결합 부위가 위치하는 면에 대해 올리고머성 코어 및/또는 다량체 단백질 스캐폴드의 대향면에, 예를 들어 축의 대향 단부의 90°이내에 적어도 하나의 도메인 삽입을 포함한다.
본원에 사용된 도메인 삽입은 단백질 도메인, 즉 단백질의 자율적으로 폴딩되는 기능 단위를 암호화하는 폴리펩타이드 서열이다. 도메인 삽입은 올리고머성 코어 또는 결합 부위의 구조 및 폴딩을 방해하지 않는다.
도메인 삽입은 바람직하게는 효과기 기능을 갖는다. 도메인 삽입은 항체, 항체 단편 또는 CD3 또는 CD16에 결합할 수 있는 항원-결합 단편과 같은 항원-결합 단편을 포함할 수 있다. 예를 들어, 도메인 삽입은 사이토카인과 같은 면역 조절 단백질, 화학요법제, 또는 암 면역요법제(즉, 암을 치료하기 위해 피험자의 면역체계를 이용하는 치료)에 결합할 수 있다. 도메인 삽입은 생물학적 시스템과 접촉할 때 세포 사멸을 유도하는 단백질을 형성할 수 있다. 도메인 삽입은 세포자멸사를 유도하거나, 항종양 반응을 증가시키거나, 다른 유익한 활성을 가질 수 있다. 도메인 삽입은 보체 억제 또는 보체 자극 활성을 가질 수 있다.
의심의 여지를 없애기 위해, 도메인 삽입은 일반적으로 본원에 기재된 바와 같이 다중-도메인 폴리펩타이드 구성체의 구조 도메인 내로 이루어진다.
단백질 복합체
또한, 본원에서는, 적어도 하나의 제1 효과기 모이어티 및 적어도 하나의 제2 효과기 모이어티에 부착된, 본원에 더 상세히 기재된 다가 단백질 스캐폴드를 포함하는 단백질 복합체가 제공된다. 각각의 제1 효과기 모이어티는 다가 단백질 스캐폴드 상의 제1 결합 부위에 결합된 제1 표적에 부착된다. 각각의 제2 효과기 모이어티는 다가 단백질 스캐폴드 상의 제2 결합 부위에 결합된 제2 표적에 부착된다.
표적은 바람직하게는 폴리펩타이드 표적이고, 더욱 바람직하게는 상기 기재된 펩타이드 링커 쌍의 상대이다.
각각의 효과기 모이어티는 다가 단백질 스캐폴드에 결합되는 표적에 부착된다. 제1 및 제2 효과기 모이어티는 동일하거나 상이할 수 있으며, 바람직하게는 상이할 수 있다. 결합 부위와 관련하여 상기에 기재한 임의의 부착 경로가 사용될 수 있다. 당업자가 접근할 수 있는 전통적인 유기 화학 경로를 사용하여 각 효과기 모이어티를 다가 단백질 스캐폴드에 결합시키는 표적에 직접 부착시킬 수 있다. 적절한 화학적 접근법은 문헌[March's Advanced Organic Chemistry (Wiley 2020)]과 같은 교과서에 기재되어 있다.
바람직하게, 각각의 효과기 모이어티는 표적에 공유결합적으로 연결된다. 더욱 바람직하게, 표적은 폴리펩타이드 표적이고 효과기 모이어티에 유전적으로 융합될 수 있다. 달리 말하면, 바람직하게 하나 또는 각각의 효과기 모이어티는 단일 폴리펩타이드 쇄로서 발현되도록 동일한 폴리뉴클레오타이드에서 암호화됨으로써 폴리펩타이드 표적에 유전적으로 융합된다. 효과기는 제1 폴리펩타이드 표적, 절단 부위, 및 제2 폴리펩타이드 표적에 유전적으로 융합될 수 있으며, 여기서 제1 폴리펩타이드 표적은 제2 폴리펩타이드 표적에 직교한다. 절단 부위는 TEV 절단 부위일 수 있다. 제1 및 제2 폴리펩타이드 표적이 둘 다 효과기 모이어티에 존재할 때, 말단 폴리펩타이드 표적만이 기능적이다(즉, 다가 단백질 스캐폴드 상의 동족 결합 부위에 결합할 수 있음). 절단 부위는 단일 표적만이 존재하도록 말단 폴리펩타이드 표적을 분리하기 위해 사용될 수 있다. 효과기 모이어티의 완전한 접합 후, 말단 폴리펩타이드 표적이 특이적으로 배치될 수 있다.
효과기 모이어티는 바람직하게는 단백질 도메인이다. 단백질 도메인은 바람직하게는 가용성 단백질 도메인이다. 단백질 도메인은 바람직하게는 분비된 단백질의 도메인 또는 막관통 단백질의 세포외 도메인을 포함한다. 단백질 도메인은 더욱 바람직하게는 세포-표면 수용체의 세포외 도메인 또는 인간 세포-표면 수용체와 같은 세포-표면 수용체의 리간드를 포함한다.
효과기 모이어티는 바람직하게는 생물학적 시스템과 접촉될 때 치료 효과를 발휘하는 모이어티이다. 예를 들어, 효과기 모이어티는 사이토카인과 같은 면역 조절 단백질, 화학요법제, 또는 암 면역요법제(즉, 암을 치료하기 위해 피험자의 면역체계를 이용하는 치료)일 수 있다. 효과기 모이어티는 생물학적 시스템과 접촉할 때 세포 사멸을 유도할 수 있다. 효과기 모이어티는 세포자멸사를 유도하거나, 항종양 반응을 증가시키거나, 다른 유익한 활성을 가질 수 있다. 효과기 모이어티는 보체 억제 또는 보체 자극 활성을 가질 수 있다. 효과기 부분은 변경된 유전자 발현, 수용체 내재화, 사이토카인 방출, 세포 사멸 또는 치료제 분자에 대한 감수성을 초래할 수 있다.
하나의 실시양태에서, 효과기 모이어티는 합성 유기 또는 무기 분자일 수 있다. 적합한 분자는 화학요법제일 수 있다. 적합한 분자는 독성제, 예를 들어 약 100 μM 미만, 예를 들어 약 10 μM 미만, 예를 들어 약 1 μM 미만 또는 약 100 nM 미만의 EC50을 갖는 작용제일 수 있으며; 여기서 EC50은 적합한 세포 분석에서 평가할 때 50% 세포 독성을 초래하는데 필요한 작용제의 농도이다. 적합한 세포 분석은 예를 들어 설포로다민 B(SRB) 분석일 수 있다.
적합한 합성 분자는 효소 활성화제 또는 억제제일 수 있다. 적합한 분자는 세린/트레오닌/티로신 키나제, 기질 메탈로프로테이나제(MMP), 열 충격 단백질(HSP) 및 프로테아좀 중 하나 이상의 억제제일 수 있다. 적합한 분자는 알킬화제(예를 들어, 질소 머스타드, 나이트로소우레아, 테트라진, 아지리딘, 시스플라틴 및 이들의 유도체); 대사길항물질(예를 들어, 항엽산제, 플루오로피리미딘, 데옥시뉴클레오사이드 유사체 및 티오퓨린); 미세소관억제제(예를 들어, 빈카 알킬로이드 또는 탁산); 토포이소머라제 억제제(예를 들어, 이리노테칸 및 토포테칸과 같은 토포이소머라제 I 억제제; 에토포사이드, 독소루비신, 미톡산트론 및 테니포시델과 같은 토포이소머라제 II 독, 또는 노보비오신, 메르바론 및 아클라루비신과 같은 토포이소머라제 II 억제제) 또는 세포독성 항생제(예를 들어, 안트라사이클린 및 블레오마이신)로서 작용할 수 있다. 적합한 분자는 약 50 내지 약 5000 g/mol, 예를 들어 약 100 내지 약 1000 g/mol, 예를 들어 약 250 내지 약 500 g/mol의 분자 질량을 가질 수 있다.
다른 실시양태에서, 효과기 모이어티는 바람직하게는 항체 또는 이의 항원-결합 단편을 포함한다. 효과기 모이어티와 관련하여 본원에서 사용된 용어 '항체 또는 이의 항원-결합 단편'은 전체 항체(즉, 다이설파이드 결합에 의해 상호 연결된 2개의 중쇄 및 2개의 경쇄의 요소를 포함함)뿐만 아니라 그의 항원-결합 단편에도 관련될 수 있다. 항체는 전형적으로 면역글로불린(Ig) 분자, 즉 항원에 특이적으로 결합하는(면역반응하는) 항원-결합 부위를 함유하는 분자의 면역학적 활성 부분을 포함한다. 본원에 사용된 용어 "특이적으로 결합하다" 또는 "와 면역반응하다"는 항체 또는 이의 단편과 항원의 상호작용의 맥락에서, 항체가 다른 폴리펩타이드와 비교하여 목적하는 항원의 하나 이상의 항원 결정인자와 우선적으로 반응한다는 것을 의미한다. 각각의 중쇄는 중쇄 가변 영역(본원에서는 HCVR 또는 VH로 약칭함)과 하나 이상의 중쇄 불변 영역으로 구성된다. 각 경쇄는 경쇄 가변 영역(본원에서는 LCVR 또는 VL로 약칭함)과 경쇄 불변 영역으로 구성된다. 중쇄와 경쇄의 가변 영역에는 항원과 상호작용하는 결합 도메인이 포함되어 있다. VH 및 VL 영역은 상보성 결정 영역(CDR)으로 불리는 고가변성 영역, 프레임워크 영역(FR)으로 불리는 더욱 보존된 영역이 산재된 영역으로 더 세분될 수 있다. 항체는 다클론, 단클론, 키메라, dAb(도메인 항체), 단쇄, Fab, Fab' 및 F(ab')2 단편, scFv 및 Fab 발현 라이브러리를 포함할 수 있으나 이에 제한되지는 않는다. 항체는 예를 들어 단쇄 항체, 단쇄 가변 단편(scFv), 가변 단편(Fv), 단편 항원-결합 영역(Fab), 재조합 항체, 단클론 항체, 고유 항체 또는 압타머의 항원-결합 도메인을 포함하는 융합 단백질, VHH 항체라고도 공지된 단일-도메인 항체(sdAb), 나노바디(카멜리드 유래 단일-도메인 항체), VNAR이라고 불리는 상어 IgNAR-유래 단일-도메인 항체 단편, 다이아바디, 트라이아바디, 안티칼린, 압타머(DNA 또는 RNA) 및 이들의 활성 성분 또는 단편을 포함한다.
"Fab 단편"(항원-결합 단편 또는 Fab 영역이라고도 함)은 각각 경쇄 및 중쇄 상의 가변 도메인 VL 및 VH와 함께 경쇄의 불변 도메인(CL) 및 중쇄의 제1 불변 도메인(CH1)을 함유한다. 가변 도메인은 항원-결합에 관여하는 상보성 결정 루프(CDR, 고가변성 영역으로도 지칭됨)를 포함한다. Fab' 단편은 항체 힌지 영역으로부터의 하나 이상의 시스테인을 포함하는 중쇄 CHI 도메인의 카복시 말단에 몇 개의 잔기를 추가한다는 점에서 Fab 단편과 다르다.
"단쇄 Fv" 또는 "scFv"에는 항체의 VH 및 VL 도메인이 포함되며, 이들 도메인은 단일 폴리펩타이드 쇄에 존재한다. 하나의 실시양태에서, Fv 폴리펩타이드는 scFv가 항원-결합을 위해 목적하는 구조를 형성할 수 있게 하는 VH 도메인과 VL 도메인 사이에 폴리펩타이드 링커를 추가로 포함한다. scFv에 대한 검토는 하기의 문헌을 참조한다: 문헌[Pluckthun in The Pharmacology of Monoclonal Antibodies, vol. 113, Rosenburg and Moore eds., Springer-Verlag, New York, pp. 269-315 (1994)]. scFv 단편의 일례로서 항체 scFv 단편이 W093/16185; 미국특허 제5,571,894호; 및 미국특허 제5,587,458호에 기재되어 있다.
효과기 모이어티는 치료용 항체의 Fab 영역일 수 있다. 예를 들어, 효과기 모이어티는 무로모맙, 아브식시맙, 리툭시맙, 다클리주맙, 바실릭시맙, 팔리비주맙, 인플릭시맙, 트라스투주맙, 에타네르셉트, 젬투주맙, 알렘투주맙, 이브리토모맙, 아달리무맙, 알레파셉트, 오말리주맙, 토시투모맙, 에팔리주맙, 세툭시맙, 베바시주맙, 나탈리주맙, 라니비주맙, 파니투무맙, 에쿨리주맙 또는 세르톨리주맙과 같은 단클론 항체의 Fab 영역일 수 있다.
효과기 모이어티는 병리학적 상태, 예를 들어 본원에 기재된 병리학적 상태와 관련된 임의의 수용체를 표적화할 수 있다. 예를 들어, 효과기 모이어티는 그의 결합이 임상적 이점과 연관된 임의의 수용체, 예를 들어, 호르몬 수용체를 표적화할 수 있다.
일부 실시양태에서 효과기 모이어티는 병리학적 상태와 연관된 것으로 이전에 알려지지 않은 표적(예를 들어, 수용체)을 가질 수 있다. 예를 들어, 그러한 수용체의 표적화는 일부 경우에 치료적 이점을 갖는 것으로 밝혀졌다.
따라서 당업자는 본원에 제공된 단백질 복합체가 생물학적 시스템 내에서 2개의 표적을 동시에 연결하여 동시에 접촉하는 데 사용될 수 있음을 이해할 것이다. 표적은 예를 들어 동일한 세포로부터 유래할 수 있다. 예를 들어, 본원에 제공된 단백질 복합체는 동일한 세포 표면에 있는 2개의 다른 유형의 수용체에 결합하는 데 사용될 수 있다.
본원에 제공된 단백질 복합체는 전형적으로 다가 단백질 스캐폴드 상의 복수의 제1 결합 부위 및 복수의 제2 결합 부위를 포함하며; 따라서 복수의 제1 효과기 모이어티 및 복수의 제2 효과기 모이어티에 결합할 수 있다. 이는 이러한 "고 결합가" 화합물이 개선되거나 이전에 볼 수 없었던 효과기 기능을 허용할 수 있기 때문에 특히 유익하다. 단일 효과기 모이어티의 다중 사본이 생물학적 시스템과 접촉될 때 개선된 치료 반응으로 이어질 수 있다는 것이 앞서 밝혀졌다(예를 들어 문헌[Brune et al.](상기); 및 문헌[Khairil Anuar et al., Nature communications 10.1 (2019): 1-13]). 그러나 복수의 서로 다른 효과기 모이어티의 복수의 사본을 접촉시키는 것은 본원에 제공된 단백질 복합체에 의해 해결되는 복잡한 기술적 과제이다.
일부 실시양태에서 효과기 기능은 효과기 모이어티의 조합과 이와 접촉된 생물학적 시스템의 상호작용의 결과로서만 발생할 수 있다. 예를 들어, 제1 효과기 모이어티(예를 들어, 제1 결합 부위에 부착된 효과기 모이어티)는, 제1 효과기도 제2 효과기도 단독으로 치료 효능을 갖지 않는 경우에, 제2 결합 모이어티(예를 들어, 제2 결합 부위에 부착된 효과기 모이어티)와 함께 할 때만 치료 효과를 갖는 것으로 나타날 수 있다.
당업자는 본원에서 확인된 플랫폼 및 방법을 통해 치료적으로 유용한 효과기 모이어티의 새로운 조합이 스크리닝되고 유용한 후보가 식별될 수 있음을 이해할 것이다.
스크리닝 플랫폼
또한 본원은 스크리닝 플랫폼을 제공한다. 스크리닝 플랫폼은 라이브러리를 포함하며, 여기서 상기 라이브러리는 본 발명의 단백질 복합체의 복수의 집단을 포함하고, 여기서 단백질 복합체의 집단은 각각 제1 효과기 모이어티, 제2 효과기 모이어티 및/또는 올리고머성 코어의 상이한 조합을 포함한다. 이러한 라이브러리도 또한 본원에서 제공된다.
예를 들어, 라이브러리는 효과기 부분의 새로운 조합을 스크리닝하는데 사용될 수 있다. 따라서, 라이브러리는 다양한 단백질 복합체의 복수의 샘플을 포함할 수 있다. 각 샘플은 동종일 수 있다. 즉, 각 샘플에는 한 가지 유형의 단백질 복합체만 포함될 수 있다. 각 샘플은 상이할 수 있다. 따라서, 각각의 샘플은 각각 다른 샘플의 단백질 복합체 내의 제1 및 제2 효과기 모이어티의 조합과 비교하여 제1 및 제2 효과기 모이어티의 상이한 조합을 포함하는 단백질 복합체를 함유할 수 있다. 예를 들어, 라이브러리는 약 1 또는 약 2 내지 약 1,000,000개의 샘플, 예를 들어 약 10 내지 약 100,000개의 샘플, 예를 들어 약 50 내지 약 50,000개의 샘플, 예를 들어 약 100 내지 약 10,000개의 샘플, 예를 들어 약 500 내지 약 1,000개의 샘플을 포함할 수 있다. 각 샘플은 다른 유형의 단백질 복합체를 포함할 수 있으며, 여기서 각 샘플의 단백질 복합체는 다른 모든 샘플의 단백질 복합체와 비교하여 제1 효과기 모이어티, 제2 효과기 모이어티 및 올리고머성 코어의 상이한 조합을 갖는다.
일부 실시양태에서 라이브러리는 "1D" 라이브러리일 수 있다. 따라서, 일부 실시양태에서, 라이브러리 내의 모든 샘플은 동일하거나 실질적으로 동일한 올리고머성 코어 및 제1 효과기 모이어티를 가질 수 있고, 제2 효과기 모이어티 측면에서 상이할 수 있다. 다른 실시양태에서, 라이브러리 내의 모든 샘플은 동일하거나 실질적으로 동일한 올리고머성 코어 및 제2 효과기 모이어티를 가질 수 있고, 제1 효과기 모이어티 측면에서 상이할 수 있다. 일부 다른 실시양태에서 라이브러리의 모든 샘플은 동일하거나 실질적으로 동일한 제1 및 제2 효과기 모이어티를 가질 수 있으며 올리고머성 코어 측면에서 상이할 수 있다. 주어진 폴리펩타이드와 실질적으로 동일한 폴리펩타이드(예를 들어, 올리고머성 코어, 또는 제1 또는 제2 폴리펩타이드 결합 부위)는 예를 들어 주어진 폴리펩타이드에 대해 적어도 90% 서열 동일성을 가질 수 있으며, 예를 들어 주어진 폴리펩타이드에 대해 적어도 95% 서열 동일성, 예를 들어 적어도 97%, 98%, 99%, 99.9% 또는 99.99% 서열 동일성을 가질 수 있다. 주어진 폴리펩타이드와 실질적으로 동일한 폴리펩타이드(예를 들어, 올리고머성 코어, 또는 제1 또는 제2 폴리펩타이드 결합 부위)는 예를 들어, 본원에 기재된 바와 같은 하나 이상의 서열 부가, 결실 또는 삽입 또는 변형을 포함함으로써 주어진 폴리펩타이드와 상이할 수 있다. 주어진 폴리펩타이드와 실질적으로 동일한 폴리펩타이드(예를 들어, 올리고머성 코어, 또는 제1 또는 제2 폴리펩타이드 결합 부위)는 예를 들어 폴리펩타이드에 대해 이루어진 번역-후 변형, 예를 들어 글리코실화 또는 인산화 패턴의 측면에서 주어진 폴리펩타이드와 상이할 수 있다.
일부 실시양태에서 라이브러리는 "2D" 라이브러리일 수 있다. 따라서, 일부 실시양태에서 라이브러리 내의 모든 샘플은 동일하거나 실질적으로 동일한 올리고머성 코어를 가질 수 있고 제1 효과기 모이어티와 제2 효과기 모이어티의 조합 측면에서 상이할 수 있다. 다른 실시양태에서, 라이브러리 내의 모든 샘플은 동일하거나 실질적으로 동일한 제1 효과기 모이어티를 가질 수 있고, 올리고머성 코어와 제2 효과기 모이어티의 조합 측면에서 상이할 수 있다. 일부 다른 실시양태에서, 라이브러리 내의 모든 샘플은 동일하거나 실질적으로 동일한 제2 효과기 모이어티를 가질 수 있고, 올리고머성 코어와 제1 효과기 모이어티의 조합 측면에서 상이할 수 있다.
일부 실시양태에서 라이브러리는 "3D" 라이브러리일 수 있다. 따라서 일부 실시양태에서 라이브러리 내의 모든 샘플은 올리고머성 코어, 제1 효과기 모이어티 및 제2 효과기 모이어티의 조합 측면에서 상이할 수 있다.
스크리닝 플랫폼은 또한 라이브러리 외에 다른 구성성분 부분을 포함할 수도 있다. 예를 들어, 스크리닝 플랫폼은 하기 중 일부 또는 전부를 포함할 수 있다.
- 라이브러리의 샘플과 접촉하기 위한 생물학적 시스템;
- 생물학적 시스템을 라이브러리의 샘플과 접촉시킴으로써 발생하는 생물학적 시스템의 변화를 검출하기 위한 검출기 시스템;
- 시약 및/또는 완충 용액; 및
- 검출기 시스템에 의해 보고된 변화를 검출하기 위한 광학적, 전기적 또는 분광학적 수단
생물학적 시스템은 포유동물 세포 배양물, 바람직하게는 인간 세포 배양물, 보다 바람직하게는 면역 세포 배양물 및/또는 암 세포주 배양물과 같은 세포 배양물일 수 있다. 생물학적 시스템은 혈액 샘플, 혈청 샘플, 혈장 샘플, 조직 또는 기관 샘플과 같은 생물학적 샘플일 수 있다. 생물학적 샘플에는 종양 샘플, 세포, 세포 용해물, 뇨, 양수 및 기타 생물학적 유체가 포함된다. 생물학적 샘플은 바람직하게는 포유동물이다. 샘플은 인간 또는 비-인간일 수 있다.
검출기 시스템은 임의의 적합한 검출기 시스템일 수 있다. 검출기 시스템은 염료 또는 착색제, 예를 들어 세포 생존성 염료일 수 있다. 적합한 염료에는 예를 들어 트리판 블루, (플루오레세인 다이아세테이트)-그린, 요오드화 프로피듐, Hoechst 33258 등이 포함될 수 있다.
시약은 세포 생육 배지 성분을 포함하여, 세포 생육성에 필요한 성분을 포함하며, 치료제 분자를 포함할 수 있다.
완충제는 예를 들어 완충제 염을 포함할 수 있는 수성 조성물을 포함한다. 사용될 수 있는 바람직한 완충제 염에는 Tris; 포스페이트; 시트르산/Na2HPO4; 시트르산/나트륨 시트레이트; 나트륨 아세테이트/아세트산; Na2HPO4/NaH2PO4; 이미다졸(글리옥살린)/HCl; 나트륨 카보네이트/나트륨 바이카보네이트; 암모늄 카보네이트/암모늄 바이카보네이트; MES; Bis-Tris; ADA; aces; PIPES; MOPSO; Bis-Tris 프로판; BES; MOPS; TES; HEPES; DIPSO; MOBS; TAPSO; Trizma; HEPPSO; POPSO; TEA; EPPS; 트리신; Gly-Gly; 바이신; HEPBS; TAPS; AMPD; TABS; AMPSO; CHES; CAPSO; AMP; CAPS 및 CABS이 포함될 수 있다. 목적하는 pH에 적합한 완충제를 선택하는 것은 당업자에게 일상적인 일이며, 지침은 예를 들어 http://www.sigmaaldrich.com/life-science/core-bioreagents/biological-buffers/learning-center/buffer-reference-center.html에서 입수할 수 있다. 완충제 염은 바람직하게는 용액 중 1 mM 내지 1 M, 바람직하게는 10 mM 내지 100 mM, 예를 들어 약 50 mM의 농도로 사용된다.
검출기 시스템에 의해 보고된 변화를 검출하기 위한 수단에는 현미경(광학 또는 전자), 전기적 수단, 예를 들어 전기 생리학(예를 들어, 패치 클램프) 장치; 및 분광학적 수단, 예를 들어 UV/VIS 분광학, NMR 분광학, 질량 분광학, IR 분광학, 라만 분광학, 원형 이색성 분광학 등을 위한 장비가 포함된다.
방법
또한, 치료 약물 유사체를 식별하는 방법이 제공되며, 상기 방법은,
본원에 기재된 바와 같은 단백질 복합체를 제공하는 단계;
단백질 복합체를 생물학적 시스템과 접촉시키는 단계;
단백질 복합체가 생물학적 시스템의 특성에 목적하는 변화를 유도하는지 여부를 측정하는 단계
를 포함한다.
상기 방법은, 임의로,
생물학적 시스템의 특성에서 목적하는 변화를 유도하는 단백질 복합체를 선택하는 단계
를 추가로 포함할 수 있다.
또한, 효과기 분자(예를 들어, 항원-결합 도메인)의 치료적 조합을 식별하는 방법이 제공되며, 상기 방법은
본원에 기재된 바와 같은 단백질 복합체를 제공하는 단계;
단백질 복합체를 생물학적 시스템과 접촉시키는 단계; 및
단백질 복합체가 생물학적 시스템의 특성에 목적하는 변화를 유도하는지 여부를 측정하는 단계
를 포함한다.
생물학적 시스템은 포유동물 세포 배양물, 바람직하게는 인간 세포 배양물, 보다 바람직하게는 면역 세포 배양물 및/또는 암 세포주 배양물과 같은 세포 배양물일 수 있다.
생물학적 시스템은 혈액 샘플, 혈청 샘플, 혈장 샘플, 조직 또는 기관 샘플과 같은 생물학적 샘플일 수 있다. 생물학적 샘플에는 종양 샘플, 세포, 세포 용해물, 뇨, 양수 및 기타 생물학적 유체가 포함된다. 생물학적 샘플은 바람직하게는 포유동물이다. 샘플은 인간 또는 비-인간일 수 있다.
생물학적 시스템의 특성 변화는 의도된 치료제의 목적하는 활성과 관련된 임의의 변화일 수 있다. 일부 실시양태에서 목적하는 변화는 세포 사멸이다. 이는 특히 암 치료제를 개발할 때 사용될 수 있다.
다른 변화에는 효과기 기능의 변화가 포함된다. 따라서, 상기 방법은 단백질 복합체가 생물학적 시스템에서 효과기 기능을 유도하는지 여부를 측정하는 단계를 포함할 수 있다.
효과기 기능의 변화에는 변경된 유전자 발현, 변경된 단백질 변형, 예를 들어, 인산화, 수용체 내재화, 사이토카인 방출, 세포 사멸, 치료 분자에 대한 감수성 등이 포함될 수 있다. 효과기 기능은 ELISA와 같은 일련의 기법에 의해 측정될 수 있는, 생물학적 샘플에 대한 고 친화도 결합일 수 있다. 표적 생물학적 시스템에 대한 고 친화도 결합은 상기에서 논의된 효과기 도메인이 암세포와 같은 특정 세포 유형일 수 있는 표적화된 생물학적 시스템에 특이적으로 영향을 미치게 할 수 있다.
효과기 기능은 대조군을 참조하여 평가될 수 있다. 대조군은 효과기 부분이 없는 단백질 복합체일 수 있다.
대조군은 단일 유형의 효과기 모이어티만이 부착된 단백질 복합체일 수 있다(즉, 단 하나의 유형의 효과기 모이어티가 다가 단백질 스캐폴드에 부착됨). 이 경우, 방법은 "상승적 기능" 또는 "상승적 생물학적 기능"(효과기 기능 또는 효과기 기능의 수준을 지칭함)을 갖는 효과기 모이어티를 식별하는 데 사용될 수 있으며, 이는 이중특이성 다가 단백질 복합체가 사용될 때까지 개별적인 융합 단백질 성분에 대해 관찰되지 않거나; 또는 단백질 복합체의 제1 및 제2 효과기 모이어티가 개별적으로 사용될 때 관찰되는 활성과 비교하여 더 높거나 더 낮은 활성, 즉 상기 두 효과기 모이어티 모두를 복합체에서 함께 사용할 때만 관찰되는 활성을 지칭한다.
상기 방법은,
단백질 복합체의 효과기 모이어티에 의해 결합된 생물학적 시스템의 분자를 식별하는 단계
를 추가로 포함할 수 있다. 상기 방법은 바람직하게는,
선택된 단백질 복합체와 동일한 생물학적 시스템의 분자, 예를 들어 효과기 부분 자체에 특이적으로 결합하는 효과기 부분의 조합을 선택하는 단계
를 포함할 수 있다.
상기 방법은,
효과기 모이어티 또는 이의 유사체의 선택된 조합을 포함하는 치료 약물 후보 또는 약물을 합성하는 단계
를 추가로 포함할 수 있다. 치료 약물 후보 또는 약물은 치료 약물 유사체의 올리고머성 코어 및 효과기 모이어티를 포함할 수 있지만, 여기서 결합 부위 및 표적 기능은 본원에 더 상세히 기재된 바와 같이 유전적 융합과 같은 공유 결합으로 대체된다. 치료 약물 또는 약물 후보는 개시된 방법에서 식별된 치료 약물 유사체와 동일한 올리고머성 코어를 포함할 수 있다. 대안적으로, 치료 약물 후보는 개시된 방법에서 식별된 치료 약물 유사체와 다른 올리고머성 코어를 포함할 수 있다. 치료 약물 후보는 추가적인 치료 이점, 예를 들어 추가적인 효과기 기능을 부여하기 위해 선택되거나 설계된 올리고머성 코어를 가질 수 있다.
또한, 본원에서는, 개시된 방법에 따라 수득될 수 있는 치료 약물 후보가 제공된다.
치료 약물 후보, 치료 약물
하나 이상의 제1 효과기 모이어티 및 하나 이상의 제2 효과기 모이어티에 부착된 복수의 서브유닛 단량체를 포함하는 올리고머성 코어를 포함하는 치료 약물 후보가 추가로 제공되며; 여기서 상기 하나 이상의 제1 효과기 모이어티와 상기 하나 이상의 제2 효과기 모이어티는 올리고머성 코어의 동일 면 상에 위치하고; (i) 상기 하나 이상의 제1 효과기 모이어티는 2개 이상의 제1 효과기 모이어티를 포함하고 상기 하나 이상의 제2 효과기 모이어티는 2개 이상의 제2 효과기 모이어티를 포함하고/하거나; (ii) 상기 올리고머성 코어는 항체 또는 항체 단편을 포함하지 않는다.
동일한 특징을 갖는 치료 약물이 또한 제공된다.
전형적으로, 올리고머성 코어는 본원에 더 상세히 기재된 바와 같은 올리고머성 코어이다. 전형적으로, 서브유닛 단량체는 본원에 더 상세히 기재된 바와 같다. 전형적으로, 제1 효과기 모이어티와 제2 효과기 모이어티는 본원에 더 상세히 기재된 바와 같다. 제1 및 제2 효과기 모이어티는 본원에 기재된 임의의 부착 수단을 포함하는 임의의 적절한 방식으로 올리고머성 코어의 서브유닛 단량체에 부착될 수 있다. 일부 실시양태에서, 제1 및 제2 효과기 모이어티의 부착은 본원에 기재된 바와 같은 제1 및 제2 결합 부위와 제1 및 제2 폴리펩타이드 표적을 포함한다. 그러나 다른 실시양태에서, 제1 및 제2 효과기 모이어티의 부착은 본원에 기재된 바와 같은 제1 및 제2 결합 부위와 제1 및 제2 폴리펩타이드 표적을 포함하지 않고 대신에 단순한 공유 부착, 예를 들어 본원에 기재된 바와 같은 유전적 융합(genetic fusion) 및/또는 클릭 화학 결합(click chemistry linkage)을 포함할 수 있다.
구체적인 실시양태
첫 번째 바람직한 양태에서, 본원은 하기를 제공한다:
- 복수(예를 들어, 3 내지 6개, 바람직하게는 3개)의 단량체를 포함하는 올리고머성 코어를 포함하는 다가 단백질 스캐폴드로서, 각각의 단량체는 서열번호 1의 아미노산 서열에 대해 적어도 30% 또는 적어도 50%의 아미노산 동일성(예를 들어, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성)을 갖는 아미노산 서열을 포함하며; 여기서 각각의 단량체는 제1 결합 부위 및 제2 결합 부위를 포함하고, 여기서 제1 결합 부위는 제2 결합 부위에 직교하고, 제1 결합 부위 및 제2 결합 부위는 각각 독립적으로 서열번호 4 내지 9, 11 내지 13, 23 또는 15 내지 18 중 어느 하나에 대해 적어도 50%의 아미노산 동일성(예를 들어, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성)을 가지며; 각각의 제1 결합 부위 및 각각의 제2 결합 부위는 이들이 부착되는 단량체에 독립적으로 유전적으로 융합된다. 바람직하게, 제1 및 제2 결합 부위 중 하나는 서열번호 4, 6 또는 8에 대해 적어도 50%의 아미노산 동일성을 갖고, 다른 하나는 서열 번호 12에 대해 적어도 50%의 아미노산 동일성을 갖는다. 이 양태의 바람직한 다가 단백질 스캐폴드는 서열번호 21의 단량체, 또는 이의 단편(예를 들어, 이의 14-348 잔기를 포함함)을 포함한다.
- 첫 번째 양태의 다가 단백질 스캐폴드를 포함하는 단백질 복합체로서, 여기서 제1 결합 부위는 제1 효과기 모이어티에 부착된 제1 폴리펩타이드 표적에 결합되고; 제2 결합 부위는 제2 효과기 모이어티에 부착된 제1 폴리펩타이드 표적에 결합되며; 여기서 제1 및 제2 효과기 모이어티는 동일하거나 상이할 수 있고, 바람직하게는 상이할 수 있으며; 여기서 제1 결합 부위/폴리펩타이드 표적 쌍 및 제2 결합 부위/폴리펩타이드 표적 쌍은 각각 독립적으로 하기의 조합으로부터 선택된다: (i) 서열번호 4, 6 또는 8 중 어느 하나와 서열번호 5, 7 또는 9 중 어느 하나; (ii) 서열번호 12와 서열번호 13 또는 15; (iii) 서열번호 5와 서열번호 11; (iv) 서열번호 15와 서열번호 16); (v) 서열번호 17과 서열번호 18; 또는 (vi) 서열번호 23과 서열번호 16).
- 첫 번째 양태의 단백질 복합체의 복수의 집단을 포함하는 라이브러리를 포함하는 스크리닝 플랫폼으로서, 여기서 각 집단은 제1 및 제2 효과기 모이어티의 상이한 조합을 포함한다.
- 복수(예를 들어, 3 내지 6개, 바람직하게는 3개)의 단량체를 포함하는 올리고머성 코어를 포함하는 치료 약물 후보로서, 각각의 단량체는 서열번호 1의 아미노산 서열에 대해 적어도 50%의 아미노산 동일성(예를 들어, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성)을 갖는 아미노산 서열을 포함하며; 여기서 각각의 단량체는 제1 효과기 모이어티 및 제2 효과기 모이어티에 (예를 들어 유전적 융합으로서) 직접 부착되고; 여기서 제1 및 제2 효과기 모이어티는 동일하거나 상이할 수 있고, 바람직하게는 상이할 수 있으며; 바람직하게는 여기서 각각의 단량체는 폴리펩타이드 링커를 통해 부착된 제1 효과기 모이어티 및 제2 효과기 모이어티에 직접 부착된다.
두 번째 바람직한 양태에서, 본원은 구체적으로 하기를 제공한다:
- 복수(예를 들어, 3 내지 6개, 바람직하게는 3개)의 단량체를 포함하는 올리고머성 코어를 포함하는 다가 단백질 스캐폴드로서, 각각의 단량체는 서열번호 2의 아미노산 서열에 대해 적어도 50%의 아미노산 동일성(예를 들어, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성)을 갖는 아미노산 서열을 포함하며; 여기서 각각의 단량체는 제1 결합 부위 및 제2 결합 부위를 포함하고, 여기서 제1 결합 부위는 제2 결합 부위에 직교하고, 제1 결합 부위 및 제2 결합 부위는 각각 독립적으로 서열번호 4 내지 9, 11 내지 13, 23 또는 15 내지 18 중 어느 하나에 대해 적어도 50%의 아미노산 동일성(예를 들어, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성)을 가지며; 각각의 제1 결합 부위 및 각각의 제2 결합 부위는 이들이 부착되는 단량체에 독립적으로 유전적으로 융합된다. 바람직하게, 제1 및 제2 결합 부위 중 하나는 서열번호 4, 6 또는 8에 대해 적어도 50%의 아미노산 동일성을 갖고, 다른 하나는 서열 번호 12에 대해 적어도 50%의 아미노산 동일성을 갖는다. 이 양태의 바람직한 다가 단백질 스캐폴드는 서열번호 20의 단량체, 또는 이의 단편(예를 들어, 이의 14-380 잔기를 포함함)을 포함한다.
- 두 번째 양태의 다가 단백질 스캐폴드를 포함하는 단백질 복합체로서, 여기서 제1 결합 부위는 제1 효과기 모이어티에 부착된 제1 폴리펩타이드 표적에 결합되고; 제2 결합 부위는 제2 효과기 모이어티에 부착된 제1 폴리펩타이드 표적에 결합되며; 여기서 제1 및 제2 효과기 모이어티는 동일하거나 상이할 수 있고, 바람직하게는 상이할 수 있으며; 여기서 제1 결합 부위/폴리펩타이드 표적 쌍 및 제2 결합 부위/폴리펩타이드 표적 쌍은 각각 독립적으로 하기의 조합으로부터 선택된다: (i) 서열번호 4, 6 또는 8 중 어느 하나와 서열번호 5, 7 또는 9 중 어느 하나; (ii) 서열번호 12와 서열번호 13 또는 15; (iii) 서열번호 5와 서열번호 11; (iv) 서열번호 15와 서열번호 16); (v) 서열번호 17과 서열번호 18; 또는 (vi) 서열번호 23과 서열번호 16).
- 두 번째 양태의 단백질 복합체의 복수의 집단을 포함하는 라이브러리를 포함하는 스크리닝 플랫폼으로서, 여기서 각 집단은 제1 및 제2 효과기 모이어티의 상이한 조합을 포함한다.
- 복수(예를 들어, 3 내지 6개, 바람직하게는 3개)의 단량체를 포함하는 올리고머성 코어를 포함하는 치료 약물 후보로서, 각각의 단량체는 서열번호 2의 아미노산 서열에 대해 적어도 50%의 아미노산 동일성(예를 들어, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성)을 갖는 아미노산 서열을 포함하며; 여기서 각각의 단량체는 제1 효과기 모이어티 및 제2 효과기 모이어티에 (예를 들어 유전적 융합으로서) 직접 부착되고; 여기서 제1 및 제2 효과기 모이어티는 동일하거나 상이할 수 있고, 바람직하게는 상이할 수 있으며; 바람직하게는 여기서 각각의 단량체는 폴리펩타이드 링커를 통해 부착된 제1 효과기 모이어티 및 제2 효과기 모이어티에 직접 부착된다.
세 번째 바람직한 양태에서, 본원은 구체적으로 하기를 제공한다:
- 복수(예를 들어, 3 내지 6개, 바람직하게는 3개)의 단량체를 포함하는 올리고머성 코어를 포함하는 다가 단백질 스캐폴드로서, 각각의 단량체는 서열번호 3의 아미노산 서열에 대해 적어도 50%의 아미노산 동일성(예를 들어, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성)을 갖는 아미노산 서열을 포함하며; 여기서 각각의 단량체는 제1 결합 부위 및 제2 결합 부위를 포함하고, 여기서 제1 결합 부위는 제2 결합 부위에 직교하고, 제1 결합 부위 및 제2 결합 부위는 각각 독립적으로 서열번호 4 내지 9, 11 내지 13, 23 또는 15 내지 18 중 어느 하나에 대해 적어도 50%의 아미노산 동일성(예를 들어, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성)을 가지며; 각각의 제1 결합 부위 및 각각의 제2 결합 부위는 이들이 부착되는 단량체에 독립적으로 유전적으로 융합된다. 바람직하게, 제1 및 제2 결합 부위 중 하나는 서열번호 4, 6 또는 8에 대해 적어도 50%의 아미노산 동일성을 갖고, 다른 하나는 서열 번호 12에 대해 적어도 50%의 아미노산 동일성을 갖는다.
- 세 번째 양태의 다가 단백질 스캐폴드를 포함하는 단백질 복합체로서, 여기서 제1 결합 부위는 제1 효과기 모이어티에 부착된 제1 폴리펩타이드 표적에 결합되고; 제2 결합 부위는 제2 효과기 모이어티에 부착된 제1 폴리펩타이드 표적에 결합되며; 여기서 제1 및 제2 효과기 모이어티는 동일하거나 상이할 수 있고, 바람직하게는 상이할 수 있으며; 여기서 제1 결합 부위/폴리펩타이드 표적 쌍 및 제2 결합 부위/폴리펩타이드 표적 쌍은 각각 독립적으로 하기의 조합으로부터 선택된다: (i) 서열번호 4, 6 또는 8 중 어느 하나와 서열번호 5, 7 또는 9 중 어느 하나; (ii) 서열번호 12와 서열번호 13 또는 15; (iii) 서열번호 5와 서열번호 11; (iv) 서열번호 15와 서열번호 16); (v) 서열번호 17과 서열번호 18; 또는 (vi) 서열번호 23과 서열번호 16).
- 세 번째 양태의 단백질 복합체의 복수의 집단을 포함하는 라이브러리를 포함하는 스크리닝 플랫폼으로서, 여기서 각 집단은 제1 및 제2 효과기 모이어티의 상이한 조합을 포함한다.
- 복수(예를 들어, 3 내지 6개, 바람직하게는 3개)의 단량체를 포함하는 올리고머성 코어를 포함하는 치료 약물 후보로서, 각각의 단량체는 서열번호 3의 아미노산 서열에 대해 적어도 50%의 아미노산 동일성(예를 들어, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성)을 갖는 아미노산 서열을 포함하며; 여기서 각각의 단량체는 제1 효과기 모이어티 및 제2 효과기 모이어티에 (예를 들어 유전적 융합으로서) 직접 부착되고; 여기서 제1 및 제2 효과기 모이어티는 동일하거나 상이할 수 있고, 바람직하게는 상이할 수 있으며; 바람직하게는 여기서 각각의 단량체는 폴리펩타이드 링커를 통해 부착된 제1 효과기 모이어티 및 제2 효과기 모이어티에 직접 부착된다.
네 번째 바람직한 양태에서, 본원은 구체적으로 하기를 제공한다:
- 복수(예를 들어, 3 내지 6개, 바람직하게는 3개)의 단량체를 포함하는 올리고머성 코어를 포함하는 다가 단백질 스캐폴드로서, 각각의 단량체는 서열번호 19의 아미노산 서열에 대해 적어도 50%의 아미노산 동일성(예를 들어, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성)을 갖는 아미노산 서열을 포함하며; 여기서 각각의 단량체는 제1 결합 부위 및 제2 결합 부위를 포함하고, 여기서 제1 결합 부위는 제2 결합 부위에 직교하고, 제1 결합 부위 및 제2 결합 부위는 각각 독립적으로 서열번호 4 내지 9, 11 내지 13, 23 또는 15 내지 18 중 어느 하나에 대해 적어도 50%의 아미노산 동일성(예를 들어, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성)을 가지며; 각각의 제1 결합 부위 및 각각의 제2 결합 부위는 이들이 부착되는 단량체에 독립적으로 유전적으로 융합된다. 바람직하게, 제1 및 제2 결합 부위 중 하나는 서열번호 4, 6 또는 8에 대해 적어도 50%의 아미노산 동일성을 갖고, 다른 하나는 서열 번호 12에 대해 적어도 50%의 아미노산 동일성을 갖는다.
- 네 번째 양태의 다가 단백질 스캐폴드를 포함하는 단백질 복합체로서, 여기서 제1 결합 부위는 제1 효과기 모이어티에 부착된 제1 폴리펩타이드 표적에 결합되고; 제2 결합 부위는 제2 효과기 모이어티에 부착된 제1 폴리펩타이드 표적에 결합되며; 여기서 제1 및 제2 효과기 모이어티는 동일하거나 상이할 수 있고, 바람직하게는 상이할 수 있으며; 여기서 제1 결합 부위/폴리펩타이드 표적 쌍 및 제2 결합 부위/폴리펩타이드 표적 쌍은 각각 독립적으로 하기의 조합으로부터 선택된다: (i) 서열번호 4, 6 또는 8 중 어느 하나와 서열번호 5, 7 또는 9 중 어느 하나; (ii) 서열번호 12와 서열번호 13 또는 15; (iii) 서열번호 5와 서열번호 11; (iv) 서열번호 15와 서열번호 16); (v) 서열번호 17과 서열번호 18; 또는 (vi) 서열번호 23과 서열번호 16).
- 네 번째 양태의 단백질 복합체의 복수의 집단을 포함하는 라이브러리를 포함하는 스크리닝 플랫폼으로서, 여기서 각 집단은 제1 및 제2 효과기 모이어티의 상이한 조합을 포함한다.
- 복수(예를 들어, 3 내지 6개, 바람직하게는 3개)의 단량체를 포함하는 올리고머성 코어를 포함하는 치료 약물 후보로서, 각각의 단량체는 서열번호 4의 아미노산 서열에 대해 적어도 50%의 아미노산 동일성(예를 들어, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100% 아미노산 동일성)을 갖는 아미노산 서열을 포함하며; 여기서 각각의 단량체는 제1 효과기 모이어티 및 제2 효과기 모이어티에 (예를 들어 유전적 융합으로서) 직접 부착되고; 여기서 제1 및 제2 효과기 모이어티는 동일하거나 상이할 수 있고, 바람직하게는 상이할 수 있으며; 바람직하게는 여기서 각각의 단량체는 폴리펩타이드 링커를 통해 부착된 제1 효과기 모이어티 및 제2 효과기 모이어티에 직접 부착된다.
다섯 번째 바람직한 양태에서, 본원은 구체적으로 하기를 제공한다:
- N 말단에 제1 결합 도메인 및 C 말단에 제2 결합 도메인을 포함하는 폴리펩타이드로서, 여기서 제1 및 제2 결합 도메인은 구조 도메인에 의해 분리되고, 제1 항원 결합 도메인 및 제2 항원 결합 도메인은 표적 분자가 단일 세포에서 발현되거나 플레이트 또는 단일 비드 상에 고정화될 때 이들의 표적에 결합할 수 있다.
- 폴리펩타이드의 올리고머로서, 여기서 올리고머 내의 각 폴리펩타이드는 N 말단에 제1 결합 도메인 및 C 말단에 제2 결합 도메인을 포함하는 폴리펩타이드로 이루어지며, 여기서 제1 및 제2 결합 도메인은 구조 도메인에 의해 분리되고, 제1 항원 결합 도메인 및 제2 항원 결합 도메인은 표적 분자가 단일 세포에서 발현되거나 플레이트 또는 단일 비드 상에 고정화될 때 이들의 표적에 결합할 수 있다.
- N 말단에 제1 결합 도메인 및 C 말단에 제2 결합 도메인을 포함하는 폴리펩타이드로서, 여기서 제1 및 제2 결합 도메인은 구조 도메인에 의해 분리되고, 제1 항원 결합 도메인 및 제2 항원 결합 도메인은 표적 분자가 단일 세포에서 발현되거나 플레이트 또는 단일 비드 상에 고정화될 때 이들의 표적에 결합할 수 있다. 제1 결합 도메인 및 제2 결합 도메인은 각각 동족 펩타이드와 이소펩타이드 연결을 형성할 수 있는 캐처 도메인이다. 이들 동족 펩타이드는 종종 태그 펩타이드로서 지칭되며, 예를 들어 SpyTag는 당업계에 공지되고 상기에서 논의된 바와 같이 SpyCatcher 도메인과 이소펩타이드 결합을 형성한다. 제1 결합 도메인에 대한 동족 펩타이드는 제2 결합 도메인에 대한 동족 펩타이드와 상이하다.
- 폴리펩타이드의 올리고머로서, 여기서 올리고머 내의 각 폴리펩타이드는 N 말단에 제1 결합 도메인 및 C 말단에 제2 결합 도메인을 포함하는 폴리펩타이드로 이루어지며, 여기서 제1 및 제2 결합 도메인은 구조 도메인에 의해 분리되고, 제1 항원 결합 도메인 및 제2 항원 결합 도메인은 표적 분자가 단일 세포에서 발현되거나 플레이트 또는 단일 비드 상에 고정화될 때 이들의 표적에 결합할 수 있다. 제1 결합 도메인 및 제2 결합 도메인은 각각 동족 펩타이드와 이소펩타이드 연결을 형성할 수 있는 캐처 도메인이다. 이들 동족 펩타이드는 종종 태그 펩타이드로서 지칭되며, 예를 들어 SpyTag는 당업계에 공지되고 상기에서 논의된 바와 같이 SpyCatcher 도메인과 이소펩타이드 결합을 형성한다. 제1 결합 도메인에 대한 동족 펩타이드는 제2 결합 도메인에 대한 동족 펩타이드와 상이하다.
개시내용의 추가적인 양태
또한, 본원에서는, 본원에 더욱 상세히 기재된 바와 같은 다가 단백질 스캐폴드의 올리고머성 코어의 하나 이상의 단량체를 암호화하는 폴리뉴클레오타이드가 제공된다. 또한, 본원에서는, 제1 결합 도메인, 제2 결합 도메인 및 구조 도메인을 포함하는, 본원에 더욱 상세히 기재된 다중-도메인 폴리펩타이드 구성체를 암호화하는 폴리뉴클레오타이드가 제공된다.
또한, 폴리뉴클레오타이드를 포함하는 벡터; 벡터를 포함하는 세포; 및 세포를 배지에서 배양하여 단백질 스캐폴드를 생성시키는 단계를 포함하는, 단량체, 올리고머성 코어 및/또는 다가 단백질 스캐폴드의 생성 방법이 제공된다.
또한, 폴리뉴클레오타이드를 포함하는 벡터; 벡터를 포함하는 세포; 및 세포를 배지에서 배양하여 다중-도메인 폴리펩타이드를 생성시키는 단계를 포함하는, 다중-도메인 폴리펩타이드 구성체의 생성 방법을 제공한다.
적어도 하나의 단량체를 암호화하는 적절한 폴리뉴클레오타이드 서열; 적절한 발현 벡터; 및 단량체, 올리고머성 코어 및/또는 다가 단백질 스캐폴드를 발현시키기 위한 적절한 세포의 선택은 당업자에게 일상적이다.
치료 효능
본원에 제공된 단백질 복합체, 치료 약물 유사체 및 치료 약물 후보는 치료적으로 유용하다. 다중-도메인 폴리펩타이드 구성체는 일반적으로 치료적으로 유용하다. 이들 제공된 물질은 본원에서 "치료 단백질 복합체"로도 지칭된다.
따라서, 본 발명은, 약물에 사용하기 위한 본원에 기재된 바와 같은 치료 단백질 복합체 및 구성체를 제공한다. 본 발명은, 인간 또는 동물 신체를 치료하는데 사용하기 위한, 본원에 기재된 치료 단백질 복합체를 제공한다. 본 발명은, 인간 또는 동물 신체를 치료하는데 사용하기 위한, 본원에 기재된 치료 단백질 구성체를 제공한다.
본 발명은, 치료가 필요한 인간 또는 동물에게 단백질 복합체, 다중-도메인 폴리펩타이드 구성체(단량체 또는 올리고머 형태), 치료 약물 유사체, 치료 약물 후보, 또는 본원에 기재된 바와 같은 약물을 투여하는 단계를 포함하는, 이와 같은 치료가 필요한 인간 또는 동물의 치료 방법을 제공한다.
또한, 약학적으로 허용되는 담체 또는 희석제와 함께 본원에 기재된 하나 이상의 치료 단백질 복합체를 포함하는 약학 조성물이 제공된다. 전형적으로, 조성물은 본 발명의 치료 단백질 복합체를 85 중량%까지 함유한다. 보다 일반적으로 조성물은 본 발명의 치료 단백질 복합체를 50 중량%까지 함유한다. 바람직한 약학 조성물은 멸균되고 발열원이 없다.
또한, 약학적으로 허용되는 담체 또는 희석제와 함께 본원에 기재된 하나 이상의 다중-도메인 폴리펩타이드 구성체를 포함하는 약학 조성물이 제공된다. 전형적으로, 조성물은 본 발명의 치료적 다중-도메인 폴리펩타이드 구성체를 85 중량%까지 함유한다. 보다 일반적으로 이는 본 발명의 치료적 다중-도메인 폴리펩타이드 구성체를 50 중량%까지 함유한다. 바람직한 약학 조성물은 멸균되고 발열원이 없다.
본 발명의 조성물은, 키트를 본원에 기재된 방법에 사용될 수 있도록 하는 설명서 또는 방법이 사용될 수 있는 피험자에 관한 세부사항을 포함하는 키트로서 제공될 수 있다.
상기에 설명된 바와 같이, 본원에 제공된 치료 단백질 복합체 및 구성체는 다양한 장애를 치료 또는 예방하는데 유용하다. 제공된 치료 단백질 복합체를 사용하여 치료하기 위한 장애에는 암, 자가면역 질환(예를 들어, 강직성 척추염), 건선, 연령 관련 황반변성과 같은 눈 질환, 다발성 경화증, 심혈관 질환, 바이러스 및 세균 감염을 포함한 감염, 크론병, 류마티스 관절염, 골관절염, 알츠하이머병, 이식 및 동종이식 거부반응 등 조혈줄기세포 장애 등이 포함될 수 있다. 보다 광범위하게, 본원에 제공된 바와 같은 치료 단백질 복합체는 항체, 특히 이중특이성 항체를 사용하여 치료되는 모든 질환을 치료하는데 있어서 유용성을 찾는다.
암, 예를 들어, 급성 림프구성 백혈병, 급성 골수성 백혈병, 부신피질 암종, 에이즈 관련 림프종, 원발성 중추신경계 림프종, 항문암, 성상세포종, 뇌암, 기저세포암종, 담관암, 방광암, 골암(예를 들어, 유잉육종, 골육종 및 악성 섬유성 조직구종), 유방암, 기관지 종양, 수모세포종 및 기타 중추신경계 배아 종양, 자궁경부암, 만성 림프구성 백혈병, 만성 골수성 백혈병, 만성 골수증식성 신생물, 대장암, 두개인두종, 자궁내막암, 상의세포종, 식도암, 유착신경모세포종, 유동 육종, 생식선외 생식세포 종양, 안구내 흑색종, 망막모세포종, 나팔관암, 담낭암, 위암, 위장관 유암종 종양, 위장관 간질 종양(괴), 생식세포 종양, 생식선외 생식세포 종양, 난소 생식세포 종양, 고환암, 임신성 융모성 질환, 모세포 백혈병, 간세포암, 조직구증가증, 랑게르한스 세포, 호지킨 림프종, 하인두암, 안내 흑색종, 섬 세포 종양, 췌장 신경내분비 종양, 카포시 육종, 신장(신세포)암, 랑게르한스 세포 조직구증, 후두암, 백혈병, 간암, 폐암(비소세포, 소세포, 흉막폐 모세포종, 기관지종양), 림프종, 뼈의 악성 섬유성 조직구종 및 골육종, 메르켈 세포암종, 중피종, 구강암, 다발내분비샘종양증후군, 다발성 골수종/형질세포종양, 균상 식육종, 골수이형성증후군, 골수이형성/골수증식성 신생물, 골수성 백혈병, 신경모세포종, 비호지킨 림프종, 구인두암, 골육종 및 미분화 다형성 육종, 췌장암, 췌장 신경내분비 종양(섬 세포 종양), 유두종증, 부신경절종, 부갑상선암, 음경암, 인두암, 크롬친화세포종, 뇌하수체 종양, 전립선암, 직장암, 망막모세포종, 횡문근육종, T세포 림프종, 고환암, 인후암, 흉선종 및 흉선암종, 갑상선암, 기관지 종양 등이 본원에 제공된 치료 단백질 복합체로 치료하기에 특히 적합하다. 본원에서 제공되는 치료 단백질 복합체로 치료할 수 있는 자가면역 장애에는 류마티스 관절염, 전신홍반루푸스(루푸스), 염증성 장질환(IBD), 다발성 경화증(MS), 제1형 당뇨병, 길랑-바레 증후군, 만성 염증성 탈수초성 다발신경병증, 건선, 그레이브스 병, 하시모토 갑상선염, 중증근육무력증 및 혈관염이 포함된다.
본원에 제공된 치료 단백질 복합체는 독립형 치료제로 사용될 수 있다. 대안적으로, 상기 복합체는 화학요법제와 같은 다른 활성제와 조합하여 사용될 수 있다. 예를 들어, 상기 복합체는 EGFR 억제제(예를 들어, 에를로티닙, 제피티닙, 라파티닙 또는 세툭시맙), 면역요법(예를 들어, 펨브롤리주맙 또는 니볼루맙), 종양-불문 요법(예를 들어, 라로트렉티닙) 또는 화학요법(예를 들어, 예를 들어 5-플루오로우라실, 시스플라틴 또는 도세탁셀)과 함께 사용될 수 있다.
암을 치료하는 데 사용되는 경우, 본원에 제공된 치료 단백질 복합체는 암 증상의 완화, 호전 또는 악화 방지에 사용될 수 있다. 전형적으로, 암 치료는 암의 진행을 감소시키는 것, 예를 들어 무진행 생존율을 증가시키는 것을 포함할 수 있다. 암 치료는 암과 관련된 종양의 성장을 예방하거나 억제하는 것을 포함할 수 있다. 암을 치료하는 것은 암의 전이를 예방하는 것을 포함할 수 있다. 바람직하게는, 암을 치료하는 것은 암과 관련된 종양의 크기를 감소시키는 것을 포함할 수 있다. 따라서 치료는 암에서 종양 퇴행을 일으킬 수 있다. 암을 치료하는 것은 환자에게 존재하는 종양 또는 병변의 수를 감소시키는 것을 포함할 수 있다. 치료가 암과 관련된 종양의 크기를 감소시키는 경우, 종양의 크기는 일반적으로 기준선보다 적어도 10% 감소한다. 기준선은 화합물 치료가 처음 시작된 날짜의 종양 크기이다. 종양의 크기는 전형적으로 RECIST 기준의 버전 1.1(예를 들어 문헌[Eisenhauer et al, European Journal of Cancer 45 (2009) 228-247]에 기재된 바와 같다)에 따라 측정되는 바와 같다.
화합물에 의한 치료에 대한 반응은 RECIST 기준의 버전 1.1에 따라 완전 반응, 부분 반응 또는 안정한 질환일 수 있다. 바람직하게, 반응은 부분 반응 또는 완전 반응이다. 치료는 적어도 60일, 적어도 120일 또는 적어도 180일 동안 무진행 생존을 달성할 수 있다.
종양 크기의 감소는 기준선에 비해 20% 초과, 30% 초과 또는 50% 초과의 감소일 수 있다. 종양 크기의 감소는 치료 30일 후 또는 치료 60일 후에 관찰될 수 있다.
본원에 제공된 치료 단백질 복합체는 또한 감염, 예를 들어 그람 양성 및/또는 그람 음성 세균에 의한 감염; 및 바이러스 감염의 치료에 유용할 수 있다. 본원에 제공된 치료 단백질 복합체는 세균, 진균 및 바이러스와 같은 병원체와 상호작용하도록 설계될 수 있다.
본원에 설명된 바와 같이, 본원에 제공된 치료 단백질 복합체는 다양한 장애를 치료 또는 예방하는데 유용하다. 따라서 본 발명은, 약물에 사용하기 위한 본원에 제공된 치료 단백질 복합체를 제공한다. 본 발명은 또한, 약제 제조에 있어서 본원에 제공된 바와 같은 치료 단백질 복합체의 용도를 제공한다. 본 발명은 또한, 본원에 제공된 치료 단백질 복합체를 포함하는 조성물 및 생성물을 제공한다. 이러한 조성물 및 생성물은 또한 장애를 치료하거나 예방하는데 유용하다. 따라서 본 발명은, 약물에 사용하기 위한 본원에 정의된 조성물 또는 생성물을 제공한다. 본 발명은 또한, 약제 제조에 있어서 본 발명의 조성물 또는 생성물의 용도를 제공한다. 또한 이러한 치료가 필요한 피험자를 치료하는 방법을 제공하며, 상기 방법은 피험자에게 본원에 제공된 치료 단백질 복합체를 투여하는 단계를 포함한다. 일부 실시양태에서 피험자는 본원에 개시된 장애 중 하나를 앓고 있거나 앓을 위험이 있다.
하나의 양태에서, 피험자는 포유동물, 특히 인간이다. 그러나, 피험자는 비-인간일 수도 있다. 바람직한 비-인간 동물에는 마모셋 또는 원숭이와 같은 영장류, 말, 소, 양 또는 돼지와 같은 상업적으로 사육되는 동물, 및 개, 고양이, 마우스, 래트, 기니 피그, 페렛, 저빌 또는 햄스터가 포함되나 이들로 제한되지 않는다. 피험자는 세균에 의해 감염될 수 있는 임의의 동물일 수 있다.
피험자는 전형적으로 인간 환자이다. 환자는 남성일 수도 있고 여성일 수도 있다. 환자의 연령은 전형적으로 적어도 18세, 예를 들어 30 내지 70세 또는 40 내지 60세이다. 피험자는 또한 소아 또는 청소년, 예를 들어 6개월 내지 11세 또는 12세 내지 17세일 수 있다.
본 발명의 치료 단백질 복합체, 폴리펩타이드 구성체 또는 조성물은 장애의 하나 이상의 증상의 발병 또는 재발을 예방하기 위해 피험자에게 투여될 수 있다. 이는 예방적이다. 이 실시양태에서, 피험자는 무증상일 수 있다. 예방적 유효량의 작용제 또는 제형은 이러한 피험자에게 투여한다. 예방적 유효량은 장애의 하나 이상의 증상의 개시를 예방하는 양이다.
본 발명의 치료 단백질 복합체, 폴리펩타이드 구성체 또는 조성물은 장애의 하나 이상의 증상을 치료하기 위해 피험자에게 투여될 수 있다. 이 실시양태에서, 피험자는 전형적으로 증상이 있다. 치료 유효량의 작용제 또는 제형을 이러한 피험자에게 투여한다. 치료 유효량은 장애의 하나 이상의 증상을 개선하는데 유효한 양이다.
치료 단백질 복합체, 폴리펩타이드 구성체 또는 조성물은 다양한 투여 형태로 투여될 수 있다. 따라서, 이는 예를 들어 정제, 트로키제, 로젠지제, 수성 또는 유성 현탁액, 분산성 분말 또는 과립으로서 경구 투여될 수 있다. 본 발명의 치료 단백질 복합체 또는 조성물은 또한 피하, 정맥내, 근육내, 흉골내, 경피 또는 주입 기법에 의해 비경구로 투여될 수 있다. 치료 단백질 복합체, 폴리펩타이드 구성체 또는 조성물은 또한 좌약으로 투여될 수 있다. 바람직하게는, 화합물, 조성물 또는 조합물은 흡입(에어로졸화) 또는 정맥내 투여를 통해 투여될 수 있으며, 가장 바람직하게는 흡입(에어로졸화) 투여에 의해 투여될 수 있다.
본 발명의 치료 단백질 복합체 또는 조성물은 일반적으로 약학적으로 허용되는 담체 또는 희석제와 함께 투여하기 위해 제형화된다. 예를 들어, 고체 경구 형태는 활성 화합물과 함께 희석제, 예를 들어 락토스, 덱스트로스, 사카로스, 셀룰로스, 옥수수 전분 또는 감자 전분; 윤활제, 예를 들어 실리카, 활석, 스테아르산, 마그네슘 또는 칼슘 스테아레이트, 및/또는 폴리에틸렌 글리콜; 결합제; 예를 들어 전분, 아라비아 고무, 젤라틴, 메틸셀룰로스, 카복시메틸셀룰로스 또는 폴리비닐 피롤리돈; 분해제, 예를 들어 전분, 알긴산, 알기네이트 또는 나트륨 전분 글리콜레이트; 발포성 혼합물; 염료; 감미료; 레시틴, 폴리소르베이트, 라우릴설페이트와 같은 습윤제; 및 일반적으로, 약학 제형에 사용되는 무독성의 약리학적으로 불활성인 물질을 함유할 수 있다. 이러한 약학 제제는 공지된 방식, 예를 들어 혼합, 과립화, 정제화, 당 코팅 또는 필름 코팅 공정에 의해 제조될 수 있다.
본 발명의 치료 단백질 복합체, 폴리펩타이드 구성체 또는 조성물을 흡입(에어로졸화) 투여를 위해 용액 또는 현탁액으로서 제형화할 수 있다. 본 발명의 치료 단백질 복합체 또는 조성물은 정량 흡입기(MDI) 또는 전자 또는 제트 분무기와 같은 분무기에 의해 투여될 수 있다. 대안적으로, 본 발명의 치료 단백질 복합체 또는 조성물은 분말 약물로서 흡입 투여하기 위해 제형화될 수 있으며, 이러한 제형은 건조 분말 흡입기(DPI)로부터 투여될 수 있다. 흡입 투여를 위해 제형화되는 경우, 본 발명의 치료 단백질 복합체 또는 조성물은 질량 중간 공기역학적 직경(MMAD)이 1 내지 100 ㎛, 바람직하게는 1 내지 50 ㎛, 더욱 바람직하게는 1 내지 20 ㎛, 예를 들어 3 내지 10 ㎛, 예를 들어 4 내지 6 ㎛인 입자의 형태로 전달될 수 있다. 본 발명의 치료 단백질 복합체 또는 조성물이 분무된 에어로졸로서 전달되는 경우, 입자 직경에 대한 참조는 에어로졸 소적의 MMAD를 정의한다. MMAD는 레이저 회절과 같은 적합한 기법으로 측정될 수 있다.
경구 투여를 위한 액체 분산액은 시럽, 유화액 및 현탁액일 수 있다. 시럽은 담체로서, 예를 들어 사카로스 또는 글리세린 및/또는 만니톨 및/또는 소르비톨과 함께 사카로스를 함유할 수 있다.
현탁액 및 유화액은 담체로서 천연 검, 아가, 나트륨 알기네이트, 펙틴, 메틸셀룰로스, 카복시메틸셀룰로스 또는 폴리비닐 알콜을 함유할 수 있다. 근육내 주사 또는 흡입을 위한 현탁액 또는 용액은 활성 화합물과 함께 약학적으로 허용되는 담체, 예를 들어 멸균수, 올리브 오일, 에틸 올리에이트, 글리콜, 예를 들어 프로필렌 글리콜 및 목적하는 경우 적합한 양의 리도카인 하이드로클로라이드를 함유할 수 있다.
흡입, 주사 또는 주입을 위한 용액은 담체로서 예를 들어 멸균수를 함유할 수 있거나, 또는 바람직하게는 멸균 수성 등장성 식염수 용액의 형태일 수 있다. 예를 들어, 경피 주사와 같은 무바늘 주사에 의한 전달에 적합한 약학 조성물이 또한 사용될 수 있다.
본 발명의 치료 단백질 복합체 또는 조성물의 치료 또는 예방 유효량이 피험자에게 투여된다. 용량은 다양한 매개변수, 특히 사용된 화합물; 치료할 피험자의 연령, 체중 및 상태; 투여 경로; 및 필요한 섭생에 따라 결정될 수 있다. 다시, 의사는 임의의 특정 피험자에 대해 필요한 투여 경로와 투여량을 결정할 수 있다. 전형적인 1일 용량은 특정 억제제의 활성, 치료할 피험자의 연령, 체중 및 상태, 질병의 유형 및 중증도, 투여 빈도 및 경로에 따라 ㎏당 약 0.01 내지 100 ㎎, 바람직하게는 약 0.1 ㎎/㎏ 내지 50 ㎎/㎏, 예를 들어 약 1 내지 10 ㎎/㎏ 체중이다. 바람직하게, 일일 투여량 수준은 5 ㎎ 내지 2 g이다.
본 발명의 치료 단백질 복합체 또는 조성물이 또 다른 활성제와 조합되어 피험자에게 투여되는 경우, 다른 활성제의 용량은 상기에 기재된 바와 같이 결정될 수 있다. 용량은 다양한 매개변수, 특히 사용된 작용제; 치료할 피험자의 연령, 체중 및 상태; 투여 경로; 및 필요한 섭생에 따라 결정될 수 있다. 다시, 의사는 임의의 특정 피험자에 대해 필요한 투여 경로와 투여량을 결정할 수 있다. 전형적인 1일 용량은 특정 억제제의 활성, 치료할 피험자의 연령, 체중 및 상태, 질병의 유형 및 중증도, 투여 빈도 및 경로에 따라 ㎏당 약 0.01 내지 100 ㎎, 바람직하게는 약 0.1 ㎎/㎏ 내지 50 ㎎/㎏, 예를 들어 약 1 내지 10 ㎎/㎏ 체중이다. 바람직하게, 일일 투여량 수준은 5 ㎎ 내지 2 g이다.
본원에 제공된 단백질 복합체, 치료 약물 유사체 및 치료 약물 후보는 진단 방법에도 유용하다. 본원에 제공된 폴리펩타이드 구성체 및 약물은 진단 방법에도 유용하다. 따라서, 본원은 피험자의 병리학을 진단하는 방법에 사용하기 위해 본원에 기재된 바와 같은 단백질 복합체, 치료 약물 유사체 또는 치료 약물 후보, 또는 폴리펩타이드 구성체 또는 약물을 제공한다. 피험자는 본원에 더 상세히 기재된 바와 같은 피험자일 수 있다. 병리학은 본원에 기재된 바와 같은 병리학일 수 있다. 방법은 단백질 복합체, 치료 약물 유사체 또는 치료 약물 후보를 피험자로부터 수득된 샘플(예를 들어 혈액, 혈청, 뇨 또는 뇌척수액과 같은 생물학적 유체; 및 바이러스 면봉 샘플, 생검 및 부검 조직)과 접촉시키고, 단백질 복합체, 치료 약물 유사체 또는 치료 약물 후보가 존재하는 경우와 존재하지 않는 경우와 비교하여 샘플에서 발생하는 병리학의 특징 변화를 검출하는 것을 포함한다.
본 발명은 적어도 하기 번호의 실시양태를 포함한다:
1. - 복수의 서브유닛 단량체를 포함하는 올리고머성 코어; 및
- 적어도 2개의 제2 결합 부위에 직교하는 적어도 2개의 제1 결합 부위
를 포함하는 다가 단백질 스캐폴드로서, 여기서 상기 제1 결합 부위와 상기 제2 결합 부위는 스캐폴드의 동일 면 상에 위치하는, 다가 단백질 스캐폴드.
2. - 복수의 서브유닛 단량체를 포함하는 올리고머성 코어; 및
- 적어도 하나의 제2 결합 부위에 직교하는 적어도 하나의 제1 결합 부위;
를 포함하는 다가 단백질 스캐폴드로서, 여기서 상기 제1 결합 부위(들) 및 상기 제2 결합 부위(들)는 스캐폴드의 동일 면 상에 위치하며;
여기서 상기 제1 결합 부위는 제1 폴리펩타이드 표적에 공유 결합을 형성할 수 있는 제1 단백질 도메인을 포함하고; 상기 제2 결합 부위는 제2 폴리펩타이드 표적에 공유 결합을 형성할 수 있는 제2 단백질 도메인을 포함한다.
3. - 복수의 서브유닛 단량체를 포함하는 올리고머성 코어; 및
- 적어도 하나의 제2 결합 부위에 직교하는 적어도 하나의 제1 결합 부위
를 포함하는 다가 단백질 스캐폴드로서,
여기서 상기 제1 결합 부위(들) 및 상기 제2 결합 부위(들)는 스캐폴드의 동일 면 상에 위치하며;
여기서 상기 올리고머성 코어는 항체의 Fc 영역을 포함하지 않는다.
4. 선행 실시양태 중 어느 하나에 따른 단백질 스캐폴드에서, 올리고머성 코어는 적어도 3개의 서브유닛 단량체를 포함하고, 바람직하게 올리고머성 코어는 3 내지 6개의 서브유닛 단량체를 포함한다.
5. 선행 실시양태 중 어느 하나에 따른 단백질 스캐폴드에서, 서브유닛 단량체가 비-공유결합적으로 함께 부착된다.
6. 실시양태 1 내지 4에 따른 단백질 스캐폴드에서, 서브유닛 단량체는 공유결합적으로 함께 부착되고; 바람직하게 상기 서브유닛 단량체는 유전적으로 함께 융합된다.
7. 선행 실시양태 중 어느 하나에 따른 단백질 스캐폴드에서, 올리고머성 코어는 동종올리고머성 코어이다.
8. 선행 실시양태 중 어느 하나에 따른 단백질 스캐폴드에서, 올리고머성 코어 내의 각각의 단량체는 적어도 하나의 제1 결합 부위 및 적어도 하나의 제2 결합 부위를 포함하고, 적어도 하나의 제1 결합 부위는 적어도 하나의 제2 결합 부위에 직교한다.
9. 선행 실시양태 중 어느 하나에 따른 단백질 스캐폴드에서, 각 단량체는 상기 단량체의 제1 말단에 부착된 제1 결합 부위 및 상기 단량체의 제2 말단에 제2 결합 부위를 포함한다.
10. 선행 실시양태 중 어느 하나에 따른 단백질 스캐폴드에서, 각 단량체의 제1 말단과 제2 말단은 상기 단량체의 동일 면 상에 위치한다.
11. 실시양태 1 내지 8 중 어느 하나에 따른 단백질 스캐폴드에서, 각 단량체는 상기 단량체의 제1 말단에 부착된 제1 결합 부위 및 상기 제1 결합 부위에 부착된 제2 결합 부위를 포함한다.
12. 실시양태 1 내지 6 중 어느 하나에 따른 단백질 스캐폴드에서, 상기 올리고머성 코어는 이종-올리고머성 코어이다.
13. 실시양태 12에 따른 단백질 스캐폴드에서, 상기 코어는 제1 결합 부위를 포함하는 적어도 하나의 제1 서브유닛 단량체, 및 제2 결합 부위를 포함하는 적어도 하나의 제2 서브유닛 단량체를 포함하고, 제1 결합 부위는 제2 결합 부위에 직교한다.
14. 선행 실시양태 중 어느 하나에 따른 단백질 스캐폴드에서,
i) 각각의 서브유닛 단량체는 300개 미만의 아미노산을 포함하고; 바람직하게는 각각의 서브유닛 단량체는 200개 미만의 아미노산을 포함하며; 더욱 바람직하게는 각각의 서브유닛 단량체는 150개 미만의 아미노산을 포함하고/하거나;
ii) 올리고머성 코어는 약 150 kDa 미만, 바람직하게는 약 100 kDa 미만; 더욱 바람직하게는 약 70 kDa 미만의 분자량을 갖는다.
15. 선행 실시양태 중 어느 하나에 따른 단백질 스캐폴드에서, 올리고머성 코어는 항체의 Fc 영역을 포함하지 않는다.
16. 선행 실시양태 중 어느 하나에 따른 단백질 스캐폴드에서, 올리고머성 코어는 다량체 단백질의 가용성 다량체화 구조 요소를 포함한다.
17. 실시양태 16에 따른 단백질 스캐폴드에서, 다량체 단백질은 콜라겐 NC1 도메인, CutA1, C1q 도메인, TNF, p53, 피브리노겐, C4, 바실러스 서브틸러스 AbrB 또는 이의 상동체 또는 동종간 상동체를 포함한다.
18. 실시양태 16 또는 실시양태 17에 따른 단백질 스캐폴드에서, 다량체화 구조 요소는 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 19에 대해 적어도 50% 아미노산 동일성을 갖는 폴리펩타이드를 포함한다.
19. 선행 실시양태 중 어느 하나에 따른 단백질 스캐폴드에서, 상기 제1 결합 부위 및/또는 상기 제2 결합 부위는 단백질 도메인을 포함하고;
바람직하게 상기 제1 결합 부위는 제1 단백질 도메인을 포함하고, 상기 제2 결합 부위는 제2 단백질 도메인을 포함하고; 제1 결합 부위 및/또는 제2 결합 부위는 이들이 부착되는 서브유닛 단량체(들)에 유전적으로 융합되어 단일 폴리펩타이드 쇄를 형성한다.
20. 선행 실시양태 중 어느 하나에 따른 단백질 스캐폴드에서, 상기 제1 결합 부위는 제1 폴리펩타이드 표적에 공유 결합을 형성할 수 있는 제1 단백질 도메인을 포함하고; 상기 제2 결합 부위는 제2 폴리펩타이드 표적에 공유 결합을 형성할 수 있는 제2 단백질 도메인을 포함하고;
바람직하게 상기 제1 단백질 도메인은 상기 제1 폴리펩타이드 표적과 이소펩타이드 결합을 형성할 수 있고, 상기 제2 단백질 도메인은 상기 제2 결합 표적과 이소펩타이드 결합을 형성할 수 있다.
21. 실시양태 20에 따른 단백질 스캐폴드에서, 상기 제1 결합 부위 및 상기 제2 결합 부위는 각각 상이한 분할된 리간드-결합 단백질 도메인을 포함하고;
바람직하게 상기 제1 결합 부위 및 상기 제2 결합 부위 중 하나는 분할된 스트렙토코커스 파이오게네스 피브로넥틴-결합 단백질 도메인을 포함하고, 상기 제1 결합 부위 및 상기 제2 결합 부위 중 나머지 하나는 분할된 스트렙토코커스 뉴모니에 부착소 도메인을 포함한다.
22. 실시양태 21에 따른 단백질 스캐폴드에서, 상기 제1 및 상기 제2 결합 부위는 각각 독립적으로 서열 번호 4-9, 11-13 또는 15-18 중 어느 하나에 대해 적어도 50% 아미노산 동일성을 갖는다.
23. 선행 실시양태 중 어느 하나에 따른 단백질 스캐폴드를 포함하는 단백질 복합체로서, 여기서 제1 결합 부위는 제1 효과기 모이어티에 부착된 제1 폴리펩타이드 표적에 결합되고, 제2 결합 부위는 제2 효과기 모이어티에 부착된 제2 폴리펩타이드 표적에 결합된다.
24. 실시양태 23에 따른 단백질 복합체에서, 제1 결합 부위/폴리펩타이드 표적 쌍 및 제2 결합 부위/폴리펩타이드 표적 쌍은 각각 독립적으로 하기의 조합으로부터 선택된다: (i) 서열번호: 4, 6 또는 8 중 어느 하나 또는 서열번호 5, 7 또는 9 중 어느 하나; (ii) 서열번호 12와 서열번호 13 또는 15; (iii) 서열번호 5와 서열번호 11; (iv) 서열번호 15와 서열번호 16); (v) 서열번호: 17 및 서열번호: 18.
25. 라이브러리를 포함하는 스크리닝 플랫폼으로서, 여기서 상기 라이브러리는 실시양태 23 또는 실시양태 24에 따른 단백질 복합체의 복수의 집단을 포함하고, 단백질 복합체 집단은 각각 제1 효과기 모이어티, 제2 효과기 모이어티 및/또는 올리고머성 코어의 상이한 조합을 포함한다.
26. 치료 약물 유사체를 식별하는 방법으로서, 상기 방법은, 실시양태 23 또는 실시양태 24에 따른 단백질 복합체를 제공하는 단계; 단백질 복합체를 생물학적 시스템과 접촉시키는 단계; 및 단백질 복합체가 생물학적 시스템의 특성 기능에 목적하는 변화를 유도하는지 여부를 측정하는 단계를 포함하고, 임의로 생물학적 시스템의 특성에 목적하는 변화를 유도하는 단백질 복합체를 선택하는 단계를 추가로 포함한다.
27. 실시양태 26에 따른 방법으로서,
- 단백질 복합체의 제1 및 제2 효과기 모이어티에 부착된 식별된 치료 약물 유사체의 단백질 복합체의 스캐폴드의 올리고머성 코어를 포함하는 치료 약물 후보를 합성하는 단계를 추가로 포함한다.
28. 실시양태 26 또는 실시양태 27의 방법에 따라 수득될 수 있는 치료 약물 후보.
29. 치료 약물 후보로서, 상기 치료 약물 후보는, 하나 이상의 제1 효과기 모이어티 및 하나 이상의 제2 효과기 모이어티에 부착된 복수의 서브유닛 단량체를 포함하는 올리고머성 코어를 포함하고, 여기서 상기 하나 이상의 제1 효과기 모이어티와 상기 하나 이상의 제2 효과기 모이어티는 올리고머성 코어의 동일 면 상에 위치하며; 여기서 (i) 상기 하나 이상의 제1 효과기 모이어티는 2개 이상의 제1 효과기 모이어티를 포함하고 상기 하나 이상의 제2 효과기 모이어티는 2개 이상의 제2 효과기 모이어티를 포함하고/하거나, (ii) 상기 올리고머성 코어는 항체 또는 항체 단편을 포함하지 않는다.
30. 실시양태 29의 치료 약물 후보에서, 올리고머성 코어는 실시양태 1 내지 22 중 어느 하나에 정의된 바와 같다.
31. 실시양태 29 또는 실시양태 30의 치료 약물 후보에서, 올리고머성 코어는 복수의 서브유닛 단량체를 포함하고, (i) 각각의 서브유닛 단량체는 콜라겐 NC1 도메인, CutA1, C1q 도메인, TNF, p53, 피브리노겐, C4, 바실러스 서브틸러스 AbrB 또는 이의 상동체 또는 동종간 상동체를 포함하고/하거나; (ii) 각각의 서브유닛 단량체는 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 19에 대해 적어도 50%의 아미노산 동일성을 갖는 폴리펩타이드를 포함하는 다량체화 구조 요소를 포함한다.
하기의 실시예는 본 발명을 예시한다. 그러나 이들 실시예는 어떤 식으로든 본 발명을 제한하지 않는다. 특히, 단백질 결합에 대한 복수의 분석이 존재하며, 따라서 특정 분석의 음성 결과가 결정적인 것은 아니다. 본 발명은 청구범위에 따라 정의된다.
요약하면, 실시예 1은, N 및 C 말단에 콜라겐 X NC1 구조 도메인과 SnoopCatcher 및 SpyCatcher 도메인을 포함하는 구성체의 생성을 상세히 설명하며, 이어서 이들은 이소펩타이드 결합을 통해 SpyTagged 및 SnoopTagged 치료 폴리펩타이드에 공유결합적으로 연결되고, 이어서 이소펩타이드-결합된 구성체는 올리고머화되어 동종삼량체를 형성한다. 실시예 2는 후속 실시예에 사용된 물질 및 방법을 제공한다. 실시예 3은 본 발명에 따른 구성체의 설계를 개괄적으로 설명하고, C3 기하학적 구조를 포함하는 적합한 기하학적 구조의 다중 성분을 식별하고, SpC-PhCutA1-SnC(서열번호 22)의 정제를 입증한다. 실시예 4는 본 발명의 바람직한 구성체에 대한 설계 기준을 충족시키기 위해 다른 조립체 기하학적 형상이 어떻게 수정될 수 있는지를 예시한다. 실시예 5는 PhCutA1-유래된 성분의 탁월한 안정성과 그 구조에 의해 예측된 다량체화에 대한 확고한 증거를 강조한다. 실시예 6은 SpyTagged/SnoopTagged 성분을 정제하고 생성 플랫폼을 태그된 단백질로 장식한다. 실시예 7은 모듈식 조립 후 단백질이 확장 가능한 방식으로 세척될 수 있음을 보여 주며, 여기서는 100-kDa 멤브레인에 대한 투석을 통해 용액 내 큰 크기를 활용한다. 실시예 8은 모듈식 조립이 PhCutA1-유래된 플랫폼에서 전환되는 HsCutA1-유래된 플랫폼 개발을 포함하여, 신속한 프로토타이핑을 가능하게 함을 보여준다. 실시예 9는 Alphafold를 사용하여 시스- 배향 및 비-시스 IMX 및 콜라겐 XVIII NC1 조립체에 대한 대조를 예측한다. 실시예 10은 리간드의 효능 및 하류 효과를 밝히기 위해 조립된 플랫폼이 시험관내 스크리닝에 사용될 수 있음을 보여주는 세포 데이터를 제공한다. 실시예 10은 또한 효과기 부분을 포함하는 PhCutA1의 다중-도메인 폴리펩타이드가 쉽게 생산될 수 있음을 보여준다.
실시예
실시예 1
SpyCatcher 및 SnoopCatcher 중 하나의 N-말단과 SpyCatcher 및 SnoopCatcher 중 나머지 하나의 C-말단에서 링커에 의해 부착된 콜라겐 NC1의 단량체를 암호화하는 폴리뉴클레오타이드 서열을 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Press, Plainsview, New York (2012)]에 기재된 방법에 따라 합성한다. 폴리뉴클레오타이드 서열은 세포 발현 시스템에서 발현되어 폴리펩타이드 융합을 생성한다. 폴리펩타이드 융합은 SpyCatcher 및 SnoopCatcher 결합 부위가 올리고머화된 삼량체 구성체의 동일 면 상에 있도록 올리고머화를 허용한다.
구성체의 샘플을 각각 SpyTag 및 SnoopTag에 결합된 서로 다른 제1 및 제2 치료 폴리펩타이드 패널과 접촉시켜 SpyTagged 폴리펩타이드가 각 SpyCatcher 모이어티 및 SnoopTagged 폴리펩타이드와 공유 이소펩타이드 결합을 형성하여 각각의 SnoopCatcher 모이어티와의 공유 이소펩타이드 결합을 형성시키고, 이에 의해 콜라겐 X NC1 구성체의 라이브러리를 생성시키며, 여기서 구성체의 각 단량체는 2개의 상이한 치료 폴리펩타이드 각각에 결합되고, 이와 같이 삼량체 구성체는 각 폴리펩타이드의 3개 사본을 포함한다. 각 샘플은 제1 치료 폴리펩타이드와 제2 치료 폴리펩타이드의 상이한 조합을 포함한다.
라이브러리의 각 샘플을, 암세포 샘플에서 세포 사멸을 유발하는 것과 같이 생물학적 시스템에서 생물학적 반응을 촉발하는 능력에 대해 평가한다.
암세포 사멸을 유발하는데 가장 효과적인 라이브러리의 샘플을 기록한다. 이러한 샘플 중의 치료 폴리펩타이드의 조합을 기록한다.
N-말단에서 치료 폴리펩타이드 중 하나에 연결되고 C-말단에서 다른 치료 펩타이드에 연결되는 콜라겐 NC1의 단량체와 같은 올리고머 단백질의 단량체를 암호화하는 폴리뉴클레오타이드를 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Press, Plainsview, New York (2012)]에 기재된 바와 같이 합성한다. 폴리뉴클레오타이드를, 올리고머 단백질 단량체와 제1 및 제2 치료 폴리펩타이드의 융합으로 이루어진 폴리펩타이드 단량체를 생성하도록 발현시킨다. 단량체의 올리고머화가 허용된다. 단량체를 생물학적 시스템에 대해 시험한다. 초기 구성체에 대해 관찰된 생물학적 반응, 예를 들어 암세포 샘플에서 세포 사멸의 원인이 관찰된다.
실시예를, 링커에 의해 N-말단에서 SpyCatcher 및 SnoopCatcher 중 하나에 연결되고 C-말단에서 SpyCatcher 및 SnoopCatcher 중 나머지 하나에 부착된 CutA1의 단량체를 암호화하는 폴리뉴클레오타이드 서열을 사용하여 수행할 수 있다.
실시예 2 - 방법
스캐폴드 단백질 성분의 선택: 설계 기준을 충족하는 단백질 구조를 Protein Data Bank(PDB)에서 선택하였다. 적합한 검색 필터(예를 들어, http://www.rcsb.org/pdb/를 통해 제공되는 것)의 사용은 기하학 기반 사전 스크리닝을 가능하게 하였으며, 그 후 후보 구조를 단백질 구조 시각화를 통해서 및 관련 문헌에 설명된 생화학적 특성을 참조하여 추가로 검사하였다.
조립된 단백질 구조의 예측: 단백질 서열의 다량체 3D 구조를, IMX-함유 SpC3-IMX-DgC 서열번호 35를 제외한 모든 단백질에 대한 디폴트 매개변수와 함께 AlphaFold2-다량체-v2 모델_유형 매개변수를 사용하여 문헌[Mirdita et al., 2021, bioRxiv, DOI: 10.1101/2021.08.15.456425v3]에 의해 제공된 Colab 노트북에서 AlphaFold2 v2.0 실행을 통해 예측하였다. IMX 함유 SpC3-IMX-DgC 서열번호 35의 경우, template_mode를 컴퓨터 리소스를 보존하기 위해 pdb70으로 설정하였다. SpC3-IMX-DgC를 제외한 모든 단백질을 삼량체로서 제출하였으며, SpC3-IMX-DgC는 칠량체로서 제출하였다. 예측 전에 말단 링커 및 태그 서열을 제거하였다. 가장 높은 순위의 모델을 시각화하였다.
분자 클로닝: 재조합 단백질을 암호화하는 플라스미드는 Twist Biosciences 또는 ProteoGenix에서 제공되었다. DNA 단편과 올리고뉴클레오타이드는 Integrated DNA Technologies(IDT)에 의해 합성되었다. L1-PhCutA1-L2, DgT-X3 및 SpC-HsCutA1-DgC에 대한 구성체는 표준 클로닝 절차를 통해 조립되었다. 합성된 DNA 단편을 플라스미드 주쇄에 도입하거나, 점 돌연변이를 도입하거나, 재조합 서열에 대한 기타 조정을 수행하기 위해, DNA를 표준 폴리머라제 연쇄 반응(PCR)에 이어서 제한 클로닝을 포함한 표준 클로닝 방법을 사용하여 증폭시켰다. 조립된 구성체를 에스케리키아 콜라이 NEB 5-알파 세포로 형질전환시켰다. 추정 양성 클론을 밤새 증식시키고, DNA를 miniprep을 통해 세균 펠릿으로부터 단리하였다. 서열 검증을 위한 Sanger 서열분석 위해 샘플을 Source Bioscience로 보냈고 Benchling의 분자 생물학 제품군(www.benchling.com)을 사용하여 정렬을 수행하였다.
단백질 정제: SnT-L1(16.1 kDa), L2-SpT(9.7 kDa), DgT-X3(26.9 kDa), SpC-PhCutA1-SnC(39.0 kDa), SpC3-MIF2m-DgC(39.6 kDa) 및 SpC3-HsCutA1-DgC(40.5 kDa)의 단백질을 수득하기 위해서 두 단백질을 모두 암호화하는 DNA((ProteoGenix, Twist Bioscience에 의해 합성되거나, 표준 클로닝 절차를 통해 합성됨)를 BL21(DE3) 세포로 형질전환시켰다. 콜로니를 사용하여 LB 배양물을 160-220 rpm으로 진탕하면서 37℃에서 50 ㎍/㎖ 카나마이신으로 접종하였다. 밤새 배양물을 50 ㎍/㎖ 카나마이신이 보충된 LB 또는 2xYT 배지에 1:100으로 희석하였다. 배양물을, OD 0.6-0.8(LB) 또는 1.6-2.0(2xYT)에서 0.2-0.4 μM IPTG를 사용하여 단백질 발현을 유도하기 전에 160-220 rpm으로 진탕하면서 37℃에서 증식시켰다. 플랫폼 단백질(SpC-PhCutA1-SnC, SpC3-MIF2m-DgC, SpC3-HsCutA1-DgC)의 경우, 샘플을 160-200 rpm으로 진탕시키면서 37℃에서 추가로 4시간 동안 배양하였다. 태그된 단백질(SnT-L1, L2-SpT, DgT-X3)의 경우 샘플을 160-200 rpm으로 진탕시키면서 18℃에서 16시간 동안 배양하였다. 세포를 4℃에서 15분 동안 5000× g 로 원심분리하여 수집하고 펠릿을 -20℃에서 보관하였다. 단백질 정제를 위해, 세포 펠릿을, 1 mM PMSF, 완전한 EDTA가 없는 프로테아제 억제제 칵테일 및 벤조나제(5 U/㎖)가 보충된 Ni-NTA 평형 완충액(50 mM Tris, pH 7.8; 300 mM NaCl, 10 mM 이미다졸)에 재현탁시켰다. 샘플을 20 ㎜ 탐침과 20%의 진폭을 사용하여 9-12분 동안 2초 켜짐/4초 꺼짐 펄스를 사용하고 16,000×g에서 30분 동안 회전하는 초음파 프로세서로 초음파처리하였다. Ni-NTA 크로마토그래피를 위해 상등액을 보관하였다.
사전 평형화된 HisPur Ni-NTA 중력 흐름 컬럼을 사용하여 세포 용해물로부터 단백질을 정제하였다. 단백질 용해물을 수지에 로딩하였다. 수지를 50 mM Tris, pH 7.8로 세척하였고; 300 mM NaCl, 10 mM 이미다졸 및 후속적으로 50 mM Tris, pH 7.8; 300 mM NaCl, 30 mM 이미다졸로 280 ㎚에서 통과 분획의 흡광도가 기준선에 접근할 때까지 세척하였다. His-태그된 단백질을, 280 ㎚에서 용출 분획의 흡광도가 기준선에 접근할 때까지 2 수지층 부피의 용출 완충액(50 mM Tris, pH 7.8; 300 mM NaCl, 200 mM 이미다졸)으로 상기 수지로부터 용출시켰다. 용출물을 SDS-PAGE에 이어서 쿠마씨 염색으로 분석하였다. Ni-NTA 정제 후, 고농도의 이미다졸 샘플을 3K MWCO에서 SnakeSkin™ 투석 튜브를 사용하여 PBS로 투석하였다. 총 용출 부피를 기준으로 적절한 길이의 튜브를 결정하고 Milli-Q 수로 수화시켰다. 샘플을 SnakeSkin™ 투석 튜브로 옮기고 자기 교반기상에서 4℃에서 밤새 5 L PBS에 두었다. 16시간 후, 완충액을 2시간 동안 배양하면서 2회 더 교체하였다. 추정 단백질 농도를 ProtParam에 의해 예측된 흡광 계수가 감소된 Implen NanoPhotometer N60을 사용하여 280 ㎚에서의 흡광도 측정을 통해 계산하였다. L3-DgT는 Absolute Antibody에 의해 생성되었다.
크기 배제 크로마토그래피: Ni-NTA 정제 후, 도면에 도시된 바와 같이 크기 배제 크로마토그래피를 사용하여 단백질을 선택적으로 추가로 정제하였다. 이는 HiLoad Superdex 75 pg(SnT-L1 및 L2-SpT) 또는 HiLoad Superdex 200 pg(SpC-PhCutA1-SnC 및 L1-PhCutA1-L2) 컬럼이 있는 KTA Pure 25(Cytiva)를 사용하여 수행되었다. 컬럼을 먼저 한 컬럼 부피의 PBS로 평형화하였다. 로딩하기 전에 단백질 샘플을 약 1 ㎖로 농축시키고 2 ㎖ 주입 루프를 사용하여 컬럼에 주입하였다. 그런 다음 샘플을 2 ㎖ 분획 크기 수집과 함께 1 ㎖ 분-1의 유량을 사용하여 분리하였다. SDS-PAGE 분석을 위한 주요 용출 피크에 해당하는 20 ㎕ 샘플을 각 분획에서 채취하였다. 관심 단백질의 피크에 해당하는 분획을 모아 하류 적용 분야에 사용하거나 -20℃에서 보관하였다.
HsCutA1 조립체를 Superose 6 Increase 5/150 컬럼을 사용하여 정제하였다. 컬럼을 먼저 한 컬럼 부피의 PBS로 평형화하였다. 로딩하기 전에 단백질 샘플을 약 100 ㎕로 제조하고 Hamilton 700 마이크로리터 주사기를 통해 컬럼에 주입하였다. 그런 다음 샘플을 0.1 ㎖ 분획 크기 수집과 함께 0.3 ㎖ 분-1의 유량을 사용하여 분리하였다. SDS-PAGE 분석을 위한 주요 용출 피크에 해당하는 10 ㎕ 샘플을 각 분획에서 채취하였다. 관심 단백질의 피크에 상응하는 분획을 모아 하류 적용 분야에 사용하거나 -20℃에서 보관하였다.
BCA 분석에 의한 단백질 정량분석: 접합 전에, 제조사의 지침에 따라 BCA 단백질 분석 키트(ThermoFisher)를 사용하여 샘플을 정량분석하였다. BSA 표준을 1X PBS로 희석하였다. 정제된 단백질을 1X PBS에 1/5, 1/10 및 1/20으로 희석하여 농도가 분석의 선형 범위 내에 있는지 확인하였다. BCA 시약과 함께 배양한 후 BMG FluoSTAR Omega 플레이트 판독기에서 562 ㎚에서의 흡광도를 측정하였다. ㎎/㎖ 단위의 농도를 표준 곡선을 기준으로 보간하였다.
캐처-기반 단백질 접합: 관련 도면에 상세히 설명된 특정 분석에 따라 관련 리간드와의 플랫폼 접합을 1:1:1 내지 1:2:2의 플랫폼:리간드:리간드 비로 수행하였다. 접합 반응을 관련 분석에 따라 25℃에서 16시간, 24시간 또는 64시간 동안 진행하였으며 샘플을 SDS-PAGE(8%, 16%)에 이어서 쿠마씨 염색으로 분석하였다.
조립-후 투석: 과잉 기질을 제거하기 위한 접합된 조립체 H6-SpC-PhCutA1-SnC:SnT-L1:L2-SpT의 확인적 투석을 실온에서 100 kDa MWCO 셀룰로스 멤브레인을 갖는 HTDialytic 12웰 블록을 사용하여 수행하였다. 투석 전, 멤브레인을 멸균 Milli-Q에서 60분간 수화시키고, 20% 에탄올로 20분간 교체한 후, 사용 전에 멸균 Milli-Q 수로 2회 세척하였다. 샘플과 투석물에는 모두 1× PMSF가 포함되어 있다. 조립된 플랫폼 및 투석물의 샘플을 투석 중 2시간, 4시간, 8시간 및 16시간에 채취 하고 SDS-PAGE(14%)에 이어서 쿠마씨 염색으로 분석하였다.
세포 분석을 위한 입력으로서 접합된 조립체의 예비 투석이 상기와 같이 수행되었지만 하기와 같이 수정되었다: PMSF를 추가하지 않았고 투석을 실온에서 밤새 수행하였다.
HsCutA1 가교결합: H6-SpC3-HsCutA1-DgC를 가교결합시키기 위해 10 μM의 단백질을 PBS 중 0.1% 글루타르알데하이드와 함께 37℃에서 20분 동안 배양하였다. 반응 중에 표시된 간격으로 샘플을 채취하고 100 mM Tris pH 8.8을 첨가하여 반응을 중단시켰다. 샘플을 SDS-PAGE(12%)에 이어서 쿠마씨 염색으로 분석하였다.
세포 배양: NCI-N87(CRL-5822) 및 A-431(CRL-1555) 세포를 ATCC에서 얻었으며 각각 10% FCS 및 5% 페니실린/스트렙토마이신이 보충된 RPMI 및 DMEM에서 일상적으로 배양하였다.
세포 생존율 분석: 2000 NCI-N87 세포/웰을 96-웰 플레이트에 시딩하고 10% FCS가 보충된 DMEM에서 24시간 동안 증식시킨 후 0.2% FCS를 함유한 DMEM 배지에서 24시간 동안 기아 상태로 만들었다. 그런 다음 세포를 2개의 리간드(H6-SpC-PhCutA1-SnC:SnT-L1:L2-SpT) 또는 단지 하나의 리간드(H6-SpC-PhCutA1-SnC:SnT-L1, H6-SpC-PhCutA1-SnC:L2-SpT)만 있는 다양한 농도(0.01-100 nM)의 단백질 조립체로 처리하거나 모의 처리하였다. 스캐폴드만(H6-SpC-PhCutA1-SnC), 리간드만(SnT-L1, L2-SpT, SnT-L1 + L2-SpT) 및 두 리간드 모두에 대한 단클론 대조용 항체를 대조군으로 사용하였다. 모든 항체를 기아 배지에 희석하였다. 처리 시작 1시간 후, 분석 관련 성장 인자를 최종 농도 30 ng/㎖, 최종 FCS 농도 2%로 첨가하였다. 그런 다음 세포를 7일 동안 증식시키고 MTT 분석을 사용하여 생존 분획을 측정하였다. PBS에 용해된 5 ㎎/㎖ 3-(4,5-다이메틸티아졸-2-일)-2,5-다이페닐테트라졸륨 브로마이드(MTT) 20 ㎕를 200 ㎕ 배지가 들어 있는 각 웰에 첨가하였다. 3시간 동안 배양한 후 배지 흡인, 100% DMSO에 포르마잔 용해 및 570 ㎚에서 흡광도 판독을 수행하였다. 생존 분획은 모의 처리된 대조군으로 정규화하였다.
웨스턴 블롯팅: 안정성 분석: H6-SpC-PhCutA1-SnC 및 H6-SpC-PhCutA1-SnC:SnT-L1:L2-SpT(크기 배제 크로마토그래피를 사용하여 정제됨)를 4℃ 또는 37℃에서 4일 동안 PBS 및 10% FCS 함유 완전 배지에서 배양하였다. 샘플을 4-20% Tris-글리신 SDS-Page 젤상에서 실행시키고 iBlot 2 시스템(Thermo Fisher)을 사용하여 나이트로셀룰로스 멤브레인으로 옮겼다. 항-폴리히스티딘(Sigma-Aldrich, 카탈로그 번호 A7058, 1:2000)에 대한 항체로 멤브레인을 탐침하고 ECL을 사용하여 신호를 검출하였다. Akt/ERK 신호전달: 1.5x106 NCI-N87 세포를 T25 플라스크에 접종하고 10% FCS 및 5% 페니실린/스트렙토마이신 배지가 보충된 DMEM에서 24시간 동안 증식시킨 후 0.2% FCS를 함유하는 배지에서 24시간 동안 기아 상태로 만들었다. 그런 다음 세포를 둘 다(H6-SpC-PhCutA1-SnC:SnT-L1:L2-SpT) 또는 하나의 리간드(H6-SpC-PhCutA1-SnC:SnT-L1, H6-SpC-PhCutA1-SnC:L2-SpT)를 함유하는 25 nM의 단백질 조립체로 처리하거나 모의 처리하였다. 스캐폴드만(H6-SpC-PhCutA1-SnC), 리간드만(SnT-L1, L2-SpT, SnT-L1 + L2-SpT) 및 두 표적 단백질에 대한 상업적으로 입수할 수 있는 단클론 항체를 대조군으로 사용하였다. 처리 시작 1시간 후, 분석 관련 성장 인자를 최종 농도 50 ng/㎖로 첨가하여 세포를 자극하고 처리 전반에 걸쳐 0.2% FCS와 함께 1시간 동안 배양하였다. 포스파타제 및 프로테아제 억제제가 보충된 RIPA 완충액을 사용하여 전체 세포 추출물을 제조하였다. 레인당 25 ㎍의 단백질을 4-12% Bis-Tris 젤에서 분리하고 제조사의 지침에 따라 iBlot2 시스템을 사용하여 나이트로셀룰로스 멤브레인으로 옮겼다. p-Akt(Cell Signalling, 카탈로그 번호 4060, 1:2000), Akt(Cell Signalling, 카탈로그 번호 2920, 1:2000), p-ERK 1/2(Cell Signalling, 카탈로그 번호 9101, 1:1000), ERK1/2(Cell Signalling, 카탈로그 번호 4695S, 1:1000)에 대한 항체로 멤브레인을 탐침하였다. 신호를 ECL을 사용하여 검출하였다.
세포 사멸 분석: L1 및 L3을 표적으로 하는 단백질 조립체를 조사하기 위해 NCI-N87 세포(30,000개 세포/웰)를 96웰 플레이트에 시딩하고 완전 배지(10% FCS 및 5% 페니실린/스트렙토마이신이 보충된 DMEM)에서 24시간 동안 증식시킨 후, 0.2% FCS 및 5% 페니실린/스트렙토마이신을 함유한 배지에서 24시간 동안 기아 상태로 유지하였다. 그런 다음 세포를 다양한 농도(0.01-100 nM)의 조립된 단백질 H6-SpC3-HsCutA1-DgC:L1-SpT:L3-DgT, H6-SpC3-HsCutA1-DgC:L1-SpT 및 H6-SpC3-HsCutA1-DgC:L3-DgT 스캐폴드만(H6-SpC3-HsCutA1-DgC) 및 리간드만(L1-SpT, L3-DgT)으로 처리하고 40시간 동안 배양하였다. 생존 분획을 MTT 분석으로 측정하고 모의 처리된 대조용 세포에 정규화하였다.
실시예 3 - 재조합 단백질 성분의 적합한 선택은 시스-배향된 기하학적 결합을 특징으로 하는 단백질 복합체의 간단한 제조를 가능하게 한다.
본 발명자들은 각 단량체가 서로 또는 동일한 복합체 내의 다른 단량체의 말단에 근접한 C-말단 및 N-말단을 특징으로 하는 다량체 단백질 성분을 사용하여 "시스-배향"으로 단일 결합 표면을 향해 결합 부위를 돌출시킬 수 있음을 인식하였다. 공개적으로 이용 가능한 단백질 구조를 키워드 및/또는 기하학적 매개변수로 필터링하여 단량체 말단의 결합 부위 또는 이러한 단백질 복합체에 대한 리간드의 재조합 융합을 통해 "시스 배향"의 다량체 단백질 복합체에 도달하기에 적합한 기하학적 구조를 갖는 단백질 구조를 식별하였다(도 11).
본 발명자들은 하기를 포함하는 복수의 적합한 도메인을 식별하였다:
콜라겐 X NC1 도메인(PDB ID: 1GR3), 콜라겐 VIII NC1 도메인(PDB ID: 1O91), 다양한 종의 CutA1(구리 내성 A) 단백질(예를 들어, 파이로코커스 호리코시이(PDB ID: 4YNO), 호모 사피엔스(PDB ID: 2ZFH), 써무스 써모필레스(PDB ID: 1V6H), 오리자 사티바(PDB ID: 2ZOM), 또는 쉐와넬라 스페시즈 SIB1(PDB ID: 3AHP)로부터의 CutA1 단백질, C1q 헤드 도메인(PDB ID: 1PK6), TNF 유사 단백질 TL1A(PDB ID: 2RE9), TNF(PDB ID: 1TNF), MIF(PDB ID: 1CA7), MIF2(PDB ID: 7MSE), 및 본원에 기재되거나 도 11에 도시된 기타 단백질 구조.
본 발명자들은 에스케리키아 콜라이에서 재조합적으로 N-말단에서(GSGS 링커를 통해) SpyCatcher(서열번호 4) 및 C-말단에서(GSGS 링커를 통해) SnoopCatcher(서열번호 12)에 융합된 파이로코커스 호리코시이(서열번호 1)로부터의 PhCutA1(SpyCatcher의 His-태그 N-말단(서열번호 21, 도 12)을 추가로 특징으로 함)을 쉽게 발현 및 제조할 수 있다. 특히, 이러한 구성체 "H6-SpyCatcher-PhCutA1-SnoopCatcher" 또는 "SpC-PhCutA1-SnC"는 변성 SDS 로딩 완충액의 비등에 대한 내성에서 명백히 나타나는 초-열안정성 삼량체화를 특징으로 하며, 이는 온전한 PhCutA1의 특징이다(문헌[Tanaka et al., 2006, FEBS Letters, 580(17), pp.4224-4230]). 따라서 코어 단백질 PhCutA1의 다량체화 특성이 SpC-PhCutA1-SnC 스캐폴드에 성공적으로 부여되었다.
실시예 4 - 단량체 단백질의 N-말단 및 C-말단의 재조합 융합을 통한 "시스- 배향된" 디스플레이에 적합한 단백질 복합체는 이종 단백질 복합체 또는 2면체 단백질 조립체로부터 유래될 수 있다
N-말단 및 C-말단 부위에서의 재조합 융합에 의한 "시스-배향된" 디스플레이에 적합한 기하학적 구조를 이미 특징으로 하는 단백질 구조 또는 도메인에 더하여, 발명자들은 또한 그러한 성분이 유래될 수 있는 단백질을 식별하였다.
PDB ID 5w0j(문헌[Spencer & Hochbaum, 2017, Biochemistry, 56(40), pp.5300-5308])의 역평행 이중나선의 C-말단과 N-말단 사이에 적합한 링커를 사용하면 그 구조는 원형 대칭 HIV GP41(PDB ID 1i5y)(도 13a,c)의 구조를 모방한다. 여기서, PDB ID 5w0j(문헌[Spencer & Hochbaum, 2017])와 동일한 간행물에서 유래된 이형중합체 역평행 이중나선 조립체(PDB ID 5vte)는 균일한 조립체를 장려함으로써 간단한(합리적) 돌연변이 유발이 말단의 반전을 얼마나 완화할 수 있는지에 대한 예를 제공한다. 이중나선 단백질은 설계하기 쉽고 pH 민감성(문헌[Nagarkar et al., 2020, Peptide Science, 112(5), e24180])과 같은 설계된 특성으로부터 또는 생물활성 단백질 스위치(문헌[Langan et al., 2019, Nature, 572(7768), pp.205-210])로서 이득이 될 수 있다.
실시예 5 - CutA1 단백질은 Catcher 단백질에 대한 재조합 융합 후 삼량체 구조를 유지한다
PhCutA1은 변성 SDS 로딩 완충액에서 비등 후에조차 삼량체 구조를 유지하는 내열성이 뛰어난 단백질이다. 도 14에서 볼 수 있듯이, SpC 및 SnC에 대한 재조합 융합 후에조차 단백질 밴드가 PhCutA1의 안정적인 삼량체화를 가리키는 130-250 kDa 사이에서 관찰되었으며, 이는 전체 복합체가 우리의 구조-기반 설계에 따라 조립됨을 입증하였다. 이 관찰된 밴드가 올바른 PhCutA1 조립체에 의존하는지 추가로 검증하기 위해서 우리는 가혹한 변성 조건을 사용하였으며, 이때 우리는 SpC-PhCutA1-SnC의 부분 단량체화를 관찰하였다.
실시예 6: 모듈식 성분의 사용은 리간드 단백질 및 기타 효과기를 선택된 스캐폴드 단백질에 신속하게 조립할 수 있게 하여 복잡한 기하학적 구조를 부여할 수 있다.
모듈식 성분 조립체의 타당성을 입증하기 위해서, SpyTagged, SnoopTagged 및 DogTagged 리간드를 설계하고 표현하였다. Spy/Snoop 태그된 단백질 성분 SnT-L1 및 L2-SpT는 통상적인 세포 항원에 대한 리간드이다. Ni-NTA 정제로 인해 두 리간드 단백질이 모두 제거되었으며(도 15 a-b), 임의로 크기 배제 크로마토그래피가 이어졌다(도 15 c-d). 이들 성분을 사용하여, 캐처 단백질을 포함하는 모듈형 플랫폼에 태그된 리간드를 접합시키면 리간드가 부착된 완전히 조립된 플랫폼을 생성시킨다는 것을 확인하였다.
SnT-L1 및/또는 L2-SpT를 SpC-PhCutA1-SnC 또는 대조용 단백질 SpC-PC-SnC와 함께 배양한 후, 모든 샘플에 대해 접합이 완료될 수 있음을 관찰하였다(도 16a-c). 특히 SpC-PhCutA1-SnC의 초-내열성 삼량체화는 SnT-L1 및 L2-SpT 둘 다로 장식하는 동안에도 유지되었다. H6-SpC-PhCutA1-SnC(삼량체로서 117 kDa) 및 H6-SpC-PC-SnC(31 kDa)를 SnT-L1 및 L2-SpT와 접합시키면 추가된 분자량(단량체 SnT-L1당 16.1 kDa, 단량체 L2-SpT당 9.7 kDa)에 해당하는 밴드 이동이 발생하였다. 어느 한 플랫폼에 대한 두 리간드의 동시 접합으로 인해 상당한 밴드 이동이 발생하였다(단량체당 25.8 kDa으로 예상됨)(도 15 c-d). 또한, 리간드 강도의 감소(플랫폼을 초과하여 첨가)에서 리간드의 소모가 관찰되었다.
실시예 7: 간단한 조립-후 클린업과 모듈식 조립의 통합은 하류 분석을 위한 균일한 약물 후보를 제조할 수 있게 한다.
자동화-호환 방식으로 조립된 약물 후보의 정제를 위한 간단하고 효과적인 방법을 검증하기 위해, 발명자들은 약물 후보 정제를 위한 재사용 가능한 96-웰 및 12-웰 고-처리량 투석 장치의 적합성을 조사하였다. 본 발명자들은 SnT-L1 및 L2-SpT를 갖는 SpC-PhCutA1-SnC의 모듈식 조립체가 정기적인 완충액 교체로 16시간 동안 고처리량 투석을 통해 정제될 수 있음을 입증하였다. 이를 위해 1:1:1의 단백질 성분 비로 조립을 수행하고 샘플을 25℃에서 16시간 동안 배양하였다. 실온에서 100 kDa MWCO 셀룰로스 멤브레인을 갖춘 12-웰 고-처리량 투석 블록을 사용하여 투석을 수행하였다. 투석 중 단백질 분해를 방지하기 위해 샘플과 투석액 모두 1× PMSF를 함유하였다. 조립된 플랫폼 및 투석물의 샘플을 투석 중 2시간, 4시간, 8시간 및 16시간에 채취하고 SDS-PAGE로 분석하여 시간 경과에 따른 과잉 리간드 및 저분자 불순물의 제거를 입증하였다(도 17).
이는 큰 분자량의 조립체가 존재하고 용액에 안정적이라는 것을 보여준다. 그 특성으로 인해 간단한 정제 프로토콜이 가능해진다. 또한 이 방법론은 최종 단백질 조립 워크플로우에 대해 확장 가능하고 자동화 호환 가능하며, 이는 하류 시험관내 분석에 사용될 수 있다.
실시예 8: 모듈식 성분 설계는 신속한 프로토타이핑 및 초기 스크리닝에 최적화된 조립 플랫폼을 더 많은 하류 치료 검증에 최적화된 조립 플랫폼으로의 점진적인 전환을 가능하게 한다.
시험관내 스크리닝에 사용하기 위한 세균 스캐폴드 단백질의 설계, 생산, 조립 및 정제를 입증하였다(도 11, 도 12). 잠재적인 약물 유용성을 포함하여 플랫폼 성분을 빠르게 변화시키는 능력을 추가로 입증하기 위해 우리는 CutA1 단백질의 인간 상동체인 HsCutA1(도 11) 및 인간 대식세포 이동 억제 인자 2(MIF2)의 돌연변이체, MIF2m(도 11)를 기반으로 하는 스캐폴드를 식별, 클로닝, 발현 및 정제하였다. SpC3-HsCutA1-DgC(서열번호 24) 플랫폼은 HsCutA1(서열번호 29, 링커로서 올리고머성 코어를 넘어 일부 천연 아미노산을 유지하기 위해 절두됨)(이는 시험관내 검증 및 하류 치료 검증을 위한 인간 변이체를 나타낸다)에 융합된 태그된-리간드에의 무솔기 모듈식 접합을 위한 SpyCatcher003(서열번호 8) 및 DogCatcher(서열번호 23)을 특징으로 한다. SpC3-MIF2m-DgC(서열번호 28)는 SpC-PhCutA1-SnC(GSGS) 및 Sp3-HsCutA1-DgC(GGGGS)와 비교하여 유사한 C3 기하학적 구조와 더 긴 링커(GGGGSGGGGSGGGGS)를 갖는 상이한 스캐폴드를 특징으로 한다. SpC3-HsCutA1-DgC 및 SpC3-MIF2-DgC를 제조하기 위해 BL21(DE3) 세포를 단백질 발현에 사용한 후 Ni-NTA 중력 흐름 컬럼 정제를 수행하였다(도 18a). PhCutA1과 마찬가지로 HsCutA1 및 MIF2m에서 유래된 플랫폼은 리간드 조립에 사용할 수 있도록 쉽게 제조되었다.
HsCutA1은 PhCutA1과 거의 동일한 폴딩을 갖는 안정적인 단백질이지만(도 11), SDS 로딩 완충액에서 비등하는 동안 쉽게 단량체로 변성된다(도 18). 가교결합제인 글루타르알데하이드와 함께 배양한 후 겉보기 분자량이 약 3배 증가한 SpC3-HsCutA1-DgC의 단량체 서브유닛의 공유 가교결합이 관찰되었으며, 이는 단백질이 용액에서 삼량체이고(도 18c) 단백질 구조로부터 예측된 대로 올바르게 조립되었음을 입증하였다. 다른 리간드도 SpC3-HsCutA1-DgC에 접합하였으며, 이어서 접합되지 않은 스캐폴드 단독, 접합된 스캐폴드 + 1개의 리간드, 접합된 스캐폴드 + 2개의 리간드의 다양한 샘플에 대한 크기 배제 크로마토그래피 수행으로, 조립 복합체의 크기가 증가하고 과잉 리간드가 제거됨에 따라 유체역학적 반경의 증가를 나타내었다.
실시예 9: "시스-배향"을 생성하는 플랫폼 설계의 능력을 컴퓨터를 통해 탐색할 수 있다.
N-말단 및 C-말단 융합 부위의 적절한 배열을 갖는 코어 성분의 사전 선택에도 불구하고, 효과기 또는 리간드 단백질의 도입과 다양한 길이 및 유연성의 링커를 통한 이러한 도메인의 연결은 융합 단백질 구조에 영향을 미칠 수 있다. 발명자들은 다양한 코어 단백질에 접합된 다양한 캐처 성분의 배향을 예측하기 위해 다가 단백질 조립에 최적화된 Alphafold v2.0의 실행을 사용하였다. 여기서 PhCutA1, HsCutA1, Col X NC1, TNF 및 TL1A는 캐처 성분의 시스-배향된 디스플레이를 안정적인 삼량체로 나타내는 것으로 예측되었다(도 19). PhCutA1의 경우, 이는 PhCutA1 단독(도 11) 및 다양한 실험(도 12, 도 14)의 결정 구조를 입증한다. 비교를 위해 코어 단백질도 시험하였으며, 이는 앞서 "트랜스-배향된" 설계, 즉 IMX313(문헌[Brune et al., 2017, Bioconjugate Chemistry, 28(5), pp.1544-1551]) 및 콜라겐 XV의 NC1 도메인(문헌[Lobo et al., 2006, International Journal of Cancer, 119(2), pp.455-462])에서 활용되었다. 여기서, GSGS 링커(서열번호 35)를 특징으로 하는 SpC3-IMX-DgC는 온전한 코어 구조를 생성할 수 없었다. 이러한 디스플레이는 SpyTagged/DogTagged 단백질과의 결합 시 입체 충돌을 일으킬 수 있다. 특히 Brune 등은 IMX와 SnoopCatcher 사이에 길고 견고한 링커를 도입하여 직교 SpyCatcher 단백질을 분리시켰다. IMX와 마찬가지로, GSGS 링커(서열번호 33)를 특징으로 하는 SpC3-콜라겐 XV NC1-DgC는 온전한 코어 구조를 생성할 수 없었다. GSGS 링커(서열번호 33에서와 같이)를 더 긴 (G4S)2 링커로 교체할 때, SpC3-콜라겐 XV NC1-DgC에서 캐처가 시차를 두고 확인되는 것을 관찰하였다.
실시예 10: 조립된 플랫폼을 시험관내 스크리닝에 사용하여 리간드의 효능을 밝힐 수 있다.
우리는 세포 증식과 관련된 2개의 상이한 표적에 대한 리간드와 완전히 접합된 PhCutA1이 성장 인자 유발 세포 증식을 억제할 수 있는지 시험하였다(도 20a). NCI-N87 세포를 2개의 리간드(H6-SpC-PhCutA1-SnC:SnT-L1:L2-SpT) 또는 하나의 리간드 단독(H6-SpC-PhCutA1-SnC:SnT-L1, H6-SpC-PhCutA1-SnC:L2-SpT)을 포함하는 표시된 농도의 단백질 조립체로 처리 또는 모의 처리하였다. 스캐폴드 단독(H6-SpC-PhCutA1-SnC), 리간드 단독(SnT-L1, L2-SpT, SnT-L1 + L2-SpT) 및 L1 또는 L2의 수용체 표적에 대한 단클론 대조용 항체를 대조군으로 사용하였다. 처리 시작 1시간 후, 관련 성장 인자를 첨가하여 세포를 자극하였다. 7일 후에 MTT 분석을 사용하여 세포 생존율을 측정하였다. 생존 분획을 모의 처리된 대조군 세포로 정규화하였다. 스캐폴드 또는 리간드만을 사용한 처리는 세포 생존율에 큰 영향을 미치지 않는 반면, 단 하나의 리간드 성분만 포함하는 접합된 조립체 처리는 세포 생존을 약간 감소시킨다(두 단백질 접합체 중 10 nM에서 약 60% 세포 생존율). 완전히 조립된 조립체로 처리하면 세포 수가 크게 감소하였으며, 10 nM의 전체 조립체가 있는 경우 증식 후 생존 가능한 세포의 35%만이 존재하였다. 이는 동일한 농도(10 nM)의 단클론 대조용 항체 조합으로 처리한 후 관찰된 생존율과 매우 유사하였다. 이는 해당 구성체가 동일한 세포에서 두 표적을 모두 차단하고 있음을 의미한다. 이를 추가로 확인하기 위해서, 동일한 처리 샘플 중의 H6-SpC-PhCutA1-SnC:SnT-L1, H6-SpC-PhCutA1-SnC:L2-SpT로 이루어지는 대조군을 추후 분석을 위해 추가할 수 있다.
우리는 완전히-접합된 조립체가 Akt 및 Erk1/2의 하류 활성화를 억제하는지를 추가로 조사하였다(도 20b). NCI-N87 세포를 0.2% FCS가 포함된 배지에서 24시간 동안 굶긴 후, 스캐폴드만으로 처리하거나 SnT-L1 및 L2-SpT 단백질의 접합된 조립체로 1시간 동안 처리한 다음, 전체 세포 추출물 제조 전에 성장 인자로 1시간 동안 자극하였다. 2개의 사용된 리간드를 수용체에 결합시킨 결과 2개의 하류 신호 전달 경로가 활성화되고 주요 효과기인 Akt 및 Erk1/2가 인산화되었다. 이 두 단백질의 인산화 수준을 웨스턴 블롯팅으로 분석하였다. Erk1은 성장 인자 자극이 없는 경우에도 NCI-N87 세포에서 구성적으로 인산화된다. 그러나 완전히-접합된 조립체(H6-SpC-PhCutA1-SnC:SnT-L1:L2-SpT)는 Erk 인산화를 크게 억제한다. Akt의 성장 인자-유도된 활성화는 이 농도에서 결합되지 않은 L2에 의해 방지된다. 중요한 것은 인산화 수준이 전체 조립체가 있는 경우 더욱 감소한다는 것이다.
약물 개발을 위한 목표가 확인되면, 임상 시험을 위해서 검증된 약물에 대해 태그 및 캐처 성분을 사용하지 않고도 다중-도메인 폴리펩타이드로서 리간드를 코어 단백질에 직접 융합시킬 수 있다(도 21).
우리는 또한 또 다른 쌍의 리간드(SpT-L1, L3-DgT)에 접합된 상이한 스캐폴드인 SpC-HsCutA1-SnC가 2일 이내에 세포자멸사를 일으키는지 여부를 조사하였다. (도 20c). 0.2% FCS를 함유한 배지에서 NCI-N87 세포를 24시간 동안 굶긴 후, 기아 배지에서 48시간 동안 스캐폴드 단독, 리간드 단독 또는 SpT-L1 및 L3-DgT 단백질의 접합된 조립체로 처리하였다. 세포 생존율을 MTT 분석으로 측정하고 생존 분획을 모의 처리된 대조군 세포에 대해 정규화하였다. 스캐폴드 또는 리간드만을 사용한 처리는 세포 생존율을 감소시키지 않았다. 완전히 조립된 스캐폴드 SpC-HsCutA1-DgC:SpT-L1:L3-DgT를 사용한 처리 후에 세포 생존의 가장 높은 감소가 관찰되었다.
비공식 서열 목록에 대한 간략한 설명
서열번호 1은 파이로코커스 호리코시이(PhCutA1)로부터의 CutA1 단백질의 단량체의 아미노산 서열을 나타낸다.
서열번호 2는 콜라겐 X NC1 단백질 도메인의 단량체의 아미노산 서열을 나타낸다.
서열번호 3은 콜라겐 VIII 단백질의 단량체의 아미노산 서열을 나타낸다.
서열번호 4는 "SpyCatcher"의 아미노산 서열을 나타낸다. 이를 또한 본원에서는 "SpyCatcher 001"이라고도 한다.
서열번호 5는 "SpyTag"의 아미노산 서열을 나타낸다. 이를 또한 본원에서 "SpyTag 001"이라고도 한다.
서열번호 6은 "SpyCatcher 002"의 아미노산 서열을 나타낸다.
서열번호 7은 "SpyTag 002"의 아미노산 서열을 나타낸다.
서열번호 8은 "SpyCatcher 003"의 아미노산 서열을 나타낸다.
서열번호 9는 "SpyTag 003"의 아미노산 서열을 나타낸다.
서열번호 10은 "SpyLigase"의 아미노산 서열을 나타낸다.
서열번호 11은 "K-Tag"의 아미노산 서열을 나타낸다.
서열번호 12는 "SnoopCatcher"의 아미노산 서열을 나타낸다.
서열번호 13은 "SnoopTag"의 아미노산 서열을 나타낸다.
서열번호 14는 "SnoopLigase"의 아미노산 서열을 나타낸다.
서열번호 15는 "SnoopTagJr"의 아미노산 서열을 나타낸다.
서열번호 16은 "DogTag"의 아미노산 서열을 나타낸다.
서열번호 17은 Pilin-C의 아미노산 서열을 나타낸다.
서열번호 18은 "Isopeptag"의 아미노산 서열을 나타낸다.
서열번호 19는 인간 CutA1 단백질의 단량체의 아미노산 서열을 나타낸다.
서열번호 20은 his-태그된 구성체 H6-SpyCatcher-NC1-SnoopCatcher의 단량체의 아미노산 서열을 나타낸다.
서열번호 21은 his-태그된 구성체 H6-SpyCatcher-PhCutA1-SnoopCatcher의 단량체의 아미노산 서열을 나타낸다.
서열번호 22는 H6-SpyCatcher-αH_링커-SnoopCatcher 구성체의 아미노산 서열을 나타낸다.
서열번호 23은 "DogCatcher"의 아미노산 서열을 나타낸다.
서열번호 24는 서열번호 29에서와 같이 HsCutA1 절두된, His-태그된 구성체 H6-SpyCatcher003-HsCutA1-DogCatcher의 단량체의 아미노산 서열을 나타낸다 .
서열번호 25는 대식세포 이동 억제인자(MIF)의 단량체의 아미노산 서열을 나타낸다.
서열번호 26은 인간 대식세포 이동 억제 인자 2(MIF2)의 단량체의 아미노산 서열을 나타낸다.
서열번호 27은 MIF의 돌연변이 S62A 및 F99A(MIF2m)를 갖는 인간 대식세포 이동 억제 인자 2(MIF2)의 단량체의 아미노산 서열을 나타낸다.
서열번호 28은 MIF2의 돌연변이 S62A 및 F99A(MIF2m)를 갖는 His-태그된 구성체 H6-SpyCatcher003-MIF2m-DogCatcher의 단량체의 아미노산 서열을 나타낸다.
서열번호 29는 PDB ID: 2zfh의 분해된 구조에 기반한 절두된 인간 CutA1의 단량체의 아미노산 서열을 나타내며, 이는 서열번호 19와 서열번호 60 사이의 중간 절두를 나타낸다.
서열번호 30은 mCitrine 형광 단백질 DgT-X3의 변이체(문헌[Grunberg et al, 2013]에 처음 기재됨)에 대한 DogTag의 His-태그된 융합의 아미노산 서열을 나타낸다.
서열번호 31은 TNF-유사 단백질 TL1A의 단량체의 아미노산 서열을 나타낸다.
서열번호 32는 구조 예측에 사용된 구성체 SpyCatcher003-TL1A-DogCatcher의 단량체의 아미노산 서열을 나타낸다.
서열번호 33은 구조 예측에 사용된 구성체 SpyCatcher003-Col XV NC1-DogCatcher의 단량체의 아미노산 서열을 나타낸다.
서열번호 34는 MIF2의 돌연변이 S62A 및 F99A를 이용한 구조 예측에 사용된 구성체 SpyCatcher003-MIF2m-DogCatcher의 단량체의 아미노산 서열을 나타낸다.
서열번호 35는 구조 예측에 사용된 구성체 SpyCatcher003-IMX-DogCatcher의 단량체의 아미노산 서열을 나타낸다.
서열번호 36은 이종삼량체 C1q 헤드 도메인의 쇄 A의 아미노산 서열을 나타낸다.
서열번호 37은 이종삼량체 C1q 헤드 도메인의 쇄 B의 아미노산 서열을 나타낸다.
서열번호 38은 이종삼량체 C1q 헤드 도메인의 쇄 C의 아미노산 서열을 나타낸다.
서열번호 39는 써무스 써모필루스 HB8 로부터의 CutA1의 단량체의 아미노산 서열을 나타낸다.
서열번호 40은 오리자 사티바로부터의 CutA1의 단량체의 아미노산 서열을 나타낸다.
서열번호 41은 쉐와넬라 스페시즈 SIB1으로부터의 CutA1의 단량체의 아미노산 서열을 나타낸다.
서열번호 42는 종양괴사인자(TNF)의 단량체의 아미노산 서열을 나타낸다.
서열번호 43은 역평행 이중나선 육량체의 단량체의 아미노산 서열을 나타낸다 .
서열번호 44는 HIV-1 GP41 코어의 단량체의 아미노산 서열을 나타낸다.
서열번호 45는 시토크롬 c555의 원형 순열체의 단량체의 아미노산 서열을 나타낸다.
서열번호 46은 MHC 부류 II-연관 불변 쇄의 단량체의 아미노산 서열을 나타낸다.
서열번호 47은 p53의 단량체의 아미노산 서열을 나타낸다.
서열번호 48은 피브리노겐-유사 도메인의 단량체의 아미노산 서열을 나타낸다.
서열번호 49는 콜라겐 IV NC1 도메인의 단량체의 아미노산 서열을 나타낸다.
서열번호 50은 바실러스 서브틸리스 ArbB 의 단량체의 아미노산 서열을 나타낸다.
서열번호 51은 파지 람다 헤드 단백질 D의 단량체의 아미노산 서열을 나타낸다.
서열번호 52는 HCRBPII의 도메인-교환 삼량체 변이체의 단량체의 아미노산 서열을 나타낸다.
서열번호 53은 T1L 레오바이러스 부착 단백질 시그나1의 단량체의 아미노산 서열을 나타낸다.
서열번호 54는 구조 예측에 사용된 구성체 SpyCatcher003-HsCutA1-DogCatcher의 단량체의 아미노산 서열을 나타낸다.
서열번호 55는 구조 예측에 사용된 구성체 SpyCatcher003-PhCutA1-DogCatcher의 단량체의 아미노산 서열을 나타낸다.
서열번호 56은 구조 예측에 사용된 구성체 SpyCatcher003-Col X NC1-DogCatcher의 단량체의 아미노산 서열을 나타낸다.
서열번호 57은 구조 예측에 사용된 구성체 SpyCatcher003-TNF-DogCatcher의 단량체의 아미노산 서열을 나타낸다.
서열번호 58은 TNF 패밀리 단백질 CD40 리간드(CD40L)의 단량체의 아미노산 서열을 나타낸다.
서열번호 59는 인간 류코트리엔 C4 신타제의 단량체의 아미노산 서열을 나타낸다.
서열번호 60은 PDB ID: 2zfh에서 분석된 인간 CutA1의 단량체의 아미노산 서열을 나타내며, 이는 서열번호 19의 절두를 나타낸다.
SEQUENCE LISTING <110> LiliumX Ltd. <120> MULTIVALENT PROTEINS AND SCREENING METHODS <130> P50193WO <140> PCT/GB2022/050750 <141> 2022-03-24 <150> GB 2104104.1 <151> 2021-03-24 <160> 78 <170> PatentIn version 3.5 <210> 1 <211> 102 <212> PRT <213> Pyrococcus horikoshii <400> 1 Met Ile Ile Val Tyr Thr Thr Phe Pro Asp Trp Glu Ser Ala Glu Lys 1 5 10 15 Val Val Lys Thr Leu Leu Lys Glu Arg Leu Ile Ala Cys Ala Asn Leu 20 25 30 Arg Glu His Arg Ala Phe Tyr Trp Trp Glu Gly Lys Ile Glu Glu Asp 35 40 45 Lys Glu Val Gly Ala Ile Leu Lys Thr Arg Glu Asp Leu Trp Glu Glu 50 55 60 Leu Lys Glu Arg Ile Lys Glu Leu His Pro Tyr Asp Val Pro Ala Ile 65 70 75 80 Ile Arg Ile Asp Val Asp Asp Val Asn Glu Asp Tyr Leu Lys Trp Leu 85 90 95 Ile Glu Glu Thr Lys Lys 100 <210> 2 <211> 134 <212> PRT <213> Homo sapiens <400> 2 Thr Gly Met Pro Val Ser Ala Phe Thr Val Ile Leu Ser Lys Ala Tyr 1 5 10 15 Pro Ala Ile Gly Thr Pro Ile Pro Phe Asp Lys Ile Leu Tyr Asn Arg 20 25 30 Gln Gln His Tyr Asp Pro Arg Thr Gly Ile Phe Thr Cys Gln Ile Pro 35 40 45 Gly Ile Tyr Tyr Phe Ser Tyr His Val His Val Lys Gly Thr His Val 50 55 60 Trp Val Gly Leu Tyr Lys Asn Gly Thr Pro Val Met Tyr Thr Tyr Asp 65 70 75 80 Glu Tyr Thr Lys Gly Tyr Leu Asp Gln Ala Ser Gly Ser Ala Ile Ile 85 90 95 Asp Leu Thr Glu Asn Asp Gln Val Trp Leu Gln Leu Pro Asn Ala Glu 100 105 110 Ser Asn Gly Leu Tyr Ser Ser Glu Tyr Val His Ser Ser Phe Ser Gly 115 120 125 Phe Leu Val Ala Pro Met 130 <210> 3 <211> 131 <212> PRT <213> Mus musculus <400> 3 Glu Met Pro Ala Phe Thr Ala Glu Leu Thr Val Pro Phe Pro Pro Val 1 5 10 15 Gly Ala Pro Val Lys Phe Asp Lys Leu Leu Tyr Asn Gly Arg Gln Asn 20 25 30 Tyr Asn Pro Gln Thr Gly Ile Phe Thr Cys Glu Val Pro Gly Val Tyr 35 40 45 Tyr Phe Ala Tyr His Val His Cys Lys Gly Gly Asn Val Trp Val Ala 50 55 60 Leu Phe Lys Asn Asn Glu Pro Met Met Tyr Thr Tyr Asp Glu Tyr Lys 65 70 75 80 Lys Gly Phe Leu Asp Gln Ala Ser Gly Ser Ala Val Leu Leu Leu Arg 85 90 95 Pro Gly Asp Gln Val Phe Leu Gln Met Pro Ser Glu Gln Ala Ala Gly 100 105 110 Leu Tyr Ala Gly Gln Tyr Val His Ser Ser Phe Ser Gly Tyr Leu Leu 115 120 125 Tyr Pro Met 130 <210> 4 <211> 113 <212> PRT <213> Streptococcus pyogenes <400> 4 Val Asp Thr Leu Ser Gly Leu Ser Ser Glu Gln Gly Gln Ser Gly Asp 1 5 10 15 Met Thr Ile Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg 20 25 30 Asp Glu Asp Gly Lys Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp 35 40 45 Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly Gln Val Lys 50 55 60 Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala 65 70 75 80 Pro Asp Gly Tyr Glu Val Ala Thr Ala Ile Thr Phe Thr Val Asn Glu 85 90 95 Gln Gly Gln Val Thr Val Asn Gly Lys Ala Thr Lys Gly Asp Ala His 100 105 110 Ile <210> 5 <211> 13 <212> PRT <213> Streptococcus pyogenes <400> 5 Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys 1 5 10 <210> 6 <211> 113 <212> PRT <213> Streptococcus pyogenes <400> 6 Val Thr Thr Leu Ser Gly Leu Ser Gly Glu Gln Gly Pro Ser Gly Asp 1 5 10 15 Met Thr Thr Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg 20 25 30 Asp Glu Asp Gly Arg Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp 35 40 45 Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly His Val Lys 50 55 60 Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala 65 70 75 80 Pro Asp Gly Tyr Glu Val Ala Thr Ala Ile Thr Phe Thr Val Asn Glu 85 90 95 Gln Gly Gln Val Thr Val Asn Gly Glu Ala Thr Lys Gly Asp Ala His 100 105 110 Thr <210> 7 <211> 14 <212> PRT <213> Streptococcus pyogenes <400> 7 Val Pro Thr Ile Val Met Val Asp Ala Tyr Lys Arg Tyr Lys 1 5 10 <210> 8 <211> 113 <212> PRT <213> Streptococcus pyogenes <400> 8 Val Thr Thr Leu Ser Gly Leu Ser Gly Glu Gln Gly Pro Ser Gly Asp 1 5 10 15 Met Thr Thr Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg 20 25 30 Asp Glu Asp Gly Arg Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp 35 40 45 Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly His Val Lys 50 55 60 Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala 65 70 75 80 Pro Asp Gly Tyr Glu Val Ala Thr Pro Ile Glu Phe Thr Val Asn Glu 85 90 95 Asp Gly Gln Val Thr Val Asp Gly Glu Ala Thr Glu Gly Asp Ala His 100 105 110 Thr <210> 9 <211> 16 <212> PRT <213> Streptococcus pyogenes <400> 9 Arg Gly Val Pro His Ile Val Met Val Asp Ala Tyr Lys Arg Tyr Lys 1 5 10 15 <210> 10 <211> 95 <212> PRT <213> Streptococcus pyogenes <400> 10 Gly Gln Ser Gly Asp Gly Lys Glu Leu Ala Gly Ala Thr Met Glu Leu 1 5 10 15 Arg Asp Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly Gln 20 25 30 Val Lys Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr 35 40 45 Ala Ala Pro Asp Gly Tyr Glu Val Ala Thr Ala Ile Thr Phe Thr Val 50 55 60 Asn Glu Gln Gly Gln Val Thr Val Asn Gly Lys Ala Thr Lys Gly Gly 65 70 75 80 Ser Gly Gly Ser Gly Gly Ser Gly Glu Asp Ser Ala Thr His Ile 85 90 95 <210> 11 <211> 10 <212> PRT <213> Streptococcus pyogenes <400> 11 Ala Thr His Ile Lys Phe Ser Lys Arg Asp 1 5 10 <210> 12 <211> 112 <212> PRT <213> Streptococcus pneumoniae <400> 12 Lys Pro Leu Arg Gly Ala Val Phe Ser Leu Gln Lys Gln His Pro Asp 1 5 10 15 Tyr Pro Asp Ile Tyr Gly Ala Ile Asp Gln Asn Gly Thr Tyr Gln Asn 20 25 30 Val Arg Thr Gly Glu Asp Gly Lys Leu Thr Phe Lys Asn Leu Ser Asp 35 40 45 Gly Lys Tyr Arg Leu Phe Glu Asn Ser Glu Pro Ala Gly Tyr Lys Pro 50 55 60 Val Gln Asn Lys Pro Ile Val Ala Phe Gln Ile Val Asn Gly Glu Val 65 70 75 80 Arg Asp Val Thr Ser Ile Val Pro Gln Asp Ile Pro Ala Thr Tyr Glu 85 90 95 Phe Thr Asn Gly Lys His Tyr Ile Thr Asn Glu Pro Ile Pro Pro Lys 100 105 110 <210> 13 <211> 12 <212> PRT <213> Streptococcus pneumoniae <400> 13 Lys Leu Gly Asp Ile Glu Phe Ile Lys Val Asn Lys 1 5 10 <210> 14 <211> 104 <212> PRT <213> Streptococcus pneumoniae <400> 14 Val Asn Lys Asn Asp Lys Lys Pro Leu Arg Gly Ala Val Phe Ser Leu 1 5 10 15 Gln Lys Gln His Pro Asp Tyr Pro Asp Ile Tyr Gly Ala Ile Asp Gln 20 25 30 Asn Gly Thr Tyr Gln Asn Val Arg Thr Gly Glu Asp Gly Lys Leu Thr 35 40 45 Phe Lys Asn Leu Ser Asp Gly Lys Tyr Arg Leu Phe Glu Asn Ser Glu 50 55 60 Pro Pro Gly Tyr Lys Pro Val Gln Asn Lys Pro Ile Val Ala Phe Gln 65 70 75 80 Ile Val Asn Gly Glu Val Arg Asp Val Thr Ser Ile Val Pro Pro Gly 85 90 95 Val Pro Ala Thr Tyr Glu Phe Thr 100 <210> 15 <211> 12 <212> PRT <213> Streptococcus pneumoniae <400> 15 Lys Leu Gly Ser Ile Glu Phe Ile Lys Val Asn Lys 1 5 10 <210> 16 <211> 23 <212> PRT <213> Streptococcus pneumoniae <400> 16 Asp Ile Pro Ala Thr Tyr Glu Phe Thr Asp Gly Lys His Tyr Ile Thr 1 5 10 15 Asn Glu Pro Ile Pro Pro Lys 20 <210> 17 <211> 282 <212> PRT <213> Streptococcus pyogenes <400> 17 Ala Thr Thr Val His Gly Glu Thr Val Val Asn Gly Ala Lys Leu Thr 1 5 10 15 Val Thr Lys Asn Leu Asp Leu Val Asn Ser Asn Ala Leu Ile Pro Asn 20 25 30 Thr Asp Phe Thr Phe Lys Ile Glu Pro Asp Thr Thr Val Asn Glu Asp 35 40 45 Gly Asn Lys Phe Lys Gly Val Ala Leu Asn Thr Pro Met Thr Lys Val 50 55 60 Thr Tyr Thr Asn Ser Asp Lys Gly Gly Ser Asn Thr Lys Thr Ala Glu 65 70 75 80 Phe Asp Phe Ser Glu Val Thr Phe Glu Lys Pro Gly Val Tyr Tyr Tyr 85 90 95 Lys Val Thr Glu Glu Lys Ile Asp Lys Val Pro Gly Val Ser Tyr Asp 100 105 110 Thr Thr Ser Tyr Thr Val Gln Val His Val Leu Trp Asn Glu Glu Gln 115 120 125 Gln Lys Pro Val Ala Thr Tyr Ile Val Gly Tyr Lys Glu Gly Ser Lys 130 135 140 Val Pro Ile Gln Phe Lys Asn Ser Leu Asp Ser Thr Thr Leu Thr Val 145 150 155 160 Lys Lys Lys Val Ser Gly Thr Gly Gly Asp Arg Ser Lys Asp Phe Asn 165 170 175 Phe Gly Leu Thr Leu Lys Ala Asn Gln Tyr Tyr Lys Ala Ser Glu Lys 180 185 190 Val Met Ile Glu Lys Thr Thr Lys Gly Gly Gln Ala Pro Val Gln Thr 195 200 205 Glu Ala Ser Ile Asp Gln Leu Tyr His Phe Thr Leu Lys Asp Gly Glu 210 215 220 Ser Ile Lys Val Thr Asn Leu Pro Val Gly Val Asp Tyr Val Val Thr 225 230 235 240 Glu Asp Asp Tyr Lys Ser Glu Lys Tyr Thr Thr Asn Val Glu Val Ser 245 250 255 Pro Gln Asp Gly Ala Val Lys Asn Ile Ala Gly Asn Ser Thr Glu Gln 260 265 270 Glu Thr Ser Thr Asp Lys Asp Met Thr Ile 275 280 <210> 18 <211> 16 <212> PRT <213> Streptococcus pyogenes <400> 18 Thr Asp Lys Asp Met Thr Ile Thr Phe Thr Asn Lys Lys Asp Ala Glu 1 5 10 15 <210> 19 <211> 179 <212> PRT <213> Homo sapiens <400> 19 Met Ser Gly Gly Arg Ala Pro Ala Val Leu Leu Gly Gly Val Ala Ser 1 5 10 15 Leu Leu Leu Ser Phe Val Trp Met Pro Ala Leu Leu Pro Val Ala Ser 20 25 30 Arg Leu Leu Leu Leu Pro Arg Val Leu Leu Thr Met Ala Ser Gly Ser 35 40 45 Pro Pro Thr Gln Pro Ser Pro Ala Ser Asp Ser Gly Ser Gly Tyr Val 50 55 60 Pro Gly Ser Val Ser Ala Ala Phe Val Thr Cys Pro Asn Glu Lys Val 65 70 75 80 Ala Lys Glu Ile Ala Arg Ala Val Val Glu Lys Arg Leu Ala Ala Cys 85 90 95 Val Asn Leu Ile Pro Gln Ile Thr Ser Ile Tyr Glu Trp Lys Gly Lys 100 105 110 Ile Glu Glu Asp Ser Glu Val Leu Met Met Ile Lys Thr Gln Ser Ser 115 120 125 Leu Val Pro Ala Leu Thr Asp Phe Val Arg Ser Val His Pro Tyr Glu 130 135 140 Val Ala Glu Val Ile Ala Leu Pro Val Glu Gln Gly Asn Phe Pro Tyr 145 150 155 160 Leu Gln Trp Val Arg Gln Val Thr Glu Ser Val Ser Asp Ser Ile Thr 165 170 175 Val Leu Pro <210> 20 <211> 380 <212> PRT <213> Artificial Sequence <220> <223> monomer of the his-tagged construct H6-SpyCatcher-NC1-SnoopCatcher <400> 20 Met Gly Ser Ser His His His His His His Ser Ser Gly Val Asp Thr 1 5 10 15 Leu Ser Gly Leu Ser Ser Glu Gln Gly Gln Ser Gly Asp Met Thr Ile 20 25 30 Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg Asp Glu Asp 35 40 45 Gly Lys Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp Ser Ser Gly 50 55 60 Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly Gln Val Lys Asp Phe Tyr 65 70 75 80 Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala Pro Asp Gly 85 90 95 Tyr Glu Val Ala Thr Ala Ile Thr Phe Thr Val Asn Glu Gln Gly Gln 100 105 110 Val Thr Val Asn Gly Lys Ala Thr Lys Gly Asp Ala His Ile Gly Ser 115 120 125 Gly Ser Thr Gly Met Pro Val Ser Ala Phe Thr Val Ile Leu Ser Lys 130 135 140 Ala Tyr Pro Ala Ile Gly Thr Pro Ile Pro Phe Asp Lys Ile Leu Tyr 145 150 155 160 Asn Arg Gln Gln His Tyr Asp Pro Arg Thr Gly Ile Phe Thr Cys Gln 165 170 175 Ile Pro Gly Ile Tyr Tyr Phe Ser Tyr His Val His Val Lys Gly Thr 180 185 190 His Val Trp Val Gly Leu Tyr Lys Asn Gly Thr Pro Val Met Tyr Thr 195 200 205 Tyr Asp Glu Tyr Thr Lys Gly Tyr Leu Asp Gln Ala Ser Gly Ser Ala 210 215 220 Ile Ile Asp Leu Thr Glu Asn Asp Gln Val Trp Leu Gln Leu Pro Asn 225 230 235 240 Ala Glu Ser Asn Gly Leu Tyr Ser Ser Glu Tyr Val His Ser Ser Phe 245 250 255 Ser Gly Phe Leu Val Ala Pro Met Gly Ser Gly Ser Lys Pro Leu Arg 260 265 270 Gly Ala Val Phe Ser Leu Gln Lys Gln His Pro Asp Tyr Pro Asp Ile 275 280 285 Tyr Gly Ala Ile Asp Gln Asn Gly Thr Tyr Gln Asn Val Arg Thr Gly 290 295 300 Glu Asp Gly Lys Leu Thr Phe Lys Asn Leu Ser Asp Gly Lys Tyr Arg 305 310 315 320 Leu Phe Glu Asn Ser Glu Pro Ala Gly Tyr Lys Pro Val Gln Asn Lys 325 330 335 Pro Ile Val Ala Phe Gln Ile Val Asn Gly Glu Val Arg Asp Val Thr 340 345 350 Ser Ile Val Pro Gln Asp Ile Pro Ala Thr Tyr Glu Phe Thr Asn Gly 355 360 365 Lys His Tyr Ile Thr Asn Glu Pro Ile Pro Pro Lys 370 375 380 <210> 21 <211> 348 <212> PRT <213> Artificial Sequence <220> <223> monomer of the his-tagged construct H6-SpyCatcher-PhCutA1-SnoopCatcher <400> 21 Met Gly Ser Ser His His His His His His Ser Ser Gly Val Asp Thr 1 5 10 15 Leu Ser Gly Leu Ser Ser Glu Gln Gly Gln Ser Gly Asp Met Thr Ile 20 25 30 Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg Asp Glu Asp 35 40 45 Gly Lys Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp Ser Ser Gly 50 55 60 Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly Gln Val Lys Asp Phe Tyr 65 70 75 80 Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala Pro Asp Gly 85 90 95 Tyr Glu Val Ala Thr Ala Ile Thr Phe Thr Val Asn Glu Gln Gly Gln 100 105 110 Val Thr Val Asn Gly Lys Ala Thr Lys Gly Asp Ala His Ile Gly Ser 115 120 125 Gly Ser Met Ile Ile Val Tyr Thr Thr Phe Pro Asp Trp Glu Ser Ala 130 135 140 Glu Lys Val Val Lys Thr Leu Leu Lys Glu Arg Leu Ile Ala Cys Ala 145 150 155 160 Asn Leu Arg Glu His Arg Ala Phe Tyr Trp Trp Glu Gly Lys Ile Glu 165 170 175 Glu Asp Lys Glu Val Gly Ala Ile Leu Lys Thr Arg Glu Asp Leu Trp 180 185 190 Glu Glu Leu Lys Glu Arg Ile Lys Glu Leu His Pro Tyr Asp Val Pro 195 200 205 Ala Ile Ile Arg Ile Asp Val Asp Asp Val Asn Glu Asp Tyr Leu Lys 210 215 220 Trp Leu Ile Glu Glu Thr Lys Lys Gly Ser Gly Ser Lys Pro Leu Arg 225 230 235 240 Gly Ala Val Phe Ser Leu Gln Lys Gln His Pro Asp Tyr Pro Asp Ile 245 250 255 Tyr Gly Ala Ile Asp Gln Asn Gly Thr Tyr Gln Asn Val Arg Thr Gly 260 265 270 Glu Asp Gly Lys Leu Thr Phe Lys Asn Leu Ser Asp Gly Lys Tyr Arg 275 280 285 Leu Phe Glu Asn Ser Glu Pro Ala Gly Tyr Lys Pro Val Gln Asn Lys 290 295 300 Pro Ile Val Ala Phe Gln Ile Val Asn Gly Glu Val Arg Asp Val Thr 305 310 315 320 Ser Ile Val Pro Gln Asp Ile Pro Ala Thr Tyr Glu Phe Thr Asn Gly 325 330 335 Lys His Tyr Ile Thr Asn Glu Pro Ile Pro Pro Lys 340 345 <210> 22 <211> 280 <212> PRT <213> Artificial Sequence <220> <223> H6-SpyCatcher-aH_Linker-SnoopCatcher construct <400> 22 Met Gly Ser Ser His His His His His His Ser Ser Gly Val Asp Thr 1 5 10 15 Leu Ser Gly Leu Ser Ser Glu Gln Gly Gln Ser Gly Asp Met Thr Ile 20 25 30 Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg Asp Glu Asp 35 40 45 Gly Lys Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp Ser Ser Gly 50 55 60 Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly Gln Val Lys Asp Phe Tyr 65 70 75 80 Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala Pro Asp Gly 85 90 95 Tyr Glu Val Ala Thr Ala Ile Thr Phe Thr Val Asn Glu Gln Gly Gln 100 105 110 Val Thr Val Asn Gly Lys Ala Thr Lys Gly Asp Ala His Ile Gly Ser 115 120 125 Gly Ser Pro Ala Asn Leu Lys Ala Leu Glu Ala Gln Lys Gln Lys Glu 130 135 140 Gln Arg Gln Ala Ala Glu Glu Leu Ala Asn Ala Lys Lys Leu Lys Glu 145 150 155 160 Gln Leu Glu Lys Gly Ser Gly Ser Lys Pro Leu Arg Gly Ala Val Phe 165 170 175 Ser Leu Gln Lys Gln His Pro Asp Tyr Pro Asp Ile Tyr Gly Ala Ile 180 185 190 Asp Gln Asn Gly Thr Tyr Gln Asn Val Arg Thr Gly Glu Asp Gly Lys 195 200 205 Leu Thr Phe Lys Asn Leu Ser Asp Gly Lys Tyr Arg Leu Phe Glu Asn 210 215 220 Ser Glu Pro Ala Gly Tyr Lys Pro Val Gln Asn Lys Pro Ile Val Ala 225 230 235 240 Phe Gln Ile Val Asn Gly Glu Val Arg Asp Val Thr Ser Ile Val Pro 245 250 255 Gln Asp Ile Pro Ala Thr Tyr Glu Phe Thr Asn Gly Lys His Tyr Ile 260 265 270 Thr Asn Glu Pro Ile Pro Pro Lys 275 280 <210> 23 <211> 104 <212> PRT <213> Streptococcus pneumoniae <400> 23 Lys Leu Gly Glu Ile Glu Phe Ile Lys Val Asp Lys Thr Asp Lys Lys 1 5 10 15 Pro Leu Arg Gly Ala Val Phe Ser Leu Gln Lys Gln His Pro Asp Tyr 20 25 30 Pro Asp Ile Tyr Gly Ala Ile Asp Gln Asn Gly Thr Tyr Gln Asp Val 35 40 45 Arg Thr Gly Glu Asp Gly Lys Leu Thr Phe Thr Asn Leu Ser Asp Gly 50 55 60 Lys Tyr Arg Leu Ile Glu Asn Ser Glu Pro Pro Gly Tyr Lys Pro Val 65 70 75 80 Gln Asn Lys Pro Ile Val Ser Phe Arg Ile Val Asp Gly Glu Val Arg 85 90 95 Asp Val Thr Ser Ile Val Pro Gln 100 <210> 24 <211> 376 <212> PRT <213> Artificial Sequence <220> <223> monomer of the His-tagged construct H6-SpyCatcher003-HsCutA1-DogCatcher, with HsCutA1 truncated as in SEQ ID NO: 29 <400> 24 Met Gly Ser Ser His His His His His His Ser Ser Gly Val Thr Thr 1 5 10 15 Leu Ser Gly Leu Ser Gly Glu Gln Gly Pro Ser Gly Asp Met Thr Thr 20 25 30 Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg Asp Glu Asp 35 40 45 Gly Arg Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp Ser Ser Gly 50 55 60 Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly His Val Lys Asp Phe Tyr 65 70 75 80 Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala Pro Asp Gly 85 90 95 Tyr Glu Val Ala Thr Pro Ile Glu Phe Thr Val Asn Glu Asp Gly Gln 100 105 110 Val Thr Val Asp Gly Glu Ala Thr Glu Gly Asp Ala His Thr Gly Gly 115 120 125 Gly Gly Ser Met Ala Ser Gly Ser Pro Pro Thr Gln Pro Ser Pro Ala 130 135 140 Ser Asp Ser Gly Ser Gly Tyr Val Pro Gly Ser Val Ser Ala Ala Phe 145 150 155 160 Val Thr Cys Pro Asn Glu Lys Val Ala Lys Glu Ile Ala Arg Ala Val 165 170 175 Val Glu Lys Arg Leu Ala Ala Cys Val Asn Leu Ile Pro Gln Ile Thr 180 185 190 Ser Ile Tyr Glu Trp Lys Gly Lys Ile Glu Glu Asp Ser Glu Val Leu 195 200 205 Met Met Ile Lys Thr Gln Ser Ser Leu Val Pro Ala Leu Thr Asp Phe 210 215 220 Val Arg Ser Val His Pro Tyr Glu Val Ala Glu Val Ile Ala Leu Pro 225 230 235 240 Val Glu Gln Gly Asn Phe Pro Tyr Leu Gln Trp Val Arg Gln Val Thr 245 250 255 Glu Ser Val Ser Asp Ser Ile Thr Val Leu Pro Gly Gly Gly Gly Ser 260 265 270 Lys Leu Gly Glu Ile Glu Phe Ile Lys Val Asp Lys Thr Asp Lys Lys 275 280 285 Pro Leu Arg Gly Ala Val Phe Ser Leu Gln Lys Gln His Pro Asp Tyr 290 295 300 Pro Asp Ile Tyr Gly Ala Ile Asp Gln Asn Gly Thr Tyr Gln Asp Val 305 310 315 320 Arg Thr Gly Glu Asp Gly Lys Leu Thr Phe Thr Asn Leu Ser Asp Gly 325 330 335 Lys Tyr Arg Leu Ile Glu Asn Ser Glu Pro Pro Gly Tyr Lys Pro Val 340 345 350 Gln Asn Lys Pro Ile Val Ser Phe Arg Ile Val Asp Gly Glu Val Arg 355 360 365 Asp Val Thr Ser Ile Val Pro Gln 370 375 <210> 25 <211> 114 <212> PRT <213> Homo sapiens <400> 25 Pro Met Phe Ile Val Asn Thr Asn Val Pro Arg Ala Ser Val Pro Asp 1 5 10 15 Gly Phe Leu Ser Glu Leu Thr Gln Gln Leu Ala Gln Ala Thr Gly Lys 20 25 30 Pro Pro Gln Tyr Ile Ala Val His Val Val Pro Asp Gln Leu Met Ala 35 40 45 Phe Gly Gly Ser Ser Glu Pro Cys Ala Leu Cys Ser Leu His Ser Ile 50 55 60 Gly Lys Ile Gly Gly Ala Gln Asn Arg Ser Tyr Ser Lys Leu Leu Cys 65 70 75 80 Gly Leu Leu Ala Glu Arg Leu Arg Ile Ser Pro Asp Arg Val Tyr Ile 85 90 95 Asn Tyr Tyr Asp Met Asn Ala Ala Asn Val Gly Trp Asn Asn Ser Thr 100 105 110 Phe Ala <210> 26 <211> 117 <212> PRT <213> Homo sapiens <400> 26 Pro Phe Leu Glu Leu Asp Thr Asn Leu Pro Ala Asn Arg Val Pro Ala 1 5 10 15 Gly Leu Glu Lys Arg Leu Cys Ala Ala Ala Ala Ser Ile Leu Gly Lys 20 25 30 Pro Ala Asp Arg Val Asn Val Thr Val Arg Pro Gly Leu Ala Met Ala 35 40 45 Leu Ser Gly Ser Thr Glu Pro Cys Ala Gln Leu Ser Ile Ser Ser Ile 50 55 60 Gly Val Val Gly Thr Ala Glu Asp Asn Arg Ser His Ser Ala His Phe 65 70 75 80 Phe Glu Phe Leu Thr Lys Glu Leu Ala Leu Gly Gln Asp Arg Ile Leu 85 90 95 Ile Arg Phe Phe Pro Leu Glu Ser Trp Gln Ile Gly Lys Ile Gly Thr 100 105 110 Val Met Thr Phe Leu 115 <210> 27 <211> 117 <212> PRT <213> Homo sapiens <400> 27 Pro Phe Leu Glu Leu Asp Thr Asn Leu Pro Ala Asn Arg Val Pro Ala 1 5 10 15 Gly Leu Glu Lys Arg Leu Cys Ala Ala Ala Ala Ser Ile Leu Gly Lys 20 25 30 Pro Ala Asp Arg Val Asn Val Thr Val Arg Pro Gly Leu Ala Met Ala 35 40 45 Leu Ser Gly Ser Thr Glu Pro Cys Ala Gln Leu Ser Ile Ala Ser Ile 50 55 60 Gly Val Val Gly Thr Ala Glu Asp Asn Arg Ser His Ser Ala His Phe 65 70 75 80 Phe Glu Phe Leu Thr Lys Glu Leu Ala Leu Gly Gln Asp Arg Ile Leu 85 90 95 Ile Arg Phe Ala Pro Leu Glu Ser Trp Gln Ile Gly Lys Ile Gly Thr 100 105 110 Val Met Thr Phe Leu 115 <210> 28 <211> 377 <212> PRT <213> Artificial Sequence <220> <223> monomer of the His-tagged construct H6-SpyCatcher003-MIF2m-DogCatcher with mutations S62A and F99A of MIF2 (MIF2m) <400> 28 Met Gly Ser Ser His His His His His His Ser Ser Gly Val Thr Thr 1 5 10 15 Leu Ser Gly Leu Ser Gly Glu Gln Gly Pro Ser Gly Asp Met Thr Thr 20 25 30 Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg Asp Glu Asp 35 40 45 Gly Arg Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp Ser Ser Gly 50 55 60 Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly His Val Lys Asp Phe Tyr 65 70 75 80 Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala Pro Asp Gly 85 90 95 Tyr Glu Val Ala Thr Pro Ile Glu Phe Thr Val Asn Glu Asp Gly Gln 100 105 110 Val Thr Val Asp Gly Glu Ala Thr Glu Gly Asp Ala His Thr Gly Gly 115 120 125 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Pro Phe Leu 130 135 140 Glu Leu Asp Thr Asn Leu Pro Ala Asn Arg Val Pro Ala Gly Leu Glu 145 150 155 160 Lys Arg Leu Cys Ala Ala Ala Ala Ser Ile Leu Gly Lys Pro Ala Asp 165 170 175 Arg Val Asn Val Thr Val Arg Pro Gly Leu Ala Met Ala Leu Ser Gly 180 185 190 Ser Thr Glu Pro Cys Ala Gln Leu Ser Ile Ala Ser Ile Gly Val Val 195 200 205 Gly Thr Ala Glu Asp Asn Arg Ser His Ser Ala His Phe Phe Glu Phe 210 215 220 Leu Thr Lys Glu Leu Ala Leu Gly Gln Asp Arg Ile Leu Ile Arg Phe 225 230 235 240 Ala Pro Leu Glu Ser Trp Gln Ile Gly Lys Ile Gly Thr Val Met Thr 245 250 255 Phe Leu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 260 265 270 Ser Lys Leu Gly Glu Ile Glu Phe Ile Lys Val Asp Lys Thr Asp Lys 275 280 285 Lys Pro Leu Arg Gly Ala Val Phe Ser Leu Gln Lys Gln His Pro Asp 290 295 300 Tyr Pro Asp Ile Tyr Gly Ala Ile Asp Gln Asn Gly Thr Tyr Gln Asp 305 310 315 320 Val Arg Thr Gly Glu Asp Gly Lys Leu Thr Phe Thr Asn Leu Ser Asp 325 330 335 Gly Lys Tyr Arg Leu Ile Glu Asn Ser Glu Pro Pro Gly Tyr Lys Pro 340 345 350 Val Gln Asn Lys Pro Ile Val Ser Phe Arg Ile Val Asp Gly Glu Val 355 360 365 Arg Asp Val Thr Ser Ile Val Pro Gln 370 375 <210> 29 <211> 136 <212> PRT <213> Homo sapiens <400> 29 Met Ala Ser Gly Ser Pro Pro Thr Gln Pro Ser Pro Ala Ser Asp Ser 1 5 10 15 Gly Ser Gly Tyr Val Pro Gly Ser Val Ser Ala Ala Phe Val Thr Cys 20 25 30 Pro Asn Glu Lys Val Ala Lys Glu Ile Ala Arg Ala Val Val Glu Lys 35 40 45 Arg Leu Ala Ala Cys Val Asn Leu Ile Pro Gln Ile Thr Ser Ile Tyr 50 55 60 Glu Trp Lys Gly Lys Ile Glu Glu Asp Ser Glu Val Leu Met Met Ile 65 70 75 80 Lys Thr Gln Ser Ser Leu Val Pro Ala Leu Thr Asp Phe Val Arg Ser 85 90 95 Val His Pro Tyr Glu Val Ala Glu Val Ile Ala Leu Pro Val Glu Gln 100 105 110 Gly Asn Phe Pro Tyr Leu Gln Trp Val Arg Gln Val Thr Glu Ser Val 115 120 125 Ser Asp Ser Ile Thr Val Leu Pro 130 135 <210> 30 <211> 295 <212> PRT <213> Artificial Sequence <220> <223> His-tagged fusion of DogTag to a variant (first described in Gr nberg et al, 2013) of mCitrine fluorescent protein DgT-X3 <400> 30 Met Ser His His His His His His Gly Ser Thr Gly Leu Glu Val Leu 1 5 10 15 Phe Gln Gly Pro Thr Gly Ser Ser Asp Ile Pro Ala Thr Tyr Glu Phe 20 25 30 Thr Asp Gly Lys His Tyr Ile Thr Asn Glu Pro Ile Pro Pro Lys Gly 35 40 45 Gly Gly Gly Ser Gly Gly Gly Gly Ser Val Ser Lys Gly Glu Glu Leu 50 55 60 Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn 65 70 75 80 Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr 85 90 95 Gly Lys Leu Glu Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu Pro Val 100 105 110 Pro Trp Pro Thr Leu Val Thr Thr Phe Gly Tyr Gly Leu Met Cys Phe 115 120 125 Ala Arg Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys Ser Ala 130 135 140 Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe Phe Lys Asp Asp 145 150 155 160 Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu 165 170 175 Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn 180 185 190 Ile Leu Gly His Lys Leu Glu Tyr Asp Tyr Asn Ser His Asn Val Tyr 195 200 205 Ile Met Ala Asp Lys Gln Lys Asn Gly Ile Lys Val Asn Phe Lys Ile 210 215 220 Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln 225 230 235 240 Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His 245 250 255 Tyr Leu Glu Tyr Gln Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg 260 265 270 Asp His Met Val Leu Ala Glu Phe Val Thr Ala Glu Gly Ile Thr Leu 275 280 285 Gly Met Asp Glu Leu Tyr Lys 290 295 <210> 31 <211> 164 <212> PRT <213> Homo sapiens <400> 31 Leu Arg Ala Asp Gly Asp Lys Pro Arg Ala His Leu Thr Val Val Arg 1 5 10 15 Gln Thr Pro Thr Gln His Phe Lys Asn Gln Phe Pro Ala Leu His Trp 20 25 30 Glu His Glu Leu Gly Leu Ala Phe Thr Lys Asn Arg Met Asn Tyr Thr 35 40 45 Asn Lys Phe Leu Leu Ile Pro Glu Ser Gly Asp Tyr Phe Ile Tyr Ser 50 55 60 Gln Val Thr Phe Arg Gly Met Thr Ser Glu Cys Ser Glu Ile Arg Gln 65 70 75 80 Ala Gly Arg Pro Asn Lys Pro Asp Ser Ile Thr Val Val Ile Thr Lys 85 90 95 Val Thr Asp Ser Tyr Pro Glu Pro Thr Gln Leu Leu Met Gly Thr Lys 100 105 110 Ser Val Cys Glu Val Gly Ser Asn Trp Phe Gln Pro Ile Tyr Leu Gly 115 120 125 Ala Met Phe Ser Leu Gln Glu Gly Asp Lys Leu Met Val Asn Val Ser 130 135 140 Asp Ile Ser Leu Val Asp Tyr Thr Lys Glu Asp Lys Thr Phe Phe Gly 145 150 155 160 Ala Phe Leu Leu <210> 32 <211> 389 <212> PRT <213> Artificial Sequence <220> <223> monomer of the construct SpyCatcher003-TL1A-DogCatcher <400> 32 Val Thr Thr Leu Ser Gly Leu Ser Gly Glu Gln Gly Pro Ser Gly Asp 1 5 10 15 Met Thr Thr Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg 20 25 30 Asp Glu Asp Gly Arg Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp 35 40 45 Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly His Val Lys 50 55 60 Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala 65 70 75 80 Pro Asp Gly Tyr Glu Val Ala Thr Pro Ile Glu Phe Thr Val Asn Glu 85 90 95 Asp Gly Gln Val Thr Val Asp Gly Glu Ala Thr Glu Gly Asp Ala His 100 105 110 Thr Gly Ser Gly Ser Leu Arg Ala Asp Gly Asp Lys Pro Arg Ala His 115 120 125 Leu Thr Val Val Arg Gln Thr Pro Thr Gln His Phe Lys Asn Gln Phe 130 135 140 Pro Ala Leu His Trp Glu His Glu Leu Gly Leu Ala Phe Thr Lys Asn 145 150 155 160 Arg Met Asn Tyr Thr Asn Lys Phe Leu Leu Ile Pro Glu Ser Gly Asp 165 170 175 Tyr Phe Ile Tyr Ser Gln Val Thr Phe Arg Gly Met Thr Ser Glu Cys 180 185 190 Ser Glu Ile Arg Gln Ala Gly Arg Pro Asn Lys Pro Asp Ser Ile Thr 195 200 205 Val Val Ile Thr Lys Val Thr Asp Ser Tyr Pro Glu Pro Thr Gln Leu 210 215 220 Leu Met Gly Thr Lys Ser Val Cys Glu Val Gly Ser Asn Trp Phe Gln 225 230 235 240 Pro Ile Tyr Leu Gly Ala Met Phe Ser Leu Gln Glu Gly Asp Lys Leu 245 250 255 Met Val Asn Val Ser Asp Ile Ser Leu Val Asp Tyr Thr Lys Glu Asp 260 265 270 Lys Thr Phe Phe Gly Ala Phe Leu Leu Gly Ser Gly Ser Lys Leu Gly 275 280 285 Glu Ile Glu Phe Ile Lys Val Asp Lys Thr Asp Lys Lys Pro Leu Arg 290 295 300 Gly Ala Val Phe Ser Leu Gln Lys Gln His Pro Asp Tyr Pro Asp Ile 305 310 315 320 Tyr Gly Ala Ile Asp Gln Asn Gly Thr Tyr Gln Asp Val Arg Thr Gly 325 330 335 Glu Asp Gly Lys Leu Thr Phe Thr Asn Leu Ser Asp Gly Lys Tyr Arg 340 345 350 Leu Ile Glu Asn Ser Glu Pro Pro Gly Tyr Lys Pro Val Gln Asn Lys 355 360 365 Pro Ile Val Ser Phe Arg Ile Val Asp Gly Glu Val Arg Asp Val Thr 370 375 380 Ser Ile Val Pro Gln 385 <210> 33 <211> 287 <212> PRT <213> Artificial Sequence <220> <223> monomer of the construct SpyCatcher003-Col XV NC1-DogCatcher <400> 33 Val Thr Thr Leu Ser Gly Leu Ser Gly Glu Gln Gly Pro Ser Gly Asp 1 5 10 15 Met Thr Thr Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg 20 25 30 Asp Glu Asp Gly Arg Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp 35 40 45 Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly His Val Lys 50 55 60 Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala 65 70 75 80 Pro Asp Gly Tyr Glu Val Ala Thr Pro Ile Glu Phe Thr Val Asn Glu 85 90 95 Asp Gly Gln Val Thr Val Asp Gly Glu Ala Thr Glu Gly Asp Ala Gly 100 105 110 Ser Gly Ser Val Thr Ala Phe Ser Asn Met Asp Asp Met Leu Gln Lys 115 120 125 Ala His Leu Val Ile Glu Gly Thr Phe Ile Tyr Leu Arg Asp Ser Thr 130 135 140 Glu Phe Phe Ile Arg Val Arg Asp Gly Trp Lys Lys Leu Gln Leu Gly 145 150 155 160 Glu Leu Ile Pro Ile Pro Ala Asp Ser Pro Pro Pro Pro Ala Leu Ser 165 170 175 Ser Asn Pro Gly Ser Gly Ser Lys Leu Gly Glu Ile Glu Phe Ile Lys 180 185 190 Val Asp Lys Thr Asp Lys Lys Pro Leu Arg Gly Ala Val Phe Ser Leu 195 200 205 Gln Lys Gln His Pro Asp Tyr Pro Asp Ile Tyr Gly Ala Ile Asp Gln 210 215 220 Asn Gly Thr Tyr Gln Asp Val Arg Thr Gly Glu Asp Gly Lys Leu Thr 225 230 235 240 Phe Thr Asn Leu Ser Asp Gly Lys Tyr Arg Leu Ile Glu Asn Ser Glu 245 250 255 Pro Pro Gly Tyr Lys Pro Val Gln Asn Lys Pro Ile Val Ser Phe Arg 260 265 270 Ile Val Asp Gly Glu Val Arg Asp Val Thr Ser Ile Val Pro Gln 275 280 285 <210> 34 <211> 342 <212> PRT <213> Artificial Sequence <220> <223> monomer of the construct SpyCatcher003-MIF2m-DogCatcher <400> 34 Val Thr Thr Leu Ser Gly Leu Ser Gly Glu Gln Gly Pro Ser Gly Asp 1 5 10 15 Met Thr Thr Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg 20 25 30 Asp Glu Asp Gly Arg Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp 35 40 45 Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly His Val Lys 50 55 60 Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala 65 70 75 80 Pro Asp Gly Tyr Glu Val Ala Thr Pro Ile Glu Phe Thr Val Asn Glu 85 90 95 Asp Gly Gln Val Thr Val Asp Gly Glu Ala Thr Glu Gly Asp Ala His 100 105 110 Thr Gly Ser Gly Ser Pro Phe Leu Glu Leu Asp Thr Asn Leu Pro Ala 115 120 125 Asn Arg Val Pro Ala Gly Leu Glu Lys Arg Leu Cys Ala Ala Ala Ala 130 135 140 Ser Ile Leu Gly Lys Pro Ala Asp Arg Val Asn Val Thr Val Arg Pro 145 150 155 160 Gly Leu Ala Met Ala Leu Ser Gly Ser Thr Glu Pro Cys Ala Gln Leu 165 170 175 Ser Ile Ala Ser Ile Gly Val Val Gly Thr Ala Glu Asp Asn Arg Ser 180 185 190 His Ser Ala His Phe Phe Glu Phe Leu Thr Lys Glu Leu Ala Leu Gly 195 200 205 Gln Asp Arg Ile Leu Ile Arg Phe Ala Pro Leu Glu Ser Trp Gln Ile 210 215 220 Gly Lys Ile Gly Thr Val Met Thr Phe Leu Gly Ser Gly Ser Lys Leu 225 230 235 240 Gly Glu Ile Glu Phe Ile Lys Val Asp Lys Thr Asp Lys Lys Pro Leu 245 250 255 Arg Gly Ala Val Phe Ser Leu Gln Lys Gln His Pro Asp Tyr Pro Asp 260 265 270 Ile Tyr Gly Ala Ile Asp Gln Asn Gly Thr Tyr Gln Asp Val Arg Thr 275 280 285 Gly Glu Asp Gly Lys Leu Thr Phe Thr Asn Leu Ser Asp Gly Lys Tyr 290 295 300 Arg Leu Ile Glu Asn Ser Glu Pro Pro Gly Tyr Lys Pro Val Gln Asn 305 310 315 320 Lys Pro Ile Val Ser Phe Arg Ile Val Asp Gly Glu Val Arg Asp Val 325 330 335 Thr Ser Ile Val Pro Gln 340 <210> 35 <211> 280 <212> PRT <213> Artificial Sequence <220> <223> monomer of the construct SpyCatcher003-IMX-DogCatcher <400> 35 Val Thr Thr Leu Ser Gly Leu Ser Gly Glu Gln Gly Pro Ser Gly Asp 1 5 10 15 Met Thr Thr Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg 20 25 30 Asp Glu Asp Gly Arg Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp 35 40 45 Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly His Val Lys 50 55 60 Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala 65 70 75 80 Pro Asp Gly Tyr Glu Val Ala Thr Pro Ile Glu Phe Thr Val Asn Glu 85 90 95 Asp Gly Gln Val Thr Val Asp Gly Glu Ala Thr Glu Gly Asp Ala His 100 105 110 Thr Gly Ser Gly Ser Lys Lys Gln Gly Asp Ala Asp Val Cys Gly Glu 115 120 125 Val Ala Tyr Ile Gln Ser Val Val Ser Asp Cys His Val Pro Thr Ala 130 135 140 Glu Leu Arg Thr Leu Leu Glu Ile Arg Lys Leu Phe Leu Glu Ile Gln 145 150 155 160 Lys Leu Lys Val Glu Leu Gln Gly Leu Ser Lys Glu Gly Ser Gly Ser 165 170 175 Lys Leu Gly Glu Ile Glu Phe Ile Lys Val Asp Lys Thr Asp Lys Lys 180 185 190 Pro Leu Arg Gly Ala Val Phe Ser Leu Gln Lys Gln His Pro Asp Tyr 195 200 205 Pro Asp Ile Tyr Gly Ala Ile Asp Gln Asn Gly Thr Tyr Gln Asp Val 210 215 220 Arg Thr Gly Glu Asp Gly Lys Leu Thr Phe Thr Asn Leu Ser Asp Gly 225 230 235 240 Lys Tyr Arg Leu Ile Glu Asn Ser Glu Pro Pro Gly Tyr Lys Pro Val 245 250 255 Gln Asn Lys Pro Ile Val Ser Phe Arg Ile Val Asp Gly Glu Val Arg 260 265 270 Asp Val Thr Ser Ile Val Pro Gln 275 280 <210> 36 <211> 133 <212> PRT <213> Homo sapiens <400> 36 Gln Pro Arg Pro Ala Phe Ser Ala Ile Arg Arg Asn Pro Pro Met Gly 1 5 10 15 Gly Asn Val Val Ile Phe Asp Thr Val Ile Thr Asn Gln Glu Glu Pro 20 25 30 Tyr Gln Asn His Ser Gly Arg Phe Val Cys Thr Val Pro Gly Tyr Tyr 35 40 45 Tyr Phe Thr Phe Gln Val Leu Ser Gln Trp Glu Ile Cys Leu Ser Ile 50 55 60 Val Ser Ser Ser Arg Gly Gln Val Arg Arg Ser Leu Gly Phe Cys Asp 65 70 75 80 Thr Thr Asn Lys Gly Leu Phe Gln Val Val Ser Gly Gly Met Val Leu 85 90 95 Gln Leu Gln Gln Gly Asp Gln Val Trp Val Glu Lys Asp Pro Lys Lys 100 105 110 Gly His Ile Tyr Gln Gly Ser Glu Ala Asp Ser Val Phe Ser Gly Phe 115 120 125 Leu Ile Phe Pro Ser 130 <210> 37 <211> 132 <212> PRT <213> Homo sapiens <400> 37 Thr Gln Lys Ile Ala Phe Ser Ala Thr Arg Thr Ile Asn Val Pro Leu 1 5 10 15 Arg Arg Asp Gln Thr Ile Arg Phe Asp His Val Ile Thr Asn Met Asn 20 25 30 Asn Asn Tyr Glu Pro Arg Ser Gly Lys Phe Thr Cys Lys Val Pro Gly 35 40 45 Leu Tyr Tyr Phe Thr Tyr His Ala Ser Ser Arg Gly Asn Leu Cys Val 50 55 60 Asn Leu Met Arg Gly Arg Glu Arg Ala Gln Lys Val Val Thr Phe Cys 65 70 75 80 Asp Tyr Ala Tyr Asn Thr Phe Gln Val Thr Thr Gly Gly Met Val Leu 85 90 95 Lys Leu Glu Gln Gly Glu Asn Val Phe Leu Gln Ala Thr Asp Lys Asn 100 105 110 Ser Leu Leu Gly Met Glu Gly Ala Asn Ser Ile Phe Ser Gly Phe Leu 115 120 125 Leu Phe Pro Asp 130 <210> 38 <211> 129 <212> PRT <213> Homo sapiens <400> 38 Lys Phe Gln Ser Val Phe Thr Val Thr Arg Gln Thr His Gln Pro Pro 1 5 10 15 Ala Pro Asn Ser Leu Ile Arg Phe Asn Ala Val Leu Thr Asn Pro Gln 20 25 30 Gly Asp Tyr Asp Thr Ser Thr Gly Lys Phe Thr Cys Lys Val Pro Gly 35 40 45 Leu Tyr Tyr Phe Val Tyr His Ala Ser His Thr Ala Asn Leu Cys Val 50 55 60 Leu Leu Tyr Arg Ser Gly Val Lys Val Val Thr Phe Cys Gly His Thr 65 70 75 80 Ser Lys Thr Asn Gln Val Asn Ser Gly Gly Val Leu Leu Arg Leu Gln 85 90 95 Val Gly Glu Glu Val Trp Leu Ala Val Asn Asp Tyr Tyr Asp Met Val 100 105 110 Gly Ile Gln Gly Ser Asp Ser Val Phe Ser Gly Phe Leu Leu Phe Pro 115 120 125 Asp <210> 39 <211> 103 <212> PRT <213> Thermus thermophilus <400> 39 Met Glu Glu Val Val Leu Ile Thr Val Pro Ser Glu Glu Val Ala Arg 1 5 10 15 Thr Ile Ala Lys Ala Leu Val Glu Glu Arg Leu Ala Ala Cys Val Asn 20 25 30 Ile Val Pro Gly Leu Thr Ser Ile Tyr Arg Trp Gln Gly Glu Val Val 35 40 45 Glu Asp Gln Glu Leu Leu Leu Leu Val Lys Thr Thr Thr His Ala Phe 50 55 60 Pro Lys Leu Lys Glu Arg Val Lys Ala Leu His Pro Tyr Thr Val Pro 65 70 75 80 Glu Ile Val Ala Leu Pro Ile Ala Glu Gly Asn Arg Glu Tyr Leu Asp 85 90 95 Trp Leu Arg Glu Asn Thr Gly 100 <210> 40 <211> 107 <212> PRT <213> Oryza sativa <400> 40 Ser Thr Thr Val Pro Ser Ile Val Val Tyr Val Thr Val Pro Asn Lys 1 5 10 15 Glu Ala Gly Lys Arg Leu Ala Gly Ser Ile Ile Ser Glu Lys Leu Ala 20 25 30 Ala Cys Val Asn Ile Val Pro Gly Ile Glu Ser Val Tyr Trp Trp Glu 35 40 45 Gly Lys Val Gln Thr Asp Ala Glu Glu Leu Leu Ile Ile Lys Thr Arg 50 55 60 Glu Ser Leu Leu Asp Ala Leu Thr Glu His Val Lys Ala Asn His Glu 65 70 75 80 Tyr Asp Val Pro Glu Val Ile Ala Leu Pro Ile Lys Gly Gly Asn Leu 85 90 95 Lys Tyr Leu Glu Trp Leu Lys Asn Ser Thr Arg 100 105 <210> 41 <211> 106 <212> PRT <213> Shewanella sp. SIB1 <400> 41 Lys Pro Glu Gln Leu Leu Ile Phe Thr Thr Cys Pro Asp Ala Asp Ile 1 5 10 15 Ala Cys Arg Ile Ala Thr Ala Leu Val Glu Ala Lys Leu Ala Ala Cys 20 25 30 Val Gln Ile Gly Gln Ala Val Glu Ser Ile Tyr Gln Trp Asp Asn Asn 35 40 45 Ile Cys Gln Ser His Glu Val Pro Met Gln Ile Lys Cys Met Thr Thr 50 55 60 Asp Tyr Pro Ala Ile Glu Gln Leu Val Ile Thr Met His Pro Tyr Glu 65 70 75 80 Val Pro Glu Phe Ile Ala Thr Pro Ile Ile Gly Gly Phe Gly Pro Tyr 85 90 95 Leu Gln Trp Ile Lys Asp Asn Ser Pro Ser 100 105 <210> 42 <211> 152 <212> PRT <213> Homo sapiens <400> 42 Arg Thr Pro Ser Asp Lys Pro Val Ala His Val Val Ala Asn Pro Gln 1 5 10 15 Ala Glu Gly Gln Leu Gln Trp Leu Asn Arg Arg Ala Asn Ala Leu Leu 20 25 30 Ala Asn Gly Val Glu Leu Arg Asp Asn Gln Leu Val Val Pro Ser Glu 35 40 45 Gly Leu Tyr Leu Ile Tyr Ser Gln Val Leu Phe Lys Gly Gln Gly Cys 50 55 60 Pro Ser Thr His Val Leu Leu Thr His Thr Ile Ser Arg Ile Ala Val 65 70 75 80 Ser Tyr Gln Thr Lys Val Asn Leu Leu Ser Ala Ile Lys Ser Pro Cys 85 90 95 Gln Arg Glu Thr Pro Glu Gly Ala Glu Ala Lys Pro Trp Tyr Glu Pro 100 105 110 Ile Tyr Leu Gly Gly Val Phe Gln Leu Glu Lys Gly Asp Arg Leu Ser 115 120 125 Ala Glu Ile Asn Arg Pro Asp Tyr Leu Leu Phe Ala Glu Ser Gly Gln 130 135 140 Val Tyr Phe Gly Ile Ile Ala Leu 145 150 <210> 43 <211> 28 <212> PRT <213> Artificial Sequence <220> <223> monomer of the antiparallel coiled coil hexamer <400> 43 Glu Leu Ala Gln Ala Phe Lys Glu Ile Ala Lys Ala Phe Lys Glu Ile 1 5 10 15 Ala Lys Ala Phe Glu Phe Ile Ala Gln Ala Ile Glu 20 25 <210> 44 <211> 61 <212> PRT <213> Homo sapiens <400> 44 Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Ile Glu Ala Gln Gln 1 5 10 15 His Leu Leu Gln Leu Thr Val Trp Ala Ile Lys Gln Leu Gln Ala Arg 20 25 30 Ser Gly Gly Arg Gly Gly Trp Met Glu Trp Asp Arg Glu Ile Asn Asn 35 40 45 Tyr Thr Ser Leu Ile His Ser Leu Ile Glu Glu Ser Gln 50 55 60 <210> 45 <211> 96 <212> PRT <213> Aquifex aeolicus VF5 <400> 45 Val Asp Pro Ala Lys Glu Ala Ile Met Lys Pro Gln Leu Thr Met Leu 1 5 10 15 Lys Gly Leu Ser Asp Ala Glu Leu Lys Ala Leu Ala Asp Phe Ile Leu 20 25 30 Arg Ile Ala Lys Gln Ala Gln Glu Lys Gln Gln Gln Asp Val Ala Lys 35 40 45 Ala Ile Phe Gln Gln Lys Gly Cys Gly Ser Cys His Gln Ala Asn Val 50 55 60 Asp Thr Val Gly Pro Ser Leu Ala Lys Ile Ala Gln Ala Tyr Ala Gly 65 70 75 80 Lys Glu Asp Gln Leu Ile Lys Phe Leu Lys Gly Glu Ala Pro Ala Ile 85 90 95 <210> 46 <211> 75 <212> PRT <213> Homo sapiens <400> 46 Tyr Gly Asn Met Thr Glu Asp His Val Met His Leu Leu Gln Asn Ala 1 5 10 15 Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly Ser Phe Pro Glu Asn 20 25 30 Leu Arg His Leu Lys Asn Thr Met Glu Thr Ile Asp Trp Lys Val Phe 35 40 45 Glu Ser Trp Met His His Trp Leu Leu Phe Glu Met Ser Arg His Ser 50 55 60 Leu Glu Gln Lys Pro Thr Asp Ala Pro Pro Lys 65 70 75 <210> 47 <400> 47 000 <210> 48 <211> 220 <212> PRT <213> Homo sapiens <400> 48 Ser Arg Pro Arg Asp Cys Leu Asp Val Leu Leu Ser Gly Gln Gln Asp 1 5 10 15 Asp Gly Val Tyr Ser Val Phe Pro Thr His Tyr Pro Ala Gly Phe Gln 20 25 30 Val Tyr Cys Asp Met Arg Thr Asp Gly Gly Gly Trp Thr Val Phe Gln 35 40 45 Arg Arg Glu Asp Gly Ser Val Asn Phe Phe Arg Gly Trp Asp Ala Tyr 50 55 60 Arg Asp Gly Phe Gly Arg Leu Thr Gly Glu His Trp Leu Gly Leu Lys 65 70 75 80 Arg Ile His Ala Leu Thr Thr Gln Ala Ala Tyr Glu Leu His Val Asp 85 90 95 Leu Glu Asp Phe Glu Asn Gly Thr Ala Tyr Ala Arg Tyr Gly Ser Phe 100 105 110 Gly Val Gly Leu Phe Ser Val Asp Pro Glu Glu Asp Gly Tyr Pro Leu 115 120 125 Thr Val Ala Asp Tyr Ser Gly Thr Ala Gly Asp Ser Leu Leu Lys His 130 135 140 Ser Gly Met Arg Phe Thr Thr Lys Asp Arg Asp Ser Asp His Ser Glu 145 150 155 160 Asn Asn Cys Ala Ala Phe Tyr Arg Gly Ala Trp Trp Tyr Arg Asn Cys 165 170 175 His Thr Ser Asn Leu Asn Gly Gln Tyr Leu Arg Gly Ala His Ala Ser 180 185 190 Tyr Ala Asp Gly Val Glu Trp Ser Ser Trp Thr Gly Trp Gln Tyr Ser 195 200 205 Leu Lys Phe Ser Glu Met Lys Ile Arg Pro Val Arg 210 215 220 <210> 49 <211> 228 <212> PRT <213> Bos taurus <400> 49 Val Asp His Gly Phe Leu Val Thr Arg His Ser Gln Thr Ile Asp Asp 1 5 10 15 Pro Gln Cys Pro Ser Gly Thr Lys Ile Leu Tyr His Gly Tyr Ser Leu 20 25 30 Leu Tyr Val Gln Gly Asn Glu Arg Ala His Gly Gln Asp Leu Gly Thr 35 40 45 Ala Gly Ser Cys Leu Arg Lys Phe Ser Thr Met Pro Phe Leu Phe Cys 50 55 60 Asn Ile Asn Asn Val Cys Asn Phe Ala Ser Arg Asn Asp Tyr Ser Tyr 65 70 75 80 Trp Leu Ser Thr Pro Glu Pro Met Pro Met Ser Met Ala Pro Ile Thr 85 90 95 Gly Glu Asn Ile Arg Pro Phe Ile Ser Arg Cys Ala Val Cys Glu Ala 100 105 110 Pro Ala Met Val Met Ala Val His Ser Gln Thr Ile Gln Ile Pro Pro 115 120 125 Cys Pro Ser Gly Trp Ser Ser Leu Trp Ile Gly Tyr Ser Phe Val Met 130 135 140 His Thr Ser Ala Gly Ala Glu Gly Ser Gly Gln Ala Leu Ala Ser Pro 145 150 155 160 Gly Ser Cys Leu Glu Glu Phe Arg Ser Ala Pro Phe Ile Glu Cys His 165 170 175 Gly Arg Gly Thr Cys Asn Tyr Tyr Ala Asn Ala Tyr Ser Phe Trp Leu 180 185 190 Ala Thr Ile Glu Arg Ser Glu Met Phe Lys Lys Pro Thr Pro Ser Thr 195 200 205 Leu Lys Ala Gly Glu Leu Arg Thr His Val Ser Arg Cys Gln Val Cys 210 215 220 Met Arg Arg Thr 225 <210> 50 <211> 52 <212> PRT <213> Bacillus subtilis <400> 50 Phe Met Lys Ser Thr Gly Ile Val Arg Lys Val Asp Glu Leu Gly Arg 1 5 10 15 Val Val Ile Pro Ile Glu Leu Arg Arg Thr Leu Gly Ile Ala Glu Lys 20 25 30 Asp Ala Leu Glu Ile Tyr Val Asp Asp Glu Lys Ile Ile Leu Lys Lys 35 40 45 Tyr Lys Pro Asn 50 <210> 51 <211> 95 <212> PRT <213> Escherichia virus Lambda <400> 51 Ser Asp Pro Ala His Thr Ala Thr Ala Pro Gly Gly Leu Ser Ala Lys 1 5 10 15 Ala Pro Ala Met Thr Pro Leu Met Leu Asp Thr Ser Ser Arg Lys Leu 20 25 30 Val Ala Trp Asp Gly Thr Thr Asp Gly Ala Ala Val Gly Ile Leu Ala 35 40 45 Val Ala Ala Asp Gln Thr Ser Thr Thr Leu Thr Phe Tyr Lys Ser Gly 50 55 60 Thr Phe Arg Tyr Glu Asp Val Leu Trp Pro Glu Ala Ala Ser Asp Glu 65 70 75 80 Thr Lys Lys Arg Thr Ala Phe Ala Gly Thr Ala Ile Ser Ile Val 85 90 95 <210> 52 <211> 133 <212> PRT <213> Homo sapiens <400> 52 Thr Arg Asp Phe Asn Gly Thr Trp Glu Met Glu Ser Asn Glu Asn Phe 1 5 10 15 Glu Gly Tyr Met Lys Ala Leu Asp Ile Asp Phe Ala Thr Arg Lys Ile 20 25 30 Ala Val Arg Leu Thr Phe Thr Asp Val Ile Asp Gln Asp Gly Asp Asn 35 40 45 Phe Lys Thr Lys Ala Thr Ser Thr Phe Leu Asn Tyr Asp Glu Asp Phe 50 55 60 Thr Val Gly Val Glu Phe Asp Glu Tyr Thr Lys Ser Leu Asp Asn Arg 65 70 75 80 His Val Lys Ala Leu Val Thr Trp Glu Gly Asp Val Leu Val Cys Val 85 90 95 Gln Lys Gly Glu Lys Glu Asn Arg Gly Trp Lys Lys Trp Ile Glu Gly 100 105 110 Asp Lys Leu Tyr Leu Glu Leu Thr Cys Gly Asp Gln Val Cys Arg Gln 115 120 125 Val Phe Lys Lys Lys 130 <210> 53 <211> 162 <212> PRT <213> Homo sapiens <400> 53 Leu Pro Thr Tyr Arg Tyr Pro Leu Glu Leu Asp Thr Ala Asn Asn Arg 1 5 10 15 Val Gln Val Ala Asp Arg Phe Gly Met Arg Thr Gly Thr Trp Thr Gly 20 25 30 Gln Leu Gln Tyr Gln His Pro Gln Leu Ser Trp Arg Ala Asn Val Thr 35 40 45 Leu Asn Leu Met Lys Val Asp Asp Trp Leu Val Leu Ser Phe Ser Gln 50 55 60 Met Thr Thr Asn Ser Ile Met Ala Asp Gly Lys Phe Val Ile Asn Phe 65 70 75 80 Val Ser Gly Leu Ser Ser Gly Trp Gln Thr Gly Asp Thr Glu Pro Ser 85 90 95 Ser Thr Ile Asp Pro Leu Ser Thr Thr Phe Ala Ala Val Gln Phe Leu 100 105 110 Asn Asn Gly Gln Arg Ile Asp Ala Phe Arg Ile Met Gly Val Ser Glu 115 120 125 Trp Thr Asp Gly Glu Leu Glu Ile Lys Asn Tyr Gly Gly Thr Tyr Thr 130 135 140 Gly His Thr Gln Val Tyr Trp Ala Pro Trp Thr Ile Met Tyr Pro Cys 145 150 155 160 Asn Val <210> 54 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> monomer of the construct SpyCatcher003-HsCutA1-DogCatcher <400> 54 Val Thr Thr Leu Ser Gly Leu Ser Gly Glu Gln Gly Pro Ser Gly Asp 1 5 10 15 Met Thr Thr Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg 20 25 30 Asp Glu Asp Gly Arg Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp 35 40 45 Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly His Val Lys 50 55 60 Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala 65 70 75 80 Pro Asp Gly Tyr Glu Val Ala Thr Pro Ile Glu Phe Thr Val Asn Glu 85 90 95 Asp Gly Gln Val Thr Val Asp Gly Glu Ala Thr Glu Gly Asp Ala His 100 105 110 Thr Gly Ser Gly Ser Met Ala Ser Gly Ser Pro Pro Thr Gln Pro Ser 115 120 125 Pro Ala Ser Asp Ser Gly Ser Gly Tyr Val Pro Gly Ser Val Ser Ala 130 135 140 Ala Phe Val Thr Cys Pro Asn Glu Lys Val Ala Lys Glu Ile Ala Arg 145 150 155 160 Ala Val Val Glu Lys Arg Leu Ala Ala Cys Val Asn Leu Ile Pro Gln 165 170 175 Ile Thr Ser Ile Tyr Glu Trp Lys Gly Lys Ile Glu Glu Asp Ser Glu 180 185 190 Val Leu Met Met Ile Lys Thr Gln Ser Ser Leu Val Pro Ala Leu Thr 195 200 205 Asp Phe Val Arg Ser Val His Pro Tyr Glu Val Ala Glu Val Ile Ala 210 215 220 Leu Pro Val Glu Gln Gly Asn Phe Pro Tyr Leu Gln Trp Val Arg Gln 225 230 235 240 Val Thr Glu Ser Val Ser Asp Ser Ile Thr Val Leu Pro Gly Ser Gly 245 250 255 Ser Lys Leu Gly Glu Ile Glu Phe Ile Lys Val Asp Lys Thr Asp Lys 260 265 270 Lys Pro Leu Arg Gly Ala Val Phe Ser Leu Gln Lys Gln His Pro Asp 275 280 285 Tyr Pro Asp Ile Tyr Gly Ala Ile Asp Gln Asn Gly Thr Tyr Gln Asp 290 295 300 Val Arg Thr Gly Glu Asp Gly Lys Leu Thr Phe Thr Asn Leu Ser Asp 305 310 315 320 Gly Lys Tyr Arg Leu Ile Glu Asn Ser Glu Pro Pro Gly Tyr Lys Pro 325 330 335 Val Gln Asn Lys Pro Ile Val Ser Phe Arg Ile Val Asp Gly Glu Val 340 345 350 Arg Asp Val Thr Ser Ile Val Pro Gln 355 360 <210> 55 <211> 327 <212> PRT <213> Artificial Sequence <220> <223> monomer of the construct SpyCatcher003-PhCutA1-DogCatcher <400> 55 Val Thr Thr Leu Ser Gly Leu Ser Gly Glu Gln Gly Pro Ser Gly Asp 1 5 10 15 Met Thr Thr Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg 20 25 30 Asp Glu Asp Gly Arg Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp 35 40 45 Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly His Val Lys 50 55 60 Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala 65 70 75 80 Pro Asp Gly Tyr Glu Val Ala Thr Pro Ile Glu Phe Thr Val Asn Glu 85 90 95 Asp Gly Gln Val Thr Val Asp Gly Glu Ala Thr Glu Gly Asp Ala His 100 105 110 Thr Gly Ser Gly Ser Met Ile Ile Val Tyr Thr Thr Phe Pro Asp Trp 115 120 125 Glu Ser Ala Glu Lys Val Val Lys Thr Leu Leu Lys Glu Arg Leu Ile 130 135 140 Ala Cys Ala Asn Leu Arg Glu His Arg Ala Phe Tyr Trp Trp Glu Gly 145 150 155 160 Lys Ile Glu Glu Asp Lys Glu Val Gly Ala Ile Leu Lys Thr Arg Glu 165 170 175 Asp Leu Trp Glu Glu Leu Lys Glu Arg Ile Lys Glu Leu His Pro Tyr 180 185 190 Asp Val Pro Ala Ile Ile Arg Ile Asp Val Asp Asp Val Asn Glu Asp 195 200 205 Tyr Leu Lys Trp Leu Ile Glu Glu Thr Lys Lys Gly Ser Gly Ser Lys 210 215 220 Leu Gly Glu Ile Glu Phe Ile Lys Val Asp Lys Thr Asp Lys Lys Pro 225 230 235 240 Leu Arg Gly Ala Val Phe Ser Leu Gln Lys Gln His Pro Asp Tyr Pro 245 250 255 Asp Ile Tyr Gly Ala Ile Asp Gln Asn Gly Thr Tyr Gln Asp Val Arg 260 265 270 Thr Gly Glu Asp Gly Lys Leu Thr Phe Thr Asn Leu Ser Asp Gly Lys 275 280 285 Tyr Arg Leu Ile Glu Asn Ser Glu Pro Pro Gly Tyr Lys Pro Val Gln 290 295 300 Asn Lys Pro Ile Val Ser Phe Arg Ile Val Asp Gly Glu Val Arg Asp 305 310 315 320 Val Thr Ser Ile Val Pro Gln 325 <210> 56 <211> 359 <212> PRT <213> Artificial Sequence <220> <223> monomer of the construct SpyCatcher003-Col X NC1-DogCatcher <400> 56 Val Thr Thr Leu Ser Gly Leu Ser Gly Glu Gln Gly Pro Ser Gly Asp 1 5 10 15 Met Thr Thr Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg 20 25 30 Asp Glu Asp Gly Arg Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp 35 40 45 Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly His Val Lys 50 55 60 Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala 65 70 75 80 Pro Asp Gly Tyr Glu Val Ala Thr Pro Ile Glu Phe Thr Val Asn Glu 85 90 95 Asp Gly Gln Val Thr Val Asp Gly Glu Ala Thr Glu Gly Asp Ala His 100 105 110 Thr Gly Ser Gly Ser Thr Gly Met Pro Val Ser Ala Phe Thr Val Ile 115 120 125 Leu Ser Lys Ala Tyr Pro Ala Ile Gly Thr Pro Ile Pro Phe Asp Lys 130 135 140 Ile Leu Tyr Asn Arg Gln Gln His Tyr Asp Pro Arg Thr Gly Ile Phe 145 150 155 160 Thr Cys Gln Ile Pro Gly Ile Tyr Tyr Phe Ser Tyr His Val His Val 165 170 175 Lys Gly Thr His Val Trp Val Gly Leu Tyr Lys Asn Gly Thr Pro Val 180 185 190 Met Tyr Thr Tyr Asp Glu Tyr Thr Lys Gly Tyr Leu Asp Gln Ala Ser 195 200 205 Gly Ser Ala Ile Ile Asp Leu Thr Glu Asn Asp Gln Val Trp Leu Gln 210 215 220 Leu Pro Asn Ala Glu Ser Asn Gly Leu Tyr Ser Ser Glu Tyr Val His 225 230 235 240 Ser Ser Phe Ser Gly Phe Leu Val Ala Pro Met Gly Ser Gly Ser Lys 245 250 255 Leu Gly Glu Ile Glu Phe Ile Lys Val Asp Lys Thr Asp Lys Lys Pro 260 265 270 Leu Arg Gly Ala Val Phe Ser Leu Gln Lys Gln His Pro Asp Tyr Pro 275 280 285 Asp Ile Tyr Gly Ala Ile Asp Gln Asn Gly Thr Tyr Gln Asp Val Arg 290 295 300 Thr Gly Glu Asp Gly Lys Leu Thr Phe Thr Asn Leu Ser Asp Gly Lys 305 310 315 320 Tyr Arg Leu Ile Glu Asn Ser Glu Pro Pro Gly Tyr Lys Pro Val Gln 325 330 335 Asn Lys Pro Ile Val Ser Phe Arg Ile Val Asp Gly Glu Val Arg Asp 340 345 350 Val Thr Ser Ile Val Pro Gln 355 <210> 57 <211> 377 <212> PRT <213> Artificial Sequence <220> <223> monomer of the construct SpyCatcher003-TNF-DogCatcher <400> 57 Val Thr Thr Leu Ser Gly Leu Ser Gly Glu Gln Gly Pro Ser Gly Asp 1 5 10 15 Met Thr Thr Glu Glu Asp Ser Ala Thr His Ile Lys Phe Ser Lys Arg 20 25 30 Asp Glu Asp Gly Arg Glu Leu Ala Gly Ala Thr Met Glu Leu Arg Asp 35 40 45 Ser Ser Gly Lys Thr Ile Ser Thr Trp Ile Ser Asp Gly His Val Lys 50 55 60 Asp Phe Tyr Leu Tyr Pro Gly Lys Tyr Thr Phe Val Glu Thr Ala Ala 65 70 75 80 Pro Asp Gly Tyr Glu Val Ala Thr Pro Ile Glu Phe Thr Val Asn Glu 85 90 95 Asp Gly Gln Val Thr Val Asp Gly Glu Ala Thr Glu Gly Asp Ala His 100 105 110 Thr Gly Ser Gly Ser Arg Thr Pro Ser Asp Lys Pro Val Ala His Val 115 120 125 Val Ala Asn Pro Gln Ala Glu Gly Gln Leu Gln Trp Leu Asn Arg Arg 130 135 140 Ala Asn Ala Leu Leu Ala Asn Gly Val Glu Leu Arg Asp Asn Gln Leu 145 150 155 160 Val Val Pro Ser Glu Gly Leu Tyr Leu Ile Tyr Ser Gln Val Leu Phe 165 170 175 Lys Gly Gln Gly Cys Pro Ser Thr His Val Leu Leu Thr His Thr Ile 180 185 190 Ser Arg Ile Ala Val Ser Tyr Gln Thr Lys Val Asn Leu Leu Ser Ala 195 200 205 Ile Lys Ser Pro Cys Gln Arg Glu Thr Pro Glu Gly Ala Glu Ala Lys 210 215 220 Pro Trp Tyr Glu Pro Ile Tyr Leu Gly Gly Val Phe Gln Leu Glu Lys 225 230 235 240 Gly Asp Arg Leu Ser Ala Glu Ile Asn Arg Pro Asp Tyr Leu Leu Phe 245 250 255 Ala Glu Ser Gly Gln Val Tyr Phe Gly Ile Ile Ala Leu Gly Ser Gly 260 265 270 Ser Lys Leu Gly Glu Ile Glu Phe Ile Lys Val Asp Lys Thr Asp Lys 275 280 285 Lys Pro Leu Arg Gly Ala Val Phe Ser Leu Gln Lys Gln His Pro Asp 290 295 300 Tyr Pro Asp Ile Tyr Gly Ala Ile Asp Gln Asn Gly Thr Tyr Gln Asp 305 310 315 320 Val Arg Thr Gly Glu Asp Gly Lys Leu Thr Phe Thr Asn Leu Ser Asp 325 330 335 Gly Lys Tyr Arg Leu Ile Glu Asn Ser Glu Pro Pro Gly Tyr Lys Pro 340 345 350 Val Gln Asn Lys Pro Ile Val Ser Phe Arg Ile Val Asp Gly Glu Val 355 360 365 Arg Asp Val Thr Ser Ile Val Pro Gln 370 375 <210> 58 <211> 141 <212> PRT <213> Homo sapiens <400> 58 Gln Ile Ala Ala His Val Ile Ser Glu Ala Ser Ser Lys Thr Thr Ser 1 5 10 15 Val Leu Gln Trp Ala Glu Lys Gly Tyr Tyr Thr Met Ser Asn Asn Leu 20 25 30 Val Thr Leu Glu Asn Gly Lys Gln Leu Thr Val Lys Arg Gln Gly Leu 35 40 45 Tyr Tyr Ile Tyr Ala Gln Val Thr Phe Cys Ser Asn Arg Glu Ala Ser 50 55 60 Ser Gln Ala Pro Phe Ile Ala Ser Leu Cys Leu Lys Ser Pro Gly Arg 65 70 75 80 Phe Glu Arg Ile Leu Leu Arg Ala Ala Asn Thr His Ser Ser Ala Lys 85 90 95 Pro Cys Gly Gln Gln Ser Ile His Leu Gly Gly Val Phe Glu Leu Gln 100 105 110 Pro Gly Ala Ser Val Phe Val Asn Val Thr Asp Pro Ser Gln Val Ser 115 120 125 His Gly Thr Gly Phe Thr Ser Phe Gly Leu Leu Lys Leu 130 135 140 <210> 59 <211> 146 <212> PRT <213> Homo sapiens <400> 59 Met Lys Asp Glu Val Ala Leu Leu Ala Ala Val Thr Leu Leu Gly Val 1 5 10 15 Leu Leu Gln Ala Tyr Phe Ser Leu Gln Val Ile Ser Ala Arg Arg Ala 20 25 30 Phe Arg Val Ser Pro Pro Leu Thr Thr Gly Pro Pro Glu Phe Glu Arg 35 40 45 Val Tyr Arg Ala Gln Val Asn Cys Ser Glu Tyr Phe Pro Leu Phe Leu 50 55 60 Ala Thr Leu Trp Val Ala Gly Ile Phe Phe His Glu Gly Ala Ala Ala 65 70 75 80 Leu Cys Gly Leu Val Tyr Leu Phe Ala Arg Leu Arg Tyr Phe Gln Gly 85 90 95 Tyr Ala Arg Ser Ala Gln Leu Arg Leu Ala Pro Leu Tyr Ala Ser Ala 100 105 110 Arg Ala Leu Trp Leu Leu Val Ala Leu Ala Ala Leu Gly Leu Leu Ala 115 120 125 His Phe Leu Pro Ala Ala Leu Arg Ala Ala Leu Leu Gly Arg Leu Arg 130 135 140 Thr Leu 145 <210> 60 <211> 108 <212> PRT <213> Homo sapiens <400> 60 Ser Gly Tyr Val Pro Gly Ser Val Ser Ala Ala Phe Val Thr Cys Pro 1 5 10 15 Asn Glu Lys Val Ala Lys Glu Ile Ala Arg Ala Val Val Glu Lys Arg 20 25 30 Leu Ala Ala Cys Val Asn Leu Ile Pro Gln Ile Thr Ser Ile Tyr Glu 35 40 45 Trp Lys Gly Lys Ile Glu Glu Asp Ser Glu Val Leu Met Met Ile Lys 50 55 60 Thr Gln Ser Ser Leu Val Pro Ala Leu Thr Asp Phe Val Arg Ser Val 65 70 75 80 His Pro Tyr Glu Val Ala Glu Val Ile Ala Leu Pro Val Glu Gln Gly 85 90 95 Asn Phe Pro Tyr Leu Gln Trp Val Arg Gln Val Thr 100 105 <210> 61 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 61 Gly Ser Gly Ser 1 <210> 62 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 62 Gly Gly Gly Gly Ser 1 5 <210> 63 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 63 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 <210> 64 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 64 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 <210> 65 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 65 Gly Gly Gly Ser 1 <210> 66 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 66 Pro Gly Gly Ser 1 <210> 67 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 67 Pro Gly Gly Gly 1 <210> 68 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 68 Arg Pro Pro Pro Pro Pro 1 5 <210> 69 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 69 Arg Pro Pro Pro Pro 1 5 <210> 70 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 70 Arg Pro Pro Gly 1 <210> 71 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 71 Pro Pro Pro Pro 1 <210> 72 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 72 Pro Pro Pro Pro Pro Pro Pro Pro Pro 1 5 <210> 73 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 73 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 1 5 10 <210> 74 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 74 Ser Gly Ser Gly 1 <210> 75 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 75 Ser Gly Ser Gly Ser Gly 1 5 <210> 76 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 76 Ser Gly Ser Gly Ser Gly Ser Gly 1 5 <210> 77 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 77 Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly 1 5 10 <210> 78 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 78 Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly 1 5 10 15

Claims (33)

  1. - 복수의 서브유닛(subunit) 단량체를 포함하는 올리고머성 코어; 및
    - 적어도 하나의 제2 결합 부위에 직교하는(orthogonal) 적어도 하나의 제1 결합 부위
    를 포함하는 다가(multivalent) 단백질 스캐폴드(scaffold)로서,
    상기 제1 결합 부위(들) 및 상기 제2 결합 부위(들)는 상기 스캐폴드의 동일 면 상에 위치하고,
    상기 제1 결합 부위는 제1 폴리펩타이드 표적에 공유 결합을 형성할 수 있는 제1 단백질 도메인을 포함하며,
    상기 제2 결합 부위는 제2 폴리펩타이드 표적에 공유 결합을 형성할 수 있는 제2 단백질 도메인을 포함하는,
    다가 단백질 스캐폴드.
  2. 제1항에 있어서,
    상기 올리고머성 코어 내의 각각의 단량체가 적어도 하나의 제1 결합 부위 및 적어도 하나의 제2 결합 부위를 포함하고,
    상기 적어도 하나의 제1 결합 부위가 상기 적어도 하나의 제2 결합 부위에 직교하는, 단백질 스캐폴드.
  3. 제1항 또는 제2항에 있어서,
    각각의 상기 단량체가, 상기 단량체의 제1 말단에 부착된 제1 결합 부위 및 상기 단량체의 제2 말단에 부착된 제2 결합 부위를 포함하는, 단백질 스캐폴드.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    각각의 상기 단량체의 제1 말단 및 제2 말단이 상기 단량체의 동일한 면 및/또는 상기 단량체의 올리고머의 동일 면 상에 위치하는, 단백질 스캐폴드.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 제1 결합 부위가, 제1 폴리펩타이드 표적에 공유 결합을 형성할 수 있는 제1 단백질 도메인을 포함하고,
    상기 제2 결합 부위가, 제2 폴리펩타이드 표적에 공유 결합을 형성할 수 있는 제2 단백질 도메인을 포함하며,
    상기 제1 단백질 도메인이 상기 제1 폴리펩타이드 표적과 이소펩타이드 결합을 형성할 수 있고,
    상기 제2 단백질 도메인이 상기 제2 결합 표적과 이소펩타이드 결합을 형성할 수 있는,
    단백질 스캐폴드.
  6. 제5항에 있어서,
    상기 제1 결합 부위 및 상기 제2 결합 부위가 각각, 상이한 분할된 리간드-결합 단백질 도메인을 포함하고,
    바람직하게는 상기 제1 결합 부위 및 상기 제2 결합 부위 중 하나가, 분할된 스트렙토코커스 파이오게네스(Streptococcus pyogenes) 피브로넥틴-결합 단백질 도메인을 포함하고,
    상기 제1 결합 부위 및 상기 제2 결합 부위 중 나머지 하나가, 분할된 스트렙토코커스 뉴모니에(Streptococcus pneumoniae) 부착소(adhesin) 도메인을 포함하는,
    단백질 스캐폴드.
  7. 제6항에 있어서,
    상기 제1 및 제2 결합 부위가 각각 독립적으로 서열 번호 4 내지 9, 11 내지 13, 23 또는 15 내지 18 중 어느 하나에 대해 적어도 50%의 아미노산 동일성(amino acid identity)을 갖는, 단백질 스캐폴드.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서,
    상기 올리고머성 코어가 적어도 3개의 서브유닛 단량체를 포함하고,
    바람직하게는 상기 올리고머성 코어가 3 내지 6개의 서브유닛 단량체를 포함하는,
    단백질 스캐폴드.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서,
    상기 서브유닛 단량체가 비-공유결합적으로 함께 부착된, 단백질 스캐폴드.
  10. 제1항 내지 제8항 중 어느 한 항에 있어서,
    상기 서브유닛 단량체가 공유결합적으로 함께 부착되고,
    바람직하게는 상기 서브유닛 단량체가 재조합 융합 단백질을 형성하는,
    단백질 스캐폴드.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서,
    상기 올리고머성 코어가 동종올리고머(homooligomeric) 코어인, 단백질 스캐폴드.
  12. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 올리고머성 코어가 이종-올리고머(hetero-oligomeric) 코어인, 단백질 스캐폴드.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서,
    i) 각각의 상기 서브유닛 단량체가 300개 미만의 아미노산을 포함하고, 바람직하게는 각각의 상기 서브유닛 단량체가 200개 미만의 아미노산을 포함하고, 더욱 바람직하게는 각각의 상기 서브유닛 단량체가 150개 미만의 아미노산을 포함하고/하거나;
    ii) 상기 올리고머성 코어가 약 150 kDa 미만, 바람직하게는 약 100 kDa 미만, 더욱 바람직하게는 약 70 kDa 미만의 분자량을 갖는,
    단백질 스캐폴드.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서,
    상기 올리고머성 코어가,
    (i) 항체의 Fc 영역을 포함하지 않거나, 또는
    (ii) CH2 도메인을 포함하지 않거나, 또는
    (iii) CH3 도메인을 포함하지 않거나, 또는
    (iv) CH2 도메인 또는 CH3 도메인을 포함하지 않는, 단백질 스캐폴드.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서,
    상기 올리고머성 코어가 다량체 단백질의 가용성 다량체화(multimerising) 구조 요소를 포함하는, 단백질 스캐폴드.
  16. 제15항에 있어서,
    상기 다량체 단백질이 콜라겐 VIII NC1(비-콜라겐성(noncollagenous)) 도메인, 콜라겐 X NC1(비-콜라겐성) 도메인, C1q 헤드 도메인, CutA1 단백질, 대식세포 이동 억제 인자(MIF 또는 MIF-2), 종양 괴사 인자(TNF) 또는 이의 상동체(homolog) 또는 동종간 상동체(paralog)를 포함하는, 단백질 스캐폴드.
  17. 제15항 또는 제16항에 있어서,
    상기 다량체화 구조 요소가, 서열번호 1, 서열번호 2, 서열번호 3, 서열번호 19, 서열번호 29, 서열번호 60, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 42, 서열번호 31, 또는 서열번호 58에 대해 적어도 30% 또는 적어도 50%의 아미노산 동일성을 갖는 폴리펩타이드를 포함하는, 단백질 스캐폴드.
  18. 제1항 내지 제17항 중 어느 한 항에 따른 단백질 스캐폴드를 포함하는 단백질 복합체(protein complex)로서,
    제1 결합 부위는, 제1 효과기 모이어티(effector moiety)에 부착된 제1 폴리펩타이드 표적에 결합되고,
    제2 결합 부위는, 제2 효과기 모이어티에 부착된 제2 폴리펩타이드 표적에 결합된, 단백질 복합체.
  19. 제18항에 있어서,
    상기 제1 결합 부위/폴리펩타이드 표적 쌍 및 상기 제2 결합 부위/폴리펩타이드 표적 쌍이 각각 독립적으로 하기의 조합으로부터 선택되는, 단백질 복합체:
    (i) 서열번호 4, 6 또는 8 중 어느 하나와 서열번호 5, 7 또는 9 중 어느 하나;
    (ii) 서열번호 12와 서열번호 13 또는 15;
    (iii) 서열번호 5와 서열번호 11;
    (iv) 서열번호 15와 서열번호 16;
    (v) 서열번호 17과 서열번호 18; 또는
    (vi) 서열번호 23과 서열번호 16.
  20. 라이브러리를 포함하는 스크리닝 플랫폼(screening platform)으로서,
    상기 라이브러리는
    각각 제1 효과기 모이어티, 제2 효과기 모이어티 및/또는 올리고머성 코어의 상이한 조합을 포함하는, 제18항 또는 제19항에 따른 복수의 단백질 복합체 집단; 또는
    제1항 내지 제17항 중 어느 한 항에 따른 복수의 단백질 스캐폴드, 제1 결합 부위에 특이적으로 결합할 수 있는 복수의 제1 효과기 모이어티, 및 제2 결합 부위에 특이적으로 결합할 수 있는 복수의 제2 효과기 모이어티
    를 포함하는, 스크리닝 플랫폼.
  21. 치료 약물 또는 약물 유사체를 식별하는 방법으로서,
    제18항 또는 제19항에 따른 단백질 복합체를 제공하는 단계;
    상기 단백질 복합체를 생물학적 시스템과 접촉시키는 단계; 및
    상기 단백질 복합체가 상기 생물학적 시스템의 특성 기능에 목적하는 변화를 유도하는지 여부를 측정하는 단계
    를 포함하고, 임의로,
    상기 생물학적 시스템의 특성에 목적하는 변화를 유도하는 단백질 복합체를 선택하는 단계
    를 추가로 포함하는 방법.
  22. 제21항에 있어서,
    상기 단백질 복합체의 제1 및 제2 효과기 모이어티에 부착된 식별된 치료 약물 또는 약물 유사체의 단백질 복합체의 스캐폴드의 올리고머성 코어를 포함하는 치료 약물 또는 약물 후보를 합성하는 단계
    를 추가로 포함하는 방법.
  23. 제21항 또는 제22항의 방법에 따라 수득될 수 있거나 또는 수득된 치료 약물 또는 약물 후보.
  24. (a) 하나 이상의 제1 효과기 모이어티 및 하나 이상의 제2 효과기 모이어티에 부착된 복수의 서브유닛 단량체를 포함하는 올리고머성 코어로서, 상기 하나 이상의 제1 효과기 모이어티 및 상기 하나 이상의 제2 효과기 모이어티가 상기 올리고머성 코어의 동일 면 상에 위치하고; 여기서 (i) 상기 하나 이상의 제1 효과기 모이어티가 2개 이상의 제1 효과기 모이어티를 포함하고 상기 하나 이상의 제2 효과기 모이어티가 2개 이상의 제2 효과기 모이어티를 포함하고/하거나, (ii) 상기 올리고머성 코어가 항체 또는 항체 단편을 포함하지 않는, 올리고머성 코어; 또는
    (b) 하나 이상의 제1 효과기 모이어티 및 하나 이상의 제2 효과기 모이어티에 부착된 단량체성 폴리펩타이드로서, 상기 하나 이상의 제1 효과기 모이어티 및 상기 하나 이상의 제2 효과기 모이어티가 상기 단량체성 폴리펩타이드의 동일 면 상에 위치하고; 여기서 (i) 상기 하나 이상의 제1 효과기 모이어티가 2개 이상의 제1 효과기 모이어티를 포함하고 상기 하나 이상의 제2 효과기 모이어티가 2개 이상의 제2 효과기 모이어티를 포함하고/하거나, (ii) 상기 올리고머성 코어가 항체 또는 항체 단편을 포함하지 않는, 단량체성 폴리펩타이드
    를 포함하는 치료 약물 또는 약물 후보.
  25. 제24항에 있어서,
    상기 올리고머성 코어(a)가 제1항 내지 제17항 중 어느 한 항에 정의된 바와 같은 것인, 치료 약물 또는 약물 후보.
  26. 제24항 또는 제25항에 있어서,
    (a) (i) 각각의 상기 서브유닛 단량체가 콜라겐 VIII NC1(비-콜라겐성) 도메인, 콜라겐 X NC1(비-콜라겐성) 도메인, C1q 헤드 도메인, CutA1 단백질, 대식세포 이동 억제 인자(MIF 또는 MIF-2), 종양 괴사 인자(TNF) 또는 이의 상동체 또는 동종간 상동체를 포함하고/하거나; (ii) 각각의 서브유닛 단량체가, 서열번호 1, 서열번호 2, 서열번호 3, 서열번호 19, 또는 서열번호 29, 서열번호 60, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 42, 서열번호 31, 또는 서열번호 58에 대해 적어도 50%의 아미노산 동일성을 갖는 폴리펩타이드를 포함하는 다량체화 구조 요소를 포함하거나; 또는
    (b) 상기 단량체성 폴리펩타이드가 콜라겐 VIII NC1(비-콜라겐성) 도메인, 콜라겐 X NC1(비-콜라겐성) 도메인, C1q 헤드 도메인, CutA1 단백질, 대식세포 이동 억제 인자(MIF 또는 MIF-2), 종양 괴사 인자(TNF) 또는 이의 상동체 또는 동종간 상동체를 포함하는,
    치료 약물 또는 약물 후보.
  27. N 말단에 제1 결합 도메인 및 C 말단에 제2 결합 도메인을 포함하는 폴리펩타이드로서,
    상기 제1 및 제2 결합 도메인은 구조 도메인에 의해 분리되고,
    상기 제1 결합 도메인 및 상기 제2 결합 도메인은, 단일 세포에서 발현되거나 플레이트 또는 단일 비드상에 고정화될 때 그들의 표적에 결합할 수 있는, 폴리펩타이드.
  28. 제27항에 있어서,
    상기 구조 도메인이 CutA1, MIF 또는 MIF-2, TNF 또는 TNF-유사 단백질 TL1A 또는 CD40L, 또는 콜라겐 VIII 또는 콜라겐 X로부터의 NC1인, 폴리펩타이드.
  29. 제27항 또는 제28항에 있어서,
    상기 제1 결합 도메인 및 상기 제2 결합 도메인이 상이한 항원-결합 도메인이고,
    임의로, 상기 항원-결합 도메인 중 하나 또는 둘 다가 항체의 항원-결합 단편, 임의로 scFv 또는 Fab이거나, 또는 단일 도메인 항체(sdAb)이거나, 또는 특정 표적에 결합하도록 선택된 다른 항체 모방체(mimetics) 또는 스캐폴드이거나, 또는 생물학적 분자와 특이적으로 결합할 수 있는 다른 단백질 또는 펩타이드인, 폴리펩타이드.
  30. 제27항 또는 제28항에 있어서,
    상기 제1 결합 도메인 및 상기 제2 결합 도메인이 각각, 동족(cognate) 펩타이드와 이소펩타이드 결합을 형성할 수 있는 캐처(catcher) 도메인이고,
    임의로, 상기 제1 결합 도메인에 대한 동족 펩타이드가 상기 제2 결합 도메인에 대한 동족 펩타이드와 상이한, 폴리펩타이드.
  31. 제30항에 있어서,
    각각의 상기 동족 펩타이드가 항원-결합 도메인에 부착되고,
    임의로, 상기 동족 펩타이드 중 하나 또는 둘 다가 이소펩타이드 결합에 의해 제1 및/또는 제2 캐처 도메인에 연결되는, 폴리펩타이드.
  32. 제27항 내지 제31항 중 어느 한 항에 따른 폴리펩타이드를 2개 이상 포함하는 올리고머.
  33. 제27항 내지 제32항 중 어느 한 항에 있어서,
    상기 폴리펩타이드 또는 올리고머가 제1항 내지 제26항 중 어느 한 항의 특징을 포함하는, 폴리펩타이드 또는 올리고머.
KR1020237035825A 2021-03-24 2022-03-24 다가 단백질 및 스크리닝 방법 KR20230159855A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB2104104.1 2021-03-24
GBGB2104104.1A GB202104104D0 (en) 2021-03-24 2021-03-24 Platform and method
PCT/GB2022/050750 WO2022200804A2 (en) 2021-03-24 2022-03-24 Multivalent proteins and screening methods

Publications (1)

Publication Number Publication Date
KR20230159855A true KR20230159855A (ko) 2023-11-22

Family

ID=75689949

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237035825A KR20230159855A (ko) 2021-03-24 2022-03-24 다가 단백질 및 스크리닝 방법

Country Status (11)

Country Link
EP (1) EP4314042A2 (ko)
JP (1) JP2024511155A (ko)
KR (1) KR20230159855A (ko)
CN (1) CN117580858A (ko)
AU (1) AU2022242858A1 (ko)
BR (1) BR112023019401A2 (ko)
CA (1) CA3212924A1 (ko)
GB (2) GB202104104D0 (ko)
IL (1) IL306000A (ko)
MX (1) MX2023011231A (ko)
WO (1) WO2022200804A2 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024069180A2 (en) * 2022-09-28 2024-04-04 LiliumX Ltd. Multivalent proteins and screening methods

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5571894A (en) 1991-02-05 1996-11-05 Ciba-Geigy Corporation Recombinant antibodies specific for a growth factor receptor
US5587458A (en) 1991-10-07 1996-12-24 Aronex Pharmaceuticals, Inc. Anti-erbB-2 antibodies, combinations thereof, and therapeutic and diagnostic uses thereof
AU675929B2 (en) 1992-02-06 1997-02-27 Curis, Inc. Biosynthetic binding protein for cancer marker
DK0656946T4 (da) 1992-08-21 2010-07-26 Univ Bruxelles Immunoglobuliner uden lette kæder
ES2701445T3 (es) * 2010-10-15 2019-02-22 Leadartis S L Generación de complejos polipeptídicos multifuncionales y multivalentes mediante el dominio de trimerización del colágeno XVIII
GB201509782D0 (en) * 2015-06-05 2015-07-22 Isis Innovation Methods and products for fusion protein synthesis
WO2018185247A1 (en) * 2017-04-06 2018-10-11 Universität Stuttgart Tumor necrosis factor receptor (tnfr) binding protein complex with improved binding and bioactivity
GB201705750D0 (en) 2017-04-10 2017-05-24 Univ Oxford Innovation Ltd Peptide ligase and use therof
GB201706430D0 (en) 2017-04-24 2017-06-07 Univ Oxford Innovation Ltd Proteins and peptide tags with enhanced rate of spontaneous isopeptide bond formation and uses thereof
KR20200079536A (ko) * 2017-11-09 2020-07-03 메디뮨 엘엘씨 이중 특이성 융합 폴리펩티드 및 이의 사용 방법
US20200299358A1 (en) 2019-03-18 2020-09-24 Bio-Rad Abd Serotec Gmbh Antigen binding proteins
US20200299369A1 (en) * 2019-03-18 2020-09-24 Bio-Rad Abd Serotec Gmbh Antigen binding fragments conjugated to a plurality of fc isotypes and subclasses

Also Published As

Publication number Publication date
MX2023011231A (es) 2023-10-02
IL306000A (en) 2023-11-01
CA3212924A1 (en) 2022-09-29
EP4314042A2 (en) 2024-02-07
GB202316256D0 (en) 2023-12-06
WO2022200804A2 (en) 2022-09-29
GB2624541A (en) 2024-05-22
GB202104104D0 (en) 2021-05-05
AU2022242858A1 (en) 2023-09-28
WO2022200804A3 (en) 2022-11-03
JP2024511155A (ja) 2024-03-12
BR112023019401A2 (pt) 2023-12-05
CN117580858A (zh) 2024-02-20

Similar Documents

Publication Publication Date Title
JP7314356B2 (ja) 改変j鎖を有する結合分子
EP3253795B1 (en) Novel binding proteins comprising a ubiquitin mutein and antibodies or antibody fragments
US11845793B2 (en) Anti-ROR1 antibodies
JP6105479B2 (ja) 血清アルブミンに結合する設計リピートタンパク質
JP5877893B2 (ja) 融合ポリペプチドのアミノ酸配列およびその使用
AU2016295024B2 (en) Her2 binding proteins based on di-ubiquitin muteins
JP6738340B2 (ja) 新規なegfr結合タンパク質
JP2017522903A (ja) Cd127に対する抗体
KR20170139131A (ko) 단백질 정제 방법
JP2022512043A (ja) 合理的に設計された新規なタンパク質組成物
KR20230159855A (ko) 다가 단백질 및 스크리닝 방법
JP2023550191A (ja) Dr4および/またはdr5を標的とするポリペプチドならびに関連する組成物および方法
WO2024069180A2 (en) Multivalent proteins and screening methods
Fiedler et al. Non‐antibody scaffolds as alternative therapeutic agents
JP2017014112A (ja) 抗サバイビン抗体又は抗体誘導体及びそれらの利用
Zhang et al. Antibody mimetics, peptides, and peptidomimetics
Peeß et al. A novel epitope-presenting thermostable scaffold for the development of highly specific insulin-like growth factor-1/2 antibodies
US20230416345A1 (en) New type ii collagen binding proteins
AU2022397890A1 (en) Specific binding molecules for fibroblast activation protein (fap)
Mehta Investigation of VISTA as a Cancer Immune Checkpoint Via Structural Analysis and Therapeutic Antibody Development