KR20190050786A

KR20190050786A - 삼량체를 안정화하는 hiv 엔벨로프 단백질 돌연변이

Info

Publication number: KR20190050786A
Application number: KR1020197007592A
Authority: KR
Inventors: 루시 루텐; 다프네 트루안; 니카 민디 스트로카페; 조하네스 페트러스 마리아 랑게딕
Original assignee: 얀센 백신스 앤드 프리벤션 비.브이.
Priority date: 2016-09-15
Filing date: 2017-09-14
Publication date: 2019-05-13
Also published as: IL265186B; IL294832A; TWI742158B; AU2020267278B2; SG11201901206SA; TW201819401A; WO2018050747A1; SI3512543T1; PT3512543T; US11365222B2; IL265186A; DK3512543T3; JP2019534690A; LT3512543T; AU2017327672A1; HUE052008T2; PH12019500280A1; CN109689091A; BR112019004593A2; US20180072777A1

Abstract

엔벨로프 단백질의 삼량체 형태를 안정화시키는 돌연변이를 갖는 인간 면역결핍 바이러스 (HIV) 엔벨로프 단백질이 제공된다. HIV 엔벨로프 단백질은 엔벨로프 단백질 서열에서의 특정된 위치에서 특정 아미노산 치환을 갖는다. 본원에 개시된 HIV 엔벨로프 단백질은 표시된 아미노산 치환들 중 하나 이상의 치환을 갖지 않는 HIV 엔벨로프 단백질과 비교하여 개선된 삼량체 형성 백분율 및/또는 개선된 삼량체 수득량을 갖는다. HIV 엔벨로프 단백질을 코딩하는 핵산 분자 및 벡터와, HIV 엔벨로프 단백질, 핵산 및 벡터를 함유하는 조성물이 또한 제공된다.

Description

삼량체를 안정화하는 HIV 엔벨로프 단백질 돌연변이

인간 면역결핍 바이러스 (Human Immunodeficiency Virus, HIV)는 전 세계적으로 수백만 명의 사람에게서 발생하며, 광범위한 항레트로바이러스 치료 시대에서도 유효한 백신을 통한 HIV의 예방은 매우 높은 우선순위로 남아 있다. HIV 바이러스의 상이한 주 (strain)들 및 클레이드들 사이의 항원 다양성은 광범위한 효능을 갖는 백신의 개발을 어렵게 한다. HIV-1은 가장 일반적이고 병원성인 바이러스 주이며, 90%가 넘는 HIV/AIDS 사례가 HIV-1 그룹 M의 감염으로부터 유래된다. 그룹 M은 클레이드 또는 아형 (subtype)으로 추가 세분된다. 유효한 백신은 이상적으로는 강력한 세포 반응 및 상이한 클레이드로부터의 HIV-1 주를 중화할 수 있는 광범위 중화 항체 둘 다를 유도할 수 있을 것이다.

HIV 표면 상의 엔벨로프 단백질 스파이크 (엔벨로프 단백질 spike; Env)는 당단백질인 gp120 및 gp41의 이종이량체의 삼량체로 구성된다 (도 1a). 전구 단백질 gp160은 푸린에 의해 gp120 (이는 상기 스파이크의 헤드 (head)이며 CD4 수용체 결합 부위와, 큰 초가변 루프 (V1 내지 V5)를 포함함), 및 gp41 (이는 엔벨로프 단백질 스파이크의 막-고정된 스템 (stem)임)로 절단된다. 다른 클래스 I 융합성 단백질과 같이, gp41은 N-말단 융합 펩티드 (FP), C-말단 막관통 (TM) 도메인, 및 세포질 도메인을 함유한다. HIV와 표적 세포막 사이의 막 융합은 엔벨로프 단백질에서의 일련의 배좌 변화를 필요로 한다. HIV 백신은 엔벨로프 단백질을 기반으로 하여 개발될 수 있다.

그러나, HIV-1의 높은 유전적 변이성, 엔벨로프 단백질의 조밀한 탄수화물 코트, 및 엔벨로프 단백질 스파이크 구조의 상대적으로 동적이고 불안정한 성질을 포함하는 다양한 요인이 엔벨로프 단백질을 기반으로 하는 HIV 백신의 개발을 어렵게 만든다. 야생형 엔벨로프 단백질은 그의 기능으로 인하여 불안정하다. 따라서, 때때로 안정화 변형이 백신 후보 생성을 위하여 엔벨로프 구조 내에 도입된다. 엔벨로프 단백질은 중화 항체의 표적이며, 고도로 글리코실화되어 있는데, 이는 단백질 에피토프를 차폐함으로써 면역원성을 감소시킨다. 모든 공지된 광범위 중화 항체 (broadly neutralizing antibody; bNAb)는 이러한 글리칸을 수용하고 있다.

백신 개발에 있어서, bNAb를 유도할 수 있는 엔벨로프 단백질을 사용하는 것이 바람직하다. 그러나, 대부분의 bNAb는 단지 이것이 임의의 배좌 변화를 겪기 전의 천연 엔벨로프 단백질 배좌를 인식한다. 따라서, 비-천연이고 따라서 비-중화성인 에피토프의 제시를 최소화하면서 천연과 유사한 콤팩트한 폐쇄 배좌의 안정한 엔벨로프 단백질을 개발하는 것은 그러한 bNAb의 생성 효율을 개선시킬 수 있다. HIV 백신을 생성하려는 이전의 노력은 삼량체형 HIV 엔벨로프 단백질, gp140의 융합 전 엑토도메인을 함유하는 백신을 개발하는 것에 초점을 맞추었다. gp140은 막관통 (TM) 및 세포질 도메인을 갖지 않지만, gp120과는 달리 삼량체 구조를 형성할 수 있다. 게다가, 이러한 이전의 노력은 주로 클레이드 A에 초점을 맞추었다. 그러나, 유도된 중화 항체 반응의 폭은 여전히 한정되어 있다. 따라서, 다수의 HIV 클레이드에 대한 안정화 천연 엔벨로프 삼량체를 이용할 수 있다면 이것이 또한 유익할 것이다.

20년 넘게, 융합 전 삼량체 배좌의 안정한 엔벨로프 단백질을 개발하려는 시도가 이루어져 왔으며, 이때 광범위 중화 항체 반응을 유도할 수 있는 엔벨로프 단백질의 가용성의 안정한 삼량체의 생성은 단지 제한적으로 성공하였다. 예를 들어, 소위 SOSIP 돌연변이 (501C, 605C 및 559P)를 엔벨로프 단백질 서열 내로 도입하여 가용성 gp140 삼량체 분획의 형성을 개선시켰다 (문헌[Sanders et al., (2002), J. Virol.76(17): 8875-89]). 소위 SOSIP 돌연변이는 위치 501 및 605에서 시스테인 잔기, 및 위치 559에서 프롤린 잔기를 포함하며, 이는 본 분야에서 사용되는 통상적인 넘버링 스킴인, HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따른 것이다. 3차원 단백질 구조에서 서로 가까이 있는 위치 501 및 605에서의 상기 두 시스테인 잔기의 도입은 디술피드 가교체를 생성한다. SOSIP 돌연변이 엔벨로프 단백질, 예컨대 BG505_SOSIP 및 B41_SOSIP (SOSIP 돌연변이를 갖는 HIV 주 BG505 및 B41 (즉 9032-08.A1.4685) 주 유래의 엔벨로프 단백질)가 백신 연구에서 사용되었으며, 이들은 tier 2 자가 중화 Ab를 유도하는 것으로 밝혀졌다 (문헌[Sanders et al., Science(2015), 349(6224):139-140]).

그러나, 비록 소위 SOSIP 돌연변이가 엔벨로프 단백질의 삼량체 형태를 안정화시킬 수 있다 하더라도, 그러한 SOSIP 돌연변이체의 삼량체 분율은 대개 10% 미만이며, 이때 많은 양의 단량체 및 응집체가 여전히 생성된다. 심지어 SOSIP 돌연변이 BG505_SOSIP (이는 삼량체 형태를 안정화하는 능력 면에서 지금까지 공지된 가장 유망한 SOSIP 돌연변이 엔벨로프 단백질 중 하나임)는 전형적으로 단지 25% 이하의 삼량체 형태를 생성한다 (문헌[Julien et al., Proc . Nat. Acad . Sci . (2015), 112(38), 11947-52]). 게다가, 이러한 삼량체 분획에서, 삼량체는 첨부에서 숨을 쉬기 때문에 완전히 안정한 것은 아니다. 따라서, SOSIP 돌연변이에 더하여, 몇몇 추가 치환, 예컨대 E64K, A316W, 및 201C-433C가 첨부를 안정화하고 첨부가 숨쉬는 것을 방지하기 위하여 설계되었다 (문헌[de Taeye et al., Cell(2015), 163(7), 1702-15]; 문헌[Kwon et al., (2015) Nat.Struct. Mol. Biol. 22(7) 522-31].

따라서, 삼량체 형성 백분율이 향상되고/되거나, 삼량체 수득량이 향상되고/되거나 삼량체 안정성이 향상된 HIV 엔벨로프 단백질의 안정화 삼량체가 필요하다. 바람직하게는, HIV 엔벨로프 단백질의 그러한 안정화 삼량체는 또한 양호한 광범위 중화 항체 (bNAb)와의 결합성, 및 비-광범위 중화 Ab (비-bNAb)에 대한 상대적으로 제한된 결합성을 나타낸다. 향상된 삼량체 백분율, 및 바람직하게는 또한 향상된 삼량체 수득량을 갖는 HIV Env 단백질을 제공하는 것이 본 발명의 목적이다.

본 발명은 이전에 개시된 HIV 엔벨로프 삼량체와 비교하여 삼량체 형성 백분율이 향상되고/되거나 삼량체 수득량이 향상된, 상이한 클레이드 유래의 재조합 HIV 엔벨로프 단백질에 관한 것이다. 본원에 개시된 돌연변이에 의해 Env 폴딩이 최적화되고, 주-특이적 특징부가 복구되고, 융합 과정에 중요한 융합 전 폐쇄 배좌의 영역이 안정화된다. 이것은 융합 전 폐쇄 HIV-1 엔벨로프 삼량체의 폴딩 및 안정성을 최적화하기 위한 보편적 접근법을 제공한다. 생성된 안정하고 잘 폴딩된 HIV Env 삼량체는, 예를 들어 재조합 HIV Env 삼량체의 투여시에 비-중화 항체 및 약한 중화성의 항체의 유도의 감소 및 광범위 중화 항체의 유도 기회의 개선을 위한 면역화 목적에 유용하다. 또한 본 발명은 본 재조합 HIV 엔벨로프 단백질을 코딩하는 단리된 핵산 분자 및 벡터, 이를 포함하는 세포, 및 재조합 HIV 엔벨로프 단백질, 핵산 분자, 벡터, 및/또는 세포의 조성물에 관한 것이다.

일반적인 일 양태에서, 본 발명은 삼량체의 형성을 안정화하는, 식별된 위치에서 특정한 아미노산 잔기를 갖는 재조합 인간 면역결핍 바이러스 (HIV) 엔벨로프 단백질에 관한 것이다.

특정 실시 형태에서, 본 발명의 재조합 HIV 엔벨로프 (Env) 단백질은 하기로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 2개의 위치에서의 표시된 아미노산 잔기를 갖는 HIV Env 단백질의 아미노산 서열을 포함한다:

(i) 위치 651에서 Phe, Leu, Met, 또는 Trp;

(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp;

(iii) 위치 535에서 Asn 또는 Gln;

(iv) 위치 589에서 Val, Ile 또는 Ala;

(v) 위치 573에서 Phe 또는 Trp;

(vi) 위치 204에서 Ile; 및

(vii) 위치 647에서 Phe, Met, 또는 Ile

(여기서, 위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름). 바람직한 특정 실시 형태에서, 위치 651에서의 표시된 아미노산 잔기는 Phe이고/이거나; 위치 655에서의 표시된 아미노산 잔기는 Ile이고/이거나; 위치 535에서의 표시된 아미노산 잔기는 Asn이고/이거나; 위치 573에서의 표시된 아미노산 잔기는 Phe이다.

특정 실시 형태에서, 본 발명의 재조합 HIV Env 단백질은 HIV Env 단백질의 아미노산 서열 및 하기로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 하나에서의 표시된 아미노산 잔기에 의한 아미노산 치환을 포함한다:

(i) 위치 651에서 Phe, Leu, Met, 또는 Trp;

(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp;

(iii) 위치 535에서 Asn 또는 Gln;

(iv) 위치 589에서 Val, Ile 또는 Ala;

(v) 위치 573에서 Phe 또는 Trp;

(vi) 위치 204에서 Ile; 및

(vii) 위치 647에서 Phe, Met, 또는 Ile

(여기서, HIV Env 단백질은

(1) HIV Env 콘센서스 아미노산 서열로서, 예를 들어 클레이드 C 유래의 것 (예를 들어 서열 번호 2 또는 3의 아미노산 서열을 포함함) 또는 클레이드 B 유래의 것 (예를 들어 서열 번호 4 또는 5의 아미노산 서열을 포함함);

(2) 합성 HIV Env 단백질, 예를 들어 (a): 서열 번호 6의 아미노산 서열, 또는 (b):위치 166에서의 Glu의 Arg으로의 돌연변이를 갖는 서열 번호 6의 아미노산 서열, 또는 (c): 위치 501 및 605에서의 아미노산의 Cys 잔기로의 돌연변이 및 위치 559에서의 아미노산의 Pro 잔기로의 돌연변이를 갖는 (a) 또는 (b), 또는 (d): 추가의 푸린 절단 부위 돌연변이, 예를 들어 위치 508~511에서의 아미노산의RRRRRR (서열 번호 10)에 의한 대체를 갖는 (a), (b) 또는 (c), 또는 (e) 서열 번호 7, 또는 (f) 모자이크 Env 서열, 예컨대 서열 번호 8 또는 9의 아미노산 서열을 포함하는 Env를 포함하는 것; 및

(3) 적어도 100개, 바람직하게는 적어도 1000개, 바람직하게는 적어도 10000개의 야생형 HIV Env 서열들의 컬렉션(collection)에서의 HIV Env 서열의 7.5% 미만, 바람직하게는 2% 미만의 빈도로 상응하는 위치에서 발견되는 아미노산 잔기에서의 적어도 하나의 복구 돌연변이를 포함하는 모 HIV Env 단백질 (이는 바람직하게는 야생형 HIV Env 단백질, 바람직하게는 클레이드 C의 야생형 HIV Env 단백질임) (여기서, 복구 돌연변이는 상기 컬렉션에서의 HIV Env 서열의 적어도 10%의 빈도로 상응하는 위치에서 발견되는 아미노산 잔기에 의한 치환이며, 바람직하게는 복구 돌연변이는 상기 컬렉션에서 가장 빈번하게 상응하는 위치에서 발견되는 아미노산 잔기에 의한 치환임)로 이루어진 군으로부터 선택되며;

위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름). 바람직한 특정 실시 형태에서, 위치 651에서의 표시된 아미노산 잔기는 Phe이고/이거나; 위치 655에서의 표시된 아미노산 잔기는 Ile이고/이거나; 위치 535에서의 표시된 아미노산 잔기는 Asn이고/이거나; 위치 573에서의 표시된 아미노산 잔기는 Phe이다.

(i) 위치 651에서 Phe, Leu, Met, 또는 Trp;

(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp;

(iii) 위치 535에서 Asn 또는 Gln;

(iv) 위치 589에서 Val, Ile 또는 Ala;

(v) 위치 573에서 Phe 또는 Trp;

(vi) 위치 204에서 Ile; 및

(vii) 위치 647에서 Phe, Met, 또는 Ile

(여기서, HIV Env 단백질은

(a) 위치 501 및 605에서의 Cys;

(b) 위치 559에서의 Pro; 및

(c) 위치 501 및 605에서의 Cys 및 위치 559에서의 Pro로 이루어진 군으로부터 선택되는 표시된 위치에서의 표시된 아미노산 잔기(들)로 이어지는 적어도 하나의 돌연변이를 포함하는 SOSIP 돌연변이 HIV Env 단백질이며;

위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름). 바람직한 특정 실시 형태에서, 위치 651에서의 표시된 아미노산 잔기는 Phe이며; 위치 655에서의 표시된 아미노산 잔기는 Ile이며; 위치 535에서의 표시된 아미노산 잔기는 Asn이며; 위치 573에서의 표시된 아미노산 잔기는 Phe이다.

다른 실시 형태에서, 본 발명의 재조합 HIV Env 단백질은 하기로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 하나에서의 표시된 아미노산 잔기를 추가로 포함한다:

(viii) 위치 588에서 Gln, Glu, Ile, Met, Val, Trp 또는 Phe, 바람직하게는 Gln 또는 Glu;

(ix) 위치 64에서 Lys, 또는 위치 66에서 Arg, 또는 위치 64에서 Lys 및 위치 66에서 Arg;

(x) 위치 316에서 Trp;

(xi) 위치 201 및 433 둘 다에서 Cys;

(xii) 위치 556에서 Pro, 또는 위치 558에서 Pro, 또는 위치 556 및 558에서 Pro;

(xiii) 7~10개의 아미노산을 갖는 루프, 바람직하게는 8개 아미노산의 루프, 예를 들어 (서열 번호 12~17) 중 어느 하나로부터 선택되는 서열을 갖는 루프에 의한 아미노산 위치 548~568에서의 루프 (HR1-루프)의 대체;

(xiv) 위치 568에서 Gly, 또는 위치 569에서 Gly, 또는 위치 636에서 Gly, 또는 위치 568 및 636 둘 다에서 Gly, 또는 위치 569 및 636 둘 다에서 Gly; 및/또는

(xv) 위치 302에서 Tyr, 또는 위치 519에서 Arg, 또는 위치 520에서 Arg, 또는 위치 302에서 Tyr 및 위치 519에서 Arg, 또는 위치 302에서 Tyr 및 위치 520에서 Arg, 또는 위치 302에서 Tyr 및 위치 519 및 520 둘 다에서 Arg.

특정 실시 형태에서, 본 발명의 재조합 HIV Env 단백질은 HIV Env 단백질의 푸린 절단 서열에서의 돌연변이, 예컨대 RRRRRR (서열 번호 10)에 의한 위치 508~511에서의 대체를 추가로 포함한다.

일 실시 형태에서, 재조합 HIV Env 단백질은 gp140 단백질이다.

또 다른 실시 형태에서, 재조합 HIV Env 단백질은 gp160 단백질이다.

특정 실시 형태에서, 재조합 HIV Env 단백질은 세포질 영역 내에서, 예를 들어 세포질 영역의 7개 아미노산 뒤에서 절두된다.

또 다른 일반 양태에서, 본 발명은 본원에 개시된 3가지의 임의의 재조합 HIV Env 단백질의 비공유적 올리고머를 포함하는 삼량체성 복합체에 관한 것이다.

모 HIV Env 단백질의 폴딩 및 안정성 (증가된 삼량체 백분율 및/또는 삼량체 수득량으로서 측정됨)을 개선시키는 방법을 제공하는 것이 본 발명의 또 다른 일반 양태이며, 본 방법은 모 HIV Env 단백질 내에 적어도 하나의 복구 돌연변이, 바람직하게는 적어도 3개의 복구 돌연변이를 도입함으로써 모 HIV Env 단백질의 아미노산 서열을 복구하는 단계를 포함하고, 여기서, 복구 돌연변이는 적어도 100개, 바람직하게는 적어도 500개, 바람직하게는 적어도 1000개, 바람직하게는 적어도 10000개의 야생형 HIV Env 서열들의 컬렉션에서 HIV Env 서열의 7.5% 미만, 바람직하게는 2% 미만의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에서의 아미노산 치환이며, 상기 치환은 상기 컬렉션에서 HIV Env 서열의 적어도 10%의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에 의한 것이고, 바람직하게는 상기 치환은 상기 컬렉션에서 가장 빈번하게 상응하는 위치에 존재하는 아미노산 잔기에 의한 것이다. 또한 본 발명은 HIV Env 단백질의 폴딩 및 안정성 (삼량체 백분율 및/또는 삼량체 수득량으로서 측정됨)을 개선시키기 위한 본 발명의 상기 방법에 의해 수득가능한 복구 HIV Env 단백질을 제공한다. 또한 본 발명은 상기 복구 HIV Env 단백질을 포함하는 제약 조성물을 제공한다. 또한 본 발명은 HIV Env 단백질의 생성 방법을 제공하며, 이는 본원에 개시된 HIV Env 단백질을 복구하고, 복구 안정화 HIV Env 단백질을 코딩하는 핵산을 재조합 숙주 세포에서 발현시키는 방법을 포함한다.

또 다른 일반 양태에서, 본 발명은 서열 번호 2의 아미노산 서열과 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 포함하는 재조합 HIV Env 단백질에 관한 것이며, 여기서, 바람직하게는 위치 204, 535, 573, 589, 647, 651, 및 655, 및 바람직하게는 추가 위치 64, 66, 201, 316, 433, 501, 508~511, 556, 558, 559, 588, 548~568 및 605는 동일성%를 결정할 때 고려되지 않고, 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따른다. 이의 특정 실시 형태에서, 재조합 HIV Env 단백질은 서열 번호 3의 아미노산 서열과 적어도 98%, 99% 또는 100% 동일한 아미노산 서열을 포함하며, 여기서, 바람직하게는 위치 204, 535, 573, 589, 647, 651, 및 655, 및 바람직하게는 추가 위치 64, 66, 201, 316, 433, 508~511, 556, 558, 588, 및 548~568은 동일성%를 결정할 때 고려되지 않고, 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따른다.

또 다른 일반 양태에서, 본 발명은 서열 번호 4의 아미노산 서열과 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 포함하는 재조합 HIV Env 단백질에 관한 것이며, 여기서, 바람직하게는 위치 204, 535, 573, 589, 647, 651, 및 655, 및 바람직하게는 추가 위치 64, 66, 201, 316, 433, 501, 508~511, 556, 558, 559, 588, 548~568 및 605는 동일성%를 결정할 때 고려되지 않고, 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따른다. 이의 특정 실시 형태에서, 재조합 HIV Env 단백질은 서열 번호 5의 아미노산 서열과 적어도 98%, 99% 또는 100% 동일한 아미노산 서열을 포함하며, 여기서, 바람직하게는 위치 204, 535, 573, 589, 647, 651, 및 655, 및 바람직하게는 추가 위치 64, 66, 201, 316, 433, 508~511, 556, 558, 588, 및 548~568은 동일성%를 결정할 때 고려되지 않고, 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따른다.

이러한 양태 및 실시 형태에서, 동일성%의 결정에 있어서 고려되지 않는 표시된 위치에서의 아미노산들 중 하나 이상은 바람직하게는 본원에서 바람직한 것으로 표시된 아미노산, 예를 들어 위치 204에서의 Ile; 위치 651에서의 Phe, Ala, Leu, 또는 Trp 등으로부터 선택된다 (하기 표 1 및 표 2 참조).

또 다른 일반 양태에서, 본 발명은 서열 번호 2, 3, 4, 5, 20, 22, 24, 26, 27, 28, 29, 30, 31, 또는 32 중 어느 하나의 아미노산 서열과 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 포함하는 재조합 HIV Env 단백질에 관한 것이며, 여기서, 서열 번호 20, 22, 24, 26, 27, 28, 29, 30, 31, 또는 32가 특히 바람직하다. 이 양태에서, 바람직하게는 위치 204, 535, 573, 589, 647, 651, 655, 및 658 및 바람직하게는 추가 위치 64, 66, 201, 316, 433, 508~511, 556, 558, 588, 및 548~568은 동일성%를 결정할 때 고려되지 않고, 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따른다. 또한 이 양태에서, 동일성% 결정에 고려되지 않는 표시된 위치에서의 아미노산들 중 하나 이상은 바람직하게는 표 1의 (i)~(vii), 표 2의 (viii)~(xv), 및/또는 표 1의 (xvi)에서 본원에서 바람직한 것으로 표시된 아미노산, 예를 들어 위치 204에서의 Ile; 위치 651에서의 Phe, Leu, Met, 또는 Trp 등으로부터 선택된다.

또 다른 일반 양태에서, 본 발명은 표면 상에 본 발명의 재조합 HIV Env 단백질을 디스플레이하는 입자, 바람직하게는 리포좀 또는 나노입자, 예를 들어 자가-조립 나노입자에 관한 것이다.

또 다른 일반 양태에서, 본 발명은 본 발명의 재조합 HIV Env 단백질을 코딩하는 단리된 핵산 분자 및 프로모터에 작동가능하게 연결된 단리된 핵산 분자를 포함하는 벡터에 관한 것이다. 일 실시 형태에서, 벡터는 바이러스 벡터이다. 또 다른 실시 형태에서, 벡터는 발현 벡터이다. 바람직한 일 실시 형태에서, 바이러스 벡터는 아데노바이러스 벡터이다.

또 다른 일반 양태는 본 발명의 재조합 HIV Env 단백질을 코딩하는 단리된 핵산 분자 또는 벡터를 포함하는 숙주 세포에 관한 것이다. 그러한 숙주 세포는 재조합 단백질 생성, 재조합 단백질 발현, 또는 바이러스 입자 생성에 사용될 수 있다.

또 다른 일반 양태는 재조합 HIV Env 단백질의 생성 방법에 관한 것이며, 이는 본 발명의 재조합 HIV Env 단백질을 코딩하는 단리된 핵산 분자 또는 벡터를 포함하는 숙주 세포를 재조합 HIV Env 단백질의 생성에 적합한 조건 하에 성장시키는 단계를 포함한다.

또 다른 일반 양태는 재조합 HIV Env 단백질, 삼량체성 복합체, 단리된 핵산 분자, 벡터, 또는 숙주 세포 (본원에 개시된 바와 같음), 및 제약상 허용가능한 담체를 포함하는 조성물에 관한 것이다.

전술한 요약뿐 아니라, 다음의 발명의 상세한 설명은 첨부된 도면과 함께 읽을 때 더 잘 이해될 것이다. 본 발명은 도면에 나타낸 정확한 실시 형태에 한정되지 않음이 이해되어야 한다.
도면에서,
도 1a 및 도 1b는 HIV 엔벨로프 (Env) 단백질의 구조의 개략도를 나타내며;
도 1a는 전장 HIV Env 단백질을 나타내며;
도 1b는 소위 SOSIP 돌연변이 및 잔기 664 (HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름 (SOSIP.644 서열))에서 시작되는 C-말단 절두를 포함하는 가용성 HIV Env 단백질을 나타내며;
도 2a 및 도 2b는 실시예 3에서 설명된 바와 같이 AlphaLISA 분석법에 의해 측정할 경우 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질에 있어서의 삼량체 형성 백분율 (도 2a) 및 삼량체 수득량 (도 2b)을 나타내며; 테스트한 재조합 HIV Env 단백질은 백본 HIV Env 콘센서스 클레이드 C 서열 ConC_SOSIP (서열 번호 3) 내에 도입된 단일, 이중 또는 삼중 아미노산 치환을 포함하였으며; 삼량체 백분율 및 삼량체 수득량은 삼량체 특이적 단클론 항체 (mAb) PGT145가 각각의 재조합 HIV Env 단백질에 결합하는 것을 기반으로 하여 결정되었으며; 각각의 본 발명의 재조합 HIV Env 단백질에 있어서의 삼량체 수득량 및 삼량체 백분율은 본원에 개시된 임의의 추가 삼량체 안정화 돌연변이를 포함하지 않는 백본 ConC_SOSIP 서열을 갖는 엔벨로프 단백질의 것과 비교되며;
도 3은 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질의 다중각 광산란을 이용한 크기 배제 크로마토그래피 (SEC-MALS)로부터의 크로마토그램을 나타내며; 테스트한 재조합 HIV Env 단백질은 백본 HIV Env 콘센서스 클레이드 C 서열 ConC_SOSIP (서열 번호 3) 내로 도입된 단일 아미노산 치환을 포함하고, 실시예 2에서 설명된 바와 같이 렉틴 친화성 크로마토그래피로 정제되었으며; SEC-MALS 분석은 실시예 3에서 설명된 바와 같이 수행되었고; 삼량체 형태에 상응하는 피크는 각각의 크로마토그램에 표시되어 있으며;
도 4는 열처리 후 잔존하는 삼량체의 백분율로 보고된 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질의 열안정성을 나타내며; 테스트한 재조합 HIV Env 단백질은 백본 HIV Env 콘센서스 클레이드 C 서열 ConC_SOSIP (서열 번호 3) 내로 도입된 단일, 이중 또는 삼중 아미노산 치환을 포함하였으며; 재조합 HIV Env 단백질은 열처리되었고, 열처리 후 잔존하는 삼량체의 백분율은 AlphaLISA 분석법에 의해 결정되었으며 (실시예 4에서 설명된 바와 같음); 임의의 추가의 삼량체 안정화 돌연변이를 포함하지 않는 백본 ConC_SOSIP 서열을 갖는 엔벨로프 단백질의 열안정성이 또한 예시되어 있으며;
도 5a~도 5b는 본 발명의 실시 형태에 따른 백본 HIV Env 콘센서스 클레이드 B 서열 ConB_SOSIP (서열 번호 5) 내로 도입된 단일 아미노산 치환을 갖는 재조합 HIV Env 단백질에 있어서의 삼량체 형성 백분율 (도 5a) 및 삼량체 수득량 (도 5b)을 본 발명의 임의의 추가의 삼량체 안정화 돌연변이를 포함하지 않는 백본 ConB_SOSIP 서열을 갖는 엔벨로프 단백질의 것과 비교하여 나타내며 (이는 실시예 5에서 설명된 바와 같음); 삼량체 수득량 및 삼량체 형성 백분율은 AlphaLISA 분석법에 의해 측정되었고;
도 6a~도 6b는 실시예 6에서 설명된 바와 같이 본 발명의 실시 형태에 따른 백본 합성 HIV 엔벨로프 단백질 서열 DS_sC4_SOSIP_E166R 내로 도입된 아미노산 치환을 갖는 재조합 HIV Env 단백질에 있어서의 삼량체 형성 백분율 및 삼량체 수득량을 나타내며; 삼량체 형성 백분율 및 삼량체 수득량은 AlphaLISA 분석법으로 측정되었다.
도 7은 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질의 다중각 광산란을 이용한 크기 배제 크로마토그래피 (SEC-MALS)로부터의 크로마토그램을 나타내며; 테스트한 재조합 HIV Env 단백질은 각각의 다음 변이체 내에서의 단일 K655I 돌연변이 및 백본 HIV Env 콘센서스 클레이드 C 서열 ConC_SOSIP (서열 번호 3) 내로 도입된 추가 돌연변이를 포함하고, 실시예 2에서 설명된 바와 같이 렉틴 친화성 크로마토그래피로 정제되었으며; SEC-MALS 분석은 실시예 3에서 설명된 바와 같이 수행되었고; ConC_SOSIP에서의 gp140 단량체를 나타내는 피크는 삼량체 피크의 우측에 음영 처리된 박스로 표시되어 있다. 하부 패널은 각각의 추가 돌연변이가 gp140 단량체 피크의 높이의 추가 감소를 야기함을 관찰할 수 있도록 그래프의 하부에의 줌인을 나타낸다.
도 8a~도 8b는 본 발명의 실시 형태에 따른 도입된 치환들의 조합 및 단일 아미노산 치환을 갖는 BG505_SOSIP (야생형 클레이드 A 주로부터 유래됨)에 있어서의 삼량체 형성 백분율 (도 8a) 및 삼량체 수득량 (도 8b)을 실시예 9에서 설명된 바와 같이 본 발명의 임의의 추가의 삼량체 안정화 돌연변이를 포함하지 않는 백본 BG505_SOSIP 서열을 갖는 엔벨로프 단백질의 것과 비교한 것을 나타낸다. 삼량체 수득량 및 삼량체 형성 백분율은 AlphaLISA 분석법으로 측정되었다.
도 9는 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질의, 다중각 광 산란을 이용한 크기 배제 크로마토그래피 (SEC-MALS) 분석으로부터의 크로마토그램을 나타내며; SEC-MALS 분석은 Env 형질감염 세포의 배양 상청액에서 수행되었다. 삼량체 형태에 상응하는 피크는 7분과 7.5분 사이에 용출된다. 짙은 회색 선은 BG505_SOSIP (야생형 클레이드 A 주로부터 유래됨)이며, 연한 회색 선은 L556P, K655I, M535N, N651F, D589V, K588E 치환을 포함하는 BG505_SOSIP이다.
도 10a~도 10b는 실시예 10에서 설명된 C97ZA_SOSIP 변이체에 있어서의 삼량체 수득량을 나타낸다. 3개의 안정화 치환 (L556P, T651F 및 M535N)을 포함하는 C97ZA의 삼량체 수득량 (도 10a 및 도 10b). 도 10b에서, Env 서열은 도 12에 설명된 개념적 프레임워크에 따른 C97ZA Env 서열의 복구를 위하여 부가된 추가 돌연변이에 의해, 그리고 추가 안정화 치환 (K655I, D589V, A204I 및 K588E)의 도입에 의해 추가로 최적화되었다. 삼량체 수득량 및 삼량체 형성 백분율은 AlphaLISA 분석법으로 측정되었다. 신호는 1로 설정된 ConC_SOSIP 신호에 대하여 정규화되었다. PNGS는 잠재적인 N-글리코실화 부위이다.
도 11. 4개의 안정화 치환을 포함하는 HIV-1 Env 주 Du422의 삼량체 수득량 (상세 사항에 대해서는 실시예 11 참조). 모든 수는 1로 설정된 ConC_SOSIP (예시되지 않음)에 대하여 정규화되었다.
도 12. HIV-1 Env 서열의 복구에 대한 보편적 개념이 주 C97ZA에 대하여 예시되었다. 전체 HIV-1 데이터베이스 (상부 막대) 및 주 C97ZA 잔기 (하부 막대)에서 최고 출현 빈도를 갖는 잔기 (본원에서 ‘콘센서스 잔기’로 칭해짐)는 C97ZA 잔기 위치의 낮은 출현 백분율로부터 높은 출현 백분율로 분류되었다. 콘센서스 잔기로 치환될 C97ZA 서열 위치는 하기 기준을 기반으로 하여 선택되었다: Env 데이터베이스 서열에서 2% 미만으로 출현하는 C97ZA 잔기에서의 위치 (흑색 막대). Env 데이터베이스 서열에서 2% 내지 7.5%로 출현하고 묻혀 있거나 부분적으로 묻혀 있는 C97ZA 잔기에서의 위치 (짙은 회색 막대). 친수성 콘센서스 잔기 및 C97ZA에서 소수성이고 노출되어 있는 위치 (2개의 가장 연한 회색 막대) 및 잠재적인 N-글리코실화 부위 (PNGS) 콘센서스 잔기 (S234N)인 위치.
도 13. 서열 복구 및 돌연변이 안정화를 통한 융합전 폐쇄 HIV ENV_SOSIP 삼량체. 광범위 중화 항체에 있어서의 ConC_SOSIP에 대하여 정규화된 모든 SOSIP 변이체에 있어서의 세포 배양 상청액에서의 AlphaLISA 신호.
도 14. 대조 Env_SOSIP 변이체 (백본 SOSIP), 실시예 12 및 도 12에 설명된 개념에 다른 복구된 Env 변이체, 및 추가의 안정화 치환을 갖는 Env 변이체 (표 3에 다름, 형질감염 후 세포 배양 상청액을 사용)의 분석용 SEC 프로파일. 세포 배양 상청액의 모크(mock) 신호는 모든 프로파일로부터 차감되었다. 삼량체 피크는 *로 표시된다.
도 15. 안정화 SOSIP 변형을 포함하지 않는 HIV-1 Env ConC 변이체의 삼량체 수득량.
도 16. 위치 589, 647, 651 및 655에서 메티오닌으로의 돌연변이를 갖는 ConC_SOSIP의 삼량체 수득량 (도 16a) 및 삼량체 백분율 (16b). 모든 수는 1로 설정된 ConC_SOSIP (예시되지 않음)에 대하여 정규화되었다. 에러 바는 막대들의 우측 말단에 나타낸다.
도 17a~17d는 AlphaLISA 분석법으로 측정된, 실시예 15에서 설명된 바와 같이 표시된 돌연변이를 갖는 재조합 HIV Env 단백질에 있어서의 삼량체 형성 백분율 (도 17a, 17b; 상이한 실험들에 대하여) 및 삼량체 수득량 (도 17c, 17d; 상이한 실험들에 대하여)을 나타낸다.
도 18은 실시예 15에서 설명된 바와 같이, 표시된 돌연변이를 갖는 재조합 HIV Env 단백질의 SEC-MALS 크로마토그램을 나타낸다.

다양한 간행물, 논문 및 특허가 [배경기술] 및 명세서 전체에 걸쳐 인용되거나 기술되며; 각각의 이러한 참고문헌은 그 전체가 본원에 참고로 포함된다. 본 명세서에 포함된 문헌, 행동, 물질, 장치, 물품 등의 논의는 본 발명의 맥락을 제공하는 목적을 위한 것이다. 이러한 논의는 임의의 또는 전부의 이들 대상이 개시되거나 청구되는 임의의 발명에 대해 선행 기술의 일부를 형성한다고 인정하는 것이 아니다.

달리 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학 용어는 본 발명과 관련된 분야의 당업자에게 통상적으로 이해되는 것과 동일한 의미를 갖는다. 다르게는, 본원에서 사용되는 특정 용어는 명세서에 제시되는 의미를 갖는다. 본원에서 인용되는 모든 특허, 공개된 특허 출원 및 공보는 마치 본원에 전체가 제시된 것처럼 참고로 포함된다. 본원에서 그리고 첨부된 청구범위에서 사용되는 단수형 "a", "an", 및 "the"는 문맥상 명확히 달리 기재되지 않는 한 복수의 언급 대상을 포함한다는 것이 주목되어야 한다.

달리 기재되지 않는 한, 본원에 기술되는 농도 또는 농도 범위와 같은 임의의 수치는 모든 경우에 "약"이라는 용어로 수식되는 것으로 이해될 것이다. 따라서, 수치는 전형적으로 열거된 값의 ±10%를 포함한다. 본원에서 사용되는 바와 같이, 수치 범위의 사용은 문맥상 명백히 달리 지시되지 않는 한, 이러한 범위 내의 정수 및 소수값을 포함하는, 그 범위 내의 모든 가능한 하위범위, 모든 개별 수치를 명확히 포함한다.

아미노산이 본 개시 내용 전체에 걸쳐 언급된다. 20가지의 천연 발생 아미노산과, 많은 천연 비-발생 아미노산이 있다. 천연 및 비-천연 아미노산 둘 다를 포함하는 각각의 공지된 아미노산은 전체 이름, 축약형 1문자 코드, 및 축약형 3문자 코드를 가지며, 이들 전부는 당업자에게 잘 알려져 있다. 예를 들어, 20가지의 천연 발생 아미노산에 사용되는 축약형 3문자 및 1문자 코드는 하기와 같다: 알라닌 (Ala; A), 아르기닌 (Arg; R), 아스파르트산 (Asp; D), 아스파라긴 (Asn; N), 시스테인 (Cys; C), 글리신 (Gly; G), 글루탐산 (Glu; E), 글루타민 (Gln; Q), 히스티딘 (His; H), 이소류신 (Ile; I), 류신 (Leu; L), 라이신 (Lys; K), 메티오닌 (Met; M), 페닐알라닌 (Phe; F), 프롤린 (Pro; P), 세린 (Ser; S), 트레오닌 (Thr; T), 트립토판 (Trp; W), 타이로신 (Tyr; Y) 및 발린 (Val; V). 아미노산은 그의 전체 이름, 축약형 1문자 코드, 또는 축약형 3문자 코드로 지칭될 수 있다.

문맥상 명확히 달리 기재되지 않는 한, 본원에서 사용되는 바와 같이, HIV 엔벨로프 단백질의 아미노산 서열에서의 위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따르며, 이는 예를 들어 문헌[Korber et al. (Human Retroviruses and AIDS 1998: A Compilation and Analysis of Nucleic Acid and Amino Acid Sequences. Korber et al., Eds. Theoretical Biology and Biophysics Group, Los Alamos National Laboratory, Los Alamos, N. Mex.)]에 기재된 바와 같은데, 상기 문헌은 본원에 그 전체가 참고로 포함된다. HXB2에 따른 넘버링은 HIV Env 단백질 분야에서 통상적인 것이다. HIV-1 단리체 HXB2의 gp160은 서열 번호 1로 나타낸 아미노산 서열을 갖는다. 이 서열과 관심 HIV Env 서열의 정렬을 이용하여 상기 관심 서열에서의 상응하는 아미노산 넘버링을 찾을 수 있다.

“~으로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 하나에서의 표시된 아미노산 잔기를 갖는 HIV Env 단백질의 아미노산 서열을 포함하다”라는 어구 및 “하기 (아미노산 잔기들) 중 하나 이상을 포함하다”라는 어구는 본원에서 상호교환가능하게 사용된다.

용어 “서열 동일성 퍼센트 (%)” 또는 “동일성 %”는 전장의 아미노산 서열을 구성하는 아미노산 잔기의 수와 비교하여 둘 이상의 정렬된 아미노산 서열 중 동일한 아미노산의 매치 (“히트 (hit)”)의 수를 설명한다. 다른 말로 하면, 정렬을 이용하면, 둘 이상의 서열에 있어서, 서열들을 본 기술 분야에 공지된 바와 같은 서열 비교 알고리즘을 이용하여 측정할 경우 최대 상응도를 위하여 비교 및 정렬할 때, 또는 수동으로 정렬하고 시각적으로 점검할 때, 동일한 아미노산 잔기의 백분율 (예를 들어 95%, 97% 또는 98%의 동일성)이 결정될 수 있다. 따라서 서열 동일성을 결정하기 위하여 비교되는 서열들은 아미노산의 치환(들), 부가(들) 또는 결실(들)이 다를 수 있다. 단백질 서열 정렬에 적합한 프로그램은 당업자에게 공지되어 있다. 단백질 서열의 서열 동일성 백분율은 예를 들어 CLUSTALW, Clustal Omega, FASTA 또는 BLAST와 같은 프로그램을 이용하여, 예를 들어 NCBI BLAST 알고리즘을 이용하여 결정될 수 있다 (문헌[Altschul SF, et al (1997), Nucleic Acids Res. 25:3389-3402]).

본원에서 사용되는 바와 같이, ‘HIV Env 서열들의 컬렉션’은 동일 클레이드 (예를 들어 클레이드 C)로부터 또는 상이한 클레이드들 (예를 들어 클레이드 A, B, C 등)로부터 유래될 수 있는 야생형 HIV Env 단백질의 대표적인 수 (예를 들어 적어도 100개, 또는 500개, 또는 1000개, 또는 이보다 더 많은 수)의 랜덤 서열들의 컬렉션이다. 그러한 서열의 적합한 컬렉션은 데이터베이스에서 이용가능하거나, 하위컬렉션이 이로부터, 예를 들어 HIV 서열 데이터베이스 (Los Alamos National Laboratory)로부터 추출될 수 있다. 그러한 컬렉션은 바람직하게는 적어도 100개의 HIV Env 단백질 서열, 1000개의 HIV Env 단백질 서열, 적어도 10000개의 HIV Env 단백질 서열, 적어도 50000개의 HIV Env 단백질 서열을 포함하며, 90000개 초과의 HIV Env 단백질 서열을 포함할 수 있다.

HIV Env 단백질에서 ‘상응하는 위치’는 적어도 2개의 HIV Env 서열을 정렬할 때의 아미노산 잔기의 위치를 지칭한다. 달리 표시되지 않는 한, 본 분야에서 관례적인 바와 같이, 이러한 목적을 위한 아미노산 위치 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따른다.

본원에서 사용되는 바와 같이, ‘안정화 돌연변이’는 본원에서 표 1의 임의의 엔트리 (i)~(vii), 또는 (xvi), 또는 표 2의 (viii)~(xv)에서 설명된 바와 같은 돌연변이이며, 이는 HIV Env 단백질의 삼량체 백분율 및/또는 삼량체 수득량 (이는 본원에서 설명된 AlphaLISA 또는 SEC-MALS 분석법에 따라 측정될 수 있음)을 모 분자와 비교하여 증가시킨다 (돌연변이가 상기 모 분자에서 상응하는 아미노산의 치환에 의해 도입되는 경우). 그러한 안정화 돌연변이에 의해 생긴 아미노산은 전형적으로, 야생형 HIV 단리체의 Env 단백질에서는 발견된다고 하더라도 드물게 발견된다.

본원에서 사용되는 바와 같이, ‘복구 돌연변이’는 모 HIV Env 단백질에서의 아미노산 잔기의 치환이며 (상기 아미노산 잔기는 HIV Env 단백질 서열들의 컬렉션에서 상응하는 위치에서 7.5% 미만, 바람직하게는 2% 미만으로 존재함), 여기서, 치환은 상기 컬렉션에서 상응하는 위치에서 더 빈번하게, 예를 들어 상기 컬렉션에서 HIV Env 단백질의 적어도 10%로 존재하는 아미노산에 의한 것이며, 바람직하게는 HIV Env 단백질의 적어도 20%에서 상기 컬렉션에서 상응하는 위치에 존재하거나 상기 컬렉션에서 상응하는 위치에서 가장 빈번하게 출현하는 아미노산인 아미노산에 의한 것이다. 따라서 그러한 복구 돌연변이에서 생긴 아미노산은 전형적으로, 상대적으로 높은 백분율의 야생형 HIV 단리체의 Env 단백질에서 발견되며, 몇몇 경우 콘센서스 HIV Env 서열에서 상응하는 위치에서의 것과 동일할 수 있다.

본원에서 사용되는 바와 같이, ‘복구되고 안정화된’ HIV Env 서열은 전형적으로, 모 HIV Env 서열과 비교하여 적어도 하나의 복구 돌연변이 및 적어도 하나의 안정화 돌연변이, 바람직하게는 다수의 복구 돌연변이 및 다수의 안정화 돌연변이를 포함한다.

용어 ‘천연’ 또는 ‘야생형’은, HIV 주 (또는 이로부터 유래된 Env 단백질)를 지칭할 때 본원에서 상호교환가능하게 사용되며, 자연에서, 예를 들어 HIV-감염 환자에서 나타나는 HIV 주 (또는 이로부터 유래된 Env 단백질)를 지칭한다.

일반적으로 본 발명은 엔벨로프 단백질 서열에서 표시된 위치에서 특정 아미노산 치환을 포함하는 재조합 HIV 엔벨로프 (Env) 단백질에 관한 것으로서, 상기 치환은 엔벨로프 단백질의 삼량체 형태를 안정화한다. 본 발명의 확인된 아미노산 치환들 중 하나 이상을 HIV 엔벨로프 단백질의 서열 내로 도입하면 삼량체 형성 백분율이 증가되고/되거나 삼량체 수득량이 증가될 수 있다. 이것은 예를 들어 삼량체-특이적 항체, 융점, 크기 배제 크로마토그래피, 및 올바르게 폴딩된 (안정한 삼량체성) 또는 대안적으로 올바르지 않게 폴딩된 (비-안정성 또는 비-삼량체성) Env 단백질에 결합하는 항체에의 결합성을 이용하여 측정될 수 있으며, 증가된 삼량체 백분율 및/또는 삼량체 수득량은 안정하고, 올바르게 폴딩된 천연 Env 단백질을 나타내는 것으로 간주된다.

인간 면역결핍 바이러스 (HIV)는 레트로바이러스과 (family of Retroviridae)의 일부인 렌티바이러스속 (genus Lentivirinae)의 구성원이다. 다음 2가지의 HIV 종이 인간을 감염시킨다: HIV-1 및 HIV-2. HIV-1은 HIV 바이러스의 가장 일반적인 주이고, HIV-2보다 더 병원성인 것으로 알려져 있다. 본원에서 사용되는 바와 같이, 용어 "인간 면역결핍 바이러스" 및 "HIV"는 HIV-1 및 HIV-2를 지칭하지만, 이에 한정되는 것은 아니다. 바람직한 실시 형태에서, HIV는 HIV-1을 지칭한다.

HIV는 높은 정도의 유전적 다양성을 갖는 복수의 클레이드로 분류된다. 본원에서 사용되는 바와 같이, 용어 "HIV 클레이드" 또는 "HIV 아형"은 이들의 유전적 유사성 정도에 따라 분류되는 관련된 인간 면역결핍 바이러스를 지칭한다. HIV-1 단리체의 가장 큰 그룹은 그룹 M (주요 주)으로 칭해지며, 적어도 10개의 클레이드, A 내지 J로 이루어진다.

일반적인 일 양태에서, 본 발명은 재조합 HIV 엔벨로프 (Env) 단백질에 관한 것이다. 단백질과 관련하여 사용될 때 “재조합”이라는 용어는 시험관 내에서 화학적 합성에 의해 또는 재조합 기술에 의해 생성된 단백질을 지칭한다. 본 발명의 실시 형태에 따르면, “재조합” 단백질은, 상응하는 천연 발생 서열에서는 발견되지 않는 적어도 하나의 서열 요소 (예를 들어, 아미노산의 치환, 결실, 부가, 서열 대체 등)를 포함한다는 점에서 인공 아미노산 서열을 갖는다. 바람직하게는, “재조합” 단백질은 하나 이상의 천연 발생 HIV 주에 대하여 면역 반응을 유도하거나 면역성을 생성하도록 최적화된 천연 비-발생 HIV 엔벨로프 단백질이다.

용어 “HIV 엔벨로프 단백질”, “HIV Env” 및 “HIV Env 단백질”은 자연에서 HIV 비리온의 엔벨로프 상에서 발현되며 HIV가 HIV 감염 세포의 형질막을 표적화하여 이에 부착되게 할 수 있는 단백질, 또는 이의 단편 또는 유도체를 지칭한다. 용어 “엔벨로프” 및 “Env”는 본 개시 내용 전체에 걸쳐 상호교환가능하게 사용된다. HIV env 유전자는 전구 단백질 gp160을 코딩하는데, 이는 단백질 분해에 의해 2개의 성숙 엔벨로프 당단백질 gp120 및 gp41로 절단된다. 상기 절단 반응은 레트로바이러스 엔벨로프 당단백질 전구체에서 고도로 보존된 서열 모티프에서 숙주 세포 프로테아제, 푸린에 의해 (또는 푸린-유사 프로테아제에 의해) 매개된다. 더 구체적으로, gp160은 (gp160)₃으로 삼량체화되며, 그 후 2개의 비공유적 회합 성숙 당단백질 gp120 및 gp41로 절단된다. 바이러스 유입은 이후 gp120/gp41 헤테로이량체의 삼량체에 의해 매개된다. Gp120은 수용체 결합 단편이고, 예를 들어 T-헬퍼 세포와 같이 그러한 수용체를 갖는 표적 세포 상의 CD4 수용체 (및 공동수용체)에 결합한다. gp120에 비공유적으로 결합된 gp41은 융합 단편이고 HIV가 세포에 진입하는 제2 단계를 제공한다. Gp41은 원래 바이러스 엔벨로프 내에 묻혀 있지만, gp120이 CD4 수용체 및 공동수용체에 결합할 때, gp120은 gp41이 노출되도록 이의 배좌를 변화시키는데, 여기서 이것은 숙주 세포와의 융합을 보조할 수 있다. Gp140은 gp160의 엑토도메인이다.

본 발명의 실시 형태에 따르면, “HIV 엔벨로프 (Env) 단백질”은 gp160 또는 gp140 단백질, 또는 이들의 조합물, 융합물, 절두된 것 또는 유도체일 수 있다. 예를 들어, “HIV 엔벨로프 단백질”은 gp41 단백질과 비?유적으로 회합된 gp120 단백질을 포함할 수 있다. 또한 “HIV 엔벨로프 단백질”은 엑토도메인 (즉, 세포외 공간 내로 연장된 도메인)에서의 C-말단 절두, gp41에서의 절두, 예컨대 gp41의 엑토도메인에서의 절두, gp41의 막관통 도메인에서의 절두, 또는 gp41의 세포질 도메인에서의 절두를 포함하는 엔벨로프 단백질을 포함하지만 이에 한정되는 것은 아닌 절두형 HIV 엔벨로프 단백질일 수 있다. 또한 HIV 엔벨로프 단백질은 gp160 엑토도메인에 상응하는 gp140, 또는 연장되거나 절두된 버전의 gp140일 수 있다. gp140 단백질의 발현은 몇 가지 간행물 (예를 들어, 문헌[Zhang et al., 2001]; 문헌[Sanders et al., 2002]; 문헌[Harris et al., 2011])에서 기술되었고, 이 단백질은 또한 서비스 제공자로부터, 예를 들어 상이한 HIV 주를 기반으로 하는 상이한 변이체로 주문될 수 있다. 본 발명에 따른 gp140 단백질은 gp120 도메인 및 gp41 엑토도메인이 절단되지 않고 공유적으로 연결되지 않거나, 또는 대안적으로 gp120 도메인 및 gp41 엑토도메인이 절단되고 예를 들어 디술피드 가교체 (예를 들어 SOSIP 변이체에서와 같이)에 의해 공유적으로 연결될 수 있도록 절단 부위 돌연변이를 가질 수 있다. “HIV 엔벨로프 단백질”은 또한, 예를 들어 푸린 절단 부위에서 서열 돌연변이 및/또는 소위 SOSIP 돌연변이를 갖는 천연 발생 HIV 엔벨로프 단백질의 유도체일 수 있다. 본 발명에 따른 HIV 엔벨로프 단백질은 또한 gp120 및 gp41 엑토도메인이 비-공유적으로 연결될 수 있도록 절단 부위를 가질 수 있다.

본 발명의 바람직한 실시 형태에서, HIV Env 단백질은 gp140 단백질 또는 gp160 단백질이며, 더 바람직하게는 gp140 단백질이다. 다른 바람직한 실시 형태에서, Env 단백질은 천연 Env 단백질과 비교하여 예를 들어 세포질 영역의 일곱 번째 잔기 뒤의 잔기들의 결실에 의해 절두된다.

본 발명의 실시 형태에 따르면, “HIV 엔벨로프 단백질”은 삼량체 또는 단량체일 수 있으며, 바람직하게는 삼량체이다. 삼량체는 호모삼량체 (예를 들어, 3개의 동일한 폴리펩티드 단위를 포함하는 삼량체), 또는 헤테로삼량체 (예를 들어, 모두 동일한 것은 아닌 3개의 폴리펩티드 단위를 포함하는 삼량체)일 수 있다. 바람직하게는, 삼량체는 호모삼량체이다. 절단된 gp140 또는 gp160의 경우, 이것은 gp120-gp41 이량체인 폴리펩티드 단위의 삼량체이며, 모든 3개의 이러한 이량체들이 동일한 경우, 이것은 호모삼량체로 간주된다.

“HIV 엔벨로프 단백질”은 가용성 단백질, 또는 막 결합 단백질일 수 있다. 전형적으로 막 결합 엔벨로프 단백질은 도 1a에 나타낸 바와 같이 막관통 도메인 (Tm)을 포함하는 전장 HIV 엔벨로프 단백질에서와 같이 막관통 도메인을 포함한다. 막 결합 단백질은 세포질 도메인을 가질 수 있지만, 세포질 도메인이 막 결합되는 것을 필요로 하는 것은 아니다. 가용성 엔벨로프 단백질은 막관통 도메인의 적어도 부분적인 결실 또는 완전한 결실을 포함한다. 예를 들어, 전장 HIV 엔벨로프 단백질의 C-말단을 막관통 도메인이 결실되도록 절두함으로써 가용성 단백질을 생성할 수 있으며, 이는 도 1b에 나타낸 바와 같다. 그러나, HIV 엔벨로프 단백질은 도 1b에 나타낸 것에 대하여 대안적인 절두 위치 및 더 짧은 절두부를 가지고서 여전히 가용성일 수 있다. 절두는 다양한 위치에서 행해질 수 있으며, 비제한적 예로는 아미노산 664, 655, 683 등의 뒤인데, 이들 전부는 가용성 단백질을 생성한다. 본 발명에 따른 막 결합 Env 단백질은 천연 Env 단백질과 비교하여 완전한 또는 부분적인 C-말단 도메인 (예를 들어, C-말단 세포질 도메인의 부분 결실에 의해 (예를 들어 특정 실시 형태에서 세포질 영역의 일곱 번째 잔기 뒤에서))을 포함할 수 있다.

전형적으로 신호 펩티드는 발현될 경우 HIV Env 단백질의 N-말단에 존재하지만, 신호 펩티다아제에 의해 절단 제거되고 따라서 성숙 단백질에는 존재하지 않는다. 신호 펩티드는 다른 신호 서열과 교환될 수 있으며, 신호 펩티드의 일부 비제한적 예가 본원에 서열 번호 11, 18, 33, 및 34로 제공되어 있다.

본 발명의 실시 형태에 따르면, HIV 엔벨로프 단백질, 예를 들어, gp160, 또는 gp140은 임의의 HIV 클레이드 (또는 ‘아형’), 예를 들어, 클레이드 A, 클레이드 B, 클레이드 C, 클레이드 D, 클레이드 E, 클레이드 F, 클레이드 G, 클레이드 H 등, 또는 이들의 조합 (상이한 아형의 바이러스들 사이의 재조합으로부터 유래된 ‘순환 재조합형’ 또는 CRF, 예를 들어 BC, AE, AG, BE, BF, ADG 등에서와 같이)으로부터의 HIV 엔벨로프 단백질 서열로부터 유래될 수 있다. HIV 엔벨로프 단백질 서열은 천연 발생 서열, 모자이크 서열, 콘센서스 서열, 합성 서열, 또는 이의 임의의 유도체 또는 단편일 수 있다. “모자이크 서열”은 하나 이상의 HIV 클레이드의 적어도 3개의 HIV 엔벨로프 서열로부터 유래된 다수의 에피토프를 포함하며, T-세포 에피토프의 커버리지(coverage)를 최적화하는 알고리즘에 의해 설계될 수 있다. 모자이크 HIV 엔벨로프 단백질의 서열의 예는 예를 들어 문헌[Barouch et al, Nat Med 2010, 16: 319-323]; 및 국제 공개 제2010/059732호에 개시된 것, 예컨대 서열 번호 8 및 9로 나타낸 것을 포함한다. 본원에서 사용되는 바와 같이, “콘센서스 서열”은 예를 들어 상동 단백질들의 아미노산 서열의 정렬 (예를 들어, Clustal Omega)에 의해 결정되는 바와 같이, 상동 단백질들의 아미노산 서열의 정렬을 기반으로 한 아미노산의 인공 서열을 의미한다. 이것은 적어도 1000가지의 천연 HIV 단리체로부터의 Env의 서열을 기반으로 한, 서열 정렬에서의 각각의 위치에서 발견되는, 계산된 가장 빈번한 순서의 아미노산 잔기이다. “합성 서열”은 하나 초과의 천연 발생 HIV 주에 대하여 면역 반응을 유도하거나 면역성을 생성하도록 최적화된 천연 비-발생 HIV 엔벨로프 단백질이다. 모자이크 HIV 엔벨로프 단백질은 합성 HIV 엔벨로프 단백질의 비제한적 예이다. 본 발명의 바람직한 실시 형태에서, HIV Env 단백질은 본 발명에 따른 표시된 위치 (i)~(vii)에서의 표시된 아미노산 중 적어도 하나를 갖는 콘센서스 Env 단백질, 또는 합성 Env 단백질이다. 본 발명에 따른 표시된 위치 (i)~(vii)에서의 표시된 아미노산 잔기들 중 적어도 하나, 바람직하게는 적어도 2개를 갖는, 바람직하게는 하기에 기술된 바와 같은 추가의 SOSIP 및/또는 푸린 절단 부위 돌연변이를 갖는 콘센서스 Env 단백질이 특히 바람직하다.

본 발명의 특정 실시 형태에서, 천연 발생 서열이든지, 모자이크 서열이든지, 콘센서스 서열이든지, 합성 서열 등이든지간에, HIV 엔벨로프 단백질은 예를 들어 푸린 절단 부위 내의 추가 서열 돌연변이, 및/또는 소위 SOSIP 돌연변이를 포함한다.

본 발명의 일부 실시 형태에서, HIV 엔벨로프 단백질은 “SOSIP 돌연변이 HIV Env 단백질”이다. 소위 SOSIP 돌연변이는 ‘SOS 돌연변이’ (위치 501 및 605에서 Cys 잔기 (이는 새롭게 생성된 시스테인 잔기들 사이에 가능한 디술피드 가교체를 도입함) 및 ‘IP 돌연변이’ (위치 559에서 Pro 잔기)를 포함하는 삼량체 안정화 돌연변이이다. 본 발명의 실시 형태에 따르면, SOSIP 돌연변이 Env 단백질은 위치 501 및 605에서 Cys; 위치 559에서 Pro; 및 바람직하게는 위치 501 및 605에서 Cys 및 위치 559에서 Pro으로 이루어진 군으로부터 선택되는 적어도 하나의 돌연변이를 포함한다. SOSIP 돌연변이 HIV Env 단백질은 예를 들어 푸린 절단 부위에서 다른 서열 돌연변이를 추가로 포함할 수 있다. 게다가, 특정 실시 형태에서 Env 단백질이 위치 556 또는 위치 558에서 또는 위치 556 및 558에서 Pro을 포함하도록 돌연변이를 추가로 부가하는 것이 가능한데, 이는 본원에서, SOSIP 변이체에서 위치 559에서의 Pro에 대한 대안으로 작용할 수 있을뿐만 아니라 위치 559에서 Pro을 이미 갖고 있는 SOSIP 변이체의 삼량체 형성을 추가로 개선시킬 수 있는 추가 돌연변이로도 작용할 수 있는 것으로 밝혀졌다.

본 발명의 바람직한 특정 실시 형태에서, SOSIP 돌연변이 HIV Env 단백질은 위치 501 및 605에서 Cys, 및 위치 559에서 Pro을 포함한다.

특정 실시 형태에서, 본 발명의 HIV 엔벨로프 단백질은 푸린 절단 부위에서의 돌연변이를 추가로 포함한다. 푸린 절단 서열에서의 돌연변이는 아미노산의 치환, 결실, 삽입, 또는 하나의 서열의 또 다른 것에 의한 대체, 또는 링커 아미노산 서열에 의한 대체일 수 있다. 바람직하게는 본 발명에서, 푸린 절단 부위를 돌연변이시키는 것은, 예를 들어 잔기 508~511에서의 서열을 RRRRRR (서열 번호 10)로 대체하는 것에 의해 [즉, 위치 509~510에서의 전형적인 아미노산 서열 (예를 들어 EK)을 4개의 아르기닌 잔기로 대체하는 한편 (즉, 2개의 대체 및 2개의 부가), 위치 508 및 511에서는, 대부분의 HIV Env 단백질에 이미 아르기닌 잔기가 존재하여서, 이들은 전형적으로 대체될 필요가 없지만, 문헌에서 최종 결과는 종종 아미노산 서열 RRRRRR로 지칭되기 때문에 본원에서는 이 명명법을 유지하였음] 푸린 절단이 야생형에 비해 개선되도록 상기 절단 부위를 최적화하는 데 사용될 수 있다. 푸린 절단을 개선시키는 다른 돌연변이가 공지되어 있으며, 또한 사용될 수 있다. 대안적으로, 푸린 절단이 더 이상 필요하지 않도록 푸린 절단 부위를 링커로 대체하는 것이 가능하지만, 단백질은 천연-유사 배좌를 채택할 것이다 (예를 들어 문헌[Sharma et al, 2015] 및 문헌[Georgiev et al, 2015]에 기술됨).

본 발명의 특정한 실시 형태에서, 본 발명의 HIV 엔벨로프 단백질은 추가로 소위 SOSIP 돌연변이 (바람직하게는 위치 501 및 605에서 Cys, 및 위치 559에서 Pro) 및 푸린 절단 부위에서의 서열 돌연변이 둘 다를 포함하며, 바람직하게는 RRRRRR (서열 번호 10)에 의한 잔기 508~511에서의 서열의 대체를 포함한다. 바람직한 특정 실시 형태에서, HIV Env는 표시된 SOSIP 및 푸린 절단 부위 돌연변이 둘 다를 포함하며, 게다가 추가로, 위치 556 또는 558에서, 가장 바람직하게는 위치 556 및 558 둘 다에서 Pro 잔기를 포함한다.

본 발명의 바람직한 실시 형태에서, HIV 엔벨로프 단백질의 아미노산 서열은 콘센서스 서열, 예컨대 HIV 엔벨로프 클레이드 C 콘센서스 또는 HIV 엔벨로프 클레이드 B 콘센서스이다. 특히 바람직한 실시 형태에서, HIV 엔벨로프 단백질의 아미노산 서열은 HIV 엔벨로프 클레이드 C 콘센서스이다.

본 발명에서 사용될 수 있는 예시적인 HIV 엔벨로프 단백질은 HIV 엔벨로프 클레이드 C 콘센서스 (서열 번호 2) 및 HIV 엔벨로프 클레이드 B 콘센서스 (서열 번호 4)를 포함한다. 이러한 HIV 엔벨로프 클레이드 C 및 클레이드 B 콘센서스 서열은, 예를 들어 안정성 및/또는 삼량체 형성을 향상시키는 추가 돌연변이, 예를 들어 소위 SOSIP 돌연변이 및/또는 푸린 절단 부위에서의 서열 돌연변이 (상기에 기술된 바와 같음), 예를 들어 서열 번호 3으로 나타낸 ConC_SOSIP 서열 및 서열 번호 5로 나타낸 ConB_SOSIP 서열에서의 것을 포함할 수 있다.

본 발명에서 사용될 수 있는 바람직한 HIV 엔벨로프 단백질 서열의 다른 비제한적 예 (‘배경’ 또는 ‘모’ 분자로서 (여기서, 그러면 본 발명의 돌연변이들 중 하나 이상이 도입됨)는, 예를 들어 서열 번호 6의 아미노산 서열, 또는 위치 166에서 Glu가 Arg으로 돌연변이된 서열 번호 6의 아미노산 서열을 포함하는 합성 HIV Env 단백질을 포함하며, 이들 중 어느 하나는 선택적으로 추가 SOSIP 및/또는 푸린 절단 부위 돌연변이 (상기에 기술된 바와 같음)를 선택적으로 갖는다. 또 다른 비제한적 예로는 서열 번호 7이 있다. 추가의 비제한적 예로는 모자이크 HIV 엔벨로프 단백질, 예컨대 서열 번호 8 또는 9의 아미노산 서열을 갖는 것이 있다.

특정 실시 형태에서, 모 분자는 야생형 HIV Env 단백질이며, 여기서, 하나 또는 바람직하게는 이보다 많은 아미노산이 본원에 개시된 방법에 따라 복구되었다. 이러한 모 분자는 적어도 100개, 바람직하게는 적어도 500개, 바람직하게는 적어도 1000개, 바람직하게는 적어도 10000개, 바람직하게는 적어도 20000개의 야생형 HIV Env 서열들의 컬렉션에서 HIV Env 서열의 7.5% 미만, 바람직하게는 2% 미만의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에서의 적어도 하나의 복구 돌연변이를 포함하며, 여기서, 복구 돌연변이는 상기 컬렉션에서 HIV Env 서열의 적어도 10%의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에 의한 치환이다. 바람직하게는 상기 치환은 상기 컬렉션에서 HIV Env 서열의 적어도 15%, 적어도 20%, 적어도 25%의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에 의한 것이다. 바람직하게는, 상기 치환은 상기 컬렉션에서 가장 빈번하게 상응하는 위치에 존재하는 아미노산 잔기에 의한 것이다. 바람직한 특정 실시 형태에서, 상기 모 분자는 그러한 복구 돌연변이들 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 적어도 20개를 포함한다. 바람직하게는, 상기 컬렉션에서 HIV Env 서열의 2% 미만의 빈도로 상응하는 위치에 존재하는 아미노산 잔기들 중 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 이들 전부가 야생형 Env 단백질과 비교하여 모 분자에서 복구된다. 특정 실시 형태에서, 상기 컬렉션에서 HIV Env 서열의 7.5% 미만의 빈도로 상응하는 위치에 존재하는 아미노산 잔기들 중 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 이들 전부가 야생형 Env 단백질에 비하여 모 분자에서 복구된다. 특정 실시 형태에서, 야생형 HIV Env 단백질은 클레이드 A, B, 또는 C 주, 바람직하게는 클레이드 C 주로부터 유래된다. 이러한 복구 돌연변이의 결과로서, 모 분자는 HIV Env 콘센서스 서열에 대하여 원래의 야생형 주보다 더 많은 유사함을 나타내며, 따라서, 복구된 아미노산 잔기는 때때로 본원에서 ‘콘센서스 아미노산’ 또는 ‘콘센서스 잔기’로 지칭된다. 이러한 복구 활성의 결과는 폴딩, 삼량체화, 발현, 및/또는 안정성과 관련하여 생성된 모 분자의 크게 향상된 특성이며, 생성된 분자는 본원에서 ‘복구된 Env 단백질’로 지칭된다. 그러한 모 분자 내로의 본 발명의 안정화 돌연변이의 부가 (예를 들어, (i)~(vii) 중 하나 이상 (표 1), 및/또는 (xvi) (표 1), 및/또는 선택적으로 (viii)~(xv) (표 2))는 삼량체 백분율, 삼량체 수득량, 안정성, 광범위 중화 항체의 결합성, 폴딩 중 하나 이상에서 훨씬 더한 개선을 초래하며, 야생형 HIV Env 단백질로부터 유래된 생성된 분자는 본원에서 ‘복구되고 안정화된 Env 단백질’로 지칭된다. 안정화 돌연변이의 도입은 실제로, 생성된 서열이 콘센서스 서열로부터 약간 벗어나게 하여서, 복구되고 안정화된 HIV Env 분자의 크게 향상된 특성의 최종 결과는 2가지의 전적으로 다른 개념을 기반으로 하게 됨이 당업자에게 명백할 것이다.

본 발명에 따른 위치 (i)~(vii)에서의 표시된 아미노산으로 이어지는 돌연변이는 또한 HIV Env 단백질에서 사용될 수 있으며, 여기서, SOSIP 돌연변이는 전혀 존재하지 않고 (예를 들어, Env 콘센서스 서열 내에 또는 야생형 HIV 단리체 유래의 Env 단백질 내에), 이의 삼량체화를 또한 개선시킬 가능성이 있으며, 그 이유는 본 발명의 돌연변이가 SOSIP 돌연변이와 관련이 없고 게다가 몇몇 상이한 HIV Env 단백질 백본에서 작동하는 것으로 보였기 때문이다. 실제로, 본 발명에 따른 돌연변이는 HIV Env 삼량체화 특성을 개선시키도록 Ip-돌연변이의 부재 하에서뿐만 아니라 SOS-돌연변이의 부재 하에서도 작동할 수 있음이 본원에 나타나 있다.

본 발명의 실시 형태에 따른 재조합 HIV 엔벨로프 단백질은 HIV 엔벨로프 단백질의 아미노산 서열에서의 특정된 위치에서 특정한 아미노산 잔기(들)를 갖는 HIV 엔벨로프 단백질을 포함한다. 특히, 엔벨로프 단백질에서의 7개의 위치가 확인되었으며, 이외에도, 확인된 위치 각각에서 바람직한 특정한 아미노산 잔기가 확인되었다. 엔벨로프 단백질 서열에서의 확인된 위치는 (i) 위치 651, (ii) 위치 655, (iii) 위치 535, (iv) 위치 589, (v) 위치 573, (vi) 위치 204, 및 (vii) 위치 647을 포함하며, 여기서, 위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따른다. 본 발명에 따른 HIV Env 단백질은 표시된 위치 (i)~(vii) 중 적어도 하나의 위치에서, 바람직하게는 표시된 위치 (i)~(vii) 중 적어도 2개의 위치에서, 더 바람직하게는 표시된 위치 (i)~(vii) 중 적어도 3개의 위치에서 특정된 아미노산 잔기(들)를 갖는다. 본 발명의 실시 형태에 따른 확인된 위치 각각에 있는 것이 바람직한 특정한 아미노산 잔기는 표 1에 예시되어 있다. 이러한 옵션의 바람직한 위치로는 (i), (ii), (iii), (iv), (vi), 및/또는 (vii)이 있다. 이러한 옵션의 특히 바람직한 위치로는 (i), (ii), (iii), (iv), 및/또는 (vii)이 있다. 추가의 바람직한 옵션으로는 이후에 본원에서 약간 더 상세하게 언급되는 (xvi)가 있다.

[표 1]

상기 하나 이상의 표시된 위치에서 하나 이상의 바람직한 아미노산 (또는 표시된 아미노산)이 도입되는 HIV 엔벨로프 단백질의 아미노산 서열은 “백본 HIV 엔벨로프 서열” 또는 “모 HIV 엔벨로프 서열”로 지칭된다. 예를 들어, 서열 번호 3의 ConC_SOSIP 서열에서의 위치 651이 Phe로 돌연변이된다면, ConC_SOSIP 서열은 “백본” 또는 “모” 서열인 것으로 간주된다. 임의의 HIV 엔벨로프 단백질이 본 발명의 실시 형태에 따른 신규 안정화 돌연변이가 단독으로 또는 다른 돌연변이, 예컨대 소위 SOSIP 돌연변이 및/또는 푸린 절단 부위에서의 돌연변이와 조합되어 도입될 수 있는 “백본” 또는 “모” 서열로 사용될 수 있다. 백본으로 사용될 수 있는 HIV Env 단백질의 비제한적 예는 천연 HIV 단리체 유래의 HIV Env 단백질, 합성 HIV Env 단백질, 또는 콘센서스 HIV Env 단백질을 포함하며, 특정한 비제한적 예에서, 서열 번호 2, 서열 번호 3, 서열 번호 4, 서열 번호 5, 서열 번호 6, 열 번호 7, 서열 번호 8, 또는 서열 번호 9를 포함하는 것을 포함한다.

본 발명의 실시 형태에 따르면, HIV 엔벨로프 단백질은 위치 651, 655, 535, 589, 573, 204, 및 647로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 하나에서의 표시된 아미노산 잔기, 예컨대 1개, 2개, 3개, 4개, 5개, 6개, 또는 7개의 위치에서의 표시된 아미노산 잔기를 가질 수 있다. 바람직하게는, HIV 엔벨로프 단백질은 표시된 위치들 중 1개, 2개 또는 3개의 위치에서 치환되며, 더 바람직하게는 HIV 엔벨로프 단백질은 표시된 위치들 중 적어도 2개의 위치에서 치환된다. 더욱 더 바람직하게는, HIV Env 단백질은 표시된 위치들 중 3개의 위치, 표시된 위치들 중 4개의 위치, 표시된 위치들 중 5개의 위치, 표시된 위치들 중 6개의 위치, 또는 표시된 위치들 중 모든 7개의 위치에서 치환된다. 바람직하게는, HIV 엔벨로프 단백질은 표시된 위치들 중 적어도 2개의 위치에서 표시된 아미노산 잔기를 포함한다. 더 바람직하게는, HIV 엔벨로프 단백질은 표시된 위치들 중 3개의 위치에서 표시된 아미노산 잔기를 포함한다. 다른 바람직한 실시 형태에서, HIV 엔벨로프 단백질은 표시된 위치들 중 4개, 5개, 6개, 또는 모든 7개의 위치에서 표시된 아미노산 잔기를 포함한다.

다수의 위치에서 표시된 아미노산을 갖는 HIV Env 단백질의 실시 형태 (HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따라 넘버링된 위치 (그 위치에 존재하는 잔기의 1문자 아미노산 코드가 뒤따름), 하나의 HIV Env 단백질 실시 형태 내의 위치는 쉼표로 나뉘어짐 [예를 들어, 위치 651에서 Phe 및 위치 655에서 Ile를 갖는 Env 단백질의 실시 형태는 651F, 655I로 설명됨], 한편 다른 실시 형태 (즉, 다른 HIV Env 단백질)는 세미콜론으로 나뉘어짐)는 다음을 포함한다.

2개의 위치에서 표시된 아미노산을 갖는 Env 단백질의 경우: 651F, 655I; 651F, 655F; 651F, 655M; 651F, 655W; 651F, 535N; 651F, 535Q; 651F, 589V; 651F, 589I; 651F, 589A; 651F, 573F; 651F, 573W; 651F, 204I; 651F, 647F; 651F, 647I; 651F, 647M; 651L, 655I; 651L, 655F; 651L, 655M; 651L, 655W; 651L, 535N; 651L, 535Q; 651L, 589V; 651L, 589I; 651L, 589A; 651L, 573F; 651L, 573W; 651L, 204I; 651L, 647F; 651L, 647I; 651L, 647M; 651M, 655I; 651M, 655F; 651M, 655A; 651M, 655L; 651M, 655W; 651M, 535N; 651M, 535Q; 651M, 589V; 651M, 589I; 651M, 589A; 651M, 573F; 651M, 573W; 651M, 204I; 651M, 647F; 651M, 647I; 651M, 647M; 651W, 655I; 651W, 655F; 651W, 655M; 651W, 655W; 651W, 535N; 651W, 535Q; 651W, 589V; 651W, 589I; 651W, 589A; 651W, 573F; 651W, 573W; 651W, 204I; 651W, 647F; 651W, 647I; 651W, 647M; 655I, 535N; 655I, 535Q; 655I, 589V; 655I, 589I; 655I, 589A; 655I, 573F; 655I, 573W; 655I, 204I; 655I, 647F; 655I, 647I; 655I, 647M; 655F, 535N; 655F, 535Q; 655F, 589V; 655F, 589I; 655F, 589A; 655F, 573F; 655F, 573W; 655F, 204I; 655F, 647F; 655F, 647I; 655F, 647M; 655M, 535N; 655M, 535Q; 655M, 589V; 655M, 589I; 655M, 589A; 655M, 573F; 655M, 573W; 655M, 204I; 655M, 647F; 655M, 647I; 655M, 647M; 655W, 535N; 655W, 535Q; 655W, 589V; 655W, 589I; 655W, 589A; 655W, 573F; 655W, 573W; 655W, 204I; 655W, 647F; 655W, 647I; 655W, 647M; 535N, 589V; 535N, 589I; 535N, 589A; 535N, 573F; 535N, 573W; 535N, 204I; 535N, 647F; 535N, 647I; 535N, 647M; 535Q, 589V; 535Q, 589I; 535Q, 589A; 535Q, 573F; 535Q, 573W; 535Q, 204I; 535Q, 647F; 535Q, 647I; 535Q, 647M; 589V, 573F; 589V, 573W; 589V, 204I; 589V, 647F; 589V, 647I; 589V, 647M; 589I, 573F; 589I, 573W; 589I, 204I; 589I, 647F; 589I, 647I; 589I, 647M; 589A, 573F; 589A, 573W; 589A, 204I; 589A, 647F; 589A, 647I; 589A, 647M; 573F, 204I; 573F, 647F; 573F, 647I; 573F, 647M; 573W, 204I; 573W, 647F; 573W, 647I; 573W, 647M; 204I, 647F; 204I, 647I; 201I, 647M. 각각의 상기 실시 형태는 임의의 HIV Env 서열, 예컨대 야생형 단리체, 또는 SOSIP 돌연변이 HIV Env 단백질, 또는 콘센서스 HIV Env 단백질, 또는 합성 HIV Env 단백질에 본 발명에 따라 존재할 수 있다. 각각의 상기 실시 형태는 본 발명에 따른 (i)~(vii)로부터의 다른 표시된 위치들 중 하나의 제3 위치에서의 본 발명에 따른 바람직한 아미노산들 중 하나와 조합될 수 있다. 표시된 (i)~(vii) 중 3개의 위치에서 바람직한 아미노산 잔기를 갖는 그러한 실시 형태는 본 발명에 따른 (i)~(vii)로부터의 다른 표시된 위치들 중 하나의 제4 위치에서의 바람직한 아미노산들 중 하나와 조합될 수 있다. 표시된 (i)~(vii) 중 4개의 위치에서 바람직한 아미노산 잔기를 갖는 그러한 실시 형태는 본 발명에 따른 (i)~(vii)로부터의 다른 표시된 위치들 중 하나의 제5 위치에서의 바람직한 아미노산들 중 하나와 조합될 수 있다. 표시된 (i)~(vii) 중 5개의 위치에서 바람직한 아미노산 잔기를 갖는 그러한 실시 형태는 본 발명에 따른 (i)~(vii)로부터의 다른 표시된 위치들 중 하나의 제6 위치에서의 바람직한 아미노산들 중 하나와 조합될 수 있다. 표시된 (i)~(vii) 중 6개의 위치에서 바람직한 아미노산 잔기를 갖는 그러한 실시 형태는 본 발명에 따른 (i)~(vii)로부터의 다른 표시된 위치들 중 하나의 제7 위치에서의 바람직한 아미노산들 중 하나와 조합될 수 있어서, Env 단백질은 본 발명에 따른 모든 7개의 위치 (i)~(vii)에서 본 발명에 따른 바람직한 아미노산을 갖게 된다. 본 발명의 위치 (v)~(vii) 중 3개, 4개, 5개, 6개 또는 7개의 위치에서 본 발명에 따른 바람직한 아미노산을 갖는 이러한 추가 실시 형태들 중 임의의 것은, 야생형 단리체, SOSIP 변이체, 콘센서스 HIV Env 단백질, 합성 HIV Env 단백질 등으로부터의 것과 같은 임의의 HIV Env 단백질에 존재할 수 있다.

2개의 위치에서 표시된 아미노산을 갖는 본 발명에 따른 바람직한 Env 단백질로는 다음이 있다: 651F, 655I; 651F, 535N; 651F, 589V; 651F, 589I; 651F, 573F; 651F, 204I; 651F, 647F; 655I, 535N; 655I, 589V; 655I, 589I; 655I, 573F; 655I, 204I; 655I, 647F; 535N, 589V; 535N, 589I; 535N, 573F; 535N, 204I; 535N, 647F ; 589V, 573F; 589V, 204I; 589V, 647F; 589I, 573F; 589I, 204I; 589I, 647F; 573F, 204I; 573F, 647F; 204I, 647F. 본 발명에 따른 적어도 2개의 위치에서 바람직한 아미노산을 갖는 특히 바람직한 Env 단백질은 다음을 포함한다: 651F, 655I; 655I, 535N; 655I, 589V; 535N, 589V; 535N, 647F.

3개의 위치에서 바람직한 아미노산 잔기를 갖는 일부 바람직한 HIV Env 단백질로는 다음이 있다: 651F, 655I, 535N; 651F, 589V, 535N; 651F, 589I, 535N; 651F, 573F, 535N; 651F, 204I, 535N; 651F, 647F, 535N; 655I, 589V, 535N; 655I, 589I, 535N; 655I, 573F, 535N; 655I, 204I, 535N; 655I, 647F, 535N; 589V, 573F, 535N; 589V, 204I, 535N; 589V, 647F, 535N;

589I, 573F, 535N; 589I, 204I, 535N; 589I, 647F, 535N; 573F, 204I, 535N; 573F, 647F, 535N;

204I, 647F, 535N; 651F, 655I, 589V; 651F, 573F, 589V; 651F, 204I, 589V; 651F, 647F, 589V;

655I, 573F, 589V; 655I, 204I, 589V; 655I, 647F, 589V; 573F, 204I, 589V; 573F, 647F, 589V;

204I, 647F, 589V; 651F, 655I, 589I; 651F, 573F, 589I; 651F, 204I, 589I; 651F, 647F, 589I;

655I, 573F, 589I; 655I, 204I, 589I; 655I, 647F, 589I; 573F, 204I, 589I; 573F, 647F, 589I;

204I, 647F, 589I; 651F, 655I, 573F; 651F, 204I, 573F; 651F, 647F, 573F; 655I, 204I, 573F; 655I, 647F, 573F; 204I, 647F, 573F; 651F, 655I, 204I; 651F, 647F, 204I; 655I, 647F, 204I; 651F, 655I, 647F; 655I, 651F, 647F; 655I, 651F, 535N; 655I, 589V, 573F; 655I, 589V, 204I. 본 발명에 따른 적어도 3개의 위치에서 바람직한 아미노산을 갖는 특히 바람직한 Env 단백질은 다음을 포함한다: 651F, 655I, 535N; 655I, 589V, 535N; 655I, 573F, 589V; 655I, 204I, 589V; 651F, 655I, 647F.

4개의 위치에서 바람직한 아미노산 잔기를 갖는 일부 바람직한 HIV Env 단백질로는 다음이 있다: 651F, 655I, 535N, 589V; 651F, 655I, 535N, 573F; 651F, 655I, 589V, 573F; 651F, 535N, 589V, 573F; 655I, 535N, 589V, 573F; 651F, 655I, 535N, 204I; 651F, 655I, 589V, 204I; 651F, 535N, 589V, 204I; 655I, 535N, 589V, 204I; 651F, 655I, 573F, 204I; 651F, 535N, 573F, 204I; 655I, 535N, 573F, 204I; 651F, 589V, 573F, 204I; 655I, 589V, 573F, 204I; 535N, 589V, 573F, 204I; 651F, 655I, 535N, 647F; 651F, 655I, 589V, 647F; 651F, 535N, 589V, 647F; 655I, 535N, 589V, 647F; 651F, 655I, 573F, 647F; 651F, 535N, 573F, 647F; 655I, 535N, 573F, 647F; 651F, 589V, 573F, 647F; 655I, 589V, 573F, 647F; 535N, 589V, 573F, 647F; 651F, 655I, 204I, 647F; 651F, 535N, 204I, 647F; 655I, 535N, 204I, 647F; 651F, 589V, 204I, 647F; 655I, 589V, 204I, 647F; 535N, 589V, 204I, 647F; 651F, 573F, 204I, 647F; 655I, 573F, 204I, 647F; 535N, 573F, 204I, 647F; and 589V, 573F, 204I, 647F.

적어도 4개의 위치에서 바람직한 아미노산 잔기를 갖는 바람직한 HIV Env 단백질의 일부 예는 다음을 포함한다: 651F, 655I, 647F, I535N; 651F, 655I, 573F, 589V. 적어도 4개의 위치에서 표시된 아미노산 잔기를 포함하는 HIV Env 단백질의 바람직한 예는 535N, 589V, 651F, 655I를 포함한다. 그러한 HIV Env 단백질의 비제한적 예는 서열 번호 20, 22, 24, 26,27, 28, 29, 30, 31, 및 32로 제공된다. 바람직하게는 그러한 HIV Env 단백질은 클레이드 C HIV Env 단백질 또는 클레이드 A HIV Env 단백질, 가장 바람직하게는 클레이드 C HIV Env 단백질이다. 특정 실시 형태에서, 상기 HIV Env 단백질은추가로 588E를 포함하며, 즉, 이것은 적어도 535N, 588E, 589V, 651F, 655I를 포함한다. 그러한 HIV Env 단백질의 비제한적 예는 서열 번호 20, 24, 26, 27, 28, 29, 30, 31, 및 32로 제공된다. 특정 실시 형태에서, 상기 HIV Env는 추가로 556P를 포함하며, 즉, 이것은 적어도 535N, 556P, 589V, 651F, 655I 또는 적어도 535N, 556P, 588E, 589V, 651F, 655I를 포함한다. 그러한 HIV Env 단백질의 비제한적 예는 서열 번호 22, 24, 26, 27, 29, 30, 31 및 32로 제공된다.

일 실시 형태에서, 본 발명에 따른 재조합 HIV Env 단백질은 하기로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 2개의 위치에서의 표시된 아미노산 잔기를 갖는 HIV Env 단백질의 아미노산 서열을 포함한다:

(i) 위치 651에서 Phe, Leu, Met, 또는 Trp;

(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp;

(iii) 위치 535에서 Asn 또는 Gln;

(iv) 위치 589에서 Val, Ile, 또는 Ala;

(v) 위치 573에서 Phe 또는 Trp;

(vi) 위치 204에서 Ile; 및

(vii) 위치 647에서 Phe, Met, 또는 Ile.

예를 들어, 재조합 HIV Env 단백질은 위치 651에서 Phe, Leu, Met, 또는 Trp 중 하나, 및 위치 535에서 Asn 또는 Gln, 선택적으로, 추가의 표시된 위치에서 추가의 표시된 아미노산 잔기를 가질 수 있다. 바람직하게는, (i)~(vii)에서의 아미노산들 중 적어도 하나가 아미노산 치환에 의해 재조합 HIV Env 단백질 내로 도입된다. 예를 들어, 재조합 HIV Env 단백질은, 전부의 또는 하나 이상의 상기 적어도 2개의 표시된 아미노산 잔기들이 아미노산 치환에 의해 재조합 HIV Env 단백질 내로 도입되도록 상기 (i)~(vii)에서의 아미노산 잔기들 중 어떤 것도 함유하지 않거나 하나만을 함유하는 HIV Env 단백질로부터 생성될 수 있다.

특정 실시 형태에서, 본 발명의 재조합 HIV Env 단백질은 (viii) 위치 588에서 Gln, Glu, Ile, Met, Val, Trp, 또는 Phe을 추가로 포함하며, 여기서, Gln 또는 Glu가 바람직하다.

상기에 기술된 치환이 도입되는 HIV Env 단백질의 아미노산 서열은 본 발명의 개시 내용을 고려하여 본 기술 분야에 공지된 임의의 HIV Env 단백질, 예를 들어 HIV 클레이드 A, 클레이드 B, 클레이드 C 등으로부터의 천연 발생 서열; 모자이크 서열; 콘센서스 서열, 예를 들어, 클레이드 B 또는 클레이드 C 콘센서스 서열; 합성 서열; 또는 이들의 임의의 유도체 또는 단편일 수 있다. 본 발명의 특정 실시 형태에서, HIV Env 단백질의 아미노산 서열은 추가 돌연변이, 예를 들어, 소위 SOSIP 돌연변이, 및/또는 푸린 절단 부위에서의 돌연변이를 포함한다.

특정한 일 실시 형태에서, HIV Env 백본 단백질은 위치 501 및 605에서 Cys; 위치 559에서 Pro로 이루어진 군으로부터 선택되는 적어도 하나의 돌연변이를 포함하는 SOSIP 돌연변이 HIV Env 단백질이다. 바람직한 실시 형태에서, SOSIP 돌연변이 HIV Env 단백질은 위치 501 및 605에서 Cys, 및 위치 559에서 Pro을 포함한다. 이러한 실시 형태에 따르면, 재조합 HIV Env 단백질은 SOSIP 돌연변이 HIV Env 단백질의 아미노산 서열 및 하기로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 하나에서의 표시된 아미노산 잔기에 의한 아미노산 치환을 포함한다:

(i) 위치 651에서 Phe, Leu, Met, 또는 Trp;

(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp;

(iii) 위치 535에서 Asn 또는 Gln;

(iv) 위치 589에서 Val, Ile, 또는 Ala;

(v) 위치 573에서 Phe 또는 Trp;

(vi) 위치 204에서 Ile; 및

(vii) 위치 647에서 Phe, Met, 또는 Ile.

SOSIP 돌연변이 HIV Env 단백질은 푸린 절단 부위에서의 돌연변이, 예컨대 서열 번호 10의 서열에 의한 위치 608~511에서의 대체를 추가로 포함할 수 있다.

또 다른 실시 형태에서, 본 발명에 따른 재조합 HIV Env 단백질은 HIV Env 단백질의 아미노산 서열 및 하기로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 하나에서의 표시된 아미노산 잔기에 의한 아미노산 치환을 포함한다:

(i) 위치 651에서 Phe, Leu, Met, 또는 Trp;

(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp;

(iii) 위치 535에서 Asn 또는 Gln;

(iv) 위치 589에서 Val, Ile, 또는 Ala;

(v) 위치 573에서 Phe 또는 Trp;

(vi) 위치 204에서 Ile; 및

(vii) 위치 647에서 Phe, Met, 또는 Ile

(여기서, HIV Env 단백질은

(1) HIV Env 콘센서스 서열, 예컨대 클레이드 C 또는 클레이드 B 콘센서스 서열 (예를 들어 서열 번호 2, 3, 4 또는 5의 아미노산 서열을 포함함);

(2) 합성 HIV Env 단백질 (예를 들어 (a) 서열 번호 6의 아미노산 서열; (b) 위치 166에서 Glu의 Arg로의 돌연변이를 갖는 서열 번호 6의 아미노산 서열; (c) 서열 번호 7의 아미노산 서열; 또는 (d) 서열 번호 8 또는 9의 아미노산 서열, 추가 SOSIP 및/또는 푸린 절단 부위 돌연변이 (상기에 기술된 바와 같음)를 선택적으로 갖는 (a), (b) 또는 (d)를 포함함)로 이루어진 군으로부터 선택됨).

바람직하게는, 재조합 HIV Env 단백질은 HIV Env 단백질의 아미노산 서열, 및 상기 (i)~(vii)로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 2개의 위치, 예컨대 2개의 위치 또는 3개의 위치에서의 표시된 아미노산 잔기에 의한 아미노산 치환을 포함한다. 그러나, 재조합 HIV Env 단백질은 표시된 위치들 중 하나 이상의 위치, 예컨대 표시된 위치들 중 1개, 2개, 3개, 4개, 5개, 6개, 또는 7개의 위치에서의 표시된 아미노산 잔기에 의한 아미노산 치환을 포함할 수 있다.

특정한 일 실시 형태에서, HIV Env 백본 단백질은 서열 번호 2의 아미노산 서열과 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 포함하는 HIV Env 콘센서스 클레이드 C이다. 바람직하게는, 서열 번호 2의 HIV 콘센서스 클레이드 C 서열은 소위 SOSIP 돌연변이, 즉, 위치 501 및 605에서 Cys, 및 위치 559에서 Pro을 추가로 포함하며, 더 바람직하게는 소위 SOSIP 돌연변이 및 푸린 절단 부위에서의 돌연변이, 예를 들어 서열 번호 10의 서열에 의한 위치 508~511에서의 대체를 추가로 포함한다. 특히 바람직한 실시 형태에서, HIV Env 백본 단백질은 서열 번호 3으로 나타낸 서열, 또는 이와 적어도 95% 동일한 서열을 포함하며, 여기서, 바람직하게는 위치 501, 559, 605, 및 508~511에서의 아미노산 (서열 번호 10의 서열로 대체되는 바와 같음)은 서열 번호 3의 서열과 비교하여 돌연변이되지 않는다.

또 다른 특정한 실시 형태에서, HIV Env 백본 단백질은 서열 번호 4의 아미노산 서열과 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 포함하는 HIV Env 콘센서스 클레이드 B이다. 바람직하게는, 서열 번호 4의 HIV 콘센서스 클레이드 B 서열은 소위 SOSIP 돌연변이, 즉, 위치 501 및 605에서 Cys, 및 위치 559에서 Pro을 추가로 포함하며, 더 바람직하게는 소위 SOSIP 돌연변이 및 푸린 절단 부위에서의 돌연변이, 예를 들어 서열 번호 10의 서열에 의한 위치 508~511에서의 대체를 추가로 포함한다. 특히 바람직한 실시 형태에서, HIV Env 백본 단백질은 서열 번호 5로 나타낸 서열, 또는 이와 적어도 95% 동일한 서열을 포함하며, 여기서, 바람직하게는 위치 501, 559, 605, 및 508~511에서의 아미노산 (서열 번호 10의 서열로 대체되는 바와 같음)은 서열 번호 5의 서열과 비교하여 돌연변이되지 않는다.

또 다른 특정한 실시 형태에서, HIV Env 백본 단백질은 합성 HIV Env 단백질로서, 예를 들어 (a) 서열 번호 6의 아미노산 서열; (b) 위치 166에서 Glu의 Arg로의 돌연변이를 갖는 서열 번호 6의 아미노산 서열; (c) 서열 번호 7의 아미노산 서열; 또는 (d) 서열 번호 8 또는 9의 아미노산 서열, 추가 SOSIP (501C, 605C, 559P) 및/또는 푸린 절단 부위 돌연변이 (508~511RRRRRR) (상기에 기술된 바와 같음)를 선택적으로 갖는 (a), (b) 또는 (d)를 포함하는 합성 HIV Env 단백질이다.

또 다른 특정한 실시 형태에서, HIV Env 백본 단백질은 야생형 클레이드 A 또는 클레이드 C HIV 바이러스 유래의 HIV Env 단백질로서, 이는 선택적으로, 본원에 개시된 방법에 따라 서열을 복구하기 위한 돌연변이를 포함한다.

동시에 치환될 수 있는 HIV Env 단백질에서의 두 위치의 예시적인 조합은 잔기 535,589; 535,647; 및 589,655; 예를 들어 이중 돌연변이체 I535N, D589V; I535N, E647F; 및 D589V, K655I를 포함한다. 다른 이중 돌연변이체는 K655I, I535N; N651F, K655I; 및 K655I, I573F를 포함한다. 동시에 치환될 수 있는 HIV Env 단백질에서의 세 위치의 예시적인 조합은 예를 들어 삼중 돌연변이체 I535N, D589V, K655I에서와 같은 535, 589, 655를 포함한다. 다른 삼중 돌연변이체는 K655I, D589V, I573F; 및 K655I, N651F, I535N을 포함한다.

본 발명의 특정 실시 형태에서, 본 발명에 따른 재조합 HIV Env 단백질은 하기 표 2에 나타낸 바와 같이, 위치 (viii) 588, (ix) 64 또는 66, (x) 316, (xi) 201/433, (xii) 556 또는 558 또는 556 및 558, (xiii) 548~568, (xiv) 568, 569 및 636, 또는 (xv) 302, 519 또는 520으로 이루어진 군으로부터 선택되는 하나 이상의 추가의 표시된 위치들에서 표시된 아미노산 잔기를 추가로 포함할 수 있다 (예를 들어 치환을 통하여). 특정한 이러한 아미노산 치환 (예를 들어 (viii))은 본 발명자에 의해, 상기에 기술된 본 발명에 따라 돌연변이 (i)~(vii)와 (이들의 조합과) 매우 잘 조합되는 것으로 밝혀졌다. 이러한 아미노산 치환들 중 다른 것은 이전에 문헌에 보고되어 있었다. 예를 들어, 문헌[De Taeye et al. Cell(2015), 163(7), 1702-15]에는 E64K 및 T316W 이중 돌연변이를 갖는 HIV 엔벨로프 단백질, 및 66R 돌연변이를 갖는 HIV Env 단백질이 보고되었으며; 문헌[Kwon et al. (2015) Nat.Struct. Mol . Biol . 22(7) 522-31]에는 I204C, A433C 디술피드 치환을 갖는 HIV 엔벨로프 단백질이 보고되었으며; 문헌[Guenaga et al. (Immunity (2017) 46, 792-803)]에는 L568G, T569G 또는 N636G, 및 N302Y, F519R, L520R 삼중 치환을 갖는 HIV 엔벨로프 단백질이 보고되었다. 그러나, 본 발명자가 알고 있는 한, 이러한 이전에 기술된 돌연변이는 본원에 개시된 신규한 치환들, 예를 들어 표 1에 열거된 치환들 중 임의의 것과 조합된 형태로는 기술되지 않았다. 본 발명의 아미노산 치환과 조합된 이러한 아미노산 돌연변이는 추가로 삼량체 수득량 및/또는 삼량체 형성 백분율을 증가시킬 수 있다. 이러한 아미노산 치환은 표 1에 기술된 바와 같은 표시된 위치들 중 하나 이상에서의 표시된 아미노산 잔기에 의한 치환에 더하여 본원에 기술된 재조합 HIV Env 단백질 중 임의의 것 내로 도입될 수 있다.

[표 2]

본 발명의 표시된 위치들 [(i)~(vii), 예를 들어 표 1 참조]에서 확인된 치환은 천연 서열에서는 존재하지 않거나 드물게 존재하며, 이전에 보고된 HIV Env 단백질 서열에서는 조합된 형태로는 발견되지 않으며, HIV Env 단백질의 개선된 삼량체화, 개선된 삼량체 수득량 및/또는 증가된 삼량체 안정성으로 이어지는 것으로 이전에 제안된 것이 아니었다. 표 2에서의 돌연변이 (ix)~(xi) (다른 이들에 의해 이전에 보고됨)는 모두 gp120 영역에 있는데, 상기 영역에 삼량체 특이적 항체 PGT145가 결합한다. 이러한 돌연변이는 첨부 (이는 분자의 정상에 있음)에서 폐쇄되는 삼량체를 유지한다. 치환 (xii) 및 (xiii)은 모두 gp41의 Hr1에 있다. 위치 204를 제외하고서, 표 1에서의 본 발명의 돌연변이는 모두 gp41 영역에 (분자의 바닥 부분에), 그러나 HR1 영역 외부에 있다. 명백하게, 이전에 기술된 돌연변이는 본 발명의 돌연변이의 도입에 대하여, PGT145 결합에 의해 측정되는 바와 같이 폐쇄 첨부에 의한 삼량체 형성에 대한 이의 놀라운 효과는 고사하고 상기 도입에 대하여 제안도 전혀 제공하지 않았다. 표 2에서의 점 돌연변이 (viii)~(xii) 외에도, Env 단백질의 HR1 루프 (야생형 서열에서 아미노산 잔기 548~568, 이때 넘버링은 HXB2 단리체의 gp160에 따름)를 7~10개의 아미노산을 갖는 더 짧고 덜 유연한 루프, 바람직하게는 8개 아미노산의 루프 (예를 들어, (서열 번호 12~17) 중 어느 하나로부터 선택되는 서열을 가짐)로 대체하는 것이 또한 가능하며, 예를 들어, 문헌[Kong et al (Nat Commun. 2016 Jun 28;7:12040. doi: 10.1038/Ncomms12040)]을 참조하는데, 상기 문헌은 HR1 루프를 대체하는 그러한 더 짧은 루프가 기술되어 있다. 본 발명에 따른 표시된 위치 (i)~(vii) 중 적어도 1개의 위치, 바람직하게는 적어도 2개의 위치에서 표시된 아미노산 잔기를 추가로 갖는 그러한 Env 변이체도 본 발명의 실시 형태이다. 본 발명의 특정 실시 형태에서, (Viii)~(xiii)에 열거된 돌연변이는 본 발명의 HIV Env 단백질에 부가될 수 있다 (즉, 위치 (i)~(vii)에서 표시된 아미노산들 중 하나 이상을 가짐). 또한, 그룹 (viii)~(xiii) 내에서의 조합이 이루어질 수 있으며, 비제한적 예로는 (viii) 및 (xii)에서 ((i)~(vii)의 적어도 하나의 돌연변이에 더하여) 돌연변이들의 조합이 있다 (예를 들어 I535N, A556P, K588E). 위치 (i)~(vii) 중 적어도 하나에서 및 위치 (viii)~(xiii) 중 적어도 하나에서 돌연젼이들이 조합되고 SOSIP 돌연변이들을 갖는 HIV Env 배경에서 이루어진 이중 돌연변이체의 일부 비제한적 예는 다음을 포함한다: 535,588; 588,589; 655,588; 558,535; 및 655,556; 예를 들어 I535N, K588E; 588Q, D589V; K655I, K588E; A588P, I535N; 및 K655I, I556P. 그러한 삼중 돌연변이체의 일부 비제한적 예는 다음을 포함한다: 558,535,588; 558,535,589; 558,535,655; 및 558,535,651, 예를 들어 A558P, I535N, K588E; A588P, I535. D589V; A558P, I535N, K655I; 및 A558P, I535N, N651F.

본 발명에 따른 조합의 추가의 비제한적 예는 다음을 포함한다: 655I, 573F, 589V, 588E; 651F, 655I, 573F, 589V, 588E; 651F, 655I, 573F, 589V, 588E, 535N; 651F, 655I, 573F, 589V, 588E, 535N, 204I; 651F, 655I, 556P; 651F, 535N, 556P; 651F, 589V, 556P; 651F, 589I, 556P; 651F, 573F, 556P; 651F, 204I, 556P; 651F, 647F, 556P; 655I, 535N, 556P; 655I, 589V, 556P; 655I, 589I, 556P; 655I, 573F, 556P; 655I, 204I, 556P; 655I, 647F, 556P; 535N, 589V, 556P; 535N, 589I, 556P; 535N, 573F, 556P; 535N, 204I, 556P; 535N, 647F, 556P;

589V, 573F, 556P; 589V, 204I, 556P; 589V, 647F, 556P; 589I, 573F, 556P; 589I, 204I, 556P; 589I, 647F, 556P; 573F, 204I, 556P; 573F, 647F, 556P; 651F, 655I, 558P; 651F, 535N, 558P; 651F, 589V, 558P; 651F, 589I, 558P; 651F, 573F, 558P; 651F, 204I, 558P; 651F, 647F, 558P;

655I, 535N, 558P; 655I, 589V, 558P; 655I, 589I, 558P; 655I, 573F, 558P; 655I, 204I, 558P; 655I, 647F, 558P; 535N, 589V, 558P; 535N, 589I, 558P; 535N, 573F, 558P; 535N, 204I, 558P; 535N, 647F , 558P; 589V, 573F, 558P; 589V, 204I, 558P; 589V, 647F, 558P; 589I, 573F, 558P; 589I, 204I, 558P; 589I, 647F, 558P; 573F, 204I, 558P; 573F, 647F, 558P; 655I, 589V, 535N, 556P; 651F, 655I, 535N, 556P; 556P, 651F; 556P, 651F, 655I, 535N; 655I, 589V, 573F, 651F, 588E, 556P; 556P, 651F, 655I, 535N, 573F; 556P, 651F, 655I, 535N, 573F, 589V; 556P, 651F, 655I, 535N, 573F, 589V, 204I; 556P, 651F, 655I, 535N, 573F, 589V, 204I, 588Q; 556P, 651F, 655I, 535N, 573F, 589V, 204I, 588Q, 647F; 556P, 651F, 535N, 573F; 556P, 651F, 535N, 573F, 589V; 556P, 651F, 535N, 573F, 589V, 204I; 556P, 651F, 535N, 573F, 589V, 204I, 588Q; 556P, 651F, 535N, 573F, 589V, 204I, 588Q, 647F; 556P, 655I, 535N, 573F; 556P, 655I, 535N, 573F, 589V; 556P, 655I, 535N, 573F, 589V, 204I; 556P, 655I, 535N, 573F, 589V, 204I, 588Q; 556P, 655I, 535N, 573F, 589V, 204I, 588Q, 647F. 또, 상기 실시 형태들 중 임의의 것은 임의의 HIV Env 단백질, 예를 들어 야생형 단리체, 콘센서스 Env, 합성 Env 단백질, SOSIP 돌연변이 Env 단백질, 본원에 개시된 개념에 따른 복구 돌연변이를 포함하는 야생형 단리체 등의 형태로 존재할 수 있다. 본 발명에 따른 일부 바람직한 조합은 다음을 포함한다: 655I,589V,573F,651F,588E,535N,204I; 556P, 655I, 535N, 573F, 589V, 204I, 588Q; 204I,535N,556P,588E,589V,651F,655I; 535N,556P,589V,651F,655I; 및 535N,556P,588E,589V,651F,655I.

바람직한 특정 실시 형태에서, HIV Env 단백질은 서열 번호 20, 22, 24, 26, 27, 28, 29, 30, 31 및 32의 서열 중 어느 하나와 적어도 95% 동일한, 바람직하게는 적어도 96%, 97%, 98%, 99% 동일한, 바람직하게는 100% 동일한 서열을 포함한다. 동일성 %의 결정을 위하여, 바람직하게는 표 1 및 표 2의 위치 (i)~(xv), 및 바람직하게는 또한 위치 501, 559 및 605는 고려되지 않는다. 바람직하게는 상기 위치에서의 아미노산 잔기는 각각 서열 번호 20, 22, 24, 26, 27, 28, 29, 30, 31 또는 32의 서열에서의 것이다.

특정 실시 형태에서, 본 발명의 HIV Env 단백질은 다음을 추가로 포함한다: (xvi) 위치 658에서 Val, Ile, Phe, Met, Ala, 또는 Leu으로부터 선택되는 아미노산 잔기.바람직하게는 위치 658에서의 아미노산은 Val 또는 Ile, 가장 바람직하게는 Val이다. 이것은 단독으로, 또는 표 1의 (i)~(vii) 및/또는 표 2의 (viii)~(xv) (본원에 기술됨)로부터 선택되는 돌연변이와 조합되어 Env 단백질의 삼량체 백분율 및 삼량체 수득량을 강하게 증가시킴이 밝혀졌다.

본 발명의 실시 형태에 따르면, 재조합 HIV Env 단백질은 표 1에 나타낸 바와 같이 위치 651, 655, 535, 589, 573, 204, 및 647 중 하나 이상에서 표시된 아미노산 잔기를 갖지 않는 HIV Env 단백질과 비교하여 (a) 개선된 삼량체 형성 백분율 및 (b) 개선된 삼량체 수득량 중 적어도 하나를 갖는다.

본원에서 사용되는 바와 같이, “개선된 삼량체 형성 백분율”은 HIV 엔벨로프 단백질의 백본 서열이 본 발명의 아미노산 치환들 중 하나 이상을 포함할 경우, HIV 엔벨로프 서열의 백본 서열이 그러한 아미노산 치환을 포함하지 않을 때 형성되는 삼량체의 백분율과 비교하여 더 큰 백분율의 삼량체가 형성됨을 의미한다. 본원에서 사용되는 바와 같이, “개선된 삼량체 수득량”은 HIV 엔벨로프 단백질의 백본 서열이 본 발명의 아미노산 치환들 중 하나 이상을 포함할 경우, HIV 엔벨로프 서열의 백본 서열이 그러한 아미노산 치환을 포함하지 않을 때 수득되는 상기 엔벨로프 단백질의 삼량체 형태의 총 양과 비교하여 더 많은 총 양의 엔벨로프 단백질의 삼량체 형태가 수득됨을 의미한다.

삼량체 형성은 HIV Env 단백질의 삼량체 형태에 특이적으로 결합하는 항체를 사용하여 항체 결합 분석법에 의해 측정될 수 있다. 삼량체 형태를 검출하는 데 사용될 수 있는 삼량체 특이적 항체의 예는 단클론 항체 (mAb) PGT145, PGDM1400, PG16, 및 PGT151을 포함하지만 이에 한정되는 것은 아니다. 바람직하게는, 삼량체 특이적 항체는 mAb PGT145이다. 본 발명의 개시 내용을 고려하면 본 기술 분야에 공지된 임의의 항체 결합 분석법, 예컨대 ELISA, AlphaLISA 등을 이용하여 본 발명의 재조합 HIV Env 단백질의 삼량체 형성 백분율을 측정할 수 있다.

특정한 실시 형태에서, 삼량체 형성은 AlphaLISA에 의해 측정된다. AlphaLISA는 도너 비드의 고에너지 조사에 의해 생성된 일중항 산소 분자가 도너 비드와 관련하여 대략 200 nm의 거리 내에 있는 억셉터 비드로 전달되는 비드-기반 근접 분석이다. 억셉터 비드로의 일중항 산소 분자의 전달은 연속적인 일련의 화학 반응들을 개시하여 화학발광 신호를 생성하고, 그 후 이것이 검출될 수 있다 (문헌[Eglen et al. Curr . Chem . Genomics, 2008, 25(1): 2-10]). 예를 들어, Flag-His 태그로 표지된 재조합 HIV 엔벨로프 단백질은 삼량체 특이적 mAb, 삼량체 특이적 mAb에 결합하는 항체에 콘쥬게이션된 도너 비드, 니켈-콘쥬게이션된 도너 비드, 항-His 항체에 콘쥬게이션된 억셉터 비드, 및 항-Flag 항체에 콘쥬게이션된 억셉터 비드와 함께 인큐베이션될 수 있다. 형성된 삼량체의 양은 삼량체 특이적 mAb에 결합하는 항체에 콘쥬게이션된 도너 비드와 항-His 항체에 콘쥬게이션된 억셉터 비드의 쌍으로부터 생성된 화학발광 신호를 측정함으로써 결정될 수 있다. 발현된 HIV 엔벨로프 단백질의 총 양은 니켈-콘쥬게이션된 도너 비드와 항-Flag-콘쥬게이션된 억셉터 비드의 쌍으로부터 생성된 화학발광 신호를 측정함으로써 결정될 수 있다. 예를 들어, 발현된 총 엔벨로프 단백질 및 삼량체의 양은 실시예 3에 상세하게 설명된 바와 같이 AlphaLISA 분석법에 의해 측정될 수 있다. 삼량체 형성 백분율은 형성된 삼량체의 양을 발현된 엔벨로프 단백질의 총 양으로 나누어서 계산될 수 있다.

형성된 삼량체의 양 및 발현된 엔벨로프 단백질의 총 양은 또한 삼량체 형태를 다른 형태의 HIV 엔벨로프 단백질, 예를 들어 단량체로부터 분리할 수 있는 크로마토그래피 기술을 이용하여 결정될 수 있다. 사용될 수 있는 그러한 기술의 예는 크기 배제 크로마토그래피 다중각 광 산란 (SEC-MALS)을 포함하지만, 이에 한정되는 것은 아니다. 특정 실시 형태에 따르면, 삼량체 형성 백분율은 SEC-MALS를 사용하여 결정된다. 특정 실시 형태에 따르면, 삼량체 수득량은 SEC-MALS를 사용하여 결정된다.

핵산, 벡터 및 세포

또 다른 일반 양태에서, 본 발명은 본 발명에 따른 재조합 HIV Env 단백질을 코딩하는 핵산 분자, 및 이 핵산 분자를 포함하는 벡터를 제공한다. 본 발명의 핵산 분자는 클로닝에 의해 수득되거나 합성에 의해 생성되는 RNA 형태 또는 DNA 형태로 존재할 수 있다. DNA는 이중 가닥 또는 단일 가닥일 수 있다. DNA는 예를 들어 cDNA, 게놈 DNA, 또는 이들의 조합을 포함할 수 있다. 본 핵산 분자 및 벡터는 재조합 단백질 생성, 숙주 세포에서의 이 단백질의 발현, 또는 바이러스 입자의 생성에 사용될 수 있다.

본 발명의 실시 형태에 따르면, 재조합 HIV 엔벨로프 단백질을 코딩하는 핵산은 프로모터에 작동가능하게 연결되며, 이는 핵산이 프로모터의 제어 하에 있음을 의미한다. 프로모터는 동종 프로모터 (즉, 벡터와 동일한 유전적 공급원으로부터 유래됨) 또는 이종 프로모터 (즉, 상이한 벡터 또는 유전적 공급원으로부터 유래됨)일 수 있다. 적합한 프로모터의 예는 인간 사이토메갈로바이러스 극초기 (hCMV IE, 또는 짧게 “CMV”) 프로모터 및 라우스 육종 바이러스 (Rous Sarcoma virus, RSV) 프로모터를 포함한다. 바람직하게는, 프로모터는 발현 카세트 내에서 핵산의 상류에 위치한다.

본 발명의 실시 형태에 따르면, 벡터는 발현 벡터일 수 있다. 발현 벡터는 재조합 단백질 발현용 벡터 및 대상체의 조직에서의 발현을 위한 대상체 내로의 핵산의 전달을 위한 벡터, 예컨대 바이러스 벡터를 포함하지만, 이에 한정되는 것은 아니다. 본 발명에서 사용하기에 적합한 바이러스 벡터의 예는 아데노바이러스 벡터, 아데노-관련 바이러스 벡터, 폭스 바이러스 벡터, 변형된 백시니아 앙카라 (Modified Vaccinia Ankara; MVA) 벡터, 장내 바이러스 벡터, 베네수엘라 말 뇌염 바이러스 벡터, 셈리키 삼림열 바이러스 벡터, 담배 모자이크 바이러스 벡터, 렌티바이러스 벡터 등을 포함하지만, 이에 한정되는 것은 아니다. 벡터는 또한 비-바이러스 벡터일 수 있다. 비-바이러스 벡터의 예는 플라스미드, 박테리아 인공 염색체, 효모 인공 염색체, 박테리오파지 등을 포함하지만, 이에 한정되는 것은 아니다.

본 발명의 특정 실시 형태에서, 벡터는 아데노바이러스 벡터, 예를 들어 재조합 아데노바이러스 벡터이다. 재조합 아데노바이러스 벡터는 예를 들어 인간 아데노바이러스 (HAdV, 또는 AdHu), 또는 시미안 아데노바이러스, 예컨대 침팬지 또는 고릴라 아데노바이러스 (ChAd, AdCh, 또는 SAdV) 또는 레수스 아데노바이러스 (rhAd)로부터 유래될 수 있다. 바람직하게는, 아데노바이러스 벡터는 재조합 인간 아데노바이러스 벡터, 예를 들어 재조합 인간 아데노바이러스 혈청형 26, 또는 재조합 인간 아데노바이러스 혈청형 5, 4, 35, 7, 48 등 중 어느 하나이다. 다른 실시 형태에서, 아데노바이러스 벡터는 rhAd 벡터, 예를 들어 rhAd51, rhAd52 또는 rhAd53이다.

재조합 아데노바이러스 벡터의 제조는 본 기술 분야에 잘 알려져 있다. 예를 들어, 재조합 아데노바이러스 26 벡터의 제조는 예를 들어 국제 공개 제2007/104792호 및 문헌[Abbink et al., (2007) Virol . 81(9): 4654-63]에 기술되어 있다. 아데노바이러스 26의 예시적인 게놈 서열은 GenBank 등록번호 EF 153474 및 국제 공개 제2007/104792호의 서열 번호 1에서 발견된다. rhAd51, rhAd52 및 rhAd53의 예시적인 게놈 서열이 미국 특허 출원 공개 제2015/0291935호에 제공되어 있다.

본 발명의 실시 형태에 따르면, 본원에 개시된 재조합 HIV Env 단백질 중 임의의 것이 본원에 개시된 벡터 중 임의의 것에 의해 발현되고/되거나 코딩될 수 있다. 유전자 코드의 축퇴성을 고려하면, 당업자는 본 기술 분야에서 전적으로 일상적인 방법에 따라 동일 단백질을 코딩하는 몇몇 핵산 서열들이 설계될 수 있음을 잘 알고 있다. 본 발명의 재조합 HIV Env 단백질을 코딩하는 핵산은 선택적으로, 숙주 세포 (예를 들어, 박테리아 또는 포유류 세포)에서의 적당한 발현을 보장하도록 코돈-최적화될 수 있다. 코돈-최적화는 본 기술 분야에서 널리 적용되는 기술이다.

또한 본 발명은 본원에 개시된 임의의 핵산 분자 및 벡터를 포함하는 세포, 바람직하게는 단리된 세포를 제공한다. 세포는 예를 들어 재조합 단백질 생산에, 또는 바이러스 입자 생성에 사용될 수 있다.

이와 같이 본 발명의 실시 형태는 또한 재조합 HIV Env 단백질의 제조 방법에 관한 것이다. 본 방법은 프로모터에 작동가능하게 연결된 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질을 코딩하는 핵산을 포함하는 발현 벡터로 숙주 세포를 형질감염시키는 단계, 형질감염된 세포를 재조합 HIV Env 단백질의 발현에 적합한 조건 하에 성장시키는 단계, 및 선택적으로, 상기 세포에서 발현된 재조합 HIV Env 단백질을 정제하거나 단리하는 단계를 포함한다. 재조합 HIV Env 단백질은 친화성 크로마토그래피, 크기 배제 크로마토그래피 등을 포함하는 본 기술 분야에 공지된 임의의 방법에 의해 세포로부터 단리되거나 수집될 수 있다. 재조합 단백질 발현에 사용되는 기술은 본 발명의 개시 내용을 고려하면 당업자에게 잘 알려져 있다. 또한, 발현된 재조합 HIV Env 단백질은, 발현된 단백질의 정제 또는 단리 없이, 예를 들어 재조합 HIV Env 단백질을 코딩하는 발현 벡터로 형질감염되고 이 HIV Env 단백질의 발현에 적합한 조건 하에 성장시킨 세포의 상청액을 분석함으로써 연구될 수 있다.

바람직한 실시 형태에서, 발현된 재조합 HIV Env 단백질은 안정화된 삼량체성 복합체를 형성하도록 상기 단백질의 회합을 가능케 하는 조건 하에 정제된다. 예를 들어, 프로모터 (예를 들어, CMV 프로모터)에 작동가능하게 연결된 재조합 HIV Env 단백질을 코딩하는 발현 벡터로 형질감염된 포유류 세포는 33~39℃, 예를 들어 37℃, 및 2~12% CO₂, 예를 들어 8% Co2에서₂에서 배양될 수 있다. 또한 발현은 대안적인 발현 시스템, 예컨대 곤충 세포 또는 효모 세포 (모두 본 기술 분야에서 통상적임)에서 수행될 수 있다. 그 후, 발현된 HIV Env 단백질은 예를 들어 렉틴 친화성 크로마토그래피에 의해 세포 배양물로부터 단리될 수 있는데, 이는 당단백질에 결합한다. 컬럼에 결합된 HIV Env 단백질은 만노피라노시드를 이용하여 용출될 수 있다. 컬럼으로부터 용출된 HIV Env 단백질은 필요할 경우 추가 정제 단계, 예컨대 크기 배제 크로마토그래피를 하여서 임의의 잔존 오염물질, 예를 들어 세포 오염물질뿐만 아니라 Env 응집물, gp140 단량체 및 gp120 단량체도 제거할 수 있다. 대안적인 정제 방법, 항체 친화성 크로마토그래피를 포함하는 비제한적 예, 비-bNAB를 이용한 음성 선택, 항-태그 정제, 또는 기타 크로마토그래피 방법, 예컨대 이온 교환 크로마토그래피 등과, 본 기술 분야에 공지된 다른 방법을 발현된 HIV Env 단백질의 단리에 또한 사용할 수 있다.

본 발명의 재조합 HIV Env 단백질을 코딩하는 핵산 분자 및 발현 벡터는 본 발명의 개시 내용을 고려하여 본 기술 분야에 공지된 임의의 방법에 의해 제조될 수 있다. 예를 들어, 재조합 HIV Env 단백질을 코딩하는 핵산은 당업자에게 잘 알려진 유전 공학 기술 및 분자 생물학 기술, 예를 들어 부위 지정 돌연변이 유발, 폴리머라아제 연쇄 반응 (PCR) 등을 이용하여, 표시된 위치에서의 아미노산 치환 중 적어도 하나의 치환을 백본 HIV 엔벨로프 서열 내로 도입함으로써 제조될 수 있다. 그 후, 핵산 분자는 표준 분자 생물학 기술을 또한 사용하여 발현 벡터 내로 도입되거나 “클로닝될” 수 있다. 그 후 재조합 HIV 엔벨로프 단백질은 숙주 세포에서 발현 벡터로부터 발현될 수 있으며, 발현된 단백질은 본 기술 분야에 공지된 임의의 방법에 의해 세포 배양물로부터 정제될 수 있다 (본 발명의 개시 내용을 고려하여).

삼량체성 복합체

또 다른 일반 양태에서, 본 발명은 본 발명에 따른 3개의 재조합 HIV Env 단백질들의 비공유적 올리고머를 포함하는 삼량체성 복합체에 관한 것이다. 삼량체성 복합체는 본원에 개시된 재조합 HIV Env 단백질 중 임의의 것을 포함할 수 있다. 바람직하게는 삼량체성 복합체는 본 발명에 따른 재조합 HIV Env 단백질의 3개의 동일한 단량체 (또는 gp140이 절단될 경우 동일한 헤테로이량체)를 포함한다. 삼량체성 복합체는 다른 형태의 HIV 엔벨로프 단백질, 예컨대 단량체 형태로부터 분리될 수 있거나, 삼량체성 복합체는 다른 형태의 HIV 엔벨로프 단백질, 예컨대 단량체 형태와 함께 존재할 수 있다.

조성물 및 방법

또 다른 일반 양태에서, 본 발명은 재조합 HIV Env 단백질, 삼량체성 복합체, 단리된 핵산 분자, 벡터, 또는 숙주 세포, 및 제약상 허용가능한 담체를 포함하는 조성물에 관한 것이다. 본 조성물은 본원에 개시된 임의의 재조합 HIV Env 단백질, 삼량체성 복합체, 단리된 핵산 분자, 벡터, 또는 숙주 세포를 포함할 수 있다.

담체는 하나 이상의 제약상 허용가능한 부형제, 예컨대 결합제, 붕해제, 팽윤제, 현탁제, 유화제, 습윤제, 활택제, 착향제, 감미제, 방부제, 염색제, 가용화제 및 코팅을 포함할 수 있다. 담체 또는 기타 재료의 정확한 성질은 투여 경로, 예를 들어 근육내, 피내, 피하, 경구, 정맥내, 피부, 점막내 (예를 들어, 소화관), 비강내 또는 복강내 경로에 의존할 수 있다. 액상 주사용 제제, 예를 들어 현탁액 및 용액에 있어서, 적합한 담체 및 첨가제는 물, 글리콜, 오일, 알코올, 방부제, 착색제 등을 포함한다. 고형 경구 제제, 예를 들어, 산제, 캡슐, 당의정, 겔캡 및 정제에 있어서, 적합한 담체 및 첨가제는 전분, 당, 희석제, 과립화제, 활택제, 결합제, 붕해제 등을 포함한다. 코 스프레이/흡입제 혼합물에 있어서, 수성 용액/현탁액은 적합한 담체 및 첨가제로서 물, 글리콜, 오일, 연화제, 안정화제, 습윤제, 방부제, 방향제, 착향제 등을 포함할 수 있다.

본 발명의 조성물은 경구 (장관) 투여 및 비경구 주사를 포함하지만 이에 한정되는 것은 아닌, 투여를 촉진하고 효능을 개선하기 위해 대상체에 투여하기에 적합한 임의의 물질로 제형화될 수 있다. 비경구 주사는 정맥내 주사 또는 주입, 피하 주사, 피내 주사, 및 근육내 주사를 포함한다. 본 발명의 조성물은 또한 경점막, 안구, 직장, 투여, 장시간 작용성 이식, 설하 투여, 혀 아래, 문맥 순환을 우회하는 구강 점막으로부터, 흡입, 또는 비내 투여를 포함하는 기타 투여 경로용으로 제형화될 수 있다.

본 발명의 실시 형태는 또한 조성물의 제조 방법에 관한 것이다. 본 발명의 실시 형태에 따르면, 조성물의 제조 방법은 본 발명의 재조합 HIV Env 단백질, 삼량체성 복합체, 단리된 핵산, 벡터, 또는 숙주 세포를 하나 이상의 제약상 허용가능한 담체와 혼합하는 단계를 포함한다. 당업자는 이러한 조성물을 제조하기 위해 사용되는 통상적인 기술에 익숙할 것이다.

HIV 항원 (예를 들어, HIV gag, pol, 및/또는 env 유전자 생성물로부터 유래되는 단백질 또는 이의 단편) 및 HIV 항원을 발현하는 벡터, 예컨대 바이러스 벡터는, HIV 감염에 대하여 대상체를 백신접종하기 위한, 또는 대상체에서 HIV 감염에 대한 면역 반응을 생성하기 위한 백신 및 면역원성 조성물에서 이전에 사용되었었다. 본원에서 사용되는 "대상"은 이에 대해 본 발명의 구현예에 따른 면역학적 조성물이 투여될 것이거나 투여된 임의의 동물, 바람직하게는 포유류, 가장 바람직하게는 인간을 의미한다. 본원에서 사용되는 바와 같이, "포유류"라는 용어는 임의의 포유류를 포괄한다. 포유류의 예는 마우스, 래트, 토끼, 기니피그, 원숭이, 인간 등, 바람직하게는 인간을 포함하지만, 이에 한정되는 것은 아니다. 또한 본 발명의 재조합 HIV Env 단백질은 필요로 하는 대상체에서 인간 면역결핍 바이러스 (HIV)에 대하여 면역 반응을 유도하기 위한 항원으로 사용될 수 있다. 면역 반응은 하나 이상의 HIV 클레이드, 예컨대 클레이드 A, 클레이드 B, 클레이드 C 등에 대한 것일 수 있다. 조성물은 재조합 HIV Env 단백질을 발현하는 벡터를 포함할 수 있거나, 조성물은 본 발명의 실시 형태에 따른 단리된 재조합 HIV Env 단백질을 포함할 수 있다.

예를 들어, 재조합 HIV 단백질 또는 이의 삼량체성 복합체를 포함하는 조성물이 필요로 하는 대상체에게 투여되어 대상체에서 HIV 감염에 대한 면역 반응을 유도할 수 있다. 또한 본 발명의 재조합 HIV Env 단백질을 코딩하는 벡터, 예컨대 아데노바이러스 벡터를 포함하는 조성물 (여기서, 재조합 HIV Env 단백질은 벡터에 의해 발현됨)이 필요로 하는 대상체에게 투여되어 대상체에서 HIV 감염에 대한 면역 반응을 유도할 수 있다. 본원에 개시된 방법은 또한, 면역 반응의 프라이밍 및 부스팅 방법을 포함하여, 바람직하게는 하나 이상의 벡터, 예컨대 아데노바이러스 벡터 또는 MVA 벡터로부터 발현되는 하나 이상의 추가 HIV 항원 (예를 들어, HIV gag, pol, 및/또는 env 유전자 생성물로부터 유래된 단백질 또는 이의 단편)과 조합된 본 발명의 조성물을 투여하는 단계를 포함한다.

특정 실시 형태에서, HIV Env 단백질은 입자, 예컨대 리포좀, 바이러스-유사 입자 (VLP), 나노입자, 비로좀, 또는 엑소좀 (선택적으로 내인성 및/또는 외인성 아쥬반트와 조합됨) 상에서 디스플레이될 수 있다. 가용성 또는 단량체성 Env 단백질 단독과 비교할 때, 그러한 입자는 전형적으로 생체 내에서 향상된 항원 제시 효능을 디스플레이한다.

HIV Env 단백질을 디스플레이하는 VLP의 예는 예를 들어 HIV Env 단백질을 자가-조립성 바이러스 단백질, 예컨대 HIV Gag 코어 또는 기타 레트로바이러스 Gag 단백질과 공동발현시킴으로써 제조될 수 있다. VLP는 바이러스와 유사하지만, 바이러스 유전 물질을 포함하지 않기 때문에 비-감염성이다. 바이러스 구조 단백질, 예컨대 엔벨로프 또는 캡시드의 발현은 VLP의 자가-조립으로 이어질 수 있다. VLP는 당업자에게 잘 알려져 있으며, 백신에서의 이의 사용은 예를 들어 문헌[Kushnir et al, 2012]에 기술되어 있다.

바람직한 특정 실시 형태에서, 입자는 리포좀이다. 리포좀은 적어도 하나의 지질 이중층을 갖는 구형 소포이다. HIV Env 삼량체 단백질은 예를 들어 그러한 리포좀에 정전기적 상호작용에 의해, 예를 들어 리포좀 내의 유도체화 지질의 헤드 그룹 내로 혼입된 Ni² ⁺ 또는 Co² ⁺와 같은 2가 킬레이팅 원자 및 HIV Env 삼량체의 C-말단에의 His-태그의 부가에 의해 비-공유적으로 커플링될 수 있다. 특정한 비제한적 예시적 실시 형태에서, 리포좀은 1,2-디스테아로일-sn-글리세로-3-포스포콜린 (DSPC), 콜레스테롤, 및 1,2-디올레오일-sn-글리세로-3-[(N-(5-아미노-1-카르복시펜틸)이미노디아세트산)숙시닐]의 니켈 또는 코발트 염 (DGS-NTA(Ni² ⁺) 또는 DGS-NTA(Co² ⁺))을 60:36:4의 몰비로 포함한다. 바람직한 실시 형태에서, HIV Env 삼량체 단백질은 예를 들어 리포좀 표면 내에 통합된 말레이미드 작용기를 통하여 리포좀 표면에 공유적으로 커플링된다. 이의 특정한 비제한적 예시적 실시 형태에서, 리포좀은 DSPC, 콜레스테롤, 및 1,2-디팔미토일-sn-글리세로-3-포스포에탄올아민-N-[4-(p-말레이미도메틸)시클로헥산-카르복스아미드] 지질을 54:30:16의 몰비로 포함한다. HIV Env 단백질은 이것에 예를 들어 HIV Env 단백질에서의 부가된 C-말단 시스테인을 통하여 커플링될 수 있다. 공유적으로 커플링된 변이체는 더 안정하며, 높은 항원 특이적 IgG 역가를 이끌어 내며, Env 삼량체의 항원적으로 덜 관련있는 “하부”의 에피토프는 차폐된다. 리포좀에 커플링된 HIV Env 삼량체의 제조 방법과, 이의 특성화는 공지되어 있으며, 예를 들어 본원에 참고로 포함된 문헌[Bale et al, 2017]에 개시되었다. 또한 본 발명은 리포좀에 융합되고/되거나 리포좀 상에서 디스플레이되는 본 발명의 HIV Env 단백질을 제공한다.

특정 실시 형태에서, 본 발명의 HIV Env 단백질은 자가-조립 입자에 융합되거나, 나노입자 상에서 디스플레이된다. 항원 나노입자는 다수의 카피의 항원, 예를 들어 본 발명의 HIV Env 단백질을 제시하는 폴리펩티드들의 조립체이며, 이는 다수의 결합 부위를 생성하고 (친화력), 개선된 항원 안정성 및 면역원성을 제공할 수 있다. 백신에서 사용하기 위한 자가-조립 단백질 나노입자의 제조 및 사용은 당업자에게 잘 알려져 있으며, 예를 들어 문헌[Zhao et al, 2014], 문헌[Lσpez-Sagaseta et al, 2016]을 참조한다. 비제한적 예로서, 자가-조립 나노입자는 페리틴, 박테리오페리틴, 또는 DPS를 기반으로 할 수 있다. 표면 상에서 단백질을 디스플레이하는 DPS 나노입자는 예를 들어 국제 공개 제2011/082087호에 기술되어 있다. 그러한 입자 상의 삼량체성 HIV-1 항원의 설명은 예를 들어 문헌[He et al, 2016]에 기술되어 있다. 다른 자가-조립 단백질 나노입자와, 이의 제조는 예를 들어 본원에 참고로 포함된 국제 공개 제2014/124301호 및 미국 특허 출원 공개 제2016/0122392호에 개시되어 있다. 또한 본 발명은 자가-조립 나노입자에 융합되고/되거나 자가-조립 나노입자 상에서 디스플레이되는 본 발명의 HIV Env 단백질을 제공한다. 또한 본 발명은 본 발명에 따른 VLP, 리포좀, 또는 자가-조립 나노입자를 포함하는 조성물을 제공한다.

특정 실시 형태에서, 아쥬반트가 본 발명의 조성물에 포함되거나 본 발명의 조성물과 함께 공동투여된다. 아쥬반트의 사용은 선택적이며, 이는 조성물이 백신접종 목적에 사용될 때 면역 반응을 추가로 향상시킬 수 있다. 본 발명에 따른 조성물에 포함시키거나 공동투여하기에 적합한 아쥬반트는 바람직하게는 사람에 있어서 잠재적으로 안전하고, 내용성이 좋고, 효과적인 것이어야 한다. 그러한 아쥬반트는 당업자에게 잘 알려져 있으며, 비제한적 예는 QS-21, Detox-PC, MPL-SE, MoGM-CSF, TiterMax-G, CRL- 1005, GERBU, TERamide, PSC97B, 아쥬머 (Adjumer), PG-026, GSK-I, GcMAF, B-알레틴 (alethine), MPC-026, 아쥬박스 (Adjuvax), CpG ODN, 베타펙틴 (Betafectin), 알루미늄 염, 예컨대 알루미늄 포스페이트 (예를 들어 아쥬포스 (AdjuPhos)) 또는 알루미늄 히드록시드, 및 MF59를 포함한다.

본 발명의 다른 양태는 서열 번호 2 또는 서열 번호 4의 아미노산 서열 (이는 각각 HIV 엔벨로프 콘센서스 클레이드 C 및 콘센서스 클레이드 B 서열을 나타냄)과 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 포함하는 재조합 HIV 엔벨로프 단백질에 관한 것이다. 이러한 콘센서스 서열은 천연 발생 서열에서 전혀 발견되지 않았으며, 따라서 신규한 HIV 엔벨로프 단백질인 것으로 믿어진다. 서열 번호 2 또는 서열 번호 4의 아미노산 서열과 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 아미노산 서열을 포함하는 재조합 HIV 엔벨로프 단백질은 선택적으로, 소위 SOSIP 돌연변이 및/또는 푸린 절단 부위에서의 돌연변이, 예를 들어 서열 번호 3으로 나타낸 서열, 또는 위치 558 및/또는 위치 556에서 Pro을 추가로 포함하는 서열 번호 3의 서열; 및 서열 번호 5의 서열, 또는 위치 558 및/또는 위치 556에서 Pro을 추가로 포함하는 서열 번호 5의 서열에서의 돌연변이를 추가로 포함한다. 이러한 서열들에 있어서 동일성 %를 결정할 때, 돌연변이된 푸린 절단 부위에서의 아미노산 및 위치 501, 605, 559, 556 및 558에서의 아미노산은 바람직하게는 고려되지 않는다. 놀랍게도, 그러한 단백질은 고수준으로 발현되며, 고수준의 안정성 및 삼량체 형성성을 갖는다는 것이 밝혀졌다. 특정 실시 형태에서 그러한 HIV Env 단백질은 백본 단백질로 사용될 수 있으며, 여기서, 상기에 설명된 돌연변이는 본 발명의 분자를 수득하도록 만들어질 수 있다. 이러한 서열을 코딩하는 단리된 핵산 분자, 프로모터에 작동가능하게 연결된 이러한 서열을 포함하는 벡터, 및 이 단백질, 단리된 핵산 분자, 또는 벡터를 포함하는 조성물이 또한 본 발명에 의해 고려된다.

실시 형태

실시 형태 1은 하기로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 2개의 위치에서의 표시된 아미노산 잔기를 갖는 HIV Env 단백질의 아미노산 서열을 포함하는 재조합 HIV Env 단백질이다:

(i) 위치 651에서 Phe, Leu, Met, 또는 Trp, 바람직하게는 Phe;

(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp, 바람직하게는 Ile;

(iii) 위치 535에서 Asn 또는 Gln, 바람직하게는 Asn;

(iv) 위치 589에서 Val, Ile 또는 Ala, 바람직하게는 Val 또는 Ile;

(v) 위치 573에서 Phe 또는 Trp, 바람직하게는 Phe;

(vi) 위치 204에서 Ile; 및

(vii) 위치 647에서 Phe, Met, 또는 Ile, 바람직하게는 Phe

(여기서, 위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름).

실시 형태 2는 HIV Env 단백질의 아미노산 서열 및 하기로 이루어진 군으로부터 선택되는 표시된 위치 중 적어도 하나에서의 표시된 아미노산 잔기에 의한 아미노산 치환을 포함하는 재조합 HIV Env 단백질이다:

(i) 위치 651에서 Phe, Leu, Met, 또는 Trp, 바람직하게는 Phe;

(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp, 바람직하게는 Ile;

(iii) 위치 535에서 Asn 또는 Gln, 바람직하게는 Asn;

(iv) 위치 589에서 Val, Ile 또는 Ala, 바람직하게는 Val 또는 Ile;

(v) 위치 573에서 Phe 또는 Trp, 바람직하게는 Phe;

(vi) 위치 204에서 Ile; 및

(vii) 위치 647에서 Phe, Met, 또는 Ile, 바람직하게는 Phe

(여기서, HIV Env 단백질은

(1) 예를 들어 (서열 번호 2, 3, 4 또는 5)의 아미노산 서열을 포함하는, 예를 들어 클레이드 C 또는 클레이드 B 유래의 콘센서스 서열을 갖는 HIV Env 단백질; 또는

(2) 합성 HIV Env 단백질 (예를 들어 (a) 서열 번호 6의 아미노산 서열; (b) 위치 166에서 Glu의 Arg로의 돌연변이를 갖는 서열 번호 6의 아미노산 서열; (c) 서열 번호 7의 아미노산 서열; 또는 (d) 서열 번호 8 또는 서열 번호 9의 아미노산 서열을 포함함) (여기서, (a), (b) 또는 (d)는 선택적으로, 추가 SOSIP (위치 501 및 605에서의 Cys 및 위치 559에서의 Pro) 및/또는 푸린 절단 부위 돌연변이 (예를 들어, 아미노산 508~511을 대체하는 서열 번호 10)를 가질 수 있음); 또는

(3) 적어도 100개, 바람직하게는 적어도 1000개, 바람직하게는 적어도 10000개의 야생형 HIV Env 서열들의 컬렉션에서의 HIV Env 서열의 7.5% 미만, 바람직하게는 2% 미만의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에서의 적어도 하나의 복구 돌연변이를 포함하는, 바람직하게는 클레이드 C의 야생형 HIV Env 단백질 (여기서, 복구 돌연변이는 상기 컬렉션에서의 HIV Env 서열의 적어도 10%의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에 의한 치환이며, 바람직하게는 복구 돌연변이는 상기 컬렉션에서 가장 빈번하게 상응하는 위치에 존재하는 아미노산 잔기에 의한 치환임)로 이루어진 군으로부터 선택되며;

위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름).

실시 형태 3은 HIV Env 단백질의 아미노산 서열 및 하기로 이루어진 군으로부터 선택되는 표시된 위치 중 적어도 하나에서의 표시된 아미노산 잔기에 의한 아미노산 치환을 포함하는 재조합 HIV Env 단백질이다:

(i) 위치 651에서 Phe, Leu, Met, 또는 Trp, 바람직하게는 Phe;

(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp, 바람직하게는 Ile;

(iii) 위치 535에서 Asn 또는 Gln, 바람직하게는 Asn;

(iv) 위치 589에서 Val, Ile 또는 Ala, 바람직하게는 Val 또는 Ile;

(v) 위치 573에서 Phe 또는 Trp, 바람직하게는 Phe;

(vi) 위치 204에서 Ile; 및

(vii) 위치 647에서 Phe, Met, 또는 Ile, 바람직하게는 Phe

(여기서, HIV Env 단백질은

(a) 위치 501 및 605에서의 Cys;

(b) 위치 559에서 Pro;

(c) 위치 501 및 605에서 Cys 및 위치 559에서 Pro로 이루어진 군으로부터 선택되는 적어도 하나의 돌연변이를 포함하는 SOSIP 돌연변이 HIV Env 단백질이며;

실시 형태 4는 (i)~(vii)로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 2개의 위치에서 표시된 아미노산 잔기를 포함하는, 실시 형태 2의 재조합 HIV Env 단백질이다.

실시 형태 5는 (i)~(vii)로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 2개의 위치에서 표시된 아미노산 잔기를 포함하는, 실시 형태 3의 재조합 HIV Env 단백질이다.

실시 형태 6은 위치 501 및 605에서 Cys 또는 위치 559에서 Pro, 바람직하게는 위치 501 및 605에서 Cys 및 위치 559에서 Pro을 추가로 포함하는, 실시 형태 1, 2 및 4 중 임의의 것의 재조합 HIV Env 단백질이다.

실시 형태 7은 (i)~(vii)로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 3개의 위치에서 표시된 아미노산 잔기를 포함하는, 실시 형태 1 내지 6 중 임의의 것의 재조합 HIV Env 단백질이다.

실시 형태 8은 (i)~(vii)로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 4개의 위치에서 표시된 아미노산 잔기를 포함하는, 실시 형태 1 내지 6 중 임의의 것의 재조합 HIV Env 단백질이다.

실시 형태 9는 (i)~(vii)로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 5개의 위치에서 표시된 아미노산 잔기를 포함하는, 실시 형태 1 내지 6 중 임의의 것의 재조합 HIV Env 단백질이다.

실시 형태 10은 (i)~(vii)로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 6개의 위치에서 표시된 아미노산 잔기를 포함하는, 실시 형태 1 내지 6 중 임의의 것의 재조합 HIV Env 단백질이다.

실시 형태 11은 (i)~(vii)로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 7개의 위치에서 표시된 아미노산 잔기를 포함하는, 실시 형태 1 내지 6 중 임의의 것의 재조합 HIV Env 단백질이다.

실시 형태 12는 상기 적어도 2개의 표시된 위치 및 잔기가 하기로 이루어진 군으로부터 선택되는 조합인, 실시 형태 1, 4 및 5 중 임의의 것의 재조합 HIV Env 단백질이다: 651F, 655I; 651F, 535N; 651F, 589V; 651F, 589I; 651F, 573F; 651F, 204I; 651F, 647F; 655I, 535N; 655I, 589V; 655I, 589I; 655I, 573F; 655I, 204I; 655I, 647F; 535N, 589V; 535N, 589I; 535N, 573F; 535N, 204I; 535N, 647F ; 589V, 573F; 589V, 204I; 589V, 647F; 589I, 573F; 589I, 204I; 589I, 647F; 573F, 204I; 573F, 647F; 및 204I, 647F.

실시 형태 13은 상기 적어도 3개의 표시된 위치 및 잔기가 하기로 이루어진 군으로부터 선택되는 조합인, 실시 형태 7의 재조합 HIV Env 단백질이다: 651F, 655I, 535N; 651F, 589V, 535N; 651F, 589I, 535N; 651F, 573F, 535N; 651F, 204I, 535N; 651F, 647F, 535N; 655I, 589V, 535N; 655I, 589I, 535N; 655I, 573F, 535N; 655I, 204I, 535N; 655I, 647F, 535N; 589V, 573F, 535N; 589V, 204I, 535N; 589V, 647F, 535N; 589I, 573F, 535N; 589I, 204I, 535N; 589I, 647F, 535N; 573F, 204I, 535N; 573F, 647F, 535N; 204I, 647F, 535N; 651F, 655I, 589V; 651F, 573F, 589V; 651F, 204I, 589V; 651F, 647F, 589V; 655I, 573F, 589V; 655I, 204I, 589V; 655I, 647F, 589V; 573F, 204I, 589V; 573F, 647F, 589V; 204I, 647F, 589V; 651F, 655I, 589I; 651F, 573F, 589I; 651F, 204I, 589I; 651F, 647F, 589I; 655I, 573F, 589I; 655I, 204I, 589I; 655I, 647F, 589I; 573F, 204I, 589I; 573F, 647F, 589I; 204I, 647F, 589I; 651F, 655I, 573F; 651F, 204I, 573F; 651F, 647F, 573F; 655I, 204I, 573F; 655I, 647F, 573F; 204I, 647F, 573F; 651F, 655I, 204I; 651F, 647F, 204I; 655I, 647F, 204I; 651F, 655I, 647F; 655I, 651F, 647F; 655I, 651F, 535N; 655I, 589V, 573F; 및 655I, 589V, 204I.

실시 형태 14는 상기 적어도 4개의 표시된 위치 및 잔기가 하기로 이루어진 군으로부터 선택되는 조합인, 실시 형태 8의 재조합 HIV Env 단백질이다: 651F, 655I, 535N, 589V; 651F, 655I, 535N, 573F; 651F, 655I, 589V, 573F; 651F, 535N, 589V, 573F; 655I, 535N, 589V, 573F; 651F, 655I, 535N, 204I; 651F, 655I, 589V, 204I; 651F, 535N, 589V, 204I; 655I, 535N, 589V, 204I; 651F, 655I, 573F, 204I; 651F, 535N, 573F, 204I; 655I, 535N, 573F, 204I; 651F, 589V, 573F, 204I; 655I, 589V, 573F, 204I; 535N, 589V, 573F, 204I; 651F, 655I, 535N, 647F; 651F, 655I, 589V, 647F; 651F, 535N, 589V, 647F; 655I, 535N, 589V, 647F; 651F, 655I, 573F, 647F; 651F, 535N, 573F, 647F; 655I, 535N, 573F, 647F; 651F, 589V, 573F, 647F; 655I, 589V, 573F, 647F; 535N, 589V, 573F, 647F; 651F, 655I, 204I, 647F; 651F, 535N, 204I, 647F; 655I, 535N, 204I, 647F; 651F, 589V, 204I, 647F; 655I, 589V, 204I, 647F; 535N, 589V, 204I, 647F; 651F, 573F, 204I, 647F; 655I, 573F, 204I, 647F; 535N, 573F, 204I, 647F; 및 589V, 573F, 204I, 647F.

실시 형태 15는 상기 적어도 5개의 표시된 위치 및 잔기가 하기로 이루어진 군으로부터 선택되는 조합인, 실시 형태 9의 재조합 HIV Env 단백질이다: 651F, 655I, 535N, 589V, 573F; 651F, 655I, 535N, 589V, 204I; 651F, 655I, 535N, 573F, 204I; 651F, 655I, 589V, 573F, 204I; 651F, 535N, 589V, 573F, 204I; 655I, 535N, 589V, 573F, 204I; 651F, 655I, 535N, 589V, 647F; 651F, 655I, 535N, 573F, 647F; 651F, 655I, 589V, 573F, 647F; 651F, 535N, 589V, 573F, 647F; 655I, 535N, 589V, 573F, 647F; 651F, 655I, 535N, 204I, 647F; 651F, 655I, 589V, 204I, 647F; 651F, 535N, 589V, 204I, 647F; 655I, 535N, 589V, 204I, 647F; 651F, 655I, 573F, 204I, 647F; 651F, 535N, 573F, 204I, 647F; 655I, 535N, 573F, 204I, 647F; 651F, 589V, 573F, 204I, 647F; 655I, 589V, 573F, 204I, 647F; 및 535N, 589V, 573F, 204I, 647F.

실시 형태 16은 상기 적어도 6개의 표시된 위치 및 잔기가 하기로 이루어진 군으로부터 선택되는 조합인, 실시 형태 10의 재조합 HIV Env 단백질이다: 651F, 655I, 535N, 589V, 573F, 204I; 651F, 655I, 535N, 589V, 573F, 647F; 651F, 655I, 535N, 589V, 204I, 647F; 651F, 655I, 535N, 573F, 204I, 647F; 651F, 655I, 589V, 573F, 204I, 647F; 651F, 535N, 589V, 573F, 204I, 647F; 및 655I, 535N, 589V, 573F, 204I, 647F.

실시 형태 17은 하기로 이루어진 군으로부터 선택되는 표시된 위치들 중 적어도 하나의 위치에서의 표시된 아미노산 잔기에 의한 아미노산 치환을 추가로 포함하는, 실시 형태 1 내지 16 중 임의의 것의 재조합 HIV Env 단백질이다:

(viii) 위치 588에서 Gln, Glu, Ile, Met, Val, Trp, 또는 Phe, 바람직하게는 Gln 또는 Glu;

(ix) 위치 64에서 Lys 또는 위치 66에서 Arg 또는 위치 64에서 Lys 및 위치 66에서 Arg;

(x) 위치 316에서 Trp;

(xi) 위치 201 및 433 둘 다에서 Cys;

(xii) 위치 556 또는 558에서, 또는 위치 556 및 558 둘 다에서 Pro; 및

(xv) 위치 302에서 Tyr, 또는 위치 519에서 Arg, 또는 위치 520에서 Arg, 또는 위치 302에서 Tyr 및 위치 519에서 Arg, 또는 위치 302에서 Tyr 및 위치 520에서 Arg, 또는 위치 302에서 Tyr 및 위치 519 및 520 둘 다에서 Arg

실시 형태 18은 HIV Env 단백질의 푸린 절단 서열에서의 돌연변이를 추가로 포함하는 실시 형태 1 내지 17 중 임의의 것의 재조합 HIV Env 단백질이다.

실시 형태 19는 푸린 절단 부위에서의 돌연변이가 RRRRRR (서열 번호 10)에 의한 위치 508~511에서의 대체인, 실시 형태 18의 재조합 HIV Env 단백질이다.

실시 형태 20은 gp140 또는 gp160인, 실시 형태 1 내지 19 중 임의의 것의 재조합 HIV Env 단백질이다.

실시 형태 21은, (i)~(vii)로 이루어진 군으로부터 선택되는 표시된 위치에서의 표시된 아미노산 잔기 중 상기 하나 이상의 잔기를 갖지 않는 HIV Env 단백질과 비교하여 개선된 삼량체 형성 백분율 및 개선된 삼량체 수득량 중 적어도 하나를 갖는, 실시 형태 1 내지 20 중 임의의 것의 재조합 HIV Env 단백질이다.

실시 형태 22는 삼량체 형성이 다중각 광 산란을 이용한 크기 배제 크로마토그래피 (SEC-MALS)에 의해 측정되는, 실시 형태 21의 재조합 HIV Env 단백질.

실시 형태 23은 위치 658에서 Val, Ile, Phe, Met, Ala, 또는 Leu, 바람직하게는 Val 또는 Ile, 가장 바람직하게는 Val으로부터 선택되는 아미노산 잔기를 추가로 포함하는, 실시 형태 1 내지 22 중 임의의 것의 재조합 HIV Env 단백질이다.

실시 형태 24는 하기로 이루어진 군으로부터 선택되는 아미노산의 조합을 포함하는, 실시 형태 1 내지 23 중 임의의 것의 재조합 HIV Env 단백질이다:

(a) 655I, 589V, 573F, 651F, 588E, 535N, 204I;

(b) 556P, 655I, 535N, 573F, 589V, 204I, 588Q;

(c) 204I, 535N, 556P, 588E, 589V, 651F, 655I;

(d) 535N, 556P, 589V, 651F, 655I; 및

(e) 535N, 556P, 588E, 589V, 651F, 655I.

실시 형태 25는 서열 번호 3, 5, 20, 22, 24, 26, 27, 28, 29, 30, 31, 또는 32의 아미노산 서열 중 어느 하나와 적어도 95%, 96%, 97%, 98%, 99% 동일한, 바람직하게는 서열 번호 20, 22, 24, 26, 27, 28, 29, 30, 31, 또는 32의 아미노산 서열 중 어느 하나와 적어도 98% 동일한 아미노산 서열을 포함하는, 실시 형태 1 내지 24 중 임의의 것의 재조합 HIV Env 단백질이다.

실시 형태 26은 실시 형태 1 내지 25 중 임의의 것의 3개의 재조합 HIV Env 단백질의 비공유적 올리고머를 포함하는 삼량체성 복합체이다.

실시 형태 27은 실시 형태 1 내지 25 중 어느 하나의 재조합 HIV Env 단백질 또는 실시 형태 26의 삼량체성 복합체를 디스플레이하는 입자, 예를 들어 리포좀 또는 나노입자, 예를 들어 자가-조립 나노입자이다.

실시 형태 28은 실시 형태 1 내지 25 중 임의의 것의 재조합 HIV Env 단백질을 코딩하는 단리된 핵산 분자이다.

실시 형태 29는 프로모터에 작동가능하게 연결된 실시 형태 28의 단리된 핵산 분자를 포함하는 벡터이다.

실시 형태 30은 아데노바이러스 벡터인 실시 형태 29의 벡터이다.

실시 형태 31은 실시 형태 28의 단리된 핵산 분자 또는 실시 형태 29 또는 30의 벡터를 포함하는 숙주 세포이다.

실시 형태 32는 실시 형태 31의 숙주 세포를, 재조합 HIV Env 단백질의 생성에 적합한 조건 하에 성장시키는 단계를 포함하는 재조합 HIV Env 단백질의 생성 방법이다.

실시 형태 33은 프로모터에 작동가능하게 연결된 실시 형태 28의 단리된 핵산을 포함하는 발현 벡터를 수득하는 단계; 세포를 상기 발현 벡터로 형질감염시키는 단계; 형질감염된 세포를 재조합 HIV Env 단백질의 발현에 적합한 조건 하에 성장시키는 단계; 및 재조합 HIV Env 단백질을 안정화된 삼량체성 복합체의 형성을 가능케 하는 조건 하에 정제하는 단계를 포함하는 재조합 HIV Env 단백질의 생성 방법이다.

실시 형태 34는 (i)~(vii)로 이루어진 군으로부터 선택되는 위치에서의 표시된 아미노산 잔기를 생성하는 적어도 하나의 아미노산 치환을 백본 HIV 엔벨로프 단백질 서열 내로 도입하는 단계를 포함하는, 실시 형태 1 내지 25 중 어느 하나에 따른 재조합 HIV Env 단백질의 생성 방법이다.

실시 형태 35는 아미노산 치환을 코딩하는 뉴클레오티드 서열을 백본 HIV 엔벨로프 단백질 서열을 코딩하는 핵산 내로 도입하는, 실시 형태 34에 따른 방법이다.

실시 형태 36은 백본 HIV 엔벨로프 단백질 서열이 하기로 이루어진 군으로부터 선택되는, 실시 형태 34 또는 35의 방법이다: 서열 번호 2; 서열 번호 3; 서열 번호 4; 서열 번호 5; 서열 번호 6; 서열 번호 7; 서열 번호 8; 서열 번호 9; 위치 166에서 Glu의 Arg로의 돌연변이를 갖는 서열 번호 6; 위치 501 및 605에서 Cys 및 위치 559에서 Pro을 갖고/갖거나 아미노산 508~511이 대체된 서열 번호 10의 서열을 갖는 서열 번호 6; 위치 166에서 Glu의 Arg로의 돌연변이를 갖고, 추가로 위치 501 및 605에서 Cys 및 위치 559에서 Pro을 갖고/갖거나 아미노산 508~511을 대체하는 서열 번호 10의 서열을 갖는 서열 번호 6; 위치 501 및 605에서 Cys 및 위치 559에서 Pro을 갖고/갖거나 아미노산 508~511을 대체하는 서열 번호 10의 서열을 갖는 서열 번호 8; 위치 501 및 605에서 Cys 및 위치 559에서 Pro을 갖고/갖거나 아미노산 508~511을 대체하는 서열 번호 10의 서열을 갖는 서열 번호 9; 및 적어도 다음의 (a), (b) 또는 (c), 바람직하게는 다음의 (a), (b) 및 (c) 중 적어도 둘, 가장 바람직하게는 다음의 (a), (b) 및 (c)로 이어지는 돌연변이를 갖는 야생형 HIV Env 단백질:

(a) 위치 501 및 506에서 Cys 및 위치 559에서 Pro,

(b) 아미노산 508~511을 대체하는 서열 번호 10의 서열을 갖는 것, 및/또는

(c) 적어도 100개, 바람직하게는 적어도 1000개, 바람직하게는 적어도 10000개의 야생형 HIV Env 서열들의 컬렉션에서의 HIV Env 서열의 7.5% 미만, 바람직하게는 2% 미만의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에서의 적어도 하나의 복구 돌연변이 (여기서, 복구 돌연변이는 상기 컬렉션에서의 HIV Env 서열의 적어도 10%의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에 의한 치환이며, 바람직하게는 복구 돌연변이는 상기 컬렉션에서 가장 빈번하게 상응하는 위치에 존재하는 아미노산 잔기에 의한 치환임).

실시 형태 37은 실시 형태 1 내지 25 중 임의의 것의 재조합 HIV Env 단백질, 실시 형태 26의 삼량체성 복합체, 실시 형태 27의 입자, 실시 형태 28의 단리된 핵산 분자, 실시 형태 29 또는 30의 벡터, 또는 실시 형태 31의 숙주 세포, 및 제약상 허용가능한 담체를 포함하는 조성물이다.

실시 형태 38은 아쥬반트를 추가로 포함하는 실시 형태 37의 조성물이다.

실시 형태 39는 재조합 HIV Env 단백질, 삼량체성 복합체, 입자, 단리된 핵산, 벡터, 또는 숙주 세포를 하나 이상의 제약상 허용가능한 담체와 혼합하는 단계를 포함하는 실시 형태 37의 조성물의 생성 방법이다.

실시 형태 40은 대상체에게 실시 형태 1 내지 25 중 어느 하나의 재조합 HIV 엔벨로프 단백질, 실시 형태 26의 삼량체성 복합체, 실시 형태 27의 입자, 또는 실시 형태 29 또는 30의 벡터를 포함하는 조성물을 투여하는 단계를 포함하는 HIV 감염에 대한 대상체의 백신접종 방법이다.

실시 형태 41은 필요로 하는 대상체에서의 HIV 감염에 대한 면역 반응의 생성 방법으로서, 이는 대상체에게 실시 형태 1 내지 25 중 어느 하나의 재조합 HIV 엔벨로프 단백질, 실시 형태 26의 삼량체성 복합체, 실시 형태 27의 입자, 또는 실시 형태 29 또는 30의 벡터를 포함하는 조성물을 투여하는 단계를 포함한다.

실시 형태 42는 서열 번호 2의 아미노산 서열, 또는 이와 적어도 95% 동일한 서열을 포함하는 재조합 HIV Env 단백질이다.

실시 형태 43은 서열 번호 3의 아미노산 서열, 또는 이와 적어도 95% 동일한 서열을 포함하는 재조합 HIV Env 단백질이다.

실시 형태 44는 서열 번호 4의 아미노산 서열, 또는 이와 적어도 95% 동일한 서열을 포함하는 재조합 HIV Env 단백질이다.

실시 형태 45는 서열 번호 5의 아미노산 서열, 또는 이와 적어도 95% 동일한 서열을 포함하는 재조합 HIV Env 단백질이다.

실시 형태 46은 실시 형태 42 내지 45 중 임의의 것의 재조합 HIV Env 단백질을 코딩하는 단리된 핵산 분자이다.

실시 형태 47은 프로모터에 작동가능하게 연결된 실시 형태 46의 단리된 핵산 분자를 포함하는 벡터이다.

실시 형태 48은 아데노바이러스 벡터인 실시 형태 47의 벡터이다.

실시 형태 49는 실시 형태 46의 단리된 핵산 분자 또는 실시 형태 47 또는 48의 벡터를 포함하는 숙주 세포이다.

실시 형태 50은 실시 형태 42 내지 25 중 임의의 것의 재조합 HIV Env 단백질, 실시 형태 46의 단리된 핵산 분자, 실시 형태 47 또는 48의 벡터, 또는 실시 형태 49의 숙주 세포, 및 제약상 허용가능한 담체를 포함하는 조성물이다.

실시 형태 51은 모 HIV Env 단백질의 삼량체 백분율 및/또는 삼량체 수득량 (폴딩 및 안정성을 나타냄)을 개선시키는 방법으로서, 본 방법은 모 HIV Env 단백질 내에 적어도 하나의 복구 돌연변이, 바람직하게는 적어도 3개의 복구 돌연변이를 도입함으로써 모 HIV Env 단백질의 아미노산 서열을 복구하는 단계를 포함하고, 여기서, 복구 돌연변이는 적어도 100개, 바람직하게는 적어도 500개, 바람직하게는 적어도 1000개, 바람직하게는 적어도 10000개의 야생형 HIV Env 서열들의 컬렉션에서 HIV Env 서열의 7.5% 미만, 바람직하게는 2% 미만의 빈도로 상응하는 위치에서 발견되는 아미노산 잔기에서의 아미노산 치환이며, 상기 치환은 상기 컬렉션에서 HIV Env 서열의 적어도 10%의 빈도로 상응하는 위치에서 발견되는 아미노산 잔기에 의한 것이고, 바람직하게는 상기 치환은 상기 컬렉션에서 가장 빈번하게 상응하는 위치에서 발견되는 아미노산 잔기에 의한 것이다.

실시 형태 52는 상기 컬렉션에서 HIV Env 서열의 7.5% 미만의 빈도로 상응하는 위치에서 발견되는 모 HIV Env 단백질에서의 아미노산 잔기의 적어도 50%, 바람직하게는 적어도 80%가 복구되는, 실시 형태 51의 방법이다.

실시 형태 53은 상기 컬렉션에서 HIV Env 서열의 2% 미만의 빈도로 상응하는 위치에서 발견되는 모 HIV Env 단백질에서의 아미노산 잔기의 적어도 50%, 바람직하게는 적어도 80%가 복구되는, 실시 형태 51의 방법이다.

실시 형태 54는 모 HIV Env 단백질이 클레이드 C 유래의 것인, 실시 형태 51 내지 53 중 어느 하나의 방법이다.

실시 형태 55는 모 HIV Env 단백질이 야생형 HIV Env 단백질인, 실시 형태 51 내지 54 중 어느 하나의 방법이다.

실시 형태 56은 모 HIV Env 단백질이 하기 중 하나 이상을 포함하는, 실시 형태 51 내지 54 중 어느 하나의 방법이다:

(a) 위치 501 및 506에서 Cys 및 위치 559에서 Pro;

(b) 예를 들어 아미노산 508~511을 대체하는 서열 번호 10의 서열을 갖는, HIV Env 단백질의 푸린 절단 서열에서의 돌연변이;

(c) 위치 651에서 Phe;

(d) 위치 655에서 Ile;

(e) 위치 535에서 Asn;

(f) 위치 589에서 Val;

(g) 위치 573에서 Phe;

(h) 위치 204에서 Ile;

(i) 위치 647에서 Phe;

(j) 위치 658에서 Val;

(k) 위치 588에서 Gln 또는 Glu; 및/또는

(l) 위치 556, 558, 또는 556 및 558에서 Pro.

실시 형태 57은 실시 형태 51 내지 56 중 임의의 것의 방법에 의해 수득가능한 재조합 HIV Env 단백질이다.

실시예

실시예 1: HIV 엔벨로프 클레이드 C 및 클레이드 B 콘센서스 서열의 생성

HIV 엔벨로프 클레이드 C 콘센서스 서열

HIV 클레이드 C 엔벨로프 (Env) 단백질 콘센서스 서열을 HIV Env 단백질의 삼량체 형성에 대한 다양한 돌연변이의 영향을 연구하기 위한 백본 서열로서 개발하였다. 공지된 HIV 바이러스 단리체로부터의 3,434개의 엔벨로프 단백질 서열의 서열 정렬을 Los Alamos Database (http://www.hiv.lanl.gov/content/index)로부터 다운로드하였다. 3,434개 서열로부터, 단지 클레이드 C의 1,252개 서열을 선택하여 HIV 클레이드 C Env 단백질 콘센서스 서열을 생성하였다. 콘센서스 잔기가 정렬에 기초하여 명확하게 확인될 수 없는 위치에서는, BLAST 검색에 의해 가장 가까운 야생형 서열을 확인하기 위하여 콘센서스 서열을 이용하였다. 그 후 이들 위치에서의 콘센서스 잔기를 BLAST 검색으로부터 확인된 가장 가까운 야생형 서열에서의 아미노산으로서 선택하였다. HIV Env 클레이드 C 콘센서스 서열을 서열 번호 2로 나타낸다. BLAST를 이용할 경우 서열 번호 2에 대하여 최고의 상동성을 갖는 두 서열은 Genbank 번호 ADM30337.1 및 ADM30340.1을 갖는 서열이었으며, 이들 둘 다는 서열 번호 2에 대하여 90% 서열 동일성을 가졌다.

위치 501 및 605에서 시스테인 잔기 및 위치 559에서 프롤린 잔기를 포함하는 소위 SOSIP 돌연변이를 도입하고, 잔기 508-511에서 푸린 부위를 6개 아르기닌 잔기로 대체함으로써 푸린 절단 부위를 최적화함으로써 HIV Env 클레이드 C 콘센서스 서열을 추가로 변형하였다. 또한, 위치 295에서의 Val을 Asn (V295N)로 돌연변이시켜, 대다수의 HIV 주에 존재하며 일부 실험에서 사용된 특정 항체에의 결합을 개선할 수 있는 N-연결 글리코실화 부위를 생성하였다. 추가적으로, C-말단을 잔기 664에서 절두시켜, 가용성 HIV gp140 단백질을 코딩하는 서열을 생성하였다. 상기에 기술된 치환/변형의 모든 위치는 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 대한 것이다. "ConC_SOSIP"으로 칭해지는, 생성된 HIV gp140 서열은 (서열 번호 3)으로 나타낸다. ConC_SOSIP 서열은 추가의 돌연변이, 예를 들어, 단일 및 이중 아미노산 치환이 도입되어 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질을 생성하는 백본 또는 모 HIV 엔벨로프 서열로서 사용되었다.

HIV 엔벨로프 클레이드 C 콘센서스 서열

HIV Env 클레이드 C 콘센서스 서열을 생성하기 위하여 상기에 개시한 것과 유사한 절차를 이용하여 HIV Env 클레이드 B 콘센서스 서열을 생성하였다. 클레이드 B 콘센서스 서열은 공지된 클레이드 B 바이러스 단리체로부터의 1,708개 클레이드 B 엔벨로프 단백질 서열을 이용하여 생성하였다. HIV Env 클레이드 B 콘센서스 서열을 서열 번호 4로 나타낸다.

HIV Env 클레이드 B 콘센서스 서열은 소위 SOSIP 돌연변이를 도입하고, 푸린 부위를 6개 아르기닌 잔기로 대체하여 푸린 절단 부위를 최적화하고, 상기에 기술된 바와 같이 잔기 664에서 C-말단을 절두함으로써 추가로 변형시켜, 가용성 HIV gp140 클레이드 B 콘센서스 서열을 코딩하는 서열을 생성하였다. "ConB_SOSIP"로 칭해지는, 생성된 HIV gp140 Env 단백질 서열을 (서열 번호 5)로 나타낸다.

놀랍게도, 콘센서스-기반 분자가 천연 단리체를 기반으로 하는 분자에 비하여 발현 수준이 개선되었으며, 또한 삼량체화 수준을 이미 개선하였음이 밝혀졌다. 따라서, 서열 번호 2~5를 가진 분자는 이미 놀라울 정도로 유익한 특성을 갖는다.

실시예 2: 재조합 HIV Env 단백질의 발현 및 정제

재조합 HIV Env 단백질을 가용성 gp140 단백질로서 발현시키고 정제하였다. 단일 돌연변이 (아미노산 치환) 및 그 조합 (예를 들어, 이중 및 삼중 돌연변이)을 ConC_SOSIP 백본 콘센서스 서열 내로 도입하여 일련의 재조합 HIV Env 단백질 변이체를 생성하였다.

HIV gp140 Env 구축물 및 변이체의 생성 및 발현

서열 번호 3으로 나타낸 HIV 클레이드 C Env 콘센서스 서열 ConC_SOSIP를 코딩하는 DNA를 GenScript (Piscataway, NJ 08854) 또는 Gene Art (Life Technologies, 미국 캘리포니아주 칼스배드 소재)에서 합성하고 코돈-최적화시켰다. 이어서 코돈-최적화된 서열을 벡터 pcDNA2004 내로 클로닝하여 HIV 클레이드 C gp140 Env 구축물을 생성하고, 이것을 추가 돌연변이를 도입하기 위한 백본 HIV 엔벨로프 서열로서 사용하였다. pcDNA2004 HIV 클레이드 C gp140 Env 구축물에서 수행된 부위 지정 돌연변이 유발 및 폴리머라아제 연쇄 반응 (PCR)에 의해 ConC_SOSIP 백본 서열 내로 돌연변이를 도입하였다. HEK-Expi293F 세포 또는 HEK293F 세포를, 제조업자의 설명서에 따라 ConC_SOSIP 서열 또는 그 변이체를 코딩하는 pcDNA2004 벡터 90% 및 푸린 프로테아제 (푸린-pCDNA2004)를 코딩하는 pcDNA2004 벡터 10%로 일시적으로 형질감염시켰다. 형질감염된 세포를 5일 동안 37℃ 및 10% CO₂에서 배양하였다. 배양 상청액을 10분 동안 1250 x g에서 회전시켰다. 그 후, 회전 상청액을 0.22 ㎛ 진공 필터를 이용하여 살균 여과하고 추가 사용할 때까지 4℃에서 보관하였다.

96웰 포맷에서의 발현을 위하여 세포를 3일 동안 37℃ 및 10% CO₂에서 배양하였다. 4 uL의 Optimem (배양 배지)을 4 uL 100 ng/uL DNA 및 8 uL Expi293F 믹스 (54 uL/mL Optimem)와 혼합하고 20분 동안 인큐베이션하였다. 그 후 웰당 200 uL의 Expi293F 세포를 2.5 x 10E6개의 세포/mL로 첨가하였다. 배양 상청액을 수확하고, 300 g에서 5분 동안 회전시켜, 세포 및 세포 잔사를 제거하였다. 이후, 회전 상청액을 0.22 um 진공 필터를 사용하여 살균 여과하고, 사용할 때까지 4℃에 보관하였다.

HIV gp140 Env 단백질의 정제

pcDNA2004 벡터로부터 발현된 HIV gp140 Env 단백질을, 초기 정제를 위하여 갈란투스 니바리스 (Galantus nivalis)-렉틴 컬럼 (Vectorlabs, AL-1243)을 이용하고 후속 단계에서는 Superdex200 Increase 컬럼 (GE)을 이용하는 2단계 정제 프로토콜에 따라 정제하여 잔여 오염물질을 제거하였다. 갈란투스 니바리스-렉틴 컬럼을 이용하는 초기 단계를 위하여, 배양 상청액을 완충제 (40 mM Tris, 500 mM NaCl pH 7.5)로 희석하고 4 mL/분의 속도로 4 mL CV Tricorn 10~50 렉틴 아가로스 컬럼에 통과시켰다. 그 후, 컬럼을 4배 컬럼 부피 완충제 (40 mM Tris, 500 mM NaCl pH 7.5)로 세척하고 1.6 mL/min의 상향류 (upflow)로 4배 컬럼 부피의 40 mM Tris, 500 mM NaCl, 및 1 M 만노피라노시드 (pH 7.5)로 용출시켰으며, 이것은 엔벨로프 단백질의 용출 속도를 증가시키고 용출 부피를 감소시키기 위하여 유동 방향이 하향에서 상향으로 변경되었음을 의미한다. 용출액을 회전 농축기 (50K, Amicon Ultra, Millipore)를 이용하여 농축시켰다.

HIV gp140 Env 단백질은, 러닝 완충제로서 50 mM Tris, 150 mM NaCl pH 7.4를 이용하여 Superdex200 컬럼에서 추가로 정제하였다. 컬럼으로부터 용출된 두 번째 피크가 HIV gp140 Env 단백질을 함유하였다. 이 피크를 함유한 분획을 모았으며, 웨스턴 블롯과 SDS-PAGE 및/또는 SEC-MALS 분석을 이용할 경우 피크의 실체는 HIV gp140 Env 단백질로 확인되었다. 정제된 HIV gp140 Env 단백질의 농도는 280 nm에서의 광학 밀도 측정에 의해 결정하였으며, 정제된 HIV gp140 Env 단백질은 추가 사용할 때까지 4℃에서 보관하였다.

SDS-PAGE 및 웨스턴 블로팅 분석

발현된 HIV gp140 Env 단백질을 함유한 세포 배양 상청액 및 정제된 HIV gp140 Env 단백질 샘플을 환원 또는 비환원 조건 하에서 4~12% (w/v) Bis-Tris NuPAGE 겔, 1X MOPS (Life Technologies)에서 분석하고, iBlot 기술 (Life Technologies)을 이용하여 블로팅하였다. 모든 절차는 제조업자의 설명서에 따라 수행하였다. 순도 분석을 위하여, 겔을 Krypton Infrared Protein Stain (Thermo Scientific) 또는 SYPRO Rubi 단백질 염색제 (Bio-Rad)으로 염색하였다. 웨스턴 블로팅 분석을 위하여, 막을 항-6x-히스티딘-태그 항체 (항-His-HRP)로 탐침하였다. 겔과 블롯 막을 Odyssey 기기 (Li-Cor)에서 스캔하고, Odyssey 3.0 소프트웨어 (Li-Cor)를 이용하여 이미지를 분석하였다.

음성 염색 전자 현미경에 의한 HIV Env 삼량체 형성의 영상화

음성 염색 전자 현미경 (NS-EM)을 이용하여 ConC_SOSIP 백본 서열을 가진 엔벨로프 단백질의 삼량체를 영상화하였으며, 삼량체는 갈란투스 니바리스 렉틴, 이어서 크기 배제 크로마토그래피를 이용하여 정제하였으며, 문헌[Julien et al. 2015 (Proc. Natl. Acad. Sci. (2015) 112(38) 11947-52)]에 개시된 바와 같이 수행하였다. 삼량체 샘플을 Tris-완충 염수 (TBS), pH 7.4에서 0.01-0.5 mg/mL로 희석시키고, 사용 직전에 공기 2*10-1 mbar, 25 mA, 30 초에서 글로우 방전된 탄소-코팅 200 Cu 메쉬 격자판 (EMS CF200-Cu) 상에 부착시켰다. 그 후, 3 μL 방울의 희석 삼량체 샘플을 1분 동안 격자판에 가하고 이어서 여과지 (Whatman 번호 1 또는 4)로 블로팅시켰다. 격자판을 1분 동안 건조시킨 후, 3 μL의 2.3% 우라닐 아세테이트 (UAc)로 60초 동안 염색하였다. 시료 평면에서 4.68 Å의 픽셀 크기를 생성하는 25,000x의 배율로, 120 keV에서 작동하는 FEI Tecnai F20 전자 현미경을 이용하여 데이터를 수집하였다. Gatan BM 울트라스캔으로 이미지를 획득하였다.

(이 삼량체-농축 물질의) 이미지에서 거의 모든 입자는 잘 형성된 폐쇄 삼량체였다 (데이터는 예시되어 있지 않음).

실시예 3: 삼량체 수득량 및 삼량체 형성 백분율에 대한 재조합 HIV gp140 Env 변이체의 스크리닝

ConC_SOSIP 백본 서열에 비하여 형성된 삼량체의 백분율을 향상시키고/시키거나 삼량체 수득량을 향상시킨 돌연변이를 확인하기 위하여, 실시예 2에서 생성된 재조합 HIV Env 단백질 변이체를 삼량체 형성에 대하여 스크리닝하였다. 재조합 HIV Env 단백질에의 광범위 중화 HIV 항체 (bNAb) 및 비-bNAb 패널의 결합을 평가하기 위하여 AlphaLISA 분석법을 이용하여 삼량체 백분율 및 삼량체 수득량의 고처리 스크리닝을 수행하였다. AlphaLISA 분석법의 결과는 크기 배제 크로마토그래피 및 다중각 광 산란 (SEC-MALS)에 의해 확인하였다.

AlphaLISA® 분석법에 의한 분석

HIV gp140 Env 단백질의 총 발현 및 실시예 2에서 개시된 바와 같이 생성된 ConC_SOSIP 서열 내로 도입된 단일 아미노산 치환을 가진 200가지가 넘는 HIV gp140 변이체의 올바르게 폴딩된 천연 삼량체의 총 양을 AlphaLISA 분석법에 의해 세포 배양 상청액에서 측정하였다. 이중 및 삼중 돌연변이를 함유한 HIV gp140 변이체를 또한 테스트하였다. 임의의 추가의 돌연변이가 없는 ConC_SOSIP 서열을 가진 HIV Env 단백질을 비교를 위해 테스트하였다.

특히 하기 단클론 항체 (mAbs)를 분석에 사용하였다: mAb PGT145, mAb PGDM1400, mAb PG16, mAb PGT151, mAb 35O22, mAb PGT128, mAb PG9, mAb F105, mAb B6, mAb 447-52d, mAb 14e, 및 mAb 17b.MAb 447-52D (AB014), PG9 (AB015), 및 PG16 (AB016)을 Polymun Scientific Immunbiologische Forschung GmbH (오스크리아 클로스테르뉴베르크 소재)로부터 구매하였다. 비-중화 항체 b6은 Dennis R. Burton (The Scripps Research Institue, 미국 캘리포니아주 라 졸라 소재)으로부터 수득하였으며, 비-중화 항체 14e는 James E. Robinson (Tulane University, New Orleans, LA)로부터 수득하였다. mAbs PGT145 (PDB: 3U1S), PGDM1400 (PDB: 4RQQ), PGT151 (PDB: 4NUG), 35O22 (PDB: 4TVP), F105 (PDB: 1U6A), PGT128 (PDB: 3TYG), 및 17b (PDB: 4RQS)의 경우 공개된 서열을 코딩하는 핵산을 발현 벡터 내로 클로닝하고 HIV Env 단백질의 평가를 위해 생성하였다. mAb F105, B6, 447-52d, 14e, 및 17b를 제외하고, 분석을 위해 사용된 항체는 광범위 중화 항체 (bNAb)이다. bNAb는 다수의 HIV 바이러스 주를 중화할 수 있다. bNAb 중에서, PGT145, PGDM1400, 및 PG16은 첨부 결합자이며 삼량체 특이적이다. PGT151가 또한 삼량체 특이적이지만, gp120과 gp41의 두 프로모터의 계면에서 결합하며, 절단 의존적이다. 비-bNAb의 결합은 올바르지 않은 폴딩 또는 개방 삼량체 배좌를 나타낸다.

단백질 폴딩은 또한 CD4의 결합 후에만 노출되는, HIV 엔벨로프 단백질의 공동수용체 결합 부위에 결합하는 것으로 알려진 항체 (mAb 17b)에의 가용성 HIV gp140 Env 단백질 변이체의 결합을 측정함으로써 테스트하였다 (데이터는 예시되어 있지 않음). 구체적으로, CD4-유도된 배좌 변화를 평가하기 위하여 가용성 수용체 CD4 (sCD4)를 mAb 17과 조합하여 이용하였다. 엔벨로프 단백질에의 사전 CD4 결합 없이 HIV gp140 Env 단백질 변이체에의 mAb 17b의 결합은 부분적으로 비폴딩되거나 예비-촉발된 엔벨로프 단백질 (즉, CD4 결합의 부재 하에서 "개방" 배좌를 채택하는 불안정한 Env)을 나타낸다.

AlphaLISA 분석법을 위하여, 링커, 이어서 소르타아제 A 태그, 이어서 Flag-태그, 이어서 유연성 (G₄S)₇ 링커를 함유하며 His-태그로 끝나는 pcDNA2004 벡터 내의 HIV gp140 Env 구축물을 제조하였다 (HIV Env 단백질의 C-말단에 위치된 태그의 서열은 서열 번호 19로 제공된다). HIV gp140 Env 구축물을 HEK-Expi293 세포에서 발현시켰으며, 세포를 3일 동안 96웰 플레이트 (200 μL/웰)에서 배양하였다. 조 상청액을 AlphaLISA 완충제 (PBS + 0.05% Tween-20 + 0.5 mg/mL BSA)에서 120배 희석시켰다. mAb 17b 기반 분석법를 위하여, 상청액을 12배 희석시켰다. 그 후, 10 μL의 각 희석액을 96웰 플레이트로 옮기고 40 μL 억셉터 비드, 도너 비드 및 상기 열거된 mAb 중 하나와 혼합하였다. 도너 비드를 mAb에 결합하는 ProtA (카탈로그 번호: AS102M, 로트 번호 1831829, Perkin Elmer)에 콘쥬게이션시켰다. 억셉터 비드를 구축물의 His-태그에 결합하는 항-His 항체 (카탈로그 번호: AL128M, Perkin Elmer)에 콘쥬게이션시켰다. 모든 형태의 엔벨로프 단백질을 포함하는 총 단백질 수득량의 정량을 위하여, His-태그의 검출을 위한 니켈-콘쥬게이션된 도너 비드 (카탈로그 번호: AS101M, Perkin Elmer)와 Flag 태그의 검출을 위한 항-Flag 항체-콘쥬게이션 도너 비드 (카탈로그 번호: AL112R, Perkin Elmer)의 조합을 이용하였다. sCD4-His와 조합된 mAb 17b를 이용하는 테스트의 경우, ProtA 도너 비드와 항-Flag 억셉터 비드의 조합을 이용하였다 (데이터는 예시되어 있지 않음). 하나의 샘플은 삼량체 형성을 검출하기 위하여 공여체 및 억셉터 비드와 혼합하였으며, 동일한 Env 변이체의 두 번째 샘플은 발현된 단백질의 총량 (즉, 총 단백질 수득량)을 측정하기 위하여 니켈-콘쥬게이션 도너 비드 및 항-Flag 콘쥬게이션 억셉터 비드와 혼합하였다.

발현된 HIV gp140 Env 단백질, mAb, 도너 비드 및 억셉터 비드를 함유한 상청액의 혼합물을 교반 없이 2시간 동안 실온에서 인큐베이션하였다. 그 후, Synergy NEO 플레이트 판독기 기기 (BioTek)로 화학발광 신호를 측정하였다. 모크 형질감염 세포로 인한 평균 배경 신호를 각 HIV gp140 Env 변이체에 대해 측정된 AlphaLISA 카운트로부터 차감하였다. 그 후, 전체 데이터 세트를 ConC_SOSIP 백본 서열 신호를 가진 HIV Env 단백질에 대해 측정된 신호로 나누어서, 테스트된 각각의 HIV gp140 Env 변이체에 대한 신호를 백본에 대하여 정규화하였다. 삼량체 특이적 mAb PGT145에의 HIV gp140 Env 변이체 각각에 있어서의 결합 데이터를 이용하여 변이체 각각에 있어서의 삼량체 형성 백분율 및 삼량체 수득량을 결정하였다. 다른 mAb에의 결합을 이용하여 bNAb 및 비-bNAb에의 HIV Env 변이체의 일반적인 결합 패턴을 평가하였다 (예시되어 있지 않음).

HIV Env 변이체 각각에 있어서의 삼량체 형성 백분율은 HIV Env 변이체, mAb PGT145, ProtA-콘쥬게이션 도너 비드 및 항-His-콘쥬게이션 억셉터 비드의 샘플 혼합물로부터 수득한 정규화된 화학발광 신호를 HIV Env 변이체, 항-His-콘쥬게이션 도너 비드 및 항-Flag-콘쥬게이션 억셉터 비드의 샘플 혼합물로부터 수득한 정규화된 화학발광 신호로 나눔으로써 계산하였다.

HIV Env 변이체 각각에 있어서의 삼량체 수득량은 임의의 추가 돌연변이가 없는 ConC_SOSIP 백본 서열을 가진 HIV Env 단백질에 있어서의 삼량체 수득량에 비하여 결정되었다. ConC_SOSIP 엔벨로프 단백질에의 mAb PGT145의 결합으로부터 수득한 정규화된 화학발광 신호를 1로 설정하고, HIV gp140 단백질의 각각에의 mAb PGT145의 결합으로부터 수득한 정규화된 화학발광 신호를 이 값에 대하여 정규화하였다.

AlphaLISA 분석법에 의한 분석의 결과 - 삼량체 백분율 및 삼량체 수득량

ConC_SOSIP 백본 서열에서 상기 표 1의 (i)~(vii) 리스트로부터의 여러 단일, 이중 및 삼중 아미노산 치환에 대한 AlphaLISA 분석에 의해 결정된 삼량체 형성 백분율을 도 2a에 나타낸다. 테스트된 단일 아미노산 치환을 함유한 약 200가지 HIV gp140 Env 변이체 중에서, 형성된 삼량체의 백분율이, 임의의 추가의 아미노산 치환이 없는 ConC_SOSIP 백본 서열에 대해 형성된 삼량체의 백분율에 비하여 적어도 25%만큼 증가한 7가지 위치의 치환이 확인되었다.

도 2a로 나타낸 결과는 삼량체 형성 백분율에서의 유의한 증가가 관찰된 7가지 바람직한 위치의 치환이 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따라 N651, K655, I535, D589, I573, A204, 및 E647을 포함함을 입증한다. 특히, 가장 향상된 삼량체 형성 백분율을 야기한 단일 아미노산 치환은 N651F, K655I (/F/W) (K655F가 향상을 야기하는 것으로 보이는 하나의 실험도 있지만), I535N, D589V (/A), I573F, A204I, E647F를 포함하였다. 몇몇의 이들 돌연변이와 조합하여 테스트된 일부 돌연변이는 K588Q/E, I556P 및 A558P를 포함하였으며, 이들은 이 실험에서 본 발명의 위치에서 바람직한 아미노산 (표 1의 (i)~(vii))을 가진 돌연변이체의 삼량체 백분율을 더 향상시켰다.

이 실험에서 테스트된 모든 이중 치환은 상응하는 단일 치환보다 더 높은 삼량체 형성 백분율을 가졌으며, 테스트된 모든 삼중 치환은 상응하는 단일 및 이중 돌연변이보다 더 높은 삼량체 형성 백분율을 가졌다 (도 2a). 예상하지 못한 그리고 놀라운 이들 결과는 이들 돌연변이가 엔벨로프 단백질의 삼량체화와 관련하여 이들 실험에서 시너지를 보여줄 수 있음을 나타낸다.

향상된 삼량체 형성 백분율에 더하여, 증가된 삼량체 수득량이 또한 바람직하다. 따라서, ConC_SOSIP 백본 서열에서 단일, 이중 및 삼중 돌연변이를 함유한 HIV gp140 변이체의 삼량체 수득량을 또한 AlphaLISA 분석법에 의해 결정하였다. 결과를 도 2b에 나타낸다. 단일 돌연변이를 함유한 대부분의 HIV gp140 변이체 (예외는 I535N, D589A 및 D589I였음)는 ConC_SOSIP 엔벨로프 단백질보다 높은 삼량체 수득량을 가졌다. 그러나, 후술하는 바와 같이, I535N 돌연변이체의 보다 정확한 SEC-MALS 분석은 삼량체 수득량의 증가를 나타냈다. 더욱이, D589V과 같은, I535N과 조합된 추가의 돌연변이는 I535N 돌연변이의 부재 하에서 그 특정 추가 치환을 가진 엔벨로프 단백질에 대해 관찰된 동일한 삼량체 수득량으로 이어졌다. 이중 돌연변이를 가진 변이체의 삼량체 수득량이 또한 증가하였으며 이때 단일 돌연변이 변이체의 각각은 ConC_SOSIP 엔벨로프 단백질보다 더 높은 삼량체 수득량을 가졌다 (도 2b).

(문헌[De Taeye et al., supra])에 의해 개시된 E64K, T316W 이중 치환, 및 (문헌[Kwon et al., supra])에 의해 개시된 디술피드 이중 치환 I204C, A433C을 비롯한, 문헌에서 이전에 개시된 ConC_SOSIP 백본에서의 이중 돌연변이를 가진 HIV gp140 변이체에 있어서의 삼량체 형성 백분율을 또한 테스트하였다. E64K, T316W 이중 치환은 ConC_SOSIP 엔벨로프 단백질보다 더 낮은 삼량체 형성 백분율, 즉 15%를 야기하였다 (데이터는 예시되어 있지 않음). 디술피드 이중 치환 I204C, A433C는 삼량체 백분율을 43%까지 증가시켰지만 (데이터는 예시되어 있지 않음), I535N/K588E, K588Q/D589V, K655I/K588E, I535N/D589V, I535N/E647F, D589V/K655I, 및 I535N/K655I와 같은, 본 명세서에 개시된 새로운 이중 치환 (도 2a)이 AlphaLISA 실험에서 훨씬 더 큰 삼량체 형성 백분율을 야기하였다.

추가의 돌연변이 (잔기 558 및/또는 556에서 프롤린)를 또한 ConC_SOSIP 백본 내로 도입하였으며, 이들 HIV gp140 Env 단백질에 대하여 삼량체 형성 백분율 및 삼량체 수득량을 측정하였다. ConC_SOSIP 백본에 이미 함유된 SOSIP 돌연변이 (즉, 위치 501 및 605에서 Cys, 및 위치 559에서 Pro)에 더하여 위치 558 또는 556에서 Pro의 단일 치환, 및 위치 556 및 558 둘 다에서 프롤린의 이중 치환은 삼량체 형성 백분율과 삼량체 수득량을 증가시켰다 (데이터는 예시되어 있지 않음). 사실상, 위치 558 및/또는 556에서 Pro 잔기를 추가로 포함하는 ConC_SOSIP 백본에서 본 발명의 새로운 아미노산 안정화 치환 하나 이상의 도입은 삼량체 형성 백분율 및/또는 삼량체 수득량을 추가로 향상시킨다 (예를 들어 도 2a, 예를 들어 A558P/I535N, K655I/L556P 및 A558P 돌연변이를 포함하는 몇몇 삼중 돌연변이체).

다른 bNAb 및 비-bNAb에의 HIV gp140 Env 변이체의 결합 데이터는 도 2a 및 도 2b에 열거된 것과 같은, 삼량체 수득량과 삼량체 형성 백분율이 증가된, 테스트된 단일, 이중 및 삼중 돌연변이의 대부분이 또한 ConC_SOSIP 백본 서열을 가진 HIV 엔벨로프 단백질에 있어서 관찰된 bNAb 및 비-bNAb에의 결합의 양에 비하여 증가된 bNAb에의 결합 및 동일하거나 감소된 비-bNAb에의 결합을 가졌음을 입증하였다 (데이터는 예시되어 있지 않음). 백신 개발을 위하여, bNAb에의 증가된 결합 및 비-bNAb에의 감소된 결합이 바람직하다. 따라서, 데이터는 상기 표 1에 나타낸 위치 (i)~(vii)에서의 아미노산 치환을 포함하는 HIV 엔벨로프 단백질이 광범위 중화 및 비-광범위 중화 항체와 관련하여 바람직한 특성을 가짐을 입증한다.

SEC-MALS 분석

AlphaLISA 분석법을 이용하여 스크리닝된 HIV gp140 변이체에 있어서의 삼량체 수득량 및 삼량체 형성 백분율을 확인하기 위하여 SEC-MALS 분석을 또한 이용하였다. HIV gp140 변이체를 30 mL 규모 배양에서 발현시키고 무세포 상청액을 Polyprep 중력 유동 컬럼 (Biorad 카탈로그 번호 731-1550) 내의 200 ㎕ 갈란투스 니바리스 렉틴 비드 (Vectorlab 카탈로그 번호 AL-1243) 상에 적용하여 정제하였다. 비드를 2 ml 결합 완충제 (40 mM Tris, 500 mM NaCl pH 7.4)로 세척하였다. 단백질을 250~500 ㎕의 40 mM Tris, 500 mM NaCl, 1 M 만노피라노시드 (pH 7.4)를 이용하여 용출하였다. 고성능 액체 크로마토그래피 시스템 (Agilent Technologies) 및 Optilab T-rEX 굴절률 검출기 (Wyatt)에 결합된 MiniDAWN TREOS 기기 (Wyatt)를 SEC-MALS 실험을 수행하기 위하여 이용하였다. 통틀어, 100 ㎕의 렉틴 용출액 또는 대략 30㎍의 단백질을 러닝 완충제 (150 mM 소듐 포스페이트, 50 mM NaCl, pH 7.0)에서 평형화된 TSK-Gel G3000SWxl 컬럼 (Tosoh Bioscience)에 1 mL/min으로 적용하였다. Astra 6 소프트웨어 패키지를 이용하여 데이터를 분석하고, 분자량 계산은 굴절률 신호로부터 유도하였다.

ConC_SOSIP 엔벨로프 단백질 및 단일 돌연변이를 함유한 HIV gp140 변이체의 SEC-MALS 크로마토그램을 도 3에 나타낸다. 일반적으로, SEC-MALS 분석으로부터 수득한 결과는 AlphaLISA 분석으로부터 수득한 결과와 비견되고 이와 일치하였다. ConC_SOSIP 엔벨로프 단백질의 크로마토그램은 4개의 주요 피크를 가지며, 약 7.3분에 용출된 두 번째 피크가 삼량체 피크이다. ConC_SOSIP 엔벨로프 단백질은 약 27% 삼량체로 결정되었다. 응집체와 단량체의 형성은 ConC_SOSIP 콘센서스 서열을 가진 HIV gp140 Env 단백질에서 일부 미스폴딩 및 불안정성이 있음을 나타낸다. 도 3으로 나타낸 크로마토그램에 의해 입증된 바와 같이, 모든 단일 치환은 ConC_SOSIP 엔벨로프 단백질에 있어서의 삼량체 피크와 비교하여 상대적으로 더 높은 삼량체 피크로 이어졌으며, 이는 삼량체 수득량이 HIV gp140 변이체 각각에 있어서 증가되었음을 나타낸다.

종합하면, 결과는 본원에서 표 1의 (i)~(vii)에서 확인된 아미노산 치환이 향상된 삼량체 형성 백분율 및/또는 향상된 삼량체 수득량을 갖는 재조합 HIV Env 단백질을 제공함을 입증한다. 특히, 확인된 돌연변이 중 둘 이상의 조합과 같은, 표 1의 (i)~(vii)에서 확인된 위치에서 다수의 치환을 갖는 HIV Env 단백질 변이체는 전형적으로 단일 돌연변이만을 갖는 HIV Env 단백질 변이체에 비하여 훨씬 더 향상된 삼량체 수득량 및/또는 삼량체 형성 백분율을 나타내며, 이는 표 1의 돌연변이 (i)~(vii)의 조합의 가능한 상승적 효과를 보여준다. 본 발명자가 알고 있는 한, 이들 아미노산 치환의 조합 중 어느 것도 자연 발생 HIV 엔벨로프 단백질 서열에서 보고되지 않았으며, 따라서 ((i)~(vii) 사이의) 모든 조합이 삼량체 안정화 돌연변이의 새로운 조합으로 생각된다. 본 발명의 재조합 HIV 엔벨로프 단백질과 같은, 삼량체 형성 백분율이 증가된 HIV 엔벨로프 단백질은, 원치 않는 비-천연 배좌로 제제 내에 존재하는 엔벨로프 단백질의 정제 및 제거가 덜 요구될 것이므로, 백신에 대해서와 같이, 제조 관점에서 유리하다. 또한, 삼량체의 증가된 총 발현 수득량은 백신 제품의 제조에 유리하다.

실시예 4: 삼량체 HIV 엔벨로프 단백질의 안정성

본 발명의 실시 형태에 따른 재조합 HIV Env 단백질의 열 안정성을 AlphaLISA 및 시차 주사 열량계 (DSC)에 의해 테스트하였다.

AlphaLISA를 이용한 열 안정성 측정

삼량체-특이적 mAb PGT145에의 결합에 기초하여 열 처리시에 본래의 삼량체의 소실을 측정함으로써 열 안정성을 테스트하였다. 조 상청액 (20 ㎕)을 1 시간 동안 60℃에서 가열하였다. 그 후 샘플을 5분 동안 최대 속도로 원심분리하여 응집체를 제거하였다. AlphaLISA 분석을 실시예 3에서 상기한 대로 수행하였다.

결과를 도 4에 나타내며, 데이터는 열 처리 후 온전하게 남아 있는 삼량체의 백분율로서 보고된다. 이 결과로부터, 테스트된 본 발명의 단일 돌연변이체 재조합 HIV gp140 Env 단백질의 대부분이 ConC_SOSIP 엔벨로프 단백질보다 더 높은 열 안정성을 가졌음을 알 수 있다. 본 명세서에서 확인된 삼량체 안정화 이중 및 삼중 치환을 가진 테스트된 HIV 엔벨로프 단백질은 또한 ConC_SOSIP 엔벨로프 단백질보다 더 높은 열 안정성을 갖는 것으로 밝혀졌다.

DSC를 이용한 열 안정성 측정

HIV gp140 Env 변이체의 융점 (T_m)을 MicroCal 모세관 DSC 시스템을 이용하여 DSC에 의해 결정하였다. 각각의 측정은 100℃/시간의 스캔 속도로 20℃의 시작 온도와 110℃의 최종 온도로 수행하였다. 0.5 mg/mL의 농도를 가진 단백질 샘플 (400 μL)을 각 측정을 위하여 사용하였다. 데이터는 Origin J. Software (MicroCal VP-분석 툴)을 이용하여 분석하였다.

DSC를 이용하여 측정한 ConC_SOSIP 엔벨로프 단백질의 융점 (T_m)은 69.8℃로 결정되었으며 용융 개시 온도는 60.1℃였다. ConC_SOSIP 엔벨로프 단백질에 대하여 측정된 T_m은 67.0℃의 T_m을 갖는 것으로 보고된 (문헌[Kwon et al, 2015]) BG505_SOSIP 엔벨로프 단백질 (소위 SOSIP 돌연변이를 갖는 BG505 바이러스 단리체의 HIV 엔벨로프 단백질)에 대한 것보다 높았다. 이것은 ConC_SOSIP 백본 서열을 가진 HIV 엔벨로프 단백질이 삼량체 안정화 돌연변이를 가진 다른 공지된 HIV 엔벨로프 서열보다 열 안정성에 관하여 더 유리한 특성을 가짐을 나타낸다.

ConC_SOSIP의 K655I 돌연변이체의 T_m은 72.3℃로 측정되었으며 용융 개시 온도는 63.7℃였으며, 이것은 ConC_SOSIP 엔벨로프 단백질의 T_m보다 훨씬 높다. ConC_SOSIP의 A558P, N651F, I535N 돌연변이체의 Tm은 77.29℃로 측정되었으며 개시 온도는 74.87℃였다. 따라서 DSC 결과는 AlphaLISA 분석법에 의해 결정된 열 안정성 결과를 확인한다.

종합하면, 결과는 본 명세서에 개시된 아미노산 치환 적어도 하나를 포함하는 HIV Env 단백질이 전형적으로 그러한 돌연변이가 없는 엔벨로프 단백질보다 높은 열 안정성을 가짐을 입증한다. 결과는 또한 모든 이중 치환 HIV Env 단백질 변이체가 ConC_SOSIP 엔벨로프 단백질보다 더 높은 열 안정성을 가졌음을 입증한다. 삼중 치환 HIV Env 단백질 변이체는 또한 ConC_SOSIP 엔벨로프 단백질보다 더 안정하였다.

실시예 5: 클레이드 B 엔벨로프 단백질 콘센서스 서열을 기반으로 한 재조합 HIV 엔벨로프 단백질 변이체

클레이드 B 콘센서스 서열 ConB_SOSIP (서열 번호 5) 내로 도입된 단일 아미노산 치환 (I535N, D589V, N651F 또는 K655I)을 포함하는 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질을 실시예 2에 개시된 바와 같이 생성하고 정제하였다. 삼량체 수득량과 삼량체 형성 백분율을 실시예 3에 개시된 바와 같이 AlphaLISA 분석에 의해 측정하였다.

결과를 도 5a (삼량체 형성의 백분율) 및 도 5b (삼량체 수득량)에 나타낸다. 보고된 값은 삼량체 형성 백분율 및 삼량체 수득량 둘 다에 대하여 1로 설정된, ConB_SOSIP 엔벨로프 단백질에 대하여 측정된 값과 비교한 것이다. 결과는 테스트된 모든 돌연변이가 삼량체 형성 백분율을 증가시켰음을 보여준다. 삼량체 수득량은 모든 테스트된 돌연변이에 대하여 ConB_SOSIP 엔벨로프 단백질에 비하여 동일하거나 향상되었다.

이들 결과는 이들 돌연변이가 또한 상이한 백본 HIV 엔벨로프 단백질 서열 내로, 이 경우에는 클레이드 B 유래 콘센서스 서열 내로 도입될 경우, 엔벨로프 단백질에 대해 안정화 효과, 예를 들어, 향상된 삼량체 수득량, 향상된 삼량체 형성 백분율 등을 가짐을 입증한다.

실시예 6: 합성 엔벨로프 단백질 서열을 기반으로 한 재조합 HIV 엔벨로프 단백질 변이체

서열 번호 7로 나타낸 서열을 가진 합성 HIV 엔벨로프 단백질 ('DS_sC4_SOSIP_E166R'로 불림) 내로 도입된 아미노산 치환을 포함하는 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질을 실시예 2에 개시된 바와 같이 제조하고 정제하였다. 합성 HIV 엔벨로프 단백질 DS_sC4_SOSIP_E166R은 소위 SOSIP 돌연변이 (잔기 501 및 605에서 Cys, 및 잔기 559에서 Pro), 디술피드 (DS) 결합의 도입을 야기하는 잔기 201 및 433에서의 Cys, 및 첨부를 안정화하기 위한 위치 166에서의 Arg를 가진다. 또한, 단백질은 위치 655에서 절두된다. 삼량체 형성 백분율 및 삼량체 수득량을 실시예 3에 개시된 바와 같이 AlphaLISA 분석에 의해 측정하였다.

결과를 도 6에 나타내며, 도 6은 테스트된 변이체의 각각에 있어서의 삼량체 형성 백분율을 DS_sC4_SOSIP_E166R 백본에 있어서의 삼량체 형성 백분율 (도 6a) 및 삼량체 수득량 (도 6b)과 비교한다. 백본 서열에 비하여 더 큰 삼량체 형성 백분율이 테스트된 변이체 각각에 대해 관찰되었다.

E166R 외에, 하기 실시예 12 및 도 12에서 더욱 상세히 설명된 프레임워크에 따라 단백질을 '복구'하기 위하여, 일부 다른 드물게 나타나는 아미노산을 야생형 HIV Env 단백질들의 컬렉션에서의 상응하는 위치 (A114Q, E117K, T375S 및 I434M)에서의 보다 일반적인 아미노산으로 변화시켰다. 이러한 '복구된' 단백질에서, 안정화 돌연변이 A204I, 및 K655I는 sC4_SOSIP를 더욱 더 향상시킨다 (도 13).

이 실시예의 결과는 본 명세서에 개시된 돌연변이가 또한 상이한 백본 HIV 엔벨로프 단백질 서열 내로, 이 경우에는 비-콘센서스, 합성, Env 서열 내로 도입될 경우, 엔벨로프 단백질에 대해 안정화 효과, 예를 들어, 향상된 삼량체 형성 백분율 및/또는 향상된 삼량체 수득량 등을 가짐을 입증한다는 점에서 실시예 5의 결과와 일치한다.

실시예 7: HIV Env 돌연변이의 추가 조합

(서열 번호 3으로 나타낸 서열을 갖는) ConC_SOSIP 내에 도입된 아미노산 치환을 포함하는 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질을 실시예 2에 개시된 바와 같이 제조하고 정제하였다. 삼량체 형성 백분율은 실시예 3에 개시된 바와 같이 AlphaLISA 분석법에 의해 측정하였다. 이어서, 더 작은 선택된 조합 (하기에 이탤릭체로 표시된 것 및 추가로 K655I; I535N,D589V; I535N, K655I; D589V, K655I)을 갈란투스 니바리스 렉틴을 이용하여 정제하고 삼량체 함량은 실시예 3에 개시된 바와 같이 SEC-MALS를 이용하여 분석하였다. 안정성은 실시예 4에 개시된 바와 같이 측정하였다.

하기 돌연변이체를 이 실험을 위하여 제조하였다:

K655I, N651F;

K655I, N651F, E647F;

K655I, N651F, E647F, I535N;

K655I, N651F, I535N;

K655I, I573F;

K655I, D589V, I573F;

K655I, D589V, I573F, N651F;

K655I, D589V, I573F, K588E;

K655I, D589V, I573F, N651F, K588E;

K655I, D589V, I573F, N651F, K588E, I535N;

K655I, D589V, I573F, N651F, K588E, I535N, A204I;

K655I, D589V, I535N, L556P;

K655I, D589V, I573F, N651F, K588E, L556P;

K655I, D589V, A204I;

L556P, N651F;

L556P, N651F, K655I;

L556P, N651F, K655I, I535N;

L556P, N651F, K655I, I535N, I573F;

L556P, N651F, K655I, I535N, I573F, D589V;

L556P, N651F, K655I, I535N, I573F, D589V, A204I;

L556P, N651F, K655I, I535N, I573F, D589V, A204I, K588Q;

L556P, N651F, K655I, I535N, I573F, D589V, A204I, K588Q, E647F;

L556P, N651F, I535N;

L556P, N651F, I535N, I573F;

L556P, N651F, I535N, I573F, D589V;

L556P, N651F, I535N, I573F, D589V, A204I;

L556P, N651F, I535N, I573F, D589V, A204I, K588Q;

L556P, N651F, I535N, I573F, D589V, A204I, K588Q, E647F;

L556P, K655I, I535N;

L556P, K655I, I535N, I573F;

L556P, K655I, I535N, I573F, D589V;

L556P, K655I, I535N, I573F, D589V, A204I;

L556P, K655I, I535N, I573F, D589V, A204I, K588Q;

L556P, K655I, I535N, I573F, D589V, A204I, K588Q, E647F;

L556P, N651F, I535N, I573F, D589V, A204I, K588Q (이때 SOS 돌연변이는 제거됨).

ConC_SOSIP 백본에서의 치환의 모든 테스트된 조합은 AlphaLISA에서 백본에 비하여 더 높은 삼량체 백분율, 더 높은 삼량체 수득량 및 60℃에서 더 높은 삼량체 안정성을 나타냈다 (데이터는 예시되어 있지 않음). SEC_MALS는 백본에서 모든 테스트된 돌연변이에 대해 향상된 삼량체 백분율을 확인하였다 (데이터는 예시되어 있지 않음).

9개 돌연변이까지 하나씩 추가 돌연변이를 포함하는 세트에 대하여, SEC-MALS는 각각의 다음 돌연변이의 도입에 의해 단량체 피크의 높이가 감소함에 따라 삼량체/단량체 비율이 증가한 한편, 삼량체 피크의 높이는 SEC 그래프에서 동일하게 머물렀음을 보여주었다 (도 7). SEC-MALS에서 테스트된 모든 변이체 중에서, L556P, N651F, K655I, I535N, I573F, D589V, A204I, K588Q, E647F 치환을 가진 변이체가 최고의 삼량체 백분율 (최소의 gp140 단량체 및 최소의 gp120 단량체), 최고의 총 단백질 수득량, 및 더 높은 온도 안정성들 중 하나를 나타냈다. 이것은 이들 돌연변이가 백본과 비교할 때 삼량체의 손실 없이 조합될 수 있음을 의미한다. 또한, 이것은 일반적으로 표 2에 개시된 돌연변이와 선택적으로 조합된, 표 1의 (i)~(vii)에 개시된 돌연변이의 부가가 더 향상된 삼량체화를 야기함을 시사한다.

'SOS 돌연변이'가 제거된 (즉, 위치 501과 605에서의 두 시스테인 잔기가 콘센서스 클레이드 C 서열에 원래 존재했던 아미노산 잔기로 다시 돌아갔음), L556P, N651F, I535N, I573F, D589V, A204I, K588Q 돌연변이를 가진 구축물을 또한 테스트하였다. 그의 온도 안정성이 더 낮았지만, 돌연변이체는 SOS 돌연변이를 포함하는 그의 상응하는 돌연변이체에 비견되는 삼량체 백분율 및 수득량을 가졌다. SOS 돌연변이가 제거된 돌연변이체는 그것이 그의 상응하는 SOS-함유 대응체 (L556P, N651F, I535N, I573F, D589V, A204I, K588Q 돌연변이를 가짐)보다 비-bNAb에 덜 결합했다는 점에서 심지어 장점을 가졌다. 이것은 높은 삼량체 백분율과 같은, 본 발명의 유리한 특성이 모든 SOSIP 돌연변이를 갖지 않는 HIV Env 단백질에서 또한 수득될 수 있다는 것을 입증한다.

발현 수준, 삼량체 형성 및 광범위 중화 항체 PGT151에의 결합에서의 유리한 특성들의 조합에 기초할 때, 하나의 돌연변이체 (ConC_SOSIP 백본에서 테스트됨)는 하기 돌연변이를 갖는다: L556P, N651F, I535N, I573F, D589V, A204I, K588Q.

ConC_SOSIP 배경에서, 9가지의 가장 성공적인 치환은 gp41에서 L556P, E647F, N651F, K655I, I535N, D589V, I573F, 및 K588E 및 gp120에서 A204I이었다. 모든 이들 9가지 치환의 조합은 증가된 안정성, 삼량체 함량 및 삼량체 수득량을 유도하였다. 9가지 치환을 가진 이 변이체에서 L556P의 추가는 향상된 삼량체 백분율에 대해 상대적으로 제한된 효과를 가졌으며 이 맥락에서 E647F 치환은 PGT151 결합을 방해하는 것으로 나타났으므로, 이들 두 돌연변이는 추가 변이체에서 항상 사용되지는 않았으며, 7가지 치환을 가진 변이체 (ConC_SOSIP_7mut로 불림, 때로는 본 명세서에서 '안정화된 ConC_SOSIP' 또는 'ConC_base'로도 불림; N651F, K655I, I535N, D589V, I573F, K588E, 및 A204I를 포함함)가 상기에 나타낸 9가지 치환을 가진 변이체보다 약간 더 안정한 (증가된 융점) 것으로 밝혀졌다. 이 변이체의 완전한 서열 (안정화된 ConC_SOSIP Env, HIV 160544)은 서열 번호 20으로 제공된다.

이때, 발현 수준, 삼량체 형성 및 광범위 중화 항체에의 결합에서의 유리한 특성들의 조합에 기초할 때, 특히 바람직한 돌연변이체[하기 추가의 돌연변이를 가진 ConC_SOSIP 백본에서 테스트됨: (a) D279N, A281V, A362Q (다른 사람들에 의해 개시된 바와 같이, 전파된 창립자 바이러스와의 유사성을 증가시킴); (b) Del139-152 (가변 루프에 대한 항체 유도 가능성을 감소시키기 위한 가변 루프의 결실); 및 (c) V295N (HIV 주의 대부분에 존재하는 글리칸 부위의 도입)]는 하기의 본 발명의 안정화 돌연변이를 가진다: N651F, K655I, I535N, I573F, D589V, A204I, K588E. 이 변이체의 완전한 서열 (안정화 ConC_SOSIP.v3 Env (HIV170654, ConC_SOSIP.v3))은 서열 번호 28로 제공된다.

추가 변이체에서는, K658V 돌연변이가 이 구축물에 부가되었으며 (하기 실시예 15를 또한 참조), 이것은 결과를 더 개선시켰다.

실시예 8: 안정화된 HIV Env 단백질을 디스플레이하는 자가-조립 입자

페리틴 및 (문헌[He et al, 2016])에서 개시된 것과 유사한 방식으로 안정화된 Env 단백질을 디스플레이하는 DPS 자가-조립 입자를 제조하였다. 이를 위하여 gp140 단백질을 DNA 레벨에서 짧은 아미노산 링커 (예를 들어 GSG 또는 AAAGS, 그러나 다른 링커도 사용될 수 있으며, 예를 들어 문헌[He et al, 2016] 참고)를 통해 입자의 N-말단에 융합시키고 Expi293F 세포에서 융합 단백질을 발현시켰다. 이 방식으로 제조된 입자의 일 예는 하기 돌연변이: I535N,A558P,D589V,K655II535N, A558P, D589V, K655I를 가진 ConC_SOSIP (서열 번호 3) HIV Env 단백질에 융합된 페리틴을 기반으로 하였다. 삼량체화를 향상시키는 것으로 보고된 (문헌[Kesavardhana et al,2014]) 추가의 V570D 돌연변이를 가진 이 Env 단백질을 가진 페리틴 입자가 또한 제조되었으나, 이 돌연변이는 비-중화 항체 (17b)의 결합에서의 강한 증가를 초래하는 것으로 관찰되었으며, 이것은 원치 않는 것이다. 이들 5가지 돌연변이를 가진 Env를 또한 헬리코박터 파일로리 (Helicobacter pylori) 유래의 및 마이코박테리움 스메그마티스 (Mycobacterium smegmatis) 유래의 두 가지 타입의 DPS 입자 (예를 들어 DPS 입자의 제조에 대하여 국제 공개 제2011/082087호 참조)에 융합시켰다. 이들 5가지 돌연변이 및 또한 디술피드 가교 도입 이중 돌연변이 I201C-A433C를 가진 Env를 또한 페리틴에 융합시켰다.

PGDM140 친화성 비드를 이용하여 무세포 상청액으로부터 입자를 정제하고 TSKgel G6000PWCL 컬럼을 가진 SEC-MALS를 이용하여 입자를 분석하였다. Native PAGE (3-12%) 뿐만 아니라 SEC-MALS도 대략 예상된 크기를 가진 입자가 형성되었음을 확인하였다.

유사한 방식으로, 페리틴 및 돌연변이의 하기 조합: (L556P, N651F, I535N, I573F, D589V, A204I, K588Q)(L556P, N651F, I535N, I573F, D589V, A204I, K588Q)을 가진 ConC_SOSIP 서열을 가진 HIV Env를 디스플레이하는 DPS 자가-조립 나노입자를 또한 제조한다.

본원에 개시된 다른 HIV Env 변이체, 예를 들어 서열 번호 20, 22, 24, 26, 27, 28, 29, 30, 31, 또는 32를 갖는 HIV Env를 디스플레이하는 추가의 리포좀 및/또는 자가-조립 나노입자를 또한 제조한다.

실시예 9: 클레이드 A 엔벨로프 단백질 서열을 기반으로 한 재조합 HIV 엔벨로프 단백질 변이체

단일 아미노산 치환 (I535N, D589V, N651F, K655I, I573F, A204I 또는 E647F)을 포함하는 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질을 실시예 2에 개시된 바와 같이 SOSIP 변형 ('BG505_SOSIP'로 불림)을 가진 야생형 클레이드 A HIV 엔벨로프 단백질 내로 도입하였다. HIV 엔벨로프 단백질 BG505_SOSIP는 소위 SOSIP 돌연변이 (잔기 501 및 605에서 Cys, 및 잔기 559에서 Pro), 및 디술피드 (DS) 결합의 도입을 야기하는 잔기 201 및 433에서의 추가 Cys, 및 위치 332 상의 잠재적 N-글리코실화 부위 (T332N 돌연변이)를 가진다. 단백질은 위치 664에서 절두된다. BG505_SOSIP의 서열은 서열 번호 21로 나타낸다.

삼량체 형성 백분율 및 삼량체 수득량을 실시예 3에 개시된 바와 같이 AlphaLISA 분석에 의해 측정하였다. 테스트된 변이체 각각에 있어서의 삼량체 형성 백분율 및 삼량체 수득량을 BG505_SOSIP와 비교하였다. 백본 서열에 비하여 M535N, D589V, N651F 또는 K655I 치환에 대해 더 높은 삼량체 형성 백분율이 관찰되었다 (예를 들어 도 8a). 예를 들어 L556P, K655I 및 M535N의 조합은 더욱 더 증가된 삼량체 수득량과 백분율을 나타냈다 (예를 들어 도 8a 및 도 8b). N651F와 D589V의 조합은 삼량체 수득량과 백분율을 더욱 더 향상시켰다 (데이터는 예시되어 있지 않음). 클레이드 A 바이러스에 대한 이 실시예의 결과는 하기 실시예 10과 11 (클레이드 C) 및 실시예 5의 결과와 일치하며, 여기서는 돌연변이 I535N, D589V, N651F 및 K655I가 또한 야생형 주로부터 유래된 엔벨로프 단백질에 대해 안정화 효과, 예를 들어, 향상된 삼량체 형성 백분율 및/또는 향상된 삼량체 수득량을 나타냈다. 명백히, 본 발명의 이들 돌연변이는 또한 야생형 클레이드 A 주로부터 유래된 HIV Env의 삼량체화를 향상시킨다.

이때, 발현 수준, 삼량체 형성 및 광범위 중화 항체에의 결합에서의 유리한 특성들의 조합에 기초할 때, 특히 바람직한 변이체 (BG505_SOSIP 백본에서 테스트됨)는 하기 돌연변이를 갖는 것이다: L556P, K655I, M535N, N651F, D589V (예를 들어, SEC-MALS 분석에서 그러한 돌연변이체의 강하게 향상된 삼량체 형성을 보여주는 도 9 및 그러한 돌연변이체의 광범위 중화 항체의 명백히 향상된 결합을 보여주는 도 13 참조). 이 안정화된 BG505_SOSIP Env (HIV170863)의 서열을 서열 번호 22로 나타낸다.

돌연변이 Q658V의 부가는 적은 추가 향상을 제공하였다.

추가의 바람직한 구축물은 L556P, K655I, M535N, N651F, D589V 돌연변이, 및 'DS' 돌연변이 (디술피드 결합의 도입을 야기하는 위치 201과 433에서의 Cys), R588E, 및 Q658V를 함유한다. 그 변이체 (BG505_SOSIP.v2 Env, HIV171814)의 서열이 서열 번호 29에 제공된다.

실시예 10: 클레이드 C 야생형 엔벨로프 단백질 서열을 기반으로 하는 재조합 HIV 엔벨로프 단백질 변이체

추가 치환 L556P을 가진 WT C97ZA_SOSIP Env 서열 (서열 번호 23) (C97ZA_SOSIP_L556P) 내로 도입된 단일 아미노산 치환 T651F, 이중 아미노산 치환 T651F, M535N을 포함하는 본 발명의 실시 형태에 따른 재조합 HIV Env 단백질을 실시예 2에 개시된 대로 생성하고 발현하였다. 삼량체 수득량과 삼량체 형성 백분율을 실시예 3에 개시된 바와 같이 AlphaLISA 분석에 의해 측정하였다.

결과는 도 10a 및 도 10b로 나타낸다. C97ZA_SOSIP_L556P_T651F_M535N의 삼량체 수득량은 C97ZA_SOSIP 백본의 수득량보다 5배 더 높다.

따라서 L556P, T651F 및 M535N 치환은 C97ZA_SOSIP를 크게 향상시켰지만, 이 클레이드 C 야생형 유래 변이체에 있어서의 bNAb에의 결합 및 삼량체 백분율은 ConC_SOSIP 백본에 대한 것보다 훨씬 더 낮았다. wt Env가 그의 숙주에 적응되어, 가능하게는 그의 일반적인 적합성을 감소시켜서 폴딩이 파괴될 수 있으므로, Env 서열을 실시예 12 및 도 12에서 개시된 개념적 프레임워크에 따라 '복구'하였다. 서열을 복구하기 위하여 총 21 잔기를 변화시켰으며, 소위 '글리칸 홀' (야생형 HIV 주 Env 단백질의 적어도 50%에서 잠재적 N-글리코실화 부위가 존재하는 위치)을 채우기 위하여 3개의 잠재적 N-글리코실화 부위 (PNGS)를 부가하였다. C97ZA_SOSIP를 위한 이 프레임워크를 따름으로써 도입된 돌연변이를 표 3에서 컬럼 '복구 돌연변이'에서 나타낸다. 본 명세서에 개시된 안정화 돌연변이 K655I의 부가는 D589V, A204I 및 K588E에서처럼 삼량체 백분율과 수득량을 더욱 더 증가시켰다.

이들 결과는 본 명세서에 개시된 T651F, M535N 및 K655I, D589V, A204I 및 K588E 돌연변이가 C97ZA_SOSIP (클레이드 C 야생형 주 Env 단백질로부터 유래됨) 및 그 변이체 내로 도입될 때 또한 엔벨로프 단백질에 대해 안정화 효과, 예를 들어, 향상된 삼량체 수득량, 향상된 삼량체 형성 백분율을 가졌음을 입증한다.

이때, 발현 수준, 삼량체 형성 및 광범위 중화 항체에의 결합에서의 유리한 특성들의 조합에 기초할 때, 특히 바람직한 변이체 (C97ZA_SOSIP 백본에서 테스트됨)는 하기 돌연변이를 갖는 것이다: Q567K (이전에 다른 사람들에 의해 개시됨); A198T, S243N, K236T, V295N (글리칸 홀을 채움); M34L, T46K, T58A, Q171K, G172V, P179L, L183Q, I192R, N209T, M307I, Q350R, N352H, Y353F, D412N, G429E, V455T, I489V, L491I, G500K, S547G, T578A, T651N (서열을 복구함); V505N, E507T, T663N (분자의 베이스에서 잠재적 N-글리코실화 부위의 부가); 및 A204I, M535N, L556P, K588E, D589V, T651F, K655I (본 발명의 안정화 돌연변이). 이 변이체에 대한 데이터를 예를 들어 도 13 (특히 그안의 '안정화되고 복구된 C97ZA'를 참고)에 나타내며, 원래의 wt C97ZA Env 분자에 비하여 광범위 중화 항체 결합에서 큰 증가를 보여준다. 이 변이체 (안정화되고 복구된 C97ZA_SOSIP Env (HIV170690))의 서열은 서열 번호 24로 제공된다.

돌연변이 K658V의 부가는 이 단백질을 더욱 더 안정화시켰다.

추가의 바람직한 변이체는 'DS' 돌연변이 및 K658V를 포함하며, 이 변이체 (C97ZA_SOSIP.v2 Env, HIV171810)의 서열은 서열 번호 30에 제공된다.

실시예 11: 또 다른 클레이드 C 야생형 엔벨로프 단백질 서열을 기반으로 하는 재조합 HIV 엔벨로프 단백질 변이체

클레이드 C 주 Du422 유래의 Env 단백질에서, SOSIP 돌연변이를 도입하고, 2개의 글리칸 홀 (hole)을 위치 295 및 386에서 K295N 및 D386N 돌연변이에 의해 채웠다. 게다가, 일부 잔기를 실시예 12 및 도 12에 설명된 개념적 프레임워크에 따라 복구하고 (V272I, W456R, G466E 및 F643Y), 안정화 치환인 L556P, I535N, N651F 및 D589V를 도입하였다. 모든 추가 치환은 더 큰 삼량체 수득량 및 삼량체 백분율로 이어졌다 (예를 들어 도 11).

이러한 4개의 안정화 돌연변이를 갖는 테스트되는 특정한 변이체 (서열 번호 25)에서, 추가적인 K655I 치환은 삼량체 수득량 및 삼량체 백분율을 각각 1.3배 및 1.4배만큼 더 증가하였다 (데이터는 예시되어 있지 않음).

이때, 발현 수준, 삼량체 형성 및 광범위 중화 항체에의 결합 면에서의 유리한 특성들의 조합을 기반으로 하면, 특히 바람직한 Du422_SOSIP Env 변이체는 하기 돌연변이를 갖는 것이다: L556P, K655I, M535N, N651F, D589V, K588E, I201C, A433C, V272I, W456R, G466E, F643Y, D386N, 및 K295N. 이 변이체 (안정화되고 복구된 Du422_SOSIP Env (HIV170859))의 서열은 도 26으로 제공된다. 이 변이체에 대한 데이터를 예를 들어 도 13에 나타내며 (그 안에서 안정화되고 복구된 Du422 참조), 이는 원래의 야생형 Du422 Env 분자와 비교하여 광범위 중화 항체 결합성의 엄청난 증가를 보여준다.

추가의 바람직한 변이체는 ‘DS’ 돌연변이 및 K658V를 추가로 포함하며, 이 변이체 (Du422_SOSIP.v1 Env, HIV171812)의 서열은 서열 번호 31로 제공된다.

실시예 12: 다양한 HIV-1 Env 서열의 복구 및 안정화

감염된 환자로부터 단리한 바이러스로부터의 야생형 서열은 올바른 폴딩을 저해하는 불안정화 돌연변이를 획득하였을 수도 있기 때문에, 먼저 클레이드 C C97ZA, DU422 및 모자이크 sC4의 야생형 Env 서열을 복구시켰다.

야생형 서열에서의 비-최적 돌연변이에 대하여 검색하기 위하여, UniProt 데이터베이스 및 Los Alamos HIV 데이터베이스에서의 모든 HIV-1 Env 서열 (대략 90.000개의 서열)의 정렬을 행하고, 아미노산 분포를 각각의 아미노산에 대하여 계산하였다. 일반적으로, 야생형 Env 서열에서의 다수의 상대적으로 드물게 나타나는 아미노산을 도 12에 설명된 개념적 프레임워크에 따라 더 일반적인 아미노산 (상응하는 위치에서의 데이터베이스에서의 빈도를 기반으로 함)으로 치환하였다.

더욱이, C97ZA_SOSIP의 첨부에서의 2개의 추가 치환 Y353F 및 Q171K를 도입하여 가능하게는 첨부 표적화 항체의 결합성을 개선시키며, 가외의 글리칸 부위를 D411N, K236T 및 V295N의 치환에 의해 도입하였는데, 그 이유는 이러한 잠재적 N-글리코실화 부위 (PNGS)가 50%보다 많이 보존되어 있기 때문이었다. 다음, 이전 실시예에서 설명한 안정화 치환을 복구된 서열에 전달하였다.

안정화된 ConC_SOSIP는 치환 A204I, I535N, I573F, K588E, D589V, N651F 및 K655I를 포함한다 (안정화된 ConC_SOSIP). 안정화된 ConC_SOSIP의 전체 서열은 서열 번호 20으로 제공된다.

일부의 변이형 Env 단백질 및 이의 돌연변이의 개관이 표 3에 제공되어 있다.

[표 3]

표 3. 본원에 개시된 몇몇 HIV Env 단백질 변이체.‘문헌으로부터의 돌연변이’라는 컬럼에는 이들 구축물에서 사용되고 다른 이들에 의해 이전에 기술된 돌연변이가 기술되어 있다. ‘부가된 PNGS’라는 컬럼에는 잠재적 N-글리코실화 부위를 (많은 야생형 Env 단백질이 그러한 부위를 포함하는 위치에) 부가하는 돌연변이가 기술되어 있다. ‘리더 서열’이라는 컬럼에는 리더 서열이 원래의 (천연) 리더 서열이 아닌 경우 어떤 리더 서열이 발현에 사용되었는지가 기술되어 있다. ‘복구 돌연변이’라는 컬럼에는 실시예 12 및 도 12에 기술된 바와 같이, 일부의 야생형 Env 단백질의 폴딩 및 안정성 (bNAb에의 결합을 기반으로 하여, 삼량체의 수득량 및 백분율로서 측정)을 개선시키는 돌연변이가 기술되어 있다. ‘안정화 돌연변이’라는 컬럼에는 본원에 개시된 바와 같이 단백질을 안정화시키고 삼량체화를 개선시키는 본 발명의 돌연변이가 기술되어 있다. ‘추가 돌연변이’라는 컬럼에는 일부 구축물을 위하여 만들어진 추가 돌연변이가 기술되어 있다. ‘말단’이라는 컬럼에는 마지막 아미노산의 위치가 기술되어 있다 (표 전체에 걸친 넘버링은 HXB2 Env 서열에 관한 것이다).

야생형 (wt), 복구, 및 안정화 Env 변이체로 일시적으로 형질감염시킨 세포의 상청액을 첨부에 대하여 유도된 몇몇 삼량체-특이적 광범위 중화 항체에의 결합에 대하여 테스트하였다. 복구 치환 및 특히 안정화 치환은 삼량체 함량에 대하여 극적인 영향을 주었으며 (도 13 및 도 14), 이는 AlphaLISA (도 13) 및 SEC-MALS (도 14)를 이용하여 결정하였다.

복구되고 안정화된 DS_sC4 Env 단백질 (복구되고 안정화된 DS_sC4_SOSIP Env (HIV170686))의 바람직한 변이체의 서열이 서열 번호 27로 제공되어 있다.

이의 또 다른 바람직한 변이체가 서열 번호 32로 제공되어 있다 (복구되고 안정화된 sC4_SOSIP.v4 Env).

실시예 13: 본 발명의 안정화 돌연변이는 SOSIP 돌연변이의 부재 하에서 기능을 한다

이전 실시예에서 나타낸 바와 같이, 7개의 돌연변이 (A204I, I535N, I573F, K588E, D589V, N651F 및 K655I)는 ConC_SOSIP에서 삼량체의 수득량 및 백분율을 개선시켰다 (이는 ‘ConC_base’ 또는 ‘안정화된 ConC_SOSIP’ 또는 ‘ConC_SOSIP 7mut’로 이어짐) (예를 들어 도 13 및 도 15 참조).

이 실시예는 상이한 SOSIP 돌연변이들 (즉, ‘SOS’ 돌연변이: 위치 501 및 605에서 Cys 잔기에 의한 2개의 치환; 및 ‘IP 돌연변이’: 위치 559에서 Pro 잔기에 의한 치환)이 추가 안정화에 기여하지만 본 발명의 돌연변이들로부터 이익을 얻는 데 필요한 것은 아님을 입증한다.

상기 7가지의 돌연변이는 안정화 I559P 돌연변이 (‘IP’ 돌연변이)를 포함하지 않는 소위 ConC_SOS에서 삼량체 수득량을 또한 개선시키는 것으로 밝혀졌으며, 이는 도 15에 나타낸 바와 같다 (ConC_SOS 대 ConC_SOS, 7mut). 따라서, ‘IP’ 돌연변이는 본원에 기술된 돌연변이들로부터 이익을 얻는 데 필수적인 것은 아니다. I559P 돌연변이의 부가는 큰 증가로 이어졌으며, 이는 본 발명의 7가지의 돌연변이에 더하여 ‘IP’ 돌연변이가 이 구축물에서 유익함을 나타내는 것이다. 안정화 IP 돌연변이 (I559P)는 또한 A558P 또는 L556P에 의해 대체될 수 있으며, 이들 둘 다도 I559P 돌연변이가 결여된 변이체에 비하여 큰 증가로 이어졌다.

또한, 상기에 기술된 본 발명의 7가지의 돌연변이를 포함하지만 ‘SOS’ 돌연변이가 결여된 ConC_IP, 7 mut는 여전히 매우 높은 삼량체 수득량을 나타냈으며, 이는 ‘SOS’ 돌연변이도 본원에 기술된 돌연변이들로부터 이익을 얻는 데 필수적인 것은 아님을 입증하는 것인데 (예를 들어 ConC_SOSIP 대 ConC_IP, 7 mut의 비교), 이는 실시예 7에서의 관찰과 일치한다. ‘SOS’ 돌연변이의 부가는 삼량체 수득량을 더 증가시킨다.

따라서, 본원에 개시된 안정화 돌연변이를 포함하는 Env 삼량체는 SOSIP 돌연변이에 의한 추가 안정화로부터 이익을 얻을 수 있지만, 상기 3개의 SOSIP 돌연변이 중 어떤 것도 본원에 개시된 안정화 돌연변이의 이익 (예를 들어, 개선된 삼량체 수득량)을 얻는 데 필요하지 않다.

실시예 14: 위치 647, 651 또는 655에서의 메티오닌 치환은 삼량체 특질을 개선시킨다

실시예 2에서 설명한 돌연변이에 더하여, ConC_SOSIP (서열 번호 3) 백본에서 위치 589, 647, 651 및 655를 Met 잔기로 개별적으로 치환시키고, 삼량체의 백분율 및 수득량에 대하여 테스트하였다 (상기에 설명된 바와 같은 방법을 이용함). 실시예 2에서 설명한 돌연변이와 같이, 위치 647, 651, 또는 655에서의 Met은 도 16에서 알 수 있는 바와 같이, 삼량체의 특질을 개선시킴이 밝혀졌다 (더 높은 삼량체의 백분율 및 수득량, 증가된 bNAb 결합성).

이와 같이, 위치 651에서의 Phe, Ala, 또는 Trp에 의한 치환 외에, 위치 651에서의 Met에 의한 치환도 삼량체 형성을 개선시키며; 위치 655에서의 Phe, Ile, 또는 Trp에 의한 치환 외에, 위치 655에서의 Met에 의한 치환도 삼량체 형성을 개선시키며; 위치 647에서의 Phe, 또는 Ile에 의한 치환 외에, 위치 647에서의 Met에 의한 치환도 삼량체 형성을 개선시킨다.

실시예 15: 위치 658에서 삼량체 안정화 돌연변이를 갖는 HIV Env 단백질

위치 658 (넘버링은 HIV-1 단리체 HXB2의 gp160에 따름)에서 치환 돌연변이를 갖는 재조합 HIV Env 단백질을 ConC_SOSIP (서열 번호 3) 백본에서 제조하였다. K658을 Val, Ile, Phe, Leu, Met, 또는 Ala으로 돌연변이시켰다. 게다가, 일부 이중 돌연변이체를 만들었으며, 여기서, 이러한 돌연변이를 상기에 설명된 안정화 돌연변이들 중 하나인 K655I와 조합하였다. 삼량체 형성 백분율을 실시예 3에 설명된 바와 같이 AlphaLISA 분석법으로 결정하였다.

결과를 도 17a 및 도 17b (삼량체 백분율, 다른 실험들에서 측정함, 따라서 2개의 패널) 및 도 17c 및 도 17d (삼량체 수득량, 다른 실험들에서 측정함, 따라서 2개의 패널)에 나타낸다. 이러한 결과는 Ile, Phe, Met, Leu, Ala, 또는 Val에 의한 위치 658에서의 치환이 삼량체 형성 백분율을 개선시켰고 삼량체 수득량을 개선시켰음을 입증한다. 위치 658에서의 Ile에 의한 치환은 상기에 설명된 표 1에서의 돌연변이 (i)~(vii)로부터의 최상의 수행성의 단일 돌연변이체 (예를 들어 도 2a 참조)인 K655I 돌연변이와 대략 동일한 범위 내에 있는 증가로 이어졌다 (도 17a, 도 17c). 위치 658에서 Val에 의한 치환은 더욱 더 많은 개선으로 이어졌다 (도 17a, 도 17c).

이 결과도, Ile 또는 Val에 의한 위치 658에서의 치환이 상기에 설명된 돌연변이 K655I와 조합될 수 있고, 이것은 각각의 상응하는 단일 돌연변이체에 비하여 추가 개선으로 이어짐을 입증하였다 (도 17a, 도 17c).

K658V 돌연변이체를 SEC-MALS를 이용하여 또한 테스트하였다. 96웰 배양물을 AlphaLISA에 대하여 행한 것과 같이 3일 동안 성장시켰다. 상청액을 SEC-MALS 컬럼에 직접적으로 로딩하였다. 모크 상청액 (푸린 발현이 있음)에 대하여 수득된 크로마토그램을 Env 단백질을 포함하는 상청액의 크로마토그램으로부터 차감하였다. 삼량체성 단백질이 7분과 8분 사이에 컬럼으로부터 용출되었다. 그 결과를 도 18에 나타내며, 이는 K658V 돌연변이체가 배경 Env 단백질에 비하여, 그리고 K655I 돌연변이 Env 단백질에 비하여 개선된 삼량체화를 나타냄을 확인해 주는 것이었다.

이 실시예는 Val, Ile, Phe, Met, Leu, 또는 Ala에 의한 HIV Env 단백질에서의 위치 658에서의 아미노산의 치환이 삼량체 백분율 및 삼량체 수득량을 개선시킴을 입증한다.

AlphaLISA 및/또는 SEC-MALS를 사용하여 변이체의 삼량체 형성을 측정하기 위한 추가 실험을 HIV Env 변이체 (여기서, K658V 돌연변이는 본원에 설명된 바와 같이 표 1 및/또는 표 2로부터의 다른 돌연변이와 조합되어 존재함)에서 수행하며, 이외에도 클레이드 A 및 B 유래의 HIV 주에서 수행한다. 예를 들어, 658V 돌연변이는 상기에 설명된 바와 같은 ConC_SOSIP,7mut 변이체 (실시예 7)와, L556P, K655I, M535N, N651F, D589V, K588E를 갖는 BG505_SOSIP (실시예 9)와, 복구되고 안정화된 C97ZA_SOSIP (실시예 10)를 개선시키는 것으로 이미 밝혀져 있었다.

상기에 기술된 결과를 기반으로 하면, 위치 658에서의 아미노산의 발린, 이소류신, 페닐알라닌, 류신, 메티오닌 또는 알라닌 잔기로의 돌연변이, 바람직하게는 발린 잔기로의 돌연변이는 상이한 배경 HIV Env 단백질들에서 삼량체 형성 및/또는 삼량체 수득량을 개선시킬 것으로 예상된다.

실시예 16: 안정화된 HIV Env 단백질을 이용한 면역화

토끼 면역화 연구를 가용성 Env 단백질을 이용하여, 그리고 리포좀에 커플링된 Env 단백질을 이용하여 행한다. 프라이밍을 안정화된 ConC_SOSIP.v3 (서열 번호 28)을 이용하여 수행하고, 이어서 각각 다른 단백질을 이용하여, 즉, 1) 복구되고 안정화된 sC4_SOSIP.v4 (서열 번호 32); 2) 복구되고 안정화된 C97ZA_SOSIP.v2 (서열 번호 30); 3) 복구되고 안정화된 Du422_SOSIP.v1 (서열 번호 31); 및 4) 안정화된 BG505_SOSIP.v2 (서열 번호 29)를 이용하여 4회 부스팅을 수행한다.

혈청을 연이은 면역화 후 단리하고, 안정하고 폐쇄된 융합 전 배좌의 Env에 특별히 결합하는 유도된 항체에 대하여 분석하고 (ELISA를 사용), 이외에도 bNAb의 유도에 대하여 분석한다 (바이러스 중화 분석법을 이용).

상기 실시예는 본 발명이 융합 전 폐쇄 HIV 엔벨로프 삼량체 단백질의 폴딩 및 안정성을 최적화하기 위한 보편적인 접근법을 제공함을 입증한다.

본원에 기술된 실시예 및 실시 형태는 단지 예시적인 목적을 위한 것이고, 이의 광범위한 발명 개념으로부터 벗어나지 않으면서 위에 기술된 실시 형태에 대한 변화가 이루어질 수 있음이 이해된다. 따라서, 본 발명은 개시된 특정 실시 형태에 한정되지 않고, 첨부된 청구범위에 의해 정의되는 본 발명의 사상 및 범주 내에서의 변형을 포함하고자 함이 이해된다.

서열 목록

참고 문헌

SEQUENCE LISTING <110> Janssen Vaccines & Prevention B.V. Rutten, Lucy Truan, Daphn? Strokappe, Nika M. Langedijk, Johannes P.M. <120> Trimer Stabilizing HIV Envelope Protein Mutations <130> 0276 WO 00 ORD <150> EP16188866.4 <151> 2016-09-15 <160> 34 <170> PatentIn version 3.5 <210> 1 <211> 856 <212> PRT <213> HIV-1 <220> <221> misc_feature <223> gp160 of HIV-1 isolate HXB2 <400> 1 Met Arg Val Lys Glu Lys Tyr Gln His Leu Trp Arg Trp Gly Trp Arg 1 5 10 15 Trp Gly Thr Met Leu Leu Gly Met Leu Met Ile Cys Ser Ala Thr Glu 20 25 30 Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala 35 40 45 Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Thr Glu 50 55 60 Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn 65 70 75 80 Pro Gln Glu Val Val Leu Val Asn Val Thr Glu Asn Phe Asn Met Trp 85 90 95 Lys Asn Asp Met Val Glu Gln Met His Glu Asp Ile Ile Ser Leu Trp 100 105 110 Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Ser 115 120 125 Leu Lys Cys Thr Asp Leu Lys Asn Asp Thr Asn Thr Asn Ser Ser Ser 130 135 140 Gly Arg Met Ile Met Glu Lys Gly Glu Ile Lys Asn Cys Ser Phe Asn 145 150 155 160 Ile Ser Thr Ser Ile Arg Gly Lys Val Gln Lys Glu Tyr Ala Phe Phe 165 170 175 Tyr Lys Leu Asp Ile Ile Pro Ile Asp Asn Asp Thr Thr Ser Tyr Lys 180 185 190 Leu Thr Ser Cys Asn Thr Ser Val Ile Thr Gln Ala Cys Pro Lys Val 195 200 205 Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Phe Ala 210 215 220 Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Thr 225 230 235 240 Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Arg Pro Val Val Ser 245 250 255 Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val Val Ile 260 265 270 Arg Ser Val Asn Phe Thr Asp Asn Ala Lys Thr Ile Ile Val Gln Leu 275 280 285 Asn Thr Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg 290 295 300 Lys Arg Ile Arg Ile Gln Arg Gly Pro Gly Arg Ala Phe Val Thr Ile 305 310 315 320 Gly Lys Ile Gly Asn Met Arg Gln Ala His Cys Asn Ile Ser Arg Ala 325 330 335 Lys Trp Asn Asn Thr Leu Lys Gln Ile Ala Ser Lys Leu Arg Glu Gln 340 345 350 Phe Gly Asn Asn Lys Thr Ile Ile Phe Lys Gln Ser Ser Gly Gly Asp 355 360 365 Pro Glu Ile Val Thr His Ser Phe Asn Cys Gly Gly Glu Phe Phe Tyr 370 375 380 Cys Asn Ser Thr Gln Leu Phe Asn Ser Thr Trp Phe Asn Ser Thr Trp 385 390 395 400 Ser Thr Glu Gly Ser Asn Asn Thr Glu Gly Ser Asp Thr Ile Thr Leu 405 410 415 Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Lys Val Gly Lys 420 425 430 Ala Met Tyr Ala Pro Pro Ile Ser Gly Gln Ile Arg Cys Ser Ser Asn 435 440 445 Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Ser Asn Asn Glu 450 455 460 Ser Glu Ile Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg 465 470 475 480 Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val 485 490 495 Ala Pro Thr Lys Ala Lys Arg Arg Val Val Gln Arg Glu Lys Arg Ala 500 505 510 Val Gly Ile Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser 515 520 525 Thr Met Gly Ala Ala Ser Met Thr Leu Thr Val Gln Ala Arg Gln Leu 530 535 540 Leu Ser Gly Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Ile Glu 545 550 555 560 Ala Gln Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu 565 570 575 Gln Ala Arg Ile Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu 580 585 590 Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val 595 600 605 Pro Trp Asn Ala Ser Trp Ser Asn Lys Ser Leu Glu Gln Ile Trp Asn 610 615 620 His Thr Thr Trp Met Glu Trp Asp Arg Glu Ile Asn Asn Tyr Thr Ser 625 630 635 640 Leu Ile His Ser Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn 645 650 655 Glu Gln Glu Leu Leu Glu Leu Asp Lys Trp Ala Ser Leu Trp Asn Trp 660 665 670 Phe Asn Ile Thr Asn Trp Leu Trp Tyr Ile Lys Leu Phe Ile Met Ile 675 680 685 Val Gly Gly Leu Val Gly Leu Arg Ile Val Phe Ala Val Leu Ser Ile 690 695 700 Val Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu Ser Phe Gln Thr His 705 710 715 720 Leu Pro Thr Pro Arg Gly Pro Asp Arg Pro Glu Gly Ile Glu Glu Glu 725 730 735 Gly Gly Glu Arg Asp Arg Asp Arg Ser Ile Arg Leu Val Asn Gly Ser 740 745 750 Leu Ala Leu Ile Trp Asp Asp Leu Arg Ser Leu Cys Leu Phe Ser Tyr 755 760 765 His Arg Leu Arg Asp Leu Leu Leu Ile Val Thr Arg Ile Val Glu Leu 770 775 780 Leu Gly Arg Arg Gly Trp Glu Ala Leu Lys Tyr Trp Trp Asn Leu Leu 785 790 795 800 Gln Tyr Trp Ser Gln Glu Leu Lys Asn Ser Ala Val Ser Leu Leu Asn 805 810 815 Ala Thr Ala Ile Ala Val Ala Glu Gly Thr Asp Arg Val Ile Glu Val 820 825 830 Val Gln Gly Ala Cys Arg Ala Ile Arg His Ile Pro Arg Arg Ile Arg 835 840 845 Gln Gly Leu Glu Arg Ile Leu Leu 850 855 <210> 2 <211> 615 <212> PRT <213> Artificial Sequence <220> <223> HIV Env consensus clade C sequence <400> 2 Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala 1 5 10 15 Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu Lys Glu 20 25 30 Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn 35 40 45 Pro Gln Glu Met Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp 50 55 60 Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp 65 70 75 80 Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr 85 90 95 Leu Asn Cys Thr Asn Val Asn Val Thr Asn Thr Asn Asn Asn Asn Met 100 105 110 Lys Glu Glu Met Lys Asn Cys Ser Phe Asn Thr Thr Thr Glu Ile Arg 115 120 125 Asp Lys Lys Gln Lys Glu Tyr Ala Leu Phe Tyr Arg Leu Asp Ile Val 130 135 140 Pro Leu Asn Glu Asn Ser Ser Glu Tyr Arg Leu Ile Asn Cys Asn Thr 145 150 155 160 Ser Thr Ile Thr Gln Ala Cys Pro Lys Val Ser Phe Asp Pro Ile Pro 165 170 175 Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile Leu Lys Cys Asn Asn 180 185 190 Lys Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn Val Ser Thr Val Gln 195 200 205 Cys Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu Leu Asn 210 215 220 Gly Ser Leu Ala Glu Glu Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr 225 230 235 240 Asp Asn Ala Lys Thr Ile Ile Val His Leu Asn Glu Ser Val Glu Ile 245 250 255 Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly 260 265 270 Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg 275 280 285 Gln Ala His Cys Asn Ile Ser Glu Ala Lys Trp Asn Lys Thr Leu Gln 290 295 300 Arg Val Lys Lys Lys Leu Lys Glu His Phe Pro Asn Lys Thr Ile Lys 305 310 315 320 Phe Ala Pro Ser Ser Gly Gly Asp Leu Glu Ile Thr Thr His Ser Phe 325 330 335 Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Lys Leu Phe Asn 340 345 350 Ser Thr Tyr Asn Asn Thr Thr Ser Asn Ser Thr Ile Thr Leu Pro Cys 355 360 365 Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Ala Met 370 375 380 Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Lys Ser Asn Ile Thr 385 390 395 400 Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Asn Asn Asn Asn Thr Glu 405 410 415 Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg Ser Glu 420 425 430 Leu Tyr Lys Tyr Lys Val Val Glu Ile Lys Pro Leu Gly Ile Ala Pro 435 440 445 Thr Lys Ala Lys Arg Arg Val Val Glu Arg Glu Lys Arg Arg Ala Val 450 455 460 Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr 465 470 475 480 Met Gly Ala Ala Ser Ile Thr Leu Thr Val Gln Ala Arg Gln Leu Leu 485 490 495 Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Leu Arg Ala Ile Glu Ala 500 505 510 Gln Gln His Met Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln 515 520 525 Ala Arg Val Leu Ala Ile Glu Arg Tyr Leu Lys Asp Gln Gln Leu Leu 530 535 540 Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val Pro 545 550 555 560 Trp Asn Ser Ser Trp Ser Asn Lys Ser Gln Glu Asp Ile Trp Asp Asn 565 570 575 Met Thr Trp Met Gln Trp Asp Arg Glu Ile Ser Asn Tyr Thr Asp Thr 580 585 590 Ile Tyr Arg Leu Leu Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn Glu 595 600 605 Lys Asp Leu Leu Ala Leu Asp 610 615 <210> 3 <211> 616 <212> PRT <213> Artificial Sequence <220> <223> ConC_SOSIP sequence <400> 3 Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala 1 5 10 15 Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu Lys Glu 20 25 30 Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn 35 40 45 Pro Gln Glu Met Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp 50 55 60 Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp 65 70 75 80 Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr 85 90 95 Leu Asn Cys Thr Asn Val Asn Val Thr Asn Thr Asn Asn Asn Asn Met 100 105 110 Lys Glu Glu Met Lys Asn Cys Ser Phe Asn Thr Thr Thr Glu Ile Arg 115 120 125 Asp Lys Lys Gln Lys Glu Tyr Ala Leu Phe Tyr Arg Leu Asp Ile Val 130 135 140 Pro Leu Asn Glu Asn Ser Ser Glu Tyr Arg Leu Ile Asn Cys Asn Thr 145 150 155 160 Ser Thr Ile Thr Gln Ala Cys Pro Lys Val Ser Phe Asp Pro Ile Pro 165 170 175 Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile Leu Lys Cys Asn Asn 180 185 190 Lys Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn Val Ser Thr Val Gln 195 200 205 Cys Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu Leu Asn 210 215 220 Gly Ser Leu Ala Glu Glu Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr 225 230 235 240 Asp Asn Ala Lys Thr Ile Ile Val His Leu Asn Glu Ser Val Glu Ile 245 250 255 Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly 260 265 270 Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg 275 280 285 Gln Ala His Cys Asn Ile Ser Glu Ala Lys Trp Asn Lys Thr Leu Gln 290 295 300 Arg Val Lys Lys Lys Leu Lys Glu His Phe Pro Asn Lys Thr Ile Lys 305 310 315 320 Phe Ala Pro Ser Ser Gly Gly Asp Leu Glu Ile Thr Thr His Ser Phe 325 330 335 Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Lys Leu Phe Asn 340 345 350 Ser Thr Tyr Asn Asn Thr Thr Ser Asn Ser Thr Ile Thr Leu Pro Cys 355 360 365 Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Ala Met 370 375 380 Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Lys Ser Asn Ile Thr 385 390 395 400 Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Asn Asn Asn Asn Thr Glu 405 410 415 Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg Ser Glu 420 425 430 Leu Tyr Lys Tyr Lys Val Val Glu Ile Lys Pro Leu Gly Ile Ala Pro 435 440 445 Thr Lys Cys Lys Arg Arg Val Val Glu Arg Arg Arg Arg Arg Arg Ala 450 455 460 Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser 465 470 475 480 Thr Met Gly Ala Ala Ser Ile Thr Leu Thr Val Gln Ala Arg Gln Leu 485 490 495 Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Leu Arg Ala Pro Glu 500 505 510 Ala Gln Gln His Met Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu 515 520 525 Gln Ala Arg Val Leu Ala Ile Glu Arg Tyr Leu Lys Asp Gln Gln Leu 530 535 540 Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr Ala Val 545 550 555 560 Pro Trp Asn Ser Ser Trp Ser Asn Lys Ser Gln Glu Asp Ile Trp Asp 565 570 575 Asn Met Thr Trp Met Gln Trp Asp Arg Glu Ile Ser Asn Tyr Thr Asp 580 585 590 Thr Ile Tyr Arg Leu Leu Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn 595 600 605 Glu Lys Asp Leu Leu Ala Leu Asp 610 615 <210> 4 <211> 630 <212> PRT <213> Artificial Sequence <220> <223> HIV Env consensus Clade B sequence <400> 4 Ala Glu Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys 1 5 10 15 Glu Ala Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp 20 25 30 Thr Glu Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp 35 40 45 Pro Asn Pro Gln Glu Val Val Leu Glu Asn Val Thr Glu Asn Phe Asn 50 55 60 Met Trp Lys Asn Asn Met Val Glu Gln Met His Glu Asp Ile Ile Ser 65 70 75 80 Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys 85 90 95 Val Thr Leu Asn Cys Thr Asp Leu Asn Asn Asn Thr Thr Asn Asn Asn 100 105 110 Ser Ser Ser Glu Lys Met Glu Lys Gly Glu Ile Lys Asn Cys Ser Phe 115 120 125 Asn Ile Thr Thr Ser Ile Arg Asp Lys Val Gln Lys Glu Tyr Ala Leu 130 135 140 Phe Tyr Lys Leu Asp Val Val Pro Ile Asp Asn Asn Asn Thr Ser Tyr 145 150 155 160 Arg Leu Ile Ser Cys Asn Thr Ser Val Ile Thr Gln Ala Cys Pro Lys 165 170 175 Val Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Phe 180 185 190 Ala Ile Leu Lys Cys Asn Asp Lys Lys Phe Asn Gly Thr Gly Pro Cys 195 200 205 Thr Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Arg Pro Val Val 210 215 220 Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val Val 225 230 235 240 Ile Arg Ser Glu Asn Phe Thr Asp Asn Ala Lys Thr Ile Ile Val Gln 245 250 255 Leu Asn Glu Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr 260 265 270 Arg Lys Ser Ile His Ile Gly Pro Gly Arg Ala Phe Tyr Ala Thr Gly 275 280 285 Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Ile Ser Arg Thr 290 295 300 Lys Trp Asn Asn Thr Leu Lys Gln Ile Val Lys Lys Leu Arg Glu Gln 305 310 315 320 Phe Gly Asn Lys Thr Ile Val Phe Asn Gln Ser Ser Gly Gly Asp Pro 325 330 335 Glu Ile Val Met His Ser Phe Asn Cys Gly Gly Glu Phe Phe Tyr Cys 340 345 350 Asn Thr Thr Gln Leu Phe Asn Ser Thr Trp Asn Ser Asn Gly Thr Trp 355 360 365 Asn Asn Thr Thr Gly Asn Asp Thr Ile Thr Leu Pro Cys Arg Ile Lys 370 375 380 Gln Ile Ile Asn Met Trp Gln Glu Val Gly Lys Ala Met Tyr Ala Pro 385 390 395 400 Pro Ile Arg Gly Gln Ile Arg Cys Ser Ser Asn Ile Thr Gly Leu Leu 405 410 415 Leu Thr Arg Asp Gly Gly Asn Asn Asn Asn Asn Thr Thr Glu Thr Phe 420 425 430 Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg Ser Glu Leu Tyr 435 440 445 Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val Ala Pro Thr Lys 450 455 460 Cys Lys Arg Arg Val Val Gln Arg Arg Arg Arg Arg Arg Ala Val Gly 465 470 475 480 Ile Gly Ala Met Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met 485 490 495 Gly Ala Ala Ser Ile Thr Leu Thr Val Gln Ala Arg Gln Leu Leu Ser 500 505 510 Gly Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Pro Glu Ala Gln 515 520 525 Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln Ala 530 535 540 Arg Val Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu Leu Gly 545 550 555 560 Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr Ala Val Pro Trp 565 570 575 Asn Thr Ser Trp Ser Asn Lys Ser Leu Asp Glu Ile Trp Asp Asn Met 580 585 590 Thr Trp Met Gln Trp Glu Arg Glu Ile Asp Asn Tyr Thr Gly Leu Ile 595 600 605 Tyr Thr Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn Glu Gln 610 615 620 Glu Leu Leu Glu Leu Asp 625 630 <210> 5 <211> 630 <212> PRT <213> Artificial Sequence <220> <223> ConB_SOSIP sequence <400> 5 Ala Glu Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys 1 5 10 15 Glu Ala Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp 20 25 30 Thr Glu Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp 35 40 45 Pro Asn Pro Gln Glu Val Val Leu Glu Asn Val Thr Glu Asn Phe Asn 50 55 60 Met Trp Lys Asn Asn Met Val Glu Gln Met His Glu Asp Ile Ile Ser 65 70 75 80 Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys 85 90 95 Val Thr Leu Asn Cys Thr Asp Leu Asn Asn Asn Thr Thr Asn Asn Asn 100 105 110 Ser Ser Ser Glu Lys Met Glu Lys Gly Glu Ile Lys Asn Cys Ser Phe 115 120 125 Asn Ile Thr Thr Ser Ile Arg Asp Lys Val Gln Lys Glu Tyr Ala Leu 130 135 140 Phe Tyr Lys Leu Asp Val Val Pro Ile Asp Asn Asn Asn Thr Ser Tyr 145 150 155 160 Arg Leu Ile Ser Cys Asn Thr Ser Val Ile Thr Gln Ala Cys Pro Lys 165 170 175 Val Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Phe 180 185 190 Ala Ile Leu Lys Cys Asn Asp Lys Lys Phe Asn Gly Thr Gly Pro Cys 195 200 205 Thr Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Arg Pro Val Val 210 215 220 Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val Val 225 230 235 240 Ile Arg Ser Glu Asn Phe Thr Asp Asn Ala Lys Thr Ile Ile Val Gln 245 250 255 Leu Asn Glu Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr 260 265 270 Arg Lys Ser Ile His Ile Gly Pro Gly Arg Ala Phe Tyr Ala Thr Gly 275 280 285 Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Ile Ser Arg Thr 290 295 300 Lys Trp Asn Asn Thr Leu Lys Gln Ile Val Lys Lys Leu Arg Glu Gln 305 310 315 320 Phe Gly Asn Lys Thr Ile Val Phe Asn Gln Ser Ser Gly Gly Asp Pro 325 330 335 Glu Ile Val Met His Ser Phe Asn Cys Gly Gly Glu Phe Phe Tyr Cys 340 345 350 Asn Thr Thr Gln Leu Phe Asn Ser Thr Trp Asn Ser Asn Gly Thr Trp 355 360 365 Asn Asn Thr Thr Gly Asn Asp Thr Ile Thr Leu Pro Cys Arg Ile Lys 370 375 380 Gln Ile Ile Asn Met Trp Gln Glu Val Gly Lys Ala Met Tyr Ala Pro 385 390 395 400 Pro Ile Arg Gly Gln Ile Arg Cys Ser Ser Asn Ile Thr Gly Leu Leu 405 410 415 Leu Thr Arg Asp Gly Gly Asn Asn Asn Asn Asn Thr Thr Glu Thr Phe 420 425 430 Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg Ser Glu Leu Tyr 435 440 445 Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val Ala Pro Thr Lys 450 455 460 Cys Lys Arg Arg Val Val Gln Arg Arg Arg Arg Arg Arg Ala Val Gly 465 470 475 480 Ile Gly Ala Met Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met 485 490 495 Gly Ala Ala Ser Ile Thr Leu Thr Val Gln Ala Arg Gln Leu Leu Ser 500 505 510 Gly Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Pro Glu Ala Gln 515 520 525 Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln Ala 530 535 540 Arg Val Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu Leu Gly 545 550 555 560 Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr Ala Val Pro Trp 565 570 575 Asn Thr Ser Trp Ser Asn Lys Ser Leu Asp Glu Ile Trp Asp Asn Met 580 585 590 Thr Trp Met Gln Trp Glu Arg Glu Ile Asp Asn Tyr Thr Gly Leu Ile 595 600 605 Tyr Thr Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn Glu Gln 610 615 620 Glu Leu Leu Glu Leu Asp 625 630 <210> 6 <211> 625 <212> PRT <213> Artificial Sequence <220> <223> synthetic HIV envelope protein Mos2S Env C4 fragment <400> 6 Met Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys 1 5 10 15 Asp Ala Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu 20 25 30 Lys Glu Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp 35 40 45 Pro Asn Pro Gln Glu Ile Val Leu Gly Asn Val Thr Glu Asn Phe Asn 50 55 60 Met Trp Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser 65 70 75 80 Leu Trp Asp Ala Ser Leu Glu Pro Cys Val Lys Leu Thr Pro Leu Cys 85 90 95 Val Thr Leu Asn Cys Arg Asn Val Arg Asn Val Ser Ser Asn Gly Thr 100 105 110 Tyr Asn Ile Ile His Asn Glu Thr Tyr Lys Glu Met Lys Asn Cys Ser 115 120 125 Phe Asn Ala Thr Thr Val Val Glu Asp Arg Lys Gln Lys Val His Ala 130 135 140 Leu Phe Tyr Arg Leu Asp Ile Val Pro Leu Asp Glu Asn Asn Ser Ser 145 150 155 160 Glu Lys Ser Ser Glu Asn Ser Ser Glu Tyr Tyr Arg Leu Ile Asn Cys 165 170 175 Asn Thr Ser Ala Ile Thr Gln Ala Cys Pro Lys Val Ser Phe Asp Pro 180 185 190 Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile Leu Lys Cys 195 200 205 Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn Val Ser Thr 210 215 220 Val Gln Cys Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu 225 230 235 240 Leu Asn Gly Ser Leu Ala Glu Glu Glu Ile Ile Ile Arg Ser Glu Asn 245 250 255 Leu Thr Asn Asn Ala Lys Thr Ile Ile Val His Leu Asn Glu Thr Val 260 265 270 Asn Ile Thr Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg 275 280 285 Ile Gly Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp 290 295 300 Ile Arg Gln Ala His Cys Asn Leu Ser Arg Asp Gly Trp Asn Lys Thr 305 310 315 320 Leu Gln Gly Val Lys Lys Lys Leu Ala Glu His Phe Pro Asn Lys Thr 325 330 335 Ile Lys Phe Ala Pro His Ser Gly Gly Asp Leu Glu Ile Thr Thr His 340 345 350 Thr Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Asn Leu 355 360 365 Phe Asn Glu Ser Asn Ile Glu Arg Asn Asp Ser Ile Ile Thr Leu Pro 370 375 380 Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Ala 385 390 395 400 Ile Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Arg Ser Asn Ile 405 410 415 Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Ser Asn Asn Gly Val Pro 420 425 430 Asn Asp Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asn Asn 435 440 445 Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Glu Val Lys Pro Leu 450 455 460 Gly Val Ala Pro Thr Glu Ala Lys Arg Arg Val Val Glu Arg Glu Lys 465 470 475 480 Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Ile Leu Gly Ala Ala 485 490 495 Gly Ser Thr Met Gly Ala Ala Ser Ile Thr Leu Thr Val Gln Ala Arg 500 505 510 Gln Leu Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Leu Arg Ala 515 520 525 Ile Glu Ala Gln Gln His Met Leu Gln Leu Thr Val Trp Gly Ile Lys 530 535 540 Gln Leu Gln Thr Arg Val Leu Ala Ile Glu Arg Tyr Leu Gln Asp Gln 545 550 555 560 Gln Leu Leu Gly Leu Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr 565 570 575 Ala Val Pro Trp Asn Thr Ser Trp Ser Asn Lys Ser Gln Thr Asp Ile 580 585 590 Trp Asp Asn Met Thr Trp Met Gln Trp Asp Lys Glu Ile Gly Asn Tyr 595 600 605 Thr Gly Glu Ile Tyr Arg Leu Leu Glu Glu Ser Gln Asn Gln Gln Glu 610 615 620 Lys 625 <210> 7 <211> 627 <212> PRT <213> Artificial Sequence <220> <223> DS_sC4_SOSIP_E166R sequence <400> 7 Met Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys 1 5 10 15 Asp Ala Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu 20 25 30 Lys Glu Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp 35 40 45 Pro Asn Pro Gln Glu Ile Val Leu Gly Asn Val Thr Glu Asn Phe Asn 50 55 60 Met Trp Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser 65 70 75 80 Leu Trp Asp Ala Ser Leu Glu Pro Cys Val Lys Leu Thr Pro Leu Cys 85 90 95 Val Thr Leu Asn Cys Arg Asn Val Arg Asn Val Ser Ser Asn Gly Thr 100 105 110 Tyr Asn Ile Ile His Asn Glu Thr Tyr Lys Glu Met Lys Asn Cys Ser 115 120 125 Phe Asn Ala Thr Thr Val Val Arg Asp Arg Lys Gln Lys Val His Ala 130 135 140 Leu Phe Tyr Arg Leu Asp Ile Val Pro Leu Asp Glu Asn Asn Ser Ser 145 150 155 160 Glu Lys Ser Ser Glu Asn Ser Ser Glu Tyr Tyr Arg Leu Ile Asn Cys 165 170 175 Asn Thr Ser Ala Cys Thr Gln Ala Cys Pro Lys Val Ser Phe Asp Pro 180 185 190 Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile Leu Lys Cys 195 200 205 Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn Val Ser Thr 210 215 220 Val Gln Cys Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu 225 230 235 240 Leu Asn Gly Ser Leu Ala Glu Glu Glu Ile Ile Ile Arg Ser Glu Asn 245 250 255 Leu Thr Asn Asn Ala Lys Thr Ile Ile Val His Leu Asn Glu Thr Val 260 265 270 Asn Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg 275 280 285 Ile Gly Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp 290 295 300 Ile Arg Gln Ala His Cys Asn Leu Ser Arg Asp Gly Trp Asn Lys Thr 305 310 315 320 Leu Gln Gly Val Lys Lys Lys Leu Ala Glu His Phe Pro Asn Lys Thr 325 330 335 Ile Lys Phe Ala Pro His Ser Gly Gly Asp Leu Glu Ile Thr Thr His 340 345 350 Thr Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Asn Leu 355 360 365 Phe Asn Glu Ser Asn Ile Glu Arg Asn Asp Ser Ile Ile Thr Leu Pro 370 375 380 Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Cys 385 390 395 400 Ile Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Arg Ser Asn Ile 405 410 415 Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Ser Asn Asn Gly Val Pro 420 425 430 Asn Asp Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asn Asn 435 440 445 Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Glu Val Lys Pro Leu 450 455 460 Gly Val Ala Pro Thr Glu Cys Lys Arg Arg Val Val Glu Arg Arg Arg 465 470 475 480 Arg Arg Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Ile Leu Gly 485 490 495 Ala Ala Gly Ser Thr Met Gly Ala Ala Ser Ile Thr Leu Thr Val Gln 500 505 510 Ala Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Leu 515 520 525 Arg Ala Pro Glu Ala Gln Gln His Met Leu Gln Leu Thr Val Trp Gly 530 535 540 Ile Lys Gln Leu Gln Thr Arg Val Leu Ala Ile Glu Arg Tyr Leu Gln 545 550 555 560 Asp Gln Gln Leu Leu Gly Leu Trp Gly Cys Ser Gly Lys Leu Ile Cys 565 570 575 Cys Thr Ala Val Pro Trp Asn Thr Ser Trp Ser Asn Lys Ser Gln Thr 580 585 590 Asp Ile Trp Asp Asn Met Thr Trp Met Gln Trp Asp Lys Glu Ile Gly 595 600 605 Asn Tyr Thr Gly Glu Ile Tyr Arg Leu Leu Glu Glu Ser Gln Asn Gln 610 615 620 Gln Glu Lys 625 <210> 8 <211> 631 <212> PRT <213> Artificial Sequence <220> <223> Mos1.Env sequence <400> 8 Ala Gly Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys 1 5 10 15 Glu Ala Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp 20 25 30 Thr Glu Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp 35 40 45 Pro Asn Pro Gln Glu Val Val Leu Glu Asn Val Thr Glu Asn Phe Asn 50 55 60 Met Trp Lys Asn Asn Met Val Glu Gln Met His Glu Asp Ile Ile Ser 65 70 75 80 Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys 85 90 95 Val Thr Leu Asn Cys Thr Asp Asp Val Arg Asn Val Thr Asn Asn Ala 100 105 110 Thr Asn Thr Asn Ser Ser Trp Gly Glu Pro Met Glu Lys Gly Glu Ile 115 120 125 Lys Asn Cys Ser Phe Asn Ile Thr Thr Ser Ile Arg Asn Lys Val Gln 130 135 140 Lys Gln Tyr Ala Leu Phe Tyr Lys Leu Asp Val Val Pro Ile Asp Asn 145 150 155 160 Asp Ser Asn Asn Thr Asn Tyr Arg Leu Ile Ser Cys Asn Thr Ser Val 165 170 175 Ile Thr Gln Ala Cys Pro Lys Val Ser Phe Glu Pro Ile Pro Ile His 180 185 190 Tyr Cys Ala Pro Ala Gly Phe Ala Ile Leu Lys Cys Asn Asp Lys Lys 195 200 205 Phe Asn Gly Thr Gly Pro Cys Thr Asn Val Ser Thr Val Gln Cys Thr 210 215 220 His Gly Ile Arg Pro Val Val Ser Thr Gln Leu Leu Leu Asn Gly Ser 225 230 235 240 Leu Ala Glu Glu Glu Val Val Ile Arg Ser Glu Asn Phe Thr Asn Asn 245 250 255 Ala Lys Thr Ile Met Val Gln Leu Asn Val Ser Val Glu Ile Asn Cys 260 265 270 Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile His Ile Gly Pro Gly 275 280 285 Arg Ala Phe Tyr Thr Ala Gly Asp Ile Ile Gly Asp Ile Arg Gln Ala 290 295 300 His Cys Asn Ile Ser Arg Ala Asn Trp Asn Asn Thr Leu Arg Gln Ile 305 310 315 320 Val Glu Lys Leu Gly Lys Gln Phe Gly Asn Asn Lys Thr Ile Val Phe 325 330 335 Asn His Ser Ser Gly Gly Asp Pro Glu Ile Val Met His Ser Phe Asn 340 345 350 Cys Gly Gly Glu Phe Phe Tyr Cys Asn Ser Thr Lys Leu Phe Asn Ser 355 360 365 Thr Trp Thr Trp Asn Asn Ser Thr Trp Asn Asn Thr Lys Arg Ser Asn 370 375 380 Asp Thr Glu Glu His Ile Thr Leu Pro Cys Arg Ile Lys Gln Ile Ile 385 390 395 400 Asn Met Trp Gln Glu Val Gly Lys Ala Met Tyr Ala Pro Pro Ile Arg 405 410 415 Gly Gln Ile Arg Cys Ser Ser Asn Ile Thr Gly Leu Leu Leu Thr Arg 420 425 430 Asp Gly Gly Asn Asp Thr Ser Gly Thr Glu Ile Phe Arg Pro Gly Gly 435 440 445 Gly Asp Met Arg Asp Asn Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val 450 455 460 Val Lys Ile Glu Pro Leu Gly Val Ala Pro Thr Lys Ala Lys Arg Arg 465 470 475 480 Val Val Gln Ser Glu Lys Ser Ala Val Gly Ile Gly Ala Val Phe Leu 485 490 495 Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly Ala Ala Ser Met Thr 500 505 510 Leu Thr Val Gln Ala Arg Leu Leu Leu Ser Gly Ile Val Gln Gln Gln 515 520 525 Asn Asn Leu Leu Arg Ala Ile Glu Ala Gln Gln His Leu Leu Gln Leu 530 535 540 Thr Val Trp Gly Ile Lys Gln Leu Gln Ala Arg Val Leu Ala Val Glu 545 550 555 560 Arg Tyr Leu Lys Asp Gln Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly 565 570 575 Lys Leu Ile Cys Thr Thr Thr Val Pro Trp Asn Ala Ser Trp Ser Asn 580 585 590 Lys Ser Leu Asp Lys Ile Trp Asn Asn Met Thr Trp Met Glu Trp Glu 595 600 605 Arg Glu Ile Asn Asn Tyr Thr Ser Leu Ile Tyr Thr Leu Ile Glu Glu 610 615 620 Ser Gln Asn Gln Gln Glu Lys 625 630 <210> 9 <211> 630 <212> PRT <213> Artificial Sequence <220> <223> Mos2.Env sequence <400> 9 Met Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys 1 5 10 15 Glu Ala Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu 20 25 30 Lys Glu Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp 35 40 45 Pro Asn Pro Gln Glu Met Val Leu Glu Asn Val Thr Glu Asn Phe Asn 50 55 60 Met Trp Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Arg 65 70 75 80 Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys 85 90 95 Val Thr Leu Glu Cys Arg Asn Val Arg Asn Val Ser Ser Asn Gly Thr 100 105 110 Tyr Asn Ile Ile His Asn Glu Thr Tyr Lys Glu Met Lys Asn Cys Ser 115 120 125 Phe Asn Ala Thr Thr Val Val Glu Asp Arg Lys Gln Lys Val His Ala 130 135 140 Leu Phe Tyr Arg Leu Asp Ile Val Pro Leu Asp Glu Asn Asn Ser Ser 145 150 155 160 Glu Lys Ser Ser Glu Asn Ser Ser Glu Tyr Tyr Arg Leu Ile Asn Cys 165 170 175 Asn Thr Ser Ala Ile Thr Gln Ala Cys Pro Lys Val Ser Phe Asp Pro 180 185 190 Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile Leu Lys Cys 195 200 205 Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn Val Ser Thr 210 215 220 Val Gln Cys Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu 225 230 235 240 Leu Asn Gly Ser Leu Ala Glu Glu Glu Ile Ile Ile Arg Ser Glu Asn 245 250 255 Leu Thr Asn Asn Ala Lys Thr Ile Ile Val His Leu Asn Glu Thr Val 260 265 270 Asn Ile Thr Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg 275 280 285 Ile Gly Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp 290 295 300 Ile Arg Gln Ala His Cys Asn Leu Ser Arg Asp Gly Trp Asn Lys Thr 305 310 315 320 Leu Gln Gly Val Lys Lys Lys Leu Ala Glu His Phe Pro Asn Lys Thr 325 330 335 Ile Asn Phe Thr Ser Ser Ser Gly Gly Asp Leu Glu Ile Thr Thr His 340 345 350 Ser Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Gly Leu 355 360 365 Phe Asn Gly Thr Tyr Met Pro Asn Gly Thr Asn Ser Asn Ser Ser Ser 370 375 380 Asn Ile Thr Leu Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln 385 390 395 400 Glu Val Gly Arg Ala Met Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr 405 410 415 Cys Arg Ser Asn Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Ser 420 425 430 Asn Asn Gly Val Pro Asn Asp Thr Glu Thr Phe Arg Pro Gly Gly Gly 435 440 445 Asp Met Arg Asn Asn Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val 450 455 460 Glu Val Lys Pro Leu Gly Val Ala Pro Thr Glu Ala Lys Arg Arg Val 465 470 475 480 Val Glu Arg Glu Lys Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly 485 490 495 Ile Leu Gly Ala Ala Gly Ser Thr Met Gly Ala Ala Ser Ile Thr Leu 500 505 510 Thr Val Gln Ala Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln Ser 515 520 525 Asn Leu Leu Arg Ala Ile Glu Ala Gln Gln His Met Leu Gln Leu Thr 530 535 540 Val Trp Gly Ile Lys Gln Leu Gln Thr Arg Val Leu Ala Ile Glu Arg 545 550 555 560 Tyr Leu Gln Asp Gln Gln Leu Leu Gly Leu Trp Gly Cys Ser Gly Lys 565 570 575 Leu Ile Cys Thr Thr Ala Val Pro Trp Asn Thr Ser Trp Ser Asn Lys 580 585 590 Ser Gln Thr Asp Ile Trp Asp Asn Met Thr Trp Met Gln Trp Asp Lys 595 600 605 Glu Ile Gly Asn Tyr Thr Gly Glu Ile Tyr Arg Leu Leu Glu Glu Ser 610 615 620 Gln Asn Gln Gln Glu Lys 625 630 <210> 10 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> furin cleavage site mutant sequence <400> 10 Arg Arg Arg Arg Arg Arg 1 5 <210> 11 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> signal sequence <400> 11 Met Arg Val Arg Gly Ile Leu Arg Asn Trp Gln Gln Trp Trp Ile Trp 1 5 10 15 Gly Ile Leu Gly Phe Trp Met Leu Met Ile Cys Asn Val Val Gly 20 25 30 <210> 12 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> example of 8 amino acid sequence that can replace HR1 loop <400> 12 Asn Pro Asp Trp Leu Pro Asp Met 1 5 <210> 13 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> example of 8 amino acid sequence that can replace HR1 loop <400> 13 Gly Ser Gly Ser Gly Ser Gly Ser 1 5 <210> 14 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> example of 8 amino acid sequence that can replace HR1 loop <400> 14 Asp Asp Val His Pro Asp Trp Asp 1 5 <210> 15 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> example of 8 amino acid sequence that can replace HR1 loop <400> 15 Arg Asp Thr Phe Ala Leu Met Met 1 5 <210> 16 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> example of 8 amino acid sequence that can replace HR1 loop <400> 16 Asp Glu Glu Lys Val Met Asp Phe 1 5 <210> 17 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> example of 8 amino acid sequence that can replace HR1 loop <400> 17 Asp Glu Asp Pro His Trp Asp Pro 1 5 <210> 18 <211> 29 <212> PRT <213> Artificial Sequence <220> <223> signal sequence <400> 18 Met Arg Val Lys Gly Ile Arg Lys Asn Tyr Gln His Leu Trp Arg Trp 1 5 10 15 Gly Thr Met Leu Leu Gly Met Leu Met Ile Cys Ser Ala 20 25 <210> 19 <211> 61 <212> PRT <213> Artificial Sequence <220> <223> tag sequence <400> 19 Ala Ala Ala Leu Pro Glu Thr Gly Gly Gly Ser Asp Tyr Lys Asp Asp 1 5 10 15 Asp Asp Lys Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 20 25 30 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 35 40 45 Gly Ser Gly Gly Gly Gly Ser His His His His His His 50 55 60 <210> 20 <211> 616 <212> PRT <213> Artificial Sequence <220> <223> stabilized ConC_SOSIP Env protein (HIV160544) <400> 20 Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala 1 5 10 15 Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu Lys Glu 20 25 30 Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn 35 40 45 Pro Gln Glu Met Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp 50 55 60 Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp 65 70 75 80 Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr 85 90 95 Leu Asn Cys Thr Asn Val Asn Val Thr Asn Thr Asn Asn Asn Asn Met 100 105 110 Lys Glu Glu Met Lys Asn Cys Ser Phe Asn Thr Thr Thr Glu Ile Arg 115 120 125 Asp Lys Lys Gln Lys Glu Tyr Ala Leu Phe Tyr Arg Leu Asp Ile Val 130 135 140 Pro Leu Asn Glu Asn Ser Ser Glu Tyr Arg Leu Ile Asn Cys Asn Thr 145 150 155 160 Ser Thr Ile Thr Gln Ile Cys Pro Lys Val Ser Phe Asp Pro Ile Pro 165 170 175 Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile Leu Lys Cys Asn Asn 180 185 190 Lys Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn Val Ser Thr Val Gln 195 200 205 Cys Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu Leu Asn 210 215 220 Gly Ser Leu Ala Glu Glu Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr 225 230 235 240 Asp Asn Ala Lys Thr Ile Ile Val His Leu Asn Glu Ser Val Glu Ile 245 250 255 Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly 260 265 270 Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg 275 280 285 Gln Ala His Cys Asn Ile Ser Glu Ala Lys Trp Asn Lys Thr Leu Gln 290 295 300 Arg Val Lys Lys Lys Leu Lys Glu His Phe Pro Asn Lys Thr Ile Lys 305 310 315 320 Phe Ala Pro Ser Ser Gly Gly Asp Leu Glu Ile Thr Thr His Ser Phe 325 330 335 Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Lys Leu Phe Asn 340 345 350 Ser Thr Tyr Asn Asn Thr Thr Ser Asn Ser Thr Ile Thr Leu Pro Cys 355 360 365 Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Ala Met 370 375 380 Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Lys Ser Asn Ile Thr 385 390 395 400 Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Asn Asn Asn Asn Thr Glu 405 410 415 Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg Ser Glu 420 425 430 Leu Tyr Lys Tyr Lys Val Val Glu Ile Lys Pro Leu Gly Ile Ala Pro 435 440 445 Thr Lys Cys Lys Arg Arg Val Val Glu Arg Arg Arg Arg Arg Arg Ala 450 455 460 Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser 465 470 475 480 Thr Met Gly Ala Ala Ser Asn Thr Leu Thr Val Gln Ala Arg Gln Leu 485 490 495 Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Leu Arg Ala Pro Glu 500 505 510 Ala Gln Gln His Met Leu Gln Leu Thr Val Trp Gly Phe Lys Gln Leu 515 520 525 Gln Ala Arg Val Leu Ala Ile Glu Arg Tyr Leu Glu Val Gln Gln Leu 530 535 540 Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr Ala Val 545 550 555 560 Pro Trp Asn Ser Ser Trp Ser Asn Lys Ser Gln Glu Asp Ile Trp Asp 565 570 575 Asn Met Thr Trp Met Gln Trp Asp Arg Glu Ile Ser Asn Tyr Thr Asp 580 585 590 Thr Ile Tyr Arg Leu Leu Glu Glu Ser Gln Phe Gln Gln Glu Ile Asn 595 600 605 Glu Lys Asp Leu Leu Ala Leu Asp 610 615 <210> 21 <211> 634 <212> PRT <213> Artificial Sequence <220> <223> BG505_SOSIP Env protein (HIV150673) <400> 21 Ala Glu Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys 1 5 10 15 Asp Ala Glu Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu 20 25 30 Thr Glu Lys His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp 35 40 45 Pro Asn Pro Gln Glu Ile His Leu Glu Asn Val Thr Glu Glu Phe Asn 50 55 60 Met Trp Lys Asn Asn Met Val Glu Gln Met His Thr Asp Ile Ile Ser 65 70 75 80 Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys 85 90 95 Val Thr Leu Gln Cys Thr Asn Val Thr Asn Asn Ile Thr Asp Asp Met 100 105 110 Arg Gly Glu Leu Lys Asn Cys Ser Phe Asn Met Thr Thr Glu Leu Arg 115 120 125 Asp Lys Lys Gln Lys Val Tyr Ser Leu Phe Tyr Arg Leu Asp Val Val 130 135 140 Gln Ile Asn Glu Asn Gln Gly Asn Arg Ser Asn Asn Ser Asn Lys Glu 145 150 155 160 Tyr Arg Leu Ile Asn Cys Asn Thr Ser Ala Ile Thr Gln Ala Cys Pro 165 170 175 Lys Val Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly 180 185 190 Phe Ala Ile Leu Lys Cys Lys Asp Lys Lys Phe Asn Gly Thr Gly Pro 195 200 205 Cys Pro Ser Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro Val 210 215 220 Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val 225 230 235 240 Met Ile Arg Ser Glu Asn Ile Thr Asn Asn Ala Lys Asn Ile Leu Val 245 250 255 Gln Phe Asn Thr Pro Val Gln Ile Asn Cys Thr Arg Pro Asn Asn Asn 260 265 270 Thr Arg Lys Ser Ile Arg Ile Gly Pro Gly Gln Ala Phe Tyr Ala Thr 275 280 285 Gly Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Val Ser Lys 290 295 300 Ala Thr Trp Asn Glu Thr Leu Gly Lys Val Val Lys Gln Leu Arg Lys 305 310 315 320 His Phe Gly Asn Asn Thr Ile Ile Arg Phe Ala Asn Ser Ser Gly Gly 325 330 335 Asp Leu Glu Val Thr Thr His Ser Phe Asn Cys Gly Gly Glu Phe Phe 340 345 350 Tyr Cys Asn Thr Ser Gly Leu Phe Asn Ser Thr Trp Ile Ser Asn Thr 355 360 365 Ser Val Gln Gly Ser Asn Ser Thr Gly Ser Asn Asp Ser Ile Thr Leu 370 375 380 Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Arg Ile Gly Gln 385 390 395 400 Ala Met Tyr Ala Pro Pro Ile Gln Gly Val Ile Arg Cys Val Ser Asn 405 410 415 Ile Thr Gly Leu Ile Leu Thr Arg Asp Gly Gly Ser Thr Asn Ser Thr 420 425 430 Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg 435 440 445 Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val 450 455 460 Ala Pro Thr Arg Cys Lys Arg Arg Val Val Gly Arg Arg Arg Arg Arg 465 470 475 480 Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala Ala 485 490 495 Gly Ser Thr Met Gly Ala Ala Ser Met Thr Leu Thr Val Gln Ala Arg 500 505 510 Asn Leu Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Leu Arg Ala 515 520 525 Pro Glu Ala Gln Gln His Leu Leu Lys Leu Thr Val Trp Gly Ile Lys 530 535 540 Gln Leu Gln Ala Arg Val Leu Ala Val Glu Arg Tyr Leu Arg Asp Gln 545 550 555 560 Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr 565 570 575 Asn Val Pro Trp Asn Ser Ser Trp Ser Asn Arg Asn Leu Ser Glu Ile 580 585 590 Trp Asp Asn Met Thr Trp Leu Gln Trp Asp Lys Glu Ile Ser Asn Tyr 595 600 605 Thr Gln Ile Ile Tyr Gly Leu Leu Glu Glu Ser Gln Asn Gln Gln Glu 610 615 620 Lys Asn Glu Gln Asp Leu Leu Ala Leu Asp 625 630 <210> 22 <211> 634 <212> PRT <213> Artificial Sequence <220> <223> stabilized BG505_SOSIP Env protein (HIV170863) <400> 22 Ala Glu Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys 1 5 10 15 Asp Ala Glu Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu 20 25 30 Thr Glu Lys His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp 35 40 45 Pro Asn Pro Gln Glu Ile His Leu Glu Asn Val Thr Glu Glu Phe Asn 50 55 60 Met Trp Lys Asn Asn Met Val Glu Gln Met His Thr Asp Ile Ile Ser 65 70 75 80 Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys 85 90 95 Val Thr Leu Gln Cys Thr Asn Val Thr Asn Asn Ile Thr Asp Asp Met 100 105 110 Arg Gly Glu Leu Lys Asn Cys Ser Phe Asn Met Thr Thr Glu Leu Arg 115 120 125 Asp Lys Lys Gln Lys Val Tyr Ser Leu Phe Tyr Arg Leu Asp Val Val 130 135 140 Gln Ile Asn Glu Asn Gln Gly Asn Arg Ser Asn Asn Ser Asn Lys Glu 145 150 155 160 Tyr Arg Leu Ile Asn Cys Asn Thr Ser Ala Ile Thr Gln Ala Cys Pro 165 170 175 Lys Val Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly 180 185 190 Phe Ala Ile Leu Lys Cys Lys Asp Lys Lys Phe Asn Gly Thr Gly Pro 195 200 205 Cys Pro Ser Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro Val 210 215 220 Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val 225 230 235 240 Met Ile Arg Ser Glu Asn Ile Thr Asn Asn Ala Lys Asn Ile Leu Val 245 250 255 Gln Phe Asn Thr Pro Val Gln Ile Asn Cys Thr Arg Pro Asn Asn Asn 260 265 270 Thr Arg Lys Ser Ile Arg Ile Gly Pro Gly Gln Ala Phe Tyr Ala Thr 275 280 285 Gly Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Val Ser Lys 290 295 300 Ala Thr Trp Asn Glu Thr Leu Gly Lys Val Val Lys Gln Leu Arg Lys 305 310 315 320 His Phe Gly Asn Asn Thr Ile Ile Arg Phe Ala Asn Ser Ser Gly Gly 325 330 335 Asp Leu Glu Val Thr Thr His Ser Phe Asn Cys Gly Gly Glu Phe Phe 340 345 350 Tyr Cys Asn Thr Ser Gly Leu Phe Asn Ser Thr Trp Ile Ser Asn Thr 355 360 365 Ser Val Gln Gly Ser Asn Ser Thr Gly Ser Asn Asp Ser Ile Thr Leu 370 375 380 Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Arg Ile Gly Gln 385 390 395 400 Ala Met Tyr Ala Pro Pro Ile Gln Gly Val Ile Arg Cys Val Ser Asn 405 410 415 Ile Thr Gly Leu Ile Leu Thr Arg Asp Gly Gly Ser Thr Asn Ser Thr 420 425 430 Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg 435 440 445 Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val 450 455 460 Ala Pro Thr Arg Cys Lys Arg Arg Val Val Gly Arg Arg Arg Arg Arg 465 470 475 480 Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala Ala 485 490 495 Gly Ser Thr Met Gly Ala Ala Ser Asn Thr Leu Thr Val Gln Ala Arg 500 505 510 Asn Leu Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Pro Arg Ala 515 520 525 Pro Glu Ala Gln Gln His Leu Leu Lys Leu Thr Val Trp Gly Ile Lys 530 535 540 Gln Leu Gln Ala Arg Val Leu Ala Val Glu Arg Tyr Leu Arg Val Gln 545 550 555 560 Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr 565 570 575 Asn Val Pro Trp Asn Ser Ser Trp Ser Asn Arg Asn Leu Ser Glu Ile 580 585 590 Trp Asp Asn Met Thr Trp Leu Gln Trp Asp Lys Glu Ile Ser Asn Tyr 595 600 605 Thr Gln Ile Ile Tyr Gly Leu Leu Glu Glu Ser Gln Phe Gln Gln Glu 610 615 620 Ile Asn Glu Gln Asp Leu Leu Ala Leu Asp 625 630 <210> 23 <211> 619 <212> PRT <213> Artificial Sequence <220> <223> wt C97ZA_SOSIP Env protein with L535M and Q567K (HIV150673) <400> 23 Asn Met Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Thr Asp Ala 1 5 10 15 Lys Thr Thr Leu Phe Cys Ala Ser Asp Thr Lys Ala Tyr Asp Arg Glu 20 25 30 Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn 35 40 45 Pro Gln Glu Ile Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp 50 55 60 Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp 65 70 75 80 Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr 85 90 95 Leu His Cys Thr Asn Ala Thr Phe Lys Asn Asn Val Thr Asn Asp Met 100 105 110 Asn Lys Glu Ile Arg Asn Cys Ser Phe Asn Thr Thr Thr Glu Ile Arg 115 120 125 Asp Lys Lys Gln Gln Gly Tyr Ala Leu Phe Tyr Arg Pro Asp Ile Val 130 135 140 Leu Leu Lys Glu Asn Arg Asn Asn Ser Asn Asn Ser Glu Tyr Ile Leu 145 150 155 160 Ile Asn Cys Asn Ala Ser Thr Ile Thr Gln Ala Cys Pro Lys Val Asn 165 170 175 Phe Asp Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile 180 185 190 Leu Lys Cys Asn Asn Lys Thr Phe Ser Gly Lys Gly Pro Cys Asn Asn 195 200 205 Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro Val Val Ser Thr 210 215 220 Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Lys Glu Ile Ile Ile Arg 225 230 235 240 Ser Glu Asn Leu Thr Asp Asn Val Lys Thr Ile Ile Val His Leu Asn 245 250 255 Lys Ser Val Glu Ile Val Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys 260 265 270 Ser Met Arg Ile Gly Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile 275 280 285 Ile Gly Asp Ile Arg Gln Ala Tyr Cys Asn Ile Ser Gly Ser Lys Trp 290 295 300 Asn Glu Thr Leu Lys Arg Val Lys Glu Lys Leu Gln Glu Asn Tyr Asn 305 310 315 320 Asn Asn Lys Thr Ile Lys Phe Ala Pro Ser Ser Gly Gly Asp Leu Glu 325 330 335 Ile Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn 340 345 350 Thr Thr Arg Leu Phe Asn Asn Asn Ala Thr Glu Asp Glu Thr Ile Thr 355 360 365 Leu Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Gly Val Gly 370 375 380 Arg Ala Met Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Lys Ser 385 390 395 400 Asn Ile Thr Gly Leu Leu Leu Val Arg Asp Gly Gly Glu Asp Asn Lys 405 410 415 Thr Glu Glu Ile Phe Arg Pro Gly Gly Gly Asn Met Lys Asp Asn Trp 420 425 430 Arg Ser Glu Leu Tyr Lys Tyr Lys Val Ile Glu Leu Lys Pro Leu Gly 435 440 445 Ile Ala Pro Thr Gly Cys Lys Arg Arg Val Val Glu Arg Arg Arg Arg 450 455 460 Arg Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala 465 470 475 480 Ala Gly Ser Thr Met Gly Ala Ala Ser Met Thr Leu Thr Val Gln Ala 485 490 495 Arg Gln Leu Leu Ser Ser Ile Val Gln Gln Gln Ser Asn Leu Leu Arg 500 505 510 Ala Pro Glu Ala Gln Gln His Met Leu Lys Leu Thr Val Trp Gly Ile 515 520 525 Lys Gln Leu Gln Thr Arg Val Leu Ala Ile Glu Arg Tyr Leu Lys Asp 530 535 540 Gln Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys 545 550 555 560 Thr Asn Val Pro Trp Asn Ser Ser Trp Ser Asn Lys Ser Gln Thr Asp 565 570 575 Ile Trp Asn Asn Met Thr Trp Met Glu Trp Asp Arg Glu Ile Ser Asn 580 585 590 Tyr Thr Asp Thr Ile Tyr Arg Leu Leu Glu Asp Ser Gln Thr Gln Gln 595 600 605 Glu Lys Asn Glu Lys Asp Leu Leu Ala Leu Asp 610 615 <210> 24 <211> 619 <212> PRT <213> Artificial Sequence <220> <223> repaired and stabilized C97ZA_SOSIP Env protein (HIV170690) <400> 24 Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Asp Ala 1 5 10 15 Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Arg Glu 20 25 30 Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn 35 40 45 Pro Gln Glu Ile Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp 50 55 60 Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp 65 70 75 80 Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr 85 90 95 Leu His Cys Thr Asn Ala Thr Phe Lys Asn Asn Val Thr Asn Asp Met 100 105 110 Asn Lys Glu Ile Arg Asn Cys Ser Phe Asn Thr Thr Thr Glu Ile Arg 115 120 125 Asp Lys Lys Gln Lys Val Tyr Ala Leu Phe Tyr Arg Leu Asp Ile Val 130 135 140 Gln Leu Lys Glu Asn Arg Asn Asn Ser Asn Asn Ser Glu Tyr Arg Leu 145 150 155 160 Ile Asn Cys Asn Thr Ser Thr Ile Thr Gln Ile Cys Pro Lys Val Thr 165 170 175 Phe Asp Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile 180 185 190 Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn 195 200 205 Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro Val Val Ser Thr 210 215 220 Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Lys Glu Ile Ile Ile Arg 225 230 235 240 Ser Glu Asn Leu Thr Asp Asn Val Lys Thr Ile Ile Val His Leu Asn 245 250 255 Lys Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys 260 265 270 Ser Ile Arg Ile Gly Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile 275 280 285 Ile Gly Asp Ile Arg Gln Ala Tyr Cys Asn Ile Ser Gly Ser Lys Trp 290 295 300 Asn Glu Thr Leu Lys Arg Val Lys Glu Lys Leu Arg Glu His Phe Asn 305 310 315 320 Asn Asn Lys Thr Ile Lys Phe Ala Pro Ser Ser Gly Gly Asp Leu Glu 325 330 335 Ile Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn 340 345 350 Thr Thr Arg Leu Phe Asn Asn Asn Ala Thr Glu Asn Glu Thr Ile Thr 355 360 365 Leu Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly 370 375 380 Arg Ala Met Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Lys Ser 385 390 395 400 Asn Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Glu Asp Asn Lys 405 410 415 Thr Glu Glu Ile Phe Arg Pro Gly Gly Gly Asn Met Lys Asp Asn Trp 420 425 430 Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Glu Ile Lys Pro Leu Gly 435 440 445 Ile Ala Pro Thr Lys Cys Lys Arg Arg Asn Val Thr Arg Arg Arg Arg 450 455 460 Arg Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala 465 470 475 480 Ala Gly Ser Thr Met Gly Ala Ala Ser Asn Thr Leu Thr Val Gln Ala 485 490 495 Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Pro Arg 500 505 510 Ala Pro Glu Ala Gln Gln His Met Leu Lys Leu Thr Val Trp Gly Ile 515 520 525 Lys Gln Leu Gln Ala Arg Val Leu Ala Ile Glu Arg Tyr Leu Glu Val 530 535 540 Gln Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys 545 550 555 560 Thr Asn Val Pro Trp Asn Ser Ser Trp Ser Asn Lys Ser Gln Thr Asp 565 570 575 Ile Trp Asn Asn Met Thr Trp Met Glu Trp Asp Arg Glu Ile Ser Asn 580 585 590 Tyr Thr Asp Thr Ile Tyr Arg Leu Leu Glu Asp Ser Gln Phe Gln Gln 595 600 605 Glu Ile Asn Glu Lys Asp Leu Leu Ala Asn Asp 610 615 <210> 25 <211> 628 <212> PRT <213> Artificial Sequence <220> <223> variant of repaired and stabilized Du422 construct (HIV161818) <400> 25 Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala 1 5 10 15 Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Lys Glu 20 25 30 Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn 35 40 45 Pro Gln Glu Ile Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp 50 55 60 Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp 65 70 75 80 Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr 85 90 95 Leu Asn Cys Lys Asn Val Asn Ile Ser Ala Asn Ala Asn Ala Thr Ala 100 105 110 Thr Leu Asn Ser Ser Met Asn Gly Glu Ile Lys Asn Cys Ser Phe Asn 115 120 125 Thr Thr Thr Glu Leu Arg Asp Lys Lys Gln Lys Val Tyr Ala Leu Phe 130 135 140 Tyr Lys Pro Asp Val Val Pro Leu Asn Gly Gly Glu His Asn Glu Thr 145 150 155 160 Gly Glu Tyr Ile Leu Ile Asn Cys Asn Ser Ser Thr Cys Thr Gln Ala 165 170 175 Cys Pro Lys Val Ser Phe Asp Pro Ile Pro Ile His Tyr Cys Ala Pro 180 185 190 Ala Gly Tyr Ala Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr 195 200 205 Gly Pro Cys Asn Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Lys 210 215 220 Pro Val Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu 225 230 235 240 Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr Asn Asn Ile Lys Thr Ile 245 250 255 Ile Val His Leu Asn Lys Ser Val Glu Ile Asn Cys Thr Arg Pro Asn 260 265 270 Asn Asn Thr Arg Lys Ser Val Arg Ile Gly Pro Gly Gln Thr Phe Tyr 275 280 285 Ala Thr Gly Glu Ile Ile Gly Asp Ile Arg Glu Ala His Cys Asn Ile 290 295 300 Ser Arg Glu Thr Trp Asn Ser Thr Leu Ile Gln Val Lys Glu Lys Leu 305 310 315 320 Arg Glu His Tyr Asn Lys Thr Ile Lys Phe Glu Pro Ser Ser Gly Gly 325 330 335 Asp Leu Glu Val Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe Phe 340 345 350 Tyr Cys Asn Thr Thr Lys Leu Phe Asn Glu Thr Lys Leu Phe Asn Glu 355 360 365 Ser Glu Tyr Val Asp Asn Lys Thr Ile Ile Leu Pro Cys Arg Ile Lys 370 375 380 Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Cys Met Tyr Ala Pro 385 390 395 400 Pro Ile Glu Gly Asn Ile Thr Cys Lys Ser Asn Ile Thr Gly Leu Leu 405 410 415 Leu Thr Arg Asp Gly Gly Glu Asn Ser Thr Glu Glu Val Phe Arg Pro 420 425 430 Gly Gly Gly Asn Met Lys Asp Asn Trp Arg Ser Glu Leu Tyr Lys Tyr 435 440 445 Lys Val Val Glu Ile Lys Pro Leu Gly Val Ala Pro Thr Lys Cys Lys 450 455 460 Arg Lys Asn Val Thr Arg Arg Arg Arg Arg Arg Ala Val Gly Leu Gly 465 470 475 480 Ala Val Leu Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly Ala 485 490 495 Ala Ser Asn Thr Leu Thr Val Gln Ala Arg Gln Leu Leu Ser Gly Ile 500 505 510 Val Gln Gln Gln Ser Asn Leu Pro Arg Ala Pro Glu Ala Gln Gln His 515 520 525 Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln Thr Arg Val 530 535 540 Leu Ala Ile Glu Arg Tyr Leu Lys Val Gln Gln Leu Leu Gly Leu Trp 545 550 555 560 Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr Ala Val Pro Trp Asn Ser 565 570 575 Ser Trp Ser Asn Lys Ser Leu Gly Asp Ile Trp Asp Asn Met Thr Trp 580 585 590 Met Gln Trp Asp Arg Glu Ile Ser Asn Tyr Thr Asn Thr Ile Tyr Arg 595 600 605 Leu Leu Glu Asp Ser Gln Phe Gln Gln Glu Lys Asn Glu Lys Asp Leu 610 615 620 Leu Ala Asn Asp 625 <210> 26 <211> 628 <212> PRT <213> Artificial Sequence <220> <223> repaired and stabilized Du422_SOSIP Env protein (HIV170859) <400> 26 Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala 1 5 10 15 Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Lys Glu 20 25 30 Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn 35 40 45 Pro Gln Glu Ile Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp 50 55 60 Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp 65 70 75 80 Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr 85 90 95 Leu Asn Cys Lys Asn Val Asn Ile Ser Ala Asn Ala Asn Ala Thr Ala 100 105 110 Thr Leu Asn Ser Ser Met Asn Gly Glu Ile Lys Asn Cys Ser Phe Asn 115 120 125 Thr Thr Thr Glu Leu Arg Asp Lys Lys Gln Lys Val Tyr Ala Leu Phe 130 135 140 Tyr Lys Pro Asp Val Val Pro Leu Asn Gly Gly Glu His Asn Glu Thr 145 150 155 160 Gly Glu Tyr Ile Leu Ile Asn Cys Asn Ser Ser Thr Ile Thr Gln Ala 165 170 175 Cys Pro Lys Val Ser Phe Asp Pro Ile Pro Ile His Tyr Cys Ala Pro 180 185 190 Ala Gly Tyr Ala Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr 195 200 205 Gly Pro Cys Asn Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Lys 210 215 220 Pro Val Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu 225 230 235 240 Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr Asn Asn Ile Lys Thr Ile 245 250 255 Ile Val His Leu Asn Lys Ser Val Glu Ile Asn Cys Thr Arg Pro Asn 260 265 270 Asn Asn Thr Arg Lys Ser Val Arg Ile Gly Pro Gly Gln Thr Phe Tyr 275 280 285 Ala Thr Gly Glu Ile Ile Gly Asp Ile Arg Glu Ala His Cys Asn Ile 290 295 300 Ser Arg Glu Thr Trp Asn Ser Thr Leu Ile Gln Val Lys Glu Lys Leu 305 310 315 320 Arg Glu His Tyr Asn Lys Thr Ile Lys Phe Glu Pro Ser Ser Gly Gly 325 330 335 Asp Leu Glu Val Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe Phe 340 345 350 Tyr Cys Asn Thr Thr Lys Leu Phe Asn Glu Thr Lys Leu Phe Asn Glu 355 360 365 Ser Glu Tyr Val Asp Asn Lys Thr Ile Ile Leu Pro Cys Arg Ile Lys 370 375 380 Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Ala Met Tyr Ala Pro 385 390 395 400 Pro Ile Glu Gly Asn Ile Thr Cys Lys Ser Asn Ile Thr Gly Leu Leu 405 410 415 Leu Thr Arg Asp Gly Gly Glu Asn Ser Thr Glu Glu Val Phe Arg Pro 420 425 430 Gly Gly Gly Asn Met Lys Asp Asn Trp Arg Ser Glu Leu Tyr Lys Tyr 435 440 445 Lys Val Val Glu Ile Lys Pro Leu Gly Val Ala Pro Thr Lys Cys Lys 450 455 460 Arg Lys Val Val Gly Arg Arg Arg Arg Arg Arg Ala Val Gly Leu Gly 465 470 475 480 Ala Val Leu Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly Ala 485 490 495 Ala Ser Asn Thr Leu Thr Val Gln Ala Arg Gln Leu Leu Ser Gly Ile 500 505 510 Val Gln Gln Gln Ser Asn Leu Pro Arg Ala Pro Glu Ala Gln Gln His 515 520 525 Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln Thr Arg Val 530 535 540 Leu Ala Ile Glu Arg Tyr Leu Glu Val Gln Gln Leu Leu Gly Leu Trp 545 550 555 560 Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr Ala Val Pro Trp Asn Ser 565 570 575 Ser Trp Ser Asn Lys Ser Leu Gly Asp Ile Trp Asp Asn Met Thr Trp 580 585 590 Met Gln Trp Asp Arg Glu Ile Ser Asn Tyr Thr Asn Thr Ile Tyr Arg 595 600 605 Leu Leu Glu Asp Ser Gln Phe Gln Gln Glu Ile Asn Glu Lys Asp Leu 610 615 620 Leu Ala Leu Asp 625 <210> 27 <211> 599 <212> PRT <213> Artificial Sequence <220> <223> repaired and stabilized DS_sC4_SOSIP Env protein (HIV170686) <400> 27 Met Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys 1 5 10 15 Asp Ala Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu 20 25 30 Lys Glu Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp 35 40 45 Pro Asn Pro Gln Glu Ile Val Leu Gly Asn Val Thr Glu Asn Phe Asn 50 55 60 Met Trp Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser 65 70 75 80 Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys 85 90 95 Val Thr Leu Asn Cys Arg Asn Val Arg Asn Val Glu Met Lys Asn Cys 100 105 110 Ser Phe Asn Ala Thr Thr Val Val Arg Asp Arg Lys Gln Lys Val His 115 120 125 Ala Leu Phe Tyr Arg Leu Asp Ile Val Pro Leu Asp Glu Asn Asn Ser 130 135 140 Ser Tyr Arg Leu Ile Asn Cys Asn Thr Ser Ala Cys Thr Gln Ile Cys 145 150 155 160 Pro Lys Val Ser Phe Asp Pro Ile Pro Ile His Tyr Cys Ala Pro Ala 165 170 175 Gly Tyr Ala Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly 180 185 190 Pro Cys Asn Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro 195 200 205 Val Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu 210 215 220 Ile Ile Ile Arg Ser Glu Asn Leu Thr Asn Asn Ala Lys Thr Ile Ile 225 230 235 240 Val His Leu Asn Glu Thr Val Asn Ile Asn Cys Thr Arg Pro Asn Asn 245 250 255 Asn Thr Arg Lys Ser Ile Arg Ile Gly Pro Gly Gln Thr Phe Tyr Ala 260 265 270 Thr Gly Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Leu Ser 275 280 285 Arg Asp Gly Trp Asn Lys Thr Leu Gln Gly Val Lys Lys Lys Leu Ala 290 295 300 Glu His Phe Pro Asn Lys Thr Ile Lys Phe Ala Pro His Ser Gly Gly 305 310 315 320 Asp Leu Glu Ile Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe Phe 325 330 335 Tyr Cys Asn Thr Ser Asn Leu Phe Asn Glu Ser Asn Ile Glu Arg Asn 340 345 350 Asp Ser Ile Ile Thr Leu Pro Cys Arg Ile Lys Gln Ile Ile Asn Met 355 360 365 Trp Gln Glu Val Gly Arg Cys Met Tyr Ala Pro Pro Ile Ala Gly Asn 370 375 380 Ile Thr Cys Arg Ser Asn Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly 385 390 395 400 Gly Ser Asn Asn Asn Asp Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp 405 410 415 Met Arg Asn Asn Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Glu 420 425 430 Val Lys Pro Leu Gly Val Ala Pro Thr Glu Cys Lys Arg Arg Val Val 435 440 445 Glu Arg Arg Arg Arg Arg Arg Ala Val Gly Ile Gly Ala Val Phe Leu 450 455 460 Gly Ile Leu Gly Ala Ala Gly Ser Thr Met Gly Ala Ala Ser Asn Thr 465 470 475 480 Leu Thr Val Gln Ala Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln 485 490 495 Ser Asn Leu Pro Arg Ala Pro Glu Ala Gln Gln His Met Leu Gln Leu 500 505 510 Thr Val Trp Gly Ile Lys Gln Leu Gln Thr Arg Val Leu Ala Ile Glu 515 520 525 Arg Tyr Leu Glu Val Gln Gln Leu Leu Gly Leu Trp Gly Cys Ser Gly 530 535 540 Lys Leu Ile Cys Cys Thr Ala Val Pro Trp Asn Thr Ser Trp Ser Asn 545 550 555 560 Lys Ser Gln Thr Asp Ile Trp Asp Asn Met Thr Trp Met Gln Trp Asp 565 570 575 Lys Glu Ile Gly Asn Tyr Thr Gly Glu Ile Tyr Arg Leu Leu Glu Glu 580 585 590 Ser Gln Phe Gln Gln Glu Ile 595 <210> 28 <211> 607 <212> PRT <213> Artificial Sequence <220> <223> Stabilized ConC_SOSIP.v3 Env protein (HIV170654) <400> 28 Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala 1 5 10 15 Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu Lys Glu 20 25 30 Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn 35 40 45 Pro Gln Glu Met Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp 50 55 60 Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp 65 70 75 80 Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr 85 90 95 Leu Asn Cys Thr Asn Val Asn Val Thr Glu Met Lys Asn Cys Ser Phe 100 105 110 Asn Thr Thr Thr Glu Ile Arg Asp Lys Lys Gln Lys Glu Tyr Ala Leu 115 120 125 Phe Tyr Arg Leu Asp Ile Val Pro Leu Asn Glu Asn Ser Ser Glu Tyr 130 135 140 Arg Leu Ile Asn Cys Asn Thr Ser Thr Ile Thr Gln Ile Cys Pro Lys 145 150 155 160 Val Ser Phe Asp Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Tyr 165 170 175 Ala Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys 180 185 190 Asn Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro Val Val 195 200 205 Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Ile Ile 210 215 220 Ile Arg Ser Glu Asn Leu Thr Asn Asn Val Lys Thr Ile Ile Val His 225 230 235 240 Leu Asn Glu Ser Val Glu Ile Val Cys Thr Arg Pro Asn Asn Asn Thr 245 250 255 Arg Lys Ser Ile Arg Ile Gly Pro Gly Gln Thr Phe Tyr Ala Thr Gly 260 265 270 Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Ile Ser Glu Ala 275 280 285 Lys Trp Asn Lys Thr Leu Gln Arg Val Lys Lys Lys Leu Lys Glu His 290 295 300 Phe Pro Asn Lys Thr Ile Lys Phe Gln Pro Ser Ser Gly Gly Asp Leu 305 310 315 320 Glu Ile Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys 325 330 335 Asn Thr Ser Lys Leu Phe Asn Ser Thr Tyr Asn Asn Thr Thr Ser Asn 340 345 350 Ser Thr Ile Thr Leu Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp 355 360 365 Gln Glu Val Gly Arg Ala Met Tyr Ala Pro Pro Ile Ala Gly Asn Ile 370 375 380 Thr Cys Lys Ser Asn Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly 385 390 395 400 Asn Asn Asn Asn Asn Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp Met 405 410 415 Arg Asp Asn Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Glu Ile 420 425 430 Lys Pro Leu Gly Ile Ala Pro Thr Lys Cys Lys Arg Arg Val Val Glu 435 440 445 Arg Arg Arg Arg Arg Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly 450 455 460 Phe Leu Gly Ala Ala Gly Ser Thr Met Gly Ala Ala Ser Asn Thr Leu 465 470 475 480 Thr Val Gln Ala Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln Ser 485 490 495 Asn Leu Leu Arg Ala Pro Glu Ala Gln Gln His Met Leu Gln Leu Thr 500 505 510 Val Trp Gly Phe Lys Gln Leu Gln Ala Arg Val Leu Ala Ile Glu Arg 515 520 525 Tyr Leu Glu Val Gln Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys 530 535 540 Leu Ile Cys Cys Thr Ala Val Pro Trp Asn Ser Ser Trp Ser Asn Lys 545 550 555 560 Ser Gln Glu Asp Ile Trp Asp Asn Met Thr Trp Met Gln Trp Asp Arg 565 570 575 Glu Ile Ser Asn Tyr Thr Asp Thr Ile Tyr Arg Leu Leu Glu Glu Ser 580 585 590 Gln Phe Gln Gln Glu Ile Asn Glu Lys Asp Leu Leu Ala Leu Asp 595 600 605 <210> 29 <211> 634 <212> PRT <213> Artificial Sequence <220> <223> Stabilized BG505_SOSIP.v2 Env protein (HIV171814) <400> 29 Ala Glu Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys 1 5 10 15 Asp Ala Glu Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu 20 25 30 Thr Glu Lys His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp 35 40 45 Pro Asn Pro Gln Glu Ile His Leu Glu Asn Val Thr Glu Glu Phe Asn 50 55 60 Met Trp Lys Asn Asn Met Val Glu Gln Met His Thr Asp Ile Ile Ser 65 70 75 80 Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys 85 90 95 Val Thr Leu Gln Cys Thr Asn Val Thr Asn Asn Ile Thr Asp Asp Met 100 105 110 Arg Gly Glu Leu Lys Asn Cys Ser Phe Asn Met Thr Thr Glu Leu Arg 115 120 125 Asp Lys Lys Gln Lys Val Tyr Ser Leu Phe Tyr Arg Leu Asp Val Val 130 135 140 Gln Ile Asn Glu Asn Gln Gly Asn Arg Ser Asn Asn Ser Asn Lys Glu 145 150 155 160 Tyr Arg Leu Ile Asn Cys Asn Thr Ser Ala Cys Thr Gln Ala Cys Pro 165 170 175 Lys Val Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly 180 185 190 Phe Ala Ile Leu Lys Cys Lys Asp Lys Lys Phe Asn Gly Thr Gly Pro 195 200 205 Cys Pro Ser Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro Val 210 215 220 Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val 225 230 235 240 Met Ile Arg Ser Glu Asn Ile Thr Asn Asn Ala Lys Asn Ile Leu Val 245 250 255 Gln Phe Asn Thr Pro Val Gln Ile Asn Cys Thr Arg Pro Asn Asn Asn 260 265 270 Thr Arg Lys Ser Ile Arg Ile Gly Pro Gly Gln Ala Phe Tyr Ala Thr 275 280 285 Gly Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Val Ser Lys 290 295 300 Ala Thr Trp Asn Glu Thr Leu Gly Lys Val Val Lys Gln Leu Arg Lys 305 310 315 320 His Phe Gly Asn Asn Thr Ile Ile Arg Phe Ala Asn Ser Ser Gly Gly 325 330 335 Asp Leu Glu Val Thr Thr His Ser Phe Asn Cys Gly Gly Glu Phe Phe 340 345 350 Tyr Cys Asn Thr Ser Gly Leu Phe Asn Ser Thr Trp Ile Ser Asn Thr 355 360 365 Ser Val Gln Gly Ser Asn Ser Thr Gly Ser Asn Asp Ser Ile Thr Leu 370 375 380 Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Arg Ile Gly Gln 385 390 395 400 Cys Met Tyr Ala Pro Pro Ile Gln Gly Val Ile Arg Cys Val Ser Asn 405 410 415 Ile Thr Gly Leu Ile Leu Thr Arg Asp Gly Gly Ser Thr Asn Ser Thr 420 425 430 Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg 435 440 445 Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val 450 455 460 Ala Pro Thr Arg Cys Lys Arg Arg Val Val Gly Arg Arg Arg Arg Arg 465 470 475 480 Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala Ala 485 490 495 Gly Ser Thr Met Gly Ala Ala Ser Asn Thr Leu Thr Val Gln Ala Arg 500 505 510 Asn Leu Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Pro Arg Ala 515 520 525 Pro Glu Ala Gln Gln His Leu Leu Lys Leu Thr Val Trp Gly Ile Lys 530 535 540 Gln Leu Gln Ala Arg Val Leu Ala Val Glu Arg Tyr Leu Glu Val Gln 545 550 555 560 Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr 565 570 575 Asn Val Pro Trp Asn Ser Ser Trp Ser Asn Arg Asn Leu Ser Glu Ile 580 585 590 Trp Asp Asn Met Thr Trp Leu Gln Trp Asp Lys Glu Ile Ser Asn Tyr 595 600 605 Thr Gln Ile Ile Tyr Gly Leu Leu Glu Glu Ser Gln Phe Gln Gln Glu 610 615 620 Ile Asn Glu Val Asp Leu Leu Ala Leu Asp 625 630 <210> 30 <211> 619 <212> PRT <213> Artificial Sequence <220> <223> Repaired and stabilized C97ZA_SOSIP.v2 Env protein (HIV171810) <400> 30 Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Asp Ala 1 5 10 15 Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Arg Glu 20 25 30 Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn 35 40 45 Pro Gln Glu Ile Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp 50 55 60 Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp 65 70 75 80 Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr 85 90 95 Leu His Cys Thr Asn Ala Thr Phe Lys Asn Asn Val Thr Asn Asp Met 100 105 110 Asn Lys Glu Ile Arg Asn Cys Ser Phe Asn Thr Thr Thr Glu Ile Arg 115 120 125 Asp Lys Lys Gln Lys Val Tyr Ala Leu Phe Tyr Arg Leu Asp Ile Val 130 135 140 Gln Leu Lys Glu Asn Arg Asn Asn Ser Asn Asn Ser Glu Tyr Arg Leu 145 150 155 160 Ile Asn Cys Asn Thr Ser Thr Cys Thr Gln Ile Cys Pro Lys Val Thr 165 170 175 Phe Asp Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Tyr Ala Ile 180 185 190 Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Asn Asn 195 200 205 Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro Val Val Ser Thr 210 215 220 Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Lys Glu Ile Ile Ile Arg 225 230 235 240 Ser Glu Asn Leu Thr Asp Asn Val Lys Thr Ile Ile Val His Leu Asn 245 250 255 Lys Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys 260 265 270 Ser Ile Arg Ile Gly Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile 275 280 285 Ile Gly Asp Ile Arg Gln Ala Tyr Cys Asn Ile Ser Gly Ser Lys Trp 290 295 300 Asn Glu Thr Leu Lys Arg Val Lys Glu Lys Leu Arg Glu His Phe Asn 305 310 315 320 Asn Asn Lys Thr Ile Lys Phe Ala Pro Ser Ser Gly Gly Asp Leu Glu 325 330 335 Ile Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn 340 345 350 Thr Thr Arg Leu Phe Asn Asn Asn Ala Thr Glu Asn Glu Thr Ile Thr 355 360 365 Leu Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly 370 375 380 Arg Cys Met Tyr Ala Pro Pro Ile Ala Gly Asn Ile Thr Cys Lys Ser 385 390 395 400 Asn Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Glu Asp Asn Lys 405 410 415 Thr Glu Glu Ile Phe Arg Pro Gly Gly Gly Asn Met Lys Asp Asn Trp 420 425 430 Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Glu Ile Lys Pro Leu Gly 435 440 445 Ile Ala Pro Thr Lys Cys Lys Arg Arg Asn Val Thr Arg Arg Arg Arg 450 455 460 Arg Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala 465 470 475 480 Ala Gly Ser Thr Met Gly Ala Ala Ser Asn Thr Leu Thr Val Gln Ala 485 490 495 Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Pro Arg 500 505 510 Ala Pro Glu Ala Gln Gln His Met Leu Lys Leu Thr Val Trp Gly Ile 515 520 525 Lys Gln Leu Gln Ala Arg Val Leu Ala Ile Glu Arg Tyr Leu Glu Val 530 535 540 Gln Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Cys 545 550 555 560 Thr Asn Val Pro Trp Asn Ser Ser Trp Ser Asn Lys Ser Gln Thr Asp 565 570 575 Ile Trp Asn Asn Met Thr Trp Met Glu Trp Asp Arg Glu Ile Ser Asn 580 585 590 Tyr Thr Asp Thr Ile Tyr Arg Leu Leu Glu Asp Ser Gln Phe Gln Gln 595 600 605 Glu Ile Asn Glu Val Asp Leu Leu Ala Asn Asp 610 615 <210> 31 <211> 628 <212> PRT <213> Artificial Sequence <220> <223> Repaired and stabilized Du422_SOSIP.v1 Env protein (HIV171812) <400> 31 Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala 1 5 10 15 Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Lys Glu 20 25 30 Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn 35 40 45 Pro Gln Glu Ile Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp 50 55 60 Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser Leu Trp 65 70 75 80 Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr 85 90 95 Leu Asn Cys Lys Asn Val Asn Ile Ser Ala Asn Ala Asn Ala Thr Ala 100 105 110 Thr Leu Asn Ser Ser Met Asn Gly Glu Ile Lys Asn Cys Ser Phe Asn 115 120 125 Thr Thr Thr Glu Leu Arg Asp Lys Lys Gln Lys Val Tyr Ala Leu Phe 130 135 140 Tyr Lys Pro Asp Val Val Pro Leu Asn Gly Gly Glu His Asn Glu Thr 145 150 155 160 Gly Glu Tyr Ile Leu Ile Asn Cys Asn Ser Ser Thr Cys Thr Gln Ala 165 170 175 Cys Pro Lys Val Ser Phe Asp Pro Ile Pro Ile His Tyr Cys Ala Pro 180 185 190 Ala Gly Tyr Ala Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr 195 200 205 Gly Pro Cys Asn Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Lys 210 215 220 Pro Val Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu 225 230 235 240 Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr Asn Asn Ile Lys Thr Ile 245 250 255 Ile Val His Leu Asn Lys Ser Val Glu Ile Asn Cys Thr Arg Pro Asn 260 265 270 Asn Asn Thr Arg Lys Ser Val Arg Ile Gly Pro Gly Gln Thr Phe Tyr 275 280 285 Ala Thr Gly Glu Ile Ile Gly Asp Ile Arg Glu Ala His Cys Asn Ile 290 295 300 Ser Arg Glu Thr Trp Asn Ser Thr Leu Ile Gln Val Lys Glu Lys Leu 305 310 315 320 Arg Glu His Tyr Asn Lys Thr Ile Lys Phe Glu Pro Ser Ser Gly Gly 325 330 335 Asp Leu Glu Val Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe Phe 340 345 350 Tyr Cys Asn Thr Thr Lys Leu Phe Asn Glu Thr Lys Leu Phe Asn Glu 355 360 365 Ser Glu Tyr Val Asp Asn Lys Thr Ile Ile Leu Pro Cys Arg Ile Lys 370 375 380 Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Cys Met Tyr Ala Pro 385 390 395 400 Pro Ile Glu Gly Asn Ile Thr Cys Lys Ser Asn Ile Thr Gly Leu Leu 405 410 415 Leu Thr Arg Asp Gly Gly Glu Asn Ser Thr Glu Glu Val Phe Arg Pro 420 425 430 Gly Gly Gly Asn Met Lys Asp Asn Trp Arg Ser Glu Leu Tyr Lys Tyr 435 440 445 Lys Val Val Glu Ile Lys Pro Leu Gly Val Ala Pro Thr Lys Cys Lys 450 455 460 Arg Lys Val Val Gly Arg Arg Arg Arg Arg Arg Ala Val Gly Leu Gly 465 470 475 480 Ala Val Leu Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly Ala 485 490 495 Ala Ser Asn Thr Leu Thr Val Gln Ala Arg Gln Leu Leu Ser Gly Ile 500 505 510 Val Gln Gln Gln Ser Asn Leu Pro Arg Ala Pro Glu Ala Gln Gln His 515 520 525 Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln Thr Arg Val 530 535 540 Leu Ala Ile Glu Arg Tyr Leu Glu Val Gln Gln Leu Leu Gly Leu Trp 545 550 555 560 Gly Cys Ser Gly Lys Leu Ile Cys Cys Thr Ala Val Pro Trp Asn Ser 565 570 575 Ser Trp Ser Asn Lys Ser Leu Gly Asp Ile Trp Asp Asn Met Thr Trp 580 585 590 Met Gln Trp Asp Arg Glu Ile Ser Asn Tyr Thr Asn Thr Ile Tyr Arg 595 600 605 Leu Leu Glu Asp Ser Gln Phe Gln Gln Glu Ile Asn Glu Val Asp Leu 610 615 620 Leu Ala Leu Asp 625 <210> 32 <211> 599 <212> PRT <213> Artificial Sequence <220> <223> Stabilized and repaired sC4_SOSIP.v4 Env protein <400> 32 Met Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys 1 5 10 15 Asp Ala Lys Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu 20 25 30 Lys Glu Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp 35 40 45 Pro Asn Pro Gln Glu Ile Val Leu Gly Asn Val Thr Glu Asn Phe Asn 50 55 60 Met Trp Lys Asn Asp Met Val Asp Gln Met His Glu Asp Ile Ile Ser 65 70 75 80 Leu Trp Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys 85 90 95 Val Thr Leu Asn Cys Arg Asn Val Arg Asn Val Glu Met Lys Asn Cys 100 105 110 Ser Phe Asn Ala Thr Thr Val Val Arg Asp Arg Lys Gln Lys Val His 115 120 125 Ala Leu Phe Tyr Arg Leu Asp Ile Val Pro Leu Asp Glu Asn Asn Ser 130 135 140 Ser Tyr Arg Leu Ile Asn Cys Asn Thr Ser Ala Cys Thr Gln Ile Cys 145 150 155 160 Pro Lys Val Ser Phe Asp Pro Ile Pro Ile His Tyr Cys Ala Pro Ala 165 170 175 Gly Tyr Ala Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly 180 185 190 Pro Cys Asn Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro 195 200 205 Val Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu 210 215 220 Ile Ile Ile Arg Ser Glu Asn Leu Thr Asn Asn Ala Lys Thr Ile Ile 225 230 235 240 Val His Leu Asn Glu Thr Val Asn Ile Val Cys Thr Arg Pro Asn Asn 245 250 255 Asn Thr Arg Lys Ser Ile Arg Ile Gly Pro Gly Gln Thr Phe Tyr Ala 260 265 270 Thr Gly Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Leu Ser 275 280 285 Arg Asp Gly Trp Asn Lys Thr Leu Gln Gly Val Lys Lys Lys Leu Ala 290 295 300 Glu His Phe Pro Asn Lys Thr Ile Lys Phe Ala Pro His Ser Gly Gly 305 310 315 320 Asp Leu Glu Ile Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe Phe 325 330 335 Tyr Cys Asn Thr Ser Asn Leu Phe Asn Glu Ser Asn Ile Glu Arg Asn 340 345 350 Asp Ser Ile Ile Thr Leu Pro Cys Arg Ile Lys Gln Ile Ile Asn Met 355 360 365 Trp Gln Glu Val Gly Arg Cys Met Tyr Ala Pro Pro Ile Ala Gly Asn 370 375 380 Ile Thr Cys Arg Ser Asn Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly 385 390 395 400 Gly Ser Asn Asn Asn Asp Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp 405 410 415 Met Arg Asn Asn Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Glu 420 425 430 Val Lys Pro Leu Gly Val Ala Pro Thr Glu Cys Lys Arg Arg Asn Val 435 440 445 Thr Arg Arg Arg Arg Arg Arg Ala Val Gly Ile Gly Ala Val Phe Leu 450 455 460 Gly Ile Leu Gly Ala Ala Gly Ser Thr Met Gly Ala Ala Ser Asn Thr 465 470 475 480 Leu Thr Val Gln Ala Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln 485 490 495 Ser Asn Leu Pro Arg Ala Pro Glu Ala Gln Gln His Met Leu Gln Leu 500 505 510 Thr Val Trp Gly Ile Lys Gln Leu Gln Thr Arg Val Leu Ala Ile Glu 515 520 525 Arg Tyr Leu Glu Asp Gln Gln Leu Leu Gly Leu Trp Gly Cys Ser Gly 530 535 540 Lys Leu Ile Cys Cys Thr Ala Val Pro Trp Asn Thr Ser Trp Ser Asn 545 550 555 560 Lys Ser Gln Thr Asp Ile Trp Asp Asn Met Thr Trp Met Gln Trp Asp 565 570 575 Lys Glu Ile Gly Asn Tyr Thr Gly Glu Ile Tyr Arg Leu Leu Glu Glu 580 585 590 Ser Gln Phe Gln Gln Glu Ile 595 <210> 33 <211> 29 <212> PRT <213> Artificial Sequence <220> <223> signal sequence <400> 33 Met Arg Val Arg Gly Met Leu Arg Asn Trp Gln Gln Trp Trp Ile Trp 1 5 10 15 Ser Ser Leu Gly Phe Trp Met Leu Met Ile Tyr Ser Val 20 25 <210> 34 <211> 29 <212> PRT <213> Artificial Sequence <220> <223> signal sequence <400> 34 Met Arg Val Met Gly Ile Gln Arg Asn Cys Gln His Leu Phe Arg Trp 1 5 10 15 Gly Thr Met Ile Leu Gly Met Ile Ile Ile Cys Ser Ala 20 25

Claims

하기 아미노산 잔기 중 2개 이상을 포함하는 재조합 인간 면역결핍 바이러스 (HIV) 엔벨로프 (Env) 단백질:
(i) 위치 651에서 Phe, Leu, Met, 또는 Trp, 바람직하게는 Phe;
(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp, 바람직하게는 Ile;
(iii) 위치 535에서 Asn 또는 Gln, 바람직하게는 Asn;
(iv) 위치 589에서 Val, Ile 또는 Ala, 바람직하게는 Val;
(v) 위치 573에서 Phe 또는 Trp, 바람직하게는 Phe;
(vi) 위치 204에서 Ile; 및/또는
(vii) 위치 647에서 Phe, Met, 또는 Ile, 바람직하게는 Phe
(여기서, 위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름).
하기 아미노산 잔기 중 1개 이상의 아미노산 잔기를 포함하는 재조합 HIV Env 단백질:
(i) 위치 651에서 Phe, Leu, Met, 또는 Trp, 바람직하게는 Phe;
(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp, 바람직하게는 Ile;
(iii) 위치 535에서 Asn 또는 Gln, 바람직하게는 Asn;
(iv) 위치 589에서 Val, Ile 또는 Ala, 바람직하게는 Val;
(v) 위치 573에서 Phe 또는 Trp, 바람직하게는 Phe;
(vi) 위치 204에서 Ile; 및/또는
(vii) 위치 647에서 Phe, Met, 또는 Ile, 바람직하게는 Phe
(여기서, HIV Env 단백질은
(1) HIV Env 콘센서스 서열 (예를 들어 서열 번호 2 또는 3의 아미노산 서열을 포함하는, 예를 들어 클레이드 C로부터 유래되거나, 예를 들어 서열 번호 4 또는 5의 아미노산 서열을 포함하는, 예를 들어 클레이드 B로부터 유래됨);
(2) 합성 HIV Env 단백질 (예를 들어 (a): 서열 번호 6의 아미노산 서열; 또는 (b): 위치 166에서의 Glu의 Arg으로의 돌연변이를 갖는 서열 번호 6의 아미노산 서열; 또는 (c): 위치 501 및 605에서의 아미노산의 Cys 잔기로의 돌연변이 및 위치 559에서의 아미노산의 Pro 잔기로의 돌연변이를 갖는 (a) 또는 (b); 또는 (d): 추가의 푸린 절단 부위 돌연변이, 예를 들어 위치 508~511에서의 아미노산의 RRRRRR (서열 번호 10)에 의한 대체를 갖는 (a), (b) 또는 (c); 또는 (e) 서열 번호 7의 아미노산 서열; 또는 (f) 서열 번호 8 또는 서열 번호 9의 아미노산 서열을 포함함); 및
(3) 적어도 1000개, 바람직하게는 적어도 10000개의 야생형 HIV Env 서열들의 컬렉션(collection)에서의 HIV Env 서열의 7.5% 미만, 바람직하게는 2% 미만의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에서의 적어도 하나의 복구 돌연변이를 포함하는 모 HIV Env 단백질 (이는 바람직하게는 야생형 HIV Env 단백질, 바람직하게는 클레이드 C의 야생형 HIV Env 단백질임) (여기서, 복구 돌연변이는 상기 컬렉션에서의 HIV Env 서열의 적어도 10%의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에 의한 치환이며, 바람직하게는 복구 돌연변이는 상기 컬렉션에서 가장 빈번하게 상응하는 위치에 존재하는 아미노산 잔기에 의한 치환임)
로 이루어진 군으로부터 선택되며;
위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름).
하기 아미노산 잔기 중 1개 이상의 아미노산 잔기를 포함하는 재조합 HIV Env 단백질:
(i) 위치 651에서 Phe, Leu, Met, 또는 Trp, 바람직하게는 Phe;
(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp, 바람직하게는 Ile;
(iii) 위치 535에서 Asn 또는 Gln, 바람직하게는 Asn;
(iv) 위치 589에서 Val, Ile 또는 Ala, 바람직하게는 Val;
(v) 위치 573에서 Phe 또는 Trp, 바람직하게는 Phe;
(vi) 위치 204에서 Ile; 및/또는
(vii) 위치 647에서 Phe, Met, 또는 Ile, 바람직하게는 Phe
(여기서, HIV Env 단백질은
(a) 위치 501 및 605에서의 Cys;
(b) 위치 559에서 Pro;
(c) 위치 501 및 605에서 Cys 및 위치 559에서 Pro 중 하나 이상을 포함하는 HIV Env 단백질이며;
위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름).
제2항 또는 제3항에 있어서, (i)~(vii)에서 표시된 아미노산 잔기들 중 2개 이상을 포함하는 재조합 HIV Env 단백질.
제1항, 제2항 및 제4항 중 어느 한 항에 있어서, 위치 501 및 605에서 Cys 또는 위치 559에서 Pro, 바람직하게는 위치 501 및 605에서 Cys 및 위치 559에서 Pro을 포함하는 재조합 HIV Env 단백질.
제1항 내지 제5항 중 어느 한 항에 있어서, (i)~(vii)에서 표시된 아미노산 잔기들 중 3개 이상을 포함하는 재조합 HIV Env 단백질.
제1항 내지 제5항 중 어느 한 항에 있어서, (i)~(vii)에서 표시된 아미노산 잔기들 중 4개 이상을 포함하는 재조합 HIV Env 단백질.
제1항 내지 제7항 중 어느 한 항에 있어서, 위치 651에서 Phe, 위치 655에서 Ile, 위치 535에서 Asn, 및 위치 589에서 Val을 포함하는 재조합 HIV Env 단백질.
제1항 내지 제8항 중 어느 한 항에 있어서, (i)~(vii)에서 표시된 아미노산 잔기들 중 5개 이상을 포함하는 재조합 HIV Env 단백질.
제1항 내지 제10항 중 어느 한 항에 있어서, 하기 중 하나 이상을 추가로 포함하는 재조합 HIV Env 단백질:
(viii) 위치 588에서 Gln, Glu, Ile, Met, Val, Trp, 또는 Phe, 바람직하게는 Gln 또는 Glu;
(ix) 위치 64에서 Lys 또는 위치 66에서 Arg 또는 위치 64에서 Lys 및 위치 66에서 Arg;
(x) 위치 316에서 Trp;
(xi) 위치 201 및 433 둘 다에서 Cys;
(xii) 위치 556 또는 558에서, 또는 위치 556 및 558 둘 다에서 Pro;
(xiii) 7~10개의 아미노산을 갖는 루프, 바람직하게는 8개 아미노산의 루프, 예를 들어 (서열 번호 12~17) 중 어느 하나로부터 선택되는 서열을 갖는 루프에 의한 아미노산 위치 548~568에서의 루프 (HR1-루프)의 대체;
(xiv) 위치 568에서 Gly, 또는 위치 569에서 Gly, 또는 위치 636에서 Gly, 또는 위치 568 및 636 둘 다에서 Gly, 또는 위치 569 및 636 둘 다에서 Gly; 및/또는
(xv) 위치 302에서 Tyr, 또는 위치 519에서 Arg, 또는 위치 520에서 Arg, 또는 위치 302에서 Tyr 및 위치 519에서 Arg, 또는 위치 302에서 Tyr 및 위치 520에서 Arg, 또는 위치 302에서 Tyr 및 위치 519 및 520 둘 다에서 Arg.
제1항 내지 제10항 중 어느 한 항에 있어서, HIV Env 단백질의 푸린 절단 서열에서의 돌연변이, 바람직하게는 RRRRRR (서열 번호 10)에 의한 위치 508~511에서의 대체를 추가로 포함하는 재조합 HIV Env 단백질.
제1항 내지 제11항 중 어느 한 항에 있어서, 서열 번호 3, 5, 20, 22, 24, 26, 27, 28, 29, 30, 31, 또는 32의 아미노산 서열 중 어느 하나와 95% 이상 동일한 아미노산 서열을 포함하는 재조합 HIV Env 단백질.
제1항 내지 제12항 중 어느 한 항에 있어서, 다음을 추가로 포함하는 재조합 HIV Env 단백질: (xvi) 위치 658에서 Val, Ile, Phe, Met, Ala, 또는 Leu, 바람직하게는 Val 또는 Ile, 가장 바람직하게는 Val으로부터 선택되는 아미노산 잔기.
제1항 내지 제13항 중 어느 한 항에 있어서, gp140 또는 gp160 단백질인 재조합 HIV Env 단백질.
제1항 내지 제14항 중 어느 한 항에 있어서, 클레이드 C 또는 클레이드 A, 바람직하게는 클레이드 C로부터 유래된 재조합 HIV Env 단백질.
제1항 내지 제15항 중 어느 한 항의 3개의 재조합 HIV Env 단백질의 비공유적 올리고머를 포함하는 삼량체성 복합체.
제1항 내지 제15항 중 어느 한 항의 재조합 HIV Env 단백질 또는 제16항의 삼량체성 복합체를 표면 상에서 디스플레이 (display)하는 입자, 바람직하게는 리포좀 또는 나노입자.
제1항 내지 제15항 중 어느 한 항의 재조합 HIV Env 단백질을 코딩하는 단리된 핵산 분자.
프로모터에 작동가능하게 연결된 제18항의 단리된 핵산 분자를 포함하는 벡터.
제19항에 있어서, 아데노바이러스 벡터인 벡터.
제18항의 단리된 핵산 분자 또는 제19항 또는 제20항의 벡터를 포함하는 숙주 세포.
제21항의 숙주 세포를 재조합 HIV Env 단백질의 생성에 적합한 조건 하에 성장시키는 단계를 포함하는, 재조합 HIV Env 단백질을 제조하는 방법.
제1항 내지 제15항 중 어느 한 항의 재조합 HIV Env 단백질, 제16항의 삼량체성 복합체, 제17항의 입자, 제18항의 단리된 핵산 분자, 또는 제19항 또는 제20항의 벡터, 및 제약상 허용가능한 담체를 포함하는 조성물.
모 HIV Env 단백질에서의 하나 이상의 아미노산 잔기의 치환 단계를 포함하고, 상기 하나 이상의 치환은 하기 아미노산들 중 하나 이상으로 이어지는, HIV Env 단백질의 삼량체 형성을 개선시키는 방법:
(i) 위치 651에서 Phe, Leu, Met, 또는 Trp, 바람직하게는 Phe;
(ii) 위치 655에서 Phe, Ile, Met, 또는 Trp, 바람직하게는 Ile;
(iii) 위치 535에서 Asn 또는 Gln, 바람직하게는 Asn;
(iv) 위치 589에서 Val, Ile 또는 Ala, 바람직하게는 Val;
(v) 위치 573에서 Phe 또는 Trp, 바람직하게는 Phe;
(vi) 위치 204에서 Ile; 및/또는
(vii) 위치 647에서 Phe, Met, 또는 Ile, 바람직하게는 Phe
(여기서, 위치의 넘버링은 HIV-1 단리체 HXB2의 gp160에서의 넘버링에 따름).
모 HIV Env 단백질 내에 하나 이상의 복구 돌연변이, 바람직하게는 3개 이상의 복구 돌연변이를 도입함으로써 모 HIV Env 단백질의 아미노산 서열을 복구하는 단계를 포함하고, 여기서, 복구 돌연변이는 100개 이상, 바람직하게는 1000개 이상, 바람직하게는 10000개 이상의 야생형 HIV Env 서열들의 컬렉션에서 HIV Env 서열의 7.5% 미만, 바람직하게는 2% 미만의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에서의 아미노산 치환이며, 상기 치환은 상기 컬렉션에서 HIV Env 서열의 10% 이상의 빈도로 상응하는 위치에 존재하는 아미노산 잔기에 의한 것이고, 바람직하게는 상기 치환은 상기 컬렉션에서 가장 빈번하게 상응하는 위치에 존재하는 아미노산 잔기에 의한 것인, 모 HIV Env 단백질의 폴딩 및 안정성 (증가된 삼량체 백분율 및/또는 삼량체 수득량으로서 측정됨)을 개선시키는 방법.