BR122021016789B1 - HIV-1 VACCINES COMPRISING ONE OR MORE POPULATION EPISSENSE ANTIGENS, USES THEREOF TO PROTECT AN INDIVIDUAL FROM AN HIV-1 INFECTION, TREAT HIV-1 AND INDUCE AN EFFECTOR MEMORY T CELL RESPONSE, AS WELL AS POLYPEPTIDE AND METHOD FOR DESIGN AND PRODUCE SAID VACCINES - Google Patents
HIV-1 VACCINES COMPRISING ONE OR MORE POPULATION EPISSENSE ANTIGENS, USES THEREOF TO PROTECT AN INDIVIDUAL FROM AN HIV-1 INFECTION, TREAT HIV-1 AND INDUCE AN EFFECTOR MEMORY T CELL RESPONSE, AS WELL AS POLYPEPTIDE AND METHOD FOR DESIGN AND PRODUCE SAID VACCINES Download PDFInfo
- Publication number
- BR122021016789B1 BR122021016789B1 BR122021016789-3A BR122021016789A BR122021016789B1 BR 122021016789 B1 BR122021016789 B1 BR 122021016789B1 BR 122021016789 A BR122021016789 A BR 122021016789A BR 122021016789 B1 BR122021016789 B1 BR 122021016789B1
- Authority
- BR
- Brazil
- Prior art keywords
- seq
- antigen
- population
- episense
- hiv
- Prior art date
Links
Abstract
A presente invenção refere-se a vacinas contra HIV-1 que compreendem um veículo e um antígeno epissenso na população determinado usando a abordagem EpiGraph. Também são fornecidas vacinas contra HIV-1 que compreendem um veículo, um antígeno epissenso de população e um antígeno personalizado. Também são fornecidos métodos para projetar e produzir uma vacina contra HIV-1 para um indivíduo que compreende projetar antígenos de vacina para cobrir idealmente a diversidade dentro de uma área geográfica usando uma sequência de aminoácidos gerada usando a abordagem EpiGraph e produzir o dito antígeno de vacina projetado. Também são fornecidos métodos para induzir uma resposta de células T de memória efetoras que compreende projetar a uma ou mais sequências de aminoácidos EpiGraph, produzir uma vacina que compreende a uma ou mais sequências de aminoácidos EpiGraph e um vetor, e administrar a vacina a um indivíduo. São adicionalmente fornecidos métodos para tratamento de HIV-1 em um indivíduo que compreendem administrar uma quantidade eficaz das vacinas contra HIV-1 descritas ao indivíduo em necessidade das mesmas.The present invention relates to HIV-1 vaccines comprising a vehicle and a population episense antigen determined using the EpiGraph approach. HIV-1 vaccines are also provided that comprise a vehicle, a population episense antigen, and a personalized antigen. Also provided are methods for designing and producing an HIV-1 vaccine for an individual comprising designing vaccine antigens to ideally cover diversity within a geographic area using an amino acid sequence generated using the EpiGraph approach and producing said vaccine antigen. designed. Also provided are methods for inducing an effector memory T cell response comprising engineering the one or more EpiGraph amino acid sequences, producing a vaccine comprising the one or more EpiGraph amino acid sequences and a vector, and administering the vaccine to an individual. . Further provided are methods for treating HIV-1 in an individual comprising administering an effective amount of the described HIV-1 vaccines to the individual in need thereof.
Description
[001] Dividido do BR1120170068656, depositado em 05/10/2015.[001] Split from BR1120170068656, deposited on 10/05/2015.
[002] Este pedido reivindica o benefício de prioridade ao Pedido de patente provisório US n° de série 62/059.497, depositado em 3 outubro de 2014, e Pedido de patente provisório US n° de série 62/059.506, depositado em 3 de outubro de 2014, o qual está incorporado no presente documento, a título de referência em sua totalidade.[002] This application claims the benefit of priority to US Provisional Patent Application Serial No. 62/059,497, filed on October 3, 2014, and US Provisional Patent Application Serial No. 62/059,506, filed on October 3 2014, which is incorporated into this document, by way of reference in its entirety.
[003] O conteúdo da listagem de sequência enviada eletronicamente em arquivo de texto ASCII (Nome: 3525.010PC02 Seq listing_ST25.txt; Tamanho: 3.634.253 bytes; e Data de Criação: 5 de outubro de 2015) depositado com o pedido está incorporado no presente documento a título de referência em sua totalidade.[003] The content of the sequence listing sent electronically in ASCII text file (Name: 3525.010PC02 Seq listing_ST25.txt; Size: 3,634,253 bytes; and Creation Date: October 5, 2015) deposited with the application is incorporated in this document for reference in its entirety.
[004] O presente assunto refere-se, em geral, a HIV e, em particular, a vacinas contra HIV.[004] The present subject relates, in general, to HIV and, in particular, to HIV vaccines.
[005] Em 2013, havia aproximadamente 2,3 milhões de novas infecções pelo vírus da imunodeficiência humana (HIV), mais de 35 milhões de pessoas vivendo com HIV e 1,6 milhão de mortes por síndrome de imunodeficiência adquirida (AIDS). Embora grandes progressos tenham sido feitos no tratamento do HIV/AIDS, todos os indivíduos que vivem com o HIV terão de ser tratados com terapia anti-retroviral (TARV) durante o resto da vida, uma vez que a terapia com fármacos não é capaz de eliminar os reservatórios virais latentes existentes em células T CD4 + em repouso a uma frequência de cerca de 1/106 células. Consulte, Eriksson, S. 2013. PLoS Pathog 9:e1003174.[005] In 2013, there were approximately 2.3 million new human immunodeficiency virus (HIV) infections, more than 35 million people living with HIV, and 1.6 million deaths from acquired immunodeficiency syndrome (AIDS). Although great progress has been made in treating HIV/AIDS, all individuals living with HIV will need to be treated with antiretroviral therapy (ART) for the rest of their lives, as drug therapy is unable to eliminate latent viral reservoirs existing in resting CD4 + T cells at a frequency of about 1/106 cells. See, Eriksson, S. 2013. PLoS Pathog 9:e1003174.
[006] As principais estratégias para purgar reservatórios de HIV latentes são geralmente destinadas a reativar o vírus latente utilizando inibidores de histona- desacetilase (HDAC), entretanto, estudos clínicos com inibidores de HDAC não têm diminuído consistentemente reservatórios latentes. Uma provável razão para isto reside na incapacidade de células T CD8+ específicas do HIV para eliminar as células T CD4+ em repouso.[006] The main strategies for purging latent HIV reservoirs are generally aimed at reactivating the latent virus using histone deacetylase (HDAC) inhibitors, however, clinical studies with HDAC inhibitors have not consistently decreased latent reservoirs. A likely reason for this lies in the inability of HIV-specific CD8+ T cells to eliminate resting CD4+ T cells.
[007] Apenas alguns casos foram documentados em que o HIV-1 foi eliminado de um indivíduo com uma infecção pré-existente. Até que uma terapia eficaz seja desenvolvida, os 35 milhões de indivíduos estimados vivendo com HIV-1 permanecerão sob fármacos antivirais para suprimir um reservatório viral que resistiu a todos os esforços de erradicação.[007] Only a few cases have been documented in which HIV-1 was eliminated from an individual with a pre-existing infection. Until an effective therapy is developed, the estimated 35 million individuals living with HIV-1 will remain on antiviral drugs to suppress a viral reservoir that has resisted all eradication efforts.
[008] Uma cura para a AIDS tem sido difícil, mas trabalhos recentes sugerem que o controle imunológico rigoroso pode eliminar o HIV ao longo do tempo. Especificamente, verificou-se que os macacos rhesus (RM) vacinados com vetores baseados em citomegalovírus (CMV) que expressam antígenos do vírus da imunodeficiência símia (SIV) foram inicialmente infectados, mas o SIV foi indetectável por vários critérios rigorosos um a dois anos após a infecção. Este resultado é ainda mais considerável devido ao fato de que a cepa SIVmac239 altamente virulenta usada nestes estudos impediu das as tentativas de vacina anteriores. Esses resultados expandiram o paradigma atual de um concentrado em uma vacina preventiva contra HIV para um em que uma imunoterapia para HIV/AIDS eventualmente se tornará uma parte essencial da luta contra esta pandemia. Dessa forma, além de uma vacina preventiva, ainda há a necessidade de uma terapia eficaz para tratar indivíduos portadores de HIV-1. Especificamente, ainda há a necessidade de projetar, fabricar e testar vacinas contra HIV profiláticas e terapêuticas na preparação para ensaios clínicos.[008] A cure for AIDS has been elusive, but recent work suggests that strict immune control can eliminate HIV over time. Specifically, it was found that rhesus macaques (RM) vaccinated with cytomegalovirus (CMV)-based vectors expressing simian immunodeficiency virus (SIV) antigens were initially infected, but SIV was undetectable by several stringent criteria one to two years later. the infection. This result is even more considerable due to the fact that the highly virulent SIVmac239 strain used in these studies prevented previous vaccine attempts. These results have expanded the current paradigm from one focused on a preventive HIV vaccine to one in which immunotherapy for HIV/AIDS will eventually become an essential part of the fight against this pandemic. Therefore, in addition to a preventive vaccine, there is still a need for an effective therapy to treat individuals with HIV-1. Specifically, there remains a need to design, manufacture, and test prophylactic and therapeutic HIV vaccines in preparation for clinical trials.
[009] São fornecidos no presente documento polipeptídeos de HIV/SIV que compreendem uma ou mais sequências de antígenos no Gráfico de epítopos (EpiGraph) que compreendem sequências de aminoácidos correspondentes a HIV/SIV Gag, Nef, Pol, Env, incluindo sequências de comprimento total, porções das mesmas, ou qualquer combinação das mesmas. São fornecidos no presente documento polipeptídeos de HIV/SIV que compreendem uma ou mais sequências de antígenos epissenso na população que compreendem sequências de aminoácidos correspondentes a HIV/SIV Gag, Nef, Pol, Env ou uma combinação das mesmas. Também são fornecidos no presente documento um ou mais veículos que compreendem polipeptídeos de HIV/SIV que compreendem uma ou mais sequências de antígenos epissenso na população. São adicionalmente fornecidos no presente documento polipeptídeos de HIV/SIV que compreendem uma ou mais sequências de antígenos personalizadas que compreendem sequências de aminoácidos correspondentes a HIV/SIV Gag, Nef, Pol, Env ou uma combinação das mesmas. Os polipeptídeos de HIV/SIV da presente revelação podem compreender um ou mais antígenos personalizados a HIV-1, em que o polipeptídeo compreende uma sequência de aminoácidos selecionada do grupo que consiste em: SEQ ID NOs: 692 a 696 e SEQ ID NOs: 754 a 789. Também são fornecidos no presente documento um ou mais veículos que compreendem polipeptídeos de HIV/SIV que compreendem uma ou mais sequências de antígenos personalizadas. As sequências de antígenos EpiGraph tendo SEQ ID NOs: 691 a 789 são fornecidas no presente documento.[009] Provided herein are HIV/SIV polypeptides comprising one or more antigen sequences in the Epitope Graph (EpiGraph) comprising amino acid sequences corresponding to HIV/SIV Gag, Nef, Pol, Env, including sequences of length total, portions thereof, or any combination thereof. Provided herein are HIV/SIV polypeptides comprising one or more episense antigen sequences in the population comprising amino acid sequences corresponding to HIV/SIV Gag, Nef, Pol, Env or a combination thereof. Also provided herein are one or more carriers comprising HIV/SIV polypeptides comprising one or more episense antigen sequences in the population. Additionally provided herein are HIV/SIV polypeptides comprising one or more custom antigen sequences comprising amino acid sequences corresponding to HIV/SIV Gag, Nef, Pol, Env or a combination thereof. The HIV/SIV polypeptides of the present disclosure may comprise one or more HIV-1 personalized antigens, wherein the polypeptide comprises an amino acid sequence selected from the group consisting of: SEQ ID NOs: 692 to 696 and SEQ ID NOs: 754 to 789. Also provided herein are one or more carriers comprising HIV/SIV polypeptides comprising one or more custom antigen sequences. EpiGraph antigen sequences having SEQ ID NOs: 691 to 789 are provided herein.
[010] São fornecidos no presente documento vacinas contra HIV-1 que compreendem um ou mais veículos e um ou mais antígenos epissenso na população. Também são fornecidas no presente documento vacinas contra HIV-1 que compreendem um vetor capaz de expressar um antígeno epissenso na população e um ou mais antígenos personalizados.[010] Provided herein are vaccines against HIV-1 that comprise one or more vehicles and one or more episense antigens in the population. Also provided herein are HIV-1 vaccines that comprise a vector capable of expressing an episense antigen in the population and one or more personalized antigens.
[011] Em algumas modalidades, o antígeno epissenso na população de HIV- 1 compreende epítopos de Gag, Pol, Nef, Env, Tat, Rev, Vpr, Vif ou Vpu. Em algumas modalidades, o antígeno epissenso na população de HIV-1 é um antígeno de fusão que compreende dois ou mais antígenos epissenso na população de HIV-1. Em algumas modalidades, o antígeno epissenso na população de HIV-1 é essencial para o clado B do HIV-1 epidêmico nos Estados Unidos. Em algumas modalidades, o antígeno epissenso na população de HIV-1 é essencial para o clado C do HIV-1 epidêmico na África do Sul. Em algumas modalidades, o antígeno epissenso na população de HIV-1 é essencial para o clado 2 do HIV-1 regional epidêmico na Tailândia. Em algumas modalidades, o antígeno epissenso na população de HIV-1 é essencial para o conjunto global do grupo M do HIV-1.[011] In some embodiments, the episense antigen in the HIV-1 population comprises epitopes of Gag, Pol, Nef, Env, Tat, Rev, Vpr, Vif or Vpu. In some embodiments, the episense antigen in the HIV-1 population is a fusion antigen comprising two or more episense antigens in the HIV-1 population. In some embodiments, the episense antigen in the HIV-1 population is essential for the HIV-1 clade B epidemic in the United States. In some embodiments, the episense antigen in the HIV-1 population is essential for the HIV-1 clade C in South Africa. In some embodiments, the episense antigen in the HIV-1 population is essential for the HIV clade 2 -1 regional epidemic in Thailand. In some embodiments, the episense antigen in the HIV-1 population is essential for the overall pool of HIV-1 group M.
[012] Em algumas modalidades, o antígeno epissenso na população de HIV- 1 compreende epítopos de Gag. Em algumas modalidades, o antígeno epissenso na população de HIV-1 compreende epítopos de uma região conservada de HIV-1. Em algumas modalidades, o antígeno epissenso na população de HIV-1 compreende epítopos de uma região conservada de Gag, Pol ou Nef. Em algumas modalidades, os epítopos da região conservada são epítopos da proteína capsidial p24 de Gag.[012] In some embodiments, the episense antigen in the HIV-1 population comprises Gag epitopes. In some embodiments, the episense antigen in the HIV-1 population comprises epitopes from a conserved region of HIV-1. In some embodiments, the episense antigen in the HIV-1 population comprises epitopes from a conserved region of Gag, Pol, or Nef. In some embodiments, the epitopes of the conserved region are epitopes of the Gag capsid protein p24.
[013] Em algumas modalidades, o antígeno personalizado de HIV-1 compreende epítopos de Gag, Pol, Nef, Env, Tat, Rev, Vpr, Vif ou Vpu. Em algumas modalidades, o antígeno personalizado de HIV-1 é essencial para o conjunto global do grupo M do HIV-1. Em algumas modalidades, o antígeno personalizado de HIV-1 é essencial para o clado C do HIV-1 epidêmico na África do Sul. Em algumas modalidades, o antígeno personalizado de HIV-1 é essencial para o clado B do HIV- 1 epidêmico nos Estados Unidos.[013] In some embodiments, the personalized HIV-1 antigen comprises Gag, Pol, Nef, Env, Tat, Rev, Vpr, Vif or Vpu epitopes. In some embodiments, the personalized HIV-1 antigen is essential for the global assembly of HIV-1 group M. In some embodiments, the personalized HIV-1 antigen is essential for epidemic HIV-1 clade C in South Africa. In some embodiments, the personalized HIV-1 antigen is essential for epidemic HIV-1 clade B in South Africa. U.S.
[014] São adicionalmente fornecidos métodos para prevenção ou tratamento de infecção por HIV-1 em um indivíduo que compreendem administrar uma quantidade eficaz das vacinas contra HIV-1 descritas ao indivíduo em necessidade das mesmas. São adicionalmente fornecidos métodos para projetar e produzir uma vacina contra HIV-1 para um indivíduo que compreende sequenciar vírus HIV-1 em um indivíduo, selecionar antígenos de vacina projetados para cobrir idealmente a densidade dentro de uma área geográfica e inserir os antígenos de vacina em um vetor. Também são fornecidos no presente documento métodos para tratamento de infecção por HIV-1 em um indivíduo que compreendem administrar uma quantidade eficaz das vacinas reveladas ao indivíduo em necessidade das mesmas.[014] Methods for preventing or treating HIV-1 infection in an individual are further provided which comprise administering an effective amount of the described HIV-1 vaccines to the individual in need thereof. Methods for designing and producing an HIV-1 vaccine for an individual are further provided which comprise sequencing HIV-1 viruses in an individual, selecting vaccine antigens designed to ideally cover density within a geographic area, and inserting the vaccine antigens into a vector. Also provided herein are methods for treating HIV-1 infection in an individual comprising administering an effective amount of the disclosed vaccines to the individual in need thereof.
[015] Também são fornecidas no presente documento vacinas contra HIV-1 que compreendem um ou mais veículos e um antígeno epissenso na população determinados usando a abordagem de Gráfico de Epítopos. São adicionalmente fornecidos métodos para projetar antígenos de vacina para cobrir idealmente a diversidade dentro de uma área geográfica usando uma sequência de aminoácidos de antígeno de vacina gerada usando o método EpiGraph de seleção de sequência de aminoácidos de antígeno e produzindo o antígeno de vacina projetado. São adicionalmente fornecidos no presente documento métodos para projetar e produzir uma vacina contra HIV-1 para um indivíduo que compreende determinar a sequência de aminoácidos de vírus HIV-1 em um indivíduo por sequenciamento, selecionar antígenos de vacina projetados para cobrir idealmente a diversidade dentro de uma área geográfica usando uma sequência de aminoácidos de antígeno de vacina gerada usando o método de Gráfico de epítopos de seleção de sequência de aminoácidos de antígeno e inserir os antígenos de vacina em um vetor.[015] Also provided herein are HIV-1 vaccines that comprise one or more carriers and an episense antigen in the population determined using the Epitope Plot approach. Methods are further provided for designing vaccine antigens to ideally cover diversity within a geographic area using a vaccine antigen amino acid sequence generated using the EpiGraph antigen amino acid sequence selection method and producing the designed vaccine antigen. Further provided herein are methods for designing and producing an HIV-1 vaccine for an individual comprising determining the amino acid sequence of HIV-1 viruses in an individual by sequencing, selecting vaccine antigens designed to ideally cover the diversity within a geographic area using a vaccine antigen amino acid sequence generated using the Antigen Amino Acid Sequence Selection Epitope Plot method and inserting the vaccine antigens into a vector.
[016] Também são fornecidos métodos para induzir uma resposta de células T de memória efetoras que compreende determinar uma ou mais sequências de aminoácidos EpiGraph, gerar uma vacina que compreende a uma ou mais sequências de aminoácidos EpiGraph e um ou mais veículos, e administrar a vacina a um indivíduo que precisa da mesma. São adicionalmente fornecidos métodos para tratamento de HIV-1 em um indivíduo que compreendem administrar uma quantidade eficaz das vacinas contra HIV-1 descritas ao indivíduo em necessidade das mesmas. Também são fornecidos no presente documento métodos para proteção contra uma infecção por HIV-1 em um indivíduo que compreendem administrar uma quantidade eficaz das vacinas contra HIV-1 descritas ao indivíduo em necessidade das mesmas.[016] Also provided are methods for inducing an effector memory T cell response comprising determining one or more EpiGraph amino acid sequences, generating a vaccine comprising the one or more EpiGraph amino acid sequences and one or more carriers, and administering the vaccine to an individual who needs it. Further provided are methods for treating HIV-1 in an individual comprising administering an effective amount of the described HIV-1 vaccines to the individual in need thereof. Also provided herein are methods for protecting against an HIV-1 infection in an individual comprising administering an effective amount of the described HIV-1 vaccines to the individual in need thereof.
[017] A Figura 1A mostra um gráfico completo para o clado CRF01-AE da proteína Nef. O retângulo é uma inserção mostrada na Figura 1B.[017] Figure 1A shows a complete graph for the CRF01-AE clade of the Nef protein. The rectangle is an inset shown in Figure 1B.
[018] A Figura 1B representa a inserção da Figura 1A. Os nós são pontos cinzas e representam cada variante k-unidades de repetição, com k = 9. As bordas são linhas horizontais que conectam epítopos cujas sequências se sobrepõem por k - 1 aminoácidos, conforme mostrado nos dois primeiros epítopos (ea = VTSSNMNNA [SEQ ID NO: 790], eb = TSSNMNNAD [SEQ ID NO: 791]) no lado esquerdo superior. Embora as propriedades topológicas do gráfico não dependam das posições de nós, esse gráfico usa o eixo geométrico vertical para indicar a frequência de epítopo no conjunto de sequências-alvo, y = f(e), para cada nó. A posição horizontal x(e) = 1 + maxe‘eP(e)x(e’), em que P(e) é o conjunto de antecessores de e, fornece a esse gráfico a propriedade que todas as bordas direcionadas conectam a esquerda à direita. A trajetória ideal através desse gráfico se mantém o máximo possível nos valores y mais altos. A inserção mostra duas trajetórias através dos nós. A linha preta contínua é a trajetória ideal, e corresponde à sequência TSSNMNNADSVWLRAQEEE [SEQ ID NO: 792] enquanto a linha tracejada corresponde a TSSNMNNADCVWLRAQEEE [SEQ ID NO: 793]. A linha tracejada alcança valores f(e) maiores em 4 nós, porém a linha contínua tem f(e) maior para 5 nós, e ∑ f(e) é maior. Nota-se que não há trajetória que inclua os nós com os valores mais altos para todos os valores de x.[018] Figure 1B represents the insertion of Figure 1A. Nodes are gray dots and represent each variant's k-repeat units, with k = 9. Edges are horizontal lines connecting epitopes whose sequences overlap by k - 1 amino acids, as shown in the first two epitopes (ea = VTSSNMNNA [SEQ ID NO: 790], and b = TSSNMNNAD [SEQ ID NO: 791]) on the top left side. Although the topological properties of the graph do not depend on node positions, this graph uses the vertical geometric axis to indicate the epitope frequency in the set of target sequences, y = f(e), for each node. The horizontal position x(e) = 1 + maxe'eP(e)x(e'), where P(e) is the set of predecessors of e, gives this graph the property that all directed edges connect to the left on the right. The ideal trajectory through this graph maintains as much as possible at the highest y values. The inset shows two trajectories through the nodes. The solid black line is the ideal trajectory, and corresponds to the sequence TSSNMNNADSVWLRAQEEE [SEQ ID NO: 792] while the dashed line corresponds to TSSNMNNNADCVWLRAQEEE [SEQ ID NO: 793]. The dashed line reaches higher f(e) values at 4 nodes, but the solid line has higher f(e) at 5 nodes, and ∑ f(e) is larger. Note that there is no trajectory that includes the nodes with the highest values for all x values.
[019] A Figura 2 mostra nós de um gráfico de epítopo que mostra a cadeia de caracteres k de epítopo, e a frequência (f) que o epítopo é observado na posição no conjunto de sequências alinhadas, e a melhor pontuação cumulativa S de trajetórias compatíveis que terminam naquele nó. Os nós são dispostos em colunas com cada coluna correspondente à posição t associada ao epítopo. As linhas que conectam esses nós correspondem a epítopos adjacentes que são compatíveis. O objetivo é encontrar uma trajetória compatível através desse gráfico que maximize a soma dos valores de frequência em cada nó. As linhas mais grossas mostram uma trajetória que resulta em uma pontuação total ideal.[019] Figure 2 shows nodes of an epitope graph that shows the k epitope string, and the frequency (f) that the epitope is observed at the position in the set of aligned sequences, and the best cumulative score S of trajectories compatibles that end at that node. Nodes are arranged in columns with each column corresponding to the t position associated with the epitope. The lines connecting these nodes correspond to adjacent epitopes that are compatible. The objective is to find a compatible trajectory through this graph that maximizes the sum of frequency values at each node. The thicker lines show a trajectory that results in an ideal total score.
[020] A Figura 3 mostra que os nós da solução inicial (fornecidos por q1 = ARCHSLM [SEQ ID NO: 794] conforme mostrado na Figura 2 têm seus valores de frequência ajustados para zero, e as pontuações cumulativas S(t;e) são recomputadas com base nesses novos nós de frequência. Isso resulta em uma solução ideal para esse problema de cobertura de complementaridade: q2=DEFGKLM [SEQ ID NO: 795]. As linhas mais grossas mostram uma trajetória que resulta em uma pontuação total ideal.[020] Figure 3 shows that the initial solution nodes (provided by q1 = ARCHSLM [SEQ ID NO: 794] as shown in Figure 2 have their frequency values set to zero, and the cumulative scores S(t;e) are recomputed based on these new frequency nodes. This results in an optimal solution to this complementarity coverage problem: q2=DEFGKLM [SEQ ID NO: 795] The thicker lines show a trajectory that results in an optimal total score.
[021] As Figuras 4A a B mostram o gráfico de epítopo associado a um conjunto de 690 sequências de proteínas Gag de clado B US [SEQ ID NOs. 1 a 690], cada uma alinhada a 556 posições. O eixo horizontal é a posição t, e as colunas de nós indicam os diferentes epítopos em cada posição. Os nós são dispostos de modo que os mais frequentes em cada posição estejam na parte inferior de cada coluna. O gráfico completo é mostrado na Figura 4A; uma inserção de perto do mesmo gráfico é mostrada na Figura 4B.[021] Figures 4A to B show the epitope graph associated with a set of 690 US clade B Gag protein sequences [SEQ ID NOs. 1 to 690], each aligned to 556 positions. The horizontal axis is the t position, and the columns of nodes indicate the different epitopes at each position. The nodes are arranged so that the most frequent nodes in each position are at the bottom of each column. The complete graph is shown in Figure 4A; a close-up inset of the same graph is shown in Figure 4B.
[022] As Figuras 5A a C mostram que a exclusão de variantes raras diminui a cobertura, porém apenas ligeiramente para Gag (Figura 5A), Nef (Figura 5B), e Pol (Figura 5C). A cobertura de soluções polivalentes (m = 2) é mostrada como uma função de conta mínima fo (isto é, a frequência de população do epítopo mais raro na vacina). As linhas tracejadas correspondem à cobertura fornecida pelo algoritmo sequencial direto; as linhas contínuas pretas são baseadas nas melhores soluções após 100 reinícios aleatórios. O eixo vertical, em todos os três gráficos, é limitado a uma faixa de 0,015.[022] Figures 5A to C show that the exclusion of rare variants decreases coverage, but only slightly for Gag (Figure 5A), Nef (Figure 5B), and Pol (Figure 5C). Coverage of polyvalent solutions (m = 2) is shown as a function of minimum account fo (i.e., the population frequency of the rarest epitope in the vaccine). The dashed lines correspond to the coverage provided by the direct sequential algorithm; the solid black lines are based on the best solutions after 100 random restarts. The vertical axis, in all three graphs, is limited to a range of 0.015.
[023] As Figuras 6A a B mostram uma cobertura de vacina de dois antígenos. As comparações que ilustram a cobertura de epítopo média por sequência das sequências de clado B contemporâneas isoladas nos Estados Unidos, que era considerada com uma população alvo hipotética para uma vacina terapêutica. Para ilustrar a cobertura de potencial epítopo de célula T (PTE) usando um par de sequências naturais dentro do clado como antígenos de vacina, 5000 pares aleatoriamente selecionados de sequências naturais de clado B (cinza) foram avaliados como potenciais vacinas, e a distribuição de cobertura média das 189 sequências US de clado B contemporâneas é mostrada no histograma cinza. Essa é comparada com a cobertura média fornecida por um conjunto de 2 Gráficos de epítopos de antígenos de grupo M (banco de dados M), um conjunto de dois antígenos de EpiGraphs de clado B global (banco de dados B), e uma vacina personalizada para clado B US em que as 2 melhores correspondências de um conjunto de 6 gráficos de epítopos representativos para fabricação foram selecionadas como uma correspondência “personalizada” para cada uma das 189 sequências naturais de clado B US. A Figura 6A mostra a comparação da proteína Gag completa. A Figura 6B mostra comparações apenas da região p24 conservada.[023] Figures 6A to B show two-antigen vaccine coverage. Comparisons illustrating the average epitope coverage per sequence of contemporary clade B sequences isolated in the United States, which was considered a hypothetical target population for a therapeutic vaccine. To illustrate potential T cell epitope (PTE) coverage using a pair of natural sequences within the clade as vaccine antigens, 5000 randomly selected pairs of clade B natural sequences (gray) were evaluated as potential vaccines, and the distribution of Average coverage of the 189 contemporary clade B US sequences is shown in the gray histogram. This is compared to the average coverage provided by a set of 2 group M antigen Epitope Graphs (M database), a set of two global B clade EpiGraphs antigens (B database), and a personalized vaccine for clade B US in which the 2 best matches from a set of 6 representative epitope plots for manufacturing were selected as a “custom” match for each of the 189 natural clade B US sequences. Figure 6A shows the comparison of the full-length Gag protein. Figure 6B shows comparisons of only the conserved p24 region.
[024] A Figura 7 mostra o mapeamento de potencial cobertura de epítopo que abrange o proteoma de HIV.[024] Figure 7 shows the mapping of potential epitope coverage that spans the HIV proteome.
[025] A Figura 8 mostra a potencial cobertura média de epítopo Gag das sequências U.S. de clado B de HIV-1 por antígenos de vacina diferentes. A Figura 8A mostra a cobertura média de epítopo Gag por antígenos de vacina individuais, e a Figura 8B mostra a cobertura média de epítopo Gag por pares de antígenos de vacina.[025] Figure 8 shows the potential average Gag epitope coverage of U.S. HIV-1 clade B sequences by different vaccine antigens. Figure 8A shows the average Gag epitope coverage by individual vaccine antigens, and Figure 8B shows the average Gag epitope coverage by pairs of vaccine antigens.
[026] As Figuras 9A a C mostram que os antígenos de HIV sintéticos projetados por Gráfico de epítopos são expressados como proteínas de comprimento total. As células HeLa foram transfectadas com plasmídeos de expressão que codificam: proteínas de fusão de gag e nef para HIV ou SIV (EpiGraph 1 de grupo M de HIV [SEQ ID NO: 705] e EpiGraph 2 de grupo M de HIV [SEQ ID NO: 707], proteínas de comprimento total SIVmac239, proteínas híbridas de variantes de SIV [SEQ ID NO: 713], e porções conservadas SIV de gag e nef [SEQ ID NO: 714]), como representado na Figura 9A; proteínas de polimerase de HIV ou SIV (SIVmac239 comprimento total (FL), proteínas híbridas de variantes de SIV [SEQ ID NO: 715], (EpiGraph 1 de grupo M de HIV [SEQ ID NO: 709] e EpiGraph 2 de grupo M de HIV [SEQ ID NO: 711], e porções conservadas SIV de pol [SEQ ID NO: 716]), como representado na Figura 9B; e proteínas de fusão de gag e nef para HIV (EpiGraph 1 de clado B gag/nef [SEQ ID NO: 701]) e EpiGraph 2 de clado B gag/nef [SEQ ID NO: 702]) e proteínas da polimerase para HIV (epi 1 de clado M pol [SEQ ID NO: 709]); EpiGraph 1 de clado B pol [SEQ ID NO: 703]); EpiGraph 2 de clado B pol [SEQ ID NO: 704]), como representado na Figura 9C. Todos os construtos de gag/nef incluem um marcador V5 carbóxi-terminal (Figura 9A), e todos os construtos de pol incluem um marcador HA carbóxi-terminal (Figuras 9B e 9C). Para a Figura 9B, 1 e 2 indicam múltiplos clones de cada construto. Os lisados foram colhidos 48 horas após a transfecção e imunomarcados usando anticorpos V5 (Figura 9A) ou HA (Figuras 9B e 9C). O peso molecular observado das proteínas é compatível com o peso molecular previsto para cada um dos construtos.[026] Figures 9A to C show that synthetic HIV antigens designed by Epitope Chart are expressed as full-length proteins. HeLa cells were transfected with expression plasmids encoding: gag and nef fusion proteins for HIV or SIV (HIV group M EpiGraph 1 [SEQ ID NO: 705] and HIV group M EpiGraph 2 [SEQ ID NO : 707], full-length SIVmac239 proteins, SIV variant hybrid proteins [SEQ ID NO: 713], and SIV conserved portions of gag and nef [SEQ ID NO: 714]), as depicted in Figure 9A; HIV or SIV polymerase proteins (SIVmac239 full length (FL), SIV variant hybrid proteins [SEQ ID NO: 715], (HIV group M EpiGraph 1 [SEQ ID NO: 709] and group M EpiGraph 2 of HIV [SEQ ID NO: 711], and SIV conserved portions of pol [SEQ ID NO: 716]), as depicted in Figure 9B; and gag and nef fusion proteins for HIV (EpiGraph 1 of clade B gag/nef [SEQ ID NO: 701]) and EpiGraph 2 of clade B gag/nef [SEQ ID NO: 702]) and HIV polymerase proteins (epi 1 of clade M pol [SEQ ID NO: 709]); Clade B pol EpiGraph 1 [SEQ ID NO: 703]); Clade B pol EpiGraph 2 [SEQ ID NO: 704]), as depicted in Figure 9C. All gag/nef constructs include a carboxy-terminal V5 tag (Figure 9A), and all pol constructs include a carboxy-terminal HA tag (Figures 9B and 9C). For Figure 9B, 1 and 2 indicate multiple clones of each construct. Lysates were harvested 48 hours after transfection and immunoblotted using V5 (Figure 9A) or HA (Figures 9B and 9C) antibodies. The observed molecular weight of the proteins is compatible with the predicted molecular weight for each of the constructs.
[027] As Figuras 10A a B mostram que antígenos sintéticos projetados por EpiGraph são expressados por vetores de CMV. Como representado na Figura 10A, polimerase de SIVmac 239 de expressão de cepa 68-1 RhCMV de comprimento total (FL), um híbrido de polimerases SIV de variantes de SIV diferentes [SEQ ID NO: 715], um gene de polimerase sintético baseado em EpiGraph 1 de HIV de grupo M global [SEQ ID NO: 709] ou EpiGraph 2 de HIV de grupo M global [SEQ ID NO: 711] foram construídos por mutagênese de BAC e reconstituídos em fibroblastos telomerizados de Rhesus. Como representado na Figura 10B, regiões conservadas de SIVmac239 de expressãod e cepa 68-1 RhCMV dos construtos de polimerase [SEQ ID NO: 716] também foram construídas por mutagênese de BAC e reconstituídos em fibroblastos telomerizados de Rhesus. Em todos os vetores, a expressão de antígeno é ativada pelo promotor Rh107 viral endógeno. Os péletes celulares foram coletados em CPE completo e imunomarcados para a etiqueta HA expressada na terminação carbóxi de cada proteína. Para pol conservado, dois clones independentes (2.1 e 2.2) são mostrados na Figura 10B.[027] Figures 10A to B show that synthetic antigens designed by EpiGraph are expressed by CMV vectors. As depicted in Figure 10A, full-length (FL) strain 68-1 RhCMV expression SIVmac 239 polymerase, a hybrid of SIV polymerases from different SIV variants [SEQ ID NO: 715], a synthetic polymerase gene based on Global group M HIV EpiGraph 1 [SEQ ID NO: 709] or global group M HIV EpiGraph 2 [SEQ ID NO: 711] were constructed by BAC mutagenesis and reconstituted in telomerized Rhesus fibroblasts. As depicted in Figure 10B, conserved regions of SIVmac239 expression and strain 68-1 RhCMV polymerase constructs [SEQ ID NO: 716] were also constructed by BAC mutagenesis and reconstituted in telomerized Rhesus fibroblasts. In all vectors, antigen expression is activated by the endogenous viral Rh107 promoter. Cell pellets were collected in complete CPE and immunostained for the HA tag expressed at the carboxy terminus of each protein. For conserved pol, two independent clones (2.1 and 2.2) are shown in Figure 10B.
[028] As Figuras 11A a C mostram regiões conservadas dentro de: Nef (Figura 11A), Gag (Figura 11B), e Pol (Figura 11C) definidas com base no potencial de cobertura de epítopo de célula T (PTE) por uma vacina bivalente (isto é, 2 antígenos).[028] Figures 11A to C show conserved regions within: Nef (Figure 11A), Gag (Figure 11B), and Pol (Figure 11C) defined based on potential T cell epitope coverage (PTE) by a vaccine bivalent (i.e. 2 antigens).
[029] A Figura 12 ilustra a cobertura média de Epigraph de cada uma das regiões conservadas por antígenos de vacina diferentes, em comparação com as seções mais variáveis das proteínas.[029] Figure 12 illustrates the average Epigraph coverage of each of the regions conserved by different vaccine antigens, compared to the more variable sections of the proteins.
[030] Vários termos relacionados a aspectos da descrição são usados ao longo do relatório descritivo e reivindicações. Tais termos devem ser ter o seu significado comum na técnica, exceto onde indicado em contrário. Outros termos especificamente definidos devem ser interpretados de forma compatível com as definições fornecidas no presente documento.[030] Various terms related to aspects of the description are used throughout the specification and claims. Such terms shall have their ordinary meaning in the art, except where otherwise indicated. Other specifically defined terms should be interpreted in a manner consistent with the definitions provided in this document.
[031] Como usado neste relatório descritivo e nas reivindicações em anexo, as formas no singular "um", "uma" e "o" incluem referentes no plural exceto onde o conteúdo indique claramente em contrário. Dessa forma, por exemplo, a referência a "uma célula" inclui uma combinação de duas ou mais células e similares.[031] As used in this specification and the attached claims, the singular forms "a", "an" and "the" include plural referents except where the content clearly indicates otherwise. Thus, for example, reference to "a cell" includes a combination of two or more cells and the like.
[032] O termo "cerca" como usado no presente documento quando se refere a um valor mensurável como uma quantidade, uma duração temporal, e similares, pretende abranger variações de até ± 20% a partir do valor especificado, uma vez que tais variações são apropriadas para executar os métodos revelados. Exceto indicação em contrário, todos os números que expressam quantidades de ingredientes, propriedades tais como peso molecular, condições de reação e assim por diante usados no relatório descritivo e reivindicações devem ser entendidos como sendo modificados em todos os casos pelo termo "cerca". Consequentemente, exceto onde indicado em contrário, os parâmetros numéricos apresentados na descrição a seguir e nas reivindicações em anexo são aproximações que podem variar dependendo das propriedades desejadas que pretende-se obter pela presente invenção. No mínimo, e não como uma tentativa de limitar a aplicação da doutrina de equivalentes ao escopo das reivindicações, cada parâmetro numérico deve pelo menos ser interpretado à luz do número de dígitos significativos relatados e aplicando técnicas de arredondamento comuns.[032] The term "about" as used herein when referring to a measurable value such as a quantity, a temporal duration, and the like, is intended to encompass variations of up to ± 20% from the specified value, since such variations are suitable for carrying out the disclosed methods. Unless otherwise indicated, all numbers expressing quantities of ingredients, properties such as molecular weight, reaction conditions and so on used in the specification and claims are to be understood as being modified in all cases by the term "about". Consequently, except where otherwise indicated, the numerical parameters presented in the following description and in the attached claims are approximations that may vary depending on the desired properties intended to be obtained by the present invention. At a minimum, and not as an attempt to limit the application of the doctrine of equivalents to the scope of the claims, each numerical parameter must at least be interpreted in light of the number of significant digits reported and applying common rounding techniques.
[033] Apesar das faixas numéricas e dos parâmetros que estabelecem o amplo escopo da invenção serem aproximações, os valores numéricos apresentados nos exemplos específicos são relatados com a maior precisão possível. Qualquer valor numérico, entretanto, contém inerentemente certos erros necessariamente resultantes do desvio padrão encontrado em suas respectivas medidas de teste.[033] Although the numerical ranges and parameters that establish the broad scope of the invention are approximations, the numerical values presented in the specific examples are reported as accurately as possible. Any numerical value, however, inherently contains certain errors necessarily resulting from the standard deviation found in their respective test measurements.
[034] Conforme empregado acima e ao longo da revelação, o termo "quantidade eficaz" refere-se a uma quantidade eficaz, em dosagens e durante períodos de tempo necessários, para se obter o resultado desejado no que se refere ao tratamento do distúrbio, condição ou efeito colateral relativo. Será avaliado que a quantidade eficaz de componentes da presente invenção irá variar de paciente para paciente não só com a vacina, componente ou composição particular selecionada, a via de administração e a capacidade dos componentes para obter um resultado desejado na indivíduo, mas também com fatores como o estado da doença ou a gravidade da condição a ser aliviada, os níveis hormonais, a idade, o sexo, o peso do indivíduo, a condição do paciente e a gravidade da condição patológica a ser tratada, medicação simultânea ou dietas especiais seguidas pelo paciente em particular, e outros fatores que os versados na técnica reconhecerão, sendo a dosagem apropriada à discrição do médico responsável. Os regimes de dosagem podem ser ajustados para proporcionar a resposta terapêutica melhorada. Uma quantidade eficaz é também uma em que quaisquer efeitos tóxicos ou prejudiciais dos componentes são compensados pelos efeitos terapeuticamente benéficos.[034] As used above and throughout the disclosure, the term "effective amount" refers to an effective amount, in dosages and for periods of time necessary, to obtain the desired result with regard to the treatment of the disorder, condition or relative side effect. It will be appreciated that the effective amount of components of the present invention will vary from patient to patient not only with the particular vaccine, component or composition selected, the route of administration and the ability of the components to obtain a desired result in the individual, but also with factors such as the state of the disease or the severity of the condition to be alleviated, the hormonal levels, the age, sex, weight of the individual, the condition of the patient and the severity of the pathological condition to be treated, simultaneous medication or special diets followed by the particular patient, and other factors that those skilled in the art will recognize, the appropriate dosage being at the discretion of the treating physician. Dosage regimens can be adjusted to provide improved therapeutic response. An effective amount is also one in which any toxic or harmful effects of the components are offset by the therapeutically beneficial effects.
[035] O termo "administrar" significa administrar diretamente um composto ou composição da presente invenção, ou administrar um pró-fármaco, derivado ou análogo que formará uma quantidade equivalente do composto ativo ou substância dentro do corpo.[035] The term "administer" means directly administering a compound or composition of the present invention, or administering a prodrug, derivative or analogue that will form an equivalent amount of the active compound or substance within the body.
[036] Os termos "sujeito", "indivíduo" e "paciente" são usados no presente documento de forma intercambiável e referem-se a um animal, por exemplo, um ser humano, ao qual o tratamento, incluindo o tratamento profilático, com a composição farmacêutica de acordo com a presente invenção, é fornecido. O termo “indivíduo”, como usado no presente documento, refere-se a animais humanos e não humanos. Os termos "animais não humanos" e "mamíferos não humanos" são usados no presente documento de forma intercambiável e incluem todos os vertebrados, por exemplo, mamíferos, como primatas não humanos, (particularmente primatas maiores), ovelhas, cães, roedores (por exemplo, camundongo ou rato), porquinho- da-Índia, cabra, porco, gato, coelhos, vacas, cavalos e não mamíferos como répteis, anfíbios, galinhas e perus.[036] The terms "subject", "individual" and "patient" are used interchangeably herein and refer to an animal, for example, a human being, to which treatment, including prophylactic treatment, with The pharmaceutical composition according to the present invention is provided. The term “individual” as used herein refers to human and non-human animals. The terms "non-human animals" and "non-human mammals" are used interchangeably herein and include all vertebrates, e.g. mammals, such as non-human primates (particularly greater primates), sheep, dogs, rodents (e.g. example, mouse or rat), guinea pig, goat, pig, cat, rabbits, cows, horses and non-mammals such as reptiles, amphibians, chickens and turkeys.
[037] O termo "coquetel" refere-se a um conjunto de antígenos destinado a ser administrado em combinação a um paciente.[037] The term "cocktail" refers to a set of antigens intended to be administered in combination to a patient.
[038] O termo "epissenso" refere-se a uma sequência consenso baseada em epítopo. A mesma é uma sequência cujos epítopos são compatíveis, o mais estreitamente possível, com os epítopos em um conjunto de referências de sequências naturais. Os termos "epítopo" e "epítopo potencial" referem-se a uma sequência de k caracteres (tipicamente k está na faixa de 8 a 12), frequentemente no contexto de uma subsequência de caracteres k de uma sequência de antígenos natural ou de vacina muito mais longa. As células T podem reconhecer tais peptídeos em uma resposta imunológica.[038] The term "episense" refers to an epitope-based consensus sequence. It is a sequence whose epitopes are compatible, as closely as possible, with the epitopes in a set of natural sequence references. The terms "epitope" and "potential epitope" refer to a sequence of k characters (typically k is in the range 8 to 12), often in the context of a k-character subsequence of a very large natural or vaccine antigen sequence. longer. T cells can recognize such peptides in an immune response.
[039] O termo "EpiGraph" refere-se a uma nova estratégia computacional desenvolvida para criar sequências que proporcionam uma sequência epissenso ideal, ou conjunto de sequências que combinadas proporcionam cobertura ideal de uma população de diversas sequências virais.[039] The term "EpiGraph" refers to a new computational strategy developed to create sequences that provide an ideal episense sequence, or set of sequences that combined provide ideal coverage of a population of diverse viral sequences.
[040] Os termos "sequência EpiGraph" ou "antígeno Epissenso" referem-se às inserções de vacina projetadas com base no algoritmo EpiGraph.[040] The terms "EpiGraph sequence" or "Epissenso antigen" refer to vaccine inserts designed based on the EpiGraph algorithm.
[041] O termo "antígeno epissenso de população" refere-se a uma sequência derivada com o algoritmo EpiGraph, que são "centrais" para uma população de sequências de HIV. A população poderia ser um clado específico de HIV, um agrupamento de sequências derivadas usando o algoritmo de agrupamento baseado em epítopo personalizado, ou a epidemia global. "Central" é definido em termos de compartilhamento de epítopos potenciais, por isso é uma sequência computacionalmente derivada que fornece a cobertura de epítopo média máxima da população.[041] The term "population episense antigen" refers to a sequence derived with the EpiGraph algorithm, which are "central" to a population of HIV sequences. The population could be a specific clade of HIV, a cluster of sequences derived using the custom epitope-based clustering algorithm, or the global epidemic. “Central” is defined in terms of potential epitope sharing, so it is a computationally derived sequence that provides the maximum population average epitope coverage.
[042] As sequências de EpiGraph podem ser usadas como uma solução para uma vacina preventiva profilática, ou podem ser adotadas como parte de estratégias mais complexas para o projeto de vacinas terapêuticas que poderiam ser personalizadas para corresponder a infecções individuais. O termo "conjunto de vacinas personalizadas " refere-se a um conjunto de sequências de antígenos de vacina projetadas para fabricação, a partir das quais um subconjunto de antígenos poderia ser selecionado para melhor corresponder ao vírus de um paciente para administração como uma vacina terapêutica.[042] EpiGraph sequences could be used as a solution for a prophylactic preventive vaccine, or could be adopted as part of more complex strategies for designing therapeutic vaccines that could be personalized to match individual infections. The term "personalized vaccine set" refers to a set of vaccine antigen sequences designed for manufacturing, from which a subset of antigens could be selected to best match a patient's virus for administration as a therapeutic vaccine.
[043] O termo "antígeno personalizado" ou "antígeno epissenso personalizado" refere-se a uma ou mais sequências de aminoácidos do "conjunto de vacinas personalizadas" que poderiam ser especificamente selecionadas com base em uma melhor correspondência com a cepa de HIV-1 infectante de um paciente para administração a esse paciente como uma vacina terapêutica.[043] The term "personalized antigen" or "personalized episense antigen" refers to one or more amino acid sequences from the "personalized vaccine pool" that could be specifically selected based on a best match to the HIV-1 strain infectious disease of a patient for administration to that patient as a therapeutic vaccine.
[044] Como usado no presente documento, os termos "tratamento" ou "terapia" (bem como formas diferentes dos mesmos, incluindo curativos ou paliativos) referem-se ao tratamento de uma pessoa infectada. Como usado no presente documento, o termo "tratamento" inclui o alívio ou a redução de pelo menos um efeito adverso ou negativo ou sintoma de uma condição, doença ou distúrbio. Esta condição, doença ou desordem pode ser infecção por HIV.[044] As used herein, the terms "treatment" or "therapy" (as well as different forms thereof, including curative or palliative) refer to the treatment of an infected person. As used herein, the term "treatment" includes the alleviation or reduction of at least one adverse or negative effect or symptom of a condition, disease or disorder. This condition, disease or disorder may be HIV infection.
[045] Como usado no presente documento, os termos "prevenção" ou "profilaxia" referem-se a impedir que um indivíduo seja infectado, ou reduzir o risco de um indivíduo ser infectado, ou parar a transmissão, ou reduzir o risco de transmissão, por exemplo, de HIV, SIV ou um vírus relacionado.[045] As used herein, the terms "prevention" or "prophylaxis" refer to preventing an individual from becoming infected, or reducing the risk of an individual being infected, or stopping transmission, or reducing the risk of transmission , for example, from HIV, SIV or a related virus.
[046] “Farmaceuticamente aceitáveis" refere-se àqueles compostos, materiais, composições e/ou formas de dosagem que são, dentro do escopo de julgamento médico, adequados para contato com os tecidos de seres humanos e animais sem toxicidade excessiva, irritação, resposta alérgica ou outras complicações do problema compatíveis com uma relação benefício/risco razoável.[046] “Pharmaceutically acceptable” refers to those compounds, materials, compositions and/or dosage forms that are, within the scope of medical judgment, suitable for contact with the tissues of humans and animals without excessive toxicity, irritation, response allergic or other complications of the problem compatible with a reasonable benefit/risk ratio.
[047] Os vetores que podem ser usados incluem, mas não se limitam a, plasmídeos, vetores bacterianos e vetores virais. Os vetores virais incluem vetores de citomegalovírus (CMV). Uma vantagem destes vectores de CMV para utilização na aplicação de vacinas terapêuticas é que os mesmos criam um novo paradigma de epítopo de células T CD8+ e induzem respostas mais potentes e duradouras. Tem sido demonstrado em modelos animais que as vacinas baseadas nestes vetores virais podem eliminar infecções virais (Hansen, SG 2013. Science 340: 1237874), e assim estas abordagens têm o compromisso de uma vacina terapêutica, uma situação em que as vacinas personalizadas podem ser úteis.[047] Vectors that can be used include, but are not limited to, plasmids, bacterial vectors and viral vectors. Viral vectors include cytomegalovirus (CMV) vectors. An advantage of these CMV vectors for use in the application of therapeutic vaccines is that they create a new CD8+ T cell epitope paradigm and induce more potent and long-lasting responses. It has been demonstrated in animal models that vaccines based on these viral vectors can eliminate viral infections (Hansen, SG 2013. Science 340: 1237874), and thus these approaches have the commitment of a therapeutic vaccine, a situation in which personalized vaccines can be Useful.
[048] Outros vetores virais podem incluir poxvírus (vaccinia), incluindo vaccinia Ankara e canarypox; adenovírus, incluindo adenovírus tipo 5 (Ad5); rubéola; vírus sendai; rabdovírus; alfavírus; e vírus adeno-associados. Alternativamente, os antígenos da vacina EpiGraph podem ser administrados como componentes de DNA, RNA ou proteína de uma vacina. Como esta é uma estratégia de desenho de antígeno, os antígenos de vacina projetados para EpiGraph poderiam ser compatíveis com praticamente qualquer modo de administração de antígeno de vacina.[048] Other viral vectors may include poxviruses (vaccinia), including vaccinia Ankara and canarypox; adenovirus, including adenovirus type 5 (Ad5); rubella; sendai virus; rhabdovirus; alphavirus; and adeno-associated viruses. Alternatively, EpiGraph vaccine antigens can be administered as DNA, RNA, or protein components of a vaccine. Because this is an antigen design strategy, vaccine antigens designed for EpiGraph could be compatible with virtually any mode of vaccine antigen delivery.
[049] Em certas modalidades, as vacinas projetadas que usam sequências de aminoácidos EpiGraph têm um único antígeno. Em certas modalidades, as vacinas projetadas que usam sequências de aminoácidos EpiGraph têm conjuntos de antígenos.[049] In certain embodiments, vaccines designed using EpiGraph amino acid sequences have a single antigen. In certain embodiments, vaccines designed using EpiGraph amino acid sequences have sets of antigens.
[050] Em certas modalidades, as sequências de antígenos EpiGraph podem ser usadas em um cenário de vacina profilática.[050] In certain embodiments, EpiGraph antigen sequences can be used in a prophylactic vaccine scenario.
[051] Em certas modalidades, a estratégia EpiGraph pode ser usada para formar sequências que otimizam completamente a cobertura de epítopo para uma vacina profilática. Essa poderia ser uma sequência, ou várias sequências projetadas para se complementarem como uma vacina preventiva. As vacinas EpiGraph poderiam ser usadas em qualquer vetor, incluindo, mas não se limitando a, plasmídeos, vetores bacterianos e vetores virais.[051] In certain embodiments, the EpiGraph strategy can be used to form sequences that completely optimize epitope coverage for a prophylactic vaccine. This could be one sequence, or several sequences designed to complement each other as a preventative vaccine. EpiGraph vaccines could be used in any vector, including, but not limited to, plasmids, bacterial vectors, and viral vectors.
[052] No algoritmo EpiGraph, as sequências naturais são caracterizadas por um gráfico grande de nós, sendo que cada nó corresponde a um epítopo que aparece nas sequências naturais. As bordas direcionadas conectam dois nós quando as duas cadeias de epítopos correspondentes são “compatíveis”, indicando que os últimos caracteres k-1 na primeira cadeia estão de acordo com os primeiros caracteres k-1 na segunda cadeia (por exemplo, “EPTAPPAEPTAP” [SEQ ID NO: 796] e “PTAPPAEPTAPP” [SEQ ID NO: 797] são compatíveis k=12-unidades de repetição). Se duas cadeias forem compatíveis, então, uma cadeia de comprimento k+1 (por exemplo, “EPTAPPAEPTAPP”) [SEQ ID NO: 798] contém ambos os epítopos. De modo mais genérico, uma trajetória através desse gráfico de nós e bordas corresponde a uma única cadeia que contém subcadeias de k-unidades de repetição correspondentes a cada um dos nós no gráfico. Cada nó é pesado de acordo com quantas sequências no conjunto de referências exibem uma subcadeia correspondente àquele nó. O algoritmo EpiGraph usa um esquema de programação dinâmica para encontrar a trajetória através desse gráfico completo que maximiza a soma desses pesos e, portanto, fornece a maior cobertura.[052] In the EpiGraph algorithm, natural sequences are characterized by a large graph of nodes, with each node corresponding to an epitope that appears in the natural sequences. Directed edges connect two nodes when the two corresponding epitope chains are “matched,” indicating that the last k-1 characters in the first chain match the first k-1 characters in the second chain (e.g., “EPTAPPAEPTAP” [ SEQ ID NO: 796] and “PTAPPAEPTAPP” [SEQ ID NO: 797] are supported k=12-repeat units). If two chains are compatible, then a chain of length k+1 (e.g., “EPTAPPAEPTAPP”) [SEQ ID NO: 798] contains both epitopes. More generally, a trajectory through this graph of nodes and edges corresponds to a single chain that contains subchains of k-repeat units corresponding to each of the nodes in the graph. Each node is weighted according to how many sequences in the reference set exhibit a substring corresponding to that node. The EpiGraph algorithm uses a dynamic programming scheme to find the trajectory through this complete graph that maximizes the sum of these weights and therefore provides the greatest coverage.
[053] Certas modalidades fornecidas incluem uma vacina contra HIV-1 que compreende um vetor e um antígeno epissenso na população, ou combinação de antígenos EpiGraph otimizados projetados para serem usados como um conjunto. Há muito vetores diferentes que poderiam ser usados para a vacina. Por exemplo, um tipo de vetor que pode ser usado em um vetor viral. Esses vetores virais podem incluir um citomegalovírus humano (HCMV), um poxvírus, adenovírus, rubéola, vírus sendai, rabdovírus, alfavírus ou vírus adeno-associado. A vacina também poderia ser aplicada como um gene que codifica a proteína EpiGraph, usando DNA, RNA ou incluída como uma proteína expressada ou parte de uma proteína.[053] Certain modalities provided include an HIV-1 vaccine comprising a vector and an episense antigen in the population, or combination of optimized EpiGraph antigens designed to be used as a set. There are many different vectors that could be used for the vaccine. For example, a type of vector that can be used in a viral vector. These viral vectors may include a human cytomegalovirus (HCMV), a poxvirus, adenovirus, rubella virus, sendai virus, rhabdovirus, alphavirus, or adeno-associated virus. The vaccine could also be delivered as a gene encoding the EpiGraph protein, using DNA, RNA, or included as an expressed protein or part of a protein.
[054] Em certas modalidades, o antígeno EpiGraph das vacinas reveladas pode ser derivado da proteína Gag do HIV-1. Em uma outra modalidade, a proteína Gag do HIV-1 foi inativada eliminando-se uma sequência de miristoilação na terminação N da proteína Gag do HIV-1. Em uma outra modalidade, o antígeno EpiGraph pode ser derivado da proteína Pol ou Nef do HIV-1, ou de fato qualquer outra proteína de HIV, incluindo Env, Tat, Rev, Vif ou Vpu.[054] In certain embodiments, the EpiGraph antigen of the disclosed vaccines may be derived from the HIV-1 Gag protein. In another embodiment, the HIV-1 Gag protein was inactivated by eliminating a myristoylation sequence at the N terminus of the HIV-1 Gag protein. In another embodiment, the EpiGraph antigen may be derived from the HIV-1 Pol or Nef protein, or in fact any other HIV protein, including Env, Tat, Rev, Vif or Vpu.
[055] Em certas modalidades, o antígeno epissenso da população pode ser determinado usando a abordagem EpiGraph. Esse antígeno epissenso da população poderia ser, então, usado para criar uma vacina. Alternativamente, EpiGraphs poderiam ser projetados como uma combinação de sequências projetadas para serem usadas como um conjunto. O HIV-1 pode ser dividido em clados com base na localização geográfica. Em uma modalidade, o antígeno epissenso da população é essencial para o clado B do HIV-1 epidêmico nos Estados Unidos nas vacinas reveladas. Em uma outra modalidade, o antígeno epissenso da população é essencial para o clado C do HIV-1 epidêmico na África do Sul nas vacinas reveladas. Em uma outra modalidade, o antígeno epissenso da população é essencial para o clado 2 do HIV-1 regional epidêmico na Tailândia nas vacinas reveladas. Em uma outra modalidade, o antígeno epissenso da população é essencial para o conjunto global de grupo M do HIV-1 nas vacinas reveladas.[055] In certain embodiments, the episense antigen of the population can be determined using the EpiGraph approach. This population episense antigen could then be used to create a vaccine. Alternatively, EpiGraphs could be designed as a combination of sequences designed to be used as a set. HIV-1 can be divided into clades based on geographic location. In one embodiment, the population episense antigen is essential for the HIV-1 clade B epidemic in the United States in the disclosed vaccines. In another embodiment, the population episense antigen is essential for the HIV-1 clade C epidemic in South Africa in the disclosed vaccines. In another embodiment, the population episense antigen is essential for the regional HIV-1 clade 2 epidemic in Thailand in the disclosed vaccines. In another embodiment, the population episense antigen is essential for the global pool of HIV-1 group M in the disclosed vaccines.
[056] Em algumas modalidades, o antígeno epissenso na população de HIV- 1 compreende epítopos de Gag, Pol, Nef, Env, Tat, Rev, Vpr, Vif ou Vpu. Em algumas modalidades, o antígeno epissenso na população de HIV-1 compreende epítopos de Gag e compreende a sequência de aminoácidos de SEQ ID NO: 691, SEQ ID NO: 697, SEQ ID NO: 698, SEQ ID NO: 699, ou SEQ ID NO: 700. Em algumas modalidades, o antígeno epissenso na população de HIV-1 compreende epítopos de uma região conservada de HIV-1. Em algumas modalidades, o antígeno epissenso na população de HIV-1 compreende epítopos de uma região conservada de Gag, Pol ou Nef. Em algumas modalidades, os epítopos da região conservada são epítopos da proteína capsidial p24 de Gag.[056] In some embodiments, the episense antigen in the HIV-1 population comprises epitopes of Gag, Pol, Nef, Env, Tat, Rev, Vpr, Vif or Vpu. In some embodiments, the episense antigen in the HIV-1 population comprises Gag epitopes and comprises the amino acid sequence of SEQ ID NO: 691, SEQ ID NO: 697, SEQ ID NO: 698, SEQ ID NO: 699, or SEQ ID NO: 700. In some embodiments, the episense antigen in the HIV-1 population comprises epitopes from a conserved region of HIV-1. In some embodiments, the episense antigen in the HIV-1 population comprises epitopes from a conserved region of Gag, Pol, or Nef. In some embodiments, the epitopes of the conserved region are epitopes of the Gag capsid protein p24.
[057] Em algumas modalidades, o antígeno epissenso na população de HIV- 1 é um antígeno de fusão que compreende dois ou mais antígenos epissenso na população de HIV-1. Em algumas modalidades, o antígeno de fusão compreende um antígeno epissenso da população do HIV-1 que compreende epítopos Gag e um antígeno epissenso da população do HIV-1 que compreende epítopos Nef. Em algumas modalidades, o antígeno de fusão compreende um antígeno epissenso de população de HIV-1 que compreende epítopos de uma região conservada de Gag e um antígeno epissenso de população de HIV-1 que compreende epítopos de uma região conservada de Nef. Em algumas modalidades, os epítopos do antígeno de fusão da região conservada são epítopos da proteína capsidial p24 de Gag.[057] In some embodiments, the episense antigen in the HIV-1 population is a fusion antigen comprising two or more episense antigens in the HIV-1 population. In some embodiments, the fusion antigen comprises an episense antigen from the HIV-1 population comprising Gag epitopes and an episense antigen from the HIV-1 population comprising Nef epitopes. In some embodiments, the fusion antigen comprises an HIV-1 population episense antigen that comprises epitopes from a conserved region of Gag and an HIV-1 population episense antigen that comprises epitopes from a conserved region of Nef. In some embodiments, the conserved region fusion antigen epitopes are Gag p24 capsid protein epitopes.
[058] Em algumas modalidades, o antígeno epissenso na população de HIV- 1 é essencial para o clado B do HIV-1 epidêmico nos Estados Unidos. Em algumas modalidades, o antígeno epissenso do clado B de população de HIV-1 compreende epítopos de Gag e compreende a sequência de aminoácidos de SEQ ID NO: 730, SEQ ID NO: 732, ou SEQ ID NO: 778. Em algumas modalidades, o antígeno epissenso de população do clado B de HIV-1 compreende epítopos da proteína capsidial p24 de Gag e compreende a sequência de aminoácidos de SEQ ID NO: 731, SEQ ID NO: 733, ou SEQ ID NO: 779. Em algumas modalidades, o antígeno epissenso do clado B de população de HIV-1 compreende epítopos de Nef e compreende a sequência de aminoácidos de SEQ ID NO: 734 ou SEQ ID NO: 736. Em algumas modalidades, o antígeno epissenso de população do clado B de HIV-1 compreende epítopos de uma região conservada de Nef e compreende a sequência de aminoácidos de SEQ ID NO: 735 ou SEQ ID NO: 737. Em algumas modalidades, o antígeno epissenso do clado B de população de HIV-1 compreende epítopos de Pol e compreende a sequência de aminoácidos de SEQ ID NO: 703, SEQ ID NO: 704, SEQ ID NO: 738, ou SEQ ID NO: 740. Em algumas modalidades, o antígeno epissenso de população do clado B de HIV-1 compreende epítopos de uma região conservada de Pol e compreende a sequência de aminoácidos de SEQ ID NO: 739 ou SEQ ID NO: 741. Em algumas modalidades, o antígeno epissenso de população de clado B de HIV-1 B é um antígeno de fusão que compreende (1) um antígeno epissenso de população de clado B de HIV-1 que compreende epítopos de Gag e (2) um antígeno epissenso de população de clado B de HIV-1 que compreende epítopos de Nef, em que o antígeno de fusão compreende a sequência de aminoácidos de SEQ ID NO: 701 ou SEQ ID NO: 702. Em algumas modalidades, o antígeno epissenso da população de clado B de HIV-1 é um antígeno de fusão que compreende (1) um antígeno epissenso da população de clado B de HIV-1 que compreende epítopos da proteína capsidial p24 de Gag e (2) um antígeno epissenso da população de clado B de HIV-1 que compreende epítopos de uma região conservada de Nef.[058] In some embodiments, the episense antigen in the HIV-1 population is essential for the HIV-1 clade B epidemic in the United States. In some embodiments, the HIV-1 population clade B episense antigen comprises Gag epitopes and comprises the amino acid sequence of SEQ ID NO: 730, SEQ ID NO: 732, or SEQ ID NO: 778. In some embodiments, The HIV-1 clade B population episense antigen comprises epitopes of the Gag capsid protein p24 and comprises the amino acid sequence of SEQ ID NO: 731, SEQ ID NO: 733, or SEQ ID NO: 779. In some embodiments, The HIV-1 population clade B episense antigen comprises Nef epitopes and comprises the amino acid sequence of SEQ ID NO: 734 or SEQ ID NO: 736. In some embodiments, the HIV-1 clade B population episense antigen 1 comprises epitopes from a conserved region of Nef and comprises the amino acid sequence of SEQ ID NO: 735 or SEQ ID NO: 737. In some embodiments, the HIV-1 population clade B episense antigen comprises Pol epitopes and comprises the amino acid sequence of SEQ ID NO: 703, SEQ ID NO: 704, SEQ ID NO: 738, or SEQ ID NO: 740. In some embodiments, the HIV-1 clade B population episense antigen comprises epitopes of a conserved region of Pol and comprises the amino acid sequence of SEQ ID NO: 739 or SEQ ID NO: 741. In some embodiments, the HIV-1 B clade population episense antigen is a fusion antigen comprising (1) an HIV-1 clade B population episense antigen comprising Gag epitopes and (2) an HIV-1 clade B population episense antigen comprising Nef epitopes, wherein the fusion antigen comprises the amino acid sequence of SEQ ID NO: 701 or SEQ ID NO: 702. In some embodiments, the HIV-1 clade B population episense antigen is a fusion antigen comprising (1) an HIV-1 clade B population episense antigen. 1 comprising epitopes from the Gag capsid protein p24 and (2) an episense antigen from the HIV-1 clade B population comprising epitopes from a conserved region of Nef.
[059] Em algumas modalidades, o antígeno epissenso na população de HIV- 1 é essencial para o clado C do HIV-1 epidêmico na África do Sul. Em algumas modalidades, o antígeno epissenso do clado C de população de HIV-1 compreende epítopos de Gag e compreende a sequência de aminoácidos de SEQ ID NO: 742, SEQ ID NO: 744, ou SEQ ID NO: 766. Em algumas modalidades, o antígeno epissenso de população do clado C de HIV-1 compreende epítopos da proteína capsidial p24 de Gag e compreende a sequência de aminoácidos de SEQ ID NO: 743, SEQ ID NO: 745, ou SEQ ID NO: 767. Em algumas modalidades, o antígeno epissenso do clado C de população de HIV-1 compreende epítopos de Nef e compreende a sequência de aminoácidos de SEQ ID NO: 746 ou SEQ ID NO: 748. Em algumas modalidades, o antígeno epissenso de população do clado C de HIV-1 compreende epítopos de uma região conservada de Nef e compreende a sequência de aminoácidos de SEQ ID NO: 747 ou SEQ ID NO: 749. Em algumas modalidades, o antígeno epissenso do clado C de população de HIV-1 compreende epítopos de Pol e compreende a sequência de aminoácidos de SEQ ID NO: 750 ou SEQ ID NO: 752. Em algumas modalidades, o antígeno epissenso de população do clado C de HIV-1 compreende epítopos de uma região conservada de Pol e compreende a sequência de aminoácidos de SEQ ID NO: 751 ou SEQ ID NO: 753. Em algumas modalidades, o antígeno epissenso de população de clado C de HIV-1 B é um antígeno de fusão que compreende (1) um antígeno epissenso de população de clado C de HIV-1 que compreende epítopos de Gag e (2) um antígeno epissenso de população de clado C de HIV-1 que compreende epítopos de Nef. Em algumas modalidades, o antígeno epissenso da população de clado C de HIV-1 é um antígeno de fusão que compreende (1) um antígeno epissenso da população de clado C de HIV-1 que compreende epítopos da proteína capsidial p24 de Gag e (2) um antígeno epissenso da população de clado C de HIV-1 que compreende epítopos de uma região conservada de Nef.[059] In some embodiments, the episense antigen in the HIV-1 population is essential for the HIV-1 clade C epidemic in South Africa. In some embodiments, the episense antigen of the HIV-1 population clade C comprises epitopes of Gag and comprises the amino acid sequence of SEQ ID NO: 742, SEQ ID NO: 744, or SEQ ID NO: 766. In some embodiments, the HIV-1 clade C population episense antigen comprises epitopes of the capsid protein p24 of Gag and comprises the amino acid sequence of SEQ ID NO: 743, SEQ ID NO: 745, or SEQ ID NO: 767. In some embodiments, the HIV-1 population clade C episense antigen comprises Nef epitopes and comprises the amino acid sequence of SEQ ID NO: 746 or SEQ ID NO: 748. In some embodiments, the HIV-1 clade C population episense antigen comprises epitopes from a conserved region of Nef and comprises the amino acid sequence of SEQ ID NO: 747 or SEQ ID NO: 749. In some embodiments, the HIV-1 population clade C episense antigen comprises Pol epitopes and comprises the amino acid sequence of SEQ ID NO: 750 or SEQ ID NO: 752. In In some embodiments, the HIV-1 clade C population episense antigen comprises epitopes from a conserved region of Pol and comprises the amino acid sequence of SEQ ID NO: 751 or SEQ ID NO: 753. In some embodiments, the episense antigen of HIV-1 clade C population B is a fusion antigen comprising (1) an HIV-1 clade C population episense antigen comprising Gag epitopes and (2) an HIV clade C population episense antigen -1 comprising Nef epitopes. In some embodiments, the episense antigen of the HIV-1 clade C population is a fusion antigen comprising (1) an episense antigen of the HIV-1 clade C population comprising epitopes of the Gag capsid protein p24 and (2) ) an episense antigen from the HIV-1 clade C population that comprises epitopes from a conserved region of Nef.
[060] Em algumas modalidades, o antígeno epissenso na população de HIV- 1 é essencial para o clado 2 do HIV-1 regional epidêmico na Tailândia. Em algumas modalidades, o antígeno epissenso de população de clado 2 de HIV-1 compreende epítopos de Gag. Em algumas modalidades, o antígeno epissenso da população de clado 2 de HIV-1 compreende epítopos da proteína capsidial p24 de Gag. Em algumas modalidades, o antígeno epissenso de população de clado 2 de HIV-1 compreende epítopos de Nef. Em algumas modalidades, o antígeno epissenso de população de clado 2 de HIV-1 compreende epítopos de uma região conservada de Nef. Em algumas modalidades, o antígeno epissenso de população de clado 2 de HIV-1 compreende epítopos de Pol. Em algumas modalidades, o antígeno epissenso de população de clado 2 de HIV-1 compreende epítopos de uma região conservada de Pol. Em algumas modalidades, o antígeno epissenso de população de clado 2 de HIV-1 B é um antígeno de fusão que compreende (1) um antígeno epissenso de população de clado 2 de HIV-1 que compreende epítopos de Gag e (2) um antígeno epissenso de população de clado 2 de HIV-1 que compreende epítopos de Nef. Em algumas modalidades, o antígeno epissenso da população de clado 2 de HIV-1 é um antígeno de fusão que compreende (1) um antígeno epissenso da população de clado 2 de HIV-1 que compreende epítopos da proteína capsidial p24 de Gag e (2) um antígeno epissenso da população de clado 2 de HIV-1 que compreende epítopos de uma região conservada de Nef.[060] In some embodiments, the episense antigen in the HIV-1 population is essential for the regional HIV-1 clade 2 epidemic in Thailand. In some embodiments, the HIV-1 clade 2 population episense antigen comprises Gag epitopes. In some embodiments, the episense antigen of the HIV-1 clade 2 population comprises epitopes of the Gag capsid protein p24. In some embodiments, the HIV-1 clade 2 population episense antigen comprises Nef epitopes. In some embodiments, the HIV-1 clade 2 population episense antigen comprises epitopes from a conserved region of Nef. In some embodiments, the HIV-1 clade 2 population episense antigen comprises epitopes from Pol. In some embodiments, the HIV-1 clade 2 population episense antigen comprises epitopes from a conserved region of Pol. HIV-1 B clade 2 population episense antigen is a fusion antigen comprising (1) an HIV-1 B clade 2 population episense antigen comprising Gag epitopes and (2) an HIV-1 B clade 2 population episense antigen comprising Gag epitopes. HIV-1 clade 2 comprising Nef epitopes. In some embodiments, the HIV-1 clade 2 population episense antigen is a fusion antigen that comprises (1) an HIV-1 clade 2 population episense antigen that comprises Gag p24 capsid protein epitopes and (2) ) an episense antigen from the HIV-1 clade 2 population that comprises epitopes from a conserved region of Nef.
[061] Em algumas modalidades, o antígeno epissenso na população de HIV- 1 é essencial para o conjunto global do grupo M do HIV-1. Em algumas modalidades, o antígeno epissenso de população de grupo M de HIV-1 compreende epítopos de Gag e compreende a sequência de aminoácidos de SEQ ID NO: 718, SEQ ID NO: 720, ou SEQ ID NO: 754. Em algumas modalidades, o antígeno epissenso de população de grupo M de HIV-1 compreende epítopos da proteína capsidial p24 de Gag e compreende a sequência de aminoácidos de SEQ ID NO: 719, SEQ ID NO: 721, ou SEQ ID NO: 755. Em algumas modalidades, o antígeno epissenso de população de grupo M de HIV-1 compreende epítopos de Nef e compreende a sequência de aminoácidos de SEQ ID NO: 722 ou SEQ ID NO: 724. Em algumas modalidades, o antígeno epissenso de população de grupo M de HIV-1 compreende epítopos de uma região conservada de Nef e compreende a sequência de aminoácidos de SEQ ID NO: 723 ou SEQ ID NO: 725. Em algumas modalidades, o antígeno epissenso de população de grupo M de HIV-1 B é um antígeno de fusão que compreende (1) um antígeno epissenso de população de grupo M de HIV-1 que compreende epítopos de Gag e (2) um antígeno epissenso de população de grupo M de HIV-1 que compreende epítopos de Nef, em que o antígeno de fusão compreende a sequência de aminoácidos de SEQ ID NO: 705 ou SEQ ID NO: 707. Em algumas modalidades, o antígeno epissenso de população de grupo M de HIV-1 B é um antígeno de fusão que compreende (1) um antígeno epissenso de população de grupo M de HIV-1 que compreende epítopos da proteína capsidial p24 de Gag e (2) um antígeno epissenso de população de grupo M de HIV-1 que compreende epítopos de uma região conservada de Nef, em que o antígeno de fusão compreende a sequência de aminoácidos de SEQ ID NO: 706 ou SEQ ID NO: 708. Em algumas modalidades, o antígeno epissenso de população de grupo M de HIV-1 compreende epítopos de Pol e compreende a sequência de aminoácidos de SEQ ID NO: 709, SEQ ID NO: 711, SEQ ID NO: 726, ou SEQ ID NO: 728. Em algumas modalidades, o antígeno epissenso de população de grupo M de HIV-1 compreende epítopos de uma região conservada de Pol e compreende a sequência de aminoácidos de SEQ ID NO: 710, SEQ ID NO: 712, SEQ ID NO: 727, ou SEQ ID NO: 729.[061] In some embodiments, the episense antigen in the HIV-1 population is essential for the global pool of HIV-1 group M. In some embodiments, the HIV-1 group M population episense antigen comprises Gag epitopes and comprises the amino acid sequence of SEQ ID NO: 718, SEQ ID NO: 720, or SEQ ID NO: 754. In some embodiments, The HIV-1 group M population episense antigen comprises epitopes of the Gag capsid protein p24 and comprises the amino acid sequence of SEQ ID NO: 719, SEQ ID NO: 721, or SEQ ID NO: 755. In some embodiments, The HIV-1 group M population episense antigen comprises Nef epitopes and comprises the amino acid sequence of SEQ ID NO: 722 or SEQ ID NO: 724. In some embodiments, the HIV-1 group M population episense antigen 1 comprises epitopes from a conserved region of Nef and comprises the amino acid sequence of SEQ ID NO: 723 or SEQ ID NO: 725. In some embodiments, the HIV-1 B group M population episense antigen is a fusion antigen comprising (1) an HIV-1 group M population episense antigen comprising Gag epitopes and (2) an HIV-1 group M population episense antigen comprising Nef epitopes, wherein the fusion antigen comprises the amino acid sequence of SEQ ID NO: 705 or SEQ ID NO: 707. In some embodiments, the HIV-1 B group M population episense antigen is a fusion antigen comprising (1) a population episense antigen of HIV-1 group M population comprising epitopes from the Gag capsid protein p24 and (2) an HIV-1 group M population episense antigen comprising epitopes from a conserved region of Nef, wherein the fusion antigen comprises the amino acid sequence of SEQ ID NO: 706 or SEQ ID NO: 708. In some embodiments, the HIV-1 group M population episense antigen comprises Pol epitopes and comprises the amino acid sequence of SEQ ID NO: 709, SEQ ID NO: 711, SEQ ID NO: 726, or SEQ ID NO: 728. In some embodiments, the HIV-1 group M population episense antigen comprises epitopes from a conserved region of Pol and comprises the amino acid sequence of SEQ ID NO: 710, SEQ ID NO: 712, SEQ ID NO: 727, or SEQ ID NO: 729.
[062] Em certas modalidades, as vacinas reveladas podem compreender adicionalmente um vetor de HCMV que compreende uma cadeia principal de HCMV e um antígeno personalizado selecionado para ser uma cepa de HIV-1 de melhor correspondência natural. Em uma outra modalidade, as vacinas reveladas podem compreender adicionalmente um vetor de HCMV que compreende uma cadeia principal de HCMV e um antígeno personalizado selecionado para ser uma cepa de HIV-1 diferente de melhor correspondência.[062] In certain embodiments, the disclosed vaccines may additionally comprise an HCMV vector comprising an HCMV backbone and a custom antigen selected to be a natural best match HIV-1 strain. In another embodiment, the disclosed vaccines may further comprise an HCMV vector comprising an HCMV backbone and a custom antigen selected to be a different best-match HIV-1 strain.
[063] Em algumas modalidades, o antígeno personalizado de HIV-1 compreende epítopos de Gag, Pol, Nef, Env, Tat, Rev, Vpr, Vif ou Vpu. Em algumas modalidades, o antígeno personalizado compreende uma sequência selecionada a partir de: SEQ ID NOs. 692 a 696; SEQ ID NOs. 756 a 765; SEQ ID NOs. 769 a 777; ou SEQ ID NOs. 780 a 789.[063] In some embodiments, the personalized HIV-1 antigen comprises Gag, Pol, Nef, Env, Tat, Rev, Vpr, Vif or Vpu epitopes. In some embodiments, the personalized antigen comprises a sequence selected from: SEQ ID NOs. 692 to 696; SEQ ID NOs. 756 to 765; SEQ ID NOs. 769 to 777; or SEQ ID NOs. 780 to 789.
[064] Em algumas modalidades, o antígeno personalizado de HIV-1 compreende epítopos de Gag e compreende a sequência de aminoácidos de SEQ ID NO: 692, SEQ ID NO: 693, SEQ ID NO: 694, SEQ ID NO: 695, ou SEQ ID NO: 696.[064] In some embodiments, the personalized HIV-1 antigen comprises Gag epitopes and comprises the amino acid sequence of SEQ ID NO: 692, SEQ ID NO: 693, SEQ ID NO: 694, SEQ ID NO: 695, or SEQ ID NO: 696.
[065] Em algumas modalidades, o antígeno personalizado de HIV-1 é essencial para o conjunto global do grupo M do HIV-1. Em algumas modalidades, o antígeno personalizado de grupo M de HIV-1 compreende epítopos de Gag e compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em: SEQ ID NOs: 756 a 765. Em algumas modalidades, o antígeno personalizado de grupo M de HIV-1 compreende epítopos da proteína capsidial p24 de Gag e compreende a sequência de aminoácidos de SEQ ID NO: 757, SEQ ID NO: 759, SEQ ID NO: 761, SEQ ID NO: 763, ou SEQ ID NO: 765.[065] In some embodiments, the personalized HIV-1 antigen is essential for the global pool of HIV-1 group M. In some embodiments, the HIV-1 group M personalized antigen comprises Gag epitopes and comprises an amino acid sequence selected from the group consisting of: SEQ ID NOs: 756 to 765. In some embodiments, the group M personalized antigen HIV-1 M comprises epitopes of the Gag p24 capsid protein and comprises the amino acid sequence of SEQ ID NO: 757, SEQ ID NO: 759, SEQ ID NO: 761, SEQ ID NO: 763, or SEQ ID NO: 765 .
[066] Em algumas modalidades, o antígeno personalizado de HIV-1 é essencial para o clado C do HIV-1 epidêmico na África do Sul. Em algumas modalidades, o antígeno personalizado de clado C de HIV-1 compreende epítopos de Gag e compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em: SEQ ID NOs: 768 a 777. Em algumas modalidades, o antígeno personalizado do clado C de HIV-1 compreende epítopos da proteína capsidial p24 de Gag e compreende a sequência de aminoácidos de SEQ ID NO: 769, SEQ ID NO: 771, SEQ ID NO: 773, SEQ ID NO: 775, ou SEQ ID NO: 777.[066] In some embodiments, the HIV-1 personalized antigen is essential for the HIV-1 clade C epidemic in South Africa. In some embodiments, the HIV-1 clade C personalized antigen comprises Gag epitopes and comprises an amino acid sequence selected from the group consisting of: SEQ ID NOs: 768 to 777. In some embodiments, the HIV-1 clade C custom antigen comprises epitopes of the Gag p24 capsid protein and comprises the amino acid sequence of SEQ ID NO: 769, SEQ ID NO: 771, SEQ ID NO: 773, SEQ ID NO: 775, or SEQ ID NO: 777.
[067] Em algumas modalidades, o antígeno personalizado de HIV-1 é essencial para o clado B do HIV-1 epidêmico nos Estados Unidos. Em algumas modalidades, o antígeno personalizado de clado B de HIV-1 compreende epítopos de Gag e compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em: SEQ ID NOs: 780 a 789. Em algumas modalidades, o antígeno personalizado do clado B de HIV-1 compreende epítopos da proteína capsidial p24 de Gag e compreende a sequência de aminoácidos de SEQ ID NO: 781, SEQ ID NO: 783, SEQ ID NO: 785, SEQ ID NO: 787, ou SEQ ID NO: 789.[067] In some embodiments, the personalized HIV-1 antigen is essential for the HIV-1 clade B epidemic in the United States. In some embodiments, the HIV-1 clade B custom antigen comprises Gag epitopes and comprises an amino acid sequence selected from the group consisting of: SEQ ID NOs: 780 to 789. In some embodiments, the clade B custom antigen HIV-1 B comprises epitopes of the Gag p24 capsid protein and comprises the amino acid sequence of SEQ ID NO: 781, SEQ ID NO: 783, SEQ ID NO: 785, SEQ ID NO: 787, or SEQ ID NO: 789 .
[068] Em certas modalidades, métodos de tratamento de HIV-1 em um indivíduo que compreendem administrar uma quantidade eficaz de uma das vacinas reveladas ao indivíduo em necessidade da mesma. Em uma outra modalidade, a seleção de antígenos de vacina para cobrir idealmente a diversidade dentro de uma área geográfica usa uma sequência de antígenos de vacina gerada usando o método EpiGraph de seleção de sequência de antígenos.[068] In certain embodiments, methods of treating HIV-1 in an individual comprising administering an effective amount of one of the disclosed vaccines to the individual in need thereof. In another embodiment, selecting vaccine antigens to ideally cover diversity within a geographic area uses a vaccine antigen sequence generated using the EpiGraph antigen sequence selection method.
[069] As modalidades da presente invenção incluem métodos de tratamento de infecção por HIV-1 em um indivíduo que compreendem administrar uma quantidade eficaz de qualquer uma dessas vacinas reveladas ao indivíduo em necessidade das mesmas.[069] Embodiments of the present invention include methods of treating HIV-1 infection in an individual that comprise administering an effective amount of any of these disclosed vaccines to the individual in need thereof.
[070] As modalidades da presente invenção também incluem métodos para induzir uma resposta de células T de memória efetoras que compreende determinar uma ou mais sequências EpiGraph, gerar uma vacina que compreende a uma ou mais sequências de aminoácidos EpiGraph e vetor, e administrar a vacina a um indivíduo que precisa da mesma. Em uma outra modalidade, são fornecidos métodos para induzir uma resposta de células T de memória efetoras em que a uma ou mais sequências de aminoácidos EpiGraph compreendem SEQ ID NO: 697, SEQ ID NO: 698, SEQ ID NO: 699, ou SEQ ID NO: 700. Essa vacina pode ser uma vacina profilática ou terapêutica.[070] Embodiments of the present invention also include methods for inducing an effector memory T cell response comprising determining one or more EpiGraph sequences, generating a vaccine comprising the one or more EpiGraph amino acid sequences and vector, and administering the vaccine to an individual who needs it. In another embodiment, methods for inducing an effector memory T cell response are provided wherein the one or more EpiGraph amino acid sequences comprise SEQ ID NO: 697, SEQ ID NO: 698, SEQ ID NO: 699, or SEQ ID NO: 700. This vaccine can be a prophylactic or therapeutic vaccine.
[071] Avanços recentes em pesquisa de vacinas contra HIV incluem o conceito de uma vacina indutora de célula T de memória efetora (TEM) para prevenir infecção por HIV. Ao contrário de células T de memória centrais (TCM) induzidas por abordagens de vacina tradicionais, TEM são mantidas persistentemente nos tecidos linfoides e nos sítios efetores extralinfoides e estão imediatamente prontas para mediar a função efetora antiviral, proporcionando assim uma proteção imune constante nos portais de entrada viral e sítios de reativação viral. O sistema de vetor mais qualificado para induzir e manter indefinidamente TEM é derivado de CMV. Presumidamente devido à reativação de baixo nível contínua e/ou expressão gênica em células persistentemente infectadas, CMV mantém apenas a quantidade certa de estimulação imune de baixo nível persistente exigida para manutenção de TEM sem provocar a exaustão de células T.[071] Recent advances in HIV vaccine research include the concept of an effector memory T cell (TEM) inducing vaccine to prevent HIV infection. Unlike central memory T cells (TCM) induced by traditional vaccine approaches, TEM are persistently maintained in lymphoid tissues and extralymphoid effector sites and are immediately ready to mediate antiviral effector function, thus providing constant immune protection at the portals of viral entry and viral reactivation sites. The vector system most qualified to induce and indefinitely maintain TEM is derived from CMV. Presumably due to continuous low-level reactivation and/or gene expression in persistently infected cells, CMV maintains just the right amount of persistent low-level immune stimulation required for maintenance of TEM without triggering T cell exhaustion.
[072] Em certas modalidades, o coquetel de antígenos personalizados pode ser usado em um cenário de vacina terapêutica. Por exemplo, a vacina personalizada pode usar uma estratégia de agrupamento de k-médias para um conjunto definido de 6 a 10 sequências que fornecem cobertura muito satisfatória de epítopos em uma população de pessoas que estão infectadas com um patógeno altamente variável, como HIV. O vírus que infecta um indivíduo pode ser sequenciado e 2 ou 3 vacinas personalizadas serão aplicadas que melhor cobrem o vírus infectante. A cobertura de epítopo será otimizada enquanto inculpabilidade de epítopos serão minimizados entre a vacina e a cepa infectante.[072] In certain embodiments, the personalized antigen cocktail can be used in a therapeutic vaccine scenario. For example, the personalized vaccine may use a k-means clustering strategy for a defined set of 6 to 10 sequences that provide very satisfactory epitope coverage in a population of people who are infected with a highly variable pathogen such as HIV. The virus infecting an individual can be sequenced and 2 or 3 personalized vaccines will be administered that best cover the infecting virus. Epitope coverage will be optimized while epitope mismatches will be minimized between the vaccine and the infecting strain.
[073] Certas modalidades fornecidas incluem uma vacina contra HIV-1 que compreende um vetor de cadeia principal de HCMV, que é desprovido de certas regiões de gene de CMV e um antígeno epissenso de população. Em certas modalidades, a cadeia principal de HCMV pode ser desprovida da região de gene UL131A-128. Certas modalidades também podem incluir a deleção do gene da proteína tegumento pp71 (UL82). (Publicação de pedido de patente US nos 20140141038; 2008-0199493; 2013-0142823: e Publicação de Pedido internacional n° WO/2014/138209).[073] Certain embodiments provided include an HIV-1 vaccine comprising an HCMV backbone vector, which is devoid of certain CMV gene regions, and a population episense antigen. In certain embodiments, the HCMV backbone may be devoid of the UL131A-128 gene region. Certain embodiments may also include deletion of the pp71 tegument protein gene (UL82). (US Patent Application Publication Nos. 20140141038; 2008-0199493; 2013-0142823: and International Application Publication No. WO/2014/138209).
[074] Em certas modalidades, a presente revelação fornece vacinas que podem compreender uma segunda sequência de antígenos personalizada. Em certas modalidades, as vacinas podem compreender uma segunda, uma terceira ou mais sequências de antígenos personalizadas. O antígeno epissenso pode compreender a sequência de aminoácidos de SEQ ID NO: 691. O antígeno personalizado pode compreender a sequência de aminoácidos de SEQ ID NO: 692, SEQ ID NO: 693, SEQ ID NO: 694, SEQ ID NO: 695 ou SEQ ID NO: 696. Em uma modalidade, a primeira sequência de antígenos personalizada e a segunda sequência de antígenos personalizada compreendem duas das sequências de aminoácidos da SEQ ID NO: 692, SEQ ID NO: 693, SEQ ID NO: 694, SEQ ID NO: 695 e SEQ ID NO: 696. Em uma outra modalidade, a primeira sequência de antígenos personalizada, a segunda sequência de antígenos personalizada e a terceira sequência de antígenos personalizada compreendem três das sequências de aminoácidos da SEQ ID NO: 692, SEQ ID NO: 693, SEQ ID NO: 694, SEQ ID NO: 695 e SEQ ID NO: 696.[074] In certain embodiments, the present disclosure provides vaccines that may comprise a second personalized antigen sequence. In certain embodiments, vaccines may comprise a second, third, or more personalized antigen sequences. The episense antigen may comprise the amino acid sequence of SEQ ID NO: 691. The personalized antigen may comprise the amino acid sequence of SEQ ID NO: 692, SEQ ID NO: 693, SEQ ID NO: 694, SEQ ID NO: 695 or SEQ ID NO: 696. In one embodiment, the first custom antigen sequence and the second custom antigen sequence comprise two of the amino acid sequences of SEQ ID NO: 692, SEQ ID NO: 693, SEQ ID NO: 694, SEQ ID NO: 695 and SEQ ID NO: 696. In another embodiment, the first custom antigen sequence, the second custom antigen sequence and the third custom antigen sequence comprise three of the amino acid sequences of SEQ ID NO: 692, SEQ ID NO: 693, SEQ ID NO: 694, SEQ ID NO: 695 and SEQ ID NO: 696.
[075] Também são fornecidas sequências de antígenos personalizadas que podem compreender SEQ ID NO: 692, SEQ ID NO: 693, SEQ ID NO: 694, SEQ ID NO: 695 ou SEQ ID NO: 696.[075] Custom antigen sequences are also provided that may comprise SEQ ID NO: 692, SEQ ID NO: 693, SEQ ID NO: 694, SEQ ID NO: 695 or SEQ ID NO: 696.
[076] Em certas modalidades, as vacinas reveladas podem compreender adicionalmente um vetor de HCMV que compreende uma cadeia principal de HCMV e um antígeno personalizado selecionado para ser uma cepa de HIV-1 de melhor correspondência natural. Em uma outra modalidade, as vacinas reveladas podem compreender adicionalmente um vetor de HCMV que compreende uma cadeia principal de HCMV e um antígeno personalizado selecionado para ser uma cepa de HIV-1 diferente de melhor correspondência (e distante).[076] In certain embodiments, the disclosed vaccines may additionally comprise an HCMV vector comprising an HCMV backbone and a custom antigen selected to be a natural best match HIV-1 strain. In another embodiment, the disclosed vaccines may further comprise an HCMV vector comprising an HCMV backbone and a custom antigen selected to be a different best-match (and distant) HIV-1 strain.
[077] Em certas modalidades, o antígeno epissenso e o antígeno personalizado das vacinas reveladas podem ser derivados da proteína de Gag de HIV-1. Em uma outra modalidade, a proteína Gag do HIV-1 foi inativada eliminando- se uma sequência de miristoilação na terminação N da proteína Gag do HIV-1. Em uma outra modalidade, o antígeno epissenso e o antígeno personalizado podem ser derivados da proteína Pol ou Nef de HIV-1.[077] In certain embodiments, the episense antigen and personalized antigen of the disclosed vaccines may be derived from the HIV-1 Gag protein. In another embodiment, the HIV-1 Gag protein was inactivated by eliminating a myristoylation sequence at the N terminus of the HIV-1 Gag protein. In another embodiment, the episense antigen and the personalized antigen can be derived from the HIV-1 Pol or Nef protein.
[078] Em certas modalidades, métodos de tratamento de HIV-1 em um indivíduo que compreendem administrar uma quantidade eficaz de uma das vacinas reveladas ao indivíduo em necessidade da mesma. Em uma outra modalidade, são fornecidos métodos para projetar e produzir uma vacina contra HIV-1 para um indivíduo que compreende sequenciar vírus HIV-1 em um indivíduo, selecionar antígenos de vacina projetados para cobrir idealmente a densidade dentro de uma área geográfica e inserir os antígenos de vacina em um vetor.[078] In certain embodiments, methods of treating HIV-1 in an individual comprising administering an effective amount of one of the disclosed vaccines to the individual in need thereof. In another embodiment, methods are provided for designing and producing an HIV-1 vaccine for an individual comprising sequencing HIV-1 viruses in an individual, selecting vaccine antigens designed to ideally cover density within a geographic area, and inserting the vaccine antigens in a vector.
[079] Certas modalidades incluem métodos de tratamento de infecção por HIV-1 em um indivíduo que compreendem administrar uma quantidade eficaz de qualquer uma dessas vacinas reveladas ao indivíduo em necessidade das mesmas.[079] Certain modalities include methods of treating HIV-1 infection in an individual that comprise administering an effective amount of any of these disclosed vaccines to the individual in need thereof.
[080] Os exemplos a seguir são fornecidos para descrever as modalidades descritas no presente documento com mais detalhes. Os mesmos destinam-se a ilustrar, não limitar, as modalidades.[080] The following examples are provided to describe the modalities described in this document in more detail. They are intended to illustrate, not limit, the modalities.
[081] Todos os documentos, patente e pedidos de patente citados no presente documento estão aqui incorporados, a título de referência, e podem ser empregados na prática da invenção.[081] All documents, patents and patent applications cited in this document are incorporated herein, by way of reference, and may be used in the practice of the invention.
[082] A existência de um conjunto S = {s1 , s2 , . . . , sN } de N sequências alinhadas foi presumida. Cada sequência é uma cadeia de caracteres alfabéticos (correspondentes aos vinte aminoácidos, possivelmente além de alguns caracteres especiais correspondentes a lacunas, desconhecidos e tais). Visto que as sequências estão alinhadas, todas têm o mesmo comprimento T, e as posições t = 1 . . . T são bem definidos de sequência para sequência; sn [t] será escrito como o t’ésimo caractere na n’ésima sequência. É útil introduzir a notação s[t : u] para a subsequência de s que começa na posição t e termina na posição u.[082] The existence of a set S = {s1 , s2 , . . . , sN } of N aligned sequences was assumed. Each sequence is a string of alphabetic characters (corresponding to the twenty amino acids, possibly plus some special characters corresponding to gaps, unknowns, and such). Since the sequences are aligned, they all have the same length T, and positions t = 1. . . T are well defined from sequence to sequence; sn [t] will be written as the t’th character in the n’th sequence. It is useful to introduce the notation s[t : u] for the subsequence of s that begins at position t and ends at position u.
[083] Um potencial epítopo foi definido como uma sequência curta de k caracteres, tipicamente 8 a 12. Os epítopos de interesse são subsequências das sequências em S. De fato, uma sequência s pode ser concebida como uma lista de epítopos: e1 , . . . , eT -k+1, com et = s[t : t + k - 1]. Nota-se, entretanto, que para uma lista de epítopos que estão associados a uma sequência, é necessário que os epítopos sejam compatíveis. Especificamente, é necessário para qualquer par adjacente et e et+1 que os últimos k - 1 caracteres de et concordem cm os primeiros k - 1 caracteres de et+1; isto é: et [2 : k] = et+1 [1 : k - 1].[083] A potential epitope has been defined as a short sequence of k characters, typically 8 to 12. The epitopes of interest are subsequences of the sequences in S. In fact, a sequence s can be conceived as a list of epitopes: e1, . . . , eT -k+1, with et = s[t : t + k - 1]. Note, however, that for a list of epitopes that are associated with a sequence, it is necessary that the epitopes are compatible. Specifically, it is necessary for any adjacent pair et and et+1 that the last k - 1 characters of et agree with the first k - 1 characters of et+1; that is: et [2 : k] = et+1 [1 : k - 1].
[084] Para cada epítopo e, uma frequência f (e) à qual pode estar associado conta a fração de sequências em S para que o epítopo apareça.[084] For each epitope e, a frequency f (e) with which it can be associated counts the fraction of sequences in S for the epitope to appear.
[085] Para o problema de coquetel geral, um conjunto de sequências artificiais Q = {q1 , . . . , qM } é necessário cujos epítopos têm propriedades úteis. Permitir que EQ seja o conjunto de todos os epítopos que aparecem em Q; isto é: EQ = {e | e = qm [t : t + k - 1] para alguma escolha de m, t}.[085] For the general cocktail problem, a set of artificial sequences Q = {q1, . . . , qM } is necessary whose epitopes have useful properties. Let EQ be the set of all epitopes that appear in Q; that is: EQ = {e | e = qm [t : t + k - 1] for some choice of m, t}.
[086] Em particular, aqueles epítopos foram projetados para cobrir o máximo possível o conjunto de sequência S. O objetivo era otimizar a pontuação de cobertura ∑ f (e) em que a soma é mais de e ∈EQ[086] In particular, those epitopes were designed to cover as much of the sequence set S as possible. The goal was to optimize the coverage score ∑ f (e) where the sum is more than e ∈EQ
[087] Com M < N , e tipicamente M « N , nenhum epítopo, em geral, pode ser coberto.[087] With M < N, and typically M « N, no epitope, in general, can be covered.
[088] Para o problema de sequência alinhada, algumas simplificações podem ser feitas. Nesse caso, cada posição no alinhamento foi tratada como u m problema diferente (porém não independente). A função de frequência agora depende da posição: f (t, e) era o número de sequências em S para que e seja a subsequência de k-unidades de repetição que começou na posição t; dessa forma, f (t, e) = ∑ I (e = sn [t : t + k - 1])[088] For the aligned sequence problem, some simplifications can be made. In this case, each position in the alignment was treated as a different (but not independent) problem. The frequency function now depends on position: f(t, e) was the number of sequences in S so that e is the subsequence of k-repeat units that started at position t; thus, f (t, e) = ∑ I (e = sn [t : t + k - 1])
[089] em que I é a função de indicador: é um se seu argumento for verdadeiro, e é zero de outro modo. O conjunto EQ também pode ser particionado de acordo com a posição em sequências q. Dessa forma: EQ [t] = {e | e = qm [t : t + k - 1] para m}[089] where I is the indicator function: it is one if its argument is true, and it is zero otherwise. The EQ set can also be partitioned according to position in q sequences. Thus: EQ [t] = {e | e = qm [t : t + k - 1] for m}
[090] Isso permite a produção de uma medição de cobertura para cada posição c[t] = ∑ eeEQ [t] f(t,e), a partir da qual uma cobertura total é dada por c = ∑t c[t].[090] This allows the production of a coverage measurement for each position c[t] = ∑ eeEQ [t] f(t,e), from which a total coverage is given by c = ∑t c[t].
[091] Para o caso especial trivial k = 1, os epítopos eram apenas os caracteres de aminoácido. Porém, mesmo que o problema fosse comum para resolver, a solução ainda era útil. Para M = 1, a melhor solução é dada pela sequência de consenso, com q1 [t] selecionado para ser o aminoácido que é mais comum na posição t. Para M = 2, alguém pode otimizar a cobertura considerando-se que q2 [t] seja o segundo aminoácido mais comum na posição t. E assim por diante para M maior.[091] For the trivial special case k = 1, the epitopes were just the amino acid characters. However, even if the problem was common to solve, the solution was still useful. For M = 1, the best solution is given by the consensus sequence, with q1 [t] selected to be the amino acid that is most common at position t. For M = 2, one can optimize coverage by assuming that q2 [t] is the second most common amino acid at position t. And so on for M major.
[092] Para k > 1, o problema se torna não trivial, pois os epítopos se sobrepõem, e então cada c[t] não pode mais ser independentemente otimizado. O caso M = 1 era chamado o problema de “epissenso”, pois é como o consenso, exceto que é um consenso de epítopos que foi solicitado.[092] For k > 1, the problem becomes non-trivial, as the epitopes overlap, and then each c[t] can no longer be independently optimized. The M = 1 case was called the “episense” problem, because it is like the consensus, except that it is a consensus of epitopes that was requested.
[093] Em um exemplo, o consenso e o epissenso k = 3 discordam: O consenso usou a letra mais popular em cada posição. O epissenso usou o “epítopo” mais popular, em que se chama um potencial epítopo de uma cadeia de 3 caracteres. A Tabela 1 expande esse exemplo para ilustrar a sobreposição de cadeias de epítopos.[093] In one example, the consensus and the k = 3 episense disagree: The consensus used the most popular letter in each position. Episense used the most popular “epitope”, which is a potential epitope of a 3-character string. Table 1 expands this example to illustrate overlapping epitope chains.
[094] Tabela 1: São mostradas seis sequências e seus epítopos associados k = 3. A linha inferior mostra as sequências consenso (formadas a partir do caractere mais comum em cada posição) e os epítopos mais comuns em cada posição. Porém esses epítopos (em particular, EFG e CHS) são incompatíveis uns com os outros, assim os mesmos não podem ser combinados em uma única solução epissenso. Nesse caso, a melhor pontuação epissenso é dada (embora não exclusivamente) pela sequência ARCHSLM [SEQ ID NO: 794], que cobre 1+1+2+2+3=9 dentre 30 epítopos possíveis nas sequências. O consenso, ARCGSLM [SEQ ID NO: 799], cobre 1+1+1+1+3=7. Nota-se que um limite superior sobre essa pontuação pode ser obtido a partir da frequência dos epítopos mais populares em cada posição: nesse caso, que dá 2+2+2+2+3=11 [094] Table 1: Six sequences and their associated k = 3 epitopes are shown. The bottom line shows the consensus sequences (formed from the most common character in each position) and the most common epitopes in each position. However, these epitopes (in particular, EFG and CHS) are incompatible with each other, so they cannot be combined in a single episense solution. In this case, the best episense score is given (although not exclusively) by the sequence ARCHSLM [SEQ ID NO: 794], which covers 1+1+2+2+3=9 out of 30 possible epitopes in the sequences. The consensus, ARCGSLM [SEQ ID NO: 799], covers 1+1+1+1+3=7. Note that an upper limit on this score can be obtained from the frequency of the most popular epitopes at each position: in this case, that gives 2+2+2+2+3=11
[095] Resolvendo o problema de epissenso. O caso M=1 foi abordado primeiro, em que uma única sequência q cujos epítopos cobrem idealmente os epítopos em uma lista de sequências não alinhadas S foi solicitada. O algoritmo EpiGraph sob suposições adequadas alcança a solução ideal. Nas comparações, o algoritmo de consenso também foi considerado (muito simples e rápido) e a otimização por algoritmo genético (muito lento) conforme descrito em (Fisher, Nat Med. 2007 Jan;13(1):100-6, incorporado no presente documento, a título de referência). O algoritmo EpiGraph é ilustrado nas Figuras 1A e 1B.[095] Solving the episense problem. The M=1 case was addressed first, in which a single sequence q whose epitopes ideally cover the epitopes in a list of unaligned sequences S was requested. The EpiGraph algorithm under suitable assumptions achieves the optimal solution. In the comparisons, the consensus algorithm was also considered (very simple and fast) and the genetic algorithm optimization (very slow) as described in (Fisher, Nat Med. 2007 Jan;13(1):100-6, incorporated herein document, for reference purposes). The EpiGraph algorithm is illustrated in Figures 1A and 1B.
[096] Em seguida, considerou-se o problema do coquetel mais comum de vacinas, com M> 1 e mostrou como o algoritmo de epissenso foi modificado para este problema mais comum.[096] Next, the problem of the most common vaccine cocktail, with M> 1, was considered and showed how the episense algorithm was modified for this most common problem.
[097] A Figura 2 mostra nós de um gráfico de epítopo, em que cada nó inclui a cadeia de k caracteres de epítopo, e a frequência (f) que o epítopo é observado na posição no conjunto de sequências alinhadas, e a melhor pontuação cumulativa S de trajetórias compatíveis que terminam naquele nó. Os nós foram dispostos em colunas com cada coluna correspondente à posição t associada ao epítopo. As linhas que conectam esses nós correspondem a epítopos adjacentes que eram compatíveis. O objetivo é encontrar uma trajetória compatível através desse gráfico que maximize a soma dos valores de frequência em cada nó.[097] Figure 2 shows nodes of an epitope graph, where each node includes the k epitope string, and the frequency (f) that the epitope is observed at the position in the set of aligned sequences, and the best score cumulative S of compatible trajectories ending at that node. Nodes were arranged in columns with each column corresponding to the t position associated with the epitope. The lines connecting these nodes correspond to adjacent epitopes that were compatible. The objective is to find a compatible trajectory through this graph that maximizes the sum of frequency values at each node.
[098] As linhas mais grossas na Figura 2 mostram uma trajetória que resulta em uma pontuação total ideal. Sempre haverá pelo menos uma tal trajetória, porém pode não ser exclusiva.[098] The thicker lines in Figure 2 show a trajectory that results in an ideal total score. There will always be at least one such trajectory, but it may not be exclusive.
[099] A pontuação cumulativa S(t, e) foi definida como a maior pontuação possível começando em t = 1 e terminando no epítopo e na posição t. Foi observado que S(t = 1, e) = f (e) e que os valores de t > 1 podem ser recursivamente computados: S(t, e) = f (e) + maxe’ S(t - 1, e’ ), com e’ ∈E(t-1,e)[099] The cumulative score S(t, e) was defined as the highest possible score starting at t = 1 and ending at the epitope and position t. It was observed that S(t = 1, e) = f (e) and that the values of t > 1 can be recursively computed: S(t, e) = f (e) + maxe' S(t - 1, e ' ), with e' ∈E(t-1,e)
[0100] em que E (t - 1, e) é o conjunto de epítopos na posição t - 1 que são compatíveis com e, que está na posição t. Tendo computada esta pontuação cumulativa para todos os epítopos, a pontuação total foi encontrada para a melhor trajetória como a pontuação máxima na última coluna: Smax = maxe S(T - k + 1, e). Além disso, a mesma pode ser operada para trás a partir desse máximo para encontrar a trajetória ideal: e*T -k+1 = argmaxe S(T - k + 1, e) e*t-i = argmaxe' S(t - 1, e’) com e’∈E(t-1,e* t)[0100] where E (t - 1, e) is the set of epitopes at position t - 1 that are compatible with e, which is at position t. Having computed this cumulative score for all epitopes, the total score was found for the best trajectory as the maximum score in the last column: Smax = maxe S(T - k + 1, e). Furthermore, it can be operated backwards from this maximum to find the ideal trajectory: e*T -k+1 = argmaxe S(T - k + 1, e) e*t-i = argmaxe' S(t - 1 , e') with e'∈E(t-1,e* t)
[0101] A sequência e*1, e*2, . . . , e*T-k definiu a sequência de epítopos compatíveis com a maior pontuação. A cadeia epissenso q é obtida retirando-se o primeiro caractere de cada epítopo: q[t] = et*[1], e terminando com o último epítopo: q[T - k : T ] = e Tk [1 : k].[0101] The sequence e*1, e*2, . . . , e*T-k defined the sequence of epitopes compatible with the highest score. The episense string q is obtained by removing the first character of each epitope: q[t] = et*[1], and ending with the last epitope: q[T - k : T ] = e Tk [1 : k] .
[0102] O operador argmax pode não ter um valo exclusivo; se não tiver então haverá várias soluções para o problema de epissenso, todas as quais são ideais no sentido de cobertura.[0102] The argmax operator may not have a unique value; if not then there will be several solutions to the episense problem, all of which are ideal in the sense of coverage.
[0103] Lacunas. Para alinhar as sequências, inserções e deleções têm de ser abordadas e isso introduz lacunas nas sequências alinhadas. Por exemplo, as sequências ARCCDEGH [SEQ ID NO: 806] e ARCDEFGH [SEQ ID NO: 807] estavam melhor alinhadas como ARCCDE-GH [SEQ ID NO: 808] e ARC-DEFGH [SEQ ID NO: 809]. Epítopos marcadores de posição foram desenvolvidos para lidar com essas lacunas no algoritmo EpiGraph.[0103] Gaps. To align sequences, insertions and deletions have to be addressed and this introduces gaps in the aligned sequences. For example, the sequences ARCCDEGH [SEQ ID NO: 806] and ARCDEFGH [SEQ ID NO: 807] were best aligned as ARCCDE-GH [SEQ ID NO: 808] and ARC-DEFGH [SEQ ID NO: 809]. Placeholder epitopes were developed to address these gaps in the EpiGraph algorithm.
[0104] Epítopos Marcadores de Posição: Os epítopos k = 3 eram ARC, RCC, CCD, CDE, DEG, EGH e ABC, BCD, CDE, DEF, EFG, FGH respectivamente; porém quando os epítopos foram alinhados pela primeira coluna lacunas precisam ser introduzidas naquela lista: ABC, BCC, CCD, CDE, DEG, EGH, -GH e ABC, BCD, CDE, -DE, DEF, EFG, FGH. As cadeias -GH e -DE eram epítopos marcadores de posição. Marcadores de posição não são contados na função de cobertura; isto é: f(t; -XY) = 0. Porém, os mesmos ainda eram úteis devido ao fato de poderem ser usados para definir a consistência de epítopos adjacentes.[0104] Position Marker Epitopes: The k = 3 epitopes were ARC, RCC, CCD, CDE, DEG, EGH and ABC, BCD, CDE, DEF, EFG, FGH respectively; however, when the epitopes were aligned by the first column, gaps need to be introduced in that list: ABC, BCC, CCD, CDE, DEG, EGH, -GH and ABC, BCD, CDE, -DE, DEF, EFG, FGH. The -GH and -DE chains were position marker epitopes. Placeholders are not counted in the coverage function; that is: f(t; -XY) = 0. However, they were still useful due to the fact that they could be used to define the consistency of adjacent epitopes.
[0105] Para sequências sem lacunas, dois epítopos adjacentes foram considerados compatíveis se os últimos caracteres k - 1 do primeiro epítopo concordarem com os primeiros caracteres k - 1 do segundo epítopo. Dessa forma, ABC e BCD são compatíveis, porém BCC e CDE não são. Quando lacunas forem introduzidas, então, um par é compatível se o segundo epítopo começar com um caractere com lacunas for considerado, e os caracteres k - 1 restantes correspondem aos últimos caracteres k - 1 do último epítopo. Dessa forma, CDE e - DE são compatíveis.[0105] For sequences without gaps, two adjacent epitopes were considered compatible if the last k - 1 characters of the first epitope agreed with the first k - 1 characters of the second epitope. Thus, ABC and BCD are compatible, but BCC and CDE are not. When gaps are introduced, then a pair is compatible if the second epitope starting with a gapped character is considered, and the remaining k - 1 characters match the last k - 1 characters of the last epitope. Thus, CDE and -DE are compatible.
[0106] Para o algoritmo “drop-in-place”, uma sequência de “substrato” que é geralmente considerada a sequência consenso foi usada. Então, todos os epítopos em todas as posições foram adotados e classificados de acordo com a forma na qual os mesmos aparecem. Começando a partir do epitopo menos frequente, cada epítopo foi depositado no substrato substituindo-se os caracteres no substrato nas posições [t: t + k - 1] pelos caracteres no epitopo. Quando o epítopo mais frequentemente ocorrente foi depositado sobre o substrato, uma cadeia foi usada como a solução de epissenso q. Visto que os epítopos mais frequentes sobrescrevem os epítopos mais raros, maior cobertura de epítopo foi obtida. E uma vez que uma única seqüência q é sempre atualizada, a solução final será composta de epítopos compatíveis.[0106] For the “drop-in-place” algorithm, a “substrate” sequence that is generally considered the consensus sequence was used. Then, all epitopes in all positions were adopted and classified according to the form in which they appear. Starting from the least frequent epitope, each epitope was deposited on the substrate by replacing the characters on the substrate at positions [t: t + k - 1] with the characters on the epitope. When the most frequently occurring epitope was deposited on the substrate, one chain was used as the q episense solution. Since more frequent epitopes overwrite rarer epitopes, greater epitope coverage was achieved. And since a single q sequence is always updated, the final solution will be composed of compatible epitopes.
[0107] O algoritmo pode não ser totalmente determinístico, pois alguns epítopos podem ter frequências idênticas e, se suas posições estiverem sobrepostas, então o resultado final pode depender da ordem em que são depositados. Na implementação, a ordem que o algoritmo de classificação concede é adotada, mas há uma oportunidade de randomizar essas ordens e fazer múltiplas execuções do algoritmo, com algumas execuções possivelmente dando maiores pontuações.[0107] The algorithm may not be fully deterministic, as some epitopes may have identical frequencies, and if their positions are overlapping, then the final result may depend on the order in which they are deposited. In implementation, the order that the ranking algorithm awards is adopted, but there is an opportunity to randomize these orders and do multiple runs of the algorithm, with some runs possibly giving higher scores.
[0108] Algoritmo “drop-in-place” heurístico. Nesse algoritmo, uma sequência de “substratos” foi adotada como a sequência consenso, porém a seleção de substrato raramente faz qualquer diferença. Todos os epítopos em todas as posições foram adotados e classificados de acordo com a forma na qual os mesmos aparecem. Começando a partir do epítopo menos frequente.[0108] Heuristic “drop-in-place” algorithm. In this algorithm, a “substrate” sequence was adopted as the consensus sequence, but substrate selection rarely makes any difference. All epitopes in all positions were adopted and classified according to the form in which they appear. Starting from the least frequent epitope.
[0109] Cada epítopo foi “depositado” sobre o substrato substituindo-se os caracteres no substrato nas posições [t : t + k - 1] pelos caracteres no epítopo. Quando o epítopo mais frequentemente ocorrente foi finalmente depositado sobre o substrato, havia uma cadeia que foi usada como solução de epissenso q. Visto que os epítopos mais frequentes sobrescrevem os epítopos mais raros, uma grande cobertura de epítopo foi obtida. Uma vez que uma única seqüência q sempre estava sendo atualizada, a solução final era composta de epítopos compatíveis.[0109] Each epitope was “deposited” on the substrate by replacing the characters on the substrate at positions [t : t + k - 1] with the characters on the epitope. When the most frequently occurring epitope was finally deposited onto the substrate, there was a chain that was used as the q episense solution. Since the most frequent epitopes overwrite the rarest epitopes, a large epitope coverage was obtained. Since a single q sequence was always being updated, the final solution was composed of compatible epitopes.
[0110] O algoritmo pode não ser totalmente determinístico, pois alguns epítopos podem ter frequências idênticas e, se suas posições estiverem sobrepostas, então o resultado final pode depender da ordem em que são depositados. Na implementação, a ordem que o algoritmo de classificação concede é adotada, mas há uma oportunidade de randomizar essas ordens e fazer múltiplas execuções do algoritmo, com algumas execuções possivelmente dando maiores pontuações. A utilidade dessa abordagem de múltiplas execuções randomizadas não foi investigada.[0110] The algorithm may not be fully deterministic, as some epitopes may have identical frequencies, and if their positions overlap, then the final result may depend on the order in which they are deposited. In implementation, the order that the ranking algorithm awards is adopted, but there is an opportunity to randomize these orders and do multiple runs of the algorithm, with some runs possibly giving higher scores. The utility of this randomized multiple-run approach has not been investigated.
[0111] A solução depende apenas dos epítopos mais frequentes em cada posição, então, por exemplo na Tabela 1, será uma combinação compatível de DEF, EFG, CHJ, HJL, JLM. Se forem depositados nessa ordem (os quatro primeiros têm freqüência 2, o último tem freqüência 3), DECHJLM [SEQ ID NO: 810] é obtido para que a pontuação 0+0+2+2+3=7 supere o consenso, porém é menos que ideal. Se os mesmas forem depositados na ordem HJL, CHJ, EFG, DEF, JLM, DEFGJLM [SEQ ID NO: 811] poderia ser obtido com uma pontuação de 2+2+1+1+3=9, que é a pontuação ideal para esse exemplo. Essas duas soluções são ilustradas na Figura 3.[0111] The solution depends only on the most frequent epitopes at each position, so, for example in Table 1, it will be a compatible combination of DEF, EFG, CHJ, HJL, JLM. If they are deposited in this order (the first four have frequency 2, the last one has frequency 3), DECHJLM [SEQ ID NO: 810] is obtained so that the score 0+0+2+2+3=7 exceeds the consensus, but is less than ideal. If they are deposited in the order HJL, CHJ, EFG, DEF, JLM, DEFGJLM [SEQ ID NO: 811] could be obtained with a score of 2+2+1+1+3=9, which is the ideal score for this example. These two solutions are illustrated in Figure 3.
[0112] O problema de coquetel alinhado de vacinas (M > 1). Na solução de mosaico original, utilizando a otimização do algoritmo genético, todas os M das sequências de mosaico são otimizados ao mesmo tempo.[0112] The aligned vaccine cocktail problem (M > 1). In the original mosaic solution using genetic algorithm optimization, all M mosaic sequences are optimized at the same time.
[0113] Soluções sequenciais. Uma maneira de estender as soluções de epissenso M = 1 para o problema M > 1 é modificar os algoritmos para otimizar a cobertura total de modo a otimizar a cobertura complementar. Isto é: dada uma solução de episódios q1, encontrar q2 que cobre o maior número possível dos epítopos restantes, não cobertos por q1.[0113] Sequential solutions. One way to extend the M = 1 episense solutions to the M > 1 problem is to modify the algorithms to optimize full coverage in order to optimize complementary coverage. That is: given a solution of episodes q1, find q2 that covers as many of the remaining epitopes as possible, not covered by q1.
[0114] Refinamento iterativo de soluções sequenciais. Dadas as soluções iniciais qi, q2,..., qM, uma nova estimativa para qi pode ser recomputada. Isso é feito começando com os valores de frequência originais para cada um dos epítopos, porém ajustando para zero aqueles epítopos que são cobertos por q2,..., qM. A otimização desse problema de cobertura complementar resulta em um novo qi. Pode-se percorrer todas as soluções iniciais dessa forma, cada vez otimizando a cobertura complementar.[0114] Iterative refinement of sequential solutions. Given the initial solutions qi, q2,..., qM, a new estimate for qi can be recomputed. This is done by starting with the original frequency values for each of the epitopes, but setting to zero those epitopes that are covered by q2,..., qM. Optimizing this complementary coverage problem results in new qi. You can go through all the initial solutions this way, each time optimizing the complementary coverage.
[0115] Pontuação off-by-one. A análise mostrada até agora valoriza a cobertura apenas se um epítopo em uma sequência s for exatamente correspondido por um epítopo em uma sequência q. Mas, particularmente para epítopos mais longos, por exemplo, k = 12, um epítopo em uma sequência pode ainda ser eficaz se for uma correspondência aproximada. Por exemplo, uma concordância em ii dos i2 caracteres pode constituir uma cobertura satisfatória.[0115] Off-by-one scoring. The analysis shown so far values coverage only if an epitope in a sequence s is exactly matched by an epitope in a sequence q. But particularly for longer epitopes, e.g. k = 12, an epitope in a sequence may still be effective if it is a close match. For example, a concordance in ii of i2 characters may constitute satisfactory coverage.
[0116] Resultados. Esses algoritmos foram comparados usando um conjunto de dados de 690 sequências.[0116] Results. These algorithms were compared using a dataset of 690 sequences.
[0117] A Figura 4 ilustra o aspecto do gráfico para tal conjunto de dados grande. A Figura 4 mostra o gráfico associado a um conjunto de dados de 690 sequências de proteínas Gag de clado B US [SEQ ID NOs. 1 a 690), cada uma alinhada a 556 posições. Os resultados são mostrados na Tabela 2. O eixo horizontal é a posição t, e as colunas de nós indicam os epítopos diferentes em cada posição. Os nós foram dispostos de modo que os mais frequentes fiquem na parte inferior. Os nós e bordas (indicando compatibilidade de nós adjacentes) são mostrados. O gráfico completo é mostrado em (a); uma inserção de perto do mesmo gráfico é mostrada em (b).[0117] Figure 4 illustrates what the graph would look like for such a large data set. Figure 4 shows the graph associated with a data set of 690 US clade B Gag protein sequences [SEQ ID NOs. 1 to 690), each aligned to 556 positions. The results are shown in Table 2. The horizontal axis is the t position, and the columns of nodes indicate the different epitopes at each position. The nodes were arranged so that the most frequent are at the bottom. Nodes and edges (indicating compatibility of adjacent nodes) are shown. The complete graph is shown in (a); a close-up inset of the same graph is shown in (b).
[0118] A Tabela 2 mostra uma comparação entre as pontuações de cobertura; essa é a fração dos epítopos (k = 12) nas sequências S que são cobertas (por correspondência exata) pelos epítopos nas sequências de vacina Q = {qi,...,qM}. TABELA 2 [0118] Table 2 shows a comparison between coverage scores; this is the fraction of the epitopes (k = 12) in the S sequences that are covered (by exact match) by the epitopes in the vaccine sequences Q = {qi,...,qM}. TABLE 2
[0119] Para as soluções de EpiGraph global, as melhores sequências EpiGraph foram determinadas com base nas sequências de banco de dados de grupo M, clado B e clado C (incluindo até aproximadamente 2015), bem como a segunda sequência EpiGraph complementar para uma vacina bivalente para Gag, Pol e Nef. Uma vantagem inovadora do código EpiGraph sobre o projeto de mosaico é que permite a exclusão deliberada de epítopos raros, uma característica incluída no desenho das novas sequências, consulte a figura abaixo para um exemplo do impacto de excluir variantes raras do grupo M. A Figura 5A a C ilustra os valores finais de EpiGraph e vacinas Personalizadas que foram usadas.[0119] For the global EpiGraph solutions, the best EpiGraph sequences were determined based on group M, clade B, and clade C database sequences (including up to approximately 2015), as well as the second complementary EpiGraph sequence for a vaccine bivalent for Gag, Pol and Nef. An innovative advantage of the EpiGraph code over the mosaic design is that it allows for the deliberate exclusion of rare epitopes, a feature included in the design of the new sequences. See the figure below for an example of the impact of excluding rare group M variants. Figure 5A C illustrates the final EpiGraph values and Custom vaccines that were used.
[0120] Um conjunto S = {s1 , s2 , . . . , sN } de N sequências de proteínas desalinhadas é adotado para caracterizar a variabilidade de um vírus sobre uma população alvo (por exemplo um clado filogenético, nacional ou global). Um epítopo potencial é uma subsequência de k aminoácidos (tipicamente k = 9). Cada epítopo potencial, e, é atribuído a uma frequência de número inteiro f(e) correspondente ao número de sequências em S em que e aparece. O problema monovalente é projetar uma única sequência artificial q que assemelha-se a uma proteína natural mas cobre idealmente os epítopos potenciais na população S. Escrevendo-se E (q) como o conjunto de epítopos que aparecem em q, a medição de cobertura é [0120] A set S = {s1 , s2 , . . . , sN } of N unaligned protein sequences is adopted to characterize the variability of a virus over a target population (e.g. a phylogenetic clade, national or global). A potential epitope is a subsequence of k amino acids (typically k = 9). Each potential epitope, e, is assigned an integer frequency f(e) corresponding to the number of sequences in S in which e appears. The monovalent problem is to design a single artificial sequence q that resembles a natural protein but ideally covers the potential epitopes in population S. Writing E(q) as the set of epitopes that appear in q, the coverage measurement is
[0121] O numerador é a soma das frequências de epítopos que aparecem em q, e o denominador é normalizado pela soma em todos os epítopos que aparecem em qualquer uma das sequências em S. Essa formulação pode ser expressada como um gráfico direcionado. Cada nó no gráfico corresponde a um epítopo diferente e, e uma borda direcionada conecta dois epítopos de comprimento- k (ea; eb) se aqueles epítopos se sobreporem por k-1 caracteres. Uma trajetória através do gráfico é uma sequência de nós ei, 62, ..., 6L, com uma borda de ei a eM para i = 1, ..., L-1. Tal trajetória corresponde a uma sequência de L+k-1 caracteres, que é o antígeno artificial q.[0121] The numerator is the sum of the frequencies of epitopes appearing in q, and the denominator is normalized by the sum across all epitopes appearing in any of the sequences in S. This formulation can be expressed as a directed graph. Each node in the graph corresponds to a different epitope, and a directed edge connects two epitopes of length k (ea; and b) if those epitopes overlap by k-1 characters. A trajectory through the graph is a sequence of nodes ei, 62, ..., 6L, with an edge from ei to eM for i = 1, ..., L-1. This trajectory corresponds to a sequence of L+k-1 characters, which is the artificial antigen q.
[0122] Se esse gráfico direcionado não tiver ciclos, então, EpiGraph encontra uma trajetória através do gráfico que maximiza rigorosamente a cobertura, fornecendo a solução ideal. Além disso, essa otimização é feita com esforço computacional que é escalonada apenas linearmente com o tamanho (como medido em nós e bordas) do gráfico. Na prática, o gráfico direcionado criado a partir de S pode não ser acíclico, embora muitas vezes quase seja, especialmente para valores maiores de k. Para esse caso, o gráfico foi “desciclado”, identificando-se iterativamente ciclos e, então, removendo-se as bordas de baixo valor até não haver ciclos.[0122] If this directed graph has no cycles, then EpiGraph finds a trajectory through the graph that rigorously maximizes coverage, providing the optimal solution. Furthermore, this optimization is done with computational effort that scales only linearly with the size (as measured in nodes and edges) of the graph. In practice, the directed graph created from S may not be acyclic, although it often almost is, especially for larger values of k. For this case, the graph was “uncycled” by iteratively identifying cycles and then removing low-value edges until there were no cycles.
[0123] Um “coquetel” polivalente de m > 1 antígenos pode ser criado executando-se EpiGraph sequencialmente, e otimizando-se a cobertura de epítopo complementar. Isso é realizado tratando-se os epítopos e que estavam incluídos nos primeiros antígenos como se suas frequências fossem zero e, então, executando-se Epigraph nessas frequências modificadas. Se for exigido que qualquer um dos epítopos nos primeiros antígenos complete uma trajetória (e gere uma proteína completa), os mesmos ainda estarão disponíveis, porém os mesmos serão desfavorecidos, visto que não contribuem mais para a pontuação de cobertura. Essa solução sequencial pode ser aprimorada usando refinamento iterativo.[0123] A multipurpose “cocktail” of m > 1 antigens can be created by running EpiGraph sequentially, and optimizing complementary epitope coverage. This is accomplished by treating the epitopes that were included in the first antigens as if their frequencies were zero and then running Epigraph on those modified frequencies. If any of the epitopes on the first antigens are required to complete a trajectory (and generate a complete protein), they will still be available, but they will be disadvantaged, as they no longer contribute to the coverage score. This sequential solution can be improved using iterative refinement.
[0124] Embora não seja viável construir uma vacina projetada para cada indivíduo, é viável sequenciar o vírus daquele indivíduo para tentar obter uma correspondência satisfatória de dentro de um pequeno conjunto de referências de opções de vacina. Primeiramente considerou-se uma população de teste de clado B baseado em US, concentrando-se na proteína Gag. Um conjunto de vacinas de referência baseado na África do Sul e um conjunto de vacinas global foram projetados, bem como um desenho de clado B baseado em US atualizado. p24 é a subproteína mais altamente conservada em Gag e pode ser excisada da proteína Gag maior para fornecer uma região conservada de ~230 aminoácidos de comprimento. Uma abordagem de região conservada também foi considerada como uma alternativa para Gag, talvez concentrando-se em regiões em Gag e Pol, possivelmente incluindo a extensão conservada de Nef bem como quaisquer outras proteínas de interesse.[0124] Although it is not feasible to construct a vaccine designed for every individual, it is feasible to sequence that individual's virus to attempt to obtain a satisfactory match from within a small reference set of vaccine options. We first considered a US-based clade B test population, focusing on the Gag protein. A South African-based reference vaccine pool and a global vaccine pool were designed, as well as an updated US-based clade B design. p24 is the most highly conserved subprotein in Gag and can be excised from the larger Gag protein to provide a conserved region ~230 amino acids in length. A conserved region approach has also been considered as an alternative to Gag, perhaps focusing on regions in Gag and Pol, possibly including the conserved extension of Nef as well as any other proteins of interest.
[0125] Esta é uma questão de otimização muito diferente da tentativa de projetar um conjunto que fornece cobertura de população ideal para uma vacina profilática. No caso profiláctico, não se sabe que vírus podem ser encontrados pelo vacinado. Em caso terapêutico, a sequência viral infectante pode ser obtida e combinada.[0125] This is a very different optimization question than trying to design a set that provides optimal population coverage for a prophylactic vaccine. In the prophylactic case, it is not known which viruses may be encountered by the vaccinated person. In therapeutic case, the infecting viral sequence can be obtained and combined.
[0126] A otimização foi feita considerando-se duas coisas: primeiro, maximizar as correspondências de vírus infectantes de um sujeito e, segundo, minimizar as incompatibilidades para que a resposta à vacina seja o mais direcionada possível nos epítopos relativos.[0126] The optimization was done considering two things: first, maximizing a subject's infecting virus matches and, second, minimizing mismatches so that the vaccine response is as targeted as possible on relative epitopes.
[0127] A filogenia dentro dos principais clados do HIV tende a ter uma estrutura pouca clara. Em vez disso, é um “starburst” com ramificações externas muito longas, e ramificações internas mal definidas muito curtas perto da base. Parte dessa estrutura provavelmente se deve à recombinação intra-subtipo. Embora seja difícil quantificar, a recombinação certamente está ocorrendo com relativa frequência e, por analogia com o que é visto em termos de recombinação inter-subtipo, é provável que seja extensa. Dada a estrutura da árvore, simplesmente usando agrupamento em uma árvore filogênica para definir o conjunto de referências de possíveis vacinas não será tão eficaz, pois as associações dentro do clado têm significado limitado a partir de uma "perspectiva de epítopo". Em vez disso, as relações de sequência deveriam ser consideradas pela medição relativa, e o conjunto de referências deveria ser selecionado com base em potenciais similaridades de epítopos entre cepas naturais e supostos projetos de vacina.[0127] The phylogeny within the main HIV clades tends to have an unclear structure. Instead, it is a “starburst” with very long outer branches, and very short, ill-defined inner branches near the base. Part of this structure is likely due to intra-subtype recombination. Although difficult to quantify, recombination is certainly occurring relatively frequently and, by analogy with what is seen in terms of inter-subtype recombination, is likely to be extensive. Given the structure of the tree, simply using clustering on a phylogenetic tree to define the reference set of potential vaccines will not be as effective, as associations within the clade have limited meaning from an "epitope perspective". Instead, sequence relationships should be considered by relative measurement, and the reference set should be selected based on potential epitope similarities between natural strains and putative vaccine designs.
[0128] 12-unidades de repetição foram otimizadas considerando epítopos de classe II, porém o código pode usar qualquer comprimento k-unidades de repetição como um ponto de referência, em que k é o suposto comprimento de epítopo potencial. 9-unidades de repetição também foram usadas. No trabalho anterior com os mosaicos, a solução ideal para 9-unidades de repetição era quase ideal para outros comprimentos próximos (8, 10, 11, 12), e que se espera que transite com os novos algoritmos descritos aqui. 9 unidades de repetição foram usadas para certos conjuntos de vacinas personalizadas revelados no presente documento.[0128] 12-repeat units were optimized considering class II epitopes, however the code can use any length k-repeat units as a reference point, where k is the supposed potential epitope length. 9-repeat units were also used. In previous work with mosaics, the ideal solution for 9-repeating units was almost ideal for other nearby lengths (8, 10, 11, 12), and is expected to carry over to the new algorithms described here. 9 repeat units were used for certain sets of personalized vaccines disclosed herein.
[0129] Idealmente foi definido em termos de cobertura de k-unidades de repetição. Isso é definido substituindo-se cada sequência por um “saco de epítopos”, isto é, uma lista desordenada de todos as k-unidades de repetição que aparecem na sequência. Um saco de epítopos pode ser definida para um conjunto de sequências fazendo uma lista de todas as k-unidades de repetição que aparecem em qualquer uma das sequências no conjunto. A cobertura de uma dada sequência S por um conjunto de sequências Q={qi,q2,...,qN} é fornecida pela fração de epítopos no saco de S que também estão na bolsa coletiva das sequências Q, em que Q deve ser uma combinação polivalente em um coquetel de vacina. Essa cobertura que foi otimizada. Uma outra quantidade de interesse era a fração de epítopos no saco de Q que não estão no saco de S. Embora não sejam (atualmente) usados diretamente na otimização, uma fração menor desses epítopos estranhos é preferida, e esses números são calculados para comparações e projeto experimental.[0129] Ideally it was defined in terms of coverage of k-repeat units. This is defined by replacing each sequence with an “epitope bag”, that is, an unordered list of all k-repeat units that appear in the sequence. An epitope bag can be defined for a set of sequences by making a list of all k-repeat units that appear in any of the sequences in the set. The coverage of a given sequence S by a set of sequences Q={qi,q2,...,qN} is given by the fraction of epitopes in the bag of S that are also in the collective bag of sequences Q, where Q must be a multipurpose combination in a vaccine cocktail. This coverage has been optimized. Another quantity of interest was the fraction of epitopes in the Q bag that are not in the S bag. Although not (currently) used directly in optimization, a smaller fraction of these foreign epitopes are preferred, and these numbers are calculated for comparisons and experimental design.
[0130] Seis (6) maneiras de encontrar “sequências centrais” foram avaliadas quando realiza-se o agrupamento para uma vacina Personalizada incorporada no código de análise de vacina personalizada (consulte abaixo). Uma solução EpiGraph foi considerada melhor, e foi usada para o código final. Várias estratégias de agrupamento também foram testadas.[0130] Six (6) ways of finding “core sequences” were evaluated when performing clustering for a Custom vaccine incorporated into the Custom vaccine analysis code (see below). An EpiGraph solution was considered best, and was used for the final code. Various clustering strategies were also tested.
[0131] Aqui estão as estratégias testadas para definir sequências centrais de agrupamentos baseadas em aminoácidos: 1) Consenso: O consenso era um padrão comum, obtido mediante a concatenação do aminoácido mais comum em um alinhamento. Baseado em Epítopo Potencial (k-unidades de repetição): 2) Epissenso: Essa abordagem resolve uma única sequência central dentro de uma população ou dentro de um agrupamento. Dois algoritmos foram testados para encontrar o epissenso. O primeiro é o algoritmo drop-in-place. Esse começa com o consenso como um “substrato”. Excluindo-se k-unidades de repetição muito raras (aqueles que são encontrados apenas 1 vez na população), começam com variantes de frequência baixas raras e substituem as k-unidades de repetição de consenso pela variante rara, então continuam substituindo por variantes, subindo na lista de todas as k-unidades de repetição com base na sua frequência, substituindo e sobrescrevendo por variantes cada vez mais frequentes até que as variantes mais frequentes em k-unidades de repetição sejam deixadas “permanecer”; sobrepondo k- unidades de repetição com maior freqüência naturalmente tendem a substituir peptídeos que se sobrepõem com frequências mais baixas. O segundo algoritmo é EpiGraph, o mesmo foi descrito no Exemplo 1. As sequências Epigraph são calculadas mais rapidamente do que os mosaicos GA, e assim foram prontamente incorporadas em um algoritmo de agrupamento exigido para projetar uma vacina personalizada. Em um experimento com um conjunto de 690 sequências alinhadas de 556 aminoácidos que compreendem a proteína Gag (SEQ ID NOs: 1 a 690), a solução EpiGraph estava muito próxima de um consenso, e também estava muito próxima do único melhor mosaico, com apenas uma diferença de aminoácidos dos outros dois centroides. 3) Sequencial: Essa abordagem resolve um conjunto de N sequências de opões de vacinas. Aqui, o epissenso é definido primeiro para a população, e esse é q1. Em seguida, todas as k-unidades de repetição que já estão cobertos por q1 são excluídos e a abordagem resolve a segunda sequência na série pelo mesmo processo drop-in-place, para produzir q2. Então, todos as k-unidades de repetição já cobertos por q1 e q2 são excluídos e a abordagem resolve q3 e assim por diante até ser resolvido para um conjunto de N sequências, cada uma incluindo versões cada vez mais raras dos epítopos potenciais. 4) Iterativo: Essa é uma versão iterativa do algoritmo sequencial. A mesma também produz um conjunto de N sequências de opções de vacinas, em geral, com melhor cobertura do que a abordagem sequencial, porém sem a ordenação preferencial que o algoritmo sequencial produz. Começando com uma solução sequencial qi, q2, ..., qN, todos os epítopos que estão no conjunto de sequências de dados são identificados e, então, os epítopos que são cobertos por q2, ..., qN são excluídos. Resolvendo-se o epissenso usando os epítopos restantes (não excluídos), um novo valor é obtido para qi. A etapa seguinte faz o mesmo com q2, excluindo os epítopos em qi, q3, ., qN. E assim por diante para q3 a qN. 5) Mosaico (mosaico GA): definido usando o algoritmo genético original (GA). Mosaico se refere ao algoritmo genético denominado Mosaico e/ou sequências de antígenos produzidas pelo GA. Aqui, um conjunto de mosaicos de tamanho N é resolvido para todos de uma vez, ou o único melhor mosaico pode ser resolvido para, fixo, e resolvido para um conjunto complementar de 5 para formar um total de 6 sequências de opções de vacinas. Essa estratégia foi empregada para permitir comparações diretas com estratégias de agrupamento descritas abaixo. 6) Mais natural: Essa abordagem resolve um conjunto de N sequências de opões de vacinas. A cepa natural em um conjunto é identificada como mais “centrada no epítopo”, isto é, tem as k-unidades de repetição mais comuns. Para encontrar a mesma, para cada k-unidade de repetição em uma determinada tensão natural, uma frequência pode ser atribuída àquela forma específica com base na sua frequência na população, e então somar as freqüências como uma medida de quão bem a cepa natural cobre a população. A cepa natural com a pontuação mais alta é a melhor cepa única, Nat.i. Então, as k-unidades de repetição que estão cobertas por Nat.i podem ser eliminadas do esquema de pontuação e o melhor complemento para Nat.2 pode ser selecionado encontrando a melhor cepa natural para a cobertura de epítopos excluindo os epítopos já cobertos por Nat.i. Isto é feito iterativamente, então k cepas naturais são colhidas, em que k é o número de opções de vacina que deseja-se considerar, e as mesmas são ordenadas, assim Nat.i é a melhor cepa única, Nat.2 o melhor complemento para Nat.i, Nat.3 o melhor complemento para (Nat.i + Nat.2).[0131] Here are the strategies tested to define central cluster sequences based on amino acids: 1) Consensus: Consensus was a common standard, obtained by concatenating the most common amino acid in an alignment. Based on Potential Epitope (k-repeat units): 2) Episense: This approach resolves a single core sequence within a population or within a cluster. Two algorithms were tested to find episense. The first is the drop-in-place algorithm. This starts with consensus as a “substrate”. Excluding very rare k-repeat units (those that are only found 1 time in the population), start with rare low-frequency variants and replace the consensus k-repeat units with the rare variant, then continue substituting with variants, moving up in the list of all k-repeat units based on their frequency, replacing and overwriting with increasingly frequent variants until the most frequent variants in k-repeat units are allowed to “stand”; overlapping k-repeat units with higher frequency naturally tend to replace overlapping peptides with lower frequencies. The second algorithm is EpiGraph, the same as described in Example 1. Epigraph sequences are calculated faster than GA mosaics, and thus were readily incorporated into a clustering algorithm required to design a personalized vaccine. In an experiment with a set of 690 aligned sequences of 556 amino acids comprising the Gag protein (SEQ ID NOs: 1 to 690), the EpiGraph solution was very close to a consensus, and was also very close to the single best mosaic, with only a difference in amino acids from the other two centroids. 3) Sequential: This approach solves a set of N sequences of vaccine options. Here, the episense is defined first for the population, and that is q1. Then, all k-repeat units that are already covered by q1 are deleted and the approach solves the second sequence in the series by the same drop-in-place process, to produce q2. Then, all k-repeat units already covered by q1 and q2 are deleted and the approach solves for q3 and so on until resolved to a set of N sequences, each including increasingly rarer versions of the potential epitopes. 4) Iterative: This is an iterative version of the sequential algorithm. It also produces a set of N sequences of vaccine options, in general, with better coverage than the sequential approach, but without the preferential ordering that the sequential algorithm produces. Starting with a sequential solution qi, q2, ..., qN, all epitopes that are in the sequence data set are identified, and then epitopes that are covered by q2, ..., qN are excluded. By resolving the episense using the remaining (non-deleted) epitopes, a new value is obtained for qi. The next step does the same with q2, deleting the epitopes on qi, q3, ., qN. And so on for q3 to qN. 5) Mosaic (GA mosaic): defined using the original genetic algorithm (GA). Mosaic refers to the genetic algorithm called Mosaic and/or antigen sequences produced by GA. Here, a set of mosaics of size N is solved for all at once, or the single best mosaic can be solved for, fixed, and solved for a complementary set of 5 to form a total of 6 vaccine option sequences. This strategy was employed to allow direct comparisons with clustering strategies described below. 6) More natural: This approach solves a set of N vaccine option sequences. The natural strain in a set is identified as most “epitope-centric,” that is, has the most common k-repeat units. To find the same, for each k-unit repeat in a given natural strain, a frequency can be assigned to that specific form based on its frequency in the population, and then sum the frequencies as a measure of how well the natural strain covers the population. The natural strain with the highest score is the best single strain, Nat.i. Then, the k-repeat units that are covered by Nat.i can be eliminated from the scoring scheme and the best complement to Nat.2 can be selected by finding the best natural strain for epitope coverage excluding the epitopes already covered by Nat. .i. This is done iteratively, then k natural strains are collected, where k is the number of vaccine options one wishes to consider, and they are ordered, so Nat.i is the best single strain, Nat.2 the best complement for Nat.i, Nat.3 the best complement to (Nat.i + Nat.2).
[0132] As opções de vacinas que foram exploradas são projetadas de acordo com as seguintes estratégias gerais, comparando-se novas ideias para abordar especificamente as sequências de populações de vacinas terapêuticas que foram projetadas no passado para otimizar a cobertura da população.[0132] The vaccine options that have been explored are designed according to the following general strategies, comparing new ideas to specifically address therapeutic vaccine population sequences that have been designed in the past to optimize population coverage.
[0133] Se todos os indivíduos fossem receber a mesma vacina (isto poderia funcionar melhor somente com regiões conservadas), o sequenciamento e personalização não são feitos - estes são projetos universais, não otimizados para cada indivíduo:[0133] If all individuals were to receive the same vaccine (this might work better only with conserved regions), sequencing and personalization are not done - these are universal designs, not optimized for each individual:
[0134] Consenso: Encontrar uma única sequência universal que melhor cobre a população. Os candidatos a esta seqüência 1-universal incluíram: um consenso de população, o melhor mosaico GA único, o epissenso e a cepa natural mais "epi-cêntrica".[0134] Consensus: Find a single universal sequence that best covers the population. Candidates for this 1-universal sequence included: a population consensus, the best single GA mosaic, the episense, and the most "epi-centric" natural strain.
[0135] EpiGraph: Encontrar 2 ou 3 sequências baseadas na população e conceda as mesmas a todos na população. Esta estratégia baseada em população foi comparada usando o mosaico GA, as melhores cepas naturais e a solução de mosaico sequencial e iterativo. Visto que EpiGraphs estão agora disponíveis, e um aprimoramento sobre Mosaicos como também pode-se excluir epítopos raros, pode- se usá-los.[0135] EpiGraph: Find 2 or 3 sequences based on the population and grant them to everyone in the population. This population-based strategy was compared using the GA mosaic, best natural strains, and the sequential and iterative mosaic solution. Since EpiGraphs are now available, and an improvement over Mosaics as you can also exclude rare epitopes, you can use them.
[0136] Em contrapartida, para uma vacina personalizada, cada indivíduo poderia obter apenas as sequências de vacinas que melhor corresponderam à sua infecção: Fabricação, por exemplo, 6 seqüências de antígenos de vacina, e escolher o melhor, ou a melhor combinação de 2 ou 3 entre essas 6 para aplicação ao paciente; isto é, escolher aquelas que proporcionam a melhor cobertura da cepa infectante de um paciente, com o menor número de epitopos incompatíveis. Várias estratégias para esse cenário foram exploradas. a.As seqüências de agrupamentos com uma estratégia semelhante a k- médias para criar 6 agrupamentos, foram feitas 1.500 iterações (cada uma dessas iterações foi uma etapa de divisão e fusão de teste seguida de algumas iterações regulares) para os conjuntos finais, sequências centroides definidas a partir desses 6 agrupamentos para conjuntos de vacinas. A distância entre duas sequências foi definida como um menos a cobertura de epítopos de uma sequência pela outra sequência. Inicialmente, 6 cepas naturais aleatoriamente selecionadas foram usadas para produzir os agrupamentos. Isto forneceu um conjunto muito altamente relacionado de 6 sequências centroides. Foi constatado que se e uma diversidade mais natural fosse representada, isso criaria um conjunto de reagentes melhor para criar vacinas sob medida. Em seguida, os 6 agrupamentos foram produzidos com a maioria das 6 cepas naturais (Nat6) complementares visto que esses são muito distintivos e, então, reatribuídos ao centro com base nos agrupamentos como o epissenso, e iterativamente reagrupados e recentrados. Essa estratégia foi comparada a partir das 6 melhores cepas naturais e usando um consenso como o centroide de agrupamento em vez do epissenso, e o epissenso concedeu uma cobertura ligeiramente melhor. A imposição de um tamanho de agrupamento mínimo também proporcionou uma cobertura ligeiramente melhor (1, 5 e 20 como tamanhos de agrupamento mínimos foram testados), assim um tamanho mínimo de agrupamento foi incorporado como uma restrição. Um tamanho mínimo de 20 era melhor que 1 ou 5. Para implementar um tamanho mínimo, se em um dado ciclo o número de sequências em um tamanho de agrupamento cair abaixo do tamanho mínimo, os membros deste "agrupamento muito pequeno" são reatribuídos ao melhor centroide dos outros cinco agrupamentos. Para fazer um novo agrupamento para substituir o que foi perdido, o agrupamento que tem as maiores distâncias médias até o seu centroide foi dividido levando-se em consideração duas sequências naturais aleatórias dentro do agrupamento como centroides e reformando dois agrupamentos sobre os mesmos, recalculando os centroides e passando para a próxima etapa com estes novos seis agrupamentos. Os centroides desses agrupamentos estavam muito próximos do centro da árvore. Determinou-se a partir das sequências que isto se deve à replicação do consenso repetidamente dentro dos agrupamentos que dominam o sinal. b.Epissenso + (5 centros de agrupamento). Aqui, a sequência central foi definida, primeiro, para a população inteira usando o algoritmo EpiGraph (o epissenso de população), fixada para inclusão como um reagente de vacina. Quaisquer epítopos que correspondem ao epissenso de população foram excluídos das considerações de agrupamento. As sequências são agrupadas como antes, com um tamanho mínimo, mas desta vez 5 agrupamentos baseados em todos os epítopos potenciais, exceto aqueles encontrados no epissenso, assim os agrupamentos complementam o epissenso da população, foram almejados. Isso foi determinado para a melhor solução para Gag. Incluindo-se o epissenso da população em cada vacina personalizada de cada indivíduo, mesmo que uma dada k-unidades de repetição mais comum não seja evidente em suas sequências de HIV amostradas, o mesmo pode estar camuflado ou uma forma comum para a reversão, dado o aminoácido frequente do HIV que alterna entre formas comuns. A segunda sequência complementar de um dos 5 agrupamentos poderia então adicionar à variante uma reação cruzada potencial entre a vacina e a cepa infectante. c.Definir o melhor EpiGraph, adicionar 5 complementos de mosaico para obter um conjunto de seis (os 5 adicionados não são ordenados), ou definir o melhor natural, adicionar 5 naturais em série.[0136] In contrast, for a personalized vaccine, each individual could obtain only the vaccine sequences that best matched their infection: Manufacture, for example, 6 vaccine antigen sequences, and choose the best one, or the best combination of 2 or 3 out of these 6 for application to the patient; that is, choosing those that provide the best coverage of a patient's infecting strain, with the fewest incompatible epitopes. Several strategies for this scenario were explored. a.Clustering sequences with a k-means-like strategy to create 6 clusters, 1,500 iterations were done (each of these iterations was a test splitting and merging step followed by some regular iterations) for the final sets, centroid sequences defined from these 6 groupings for vaccine sets. The distance between two sequences was defined as one minus the epitope coverage of one sequence by the other sequence. Initially, 6 randomly selected natural strains were used to produce the clusters. This provided a very highly related set of 6 centroid sequences. It was found that if more natural diversity was represented, this would create a better set of reagents to create tailored vaccines. Next, the 6 clusters were produced with most of the 6 natural strains (Nat6) complementary as these are very distinctive, and then reassigned to the center based on the clusters like episense, and iteratively regrouped and re-centered. This strategy was compared starting from the top 6 natural strains and using a consensus as the cluster centroid instead of episense, and episense gave slightly better coverage. Imposing a minimum cluster size also provided slightly better coverage (1, 5, and 20 as minimum cluster sizes were tested), so a minimum cluster size was incorporated as a constraint. A minimum size of 20 was better than 1 or 5. To implement a minimum size, if in a given cycle the number of sequences in a cluster size falls below the minimum size, the members of this "very small cluster" are reassigned to the best centroid of the other five clusters. To make a new cluster to replace what was lost, the cluster that has the greatest average distances to its centroid was divided taking into account two random natural sequences within the cluster as centroids and reforming two clusters on them, recalculating the centroids and moving on to the next step with these new six clusters. The centroids of these clusters were very close to the center of the tree. It was determined from the sequences that this is due to the consensus replicating repeatedly within the clusters that dominate the signal. b.Epissenso + (5 cluster centers). Here, the core sequence was first defined for the entire population using the EpiGraph algorithm (the population episense), fixed for inclusion as a vaccine reagent. Any epitopes matching the population episense were excluded from grouping considerations. Sequences are clustered as before, with a minimum size, but this time 5 clusters based on all potential epitopes except those found in the episense, so the clusters complement the population episense, were targeted. This was determined to be the best solution for Gag. By including the population's episense in each individual's personalized vaccine, even if a given most common k-repeat unit is not evident in their sampled HIV sequences, it may be camouflaged or a common form for reversion, given the frequent HIV amino acid that alternates between common forms. The second complementary sequence from one of the 5 clusters could then add to the variant a potential cross-reaction between the vaccine and the infecting strain. c.Define best EpiGraph, add 5 tessellation complements to get a set of six (the 5 added are not ordered), or define best natural, add 5 naturals in series.
[0137] Após extensas comparações e refinamentos, privilegiou-se o uso do algoritmo EpiGraph para definir o centro de agrupamentos para vacinas personalizadas. É fornecido um conjunto de 6 antígenos de proteína Gag para a fabricação em um modelo personalizado, que visa uma vacina de grupo M global, uma vacina contemporânea do clado B e uma vacina C contemporânea do clado C para a África Austral. A comparação da cobertura de sequências de clados B contemporâneas naturais utilizando 2 sequências de clados B naturais, EpiGraphs de grupo M, EpiGraphs de clado B ou clado B personalizado é mostrada na Figura 6A a B; projetos personalizados de clado B proporcionam a melhor cobertura de epítopo.[0137] After extensive comparisons and refinements, the use of the EpiGraph algorithm was favored to define the center of clusters for personalized vaccines. A set of 6 Gag protein antigens is provided for manufacturing in a custom model, which targets a global group M vaccine, a contemporary clade B vaccine, and a contemporary clade C vaccine for Southern Africa. Comparison of natural contemporary clade B sequence coverage using 2 natural clade B sequences, group M EpiGraphs, clade B EpiGraphs, or custom clade B is shown in Figure 6A to B; custom clade B designs provide the best epitope coverage.
[0138] Os vários cenários podem ser resumidos com alguns números como observado na Tabela 3, que são detonados por M, C, T, A e P. Estes são descritos abaixo em termos do número de "pílulas" (isto é, antígenos de vacina) para cada categoria: M=Fabricado, número total de pílulas criadas, a partir do qual algum subconjunto é selecionado para cada indivíduo. (Tipicamente, supõe que M=6 ou menos). C=Comum, essas pílulas que todos administram, possivelmente além de algumas pílulas personalizadas. T/A=Personalizadas/Alternativas, T é o número de pílulas personalizadas (dentre A alternativas) que são dadas a cada indivíduo, possivelmente em combinação com algumas pílulas comuns. P=Por-indivíduo total (T+C), o número de pílulas dados a cada indivíduo. TABELA 3 [0138] The various scenarios can be summarized with a few numbers as noted in Table 3, which are triggered by M, C, T, A and P. These are described below in terms of the number of "pills" (i.e. antigens of vaccine) for each category: M=Manufactured, total number of pills created, from which some subset is selected for each individual. (Typically assumes M=6 or less). C=Common, those pills that everyone administers, possibly plus some custom pills. T/A=Personalized/Alternative, T is the number of personalized pills (among A alternatives) that are given to each individual, possibly in combination with some common pills. P=Per-individual total (T+C), the number of pills given to each individual. TABLE 3
[0139] Na Tabela 3, os únicos números sublinhados indicam que, em média, mais de 60% das 12-unidades de repetição nas sequências naturais são cobertos pela vacina (SATISFATÓRIO), enquanto os números sublinhados duplos indicam que mais de 70% das 12-unidades de repetição em média não estão presentes na cepas naturais. C6-epi 2 0 2/6 6 1+5-Epi-C5 2 0 2/6 6[0139] In Table 3, the single underlined numbers indicate that, on average, more than 60% of the 12-repeat units in the natural sequences are covered by the vaccine (SATISFACTORY), while the double underlined numbers indicate that more than 70% of the 12-repeat units on average are not present in natural strains. C6-epi 2 0 2/6 6 1+5-Epi-C5 2 0 2/6 6
[0140] Personalizado - selecionar a melhor 1 de 6 para cada uma das 690 sequências de população: Não muito melhor (0,54 vs 0,51) do que apenas fazer um para toda a população, mas C6-epi é a melhor da classe se 6 vacinas que seriam feitas, e administrar uma das seis a um indivíduo com base em sua sequência. [0140] Custom - select best 1 of 6 for each of 690 population sequences: Not much better (0.54 vs 0.51) than just doing one for the entire population, but C6-epi is the best of the bunch class if 6 vaccines that would be made, and administer one of the six to an individual based on their sequence.
[0141] Par personalizado híbrido: definir o centro de população, adicionar 1 de 5 centroides para melhor complementar uma sequência fixa para cobrir cada uma das seqüências de teste - [0141] Hybrid Custom Pair: Set population center, add 1 of 5 centroids to best complement a fixed sequence to cover each of the test sequences -
[0142] Três melhores híbridos - definir o centro da população, e 2 de 5 centroides para melhor complementar uma sequência fixa para cobrir a sequência de teste. [0142] Three best hybrids - define the center of the population, and 2 of 5 centroids to best complement a fixed sequence to cover the test sequence.
[0143] Comum: Todos recebem a mesma vacina com base na população, ou são administrados 1 ou 2 antígenos de vacina: [0143] Common: Everyone receives the same vaccine based on population, or 1 or 2 vaccine antigens are administered:
[0144] Correspondência exata 1+5-Epi-C5: [0144] Exact match 1+5-Epi-C5:
[0145] E off-by-one considerado uma correspondência 1+5-Epi-C5: [0145] And off-by-one considered a 1+5-Epi-C5 correspondence:
[0146] ** esses provavelmente são a melhor solução. Um epissenso de população foi feito, as 12-unidades de repetição encontradas no epissenso para agrupamento foram excluídas. Quando o epissenso de população é fixo e o melhor epissenso dos outros 5 agrupamentos complementares é escolhido para emparelhar com o mesmo, a mesma resposta é obtida como quando o melhor par entre as 6 variantes foi escolhido. Isso significa que o epissenso de população sempre foi um dos melhores pares.[0146] ** these are probably the best solution. A population episense was made, the 12-repeat units found in the episense for clustering were excluded. When the population episense is fixed and the best episense from the other 5 complementary clusters is chosen to pair with it, the same response is obtained as when the best pair among the 6 variants was chosen. This means that the population episense has always been one of the best pairs.
[0147] Off by one: Para as estimativas acima, apenas correspondências perfeitas foram consideradas, para um epítopo para correspondência entre um coquetel de vacina e uma cepa natural, uma correspondência perfeita de 12/12 era necessária. As incompatibilidades são frequentemente bem tolerados, particularmente para epítopos de classe II, se uma correspondência exigir concordância de 11/12, uma incompatibilidade é 10/12 ou menos. A verdade está provavelmente entre isso, e 10/12 também pode ser aceitável em alguns casos. Aqui, a melhor opção é comparada com uma melhor opção de cepa natural, com correspondências perfeitas:[0147] Off by one: For the above estimates, only perfect matches were considered, for an epitope match between a vaccine cocktail and a natural strain, a perfect match of 12/12 was required. Mismatches are often well tolerated, particularly for class II epitopes; if a match requires 11/12 agreement, a mismatch is 10/12 or less. The truth is probably somewhere in between, and 10/12 may also be acceptable in some cases. Here, the best option is compared to a best natural strain option, with perfect matches:
[0148] Correspondência perfeita (extraída da tabela acima): [0148] Perfect match (extracted from the table above):
[0149] E off-by-one considerado um a correspondência: [0149] And off-by-one considered a correspondence:
[0150] Três pílulas, uma comum (igual para todos). E duas pílulas personalizadas, o melhor par das cinco restantes.[0150] Three pills, one common (same for everyone). And two custom pills, the best pair of the remaining five.
[0151] A diversidade de HIV no nível de população começa com evolução rápida dentro de cada hospedeiro infectado. Grande parte da diversidade dentro do hospedeiro é uma consequência direta de escape imunológico (Bar, K. J. 2012. PLoS Pathog 8:e1002721., Liu, M. K. 2013. J. Clin. Invest. 123:380 a 93, e variantes de escape surgem logo após a infecção (Fischer, W. 2010. PLoS One 5:e12303). O objetivo de vacinas profiláticas é eliminar rapidamente a cepa infectante ou impedir que a mesma infecte inicialmente. Uma vez que não se sabe qual cepa será transmitida, as vacinas profilácticas têm de induzir respostas imunológicas que sejam ativas contra qualquer variante que possa ser encontrada. Em contrapartida, uma imunoterapia pode ser dirigida contra uma população viral conhecida presente num dado hospedeiro. As vacinas profilácticas e terapêuticas contra HIV têm, portanto, de ser concebidas tendo em mente esses requisitos distintos. Conforme ilustrado na Figura 7, as soluções em mosaico aproximam-se da cobertura de epítopo máxima possível para uma determinada população de HIV. A figura também revela diferenças na conservação de proteínas do HIV, com grandes segmentos de Gag, Nef e Pol sendo altamente conservados, enquanto que a maior parte de Env, bem como a maioria das proteínas auxiliares pequenas (dados não mostrados) são altamente variáveis. Embora os mosaicos ofereçam uma solução quase ideal para a cobertura de epítopo em uma população para uma vacina profilática, os mesmos não exploram as informações adicionais para conhecer a sequência da cepa infectante alvejada em um ambiente terapêutico.[0151] HIV diversity at the population level begins with rapid evolution within each infected host. Much of the diversity within the host is a direct consequence of immune escape (Bar, K. J. 2012. PLoS Pathog 8:e1002721., Liu, M. K. 2013. J. Clin. Invest. 123:380 to 93, and escape variants soon emerge after infection (Fischer, W. 2010. PLoS One 5:e12303). The goal of prophylactic vaccines is to quickly eliminate the infecting strain or prevent it from infecting initially. Since it is not known which strain will be transmitted, prophylactic vaccines must induce immunological responses that are active against any variant that may be encountered. In contrast, an immunotherapy can be directed against a known viral population present in a given host. Prophylactic and therapeutic vaccines against HIV must therefore be designed taking into account these distinct requirements. As illustrated in Figure 7, the mosaic solutions approximate the maximum possible epitope coverage for a given HIV population. The figure also reveals differences in the conservation of HIV proteins, with large segments of Gag, Nef and Pol being highly conserved, whereas most of Env as well as most of the small auxiliary proteins (data not shown) are highly variable. Although mosaics offer a near-ideal solution for epitope coverage in a population for a prophylactic vaccine, they do not exploit the additional information to know the sequence of the infecting strain targeted in a therapeutic setting.
[0152] A implementação de uma estratégia de projeto de vacina personalizada requer a fabricação de um número gerenciável de reagentes de vacina que capturem maximamente a diversidade de epítopos da população alvo, sequenciamento de HIV do receptor de vacina infectado e, então, a seleção entre o grupo de reagentes de vacina do subconjunto de inserções de antígenos que melhor corresponde ao indivíduo. Dessa forma, a estratégia de vacina personalizada é conceitualmente diferente do moelo de vacina em mosaico.[0152] Implementing a personalized vaccine design strategy requires manufacturing a manageable number of vaccine reagents that maximally capture the epitope diversity of the target population, sequencing HIV from the infected vaccine recipient, and then selecting among the vaccine reagent group from the subset of antigen insertions that best matches the individual. In this way, the personalized vaccine strategy is conceptually different from the mosaic vaccine model.
[0153] 98% de aproximadamente 150.000 sequências de HIV que foram amostradas nos E.U.A. são clado B. Foram utilizadas as sequências de Gag B de clado B amostradas US, atualmente disponíveis a partir da base de dados HIV de Los Alamos. Havia 690 sequências de Gag intactas neste conjunto (SEQ ID NOs. 1 a 690), cada uma derivada de um indivíduo infectado diferente, representando uma seção transversal da diversidade de cepas de HIV US. Para maximizar a cobertura de epítopo de células T em uma vacina hipotética, ao mesmo tempo que define-se o número de sequências de Gag diferentes que precisam de estar contidas em um coquetel de vacinas, uma estratégia computacional inovadora que acopla o uso de um algoritmo de sequência consenso baseado em epítopo (ou “epissenso”) com agrupamento semelhante a k-médias. Ao contrário de uma sequência consenso simples, que adota o aminoácido mais comum em cada posição do alinhamento, o epissenso busca o epítopo mais comum (por exemplo, 12-unidades de repetição) partindo de cada posição do alinhamento. Entretanto, não se pode simplesmente adotar o epítopo mais comum em cada posição, pois os epítopos se sobrepõem, e isso pode levar a conflitos em aminoácidos nas proximidades. O objetivo é lidar com esses conflitos de uma forma que leve à cobertura máxima de epítopo de uma população por uma vacina.[0153] 98% of approximately 150,000 HIV sequences that have been sampled in the U.S. are clade B. US sampled clade B Gag B sequences, currently available from the Los Alamos HIV database, were used. There were 690 intact Gag sequences in this set (SEQ ID NOs. 1 to 690), each derived from a different infected individual, representing a cross-section of the diversity of US HIV strains. To maximize T cell epitope coverage in a hypothetical vaccine, while defining the number of different Gag sequences that need to be contained in a vaccine cocktail, an innovative computational strategy that couples the use of an algorithm epitope-based consensus sequence (or “episense”) with k-means-like clustering. Unlike a simple consensus sequence, which adopts the most common amino acid in each alignment position, episense searches for the most common epitope (e.g., 12-repeat units) starting from each alignment position. However, one cannot simply adopt the most common epitope at each position, as epitopes overlap, and this can lead to conflicts in nearby amino acids. The goal is to address these conflicts in a way that leads to maximum epitope coverage of a population by a vaccine.
[0154] Para definir um pequeno conjunto de antígenos para fabricação que representa a diversidade de epítopos na população, utilizou-se uma abordagem semelhante a k-médias para particionar as 690 sequências de Gag em agrupamentos distintos com base na similaridade de epítopos e as sequências epissenso separadas foram geradas para cada agrupamento para servir como a sequência central do agrupamento. A fabricação da cobertura de níveis de variantes individuais após 5 a 6 agrupamentos, e 6 vetores de vacina com 6 variantes de antígeno de HIV é viável, de modo que um conjunto de 6 antígenos seja inicialmente almejado. O algoritmo começa com 6 cepas naturais aleatoriamente selecionadas como sequências de centroides iniciais, e atribui cada uma das seqüências restantes a qualquer um dos 6 que estiver mais próximo. Dentro de cada um dos 6 agrupamentos, uma nova sequência centroide é computada, com base no epissenso das sequências naquele agrupamento. Então, todas as sequências são reatribuídas de acordo com qual dos novos centroides está mais próximo. Este processo converge para uma otimização semelhante a k-médias para o desenho dos 6 antígenos de vacina, que são adotados como os centroides epissenso dos agrupamentos individuais, e esses antígenos poderiam ser usados como um conjunto fabricado, a partir do qual selecionam-se aqueles que fornecem a melhor correspondência para uma dada vacina.[0154] To define a small set of antigens for manufacturing that represents the diversity of epitopes in the population, a k-means-like approach was used to partition the 690 Gag sequences into distinct clusters based on similarity of epitopes and sequences Separate episense sequences were generated for each cluster to serve as the cluster's core sequence. Manufacturing coverage of individual variant levels after 5 to 6 pools, and 6 vaccine vectors with 6 HIV antigen variants is feasible, so that a pool of 6 antigens is initially targeted. The algorithm starts with 6 randomly selected natural strains as initial centroid sequences, and assigns each of the remaining sequences to whichever of the 6 is closest. Within each of the 6 clusters, a new centroid sequence is computed, based on the episense of the sequences in that cluster. Then, all sequences are reassigned according to which of the new centroids is closest. This process converges to a k-means-like optimization for the design of the 6 vaccine antigens, which are adopted as the episense centroids of the individual clusters, and these antigens could be used as a manufactured set, from which to select those that provide the best match for a given vaccine.
[0155] Verificou-se que uma abordagem híbrida aprimora substancialmente a cobertura do epítopo, ao mesmo tempo que minimiza aumentos em potenciais respostas específicas da vacina. Na estratégia híbrida, a sequência central foi computada para a população inteira (a população epissenso), e o agrupamento subsequente baseou-se exclusivamente em epítopos que não foram encontrados na sequência central. Desta forma, as sequências epissenso de agrupamentos complementam o epsissenso da população. Deste modo, o grupo de reagentes de 6 sequências consiste no epissenso de uma população e em cinco sequências de centroides de agrupamento complementar, e os indivíduos poderiam receber uma vacina personalizada de dois antígenos, o episenso de população emparelhado com a melhor sequência complementar. Esta estratégia produziu sequências mais diversas no conjunto de referências e aprimorou a cobertura potencial de sequências de Gag naturais na população de teste como observado na Tabela 4.[0155] A hybrid approach was found to substantially improve epitope coverage while minimizing increases in potential vaccine-specific responses. In the hybrid strategy, the core sequence was computed for the entire population (the episense population), and subsequent clustering was based exclusively on epitopes that were not found in the core sequence. In this way, cluster episense sequences complement the population epsisense. In this way, the 6-sequence reagent pool consists of a population episense and five complementary cluster centroid sequences, and individuals could receive a personalized two-antigen vaccine, the population episense paired with the best complementary sequence. This strategy produced more diverse sequences in the reference set and improved the potential coverage of natural Gag sequences in the test population as noted in Table 4.
[0156] Tabela 4. Cobertura média por cepa de epítopos potenciais em Gag de clado B US por vacinas diferentes [0156] Table 4. Average coverage by strain of potential epitopes in US clade B Gag by different vaccines
[0157] Uma vacina personalizada, projeto com 2 ou 3 antígenos, foi fabricada para cada uma das 690 variantes, selecionadas a partir do epissenso de população e das 5 sequências complementares derivadas do agrupamento. Isto foi comparado com a cobertura potencial de epítopo de estratégias de vacinas baseadas na população, em que cada vacinado poderia receber a mesma vacina, em combinações em mosaico ou de melhor natural. "Administrado" indica o número de antígenos que poderiam estar incluídos em um coquetel de vacinas. “Fabricado" indica o tamanho do grupo de referência de antígenos de vacina que precisaria ser sintetizado para escolher entre a abordagem personalizada a ser utilizada. A "% compatível" indica o número médio de epítopos potenciais perfeitamente compatíveis entre cada uma das variantes de Gag naturais e a vacina; quanto mais alto for este valor, mais provavelmente as respostas à vacina apresentarão reatividade cruzada com variantes naturais A "% não compatível" representa a fração de epítopos potenciais na vacina que não são encontrados em uma dada sequência de Gag natural, calculada para cada uma das 690 sequências separadamente. então, a média é calculada. Quanto mais alto esse valor, maior é o potencial da vacina para obter respostas específicas da vacina que podem desviar das respostas de reatividade cruzada. O fator de aprimoramento indica o aumento em cobertura usando as novas opções de modelo de vacina propostas, em vez de usar uma melhor cepa única natural.[0157] A personalized vaccine, design with 2 or 3 antigens, was manufactured for each of the 690 variants, selected from the population episense and the 5 complementary sequences derived from the cluster. This was compared with the potential epitope coverage of population-based vaccine strategies, where each vaccinee could receive the same vaccine, in mosaic or natural-best combinations. "Administered" indicates the number of antigens that could be included in a vaccine cocktail. “Manufactured" indicates the size of the reference group of vaccine antigens that would need to be synthesized to choose between the personalized approach to be used. The "% compatible" indicates the average number of perfectly compatible potential epitopes between each of the natural Gag variants and the vaccine; the higher this value, the more likely vaccine responses will show cross-reactivity with natural variants The "% mismatch" represents the fraction of potential epitopes in the vaccine that are not found in a given natural Gag sequence, calculated for each of the 690 sequences separately. then the average is calculated. The higher this value, the greater the vaccine's potential to elicit vaccine-specific responses that may deviate from cross-reactive responses. The enhancement factor indicates the increase in coverage using the proposed new vaccine model options rather than using a best natural single strain.
[0158] As soluções de vacina personalizadas otimizadas em 12-unidades de repetição são quase ideais para 9-unidades de repetição, e vice-versa, assim agrupamentos baseados em 12-unidades de repetição deveriam funcionar bem para a apresentação de epítopo de classe I e classe II como observado na Tabela 5.[0158] Custom vaccine solutions optimized on 12-repeat units are almost ideal for 9-repeat units, and vice versa, so clusters based on 12-repeat units should work well for class I epitope presentation and class II as seen in Table 5.
[0159] Tabela 5. Permitir que uma única incompatibilidade de aminoácidos na avaliação de 9 unidades de repetição ou 12 unidades de repetição seja considerada como uma correspondência positiva quando se calcula a cobertura média de um modelo personalizado de 2 proteínas [0159] Table 5. Allowing a single amino acid mismatch when evaluating 9 repeat units or 12 repeat units to be considered as a positive match when calculating the average coverage of a 2-protein custom model
[0160] Por fim, a abordagem de vacina personalizada teoricamente obtém ótimos resultados se 1 dentre 12 incompatibilidades forem toleradas em epítopos potenciais, em vez de exigir identidade (Tabela 5); dada esta medida mais indulgente e talvez biologicamente mais realista, aproximadamente 90% das respostas de vacina às vacinas personalizadas podem apresentar reatividade cruzada com epítopos em Gags naturais compatíveis. A abordagem de vacina personalizada foi superior aos mosaicos de populações, sequências consenso e as melhores cepas naturais em termos tanto de maximizar a cobertura de epítopo de sequências de Gag como minimizar epítopos específicos de vacina potencialmente prejudiciais (Figura 8). O código também pode ser aplicado a vacinas personalizadas usando múltiplas sequências em vez de usar um representante de indivíduos infectados e a aplicação da estratégia de modelo de vacina personalizada a diferentes populações (o clado C epidêmico na África do Sul, o clado 2 epidêmico regional na Tailândia, e conjunto de grupo M global) é explorada.[0160] Finally, the personalized vaccine approach theoretically achieves optimal results if 1 out of 12 mismatches are tolerated in potential epitopes, rather than requiring identity (Table 5); Given this more lenient and perhaps more biologically realistic measure, approximately 90% of vaccine responses to personalized vaccines may show cross-reactivity with epitopes on compatible natural Gags. The personalized vaccine approach was superior to population mosaics, consensus sequences, and best natural strains in terms of both maximizing epitope coverage of Gag sequences and minimizing potentially harmful vaccine-specific epitopes (Figure 8). The code can also be applied to personalized vaccines using multiple sequences rather than using a representative of infected individuals and the application of the personalized vaccine model strategy to different populations (the epidemic clade C in South Africa, the regional epidemic clade 2 in Thailand, and global M group set) is explored.
[0161] Os antígenos de vacina personalizada podem fornecer uma melhor cobertura (em comparação com antígenos baseados em população) de sequências naturais quando a cepa infectante é conhecida.[0161] Personalized vaccine antigens can provide better coverage (compared to population-based antigens) of natural sequences when the infecting strain is known.
[0162] Com o uso dos antígenos de epissenso de população e/ou os antígenos personalizados descritos no presente documento, vetores de expressão dupla são gerados, com cada um expressando um antígeno de Gag completo e um segundo antígeno de HIV. O segundo antígeno do HIV pode ser, por exemplo, uma proteína de fusão da transcriptase inversa (RT) e a parte central de Nef. A integrase não está incluída, uma vez que é um estimulador bastante insatisfatório de respostas de células T. Utilizando vetores CMV (por exemplo, vetores RhCMV ou HCMV) como vectores de expressão dupla, é possível induzir simultaneamente células T em dois antígenos SIV ou HIV diferentes.[0162] Using the population episense antigens and/or the custom antigens described herein, dual expression vectors are generated, with each expressing a full-length Gag antigen and a second HIV antigen. The second HIV antigen can be, for example, a fusion protein of reverse transcriptase (RT) and the central part of Nef. Integrase is not included, as it is a rather poor stimulator of T cell responses. Using CMV vectors (e.g., RhCMV or HCMV vectors) as dual expression vectors, it is possible to simultaneously induce T cells on two SIV or HIV antigens. many different.
[0163] Por exemplo, painéis de até seis vetores de HCMV contendo sequências de Gag personalizadas com base no algoritmo EpiGraph desenvolvido são gerados (um vetor que expressa um antígeno de epissenso de população de Gag e cinco vetores que expressam um antígeno de Gag baseado em agrupamento complementar) e painéis de antígenos que cobrem RT e a região central de Nef também são projetados. Um vetor que expressa um antígeno de epissenso de população de Gag mais dois vetores cada um que expressam um antígeno de Gag diferente pode ser selecionado dentre os cinco antígenos complementares baseados em agrupamentos. Estes vetores também podem conter uma de duas sequências complementares de HIV-1 EpiGraph RT/ nef. Quando não prevê-se que a personalização aprimora a cobertura devido à elevada conservação destas sequências, a solução de 2 mosaicos é mantida e usada para o vetor. Por exemplo, um mosaico RT/nef está incluído no vetor de epissenso de população e o outro é u sado nos vetores personalizados. Um painel de vetores de vacina baseado em HCMV que pode entrar na produção de vacina é gerado por sequenciamento dos vetores resultantes e caracterização dos mesmos para expressão de antígenos e crescimento in vitro.[0163] For example, panels of up to six HCMV vectors containing custom Gag sequences based on the developed EpiGraph algorithm are generated (one vector expressing a Gag population episense antigen and five vectors expressing a Gag population-based Gag antigen). complementary cluster) and antigen panels covering RT and the central region of Nef are also designed. A vector expressing a Gag population episense antigen plus two vectors each expressing a different Gag antigen can be selected from the five cluster-based complementary antigens. These vectors can also contain one of two complementary HIV-1 EpiGraph RT/ nef sequences. When customization is not expected to improve coverage due to high conservation of these sequences, the 2-tile solution is retained and used for the vector. For example, one RT/nef mosaic is included in the population episense vector and the other is used in the custom vectors. A panel of HCMV-based vaccine vectors that can enter vaccine production is generated by sequencing the resulting vectors and characterizing them for antigen expression and in vitro growth.
[0164] As inserções de DNA otimizadas para códons sintéticos são geradas correspondendo ao mosaico Gag, RT e Nef e aos antígenos personalizados projetados no Exemplo 3.[0164] DNA inserts optimized for synthetic codons are generated corresponding to the Gag, RT and Nef mosaic and the custom antigens designed in Example 3.
[0165] Os antígenos projetados para maximizar a frequência de epítopo usando o algoritmo EpiGraph se assemelham a sequências naturais, mas já não codificam proteínas nativas. Embora as diretivas teóricas para a expressão destas sequências artificiais sejam aderidas na construção destas sequências, as proteínas codificadas pelas mesmas podem exibir perfis de expressão não antecipados ou não expressar uma proteína de comprimento total estável.[0165] Antigens designed to maximize epitope frequency using the EpiGraph algorithm resemble natural sequences, but no longer encode native proteins. Although theoretical guidelines for the expression of these artificial sequences are adhered to in the construction of these sequences, the proteins encoded by them may exhibit unanticipated expression profiles or may not express a stable full-length protein.
[0166] Para avaliar o perfil de expressão destas sequências no contexto de células de mamífero, as sequências de EpiGraph foram sintetizadas e clonadas para transfecção temporária. O DNA que codifica estes construtos foi sintetizado (Genscript, Piscataway, NJ) para conter locais de clonagem compatíveis para vectores plasmidiais (pcDNA3.1 e pOri). Todas as inserções foram otimizadas para o respectivo hospedeiro (rhesus, SIV ou humano, HIV). Cada construto também foi modificado para eliminar a atividade enzimática residual da sequência nativa como descrito em Kulkarni et al. Vaccine (2011). As posições deletadas eram baseadas na sequência de aminoácidos relativa a EpiGraph-1 de Clado B. Os aminoácidos excluídos incluem; "DTG" associado à atividade de protease (posições 81 a 83), "YMDD" associado à atividade de transcriptase reversa (posições 338 a 341), "E" associado à atividade de RNaseH (posição 633), "D" 779), "D" associado à atividade de Integrase (posição 831), e "E" associado à atividade de Integrase (posição 867). O DNA sintético foi reidratado em água e digerido com endonucleases de restrição (5 'NheI, 3' BamHI) seguido de inativação por calor. O vetor plasmidial foi linearizado com endonucleases compatíveis e tratado com fosfatase intestinal de vitelo para impedir a recircularização do vetor vazio. O vetor e fragmentos de inserção foram resolvidos por eletroforese em gel de agarose para confirmar os tamanhos de fragmento de digestão e limpos para ligação por kit de purificação por PCR (Thermo Scientific). As inserções foram ligadas a um vetor linearizado a uma relação de inserção para vetor de cerca de 3:1 durante 15 minutos à temperatura ambiente utilizando um kit de ligação rápida (Roche, Indianapolis, IN), transformadas em E. coli (DH5-alfa) quimicamente competente e colocadas em placas de seleção de antibióticos. O DNA das colônias resultantes foi rastreado por digestão de restrição de inserções[0166] To evaluate the expression profile of these sequences in the context of mammalian cells, EpiGraph sequences were synthesized and cloned for temporary transfection. DNA encoding these constructs was synthesized (Genscript, Piscataway, NJ) to contain compatible cloning sites for plasmid vectors (pcDNA3.1 and pOri). All inserts were optimized for the respective host (rhesus, SIV or human, HIV). Each construct was also modified to eliminate residual enzymatic activity from the native sequence as described in Kulkarni et al. Vaccine (2011). Deleted positions were based on the amino acid sequence relative to Clade B EpiGraph-1. Deleted amino acids include; "DTG" associated with protease activity (positions 81 to 83), "YMDD" associated with reverse transcriptase activity (positions 338 to 341), "E" associated with RNaseH activity (position 633), "D" 779), "D" associated with Integrase activity (position 831), and "E" associated with Integrase activity (position 867). Synthetic DNA was rehydrated in water and digested with restriction endonucleases (5' NheI, 3' BamHI) followed by heat inactivation. The plasmid vector was linearized with compatible endonucleases and treated with calf intestinal phosphatase to prevent recircularization of the empty vector. The vector and insert fragments were resolved by agarose gel electrophoresis to confirm digestion fragment sizes and cleaned for ligation by PCR purification kit (Thermo Scientific). The inserts were ligated into a linearized vector at an insert to vector ratio of about 3:1 for 15 minutes at room temperature using a rapid ligation kit (Roche, Indianapolis, IN), transformed into E. coli (DH5-alpha ) chemically competent and placed on antibiotic selection plates. DNA from the resulting colonies was screened by insertion restriction digestion
[0167] Os clones contendo cada uma das inserções corretas na orientação apropriada relativa ao promotor do vetor e às sequências de poli (A) foram desenvolvidas em cultura líquida para purificação de DNA plasmidial. As células Hela subconfluentes que crescem ativamente em placas de cultura de tecidos de 12 poços receberam 500ul de meio fresco (DMEM 10% de FBS) enquanto lipossomas eram preparados. Para gerar lipossomas contendo DNA plasmidial, 250 ul de meio isento de soro foram misturados com 500 ng de DNA plasmidial e 250 ul de meio isento de soro foram misturados com 2 uL de lipídeo (Lipofectamine 2000, Invitrogen). Após 5 minutos de incubação à temperatura ambiente, estas soluções foram combinadas, misturadas e incubadas durante 20 minutos. Os lipossomas contendo DNA (500 ul) formados durante este processo foram adicionados por gotejamento à cultura e deixados incubar 12 a 16 horas, após esse período a mistura de transfecção foi substituída por meio fresco. Após um dia adicional de incubação as culturas foram colhidas por raspagem e centrifugação. Os sobrenadantes foram removidos por aspiração e os péletes celulares foram lisados por ressuspensão em 100ul de corante de carga de gel contendo 5% de SDS e 10% de 2-mercaptoetanol e centrifugação através de coluna QiaShred (Qiagen, Valencia, CA).[0167] Clones containing each of the correct insertions in the appropriate orientation relative to the vector promoter and poly (A) sequences were grown in liquid culture for plasmid DNA purification. Subconfluent Hela cells actively growing in 12-well tissue culture plates received 500ul of fresh medium (DMEM 10% FBS) while liposomes were prepared. To generate liposomes containing plasmid DNA, 250 μl of serum-free medium was mixed with 500 ng of plasmid DNA and 250 μl of serum-free medium was mixed with 2 μl of lipid (Lipofectamine 2000, Invitrogen). After 5 minutes of incubation at room temperature, these solutions were combined, mixed and incubated for 20 minutes. The DNA-containing liposomes (500 ul) formed during this process were added dropwise to the culture and allowed to incubate for 12 to 16 hours, after which the transfection mixture was replaced with fresh medium. After an additional day of incubation, cultures were harvested by scraping and centrifugation. Supernatants were removed by aspiration and cell pellets were lysed by resuspension in 100ul gel loading dye containing 5% SDS and 10% 2-mercaptoethanol and centrifugation through a QiaShred column (Qiagen, Valencia, CA).
[0168] A expressão das proteínas EpiGraph foi demonstrada por electroforese em gel de poliacrilamida SDS (SDS-page) e por Western blotting desenvolvido com anticorpos para o V5 ou marcador de epítopo de hemaglutinina manipulado em cada construto. Brevemente, géis de poliacrilamida a 10% foram preparados e carregados com 10 ul (10% de cada amostra) e submetidos à electroforese a 110 a 120 volts durante 90 minutos. As proteínas resolvidas foram transferidas para membranas de PVDF por blotting semisseco a 20 volts durante 45 a 50 minutos. A ligação não específica foi bloqueada com uma solução de 10% de leite em pó desnatado em solução salina tamponada com fosfato com tween-20 a 0,1% (PBS-T) durante 60 minutos. Os anticorpos de HA (Sigma) ou V5 (Santa Cruz) foram diluídos em solução de leite a 5% e incubados com membranas durante 1 hora seguido de 3 lavagens com PBS-T antes da adição de diluição 1: 2000 de anticorpo secundário anti-camundongo de cabra conjugado com peroxidase de raiz- forte (Santa Cruz) durante 1 hora. Subsequentemente, as manchas são lavadas três vezes em PBS-T e desenvolvidas com enzima quimiluminescência ligada à enzima (ECL, kit (Thermo-Pierce) e visualizadas com filme de raios-X.[0168] Expression of EpiGraph proteins was demonstrated by SDS-polyacrylamide gel electrophoresis (SDS-page) and by Western blotting developed with antibodies to the V5 or hemagglutinin epitope tag manipulated in each construct. Briefly, 10% polyacrylamide gels were prepared and loaded with 10 µl (10% of each sample) and electrophoresed at 110 to 120 volts for 90 minutes. Resolved proteins were transferred to PVDF membranes by semi-dry blotting at 20 volts for 45 to 50 minutes. Nonspecific binding was blocked with a solution of 10% skimmed milk powder in phosphate-buffered saline with 0.1% tween-20 (PBS-T) for 60 minutes. Antibodies to HA (Sigma) or V5 (Santa Cruz) were diluted in 5% milk solution and incubated with membranes for 1 hour followed by 3 washes with PBS-T before adding 1:2000 dilution of anti-Sigma secondary antibody. goat mouse conjugated with horseradish peroxidase (Santa Cruz) for 1 hour. Subsequently, the blots are washed three times in PBS-T and developed with enzyme-linked chemiluminescence (ECL) kit (Thermo-Pierce) and visualized with X-ray film.
[0169] Todos os construtos testados demonstraram expressão temporária robusta a proteínas do peso molecular previsto e confirmaram a sua utilidade para testes na cadeia principal de vetor CMV. (por exemplo, consulte as Figuras 9A a C ).[0169] All tested constructs demonstrated robust temporary expression of proteins of the predicted molecular weight and confirmed their usefulness for testing on the CMV vector backbone. (e.g., see Figures 9A to C).
[0170] Os antígenos de EpiGraph foram projetados para maximizar a cobertura de epítopos de células T representativos do espectro de sequências virais e clados de HIV a partir dos quais os mesmos foram gerados. Para utilizar estes antígenos de forma mais eficaz, os mesmos foram projetados em vetores CMV que demonstraram três vezes o espectro de células T CD8+ de plataformas concorrentes. A ampla apresentação de antígenos e os perfis de expressão ao longo da vida de vetores CMV demonstraram a capacidade de proteger e curar macacos rhesus infectados com SIV. O algoritmo de desenho de antigeno EpiGraph em combinação com vetores CMV pode proporcionar uma cobertura ainda maior do HIV dentro e entre clados quando aplicado a vacinas amplamente profiláticas ou vacinas focalizadas personalizadas.[0170] EpiGraph antigens were designed to maximize coverage of T cell epitopes representative of the spectrum of viral sequences and HIV clades from which they were generated. To utilize these antigens more effectively, they were engineered into CMV vectors that demonstrated three times the CD8+ T cell spectrum of competing platforms. The broad antigen presentation and lifelong expression profiles of CMV vectors have demonstrated the ability to protect and cure SIV-infected rhesus macaques. The EpiGraph antigen design algorithm in combination with CMV vectors can provide even greater coverage of HIV within and across clades when applied to broadly prophylactic vaccines or personalized targeted vaccines.
[0171] As sequências EpiGraph que foram demonstradas como expressão em sistemas de transfecção temporários foram subclonadas no plasmídeo de recombinação (pOri) e transferidas para cadeias principais de CMV utilizando a recombinação de BAC. (Messerle et al. Proc Natl Acad Sci U S A. 1997 Dec 23;94(26):14759 a 63; e Borst et al. J Virol. 1999 Oct;73(10):8320 a 9).[0171] EpiGraph sequences that were demonstrated to be expressed in temporary transfection systems were subcloned into the recombination plasmid (pOri) and transferred into CMV backbones using BAC recombination. (Messerle et al. Proc Natl Acad Sci U S A. 1997 Dec 23;94(26):14759 to 63; and Borst et al. J Virol. 1999 Oct;73(10):8320 to 9).
[0172] A recombinação de BAC facilita a manipulação de sequências de DNA grandes utilizando enzimas de recombinação reguladas por temperatura e metabólito no contexto da cepa EL250 de E. coli contendo um BAC parental. A recombinação é um processo sequencial em duas etapas que consiste na inserção da sequência de antígeno com um gene de resistência a antibióticos (canamicina) na região alvo seguido pela remoção de cassete de canamicina. Os fragmentos de inserção são amplificados por PCR a partir de DNA modelo contendo o antígeno de interesse mais canamicina utilizando iniciadores com braços de homologia longos (50+ pb).[0172] BAC recombination facilitates the manipulation of large DNA sequences using temperature- and metabolite-regulated recombination enzymes in the context of the E. coli strain EL250 containing a parental BAC. Recombination is a two-step sequential process consisting of insertion of the antigen sequence with an antibiotic resistance gene (kanamycin) into the target region followed by removal of the kanamycin cassette. The insertion fragments are amplified by PCR from template DNA containing the antigen of interest plus kanamycin using primers with long homology arms (50+ bp).
[0173] Para preparar as células bacterianas para a etapa de inserção, culturas de cinco ml foram desenvolvidas de um dia para o outro a 30°C em Caldo Luria (LB) com cloranfenicol e diluído até 50 ml na manhã seguinte. As bactérias se desenvolveram durante aproximadamente 3 a 4 horas adicionais a 30°C (até um OD = 0,6) e depois submetidas a choque térmico por agitação a 42°C durante 15 minutos para induzir as enzimas de recombinação. Após esta indução, as bactérias foram peletizadas (3000 rpm, 10 minutos, 4°C) e, então, lavadas três vezes em água gelada. As células de E. coli se tornaram eletrocompetentes para receber o produto de PCR e a recombinação competente para inserção da sequência na região alvo do BAC. O elemento de inserção purificado (500 ng) foi combinado com 100 ul de E. coli competente em gelo, deslocado para um cadinho de 0,2 cm (Fisher) e eletroporado utilizando o aparelho Bio-rad MicroPulser. Após a eletroporação, as bactérias foram diluídas por adição de 900 ul de meio de cultura LB e deixadas se recuperarem a 30°C durante 2 horas antes do plaqueamento em placas de cloranfenicol/canamicina. As placas foram incubadas a 30°C durante dois dias e as colônias foram filtradas por digestão de restrição e PCR para eventos de recombinação.[0173] To prepare the bacterial cells for the insertion step, five ml cultures were grown overnight at 30°C in Luria Broth (LB) with chloramphenicol and diluted to 50 ml the next morning. The bacteria were grown for approximately 3 to 4 additional hours at 30°C (to an OD = 0.6) and then heat shocked by shaking at 42°C for 15 minutes to induce recombination enzymes. After this induction, the bacteria were pelleted (3000 rpm, 10 minutes, 4°C) and then washed three times in ice-cold water. E. coli cells became electrocompetent to receive the PCR product and recombination competent to insert the sequence into the target region of the BAC. The purified insert (500 ng) was combined with 100 μl of competent E. coli on ice, moved to a 0.2 cm crucible (Fisher), and electroporated using the Bio-rad MicroPulser apparatus. After electroporation, bacteria were diluted by adding 900 μl of LB culture medium and allowed to recover at 30°C for 2 hours before plating on chloramphenicol/kanamycin plates. Plates were incubated at 30°C for two days and colonies were filtered by restriction digestion and PCR for recombination events.
[0174] Os construtos de BAC positivas para recombinação prosseguiram para a segunda etapa em que a cassete de canamicina foi excisado pela indução de arabinose da recombinase de Flip mediada por sítios FRT flanqueadores. Culturas de 5 ml foram desenvolvidas de um dia para o outro em LB + cloranfenicol e diluídas 1:10 na manhã seguinte. Após três horas de crescimento, as bactérias foram tratadas com L-arabinose (Arcos, concentração final de 0,1%) e induzidas durante 1,5 hora a 30°C. Após a indução, as bactérias foram aplicadas por esfregaço em placas de cloranfenicol e incubadas durante dois dias a 30°C. As colônias foram, então, replicadas em placas de cloranfenicol/canamicina e cloranfenicol para analisar clones que tinham perdido resistência à canamicina. Estes clones foram ainda analisados por digestão de restrição e PCR para confirmar o construto.[0174] Recombination-positive BAC constructs proceeded to the second step in which the kanamycin cassette was excised by arabinose induction of Flip recombinase mediated by flanking FRT sites. 5 ml cultures were grown overnight in LB + chloramphenicol and diluted 1:10 the next morning. After three hours of growth, the bacteria were treated with L-arabinose (Arcos, final concentration 0.1%) and induced for 1.5 hours at 30°C. After induction, the bacteria were smeared onto chloramphenicol plates and incubated for two days at 30°C. Colonies were then replicated onto chloramphenicol/kanamycin and chloramphenicol plates to analyze clones that had lost resistance to kanamycin. These clones were further analyzed by restriction digestion and PCR to confirm the construct.
[0175] Reconstituição Viral: Para regenerar o vírus, o DNA de BAC foi transferido para células hospedeiras de mamífero permissivas para o crescimento viral. O DNA de BAC purificado a partir de 10 ml de uma cultura de um dia para o outro foi eletroporado em aproximadamente 1/5 de um frasco confluente de fibroblastos telomerizados (~ 200.000 células). Em suma, as células foram peletizadas (1.500 rpm, 5 minutos) e ressuspensas em 700 ul de Opti-Mem. Esta mistura de células foi, então, adicionada a 50 ul de DNA de BAC e misturada suavemente antes da transferência para um cadinho de 4 mm. A eletroporação foi realizada utilizando o Bio-rad GenePulser II em 0,25 kV e 0,95 uF. Após a eletroporação, as células foram plaqueadas em placas de 100 mm contendo DMEM + FBS a 10% e o meio foi mudado no dia seguinte para remover restos de células. As células foram observadas diariamente quanto à formação de placas e colhidas em CPE completa. As células ligadas restantes foram colhidas por raspador de células e peletizadas por centrifugação (1.500 rpm, 5 minutos), e o sobrenadante contendo o vetor viral reconstituído foi retido para a passagem do vírus recombinante. Os péletes celulares foram lisados por ressuspensão em 100ul de corante de carga de gel contendo 5% de SDS e 10% de 2-mercaptoetanol e centrifugação através de coluna QiaShred (Qiagen, Valencia, CA).[0175] Viral Reconstitution: To regenerate the virus, BAC DNA was transferred into mammalian host cells permissive for viral growth. BAC DNA purified from 10 ml of an overnight culture was electroporated into approximately 1/5 of a confluent flask of telomerized fibroblasts (~200,000 cells). Briefly, cells were pelleted (1,500 rpm, 5 minutes) and resuspended in 700 μl of Opti-Mem. This cell mixture was then added to 50 μl of BAC DNA and mixed gently before transferring to a 4 mm crucible. Electroporation was performed using the Bio-rad GenePulser II at 0.25 kV and 0.95 uF. After electroporation, cells were plated in 100 mm dishes containing DMEM + 10% FBS and the medium was changed the next day to remove cell debris. Cells were observed daily for plaque formation and harvested in complete CPE. The remaining bound cells were harvested by cell scraper and pelleted by centrifugation (1,500 rpm, 5 minutes), and the supernatant containing the reconstituted viral vector was retained for passage of the recombinant virus. Cell pellets were lysed by resuspension in 100ul gel loading dye containing 5% SDS and 10% 2-mercaptoethanol and centrifugation through a QiaShred column (Qiagen, Valencia, CA).
[0176] Expressão de EpiGraph Viral: A expressão das proteínas EpiGraph foi testada por eletroforese em gel de poliacrilamida SDS (SDS-page) e por Western blotting desenvolvido com anticorpos para o V5 ou marcador de epítopo de hemaglutinina manipulado em cada construto. Brevemente, géis de poliacrilamida a 10% foram preparados e carregados com 10 ul (10% de cada amostra) e submetidos à eletroforese a 110 a 120 volts durante 90 minutos. As proteínas resolvidas foram transferidas para membranas de PVDF por blotting semisseco a 20 volts durante 45 a 50 minutos. A ligação não específica foi bloqueada com uma solução de 10% de leite em pó desnatado em solução salina tamponada com fosfato com tween-20 a 0,1% (PBS-T) durante 60 minutos. Os anticorpos de HA (Sigma) ou V5 (Santa Cruz) foram diluídos em solução de leite a 5% e incubados com membranas durante 1 hora seguido de 3 lavagens com PBS-T antes da adição de diluição 1: 2000 de anticorpo secundário anti-camundongo de cabra conjugado com peroxidase de raiz-forte (Santa Cruz) durante 1 hora. Subsequentemente, as manchas foram lavadas três vezes em PBS-T e desenvolvidas com enzima quimiluminescência ligada à enzima (ECL, kit (Thermo-Pierce) e visualizadas com filme de raios-X.[0176] Viral EpiGraph Expression: Expression of EpiGraph proteins was tested by SDS-polyacrylamide gel electrophoresis (SDS-page) and by Western blotting developed with antibodies to the V5 or hemagglutinin epitope tag manipulated in each construct. Briefly, 10% polyacrylamide gels were prepared and loaded with 10 μl (10% of each sample) and electrophoresed at 110 to 120 volts for 90 minutes. Resolved proteins were transferred to PVDF membranes by semi-dry blotting at 20 volts for 45 to 50 minutes. Nonspecific binding was blocked with a solution of 10% skimmed milk powder in phosphate-buffered saline with 0.1% tween-20 (PBS-T) for 60 minutes. Antibodies to HA (Sigma) or V5 (Santa Cruz) were diluted in 5% milk solution and incubated with membranes for 1 hour followed by 3 washes with PBS-T before adding 1:2000 dilution of anti-Sigma secondary antibody. goat mouse conjugated with horseradish peroxidase (Santa Cruz) for 1 hour. Subsequently, the blots were washed three times in PBS-T and developed with enzyme-linked chemiluminescence (ECL) kit (Thermo-Pierce) and visualized with X-ray film.
[0177] Todos os construtos testados demonstraram expressão estável robusta a proteínas do peso molecular previsto, dessa forma, confirmando a sua utilidade para testes de imunogenicidade no modelo de vacina CMV em rhesus. (por exemplo, consulte a Figura 10A a B).[0177] All tested constructs demonstrated robust stable expression of proteins of the predicted molecular weight, thus confirming their usefulness for immunogenicity tests in the CMV vaccine model in rhesus. (for example, see Figure 10A to B).
[0178] O algoritmo Epigraph foi utilizado para criar um conjunto de antígenos de vacina utilizando inicialmente vetores CMV, entretanto, outros sistemas de administração de vacinas podem ser utilizados.[0178] The Epigraph algorithm was used to create a set of vaccine antigens initially using CMV vectors, however, other vaccine delivery systems can be used.
[0179] O grupo M (global) foi considerado, bem como clado B e C (uso geograficamente limitado para regiões onde estes clados particulares são endêmicos). Antígenos de vacina Epigraph de Gag, Pol e Nef foram gerados. Grupos B e M são expressados.[0179] Group M (global) was considered, as well as clade B and C (geographically limited use to regions where these particular clades are endemic). Epigraph vaccine antigens of Gag, Pol, and Nef were generated. Groups B and M are expressed.
[0180] Os Epigraphs usam uma teoria de gráfico/abordagem de programação dinâmica para projetar antígenos que maximizam a potencial cobertura de epítopo de células T (PTE). Sob certas condições, os mesmos são matematicamente ideais e são muito computacionalmente eficientes. Os Epigraphs têm um benefício tangível adicional em relação a antígenos Mosaico, pelo fato de que o benefício de excluir epítopos cada vez mais raros nos construtos pode ser equilibrado tolerando-se custos de cobertura de PTE mínimos. Estes Epigraphs foram projetados considerando esse fato, permitindo um ligeiro custo de cobertura (0,005) para assegurar que mesmo os epítopos mais raros representados nos antígenos Epigraph foram observados em muitas das sequências de população (o número preciso depende do conjunto de dados de entrada).[0180] Epigraphs use a graph theory/dynamic programming approach to design antigens that maximize potential T cell epitope coverage (PTE). Under certain conditions, they are mathematically ideal and are very computationally efficient. Epigraphs have an additional tangible benefit over Mosaic antigens in that the benefit of excluding increasingly rare epitopes in the constructs can be balanced by tolerating minimal PTE coverage costs. These Epigraphs were designed with this fact in mind, allowing for a slight coverage cost (0.005) to ensure that even the rarest epitopes represented in the Epigraph antigens were observed in many of the population sequences (the precise number depends on the input dataset).
[0181] Os conjuntos de dados de entrada para estes Epigraphs foram obtidos a partir do conjunto de alinhamento da sequência de banco de dados de HIV para cada uma das proteínas, Gag, Pol e Nef, incluindo uma sequência por pessoa, circa Set 2014. Sequências incompletas foram excluídas. Isto deixou os seguintes números de sequências para cada conjunto de proteínas, Nseqs é o número de sequências no alinhamento de entrada [0181] The input data sets for these Epigraphs were obtained from the HIV database sequence alignment set for each of the proteins, Gag, Pol and Nef, including one sequence per person, circa Sep 2014. Incomplete sequences were excluded. This left the following sequence numbers for each set of proteins, Nseqs is the number of sequences in the input alignment
[0182] Os conjuntos de antígenos Epigraph emparelhados para uma vacina bivalente foram sequencialmente resolvidos utilizando o algoritmo Epigraph para sequências não alinhadas. A solução sequencial foi utilizada, o que permite o uso do primeiro Epigraph como uma vacina monovalente em isolamento. Isso significa que os mesmos são projetados de modo que o melhor antígeno Epigraph único, um "epissenso", seja resolvido primeiro para fornecer a cobertura ideal de PTE de uma população, e, então, seja fixado para inclusão no design bivalente. O complemento é então resolvido para fornecer a melhor cobertura de PTE de população por um par bivalente de antígenos que contém o primeiro Epigraph, o epissenso. Os custos de cobertura foram mínimos em relação a uma solução de antígeno simultânea.[0182] Paired Epigraph antigen sets for a bivalent vaccine were sequentially resolved using the Epigraph algorithm for unaligned sequences. The sequential solution was used, which allows the use of the first Epigraph as a monovalent vaccine in isolation. This means they are designed so that the best single Epigraph antigen, an “episense,” is resolved first to provide optimal PTE coverage of a population, and is then fixed for inclusion in the bivalent design. The complement is then resolved to provide the best population PTE coverage by a bivalent pair of antigens that contain the first Epigraph, the episense. Coverage costs were minimal relative to a simultaneous antigen solution.
[0183] Uma análise foi, então, realizada para determinar o custo de cobertura de excluir variantes raras. Os dados são resumidos na tabela a seguir. fo é o limiar de epítopo raro. As sequências são produzidas após descartar todos os que aparecem em fo ou menos sequências. Em outras palavras, cada PTE que está na vacina apareceu em mais de fo sequências. Esses valores de fo eram os maiores possíveis enquanto alcançavam uma cobertura que estava dentro de 0,005 da cobertura máxima alcançada quando fo=0. Nseqs é o número de sequências no alinhamento de entrada. [0183] An analysis was then performed to determine the coverage cost of excluding rare variants. The data is summarized in the following table. fo is the rare epitope threshold. Sequences are produced after discarding all that appear in fo or fewer sequences. In other words, each PTE that is in the vaccine appeared in more than four sequences. These fo values were the largest possible while achieving coverage that was within 0.005 of the maximum coverage achieved when fo=0. Nseqs is the number of sequences in the input alignment.
[0184] Os antígenos Epigraph básicos foram projetados como proteínas completas, e estes foram expressados em vetores CMV e testados como proteínas de fusão Gag/Nef ou Pol com deleções feitas por segurança ou como as regiões mais conservadas de Gag e Nef fundidas ou as regiões mais conservadas de Pol fundidas. Listas de cada forma de proteína completa para a expressão no vetor CMV são incluídas abaixo com exemplos do grupo M e do clado B.[0184] The basic Epigraph antigens were designed as complete proteins, and these were expressed in CMV vectors and tested as Gag/Nef or Pol fusion proteins with deletions made for safety or as the most conserved regions of Gag and Nef fused or the regions more conserved than fused Pol. Lists of each full-length protein form for expression in the CMV vector are included below with examples from group M and clade B.
[0185] As regiões conservadas para antígenos de vacina são excisadas das proteínas Epigraph de comprimento total.[0185] The conserved regions for vaccine antigens are excised from the full-length Epigraph proteins.
[0186] As regiões conservadas dentro de Gag, Pol e Nef foram definidas com base no potencial para a cobertura de PTE por uma vacina bivalente (isto é, 2 antígenos). Isto é, os mesmos eram baseados no potencial de dois antígenos otimizados para proporcionar cobertura PTE do clado B. As sequências para as regiões conservadas são mostradas na lista abaixo. Os limites foram selecionados para capturar a metade mais conservada de cada uma das três proteínas (Gag, Pol e Nef), no fragmento contíguo possível mais longo, então as regiões conservadas são intercaladas com seções mais variáveis. Em Gag, os contornos refletem simplesmente os contornos da proteína capsidial p24.[0186] The conserved regions within Gag, Pol and Nef were defined based on the potential for PTE coverage by a bivalent vaccine (i.e. 2 antigens). That is, they were based on the potential of two optimized antigens to provide clade B PTE coverage. The sequences for the conserved regions are shown in the list below. The boundaries were selected to capture the most conserved half of each of the three proteins (Gag, Pol, and Nef), in the longest possible contiguous fragment, so the conserved regions are interspersed with more variable sections. In Gag, the contours simply reflect the contours of the capsid protein p24.
[0187] Para os antígenos personalizados, Gag ou a parte mais conservada de Gag, p24 foram usados. Para um projeto, os 2015 alinhamentos de grupo M completos de 4596 sequências foram usados, para fornecer uma solução global. Um alinhamento de 189 sequências de clado B contemporâneas foi isolado nos EUA, ou um alinhamento de 199 sequências de clado C contemporâneas da África do Sul. "Contemporâneo" refere-se a vírus que foram isolados após 2004; Todas as sequências amostradas na última década foram usadas para obter uma amostragem razoável de sequências de cada região. As sequências que não foram totalmente resolvidas ou estavam incompletas foram excluídas. Os vírus contemporâneos específicos de subtipos regionais foram selecionados, pois os mesmos representam correspondências satisfatórias para populações que seriam prováveis para estudos iniciais de prova de conceito para avaliação de vacinas personalizadas; usando conjuntos regionais de subtipo único, a diversidade de populações poderia ser limitada para aumentar o potencial de sucesso de uma vacina terapêutica contra o HIV.[0187] For personalized antigens, Gag or the more conserved part of Gag, p24 were used. For one project, the 2015 complete M-group alignments of 4596 sequences were used, to provide a global solution. An alignment of 189 contemporary clade B sequences was isolated from the US, or an alignment of 199 contemporary clade C sequences from South Africa. "Contemporary" refers to viruses that were isolated after 2004; All sequences sampled over the past decade were used to obtain a reasonable sampling of sequences from each region. Sequences that were not fully resolved or were incomplete were excluded. Regional subtype-specific contemporary viruses were selected because they represent satisfactory matches for populations that would be likely for initial proof-of-concept studies to evaluate personalized vaccines; Using regional single-subtype pools, population diversity could be limited to increase the potential for success of a therapeutic HIV vaccine.
[0188] Estes antígenos de vacina terapêuticos são projetados para serem usados em cenários de tratamento em que poderiam ser combinados ou “personalizados”, para o vírus infectante sequenciado da pessoa que receberia a vacina. 6 antígenos de vacina poderiam ser fabricados, as melhores 2 ou 3 correspondências a partir do conjunto para o vírus infectante de indivíduos poderiam ser dadas a um indivíduo para maximizar as correspondências entre a vacina e sua cepa infectante.[0188] These therapeutic vaccine antigens are designed to be used in treatment scenarios where they could be matched, or “customized,” to the sequenced infecting virus of the person receiving the vaccine. 6 vaccine antigens could be manufactured, the best 2 or 3 matches from the pool to the individuals infecting virus could be given to an individual to maximize matches between the vaccine and its infecting strain.
[0189] Assim, a Gag completa para cada epigraph é fornecida abaixo, para a fabricação da solução de 6 antígenos personalizados, com p24 como em negrito. Gag ou a p24 mais conservada poderia ser utilizada em uma vacina personalizada.[0189] Thus, the complete Gag for each epigraph is provided below, for manufacturing the custom 6-antigen solution, with p24 as in bold. Gag or the more conserved p24 could be used in a personalized vaccine.
[0190] As pontuações de PTE compatíveis e as pontuações incompatíveis (número de extras), para a distribuição dos n melhores antígenos correspondentes dentre um grupo de m, para proteínas Gag ou a região p24 interior, em que os n são selecionados para cobrir melhor cada sequência individual na população alvo. As populações alvo são a população infectada por clado C contemporânea amostrada na África do Sul, ou a população de clado B contemporânea amostrada nos EUA. As melhores soluções usam um grupo de m=6 antígenos, e estão em negrito; essas são baseadas nas seis sequências mostradas acima.[0190] Compatible PTE scores and incompatible scores (number of extras), for the distribution of the n best matching antigens from a group of m, for Gag proteins or the interior p24 region, where the n are selected to best cover each individual sequence in the target population. Target populations are the contemporary clade C-infected population sampled in South Africa, or the contemporary clade B population sampled in the USA. The best solutions use a group of m=6 antigens, and are in bold; these are based on the six sequences shown above.
[0191] Cobertura de Epítopo de Gag de clado C da África do Sul [0191] South African Clade C Gag Epitope Coverage
[0192] Cobertura de Epítopo de Gag de p24 de clado C da África do Sul [0192] South African clade C p24 Gag Epitope Coverage
[0193] Cobertura de Epítopo de Gag de clado B dos EUA [0193] US Clade B Gag Epitope Coverage
[0194] Cobertura de Epítopo de p24 de clado B dos EUA [0194] US Clade B p24 Epitope Coverage
[0195] As ramificações de vacina para teste inicial em CMV incluem: 1) Um único antígeno Gag de epissenso de população, essencial para o clado B epidêmico dos EUA; 2) O episenso de população mais uma proteína Gag personalizada selecionada para ser uma cepa natural de HIV-1 de melhor correspondência; 3) O epissenso de população mais uma proteína Gag personalizada selecionada para ser uma cepa de HIV-1 natural de melhor correspondência diferente (e distante); 4) O epissenso de população mais ambas as proteínas Gag da coorte 2 e 3. As respostas imunológicas resultantes são analisadas usando peptídeos de 15- unidades de repetição sobrepostos (sobreposição de 4 aminoácidos) correspondentes ao antígeno da vacina (para determinar as respostas específicas específicas de Gag induzidas pela vacina) e, então, à cepa de HIV-1 “alvo” e cepas de HIV não alvo selecionadas (consulte abaixo) para medir as respostas específicas da cepa e o nível de correspondência de epítopos (comparando sequências de Gag de HIV alvo vs. não alvo). Foi determinado que as inserções computacionalmente projetadas e as combinações de vetor proporcionam uma maior magnitude e respostas de células T mais amplas à cepa alvo, enquanto minimizam as respostas correspondentes à cepa não-alvo. Os resultados desta análise permitem testar experimentalmente as previsões de correspondência de epítopos geradas no Exemplo 1.[0195] Vaccine ramifications for initial testing in CMV include: 1) A single population episense Gag antigen, essential for the US epidemic clade B; 2) Population episense plus a custom Gag protein selected to be a best-match natural HIV-1 strain; 3) Population episense plus a custom Gag protein selected to be a different (and distant) best-match natural HIV-1 strain; 4) Population episense plus both Gag proteins from cohorts 2 and 3. Resulting immune responses are analyzed using overlapping 15-repeat unit peptides (4 amino acid overlap) corresponding to the vaccine antigen (to determine specific specific responses vaccine-induced Gag sequences) and then to the “target” HIV-1 strain and selected non-target HIV strains (see below) to measure strain-specific responses and the level of epitope matching (comparing Gag sequences from HIV target vs. non-target). It was determined that computationally designed insertions and vector combinations provide greater magnitude and broader T cell responses to the target strain, while minimizing responses corresponding to the non-target strain. The results of this analysis allow us to experimentally test the epitope matching predictions generated in Example 1.
[0196] Quatro coortes de 5 Macacos Rhesus (RM) são inoculadas com 106 PFU de vetores HCMV da seguinte forma: a coorte 1 recebe um único vetor contendo a sequência de epissenso de clado B, a coorte 2 recebe o vetor de epissenso mais um único vetor de vacina personalizada, a coorte 3 recebe o epissenso mais um vetor de vacina personalizada diferente e a coorte 4 recebe o epissenso mais ambos os vetores de vacina personalizada. As vacinas são "personalizadas" para 2 cepas de HIV transmitidas/fundadoras representativas selecionadas a partir de um pequeno conjunto de 9 infecções por HIV de U.S. do clado B que foram extensivamente sequenciadas longitudinalmente; este painel representa um espectro de infecção natural comparável com o que poderia ser encontrado em um ensaio clínico humano. Essencialmente, estas duas cepas naturais divergentes estão sendo usadas como protótipos por pacientes. O par de elementos de inserção insertos de vacina, que é otimizado para um, será subideal para o outro e vice-versa, permitindo - através da determinação do reconhecimento cruzado a conjuntos de peptídeos que refletem cada sequência específica de cepa - análise recíproca da possibilidade de existir um benefício para a presente estratégia de correspondência de sequências personalizadas Além desta análise recíproca, a sequência das outras 7 infecções variará na sua "correspondência" relativa ao(s) elemento(s) de inserção do vetor de vacina selecionado(s) e analisando as respostas aos conjuntos de peptídeos que refletem as sequências destas outras 7 cepas de HIV, a reação entre a sequência de inserção de vetor e a combinação de vetor em magnitude e amplitude de respostas compatíveis versus incompatíveis será amplamente analisada. Parte da motivação para se concentrar neste conjunto de 9 cepas é que os genomas de comprimento total cuidadosamente sequenciados estão disponíveis a partir de amostras longitudinais. Os isolados também estão disponíveis como clones moleculares infecciosos, que podem ser úteis para avaliar respostas em estudos humanos subsequentes. Dessa forma, fazendo o trabalho de base em RM usando este conjunto, haverá um conjunto compatível de proteínas particularmente útil para comparações diretas entre respostas de macacos e seres humanos quando essas vacinas são avançadas em estudos em seres humanos.[0196] Four cohorts of 5 Rhesus Macaques (RM) are inoculated with 106 PFU of HCMV vectors as follows: cohort 1 receives a single vector containing the clade B episense sequence, cohort 2 receives the episense vector plus one single personalized vaccine vector, cohort 3 receives episense plus a different personalized vaccine vector, and cohort 4 receives episense plus both personalized vaccine vectors. The vaccines are "customized" to 2 representative transmitted/founder HIV strains selected from a small set of 9 clade B U.S. HIV infections that have been extensively sequenced longitudinally; this panel represents a spectrum of natural infection comparable to what would be found in a human clinical trial. Essentially, these two divergent natural strains are being used as prototypes by patients. The pair of vaccine insert insertion elements, which is optimized for one, will be suboptimal for the other and vice versa, allowing - through determination of cross-recognition to sets of peptides reflecting each strain-specific sequence - reciprocal analysis of the possibility that there is a benefit to the present custom sequence matching strategy. In addition to this reciprocal analysis, the sequence of the other 7 infections will vary in their "match" relative to the selected vaccine vector insertion element(s) and By analyzing the responses to sets of peptides that reflect the sequences of these other 7 HIV strains, the reaction between the vector insertion sequence and the vector combination in magnitude and breadth of compatible versus incompatible responses will be extensively analyzed. Part of the motivation for focusing on this set of 9 strains is that carefully sequenced full-length genomes are available from longitudinal samples. Isolates are also available as infectious molecular clones, which may be useful for evaluating responses in subsequent human studies. Thus, by doing the groundwork in MRI using this set, there will be a compatible set of proteins particularly useful for direct comparisons between macaque and human responses when these vaccines are advanced into human studies.
[0197] Os macacos Rhesus (RM) são inoculados de forma subcutânea no dia 0 e semana 12 e acompanhados longitudinalmente durante um ano. Uma vez que a vacinação por vetores HCMV não é afetada pela imunidade anti-RhCMV pré- existente, os animais naturalmente infectados com RhCMV são utilizados para estas experiências. A análise de citocinas intracelulares por citometria de fluxo (ICS) é usada para determinar a resposta das células T CD4+ e CD8+ a peptídeos de 15 unidades de repetição consecutivos individuais compreendendo as sequências de vacina dentro das inserções de vacina administradas a cada animal (que irão compreender as respostas totais induzidas pela vacina). É, então, determinado que estas células T específicas de epítopo reconhecem variantes de epítopo tanto na cepa alvo como nas outras 8 cepas não-alvo. Para os peptídeos que mostram respostas a epítopos específicos de cepa, a magnitude, avidez funcional e características funcionais (produção de IFN-y, TNF-a, IL-2 e MIP-1β e externalização de CD107) destas respostas às variantes de peptídeos "parentais” são comparadas para determinar o grau de reatividade cruzada funcional. Em casos selecionados, a análise de truncagem é usada para identificar o epítopo nuclear para análises comparativas similares. Para determinar a porcentagem de células T CD8+ restritas a MHC-II presentes, mAbs "bloqueadores" específicos para MHC-I e MHC-II, e o peptídeo de ligação específico para MHC-II derivado da cadeia invariante, CLIP, são usados para inibir respostas de células T CD8+ específicas para gripe em PBMC, como foi feito anteriormente para respostas de SIV.[0197] Rhesus monkeys (RM) are inoculated subcutaneously on day 0 and week 12 and followed longitudinally for one year. Since vaccination by HCMV vectors is not affected by pre-existing anti-RhCMV immunity, animals naturally infected with RhCMV are used for these experiments. Intracellular cytokine analysis by flow cytometry (ICS) is used to determine the response of CD4+ and CD8+ T cells to individual consecutive 15 repeat unit peptides comprising the vaccine sequences within the vaccine inserts administered to each animal (which will understand the total responses induced by the vaccine). It is then determined that these epitope-specific T cells recognize epitope variants in both the target strain and the other 8 non-target strains. For peptides that show responses to strain-specific epitopes, the magnitude, functional avidity and functional characteristics (production of IFN-γ, TNF-a, IL-2 and MIP-1β and externalization of CD107) of these responses to the peptide variants" parental” are compared to determine the degree of functional cross-reactivity. In selected cases, truncation analysis is used to identify the nuclear epitope for similar comparative analyses. To determine the percentage of MHC-II restricted CD8+ T cells present, mAbs " blockers" specific for MHC-I and MHC-II, and the invariant chain-derived MHC-II-specific binding peptide, CLIP, are used to inhibit influenza-specific CD8+ T cell responses in PBMC, as has been done previously for influenza-specific of SIV.
[0198] Independentemente dos resultados de iniciação de células T relacionados a genes específicos de vetor, a análise imunológica permite testar a hipótese de que as células T induzidas por vacinas personalizadas são superiores em relação à cobertura de epítopo de um dado reservatório natural de HIV em comparação com vacinas não personalizadas. O coquetel de 2 antígenos personalizado poderia provavelmente gerar respostas de células T com uma frequência pelo menos 25% maior de respostas com reatividade cruzada à sua cepa natural correspondente em comparação com epissenso individualmente (Tabela 5). Um teste também foi feito para determinar se a inclusão de 3 antígenos personalizados complementares em um coquetel induz mais reatividade cruzada ou se a diluição do antígeno ou a presença de um maior número de epítopos específicos da vacina necessários adicionando 3 em vez de 2 antígenos diminui realmente a magnitude ou amplitude da resposta com reatividade cruzada à proteína natural. Espera-se que as respostas das células T baseadas em CMV sejam muito mais amplas e, portanto, cobrem uma porcentagem muito maior de sequências do que a relatada anteriormente para outros vetores. Dessa forma, mesmo com um número relativamente pequeno de animais, deve haver respostas de epítopos suficientes para avaliar o impacto da variação da sequência no potencial de reatividade cruzada das respostas. O número e a magnitude de todas as respostas às vacinas são determinados usando conjuntos de peptídeos correspondentes à vacina. Uma vez que os peptídeos almejados são determinados, usa-se apenas aqueles peptídeos que são positivos em cada animal, determina-se o impacto de variação natural em cada peptídeo responsivo à vacina. As variantes naturais que são testadas são baseadas na variação encontrada em um painel de referência, incluindo ambas as Gags personalizadas e mal combinados. Métodos estatísticos de reamostragem não-paramétricos e computacionais são usados como as ferramentas principais para avaliar o impacto de variação do epítopo sobre a redução de magnitude ou a anulação de reconhecimento. Essas análises são complementadas, entretanto, usando modelos lineares generalizados como necessário para explorar o impacto de interações mais complexas sobre a reatividade cruzada de resposta de células T. SEQ ID NO: 691 Sequência epissenso de antígenos de vacina personalizada. MGARASVLSGGELDRWEKIRLRPGGKKKYKLKHIVWASRELERFAVNPGLLETSEGCRQILGQLQPSLQTGSEEL KSLYNTVATLYCVHQKIEVKDTKEALDKIEEEQNKSKKKAQQ AAADTGNSS QVSQNYPIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQML KETINEEAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRM YSPTSILDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQ GVGGPGHKARVLAEAMSQVTN-- SATIMMQRGNFRNQRKTVKCFNCGKEGHIARNCRAPRKKGCWKCGKEGHQMKDC--TERQANFLGKIWPSH- KGRPGNFLQ SRPEPT APPEESFRFGEETTTPS QKQEPIDKE LYP-LASLRSLFGNDPSSQ SEQ ID NO: 692 Sequência de antígenos 1 de vacina personalizada. MGARASVLSGGELDKWEKIRLRPGGKKKYRLKHIVWASRELERFAVNPGLLETSGGCRQILEQLQPSLQTGSEEL RSLYNTVATLYCVHQKIDVKDTKEALEKIEEEQNKSKKKAQQ AAAAADTGNNS QVSQNYPIVQNMQGQMVHQALSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNTMLNSVGGHQAAMQML KETINEEAAEWDRVHPVHAGPVAPGQMREPRGSDIAGTTSTLQEQIGWMTSNPPIPVGEIYKRWIIMGLNKIVRM YSPTSILDIKQGPKEPFRDYVDRFYKTLRAEQATQEVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQ GVGGPSHKARVLAEAMSQATN-- SATIMMQKGNFRNQRKIVKCFNCGKEGHIAKNCRAPRKKGCWKCGREGHQMKDC--TERQVNFLGKIWPSH- KGRPGNFLQ NRPEPT APPAESFRFGEETTTPP QKQEPIDKE LYP-LASLKSLFGNDPSSQ SEQ ID NO: 693 Sequência de antígenos 2 de vacina personalizada. MGARASVLSGGKLDKWEKIRLRPGGKKRYKLKHIVWASRELERFAVNPGLLETAEGCRQILGQLQPALQTGSEEL KSLFNTVATLYCVHQRIDVKDTKEALEKIEEEQNKSKKKAQP AAADTGSSS QVSQNYPIVQNMQGQMVHQAISPRTLNAWVKVIEEKAFSPEVIPMFAALSEGATPQDLNLMLNTVGGHQAAMQML KETINEEAAEWDRLHPVHAGPVAPGQMREPRGSDIAGTTSTLQEQIGWMTHNPPIPVGEIYKKWIIMGLNKIVRM YSPTSILDIKQGPKEPFRDYVDRFYKTLRAEQATQEVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQ GVGGPSHKARVLAEAMSQATN-- SATIMMQRGNFKNQRKTIKCFNCGKEGHIAKNCRAPRKKGCWKCGREGHQMKDC--TERQANFLGKIWPSH- KGRPGNFLQ NRPEPT APPAESFRFGEETTTPP QKQEPIDKE LYP-LASLKSLFGNDPSSQ SEQ ID NO: 694 Sequência de antígenos 3 de vacina personalizada. MGARASVLSGGELDKWEKIRLRPGGKKKYRLKHIVWASRELERFAVNPGLLETSGGCRQILEQLQPSLQTGSEEL RSLYNTVATLYCVHQKIDVKDTKEALEKIEEEQNKSKKKAQQ AAAAADTGNNS QVSQNYPIVQNMQGQMVHQALSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNTMLNSVGGHQAAMQML KETINEEAAEWDRVHPVHAGPVAPGQMREPRGSDIAGTTSTLQEQIGWMTSNPPIPVGEIYKRWIIMGLNKIVRM YSPTSILDIKQGPKEPFRDYVDRFYKTLRAEQATQEVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQ GVGGPSHKARVLAEAMSQATN-- SATIMMQKGNFRNQRKIVKCFNCGKEGHIAKNCRAPRKKGCWKCGREGHQMKDC--TERQVNFLGKIWPSH- KGRPGNFLQ NRPEPT APPAESFRFGEETTTPP QKQEPIDKE LYP-LASLKSLFGNDPSSQ SEQ ID NO: 695 Sequência de antígenos 4 de vacina personalizada. MGARASVLSGGKLDKWEKIRLRPGGKKKYRLKHIVWASRELERFAVNPGLLETAEGCRQILGQLQPALQTGSEEL RSLYNTVATLYCVHQRIEVKDTKEALEKIEEEQNKSKKKVQQ AAAADTGNSN QVSQNYPIVQNIQGQMVHQPLSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNTMLNTIGGHQAAMQML KETINEEAADWDRLHPVHAGPVAPGQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGEIYKRWIIMGLNKIVRM YSPTSILDIKQGPKEPFRDYVDRFYKTLRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQ GVGGPSHKARVLAEAMSQVTN-- SATIMMQKGNFRNQRKIVKCFNCGKEGHIAKNCRAPRKRGCWKCGKEGHQMKEC--TERQANFLGKIWPSY- KGRPGNFLQ SRPEPS APPEESFRFGEETATPS QKQEPIDKE LYP-LASLKSLFGNDPSSQ SEQ ID NO: 696 Sequência de antígenos 5 de vacina personalizada. MGARASVLSGGKLDKWEKIRLRPGGKKQYKLKHLVWASRELERFAVNPGLLETAEGCRQILGQLQPALQTGSEEL KSLFNTVATLYCVHQRIDVKDTKEALEKIEEEQNKSKKKAQQ AAADTGNNS QVSQNYPIVQNIQGQMVHQALSPRTLNAWVKVIEEKAFSPEVIPMFSALAEGATPQDLNTMLNTVGGHQAAMQIL KETINEEAAEWDRLHPVQAGPVAPGQMREPRGSDIAGTTSNLQEQIAWMTHNPPIPVGEIYKRWIIMGLNKIVRM YSPVSILDIRQGPKEPFRDYVDRFYKTLRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQ GVGGPSHKARVLAEAMSQATN-- PATIMMQRGNFKNQRKIVKCFNCGKEGHIAKNCRAPRKKGCWKCGKEGHQMKEC--TERQANFLGKIWPSY- KGRPGNFLQ SRPEPS APPEESFRFGEETTTPP QKQEPIDKE LYP-LTSLRSLFGNDPSSQ SEQ ID NO: 697 EpiGraph de Sequência de antígeno 1. MGARASVLSGGELDRWEKIRLRPGGKKKYKLKHIVWASRELERFAVNPGLLETSEGCRQILGQLQPSLQTGSEEL KSLYNTVATLYCVHQRIDVKDTKEALDKIEEEQNKSKKKAQQ AAADTGNSS QVSQNYPIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQML KETINEEAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRM YSPTSILDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQ GVGGPGHKARVLAEAMSQVTN-- SATIMMQRGNFRNQRKTVKCFNCGKEGHIARNCRAPRKKGCWKCGKEGHQMKDC--TERQANFLGKIWPSH- KGRPGNFLQ SRPEPT APPEESFRFGEETTTPS QKQEPIDKE LYP-LASLRSLFGNDPSSQ SEQ ID NO: 698 EpiGraph de Antígeno 1 de coquetel. MGARASVLSGGELDRWEKIRLRPGGKKKYKLKHIVWASRELERFAVNPGLLETSEGCRQILGQLQPSLQTGSEEL KSLYNTVATLYCVHQRIDVKDTKEALDKIEEEQNKSKKKAQQ AAADTGNSS QVSQNYPIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQML KETINEEAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRM YSPTSILDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQ GVGGPGHKARVLAEAMSQVTN-- SATIMMQRGNFRNQRKTVKCFNCGKEGHIARNCRAPRKKGCWKCGKEGHQMKDC--TERQANFLGKIWPSH- KGRPGNFLQ SRPEPT APPEESFRFGEETTTPS QKQEPIDKE LYP-LASLRSLFGNDPSSQ SEQ ID NO: 699 EpiGraph de Antígeno 2 de coquetel. MGARASVLSGGKLDKWEKIRLRPGGKKKYRLKHIVWASRELERFALNPGLLETAEGCRQILGQLQPALQTGSEEL KSLFNTVATLYCVHQKIDVKDTKEALEKIEEEQNKSKKKAQQ AAAAADTGNNS QVSQNYPIVQNMQGQMVHQALSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNLMLNTVGGHQAAMQIL KETINEEAADWDRLHPVHAGPVAPGQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGEIYKRWIIMGLNKIVRM YSPVSILDIKQGPKEPFRDYVDRVYKTLRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQ GVGGPSHKARVLAEAMSQATN-- SATIMMQKGNFRNQRKIVKCFNCGKEGHIAKNCRAPRKRGCWKCGKEGHQMKEC--TERQANFLGKIWPSY- KGRPGNFLQ NRPEPT APPAESFRFGEETTTPP QKQEPIDKE LYP-LASLKSLFGNDPSSQ SEQ ID NO: 700 EpiGraph de Antígeno 3 de coquetel. ARASVLSGGELDKWEKIRLRPGGKKQYKLKHLVWASRELERFAINPGLLETSGGCRQILEQLQPSLQTGSEELRS LYNTVAVLYCVHQRIEVKDTKEALEKVEEEQNKSKKKVQQ AAADTGNSN QVSQNYPIVQNIQGQMVHQPISPRTLNAWVKVIEDKAFSPEVIPMFAALSEGATPQDLNTMLNTIGGHQAAMQML KDTINEEAAEWDRLHPVQAGPVAPGQMRDPRGSDIAGTTSTLQEQIAWMTNNPPIPVGDIYKRWIILGLNKIVRM YSPTSILDIKQGPKESFRDYVDRFYKTLRAEQATQEVKNWMTETLLVQNANPDCRTILKALGPAATLEEMMSACQ GVGGPSHKARILAEAMSQVTN-- STAIMMQRGNFKNQRKTVKCFNCGREGHIAKNCRAPRKKGCWKCGREGHQMKDCTERQRQANFLGKIWPSS- KGRPGNFLQ SRPEPS APPEESFRFGEETATPS QKQEPIDKE LYP-LTSLRSLFGNDPSLQ SEQ ID NO: 701 Epigraph 1 de fusão de gag/nef de HIV B MGARASVLSGGELDRWEKIRLRPGGKKKYRLKHIVWASRELERFAVNPGLLETSEGCRQILGQLQPSLQTGSEEL KSLYNTVATLYCVHQRIEVKDTKEALDKIEEEQNKSKKKAQQAAADTGNSSQVSQNYPIVQNLQGQMVHQAISPR TLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINEEAAEWDRLHPVHAGPIAP GQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPTSILDIRQGPKEPFRDYVDRF YKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPGHKARVLAEAMSQVTNSAT IMMQRGNFRNQRKTVKCFNCGKEGHIAKNCRAPRKKGCWKCGKEGHQMKDCTERQANFLGKIWPSHKGRPGNFLQ SRPEPTAPPEESFRFGEETTTPSQKQEPIDKELYPLASLKSLFGNDPSSQGGKWSKSSIVGWPAVRERMRRAEPA AEGVGAVSRDLEKHGAITSSNTAATNADCAWLEAQEEEEVGFPVRPQVPLRPMTYKGALDLSHFLKEKGGLEGLI YSQKRQDILDLWVYHTQGYFPDWQNYTPGPGIRYPLTFGWCFKLVPVEPEKVEEANEGENNSLLHPMSQHGMDDP EKEVLMWKFDSRLAFHHMARELHPEYYKDC SEQ ID NO: 702 Epigraph 2 de fusão de gag/nef de HIV B MGARASVLSGGKLDKWEKIRLRPGGKKKYKLKHIVWASRELERFALNPGLLETSEGCKQILGQLQPALQTGSEEL RSLYNTVAVLYCVHQRIDVKDTKEALEKIEEEQNKCKKKAQQAAAAADTGNNSQVSQNYPIVQNMQGQMVHQALS PRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNTMLNTIGGHQAAMQMLKDTINEEAAEWDRVHPVHAGPV APGQMREPRGSDIAGTTSNLQEQIAWMTHNPPIPVGEIYKRWIIMGLNKIVRMYSPVSILDIKQGPKEPFRDYVD RFYRTLRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQVTNS ATIMMQKGNFRNQRKIVKCFNCGKEGHIARNCRAPRKRGCWKCGKEGHQMKECTERQANFLGKIWPSYKGRPGNF LQNRPEPTAPPAESFRFGEETATPPQKQEPIDKEMYPLASLRSLFGNDPSQGGKWSKRSVPGWNTIRERMRRTEP AAEGVGAASRDLERHGAITSSNTAANNAACAWLEAQEDEEVGFPVKPQVPLRPMTYKAAVDLSHFLKEKGGLEGL IHSQKRQEILDLWVYNTQGYFPDWHNYTPGPGTRFPLTFGWCFKLVPVDPEQVEKANEGENNCLLHPMSLHGMDD PEREVLVWKFDSRLAFHHVAREKHPEYYKDC SEQ ID NO: 703 Epigraph 1 de pol de HIV B MFFRENLAFPQGKAREFSSEQTRANSPTRRELQVWGRDNNSLSEAGADRQGTVSFSFPQITLWQRPLVTIKIGGQ LKEALLADDTVLEEMNLPGRWKPKMIGGIGGFIKVRQYDQIPIEICGHKAIGTVLVGPTPVNIIGRNLLTQIGCT LNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIGPENPYNTPVFAIKKKDSTKWR KLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDKDFRKYTAFTIPSINNETPGIRYQYN VLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQLYVGSDLEIGQHRTKIEELRQHLLRWGFTTPDKKHQKEPP FLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYAGIKVKQLCKLLRGTKALTEVVPLTEEAEL ELAENREILKEPVHGVYYDPSKDLIAEIQKQGQGQWTYQIYQEPFKNLKTGKYARMRGAHTNDVKQLTEAVQKIA TESIVIWGKTPKFKLPIQKETWEAWWTEYWQATWIPEWEFVNTPPLVKLWYQLEKEPIVGAETFYVDGAANRETK LGKAGYVTDRGRQKVVSLTDTTNQKTQAIHLALQDSGLEVNIVTDSQYALGIIQAQPDKSESELVSQIIEQLIKK EKVYLAWVPAHKGIGGNEQVDKLVSAGIRKVLFLDGIDKAQEEHEKYHSNWRAMASDFNLPPVVAKEIVASCDKC QLKGEAMHGQVDCSPGIWQLCTHLEGKIILVAVHVASGYIEAEVIPAETGQETAYFLLKLAGRWPVKTIHTNGSN FTSTTVKAACWWAGIKQEFGIPYNPQSQGVVSMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNFKRKGGIGGYSA GERIVDIIATDIQTKELQKQITKIQNFRVYYRDSRDPLWKGPAKLLWKGEGAVVIQDNSDIKVVPRRKAKIIRDY GKQMAGDDCVASRQDED SEQ ID NO: 704 Epigraph 2 de pol de HIV B MFFREDLAFPQGEAREFPSEQTRANSPTSRELQVWGGDNNSPSEAGADRQGTVSLSFPQITLWQRPLVTVKIGGQ LKEALLADDTVLEEMSLPGKWKPKMIGGIGGFIKVRQYDQVPIEICGHKTIGTVLIGPTPVNIIGRNLLTQLGCT LNFPISPIETVPVKLKPGMDGPRVKQWPLTEEKIKALIEICTEMEKEGKISRIGPENPYNTPIFAIKKKDSTKWR KLVDFRELNKKTQDFWEVQLGIPHPSGLKKKKSVTVLDVGDAYFSVPLDKEFRKYTAFTIPSTNNETPGIRYQYN VLPQGWKGSPAIFQCSMTKILEPFRKQNPEIVIYQLYVGSDLEIGQHRAKIEELRQHLLKWGFTTPDKKHQKEPP FLWMGYELHPDKWTVQPIELPEKDSWTVNDIQKLVGKLNWASQIYPGIKVRQLCKLLRGAKALTEVIPLTKEAEL ELAENREILREPVHGVYYDPTKDLIAEIQKQGLGQWTYQIYQEPFKNLKTGKYARTRGAHTNDVRQLTEAVQKIT TESIVIWGKTPKFRLPIQKETWETWWTEYWQATWIPEWEFVNTPPLVKLWYQLEKEPIIGAETFYVDGASNRETK LGKAGYVTNRGRQKVISLTDTTNQKTLQAIYLALQDSGSEVNIVTDSQYALGIIQAQPDQSESELVNQIIEQLIN KEKVYLAWVPAHKGIGGNEQVDKLVSTGIRKVLFLDGIDRAQEEHEKYHNNWRAMASDFNLPPIVAKEIVASCDK CQLKGEAIHGQVDCSPGIWQLCTHLEGKVILVAVHVASGYIEAEVIPAETGQETAYFILKLAGRWPVKTVHTNGS NFTSATVKAACWWAGVKQEFGIPYNPQSQGVVSMNNELKKIIGQIRDQAEHLKTAVQMAVFIHNFKRKGGIGEYS AGERIIDIIATDIQTRELQKQITKIQNFRVYYRDNRDPLWKGPAKLLWKGEGAVVIQDNSEIKVVPRRKVKIIRD YGKQMAGDDCVAGRQDED SEQ ID NO: 705 Epigraph 1 de fusão de gag/nef de HIV M MGARASVLSGGKLDAWEKIRLRPGGKKKYRLKHLVWASRELERFALNPGLLETSEGCRQILGQLQPSLQTGSEEL KSLYNTVATLYCVHQRIEVKDTKEALDKIEEEQNKSKKKAQQAAADTGNSSQVSQNYPIVQNLQGQMVHQAISPR TLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINEEAAEWDRLHPVHAGPIAP GQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSILDIRQGPKEPFRDYVDRF YKTLRAEQATQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPGHKARVLAEAMSQVTNSAT IMMQRGNFKGQKRIKCFNCGKEGHIARNCRAPRKKGCWKCGKEGHQMKDCTERQANFLGKIWPSHKGRPGNFLQS RPEPTAPPEESFRFGEETTTPSQKQEPIDKELYPLASLKSLFGNDPLSQGGKWSKSSIVGWPAVRERMRRAEPAA EGVGAVSRDLEKHGAITSSNTAATNADCAWLEAQEEEEVGFPVRPQVPLRPMTYKGALDLSHFLKEKGGLEGLIY SKKRQEILDLWVYHTQGYFPDWQNYTPGPGIRYPLTFGWCFKLVPVDPREVEEANEGENNCLLHPMSQHGMDDPE KEVLMWKFDSRLAFHHMARELHPEYYKDC SEQ ID NO: 706 Epigraph 1 conservado de gag/nef de HIV M MPIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETIN EEAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVS ILDIRQGPKEPFRDYVDRFYKTLRAEQATQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGP GHKARVLVGFPVRPQVPLRPMTYKGALDLSHFLKEKGGLEGLIYSKKRQEILDLWVYHTQGYFPDWQNYTPGPGI RYPLTFGWCFKLVP SEQ ID NO: 707 Epigraph 2 de fusão de gag/nef de HIV M MGARASVLSGGELDRWEKIRLRPGGKKKYKLKHIVWASRELERFAVNPGLLETAEGCQQIIEQLQSTLKTGSEEL KSLFNTVAVLYCVHQRIDVKDTKEALEKIEEEQNKSQQKTQQAAAGTGSSSKVSQNYPIVQNAQGQMVHQPLSPR TLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNMMLNIVGGHQAAMQMLKDTINEEAAEWDRVHPVHAGPIPP GQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGDIYKRWIILGLNKIVRMYSPTSILDIKQGPKEPFRDYVDRF FKTLRAEQASQEVKNWMTDTLLVQNANPDCKTILRALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQVTNSAT IMMQRGNFRNQRKTVKCFNCGKEGHLARNCRAPRKKGCWKCGREGHQMKDCNERQANFLGKIWPSNKGRPGNFPQ SRPEPTAPPAESFRFEETTPAPKQEPKDREPLTSLKSLFGSDPLSQGSKWSKSSIVGWPAIRERMRRTEPAAEGV GAASRDLERHGAITSSNTAANNADCAWLEAQEDEEVGFPVKPQVPLRPMTYKAAFDLSFFLKEKGGLDGLIYSQK RQDILDLWVYNTQGFFPDWQNYTPGPGVRYPLTFGWCFKLVPVEPEKVEEANEGENNSLLHPMSLHGMDDPEREV LMWKFDSSLARRHMARELHPEFYKDC SEQ ID NO: 708 Epigraph 2 conservado de gag/nef de HIV M MPIVQNAQGQMVHQPLSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNMMLNIVGGHQAAMQMLKDTIN EEAAEWDRVHPVHAGPIPPGQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGDIYKRWIILGLNKIVRMYSPTS ILDIKQGPKEPFRDYVDRFFKTLRAEQASQEVKNWMTDTLLVQNANPDCKTILRALGPGATLEEMMTACQGVGGP SHKARVLVGFPVKPQVPLRPMTYKAAFDLSFFLKEKGGLDGLIYSQKRQDILDLWVYNTQGFFPDWQNYTPGPGV RYPLTFGWCFKLVP SEQ ID NO: 709 Epigraph 1 de pol de HIV M MFFRENLAFPQGEAREFSSEQTRANSPTRRELQVWGRDNNSLSEAGADRQGTVSFSFPQITLWQRPLVTIKIGGQ LKEALLADDTVLEDINLPGKWKPKMIGGIGGFIKVRQYDQILIEICGKKAIGTVLVGPTPVNIIGRNLLTQIGCT LNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIGPENPYNTPVFAIKKKDSTKWR KLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDKDFRKYTAFTIPSINNETPGIRYQYN VLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQLYVGSDLEIGQHRTKIEELRQHLLKWGFTTPDKKHQKEPP FLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYPGIKVKQLCKLLRGAKALTDIVPLTEEAEL ELAENREILKEPVHGVYYDPSKDLIAEIQKQGQDQWTYQIYQEPFKNLKTGKYARMRGAHTNDVKQLTEAVQKIA TESIVIWGKTPKFRLPIQKETWETWWTEYWQATWIPEWEFVNTPPLVKLWYQLEKEPIVGAETFYVDGAANRETK LGKAGYVTDRGRQKVVSLTETTNQKTLQAIHLALQDSGSEVNIVTDSQYALGIIQAQPDKSESELVNQIIEQLIK KEKVYLSWVPAHKGIGGNEQVDKLVSSGIRKVLFLDGIDKAQEEHEKYHSNWRAMASDFNLPPIVAKEIVASCDK CQLKGEAMHGQVDCSPGIWQLCTHLEGKVILVAVHVASGYIEAEVIPAETGQETAYFLLKLAGRWPVKVIHTNGS NFTSAAVKAACWWAGIKQEFGIPYNPQSQGVVSMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNFKRKGGIGGYS AGERIIDIIATDIQTKELQKQITKIQNFRVYYRDSRDPIWKGPAKLLWKGEGAVVIQDNSDIKVVPRRKAKIIRD YGKQMAGDDCVAGRQDEDQ SEQ ID NO: 710 Epigraph 1 conservado de pol de HIV M MPQITLWQRPLVTIKIGGQLKEALLADDTVLEDINLPGKWKPKMIGGIGGFIKVRQYDQILIEICGKKAIGTVLV GPTPVNIIGRNLLTQIGCTLNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIGPE NPYNTPVFAIKKKDSTKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDKDFRKYT AFTIPSINNETPGIRYQYNVLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQLYVGSDLEIGQHRTKIEELRQ HLLKWGFTTPDKKHQKEPPFLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYHGQVDCSPGIW QLCTHLEGKVILVAVHVASGYIEAEVIPAETGQETAYFLLKLAGRWPVKVIHTNGSNFTSAAVKAACWWAGIKQE FGIPYNPQSQGVVSMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNFKRKGGIGGYSAGERIIDIIATDIQTKLQK QITKIQNFRVYYRDSRDPIWKGPAKLLWKGEGAVVIQDNSDIKVVPRRKAKIIRDYGKQMAGDDCVAGRQDEDQ SEQ ID NO: 711 Epigraph 2 de pol de HIV M MFFREDLAFPQGKAREFPSEQTRANSPTRGELQVWGGDNNSPSEAGADRQGTVSFSFPQITLWQRPLVSIKVGGQ IKEALLADDTVLEEMNLPGRWKPKMIGGIGGFIKVRQYDQIPIEICGHKAIGTVLIGPTPVNIIGRNMLTQLGCT LNFPISPIDTVPVTLKPGMDGPRVKQWPLTEEKIKALTEICKEMEKEGKITKIGPENPYNTPIFAIKKKDSTKWR KLVDFRELNKKTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDESFRKYTAFTIPSTNNETPGIRYQYN VLPQGWKGSPAIFQCSMTKILEPFRIKNPEIVIYQLYVGSDLEIGQHRAKIEELREHLLRWGFTTPDKKHQKEPP FLWMGYELHPDRWTVQPIELPEKDSWTVNDIQKLVGKLNWASQIYAGIKVRQLCKLLRGTKALTEVVPLTEEAEL ELAENREILKTPVHGVYYDPSKDLVAEIQKQGQGQWTYQIYQEPYKNLKTGKYARKRSAHTNDVRQLTEVVQKIA TESIVIWGKTPKFKLPIQKETWEAWWTDYWQATWIPDWEFVNTPPLVKLWYQLEKDPIVGAETFYVDGAASRETK LGKAGYVTNRGRQKVVSLTDTTNQKTLHAIHLALQDSGLEVNIVTDSQYALGIIQAQPDRSESEVVNQIIEELIK KEKVYLAWVPAHKGIGGNEQVDKLVSAGIRKVLFLDGIDKAQEEHERYHSNWRTMASDFNLPPVVAKEIVANCDK CQLKGEAIHGQVDCSPGMWQLCTHLEGKIILVAVHVASGYMEAEVIPAETGQETAYFILKLAGRWPVKTIHTNGS NFTSTTVKAACWWAGIQQEFGIPYNPQSQGVVSMNNELKKIIGQVREQAEHLKTAVQMAVFIHNFKRRGGIGGYS AGERIVDIIATDIQTRELQKQIIKIQNFRVYYRDSRDPLWKGPAKLLWKGEGAVVIQDNSEIKVVPRRKVKIIKD YGKQMAGDDCVASRQDED SEQ ID NO: 712 Epigraph 2 conservado de pol de HIV M MPQITLWQRPLVSIKVGGQIKEALLADDTVLEEMNLPGRWKPKMIGGIGGFIKVRQYDQIPIEICGHKAIGTVLI GPTPVNIIGRNMLTQLGCTLNFPISPIDTVPVTLKPGMDGPRVKQWPLTEEKIKALTEICKEMEKEGKITKIGPE NPYNTPIFAIKKKDSTKWRKLVDFRELNKKTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDESFRKYT AFTIPSTNNETPGIRYQYNVLPQGWKGSPAIFQCSMTKILEPFRIKNPEIVIYQLYVGSDLEIGQHRAKIEELRE HLLRWGFTTPDKKHQKEPPFLWMGYELHPDRWTVQPIELPEKDSWTVNDIQKLVGKLNWASQIYHGQVDCSPGMW QLCTHLEGKIILVAVHVASGYMEAEVIPAETGQETAYFILKLAGRWPVKTIHTNGSNFTSTTVKAACWWAGIQQE FGIPYNPQSQGVVSMNNELKKIIGQVREQAEHLKTAVQMAVFIHNFKRRGGIGGYSAGERIVDIIATDIQTRLQK QIIKIQNFRVYYRDSRDPLWKGPAKLLWKGEGAVVIQDNSEIKVVPRRKVKIIKDYGKQMAGDDCVASRQDED SEQ ID NO: 713 Híbrido de gag/nef de SIV MGARGSVLSGKKTDELEKVRLRPGGRKKYMLKHIVWAARELDRFGSAESLLESKEGCQRILAVLAPLMPTGSEDL KSLFSTVCVVWCLHAEMKVKDTEEAKKTVQSHLVVESGTAETMPAQSRPTAPPSGRGGNYPVQQIGGNYVHLPLS PRTLNAWVKLIEEKKFGAEVVPGFQALSEGCTPYDINQMLNCVGDHQAAMQIIRDIINEEAADWDLQHPQPAPQQ GQLREPSGSDIAGTTSSVDEQIQWMYRQQNPIPVGNIYRRWIQLGLQKCVRMYNPTNILDVKQGPKEPFQSYVDR FYKSLRAEQTDAAVKNWMTQTLLIQNANPDCKLVLKGLGVNPTLEEMLTACQGVGGPGQKARLMAEALKDALTPG PIPFAAVQQRGQRKIIKCWNCGKTGHSARQCKAPRRKGCWKCGKAGHVMAKCPERQAGFLGFGPWGKKPHNFPMA QMPQGLTPTAPPADPAVDMLKNYMKMGKRQREKQRENRERPYKEVSEDLLHLSSLFGEDQPGGATSKRRSKPSGD LRQKLLRARGENYGRLWGELEDGSSQSLGGLGKGLSSRSCEGQKYSQGQFMNTPWKNPAEEKEKLPYRKQNIDDV DEEDNDLVGVSVRPKVPLRTMSYKLAIDMSHFIKEKGGLEGIYYSARRHRILDIYLEKEEGIIPDWQDYTSGPGI RYPKTFGWLWKLVPVDMSNEAQEDDTHYLVHPAQTHQWSDPWGEVLVWKFDPLLAHTYEAFVRHPEEFGWKSGLP KEEVERRLAARGLLKMADKKETR SEQ ID NO: 714 gag/nef conservada de SIV MPVQQIGGNYVHLPLSPRTLNAWVKLIEEKKFGAEVVPGFQALSEGCTPYDINQMLNCVGDHQAAMQIIRDIINE EAADWDLQHPQPAPQQGQLREPSGSDIAGTTSSVDEQIQWMYRQQNPIPVGNIYRRWIQLGLQKCVRMYNPTNIL DVKQGPKEPFQSYVDRFYKSLRAEQTDAAVKNWMTQTLLIQNANPDCKLVLKGLGVNPTLEEMLTACQGVGGPGQ KARLMVGVSVRPKVPLRTMSYKLAIDMSHFIKEKGGLEGIYYSARRHRILDIYLEKEEGIIPDWQDYTSGPGIRY PKTFGWLWKLVP SEQ ID NO: 715 Híbrido de pol de SIV MFFRAWPMGKEASQFPHGPDASGADTNCSPRGSSCGSTEELHEVGQKAERKAEGEQRETLQGGNGGFAAPQFSLW RRPVVTAHIEGQPVEVLLADDSIVTGIELGPHYTPKIVGGIGGFINTKEYKNVEIEVLGKRIKGTIMTGDTPINI FGRNLLTALGMSLNFPIAKVEPVKVALKPGKDGPKLKQWPLSKEKIVALREICEKMEKDGQLEEAPPTNPYNTPT FAIKKKDKNKWRMLIDFRELNRVTQDFTEVQLGIPHPAGLAKRKRITVLDIGDAYFSIPLDEEFRQYTAFTLPSV NNAEPGKRYIYKVLPQGWKGSPAIFQYTMRHVLEPFRKANPDVTLVQILIASDRTDLEHDRVVLQSKELLNSIGF STPEEKFQKDPPFQWMGYELWPTKWKLQKIELPQRETWTVNDIQKLVGVLNWAAQIYPGIKTKNLCKMIRGKMAL TEGVQWTELAEAELEENRIILNQEQEGRYYREDKPLEATVLKNQDNQWTYKIHQGDRILKVGKYAKVKNTHTNGI RLLANVVQKIGKESIVIWGQTPFFHLPVEREVWDQWWTDYWQATWIPDWDFVSTPPLIRLVFNLVKEPIEKEEVY YIDGSCNRNSKEGKAGYVTDRGKEKVLVLEQATNQQALQAFLLALKDSGPKANIVTDSQYVLGIITGQPTESDSR IVAQIIEQMIKKSEVYIGWVPAHKGLGGNQEVDRLVSQEIRQVLFLESIEPAQEDHDKYHSNIKELAFKFGLPRL VAKQIVDTCNKCQQKGEAIHGQANSDLGTWQMCTHLEGKIIIVAVHVASGFIEAEVIPQETGRQTALFLLKLAGR WPITHLHTNGANFASQEVKMVAWWAGIEHTFGVPYNPQSQGVVAMNHHLKNQIDRIREQANSVETIVLMAVHCMN FKRRGGIGDMTPAERLINMITTEQEIQFQQSKNSKFKNFRVYYREGRDQLWKGPGELLWKGEGAVILKVGTDIKV VPRRKAKIIKDYGGGKEVDSSSHMEDTGEAREVA SEQ ID NO: 716 pol conservado de SIV MPQFSLWRRPVVTAHIEGQPVEVLLADDSIVTGIELGPHYTPKIVGGIGGFINTKEYKNVEIEVLGKRIKGTIMT GDTPINIFGRNLLTALGMSLNFPIAKVEPVKVALKPGKDGPKLKQWPLSKEKIVALREICEKMEKDGQLEEAPPT NPYNTPTFAIKKKDKNKWRMLIDFRELNRVTQDFTEVQLGIPHPAGLAKRKRITVLDIGDAYFSIPLDEEFRQYT AFTLPSVNNAEPGKRYIYKVLPQGWKGSPAIFQYTMRHVLEPFRKANPDVTLVQILIASDRTDLEHDRVVLQSKE LLNSIGFSTPEEKFQKDPPFQWMGYELWPTKWKLQKIELPQRETWTVNDIQKLVGVLNWAAQIYHGQANSDLGTW QMCTHLEGKIIIVAVHVASGFIEAEVIPQETGRQTALFLLKLAGRWPITHLHTNGANFASQEVKMVAWWAGIEHT FGVPYNPQSQGVVAMNHHLKNQIDRIREQANSVETIVLMAVHCMNFKRRGGIGDMTPAERLINMITTEQEIQFQQ SKNSKFKNFRVYYREGRDQLWKGPGELLWKGEGAVILKVGTDIKVVPRRKAKIIKDYGGGKEVDSSSHMEDTGEA REVA SEQ ID NO: 717 Epigraph 1 de pol de HIV B FFRENLAFPQGKAREFSSEQTRANSPTRRELQVWGRDNNSLSEAGADRQGTVSFSFPQITLWQRPLVTIKIGGQL KEALLDTGADDTVLEEMNLPGRWKPKMIGGIGGFIKVRQYDQIPIEICGHKAIGTVLVGPTPVNIIGRNLLTQIG CTLNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIGPENPYNTPVFAIKKKDSTK WRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDKDFRKYTAFTIPSINNETPGIRYQ YNVLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQYMDDLYVGSDLEIGQHRTKIEELRQHLLRWGFTTPDKK HQKEPPFLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYAGIKVKQLCKLLRGTKALTEVVPL TEEAELELAENREILKEPVHGVYYDPSKDLIAEIQKQGQGQWTYQIYQEPFKNLKTGKYARMRGAHTNDVKQLTE AVQKIATESIVIWGKTPKFKLPIQKETWEAWWTEYWQATWIPEWEFVNTPPLVKLWYQLEKEPIVGAETFYVDGA ANRETKLGKAGYVTDRGRQKVVSLTDTTNQKTELQAIHLALQDSGLEVNIVTDSQYALGIIQAQPDKSESELVSQ IIEQLIKKEKVYLAWVPAHKGIGGNEQVDKLVSAGIRKVLFLDGIDKAQEEHEKYHSNWRAMASDFNLPPVVAKE IVASCDKCQLKGEAMHGQVDCSPGIWQLDCTHLEGKIILVAVHVASGYIEAEVIPAETGQETAYFLLKLAGRWPV KTIHTDNGSNFTSTTVKAACWWAGIKQEFGIPYNPQSQGVVESMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNF KRKGGIGGYSAGERIVDIIATDIQTKELQKQITKIQNFRVYYRDSRDPLWKGPAKLLWKGEGAVVIQDNSDIKVV PRRKAKIIRDYGKQMAGDDCVASRQDED SEQ ID NO: 718 Epigraph 1 de gag de HIV M MGARASVLSGGKLDAWEKIRLRPGGKKKYRLKHLVWASRELERFALNPGLLETSEGCRQILGQLQPSLQTGSEEL KSLYNTVATLYCVHQRIEVKDTKEALDKIEEEQNKSKKKAQQAAADTGNSSQVSQNYPIVQNLQGQMVHQAISPR TLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINEEAAEWDRLHPVHAGPIAP GQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSILDIRQGPKEPFRDYVDRF YKTLRAEQATQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPGHKARVLAEAMSQVTNSAT IMMQRGNFKGQKRIKCFNCGKEGHIARNCRAPRKKGCWKCGKEGHQMKDCTERQANFLGKIWPSHKGRPGNFLQS RPEPTAPPEESFRFGEETTTPSQKQEPIDKELYPLASLKSLFGNDPLSQ SEQ ID NO: 719 Epigraph 1 conservado de gag de HIV M PIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINE EAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSI LDIRQGPKEPFRDYVDRFYKTLRAEQATQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPG HKARVL SEQ ID NO: 720 Epigraph 2 de gag de HIV M MGARASVLSGGELDRWEKIRLRPGGKKKYKLKHIVWASRELERFAVNPGLLETAEGCQQIIEQLQSTLKTGSEEL KSLFNTVAVLYCVHQRIDVKDTKEALEKIEEEQNKSQQKTQQAAAGTGSSSKVSQNYPIVQNAQGQMVHQPLSPR TLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNMMLNIVGGHQAAMQMLKDTINEEAAEWDRVHPVHAGPIPP GQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGDIYKRWIILGLNKIVRMYSPTSILDIKQGPKEPFRDYVDRF FKTLRAEQASQEVKNWMTDTLLVQNANPDCKTILRALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQVTNSAT IMMQRGNFRNQRKTVKCFNCGKEGHLARNCRAPRKKGCWKCGREGHQMKDCNERQANFLGKIWPSNKGRPGNFPQ SRPEPTAPPAESFRFEETTPAPKQEPKDREPLTSLKSLFGSDPLSQ SEQ ID NO: 721 Epigraph 2 conservado de gag de HIV M PIVQNAQGQMVHQPLSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNMMLNIVGGHQAAMQMLKDTINE EAAEWDRVHPVHAGPIPPGQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGDIYKRWIILGLNKIVRMYSPTSI LDIKQGPKEPFRDYVDRFFKTLRAEQASQEVKNWMTDTLLVQNANPDCKTILRALGPGATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 722 Epigraph 1 de nef de HIV M MGGKWSKSSIVGWPAVRERMRRAEPAAEGVGAVSRDLEKHGAITSSNTAATNADCAWLEAQEEEEVGFPVRPQVP LRPMTYKGALDLSHFLKEKGGLEGLIYSKKRQEILDLWVYHTQGYFPDWQNYTPGPGIRYPLTFGWCFKLVPVDP REVEEANEGENNCLLHPMSQHGMDDPEKEVLMWKFDSRLAFHHMARELHPEYYKDC SEQ ID NO: 723 Epigraph 1 conservado de nef de HIV M VGFPVRPQVPLRPMTYKGALDLSHFLKEKGGLEGLIYSKKRQEILDLWVYHTQGYFPDWQNYTPGPGIRYPLTFG WCFKLVP SEQ ID NO: 724 Epigraph 2 de nef de HIV M MGSKWSKSSIVGWPAIRERMRRTEPAAEGVGAASRDLERHGAITSSNTAANNADCAWLEAQEDEEVGFPVKPQVP LRPMTYKAAFDLSFFLKEKGGLDGLIYSQKRQDILDLWVYNTQGFFPDWQNYTPGPGVRYPLTFGWCFKLVPVEP EKVEEANEGENNSLLHPMSLHGMDDPEREVLMWKFDSSLARRHMARELHPEFYKDC SEQ ID NO: 725 Epigraph 2 conservado de nef de HIV M VGFPVKPQVPLRPMTYKAAFDLSFFLKEKGGLDGLIYSQKRQDILDLWVYNTQGFFPDWQNYTPGPGVRYPLTFG WCFKLVP SEQ ID NO: 726 Epigraph 1 de pol de HIV M FFRENLAFPQGEAREFSSEQTRANSPTRRELQVWGRDNNSLSEAGADRQGTVSFSFPQITLWQRPLVTIKIGGQL KEALLDTGADDTVLEDINLPGKWKPKMIGGIGGFIKVRQYDQILIEICGKKAIGTVLVGPTPVNIIGRNLLTQIG CTLNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIGPENPYNTPVFAIKKKDSTK WRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDKDFRKYTAFTIPSINNETPGIRYQ YNVLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQYMDDLYVGSDLEIGQHRTKIEELRQHLLKWGFTTPDKK HQKEPPFLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYPGIKVKQLCKLLRGAKALTDIVPL TEEAELELAENREILKEPVHGVYYDPSKDLIAEIQKQGQDQWTYQIYQEPFKNLKTGKYARMRGAHTNDVKQLTE AVQKIATESIVIWGKTPKFRLPIQKETWETWWTEYWQATWIPEWEFVNTPPLVKLWYQLEKEPIVGAETFYVDGA ANRETKLGKAGYVTDRGRQKVVSLTETTNQKTELQAIHLALQDSGSEVNIVTDSQYALGIIQAQPDKSESELVNQ IIEQLIKKEKVYLSWVPAHKGIGGNEQVDKLVSSGIRKVLFLDGIDKAQEEHEKYHSNWRAMASDFNLPPIVAKE IVASCDKCQLKGEAMHGQVDCSPGIWQLDCTHLEGKVILVAVHVASGYIEAEVIPAETGQETAYFLLKLAGRWPV KVIHTDNGSNFTSAAVKAACWWAGIKQEFGIPYNPQSQGVVESMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNF KRKGGIGGYSAGERIIDIIATDIQTKELQKQITKIQNFRVYYRDSRDPIWKGPAKLLWKGEGAVVIQDNSDIKVV PRRKAKIIRDYGKQMAGDDCVAGRQDEDQ SEQ ID NO: 727 Epigraph 1 conservado de pol de HIV M PQITLWQRPLVTIKIGGQLKEALLDTGADDTVLEDINLPGKWKPKMIGGIGGFIKVRQYDQILIEICGKKAIGTV LVGPTPVNIIGRNLLTQIGCTLNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIG PENPYNTPVFAIKKKDSTKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDKDFRK YTAFTIPSINNETPGIRYQYNVLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQYMDDLYVGSDLEIGQHRTK IEELRQHLLKWGFTTPDKKHQKEPPFLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYHGQVD CSPGIWQLDCTHLEGKVILVAVHVASGYIEAEVIPAETGQETAYFLLKLAGRWPVKVIHTDNGSNFTSAAVKAAC WWAGIKQEFGIPYNPQSQGVVESMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNFKRKGGIGGYSAGERIIDIIA TDIQTKELQKQITKIQNFRVYYRDSRDPIWKGPAKLLWKGEGAVVIQDNSDIKVVPRRKAKIIRDYGKQMAGDDC VAGRQDEDQ SEQ ID NO: 728 Epigraph 2 de pol de HIV M FFREDLAFPQGKAREFPSEQTRANSPTRGELQVWGGDNNSPSEAGADRQGTVSFSFPQITLWQRPLVSIKVGGQI KEALLDTGADDTVLEEMNLPGRWKPKMIGGIGGFIKVRQYDQIPIEICGHKAIGTVLIGPTPVNIIGRNMLTQLG CTLNFPISPIDTVPVTLKPGMDGPRVKQWPLTEEKIKALTEICKEMEKEGKITKIGPENPYNTPIFAIKKKDSTK WRKLVDFRELNKKTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDESFRKYTAFTIPSTNNETPGIRYQ YNVLPQGWKGSPAIFQCSMTKILEPFRIKNPEIVIYQYMDDLYVGSDLEIGQHRAKIEELREHLLRWGFTTPDKK HQKEPPFLWMGYELHPDRWTVQPIELPEKDSWTVNDIQKLVGKLNWASQIYAGIKVRQLCKLLRGTKALTEVVPL TEEAELELAENREILKTPVHGVYYDPSKDLVAEIQKQGQGQWTYQIYQEPYKNLKTGKYARKRSAHTNDVRQLTE VVQKIATESIVIWGKTPKFKLPIQKETWEAWWTDYWQATWIPDWEFVNTPPLVKLWYQLEKDPIVGAETFYVDGA ASRETKLGKAGYVTNRGRQKVVSLTDTTNQKTELHAIHLALQDSGLEVNIVTDSQYALGIIQAQPDRSESEVVNQ IIEELIKKEKVYLAWVPAHKGIGGNEQVDKLVSAGIRKVLFLDGIDKAQEEHERYHSNWRTMASDFNLPPVVAKE IVANCDKCQLKGEAIHGQVDCSPGMWQLDCTHLEGKIILVAVHVASGYMEAEVIPAETGQETAYFILKLAGRWPV KTIHTDNGSNFTSTTVKAACWWAGIQQEFGIPYNPQSQGVVESMNNELKKIIGQVREQAEHLKTAVQMAVFIHNF KRRGGIGGYSAGERIVDIIATDIQTRELQKQIIKIQNFRVYYRDSRDPLWKGPAKLLWKGEGAVVIQDNSEIKVV PRRKVKIIKDYGKQMAGDDCVASRQDED SEQ ID NO: 729 Epigraph 2 conservado de pol de HIV M PQITLWQRPLVSIKVGGQIKEALLDTGADDTVLEEMNLPGRWKPKMIGGIGGFIKVRQYDQIPIEICGHKAIGTV LIGPTPVNIIGRNMLTQLGCTLNFPISPIDTVPVTLKPGMDGPRVKQWPLTEEKIKALTEICKEMEKEGKITKIG PENPYNTPIFAIKKKDSTKWRKLVDFRELNKKTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDESFRK YTAFTIPSTNNETPGIRYQYNVLPQGWKGSPAIFQCSMTKILEPFRIKNPEIVIYQYMDDLYVGSDLEIGQHRAK IEELREHLLRWGFTTPDKKHQKEPPFLWMGYELHPDRWTVQPIELPEKDSWTVNDIQKLVGKLNWASQIYHGQVD CSPGMWQLDCTHLEGKIILVAVHVASGYMEAEVIPAETGQETAYFILKLAGRWPVKTIHTDNGSNFTSTTVKAAC WWAGIQQEFGIPYNPQSQGVVESMNNELKKIIGQVREQAEHLKTAVQMAVFIHNFKRRGGIGGYSAGERIVDIIA TDIQTRELQKQIIKIQNFRVYYRDSRDPLWKGPAKLLWKGEGAVVIQDNSEIKVVPRRKVKIIKDYGKQMAGDDC VASRQDED SEQ ID NO: 730 Epigraph 1 de gag de HIV B MGARASVLSGGELDRWEKIRLRPGGKKKYRLKHIVWASRELERFAVNPGLLETSEGCRQILGQLQPSLQTGSEEL KSLYNTVATLYCVHQRIEVKDTKEALDKIEEEQNKSKKKAQQAAADTGNSSQVSQNYPIVQNLQGQMVHQAISPR TLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINEEAAEWDRLHPVHAGPIAP GQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPTSILDIRQGPKEPFRDYVDRF YKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPGHKARVLAEAMSQVTNSAT IMMQRGNFRNQRKTVKCFNCGKEGHIAKNCRAPRKKGCWKCGKEGHQMKDCTERQANFLGKIWPSHKGRPGNFLQ SRPEPTAPPEESFRFGEETTTPSQKQEPIDKELYPLASLKSLFGNDPSSQ SEQ ID NO: 731 Epigraph 1 conservado de gag de HIV B PIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINE EAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPTSI LDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPG HKARVL SEQ ID NO: 732 Epigraph 2 de gag de HIV B MGARASVLSGGKLDKWEKIRLRPGGKKKYKLKHIVWASRELERFALNPGLLETSEGCKQILGQLQPALQTGSEEL RSLYNTVAVLYCVHQRIDVKDTKEALEKIEEEQNKSKKRAQQAAADTGNNSQVSQNYPIVQNMQGQMVHQPISPR TLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNTMLNTVGGHQAAMQILKETINEEAADWDRLHPVHAGPVAP GQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGEIYKRWIIMGLNKIVRMYSPVSILDIKQGPKEPFRDYVDRF YKVLRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPSHKARILAEAMSQVTNSAT IMMQKGNFRNQRKIVKCFNCGKEGHIARNCRAPRKKGCWKCGREGHQMKDCNERQANFLGKIWPSYKGRPGNFLQ NRPEPTAPPAESFRFGEETTTPPQKQEPIDKDLYPLASLRSLFGNDPSS SEQ ID NO: 733 Epigraph 2 conservado de gag de HIV B PIVQNMQGQMVHQPISPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNTMLNTVGGHQAAMQILKETINE EAADWDRLHPVHAGPVAPGQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGEIYKRWIIMGLNKIVRMYSPVSI LDIKQGPKEPFRDYVDRFYKVLRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPS HKARIL SEQ ID NO: 734 Epigraph 1 de nef de HIV B MGGKWSKSSIVGWPAVRERMRRAEPAAEGVGAVSRDLEKHGAITSSNTAATNADCAWLEAQEEEEVGFPVRPQVP LRPMTYKGALDLSHFLKEKGGLEGLIYSQKRQDILDLWVYHTQGYFPDWQNYTPGPGIRYPLTFGWCFKLVPVEP EKVEEANEGENNSLLHPMSQHGMDDPEKEVLMWKFDSRLAFHHMARELHPEYYKDC SEQ ID NO: 735 Epigraph 1 conservado de nef de HIV B GFPVRPQVPLRPMTYKGALDLSHFLKEKGGLEGLIYSQKRQDILDLWVYHTQGYFPDWQNYTPGPGIRYPLTFGW CFKLVP SEQ ID NO: 736 Epigraph 2 de nef de HIV B MGGKWSKSSVVGWPAIRERMRRAEPAADGVGAASRDLERHGAITSSNTAANNAACAWLEAQEDEEVGFPVKPQVP LRPMTYKAAVDLSHFLKEKGGLEGLIHSQKRQEILDLWVYHTQGFFPDWQNYTPGPGTRFPLTFGWCFKLVPVDP DKVEEANEGENNCLLHPMSLHGMDDPEREVLVWKFDSRLAFHHVARELHPEYYKNC SEQ ID NO: 737 Epigraph 2 Conservado de nef de HIV B GFPVKPQVPLRPMTYKAAVDLSHFLKEKGGLEGLIHSQKRQEILDLWVYHTQGFFPDWQNYTPGPGTRFPLTFGW CFKLVP SEQ ID NO: 738 Epigraph 1 de pol de HIV B FFRENLAFPQGKAREFSSEQTRANSPTRRELQVWGRDNNSLSEAGADRQGTVSFSFPQITLWQRPLVTIKIGGQL KEALLDTGADDTVLEEMNLPGRWKPKMIGGIGGFIKVRQYDQIPIEICGHKAIGTVLVGPTPVNIIGRNLLTQIG CTLNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIGPENPYNTPVFAIKKKDSTK WRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDKDFRKYTAFTIPSINNETPGIRYQ YNVLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQYMDDLYVGSDLEIGQHRTKIEELRQHLLRWGFTTPDKK HQKEPPFLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYAGIKVKQLCKLLRGTKALTEVVPL TEEAELELAENREILKEPVHGVYYDPSKDLIAEIQKQGQGQWTYQIYQEPFKNLKTGKYARMRGAHTNDVKQLTE AVQKIATESIVIWGKTPKFKLPIQKETWEAWWTEYWQATWIPEWEFVNTPPLVKLWYQLEKEPIVGAETFYVDGA ANRETKLGKAGYVTDRGRQKVVSLTDTTNQKTELQAIHLALQDSGLEVNIVTDSQYALGIIQAQPDKSESELVSQ IIEQLIKKEKVYLAWVPAHKGIGGNEQVDKLVSAGIRKVLFLDGIDKAQEEHEKYHSNWRAMASDFNLPPVVAKE IVASCDKCQLKGEAMHGQVDCSPGIWQLDCTHLEGKIILVAVHVASGYIEAEVIPAETGQETAYFLLKLAGRWPV KTIHTDNGSNFTSTTVKAACWWAGIKQEFGIPYNPQSQGVVESMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNF KRKGGIGGYSAGERIVDIIATDIQTKELQKQITKIQNFRVYYRDSRDPLWKGPAKLLWKGEGAVVIQDNSDIKVV PRRKAKIIRDYGKQMAGDDCVASRQDED SEQ ID NO: 739 Epigraph 1 Conservado de pol de HIV B PQITLWQRPLVTIKIGGQLKEALLDTGADDTVLEEMNLPGRWKPKMIGGIGGFIKVRQYDQIPIEICGHKAIGTV LVGPTPVNIIGRNLLTQIGCTLNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIG PENPYNTPVFAIKKKDSTKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDKDFRK YTAFTIPSINNETPGIRYQYNVLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQYMDDLYVGSDLEIGQHRTK IEELRQHLLRWGFTTPDKKHQKEPPFLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYHGQVD CSPGIWQLDCTHLEGKIILVAVHVASGYIEAEVIPAETGQETAYFLLKLAGRWPVKTIHTDNGSNFTSTTVKAAC WWAGIKQEFGIPYNPQSQGVVESMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNFKRKGGIGGYSAGERIVDIIA TDIQTKELQKQITKIQNFRVYYRDSRDPLWKGPAKLLWKGEGAVVIQDNSDIKVVPRRKAKIIRDYGKQMAGDDC VASRQDED SEQ ID NO: 740 Epigraph 2 de pol de HIV B FFREDLAFPQGEAREFPSEQTRANSPTRGELQVWGGDNNSPSEAGADRQGTVSLSFPQITLWQRPLVTIKVGGQL KEALLDTGADDTVLEDMNLPGKWKPKMIGGIGGFIKVRQYDQILIEICGHKAIGTVLIGPTPVNIIGRNLLTQLG CTLNFPISPIDTVPVKLKPGMDGPRVKQWPLTEEKIKALIEICTEMEKEGKISRIGPENPYNTPIFAIKKKDSTK WRKLVDFRELNKKTQDFWEVQLGIPHPSGLKKKKSVTVLDVGDAYFSVPLDKEFRKYTAFTIPSTNNETPGIRYQ YNVLPQGWKGSPAIFQCSMTKILEPFRKQNPEIVIYQYMDDLYVGSDLEIEQHRTKIEELRQHLLKWGFTTPDKK HQKEPPFLWMGYELHPDKWTVQPIMLPEKDSWTVNDIQKLVGKLNWASQIYPGIKVRQLCKLLRGAKALTEVIPL TEEAELELAENREILREPVHGVYYDPTKDLIAEIQKQGLGQWTYQIYQEPYKNLKTGKYARTRGAHTNDVRQLTE AVQKITTESIVIWGKTPKFRLPIQKETWETWWTEYWQATWIPEWEFVNTPPLVKLWYQLEKEPIIGAETFYVDGA ANRDTKLGKAGYVTNKGRQKVVTLTDTTNQKTELQAIYLALQDSGSEVNIVTDSQYALGIIQAQPDKSESELVNQ IIEQLIKKEKIYLAWVPAHKGIGGNEQVDKLVSSGIRKVLFLDGIDKAQEDHEKYHSNWKAMASDFNLPPIVAKE IVASCDKCQLKGEAIHGQVDCSPGIWQLDCTHLEGKVILVAVHVASGYIEAEVIPAETGQETAYFILKLAGRWPV KTVHTDNGSNFTSATVKAACWWAGVKQEFGIPYNPQSQGVVESMNNELKKIIGQIRDQAEHLKTAVQMAVFIHNF KRKGGIGGYSAGERIIDIIATDIQTRELQKQITKIQNFRVYYRDNRDPLWKGPAKLLWKGEGAVVIQDNSEIKVV PRRKVKIIRDYGKQMAGDDCVAGRQDED SEQ ID NO: 741 Epigraph 2 Conservado de pol de HIV B PQITLWQRPLVTIKVGGQLKEALLDTGADDTVLEDMNLPGKWKPKMIGGIGGFIKVRQYDQILIEICGHKAIGTV LIGPTPVNIIGRNLLTQLGCTLNFPISPIDTVPVKLKPGMDGPRVKQWPLTEEKIKALIEICTEMEKEGKISRIG PENPYNTPIFAIKKKDSTKWRKLVDFRELNKKTQDFWEVQLGIPHPSGLKKKKSVTVLDVGDAYFSVPLDKEFRK YTAFTIPSTNNETPGIRYQYNVLPQGWKGSPAIFQCSMTKILEPFRKQNPEIVIYQYMDDLYVGSDLEIEQHRTK IEELRQHLLKWGFTTPDKKHQKEPPFLWMGYELHPDKWTVQPIMLPEKDSWTVNDIQKLVGKLNWASQIYHGQVD CSPGIWQLDCTHLEGKVILVAVHVASGYIEAEVIPAETGQETAYFILKLAGRWPVKTVHTDNGSNFTSATVKAAC WWAGVKQEFGIPYNPQSQGVVESMNNELKKIIGQIRDQAEHLKTAVQMAVFIHNFKRKGGIGGYSAGERIIDIIA TDIQTRELQKQITKIQNFRVYYRDNRDPLWKGPAKLLWKGEGAVVIQDNSEIKVVPRRKVKIIRDYGKQMAGDDC VAGRQDED SEQ ID NO: 742 Epigraph 1 de gag de HIV C MGARASILRGGKLDKWEKIRLRPGGKKHYMLKHLVWASRELERFALNPGLLETSEGCKQIMKQLQPALQTGTEEL RSLYNTVATLYCVHEKIEVRDTKEALDKIEEEQNKSQQKTQQAKAADGKVSQNYPIVQNLQGQMVHQAISPRTLN AWVKVIEEKAFSPEVIPMFTALSEGATPQDLNTMLNTVGGHQAAMQMLKDTINEEAAEWDRLHPVHAGPIAPGQM REPRGSDIAGTTSTLQEQIAWMTSNPPIPVGDIYKRWIILGLNKIVRMYSPVSILDIKQGPKEPFRDYVDRFFKT LRAEQATQDVKNWMTDTLLVQNANPDCKTILRALGPGATLEEMMTACQGVGGPGHKARVLAEAMSQANSNIMMQR SNFKGPKRIVKCFNCGKEGHIARNCRAPRKKGCWKCGKEGHQMKDCTERQANFLGKIWPSHKGRPGNFLQSRPEP TAPPAEPTAPPAESFRFEETTPAPKQEPKDREPLTSLKSLFGSDPLSQ SEQ ID NO: 743 Epigraph 1 Conservado de gag de HIV C PIVQNLQGQMVHQAISPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNTMLNTVGGHQAAMQMLKDTINE EAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIAWMTSNPPIPVGDIYKRWIILGLNKIVRMYSPVSI LDIKQGPKEPFRDYVDRFFKTLRAEQATQDVKNWMTDTLLVQNANPDCKTILRALGPGATLEEMMTACQGVGGPG HKARVL SEQ ID NO: 744 Epigraph 2 de gag de HIV C MGARASVLRGEKLDKWERIRLRPGGKKRYMLKHIVWASRELEKFALNPGLLETAEGCKQIIKQLHPALQTGTEEL KSLFNTVATLYCVHKKIDVRDTKEALDKIEEEQNKCQQKTQQAEAADKGKVSQNYPIVQNLQGQMVHQALSPRTL NAWVKVVEEKAFSPEIIPMFTALSEGATPTDLNTMLNTVGGHQAAMQMLKDTINEEAAEWDRVHPVHAGPVAPGQ MREPRGSDIAGTTSNLQEQIAWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSILDIRQGPKEPFRDYVDRFFK VLRAEQATQEVKNWMTETLLVQNANPDCKTILRALGPGASLEEMMTACQGVGGPSHKARVLAEAMSQANNANIMM QRSNFKGSKRIVKCFNCGKEGHIAKNCRAPRKKGCWKCGREGHQMKDCNERQANFLGKIWPSNKGRPGNFLQNRP EPTAPPAEPTAPPAESFKFEETTPAPKQESKDREPLISLKSLFGNDPLSQ SEQ ID NO: 745 Epigraph 2 Conservado de gag de HIV C PIVQNLQGQMVHQALSPRTLNAWVKVVEEKAFSPEIIPMFTALSEGATPTDLNTMLNTVGGHQAAMQMLKDTINE EAAEWDRVHPVHAGPVAPGQMREPRGSDIAGTTSNLQEQIAWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSI LDIRQGPKEPFRDYVDRFFKVLRAEQATQEVKNWMTETLLVQNANPDCKTILRALGPGASLEEMMTACQGVGGPS HKARVL SEQ ID NO: 746 Epigraph 1 de nef de HIV C MGGKWSKSSIVGWPAVRERIRRTEPAAEGVGAASQDLDKYGALTSSNTAHNNADCAWLQAQEEEEEVGFPVRPQV PLRPMTYKAAFDLSFFLKEKGGLEGLIYSKKRQEILDLWVYHTQGFFPDWQNYTPGPGVRYPLTFGWCFKLVPVD PREVEEANEGENNCLLHPMSQHGMEDEDREVLKWQFDSSLARRHMARELHPEYYKDC SEQ ID NO: 747 Epigraph 1 Conservado de nef de HIV C GFPVRPQVPLRPMTYKAAFDLSFFLKEKGGLEGLIYSKKRQEILDLWVYHTQGFFPDWQNYTPGPGVRYPLTFGW CFKLV SEQ ID NO: 748 Epigraph 2 de nef de HIV C MGSKWSKSSIVGWPAVRERMRRAEPAAEGVGAASRDLDKHGALTSSNTPANNADCAWLEAQEEEGEVGFPVKPQV PLRPMTYKGAFDLGFFLKEKGGLDGLIYSKKRQDILDLWVYNTQGYFPDWQNYTPGPGIRYPLTFGWCYKLVPVD PSEVEEANKGENNCLLHPMSLHGMEDEHREVLKWKFDSSLARRHLAREKHPEFYKDC SEQ ID NO: 749 Epigraph 2 Conservado de nef de HIV C GFPVKPQVPLRPMTYKGAFDLGFFLKEKGGLDGLIYSKKRQDILDLWVYNTQGYFPDWQNYTPGPGIRYPLTFGW CYKLV SEQ ID NO: 750 Epigraph 1 de pol de HIV C FFRENLAFPQGEAREFPSEQTRANSPTSRANSPTSRELQVRGDNPRSEAGAERQGTLNFPQITLWQRPLVSIKVG GQIKEALLDTGADDTVLEEINLPGKWKPKMIGGIGGFIKVRQYDQILIEICGKKAIGTVLVGPTPVNIIGRNMLT QLGCTLNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALTAICEEMEKEGKITKIGPENPYNTPVFAIKKKD STKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDEGFRKYTAFTIPSINNETPGI RYQYNVLPQGWKGSPAIFQSSMTKILEPFRAQNPEIVIYQYMDDLYVGSDLEIGQHRAKIEELREHLLKWGFTTP DKKHQKEPPFLWMGYELHPDKWTVQPIQLPEKDSWTVNDIQKLVGKLNWASQIYPGIKVRQLCKLLRGAKALTDI VPLTEEAELELAENREILKEPVHGVYYDPSKDLIAEIQKQGHDQWTYQIYQEPFKNLKTGKYAKMRTAHTNDVKQ LTEAVQKIAMESIVIWGKTPKFRLPIQKETWETWWTDYWQATWIPEWEFVNTPPLVKLWYQLEKEPIAGAETFYV DGAANRETKIGKAGYVTDRGRQKIVSLTETTNQKTELQAIQLALQDSGSEVNIVTDSQYALGIIQAQPDKSESEL VNQIIEQLIKKERVYLSWVPAHKGIGGNEQVDKLVSSGIRKVLFLDGIDKAQEEHEKYHSNWRAMASEFNLPPIV AKEIVASCDKCQLKGEAIHGQVDCSPGIWQLDCTHLEGKIILVAVHVASGYIEAEVIPAETGQETAYYILKLAGR WPVKVIHTDNGSNFTSAAVKAACWWAGIQQEFGIPYNPQSQGVVESMNKELKKIIGQVRDQAEHLKTAVQMAVFI HNFKRKGGIGGYSAGERIIDIIATDIQTKELQKQIIKIQNFRVYYRDSRDPIWKGPAKLLWKGEGAVVIQDNSDI KVVPRRKVKIIKDYGKQMAGADCVAGRQDEDQ SEQ ID NO: 751 Epigraph 1 Conservado de pol de HIV C PQITLWQRPLVSIKVGGQIKEALLDTGADDTVLEEINLPGKWKPKMIGGIGGFIKVRQYDQILIEICGKKAIGTV LVGPTPVNIIGRNMLTQLGCTLNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALTAICEEMEKEGKITKIG PENPYNTPVFAIKKKDSTKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDEGFRK YTAFTIPSINNETPGIRYQYNVLPQGWKGSPAIFQSSMTKILEPFRAQNPEIVIYQYMDDLYVGSDLEIGQHRAK IEELREHLLKWGFTTPDKKHQKEPPFLWMGYELHPDKWTVQPIQLPEKDSWTVNDIQKLVGKLNWASQIYHGQVD CSPGIWQLDCTHLEGKIILVAVHVASGYIEAEVIPAETGQETAYYILKLAGRWPVKVIHTDNGSNFTSAAVKAAC WWAGIQQEFGIPYNPQSQGVVESMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNFKRKGGIGGYSAGERIIDIIA TDIQTKELQKQIIKIQNFRVYYRDSRDPIWKGPAKLLWKGEGAVVIQDNSDIKVVPRRKVKIIKDYGKQMAGADC VAGRQDEDQ SEQ ID NO: 752 Epigraph 2 de pol de HIV C FFRENLAFQQGEAREFPSEQARANSPTSRANSPTSRELQVRGDNPCSEAGAERQGTFNFPQITLWQRPLVTIKVG GQIKEALLDTGADDTVLEDINLPGKWKPRMIGGIGGFIKVRQYDQIPIEICGKKAIGSVLVGPTPVNIIGRNLLT QLGCTLNFPISPIETIPVKLKPGMDGPRVKQWPLTEEKIKALTEICEEMEKEGKISKIGPENPYNTPIFAIKKKD STKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDESFRKYTAFTIPSTNNETPGI RYQYNVLPQGWKGSPAIFQSSMTRILEPFRAKNPEIVIYQYMDDLYVGSDLEIEQHRAKIEELREHLLRWGFTTP DKKHQKEPPFLWMGYELHPDKWTVQPIQLPEKESWTVNDIQKLVGKLNWASQIYPGIKVKQLCKLLRGTKALTDI VPLTEEAELELAENREILREPVHGVYYDPSKELIAEIQKQGQDQWTYQIYQEPFKNLKTGKYAKRRTAHTNDVRQ LTEAVQKIALESIVIWGKIPKFRLPIQKETWEIWWTDYWQATWIPDWEFVNTPPLVKLWYQLEKEPIAGVETFYV DGAANRETKLGKAGYVTDKGRQKIVTLTETTNQKAELQAIQLALQDSGPEVNIVTDSQYALGIIQAQPDKSESEI VNQIIEQLINKERIYLSWVPAHKGIGGNEQVDKLVSNGIRKVLFLDGIDKAQEEHEKYHNNWRAMASDFNLPPVV AKEIVASCDQCQLKGEAMHGQVDCSPGIWQLDCTHLEGKVILVAVHVASGYMEAEVIPAETGQETAYFILKLAGR WPVKIIHTDNGSNFTSTAVKAACWWAGIKQEFGIPYNPQSQGVVESMNKELKKIIGQVREQAEHLKTAVQMAVFI HNFKRRGGIGGYSAGERIIDIIASDIQTKELQKQITKIQNFRVYYRDSRDPIWKGPAKLLWKGEGAVVLQDNSDI KVVPRRKAKIIRDYGKQMAGDDCVAGRQDED SEQ ID NO: 753 Epigraph 2 Conservado de pol de HIV C PQITLWQRPLVTIKVGGQIKEALLDTGADDTVLEDINLPGKWKPRMIGGIGGFIKVRQYDQIPIEICGKKAIGSV LVGPTPVNIIGRNLLTQLGCTLNFPISPIETIPVKLKPGMDGPRVKQWPLTEEKIKALTEICEEMEKEGKISKIG PENPYNTPIFAIKKKDSTKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDESFRK YTAFTIPSTNNETPGIRYQYNVLPQGWKGSPAIFQSSMTRILEPFRAKNPEIVIYQYMDDLYVGSDLEIEQHRAK IEELREHLLRWGFTTPDKKHQKEPPFLWMGYELHPDKWTVQPIQLPEKESWTVNDIQKLVGKLNWASQIYHGQVD CSPGIWQLDCTHLEGKVILVAVHVASGYMEAEVIPAETGQETAYFILKLAGRWPVKIIHTDNGSNFTSTAVKAAC WWAGIKQEFGIPYNPQSQGVVESMNKELKKIIGQVREQAEHLKTAVQMAVFIHNFKRRGGIGGYSAGERIIDIIA SDIQTKELQKQITKIQNFRVYYRDSRDPIWKGPAKLLWKGEGAVVLQDNSDIKVVPRRKAKIIRDYGKQMAGDDC VAGRQDE SEQ ID NO: 754 EG-0 epissenso de Gag HIV M, Personalizado MGARASVLSGGKLDAWEKIRLRPGGKKKYRLKHLVWASRELERFALNPGLLETSEGCRQILGQLQPSLQTGSEEL KSLYNTVATLYCVHQRIEVKDTKEALDKIEEEQNKSKKKAQQAAADTGNSSQVSQNYPIVQNLQGQMVHQAISPR TLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINEEAAEWDRLHPVHAGPIAP GQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSILDIRQGPKEPFRDYVDRF YKTLRAEQATQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPGHKARVLAEAMSQVTNSAT IMMQRGNFKGQKRIKCFNCGKEGHIARNCRAPRKKGCWKCGKEGHQMKDCTERQANFLGKIWPSHKGRPGNFLQS RPEPTAQSRPEPTAPPAESFRPQPTAPPEESFRFGEETTTPSQKQEPIDKELYPLASLKSLFGNDPLSQY SEQ ID NO: 755 EG-0 epissenso Conservado de gag de HIV M, Personalizado PIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINE EAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSI LDIRQGPKEPFRDYVDRFYKTLRAEQATQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPG HKARVL SEQ ID NO: 756 CEN-1 de gag de HIV M, Personalizado MGARASVLTGGKLDAWERIRLRPGGKKKYRMKHLVWASRELERFAINPGLLETAEGCQQIIEQLQSTLKTGSEEL KSLFNTVATLWCVHQRIEIKDTKEALDKLEEVQNKSQQKTQQAAAGTGSSSKVSQNYPIVQNAQGQMVHQPLSPR TLNAWVKVVEEKGFNPEVIPMFSALSDGATPQDLNMMLNIVGGHQAAMQMLKDTINEEAAEWDRVHPVHAGPIPP GQMREPRESDIAGTTSNLQEQIGWMTSNPPIPVGDIYKRWIILGLHKIVRMYSPVGILDIKQGPKEPFRDYVDRF FKTLRAEQASQEVKNWMTETLLIQNANPDCKSILKALGTGATLEEMMTACQGVGGPSHKARVLAEAMSQAQHANI MMQRGNFKGQRKIKCFNCGKEGHLARNCRAPRKRGCWKCGQEGHQMKDCNERQANFLGKIWPSNKGRPGNFPQSR PEPTAPRTEPTAPPARPEPTAPPLQSRLEPTAPPAEPTAPPAENWGMGEEITSLLKQEQKDKEHPPPLVSLKSLF GNDPLLQ SEQ ID NO: 757 CEN-1 Conservado de gag de HIV M, Personalizado PIVQNAQGQMVHQPLSPRTLNAWVKVVEEKGFNPEVIPMFSALSDGATPQDLNMMLNIVGGHQAAMQMLKDTINE EAAEWDRVHPVHAGPIPPGQMREPRESDIAGTTSNLQEQIGWMTSNPPIPVGDIYKRWIILGLHKIVRMYSPVGI LDIKQGPKEPFRDYVDRFFKTLRAEQASQEVKNWMTETLLIQNANPDCKSILKALGTGATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 758 CEN-2 de gag de HIV M, Personalizado MGARASILRGGKLDKWEKIRLRPGGKKHYMLKHIVWASRELEKFALNPDLLETSEGCKQIIKQLQPALQTGTEEL RSLFNTVATLYCVHEKIEVRDTKEALDKVEEEQNKSQQKTQQAKAADGKVSQNYPIVQNAQGQMVHQALSPRTLN AWVKVIEEKAFSPEVIPMFTALSEGATPSDLNTMLNTIGGHQAAMQMLKDTINEEAAEWDRVHPVHAGPVAPGQM REPRGSDIAGSTSTLQEQIAWMTSNPPIPVGDIYKRWIILGLNKIVKMYSPVSILDIKQGPKEPFRDYVDRFFKT LRAEQATQDVKNWMTDTLLVQNANPDCKTILRALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQANSNIMMQR SNFKGPKRIVKCFNCGKEGHIAKNCRAPRKKGCWKCGREGHQMKDCNERQANFLGKIWPSNKGRPGNFLQNRPEP TAPPLQSRLEPTAPLEPTAPPEPTAPPAVVPTAPPVEPTAPPAEPTAPPAESFRFEETTPAPKQEPKDREPLTSL KSLFGSDPLSQ SEQ ID NO: 759 CEN-2 Conservado de gag de HIV M, Personalizado PIVQNAQGQMVHQALSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPSDLNTMLNTIGGHQAAMQMLKDTINE EAAEWDRVHPVHAGPVAPGQMREPRGSDIAGSTSTLQEQIAWMTSNPPIPVGDIYKRWIILGLNKIVKMYSPVSI LDIKQGPKEPFRDYVDRFFKTLRAEQATQDVKNWMTDTLLVQNANPDCKTILRALGPGATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 760 CEN-3 de gag de HIV M, Personalizado MGSRASVLSGGELDRWEKIRLRPGGKKKYKLKHIVWASRELERFAVNPGLLETSEGCKQILGQLQPALQTGSEEL RSLYNTVAVLYCVHQRIDVKDTKEALEKIEEEQNKCKKKAQQAAAAADTGNNSQVSQNYPIVQNIQGQMVHQALS PRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPSDLNTMLNTIGGHQAAMQMLKDTINEEAADWDRLHPVQAGPV APGQMRDPRGSDIAGTTSNLQEQIGWMTSNPPIPVGDIYKRWIIMGLNKIVRMYSPTSILDIKQGPKEPFRDYVD RFFKTLRAEQASQEVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQATNS AAIMMQRGNFRNQRKIVKCFNCGKEGHIAKNCRAPRKRGCWKCGREGHQMKDCNERQANFLGRIWPSNKGRPGNF LQNRPEPTAPNFLQSRPEPSAPPEPTAPPEESFRFGEETATPSQKQEPTDKELYPLASLRSLFGNDPSSQ SEQ ID NO: 761 CEN-3 Conservado de gag de HIV M, Personalizado PIVQNIQGQMVHQALSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPSDLNTMLNTIGGHQAAMQMLKDTINE EAADWDRLHPVQAGPVAPGQMRDPRGSDIAGTTSNLQEQIGWMTSNPPIPVGDIYKRWIIMGLNKIVRMYSPTSI LDIKQGPKEPFRDYVDRFFKTLRAEQASQEVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 762 CEN-4 de gag de HIV M, Personalizado MGTRASVLSGGELDRWEKIRLRPGGKKKYKLKHIVWASRELERFAVNPGLLETAEGCRQILEQLQPALQTGSEEL RSLYNTVAVLYCVHQRIDVKDTKEALEKIEEEQNKCKKKAQQTAADTGNNSQVSQNYPIVQNMQGQMVHQPISPR TLNAWVKVIEEKAFSPEVIPMFTALSEGATPHDLNTMLNTIGGHQAAMQMLKDTINEEAAEWDRVHPVHAGPVAP GQMREPKGSDIAGTTSNLQEQIGWMTHNPPIPVGDIYKRWIIMGLNKIVRMYSPTSILDIKQGPKEPFRDYVDRF FKTLRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMSACQGVGGPSHKARILAEAMSQATNSAN IMMQRGNFRNQRKTVKCFNCGKEGHIAKNCRAPRKRGCWKCGREGHQMKDCNERQANFLGKIWPSYKGRPGNFLQ NRPEPTAPPEPTAPPEESFGFGEETTTPPQKQEPIDKDLYPLASLRSLFGNDPSSQ SEQ ID NO: 763 CEN-4 Conservado de gag de HIV M, Personalizado PIVQNMQGQMVHQPISPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPHDLNTMLNTIGGHQAAMQMLKDTINE EAAEWDRVHPVHAGPVAPGQMREPKGSDIAGTTSNLQEQIGWMTHNPPIPVGDIYKRWIIMGLNKIVRMYSPTSI LDIKQGPKEPFRDYVDRFFKTLRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMSACQGVGGPS HKARIL SEQ ID NO: 764 CEN-5 de gag de HIV M, Personalizado MGARASILSGGKLDAWERIRLRPGGKKKYRMKHLVWASRELDRFALNPSLLETAEGCQQIMEQLQPALKTGTEEL RSLFNTVATLYCVHQRIDVKDTKEALDKIEEIQNKSKQKTQQAAADTGNSSKVSQNYPIVQNAQGQMIHQSLSPR TLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNMMLNIVGGHQAAMQMLKDTINEEAAEWDRVHPVHAGPIPP GQMREPRGGDIAGTTSTPQEQIGWMTSNPPIPVGDIYKRWIILGLHKLVRMYSPVSILDIKQGPKEPFRDYVDRF FKTLRAEQATQEVKGWMTETLLIQNANPDCKSILRALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQVQHTNI MMQRGNFRGQKRIKCFNCGKEGHLARNCRAPRKRGCWKCGREGHQMKDCNERQANFLGKIWPSSKGRPGNFPQSR PEPTAPQNRLEPTAPPAEPTAPPAEIFGMGEEITSPPKQEQKDREQAPPLVSLKSLFGNDLLSQ SEQ ID NO: 765 CEN-5 Conservado de gag de HIV M, Personalizado PIVQNAQGQMIHQSLSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNMMLNIVGGHQAAMQMLKDTINE EAAEWDRVHPVHAGPIPPGQMREPRGGDIAGTTSTPQEQIGWMTSNPPIPVGDIYKRWIILGLHKLVRMYSPVSI LDIKQGPKEPFRDYVDRFFKTLRAEQATQEVKGWMTETLLIQNANPDCKSILRALGPGATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 766 EG-0 epissenso de gag HIV C, Personalizado MGARASILRGGKLDKWEKIRLRPGGKKHYMLKHLVWASRELERFALNPGLLETSEGCKQIMKQLQPALQTGTEEL RSLYNTVATLYCVHEKIEVRDTKEALDKIEEEQNKSQQKTQQAKAADGKVSQNYPIVQNLQGQMVHQAISPRTLN AWVKVIEEKAFSPEVIPMFTALSEGATPQDLNTMLNTVGGHQAAMQMLKDTINEEAAEWDRLHPVHAGPVAPGQM REPRGSDIAGTTSTLQEQIAWMTSNPPIPVGDIYKRWIILGLNKIVRMYSPVSILDIKQGPKEPFRDYVDRFFKT LRAEQATQDVKNWMTDTLLVQNANPDCKTILRALGPGATLEEMMTACQGVGGPGHKARVLAEAMSQANSNIMMQR SNFKGPKRIVKCFNCGKEGHIARNCRAPRKKGCWKCGKEGHQMKDCTERQANFLGKIWPSHKGRPGNFLQSRPEP TAPPAEPTAPPAESFRFEETTPAPKQEPKDREPLTSLKSLFGSDPLSQ SEQ ID NO: 767 EG-0 epissenso Conservado de gag HIV C, Personalizado PIVQNLQGQMVHQAISPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNTMLNTVGGHQAAMQMLKDTINE EAAEWDRLHPVHAGPVAPGQMREPRGSDIAGTTSTLQEQIAWMTSNPPIPVGDIYKRWIILGLNKIVRMYSPVSI LDIKQGPKEPFRDYVDRFFKTLRAEQATQDVKNWMTDTLLVQNANPDCKTILRALGPGATLEEMMTACQGVGGPG HKARVL SEQ ID NO: 768 CEN-1 de gag HIV C, Personalizado MGARASILRGEKLDKWEKIKLRPGGKKRYMLKHLIWASRELERFALNPSLLETSEGCKQIIKQLQPALKTGTEEL RSLFNTVATLYCVHAGIEVRDTKEALDRIEEEQNKCQQKTQQAEAADKGKVSQNYPIVQNAQGQMVHQALSPRTL NAWVKVVEEKAFSPEIIPMFTALSEGATPSDLNSMLNTVGGHQAAMQMLKDTINDEAAEWDRVHPVHAGPIAPGQ MREPRGSDIAGTTSNLQEQIAWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSILDIRQGPKEPFRDYVDRFFK CLRAEQATQEVKNWMTDTLLIQNANPDCKTILKALGPGASLEEMMTACQGVGGPSHKARVLAEAMSQVNNANIMM QRGNFKGPKRIIKCFNCGKEGHLARNCRAPRKKGCWKCGQEGHQMKDCSNERQANFLGKLWPSHKGGRPGNFLQN RPEPTAPPVEPTAPPAEPTAPPAESFKFEETTPVPKQELKDREPLISLKSLFGNDPLSQ SEQ ID NO: 769 CEN-1 Conservado de gag de HIV C, Personalizado IVQNAQGQMVHQALSPRTLNAWVKVVEEKAFSPEIIPMFTALSEGATPSDLNSMLNTVGGHQAAMQMLKDTINDE AAEWDRVHPVHAGPIAPGQMREPRGSDIAGTTSNLQEQIAWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSIL DIRQGPKEPFRDYVDRFFKCLRAEQATQEVKNWMTDTLLIQNANPDCKTILKALGPGASLEEMMTACQGVGGPSH KARVL SEQ ID NO: 770 CEN-2 de gag HIV C, Personalizado MGARASILRGEKLDKWERIRLRPGGKKHYMIKHLVWASRELEKFALNPGLLETADGCKQIIKQLHPALQTGTEEL KSLYNTVATLYCVHERIEVRDTKEALDRIEEEQNKCQQKTQQAEAADKGKVSQNYPIVQNAQGQMVHQPISPRTL NAWVKVVEEKAFSPEIIPMFTALSEGATPTDLNTMLNTIGGHQAAMQILKDTINEEAVEWDRLHPVQAGPVAPGQ IREPRGSDIAGTTSNLQEQIAWMTGNPPVPVGDIYKRWIIMGLNKIVRMYSPVSILDIRQGPKEPFRDYVDRFFK VLRAEQATQEVKNWMTETLLVQNANPDCKIILKGLGPAATLEEMMTACQGVGGPSHKARVLAEAMSQVNNTNIMM QKSNFKGPKRTVKCFNCGKEGHIAKNCRAPRKKGCWKCGREGHQMKDCNERQANFLGKIWPSQKGRPGNFLQNRP EPTAPRPEPTAPPRLEPTAPPAEPSAPPAESFRFEGTTPAPKQESKDREPLISLKSLFGNDPLSQ SEQ ID NO: 771 CEN-2 Conservado de gag de HIV C, Personalizado PIVQNAQGQMVHQPISPRTLNAWVKVVEEKAFSPEIIPMFTALSEGATPTDLNTMLNTIGGHQAAMQILKDTINE EAVEWDRLHPVQAGPVAPGQIREPRGSDIAGTTSNLQEQIAWMTGNPPVPVGDIYKRWIIMGLNKIVRMYSPVSI LDIRQGPKEPFRDYVDRFFKVLRAEQATQEVKNWMTETLLVQNANPDCKIILKGLGPAATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 772 CEN-3 de gag HIV C, Personalizado MGARASILRGEKLDRWERIRLRPGGKKCYMLKHIVWASRELERFSLNPGLLETAEGCKQIIKQLHPALQTGTEEL KSLFNTVATLYCVHKKIDVRDTKEALDKVEEEQNKCQQKTQQAKAADEKVSQNYPIVQNIQGQMVHQALSPRTLN AWVKVVEEKAFSPEIIPMFTALSEEATPQDLNTMLNAVGGHQAAMQMLKETINEEAAEWDRVHPVHAGPIAPGQM REPRGSDIAGTTSNLQEQIAWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSILDIRQGPKEPFRDYVDRFFRV LRAEQATQEVKNWMTDTLLIQNANPDCKTILKALGPGASLEEMMTACQGVGGPSHKARVLAEAMSQANNINIMMQ RGNFKGPKRTVKCFNCGKEGHIAKNCRAPRKRGCWKCGKEGHQMKDCNERQANFLGRIWPSHKGRPGNFLQNRPE PTAPSAESFRQNRTEPTAPPARLEPTAPPAEPSAPPVESFRFEETTPALKQESKDREPLTSLRSLFGSDPLFQ SEQ ID NO: 773 CEN-3 Conservado de gag de HIV C, Personalizado PIVQNIQGQMVHQALSPRTLNAWVKVVEEKAFSPEIIPMFTALSEEATPQDLNTMLNAVGGHQAAMQMLKETINE EAAEWDRVHPVHAGPIAPGQMREPRGSDIAGTTSNLQEQIAWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSI LDIRQGPKEPFRDYVDRFFRVLRAEQATQEVKNWMTDTLLIQNANPDCKTILKALGPGASLEEMMTACQGVGGPS HKARVL SEQ ID NO: 774 CEN-4 de gag HIV C, Personalizado MGARASVLRGEKLDKWERIRLRPGGKKQYMLKHIVWASRELEKFALNPGLLETAEGCKQIIKQLHPALQTGTEEL RSLFNTVATLYCVHKGIDVRDTKEALDKVEEEQNKCQQKTQQAEADKKVSQNYPIVQNIQGQMVHQPLSPRTLNA WVKVVEEKAFSPEVIPMFSALSEGATPGDLNTMLNTIGGHQAAMQMLKDTINDEAAEWDRLHPVHAGPIAPGQMR EPRGSDIAGTTSNLQEQIAWMTNNPPVPVGEIYKRWIVLGLNKIVRMYSPVSILDIRQGPKEPFRDYVDRFFRTL RAEQATQEVKNWMTETLLVQNANPDCKNILRALGPGASLEEMMTACQGVGGPSHKARVLAEAMSQANNTNIMMQK SNFKGPRRIVKCFNCGKEGHIAKNCRAPRKRGCWKCGKEGHQMKDCNERQANFLGKIWPSNKGRPGNFLQNRPEP TAPQSRPEPTAPLEPTAPPAEPTAPPAESFKFEETTPAPKQEQKDREPLISLKSLFGNDPLSQ SEQ ID NO: 775 CEN-4 Conservado de gag de HIV C, Personalizado PIVQNIQGQMVHQPLSPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPGDLNTMLNTIGGHQAAMQMLKDTIND EAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSNLQEQIAWMTNNPPVPVGEIYKRWIVLGLNKIVRMYSPVSI LDIRQGPKEPFRDYVDRFFRTLRAEQATQEVKNWMTETLLVQNANPDCKNILRALGPGASLEEMMTACQGVGGPS HKARVL SEQ ID NO: 776 CEN-5 de gag HIV C, Personalizado MGARASVLRGEKLDKWERIRLRPGGKKRYMLKHIVWASRELEKFALNPGLLETAEGCKQIIKQLQPALQTGTEEL KSLFNTVATLYCVHEKIDVRDTKEALDRIEEEQNKCQQKTQQAKAADEKVSQNYPIVQNAQGQMVHQALSPRTLN AWVKVIEEKGFNPEVIPMFTALSDGATPQDLNSMLNTVGGHQAAMQILKDTINEEAAEWDRVHPVHAGPIAPGQM REPRGSDIAGTTSNLQEQIAWMTGNPPIPVGEIYKRWIILGLNKIVRMYSPVSILDIRQGPKEPFRDYVDRFFKA LRAEQATQEVKNWMTETLLVQNANPDCKNILRALGPGASLEEMMTACQGVGGPSHKARVLAEAMSQANNTNIMMQ RNNFKGPKRIIKCFNCGKEGHIAKNCRAPRKKGCWKCGREGHQMKDCNERQANFLGRIWPSHKGGRPGNFLQNRP EPTAPPVEPTAPPAEPTAPPAESFKFEETTPTPKQEQKDREPLISLKSLFGNDPLSQ SEQ ID NO: 777 CEN-5 Conservado de gag de HIV C, Personalizado PIVQNAQGQMVHQALSPRTLNAWVKVIEEKGFNPEVIPMFTALSDGATPQDLNSMLNTVGGHQAAMQILKDTINE EAAEWDRVHPVHAGPIAPGQMREPRGSDIAGTTSNLQEQIAWMTGNPPIPVGEIYKRWIILGLNKIVRMYSPVSI LDIRQGPKEPFRDYVDRFFKALRAEQATQEVKNWMTETLLVQNANPDCKNILRALGPGASLEEMMTACQGVGGPS HKARVL SEQ ID NO: 778 EG-0 epissenso de gag de HIV B, Personalizado MGARASVLSGGELDRWEKIRLRPGGKKKYKLKHIVWASRELERFAVNPGLLETSEGCRQILGQLQPSLQTGSEEL KSLYNTVATLYCVHQKIDVKDTKEALDKIEEEQNKSKKKAQQAAADTGNSSQVSQNYPIVQNLQGQMVHQAISPR TLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINEEAAEWDRLHPVHAGPIAP GQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPTSILDIRQGPKEPFRDYVDRF YKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPGHKARVLAEAMSQVTNSAT IMMQRGNFRNQRKTVKCFNCGKEGHIARNCRAPRKKGCWKCGKEGHQMKDCTERQANFLGKIWPSHKGRPGNFLQ SRPEPTAPPEPTAPPEESFRFGEETTTPSQKQEPIDKELYPLASLKSLFGNDPSSQ SEQ ID NO: 779 EG-0 epissenso Conservado de gag de HIV B, Personalizado PIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINE EAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPTSI LDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPG HKARVL SEQ ID NO: 780 CEN-1 de gag de HIV C, Personalizado MGSRASVLSGGKLDQWEKIRLRPGGKKRYKLKHLVWASRELERFAVNPSLLETSEGCKQILGQLQPALQTGSEEL RSLYNTIAVLYCVHQRIEVKDTKEALEKIEEEQNKCKKKAQQAAAAAADTGNSNQVSQNYPIVQNMQGQMVHQAL SPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPADLNTMLNTIGGHQAAMQILKETINEEAAEWDRVHPVHAGP VAPGQMREPRGSDIAGSTSTLQEQIAWMTSNPPIPVGDIYKRWIIMGLNKIVRMYSPTSILDIKQGPKEPFRDYV DRFYKTLRAEQATQEVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQVTT PPAIMMQRGNFKNQRKIVKCFNCGKEGHLARNCRAPRKRGCWKCGREGHQMKDCSERQANFLGKIWPSYKGRPGN FLQNRPEPTAPPAEPTAPPAESFRFGEETATPPQKQEPIDKEMYPLTSLRSLFGNDPSQ SEQ ID NO: 781 CEN-1 Conservado de gag de HIV B, Personalizado PIVQNMQGQMVHQALSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPADLNTMLNTIGGHQAAMQILKETINE EAAEWDRVHPVHAGPVAPGQMREPRGSDIAGSTSTLQEQIAWMTSNPPIPVGDIYKRWIIMGLNKIVRMYSPTSI LDIKQGPKEPFRDYVDRFYKTLRAEQATQEVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 782 CEN-2 de gag de HIV C, Personalizado MGSRASVLSGGKLDKWEKIRLRPGGKKKYRLKHLVWASRELERYALNPGLLETAEGCRQILGQLQPALQTGSEEL KSLFNTVAVLYCVHQRIDVKDTKEALEKIEEEQNKSKKKTQQAAADTGNNSQVKVSQNYPIVQNIQGQMVHQALS PRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPHDLNTMLNTIGGHQAAMQILKETINDEAAEWDRTHPVHAGPV APGQMRDPRGSDIAGTTSNLQEQIGWMTHNPPIPVGDIYKRWIIMGLNKIVRMYSPVSILDIKQGPKEPFRDYVD RFYKILRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQMTNS ATIMMQKGNFRNQRKTIKCFNCGKEGHLARNCRAPRKRGCWKCGQEGHQMKDCNERQANFLGKIWPSSKGRPGNF LQSRPESRPEPTAPPAEPTAPPAESFRFGEETATPPQKQEPIDKEMYPLASLRSLFGNDPSSK SEQ ID NO: 783 CEN-2 Conservado de gag de HIV B, Personalizado PIVQNIQGQMVHQALSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPHDLNTMLNTIGGHQAAMQILKETIND EAAEWDRTHPVHAGPVAPGQMRDPRGSDIAGTTSNLQEQIGWMTHNPPIPVGDIYKRWIIMGLNKIVRMYSPVSI LDIKQGPKEPFRDYVDRFYKILRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 784 CEN-3 de gag de HIV C, Personalizado MGARASILSGGELDKWEKIRLRPGGKKQYKLKHIVWASRELERFALNPGLLETSGGCRQILEQLQPALQTGSEEL RSLYNTVAVLYCVHQRIEVKDTKEALEKIEEEQNKCKKKAQQAAAAAADTGNNSQVSQNYPIVQNIQGQMVHQAL SPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPGDLNLMLNAVGGHQAAMQMLKDTINEEAADWDRLHPVQAGP VAPGQLREPRGSDIAGTTSNLQEQIAWMTHNPPIPVGEIYKRWIIMGLNKIVRMYSPVSILDIKQGPKEPFRDYV DRFYRTLRAEQASQDVKNWMTETLLIQNANPDCRTILKALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQATS SATIMMQKGNFRNQRKIVKCFNCGKEGHIAKNCRAPRKRGCWKCGREGHQMKDCSERQANFLGKIWPSYKGRPGN FLQNRPEPTAPPAEPTAPPAESFRFGEETTTPPQKQEPTDKELYPLASLRSLFGNDPLSQ SEQ ID NO: 785 CEN-3 Conservado de gag de HIV B, Personalizado PIVQNIQGQMVHQALSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPGDLNLMLNAVGGHQAAMQMLKDTINE EAADWDRLHPVQAGPVAPGQLREPRGSDIAGTTSNLQEQIAWMTHNPPIPVGEIYKRWIIMGLNKIVRMYSPVSI LDIKQGPKEPFRDYVDRFYRTLRAEQASQDVKNWMTETLLIQNANPDCRTILKALGPGATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 786 CEN-4 de gag de HIV C, Personalizado MGARASILSGGELDKWEKIRLRPGGKKKYRLKHIVWASNELERFALNPGLLETSDGCRQILGQLHPSLQTGSEEL RSLYNTVAVLYCVHQRIEIKDTKEALEKIEEEQNKCKKKAQQAAAAQQAAAGTGNNSQVSQNYPIVQNMQGQMVH QALSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPHDLNTMLNTIGGHQAAMQILKETINEEAAEWDRVHPVH AGPIAPGQIREPRGSDIAGTTSNLQEQIGWMTHNPPIPVGEIYKKWIIMGLNKIVRMYSPVSILDIKQGPKEPFR DYVDRFYKTLRAEQATQEVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPAHKARVLAEAMSQ ATNSAAIMMQKGNFRNQRRTVKCFNCGKEGHIAKNCRAPRKKGCWKCGQEGHQMKDCNERQANFLGRSWPSLKGR PGNFLQNRPEPSAPPEESFKFGEETTTPPQKQEPIDKDLYPLASLRSLFGNDPSST SEQ ID NO: 787 CEN-4 Conservado de gag de HIV B, Personalizado PIVQNMQGQMVHQALSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPHDLNTMLNTIGGHQAAMQILKETINE EAAEWDRVHPVHAGPIAPGQIREPRGSDIAGTTSNLQEQIGWMTHNPPIPVGEIYKKWIIMGLNKIVRMYSPVSI LDIKQGPKEPFRDYVDRFYKTLRAEQATQEVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPA HKARVL SEQ ID NO: 788 CEN-5 de gag de HIV C, Personalizado MGSRASVLSGGKLDKWEKIRLRPGGKKKYQLKHIVWASRELERYALNPGLLETAEGCRQILEQLQPALQTGSEEL RSLYNTVAVLYCVHQKIEVKDTKEALEKVEEEQNKSKKRIQQAQQAAAADTGNSSKVSQNYPIVRNLQGQMVHQP ISPRTLNAWVKVIEEKAFSPEVIPMFSALAEGATPQDLNLMLNAVGGHQAAMQMLKDTINEEAAEWDRMHPVHAG PVAPGQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGEIYKRWIIMGLNKIVRMYSPVSILDIKQGPKEPFRDY VDRFYRTLRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQVT NSTAIMMQRGNFKNQRKIVKCFNCGKEGHIAKNCRAPRKRGCWKCGREGHQMKECTERQVNFLGKIWPSYKGRPG NFLQNRPEPTAPPAPPEESFRFGEGTTTPSQKQGTIDKELYPLTSLRSLFGNDPS SEQ ID NO: 789 CEN-5 Conservado de gag de HIV B, Personalizado PIVRNLQGQMVHQPISPRTLNAWVKVIEEKAFSPEVIPMFSALAEGATPQDLNLMLNAVGGHQAAMQMLKDTINE EAAEWDRMHPVHAGPVAPGQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGEIYKRWIIMGLNKIVRMYSPVSI LDIKQGPKEPFRDYVDRFYRTLRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 790 VTSSNMNNA SEQ ID NO: 791 TSSNMNNAD SEQ ID NO: 792 TSSNMNNADSVWLRAQEEE SEQ ID NO: 793 TSSNMNNADCVWLRAQEEE SEQ ID NO: 794 ARCHSLM SEQ ID NO: 795 DEFGKLM SEQ ID NO: 796 EPTAPPAEPTAP SEQ ID NO: 797 PTAPPAEPTAPP SEQ ID NO: 798 EPTAPPAEPTAPP SEQ ID NO: 799 ARCGSLM SEQ ID NO: 800 ARCGSPM SEQ ID NO: 801 ARYGSLM SEQ ID NO: 802 AYCHSLM SEQ ID NO: 803 YRCHSLM SEQ ID NO: 804 DEFGSLM SEQ ID NO: 805 DEFGKLM SEQ ID NO: 806 ARCCDEGH SEQ ID NO: 807 ARCDEFGH SEQ ID NO: 808 ARCCDE-GH SEQ ID NO: 809 ARC-DEFGH SEQ ID NO: 810 DECHJLM SEQ ID NO: 811 DEFGJLM[0198] Regardless of T cell priming results related to vector-specific genes, immunological analysis allows testing the hypothesis that T cells induced by personalized vaccines are superior with respect to epitope coverage of a given natural HIV reservoir in compared to non-personalized vaccines. The custom 2-antigen cocktail could likely generate T cell responses with at least a 25% higher frequency of cross-reactive responses to their corresponding natural strain compared to episense individually (Table 5). A test was also done to determine whether including 3 complementary custom antigens in a cocktail induces more cross-reactivity or whether antigen dilution or the presence of a greater number of vaccine-specific epitopes required by adding 3 rather than 2 antigens actually decreases the magnitude or breadth of the response with cross-reactivity to the natural protein. CMV-based T cell responses are expected to be much broader and therefore cover a much greater percentage of sequences than previously reported for other vectors. Thus, even with a relatively small number of animals, there must be sufficient epitope responses to assess the impact of sequence variation on the cross-reactivity potential of responses. The number and magnitude of all vaccine responses are determined using sets of peptides corresponding to the vaccine. Once the targeted peptides are determined, using only those peptides that are positive in each animal, the impact of natural variation on each vaccine-responsive peptide is determined. The natural variants that are tested are based on the variation found in a reference panel, including both custom and mismatched Gags. Non-parametric statistical and computational resampling methods are used as the primary tools to evaluate the impact of epitope variation on magnitude reduction or recognition abrogation. These analyzes are complemented, however, by using generalized linear models as necessary to explore the impact of more complex interactions on T cell response cross-reactivity. SEQ ID NO: 691 Episense sequence of personalized vaccine antigens. MGARASVLSGGELDRWEKIRLRPGGKKKYKLKHIVWASRELERFAVNPGLLETSEGCRQILGQLQPSLQTGSEEL KSLYNTVATLYCVHQKIEVKDTKEALDKIEEEQNKSKKKAQQ AAADTGNSS QVSQNYPIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQA AMQML KETINEEAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRM YSPTSILDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQ GVGGPGHKARVLAEAMSQVTN-- SATIMMQRGNFRNQRKTVKCFNCGKE GHIARNCRAPRKKGCWKCGKEGHQMKDC--TERQANFLGKIWPSH- KGRPGNFLQ SRPEPT APPEESFRFGEETTTPS QKQEPIDKE LYP-LASLRSLFGNDPSSQ SEQ ID NO: 692 Custom Vaccine Antigen 1 Sequence. MGARASVLSGGELDKWEKIRLRPGGKKKYRLKHIVWASRELERFAVNPGLLETSGGCRQILEQLQPSLQTGSEEL RSLYNTVATLYCVHQKIDVKDTKEALEKIEEEQNKSKKKAQQ AAAAADTGNNS QVSQNYPIVQNMQGQMVHQALSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNTMLNSVGGHQ AAMQML KETINEEAAEWDRVHPVHAGPVAPGQMREPRGSDIAGTTSTLQEQIGWMTSNPPIPVGEIYKRWIIMGLNKIVRM YSPTSILDIKQGPKEPFRDYVDRFYKTLRAEQATQEVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQ GVGGPSHKARVLAEAMSQATN-- SATIMMQKGNFRNQRKIVKCF NCGKEGHIAKNCRAPRKKGCWKCGREGHQMKDC--TERQVNFLGKIWPSH- KGRPGNFLQ NRPEPT APPAESFRFGEETTTPP QKQEPIDKE LYP-LASLKSLFGNDPSSQ SEQ ID NO: 693 Custom Vaccine Antigen 2 Sequence. MGARASVLSGGKLDKWEKIRLRPGGKKRYKLKHIVWASRELERFAVNPGLLETAEGCRQILGQLQPALQTGSEEL KSLFNTVATLYCVHQRIDVKDTKEALEKIEEEQNKSKKKAQP AAADTGSSS QVSQNYPIVQNMQGQMVHQAISPRTLNAWVKVIEEKAFSPEVIPMFAALSEGATPQDLNLMLNTVGGH QAAMQML KETINEEAAEWDRLHPVHAGPVAPGQMREPRGSDIAGTTSTLQEQIGWMTHNPPIPVGEIYKKWIIMGLNKIVRM YSPTSILDIKQGPKEPFRDYVDRFYKTLRAEQATQEVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQ GVGGPSHKARVLAEAMSQATN-- SATIMMQRGNFKNQRKTIKCF NCGKEGHIAKNCRAPRKKGCWKCGREGHQMKDC--TERQANFLGKIWPSH- KGRPGNFLQ NRPEPT APPAESFRFGEETTTPP QKQEPIDKE LYP-LASLKSLFGNDPSSQ SEQ ID NO: 694 Custom Vaccine Antigen 3 Sequence. MGARASVLSGGELDKWEKIRLRPGGKKKYRLKHIVWASRELERFAVNPGLLETSGGCRQILEQLQPSLQTGSEEL RSLYNTVATLYCVHQKIDVKDTKEALEKIEEEQNKSKKKAQQ AAAAADTGNNS QVSQNYPIVQNMQGQMVHQALSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNTMLNSVGGHQ AAMQML KETINEEAAEWDRVHPVHAGPVAPGQMREPRGSDIAGTTSTLQEQIGWMTSNPPIPVGEIYKRWIIMGLNKIVRM YSPTSILDIKQGPKEPFRDYVDRFYKTLRAEQATQEVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQ GVGGPSHKARVLAEAMSQATN-- SATIMMQKGNFRNQRKIVKCF NCGKEGHIAKNCRAPRKKGCWKCGREGHQMKDC--TERQVNFLGKIWPSH- KGRPGNFLQ NRPEPT APPAESFRFGEETTTPP QKQEPIDKE LYP-LASLKSLFGNDPSSQ SEQ ID NO: 695 Custom Vaccine Antigen 4 Sequence. MGARASVLSGGKLDKWEKIRLRPGGKKKYRLKHIVWASRELERFAVNPGLLETAEGCRQILGQLQPALQTGSEEL RSLYNTVATLYCVHQRIEVKDTKEALEKIEEEQNKSKKKVQQ AAAADTGNSN QVSQNYPIVQNIQGQMVHQPLSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNTMLNTIGGHQ AAMQML KETINEEAADWDRLHPVHAGPVAPGQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGEIYKRWIIMGLNKIVRM YSPTSILDIKQGPKEPFRDYVDRFYKTLRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQ GVGGPSHKARVLAEAMSQVTN-- SATIMMQKGNFRNQRKIVKCFNCG KEGHIAKNCRAPRKRGCWKCGKEGHQMKEC--TERQANFLGKIWPSY- KGRPGNFLQ SRPEPS APPEESFRFGEETATPS QKQEPIDKE LYP-LASLKSLFGNDPSSQ SEQ ID NO: 696 Custom Vaccine Antigen 5 Sequence. MGARASVLSGGKLDKWEKIRLRPGGKKQYKLKHLVWASRELERFAVNPGLLETAEGCRQILGQLQPALQTGSEEL KSLFNTVATLYCVHQRIDVKDTKEALEKIEEEQNKSKKKAQQ AAADTGNNS QVSQNYPIVQNIQGQMVHQALSPRTLNAWVKVIEEKAFSPEVIPMFSALAEGATPQDLNTMLNTVG GHQAAMQIL KETINEEAAEWDRLHPVQAGPVAPGQMREPRGSDIAGTTSNLQEQIAWMTHNPPIPVGEIYKRWIIMGLNKIVRM YSPVSILDIRQGPKEPFRDYVDRFYKTLRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQ GVGGPSHKARVLAEAMSQATN-- PATIMMQRGNFKNQRKIV KCFNCGKEGHIAKNCRAPRKKGCWKCGKEGHQMKEC--TERQANFLGKIWPSY- KGRPGNFLQ SRPEPS APPEESFRFGEETTTPP QKQEPIDKE LYP-LTSLRSLFGNDPSSQ SEQ ID NO: 697 Antigen Sequence EpiGraph 1. MGARASVLSGGELDRWEKIRLRPGGKKKYKLKHIVWASRELERFAVNPGLLETSEGCRQIL GQLQPSLQTGSEEL KSLYNTVATLYCVHQRIDVKDTKEALDKIEEEQNKSKKKAQQ AAADTGNSS QVSQNYPIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQML KETINEEAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIGWMTNNPPI PVGEIYKRWIILGLNKIVRM YSPTSILDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQ GVGGPGHKARVLAEAMSQVTN-- SATIMMQRGNFRNQRKTVKCFNCGKEGHIARNCRAPRKKGCWKCGKEGHQMKDC--TERQANFLGKIWPSH- KGRPGNFLQ SRPEPT APPEESFRFGEETTTPS QKQEPIDKE LYP-LASLRSLFGNDPSSQ SEQ ID NO: 698 Cocktail Antigen 1 EpiGraph. MGARASVLSGGELDRWEKIRLRPGGKKKYKLKHIVWASRELERFAVNPGLLETSEGCRQILGQLQPSLQTGSEEL KSLYNTVATLYCVHQRIDVKDTKEALDKIEEEQNKSKKKAQQ AAADTGNSS QVSQNYPIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQA AMQML KETINEEAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRM YSPTSILDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQ GVGGPGHKARVLAEAMSQVTN-- SATIMMQRGNFRNQRKTVKCFNCGKE GHIARNCRAPRKKGCWKCGKEGHQMKDC--TERQANFLGKIWPSH- KGRPGNFLQ SRPEPT APPEESFRFGEETTTPS QKQEPIDKE LYP-LASLRSLFGNDPSSQ SEQ ID NO: 699 Cocktail Antigen 2 EpiGraph. MGARASVLSGGKLDKWEKIRLRPGGKKKYRLKHIVWASRELERFALNPGLLETAEGCRQILGQLQPALQTGSEEL KSLFNTVATLYCVHQKIDVKDTKEALEKIEEEQNKSKKKAQQ AAAAADTGNNS QVSQNYPIVQNMQGQMVHQALSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNLMLNTVG GHQAAMQIL KETINEEAADWDRLHPVHAGPVAPGQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGEIYKRWIIMGLNKIVRM YSPVSILDIKQGPKEPFRDYVDRVYKTLRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQ GVGGPSHKARVLAEAMSQATN-- SATIMMQKGNFRNQRKIV KCFNCGKEGHIAKNCRAPRKRGCWKCGKEGHQMKEC--TERQANFLGKIWPSY- KGRPGNFLQ NRPEPT APPAESFRFGEETTTPP QKQEPIDKE LYP-LASLKSLFGNDPSSQ SEQ ID NO: 700 Cocktail Antigen 3 EpiGraph. ARASVLSGGELDKWEKIRLRPGGKKQYKLKHLVWASRELERFAINPGLLETSGGCRQILEQLQPSLQTGSEELRS LYNTVAVLYCVHQRIEVKDTKEALEKVEEEQNKSKKKVQQ AAADTGNSN QVSQNYPIVQNIQGQMVHQPISPRTLNAWVKVIEDKAFSPEVIPMFAALSEGATPQDLNTMLNTIGGHQ Aamqml REGHIAKNCRAPRKKGCWKCGREGHQMKDCTERQRQANFLGKIWPSS- KGRPGNFLQ SRPEPS APPEESFRFGEETATPS QKQEPIDKE LYP-LTSLRSLFGNDPSLQ SEQ ID NO: 701 HIV B gag/nef fusion Epigraph 1 MGARASVLSGGELDRWEKIRLRPGGKKKYRLKHIVWASRELERFAVNPGLLETSEGCRQILG TLQPSLQTGSEEL GEIYKRWIILGLNKIVRMYSPTSILDIRQGPKEPFRDYVDRF YKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPGHKARVLAEAMSQVTNSAT IMMQRGNFRNQRKTVKCFNCGKEGHIAKNCRAPRKKGCWKCGKEGHQMKDCTERQANFLGKIWPSHKGRPGNFLQ SRPEPTAPPEESF RFGEETTTPSQKQEPIDKELYPLASLKSLFGNDPSSQGGKWSKSSIVGWPAVRERMRRAEPA AEGVGAVSRDLEKHGAITSSNTAATNADCAWLEAQEEEEVGFPVRPQVPLRPMTYKGALDLSHFLKEKGGLEGLI YSQKRQDILDLWVYHTQGYFPDWQNYTPGPGIRYPLTFGWCFKLVPVEPEKVEEANEGENNSLL HPMSQHGMDDP EKEVLMWKFDSRLAFHHMARELHPEYYKDC SEQ ID NO: 702 Epigraph 2 HIV gag/nef fusion TALSEGATPQDLNTMLNTIGGHQAAMQMLKDTINEEAAEWDRVHPVHAGPV APGQMREPRGSDIAGTTSNLQEQIAWMTHNPPIPVGEIYKRWIIMGLNKIVRMYSPVSILDIKQGPKEPFRDYVD RFYRTLRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQVTNS ATI MMQKGNFRNQRKIVKCFNCGKEGHIARNCRAPRKRGCWKCGKEGHQMKECTERQANFLGKIWPSYKGRPGNF LQNRPEPTAPPAESFRFGEETATPPQKQEPIDKEMYPLASLRSLFGNDPSQGGKWSKRSVPGWNTIRERMRRTEP AAEGVGAASRDLERHGAITSSNTAANNAACAWLEAQEDEEVGFPVKPQVPLRPMTYKAAVDLSH FLKEKGGLEGL IHSQKRQEILDLWVYNTQGYFPDWHNYTPGPGTRFPLTFGWCFKLVPVDPEQVEKANEGENNCLLHPMSLHGMDD PEREVLVWKFDSRLAFHHVAREKHPEYYKDC SEQ ID NO: 703 HIV B Pol Epigraph 1 MFFRENLAFPQGKAREFSSEQTRANSPTRRELQVWGRDNNSLSEAGADRQGTVSFSFPQ ITLWQRPLVTIKIGGQ LKEALLADDTVLEEMNLPGRWKPKMIGGIGGFIKVRQYDQIPIEICGHKAIGTVLVGPTPVNIIGRNLLTQIGCT LNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIGPENPYNTPVFAIKKKDSTKWR KLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTV LDVGDAYFSVPLDKDFRKYTAFTIPSINNETPGIRYQYN VLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQLYVGSDLEIGQHRTKIEELRQHLLRWGFTTPDKKHQKEPP FLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYAGIKVKQLCKLLRGTKALTEVVPLTEEAEL E LAENREILKEPVHGVYYDPSKDLIAEIQKQGQGQWTYQIYQEPFKNLKTGKYARMRGAHTNDVKQLTEAVQKIA TESIVIWGKTPKFKLPIQKETWEAWWTEYWQATWIPEWEFVNTPPLVKLWYQLEKEPIVGAETFYVDGAANRETK LGKAGYVTDRGRQKVVSLTDTTNQKTQAIHLAL FTST TVKAACWWAGIKQEFGIPYNPQSQGVVSMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNFKRKGGIGGYSA GERIVDIIATDIQTKELQKQITKIQNFRVYYRDSRDPLWKGPAKLLWKGEGAVVIQDNSDIKVVPRRKAKIIRDY GKQMAGDDCVASRQDED SEQ ID NO: 704 HIV B Pol Epigraph 2 MFFREDLAFPQGEAREFPSEQTRANSPTSRELQVWGGDNNSPSEAGADRQGTVSLSFPQITLWQRPLVTVKIGGQ LKEALLADDTVLEEMSLPGKWKPKMIGGIGGFIKVRQYDQVPIEICGHKTIGTVLIGPTPVNIIGRNLLTQLGCT LNFPISPIETVPVKLKPGMDGPRVKQWPLTEEKI KALIEICTEMEKEGKISRIGPENPYNTPIFAIKKKDSTKWR KLVDFRELNKKTQDFWEVQLGIPHPSGLKKKKSVTVLDVGDAYFSVPLDKEFRKYTAFTIPSTTNNETPGIRYQYN VLPQGWKGSPAIFQCSMTKILEPFRKQNPEIVIYQLYVGSDLEIGQHRAKIEELRQHLLKWGFTTPDKKHQKEPP FLWMGYELH PDKWTVQPIELPEKDSWTVNDIQKLVGKLNWASQIYPGIKVRQLCKLLRGAKALTEVIPLTKEAEL ELAENREILREPVHGVYYDPTKDLIAEIQKQGLGQWTYQIYQEPFKNLKTGKYARTRGAHTNDVRQLTEAVQKIT TESIVIWGKTPKFRLPIQKETWETWWTEYWQATWIPEWEFV NTPPLVKLWYQLEKEPIIGAETFYVDGASNRETK LGKAGYVTNRGRQKVISLTDTTNQKTLQAIYLALQDSGSEVNIVTDSQYALGIIQAQPDQSESELVNQIIEQLIN KEKVYLAWVPAHKGIGGNEQVDKLVSTGIRKVLFLDGIDRAQEEHEKYHNNWRAMASDFNLPPIVAKEIVASCDK CQLKGEAIHGQVDC SPGIWQLCTHLEGKVILVAVHVASGYIEAEVIPAETGQETAYFILKLAGRWPVKTVHTNGS NFTSATVKAACWWAGVKQEFGIPYNPQSQGVVSMNNELKKIIGQIRDQAEHLKTAVQMAVFIHNFKRKGGIGEYS AGERIIDIIATDIQTRELQKQITKIQNFRVYYRDNRDPLWKGPAKLLWKG EGAVVIQDNSEIKVVPRRKVKIIRD YGKQMAGDDCVAGRQDED SEQ ID NO: 705 HIV gag/nef fusion epigraph 1 QQAAADTGNSSQVSQNYPIVQNLQGQMVHQAISPR TLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINEEAAEWDRLHPVHAGPIAP GQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSILDIRQGPKEPFRDYVDRF YKTLRAEQATQEVK NWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPGHKARVLAEAMSQVTNSAT IMMQRGNFKGQKRIKCFNCGKEGHIARNCRAPRKKGCWKCGKEGHQMKDCTERQANFLGKIWPSHKGRPGNFLQS RPEPTAPPEESFRFGEETTTPSQKQEPIDKELYPLASLKSLFGNDPLSQGGKWSKSSIVGWPAVRERMRRA EPAA EGVGAVSRDLEKHGAITSSNTAATNADCAWLEAQEEEEVGFPVRPQVPLRPMTYKGALDLSHFLKEKGGLEGLIY SKKRQEILDLWVYHTQGYFPDWQNYTPGPGIRYPLTFGWCFKLVPVDPREVEEANEGENNCLLHPMSQHGMDDPE KEVLMWKFDSRLAFHHMARELHPEYYKDC SEQ ID NO: 706 Epigraph 1 conserved gag/nef of HIV M MPIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETIN EEAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVS ILDIRQGPKEPFRDYVDRF YKTLRAEQATQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGP GHKARVLVGFPVRPQVPLRPMTYKGALDLSHFLKEKGGLEGLIYSKKRQEILDLWVYHTQGYFPDWQNYTPGPGI RYPLTFGWCFKLVP SEQ ID NO: 707 HIV M gag/nef fusion Epigraph 2 MGARASVLS GGELDRWEKIRLRPGGKKKYKLKHIVWASRELERFAVNPGLLETAEGCQQIIEQLQSTLKTGSEEL KSLFNTVAVLYCVHQRIDVKDTKEALEKIEEEQNKSQQKTQQAAAGTGSSSKVSQNYPIVQNAQGQMVHQPLSPR TLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNMMLNIVGGHQAAMQML KDTINEEAAEWDRVHPVHAGPIPP GQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGDIYKRWIILGLNKIVRMYSPTSILDIKQGPKEPFRDYVDRF FKTLRAEQASQEVKNWMTDTLLVQNANPDCKTILRALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQVTNSAT IMMQRGNFRNQRKTVKCFNCGKEGHLARNC RAPRKKGCWKCGREGHQMKDCNERQANFLGKIWPSNKGRPGNFPQ SRPEPTAPPAESFRFEETTPAPKQEPKDREPLTSLKSLFGSDPLSQGSKWSKSSIVGWPAIRERMRRTEPAAEGV GAASRDLERHGAITSSNTAANNADCAWLEAQEDEEVGFPVKPQVPLRPMTYKAAFDLSFFLKEKGGLDGLIYSQK RQDILDLWVYNT QGFFPDWQNYTPGPGVRYPLTFGWCFKLVPVEPEKVEEANEGENNSLLHPMSLHGMDDPEREV LMWKFDSSLARRHMARELHPEFYKDC SEQ ID NO: 708 Epigraph 2 conserved gag/nef of HIV M MPIVQNAQGQMVHQPLSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNMMLNIVGGHQAAMQMLKDTIN EEAAEWDRVHPVHAGPIPPGQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGDIYKRWIILGLNKIVRMYSPTS ILDIKQGPKEPFRDYVDRFFKTLRAE QASQEVKNWMTDTLLVQNANPDCKTILRALGPGATLEEMMTACQGVGGP SHKARVLVGFPVKPQVPLRPMTYKAAFDLSFFLKEKGGLDGLIYSQKRQDILDLWVYNTQGFFPDWQNYTPGPGV RYPLTFGWCFKLVP SEQ ID NO: 709 HIV Pol Epigraph 1 M MFFRENLAFPQGEAREFSSEQTRANSPTRRELQ VWGRDNNSLSEAGADRQGTVSFSFPQITLWQRPLVTIKIGGQ LKEALLADDTVLEDINLPGKWKPKMIGGIGGFIKVRQYDQILIEICGKKAIGTVLVGPTPVNIIGRNLLTQIGCT LNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIGPENPYNTPVFAIKKKDSTKWR KLVDFRELNK RTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDKDFRKYTAFTIPSINNETPGIRYQYN VLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQLYVGSDLEIGQHRTKIEELRQHLLKWGFTTPDKKHQKEPP FLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYPGIKV KQLCKLLRGAKALTDIVPLTEEAEL ELAENREILKEPVHGVYYDPSKDLIAEIQKQGQDQWTYQIYQEPFKNLKTGKYARMRGAHTNDVKQLTEAVQKIA TESIVIWGKTPKFRLPIQKETWETWWTEYWQATWIPEWEFVNTPPLVKLWYQLEKEPIVGAETFYVDGAANRETK LGKAGYVTDRGR QKVVSLTETTNQKTLQAIHLALQDSGSEVNIVTDSQYALGIIQAQPDKSESELVNQIIEQLIK KEKVYLSWVPAHKGIGGNEQVDKLVSSGIRKVLFLDGIDKAQEEHEKYHSNWRAMASDFNLPPIVAKEIVASCDK CQLKGEAMHGQVDCSPGIWQLCTHLEGKVILVAVHVASGYIEAEVIPAETGQETA YFLLKLAGRWPVKVIHTNGS NFTSAAVKAACWWAGIKQEFGIPYNPQSQGVVSMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNFKRKGGIGGYS AGERIIDIIATDIQTKELQKQITKIQNFRVYYRDSRDPIWKGPAKLLWKGEGAVVIQDNSDIKVVPRRKAKIIRD YGKQMAGDDCVAGRQ DEDQ SEQ ID NO: 710 Epigraph 1 preserved from pol of HIV M MPQITLWQRPLVTIKIGGQLKEALLADDTVLEDINLPGKWKPKMIGGIGGFIKVRQYDQILIEICGKKAIGTVLV GPTPVNIIGRNLLTQIGCTLNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIGPE NPYNTPVFAIKKKDSTKWRKLVDFRELNKRTQDFWEVQLGIPH PAGLKKKKSVTVLDVGDAYFSVPLDKDFRKYT AFTIPSINNETPGIRYQYNVLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQLYVGSDLEIGQHRTKIEELRQ HLLKWGFTTPDKKHQKEPPFLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYHGQVDCSPGIW QLCTHLEGKVI LVAVHVASGYIEAEVIPAETGQETAYFLLKLAGRWPVKVIHTNGSNFTSAAVKAACWWAGIKQE FGIPYNPQSQGVVSMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNFKRKGGIGGYSAGERIIDIIATDIQTKLQK QITKIQNFRVYYRDSRDPIWKGPAKLLWKGEGAVVIQDNSDIKVVPRR KAKIIRDYGKQMAGDDCVAGRQDEDQ SEQ ID NO: 711 HIV Pol Epigraph 2 M MFFREDLAFPQGKAREFPSEQTRANSPTRGELQVWGGDNNSPSEAGADRQGTVSFSFPQITLWQRPLVSIKVGGQ IKEALLADDTVLEEMNLPGRWKPKMIGGIGGFIKVRQYDQIPIEICGHKAIGTVLIGPTPVNIIGRNMLTQ LGCT LNFPISPIDTVPVTLKPGMDGPRVKQWPLTEEKIKALTEICKEMEKEGKITKIGPENPYNTPIFAIKKKDSTKWR KLVDFRELNKKTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDESFRKYTAFTIPSTTNNETPGIRYQYN VLPQGWKGSPAIFQCSMTKILEPFRIKNPEIVIYQLYVGSDLEIGQ HRAKIEELREHLLRWGFTTPDKKHQKEPP FLWMGYELHPDRWTVQPIELPEKDSWTVNDIQKLVGKLNWASQIYAGIKVRQLCKLLRGTKALTEVVPLTEEAEL ELAENREILKTPVHGVYYDPSKDLVAEIQKQGQGQWTYQIYQEPYKNLKTGKYARKRSAHTNDVRQLTEVVQKIA TESIVI WGKTPKFKLPIQKETWEAWWTDYWQATWIPDWEFVNTPPLVKLWYQLEKDPIVGAETFYVDGAASRETK LGKAGYVTNRGRQKVVSLTDTTNQKTLHAIHLALQDSGLEVNIVTDSQYALGIIQAQPDRSESEVVNQIIEELIK KEKVYLAWVPAHKGIGGNEQVDKLVSAGIRKVLFLDGID KAQEEHERYHSNWRTMASDFNLPPVVAKEIVANCDK CQLKGEAIHGQVDCSPGMWQLCTHLEGKIILVAVHVASGYMEAEVIPAETGQETAYFILKLAGRWPVKTIHTNGS NFTSTTVKAACWWAGIQQEFGIPYNPQSQGVVSMNNELKKIIGQVREQAEHLKTAVQMAVFIHNFKRRGGIGGYS AGERIVDIIATDI QTRELQKQIIKIQNFRVYYRDSRDPLWKGPAKLLWKGEGAVVIQDNSEIKVVPRRKVKIIKD YGKQMAGDDCVASRQDED SEQ ID NO: 712 Epigraph 2 conserved from HIV M pol MPQITLWQRPLVSIKVGGQIKEALLADDTVLEEMNLPGRWKPKMIGGIGGFIKVRQYDQIPIEICGHKAIGTVLI GPTPVNIIGRNMLTQLGCTLNFPISPIDTVPVTLKPGMDGPRVKQWPLTEEKIKALTEICKEMEKEGKITKIGPE NPYNTPIFAIKKKDSTKWRKLVDFRELNKKTQDFWEVQLGIPHPAGLKK KKSVTVLDVGDAYFSVPLDESFRKYT AFTIPSTNNETPGIRYQYNVLPQGWKGSPAIFQCSMTKILEPFRIKNPEIVIYQLYVGSDLEIGQHRAKIEELRE HLLRWGFTTPDKKHQKEPPFLWMGYELHPDRWTVQPIELPEKDSWTVNDIQKLVGKLNWASQIYHGQVDCSPGMW QLCTHLEGKIILVAVHVASG YMEAEVIPAETGQETAYFILKLAGRWPVKTIHTNGSNFTSTTVKAACWWAGIQQE FGIPYNPQSQGVVSMNNELKKIIGQVREQAEHLKTAVQMAVFIHNFKRRGGIGGYSAGERIVDIIATDIQTRLQK QIIKIQNFRVYYRDSRDPLWKGPAKLLWKGEGAVVIQDNSEIKVVPRRKVKIIKDYG KQMAGDDCVASRQDED SEQ ID NO: 713 SIV GAG/NEF Hybrid VKLIEEKKFGAEVVPGFQALSEGCTPYDINQMLNCVGDHQAAMQIIRDIINEEAADWDLQHPQPAPQQ GQLREPSGSDIAGTTSSVDEQIQWMYRQQNPIPVGNIYRRWIQLGLQKCVRMYNPTNILDVKQGPKEPFQSYVDR FYKSLRAEQTDAAVKNWMTQTLLIQNANPDCKLVLKGLGVNP TLEEMLTACQGVGGPGQKARLMAEALKDALTPG PIPFAAVQQRGQRKIIKCWNCGKTGHSARQCKAPRRKGCWKCGKAGHVMAKCPERQAGFLGFGPWGKKPHNFPMA QMPQGLTPTAPPADPAVDMLKNYMKMGKRQREKQRENRERPYKEVSEDLLHLSSLFGEDQPGGATSKRRSKPSGD LRQKLLRARGENYGRLWGELED GSSQSLGGLGKGLSSRSCEGQKYSQGQFMNTPWKNPAEEKEKLPYRKQNIDDV DEEDNDLVGVSVRPKVPLRTMSYKLAIDMSHFIKEKGGLEGIYYSARRHRILDIYLEKEEGIIPDWQDYTSGPGI RYPKTFGWLWKLVPVDMSNEAQEDDTHYLVHPAQTHQWSDPWGEVLVWKFDPLLAHTYEAFVRHPEE FGWKSGLP KEEVERRLAARGLLKMADKKETR SEQ ID NO: 714 gag/nef conserved from SIV MPVQQIGGNYVHLPLSPRTLNAWVKLIEEKKFGAEVVPGFQALSEGCTPYDINQMLNCVGDHQAAMQIIRDIINE EAADWDLQHPQPAPQQGQLREPSGSDIAGTTSSVDEQIQWMYRQQNPIPVGNIYRR WIQLGLQKCVRMYNPTNIL DVKQGPKEPFQSYVDRFYKSLRAEQTDAAVKNWMTQTLLIQNANPDCKLVLKGLGVNPTLEEMLTACQGVGGPGQ KARLMVGVSVRPKVPLRTMSYKLAIDMSHFIKEKGGLEGIYYSARHRILDIYLEKEEGIIPDWQDYTSGPGIRY PKTFGWLWKLVP SEQ ID NO : 715 SIV pol hybrid MFFRAWPMGKEASQFPHGPDASGADTNCSPRGSSCGSTEELHEVGQKAERKAEGEQRETLQGGNGGFAAPQFSLW RRPVVTAHIEGQPVEVLLADDSIVTGIELGPHYTPKIVGGIGGFINTKEYKNVEIEVLGKRIKGTIMTGDTPINI FGRNLLTALGMSLNFPIAKVEPVKVALKPGKD GPKLKQWPLSKEKIVALREICEKMEKDGQLEEEAPPTNPYNTPT FAIKKKDKNKWRMLIDFRELNRVTQDFTEVQLGIPHPAGLAKRKRITVLDIGDAYFSIPLDEEFRQYTAFTLPSV NNAEPGKRYIYKVLPQGWKGSPAIFQYTMRHVLEPFRKANPDVTLVQILIASDRTDLEHDRVVLQSKELLNSIGF STPEEKFQ KDPPFQWMGYELWPTKWKLQKIELPQRETWTVNDIQKLVGVLNWAAQIYPGIKTKNLCKMIRGKMAL TEGVQWTELAEAELEENRIILNQEQEGRYYREDKPLEATVLKNQDNQWTYKIHQGDRILKVGKYAKVKNTHTNGI RLLANVVQKIGKESIVIWGQTPFFHLPVEREVWDQW WTDYWQATWIPDWDFVSTPPLIRLVFNLVKEPIEKEEVY YIDGSCNRNSKEGKAGYVTRDRGKEKVLVLEQATNQQALQAFLLALKDSGPKANIVTDSQYVLGIITGQPTESDSR IVAQIIEQMIKKSEVYIGWVPAHKGLGGNQEVDRLVSQEIRQVLFLESIEPAQEDHDKYHSNIKELAFKFGLPRL VAK QIVDTCNKCQQKGEAIHGQANSDLGTWQMCTHLEGKIIIVAVHVASGFIEAEVIPQETGRQTALFLLKLAGR WPITHLHTNGANFASQEVKMVAWWAGIEHTFGVPYNPQSQGVVAMNHHLKNQIDRIREQANSVETIVLMAVHCMN FKRRGGIGDMTPAERLINMITTEQEIQFQQSKNSKFKNFRVYYREGRDQ LWKGPGELLWKGEGAVILKVGTDIKV VPRRKAKIIKDYGGGKEVDSSSHMEDTGEAREVA SEQ ID NO: 716 pol conserved from SIV MPQFSLWRRPVVTAHIEGQPVEVLLADDSIVTGIELGPHYTPKIVGGIGGFINTKEYKNVEIEVLGKRIKGTIMT GDTPINIFGRNLLTALGMSLNFPIAKVEPVKVALKPGKDGPKLKQ WPLSKEKIVALREICEKMEKDGQLEEAPPT NPYNTPTFAIKKKDKNKWRMLIDFRELNRVTQDFTEVQLGIPHPAGLAKRKRITVLDIGDAYFSIPLDEEFRQYT AFTLPSVNNAEPGKRYIYKVLPQGWKGSPAIFQYTMRHVLEPFRKANPDVTLVQILIASDRTDLEHDRVVLQSKE LLNSIGFSTPEEKFQKDPPFQ WMGYELWPTKWKLQKIELD TEQEIQFQQ SKNSKFKNFRVYYREGRDQLWKGPGELLWKGEGAVILKVGTDIKVVPRRKAKIIKDYGGGKEVDSSSHMEDTGEA REVA SEQ ID NO: 717 HIV Pol Epigraph 1 B FFRENLAFPQGKAREFSSEQTRANSPTRRELQVWGRDNNSLSEAGADRQGTVSFSFPQITLWQRPLVTIKIGGQL KEALLDTGADDTVLEEMNLPGRWKPKMIGGIGGFIKVRQYDQIPIEICGHKAIGTVLVGPTPVNIIGRNLLTQIG CTLNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKIS KIGPENPYNTPVFAIKKKDSTK WRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDKDFRKYTAFTIPSINNETPGIRYQ YNVLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQYMDDLYVGSDLEIGQHRTKIEELRQHLLRWGFTTPDKK HQKEPPFLWMGYELHPDKWTVQPIVL PEKDSWTVNDIQKLVGKLNWASQIYAGIKVKQLCKLLRGTKALTEVVPL TEEAELELAENREILKEPVHGVYYDPSKDLIAEIQKQGQGQWTYQIYQEPFKNLKTGKYARMRGAHTNDVKQLTE AVQKIATESIVIWGKTPKFKLPIQKETWEAWWTEYWQATWIPEWEFVNTPPLVKL WYQLEKEPIVGAETFYVDGA ANRETKLGKAGYVTDRGRQKVVSLTDTTNQKTELQAIHLALQDSGLEVNIVTDSQYALGIIQAQPDKSESELVSQ IIEQLIKKEKVYLAWVPAHKGIGGNEQVDKLVSAGIRKVLFLDGIDKAQEEHEKYHSNWRAMASDFNLPPVVAKE IVASCDKCQLKGEAMHGQVDCSPGI WQLDCTHLEGKIILVAVHVASGYIEAEVIPAETGQETAYFLLKLAGRWPV KTIHTDNGSNFTSTTVKAACWWAGIKQEFGIPYNPQSQGVVESMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNF KRKGGIGGYSAGERIVDIIATDIQTKELQKQITKIQNFRVYYRDSRDPLWKGPAKLLWKGEGAV VIQDNSDIKVV PRRKAKIIRDYGKQMAGDDCVASRQDED SEQ ID NO: 718 HIV gag epigraph 1 SQNYPIVQNLQGQMVHQAISPR TLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINEEAAEWDRLHPVHAGPIAP GQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSILDIRQGPKEPFRDYVDRF YKTLRAEQATQEVKNWMTETLLVQNANP DCKTILKALGPAATLEEMMTACQGVGGPGHKARVLAEAMSQVTNSAT IMMQRGNFKGQKRIKCFNCGKEGHIARNCRAPRKKGCWKCGKEGHQMKDCTERQANFLGKIWPSHKGRPGNFLQS RPEPTAPPEESFRFGEETTTPSQKQEPIDKELYPLASLKSLFGNDPLSQ SEQ ID NO: 719 Epigraph 1 conserved HIV M gag PIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINE EAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSI LDIRQGPKEPFRDYVDRFYKTLRAEQATQEVKNWMTETLLVQNANPDCKTI LKALGPAATLEEMMTACQGVGGPG HKARVL SEQ ID NO: 720 HIV gag epigraph 2 NAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNMMLNIVGGHQAAMQMLKDTINEEAAEWDRVHPVHAGPIPP GQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGDIYKRWIILGLNKIVRMYSPTSILDIKQGPKEPFRDYVDRF FKTLRAEQASQEVKNWMTDTLLVQNANPDCKTILRALGPGATLEEMMTACQGV GGPSHKARVLAEAMSQVTNSAT IMMQRGNFRNQRKTVKCFNCGKEGHLARNCRAPRKKGCWKCGREGHQMKDCNERQANFLGKIWPSNKGRPGNFPQ SRPEPTAPPAESFRFEETTPAPKQEPKDREPLTSLKSLFGSDPLSQ SEQ ID NO: 721 Conserved Epigraph 2 of HIV M gag PIVQNAQGQMVHQPLSPRTLNAWV KVIEEKAFSPEVIPMFTALSEGATPQDLNMMLNIVGGHQAAMQMLKDTINE EAAEWDRVHPVHAGPIPPGQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGDIYKRWIILGLNKIVRMYSPTSI LDIKQGPKEPFRDYVDRFFKTLRAEQASQEVKNWMTDTLLVQNANPDCKTILRALGPGATLEEMMTACQGVGGPS HK ARVL SEQ ID NO: 722 HIV M nef Epigraph 1 MGGKWSKSSIVGWPAVRERMRRAEPAAEGVGAVSRDLEKHGAITSSNTAATNADCAWLEAQEEEEVGFPVRPQVP LRPMTYKGALDLSHFLKEKGGLEGLIYSKKRQEILDLWVYHTQGYFPDWQNYTPGPGIRYPLTFGWCFKLVPVDP REVEEANEGENNCLLHPMSQHGMDDPEKEVLMWKFDSRLAFHHMARELHPEYYKDC SEQ ID NO: 723 Epigraph 1 conserved nef of HIV M VGFPVRPQVPLRPMTYKGALDLSHFLKEKGGLEGL IYSKKRQEILDLWVYHTQGYFPDWQNYTPGPGIRYPLTFG WCFKLVP SEQ ID NO: 724 HIV M nef Epigraph 2 MGSKWSKSSIVGWPAIRERMRRTEPAAEGVGAASRDLERHGAITSSNTAANNADCAWLEAQEDEEVGFPVKPQVP LRPMTYKAAFDLSFFLKEKGGLDGLIYSQKRQDILDLWVYNTQG FFPDWQNYTPGPGVRYPLTFGWCFKLVPVEP EKVEEANEGENNSLLHPMSLHGMDDPEREVLMWKFDSSLARRHMARELHPEFYKDC SEQ ID NO: 725 Epigraph 2 conserved nef of HIV M VGFPVKPQVPLRPMTYKAAFDLSFFLKEKGGLDGLIYSQKRQDILDLWVYNTQGFFPDWQNYTPGPGVRYPLTFG WCFKL VP SEQ ID NO :726 HIV Pol Epigraph 1 M FFRENLAFPQGEAREFSSEQTRANSPTRRELQVWGRDNNSLSEAGADRQGTVSFSFPQITLWQRPLVTIKIGGQL KEALLDTGADDTVLEDINLPGKWKPKMIGGIGGFIKVRQYDQILIEICGKKAIGTVLVGPTPVNIIGRNLLTQIG CTLNFPISPIETVPVKLKPGMDGPKVKQWP LTEEKIKALVEICTEMEKEGKISKIGPENPYNTPVFAIKKKDSTK WRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDKDFRKYTAFTIPSINNETPGIRYQ YNVLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQYMDDLYVGSDLEIGQHRTKIEELRQHLLKWGFTTPDKK HQKEPPFL WMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYPGIKVKQLCKLLRGAKALTDIVPL TEEAELELAENREILKEPVHGVYYDPSKDLIAEIQKQGQDQWTYQIYQEPFKNLKTGKYARMRGAHTNDVKQLTE AVQKIATESIVIWGKTPKFRLPIQKETWETWWTEYWQAT WIPEWEFVNTPPLVKLWYQLEKEPIVGAETFYVDGA ANRETKLGKAGYVTDRGRQKVVSLTETTNQKTELQAIHLALQDSGSEVNIVTDSQYALGIIQAQPDKSESELVNQ IIEQLIKKEKVYLSWVPAHKGIGGNEQVDKLVSSGIRKVLFLDGIDKAQEEHEKYHSNWRAMASDFNLPPIVAKE IVASCDKC QLKGEAMHGQVDCSPGIWQLDCTHLEGKVILVAVHVASGYIEAEVIPAETGQETAYFLLKLAGRWPV KVIHTDNGSNFTSAAVKAACWWAGIKQEFGIPYNPQSQGVVESMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNF KRKGGIGGYSAGERIIDIIATDIQTKELQKQITKIQNFRVYYRDSRDPIW KGPAKLLWKGEGAVVIQDNSDIKVV PRRKAKIIRDYGKQMAGDDCVAGRQDEDQ SEQ ID NO: 727 Epigraph 1 conserved HIV pol M PQITLWQRPLVTIKIGGQLKEALLDTGADDTVLEDINLPGKWKPKMIGGIGGFIKVRQYDQILIEICGKKAIGTV LVGPTPVNIIGRNLLTQIGCTLNFPISPIETV PVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIG PENPYNTPVFAIKKKDSTKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDKDFRK YTAFTIPSINNETPGIRYQYNVLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQYMDDLYVGSDLEIGQHRTK IEELRQ HLLKWGFTTPDKKHQKEPPFLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYHGQVD CSPGIWQLDCTHLEGKVILVAVHVASGYIEAEVIPAETGQETAYFLLKLAGRWPVKVIHTDNGSNFTSAAVKAAC WWAGIKQEFGIPYNPQSQGVVESMNKELKKIIGQVRDQAEHLK TAVQMAVFIHNFKRKGGIGGYSAGERIIDIIA TDIQTKELQKQITKIQNFRVYYRDSRDPIWKGPAKLLWKGEGAVVIQDNSDIKVVPRRKAKIIRDYGKQMAGDDC VAGRQDEDQ SEQ ID NO: 728 HIV Pol Epigraph 2 M FFREDLAFPQGKAREFPSEQTRANSPTRGELQVWGGDNNSPSEAGADRQGTVSFSFPQITLWQRPLVSIKVGGQI KEALLDTGADDTVLEEMNLPGRWKPKMIGGIGGFIKVRQYDQIPIEICGHKAIGTVLIGPTPVNIIGRNMLTQLG CTLNFPISPIDTVPVTLKPGMDGPRVKQWPLTEEKIK ALTEICKEMEKEGKITKIGPENPYNTPIFAIKKKDSTK WRKLVDFRELNKKTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDESFRKYTAFTIPSTTNNETPGIRYQ YNVLPQGWKGSPAIFQCSMTKILEPFRIKNPEIVIYQYMDDLYVGSDLEIGQHRAKIEELREHLLRWGFTTPDKK HQKEPPFLWMGY ELHPDRWTVQPIELPEKDSWTVNDIQKLVGKLNWASQIYAGIKVRQLCKLLRGTKALTEVVPL TEEAELELAENREILKTPVHGVYYDPSKDLVAEIQKQGQGQWTYQIYQEPYKNLKTGKYARKRSAHTNDVRQLTE VVQKIATESIVIWGKTPKFKLPIQKETWEAWWTDYWQATWIPD WEFVNTPPLVKLWYQLEKDPIVGAETFYVDGA ASRETKLGKAGYVTNRGRQKVVSLTDTTNQKTELHAIHLALQDSGLEVNIVTDSQYALGIIQAQPDRSESEVVNQ IIEELIKKEKVYLAWVPAHKGIGGNEQVDKLVSAGIRKVLFLDGIDKAQEEHERYHSNWRTMASDFNLPPVVAKE IVANCDKCQLKGE AIHGQVDCSPGMWQLDCTHLEGKIILVAVHVASGYMEAEVIPAETGQETAYFILKLAGRWPV LLWKGEGAVVIQDNSEIKVV PRRKVKIIKDYGKQMAGDDCVASRQDED SEQ ID NO: 729 Epigraph 2 conserved HIV pol M PQITLWQRPLVSIKVGGQIKEALLDTGADDTVLEEMNLPGRWKPKMIGGIGGFIKVRQYDQIPIEICGHKAIGTV LIGPTPVNIIGRNMLTQLGCTLNFPISPIDTVPVTLKPGMDG PRVKQWPLTEEKIKALTEICKEMEKEGKITKIG PENPYNTPIFAIKKKDSTKWRKLVDFRELNKKTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDESFRK YTAFTIPSTNNETPGIRYQYNVLPQGWKGSPAIFQCSMTKILEPFRIKNPEIVIYQYMDDLYVGSDLEIGQHRAK IEELREHLLRWGF TTPDKKHQKEPPFLWMGYELHPDRWTVQPIELPEKDSWTVNDIQKLVGKLNWASQIYHGQVD CSPGMWQLDCTHLEGKIILVAVHVASGYMEAEVIPAETGQETAYFILKLAGRWPVKTIHTDNGSNFTSTTVKAAC WWAGIQQEFGIPYNPQSQGVVESMNNELKKIIGQVREQAEHLKTAVQMAVFI HNFKRRGGIGGYSAGERIVDIIA TDIQTRELQKQIIKIQNFRVYYRDSRDPLWKGPAKLLWKGEGAVVIQDNSEIKVVPRRKVKIIKDYGKQMAGDDC VASRQDED SEQ ID NO: 730 Epigraph 1 HIV B gag MGARASVLSGGELDRWEKIRLRPGGKKKYRLKHIVWASRELERFAVNPGLLETSEGCRQILGQLQPSLQTGSEEL KSLYNTVATLYCVHQRIEVKDTKEALDKIEEEQNKSKKKAQQAAADTGNSSQVSQNYPIVQNLQGQMVHQAISPR TLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTML NTVGGHQAAMQMLKETINEEAAEWDRLHPVHAGPIAP GQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPTSILDIRQGPKEPFRDYVDRF YKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPGHKARVLAEAMSQVTNSAT IMMQRGNFRNQRKTVKCF NCGKEGHIAKNCRAPRKKGCWKCGKEGHQMKDCTERQANFLGKIWPSHKGRPGNFLQ SRPEPTAPPEESFRFGEETTTPSQKQEPIDKELYPLASLKSLFGNDPSSQ SEQ ID NO: 731 Conserved Epigraph 1 of HIV B gag PIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQ AAMQMLKETINE EAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPTSI LDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPG HKARVL SEQ ID NO: 732 Epigraph 2 of HIV B MGAR gag ASVLSGGKLDKWEKIRLRPGGKKKYKLKHIVWASRELERFALNPGLLETSEGCKQILGQLQPALQTGSEEL RSLYNTVAVLYCVHQRIDVKDTKEALEKIEEEQNKSKKRAQQAAADTGNNSQVSQNYPIVQNMQGQMVHQPISPR TLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNTMLNTVGGHQAAMQ ILKETINEEAADWDRLHPVHAGPVAP GQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGEIYKRWIIMGLNKIVRMYSPVSILDIKQGPKEPFRDYVDRF YKVLRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPSHKARILAEAMSQVTNSAT IMMQKGNFRNQRKIVKCFNCGKEGHIARN CRAPRKKGCWKCGREGHQMKDCNERQANFLGKIWPSYKGRPGNFLQ NRPEPTAPPAESFRFGEETTTPPQKQEPIDKDLYPLASLRSLFGNDPSS SEQ ID NO: 733 Epigraph 2 conserved HIV B gag PIVQNMQGQMVHQPISPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNTMLNTVGGHQAAMQILKETINE EAADWDRLHPVHAGPVAPGQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGEIYKRWIIMGLNKIVRMYSPVSI LDIKQGPKEPFRDYVDRFYKV LRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPS HKARIL SEQ ID NO: 734 HIV B nef Epigraph 1 MGGKWSKSSIVGWPAVRERMRRAEPAAEGVGAVSRDLEKHGAITSSNTAATNADCAWLEAQEEEEVGFPVRPQVP LRPMTYKGALDLSHFLKEKGGLEGLIYSQKRQ DILDLWVYHTQGYFPDWQNYTPGPGIRYPLTFGWCFKLVPVEP EKVEEANEGENNSLLHPMSQHGMDDPEKEVLMWKFDSRLAFHHMARELHPEYYKDC SEQ ID NO: 735 HIV B nef conserved Epigraph 1 GFPVRPQVPLRPMTYKGALDLSHFLKEKGGLEGLIYSQKRQDILDLWVYHTQGYFPDWQNY TPGPGIRYPLTFGW CFKLVP SEQ ID NO: 736 HIV B nef epigraph 2 MGGKWSKSSVVGWPAIRERMRRAEPAADGVGAASRDLERHGAITSSNTAANNAACAWLEAQEDEEVGFPVKPQVP LRPMTYKAAVDLSHFLKEKGGLEGLIHSQKRQEILDLWVYHTQGFFPDWQNYTPGPGTRFPLTFGWCFKLVPVDP DKVEEANEGENNCLLHPMSLHGMDDPEREVLVWKFDSRLA FHHVARELHPEYYKNC SEQ ID NO: 737 Epigraph 2 Conserved from HIV B nef GFPVKPQVPLRPMTYKAAVDLSHFLKEKGGLEGLIHSQKRQEILDLWVYHTQGFFPDWQNYTPGPGTRFPLTFGW CFKLVP SEQ ID NO: 738 Epigraph 1 from HIV B pol FFRENLAFPQGKAREFSSEQTRANSPTRRELQVWGRDN NSLSEAGADRQGTVSFSFPQITLWQRPLVTIKIGGQL KEALLDTGADDTVLEEMNLPGRWKPKMIGGIGGFIKVRQYDQIPIEICGHKAIGTVLVGPTPVNIIGRNLLTQIG CTLNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIGPENPYNTPVFAIKKKDSTK WRKLVDFRELNKRTQDF WEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDKDFRKYTAFTIPSINNETPGIRYQ YNVLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQYMDDLYVGSDLEIGQHRTKIEELRQHLLRWGFTTPDKK HQKEPPFLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYAGIKVK QLCKLLRGTKALTEVVPL TEEAELELAENREILKEPVHGVYYDPSKDLIAEIQKQGQGQWTYQIYQEPFKNLKTGKYARMRGAHTNDVKQLTE AVQKIATESIVIWGKTPKFKLPIQKETWEAWWTEYWQATWIPEWEFVNTPPLVKLWYQLEKEPIVGAETFYVDGA ANRETKLGKAGYVTDRGRQ KVVSLTDTTNQKTELQAIHLALQDSGLEVNIVTDSQYALGIIQAQPDKSESELVSQ IIEQLIKKEKVYLAWVPAHKGIGGNEQVDKLVSAGIRKVLFLDGIDKAQEEHEKYHSNWRAMASDFNLPPVVAKE IVASCDKCQLKGEAMHGQVDCSPGIWQLDCTHLEGKIILVAVHVASGYIEAEVIPAETGQET AYFLLKLAGRWPV KTIHTDNGSNFTSTTVKAACWWAGIKQEFGIPYNPQSQGVVESMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNF KRKGGIGGYSAGERIVDIIATDIQTKELQKQITKIQNFRVYYRDSRDPLWKGPAKLLWKGEGAVVIQDNSDIKVV PRRKAKIIRDYGKQMAGDDCVASRQDED SEQ ID NO: 739 Epigraph 1 Conserved from HIV B pol PQITLWQRPLVTIKIGGQLKEALLDTGADDTVLEEMNLPGRWKPKMIGGIGGFIKVRQYDQIPIEICGHKAIGTV LVGPTPVNIIGRNLLTQIGCTLNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTE MEKEGKISKIG PENPYNTPVFAIKKKDSTKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDKDFRK YTAFTIPSINNETPGIRYQYNVLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQYMDDLYVGSDLEIGQHRTK IEELRQHLLRWGFTTPDKKHQKEPPFLWMGYELHPDK WTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYHGQVD CSPGIWQLDCTHLEGKIILVAVHVASGYIEAEVIPAETGQETAYFLLKLAGRWPVKTIHTDNGSNFTSTTVKAAC WWAGIKQEFGIPYNPQSQGVVESMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNFKRKGGIGGYSAGERIVDIIA KEALL DTGADDTVLEDMNLPGKWKPKMIGGIGGFIKVRQYDQILIEICGHKAIGTVLIGPTPVNIIGRNLLTQLG CTLNFPISPIDTVPVKLKPGMDGPRVKQWPLTEEKIKALIEICTEMEKEGKISRIGPENPYNTPIFAIKKKDSTK WRKLVDFRELNKKTQDFWEVQLGIPHPSGLKKKKSVTVLDVGDAYFSVPLDKEFRKYTAFT IPSTNNETPGIRYQ YNVLPQGWKGSPAIFQCSMTKILEPFRKQNPEIVIYQYMDDLYVGSDLEIEQHRTKIEELRQHLLKWGFTTPDKK HQKEPPFLWMGYELHPDKWTVQPIMLPEKDSWTVNDIQKLVGKLNWASQIYPGIKVRQLCKLLRGAKALTEVIPL TEEAELELAENREILREILREPVHGVYYDPTKDL IAEIQKQGLGQWTYQIYQEPYKNLKTGKYARTRGAHTNDVRQLTE AVQKITTESIVIWGKTPKFRLPIQKETWETWWTEYWQATWIPEWEFVNTPPLVKLWYQLEKEPIIGAETFYVDGA ANRDTKLGKAGYVTNKGRQKVVTLTDTTNQKTELQAIYLALQDSGSEVNIVTDSQYALGIIQA QPDKSESELVNQ IIEQLIKKEKIYLAWVPAHKGIGGNEQVDKLVSSGIRKVLFLDGIDKAQEDHEKYHSNWKAMASDFNLPPIVAKE IVASCDKCQLKGEAIHGQVDCSPGIWQLDCTHLEGKVILVAVHVASGYIEAEVIPAETGQETAYFILKLAGRWPV KTVHTDNGSNFTSATVKAACWWAGVKQEFGIPYNPQ SQGVVESMNNELKKIIGQIRDQAEHLKTAVQMAVFIHNF KRKGGIGGYSAGERIIDIIATDIQTRELQKQITKIQNFRVYYRDNRDPLWKGPAKLLWKGEGAVVIQDNSEIKVV PRRKVKIIRDYGKQMAGDDCVAGRQDED SEQ ID NO: 741 Epigraph 2 Conserved from HIV B pol PQITLWQRPLVTIKVGGQLKEALLDTGADDTVLEDMNLPGKWKPKMIGGIGGFIKVRQYDQILIEICGHKAIGTV LIGPTPVNIIGRNLLTQLGCTLNFPISPIDTVPVKLKPGMDGPRVKQWPLTEEKIKALIEICTEMEKEGKISRIG PENPYNTPIFAIKKKDSTKWRK LVDFRELNKKTQDFWEVQLGIPHPSGLKKKKSVTVLDVGDAYFSVPLDKEFRK YTAFTIPSTNNETPGIRYQYNVLPQGWKGSPAIFQCSMTKILEPFRKQNPEIVIYQYMDDLYVGSDLEIEQHRTK IEELRQHLLKWGFTTPDKKHQKEPPFLWMGYELHPDKWTVQPIMLPEKDSWTVNDIQKLVGKLN WASQIYHGQVD CSPGIWQLDCTHLEGKVILVAVHVASGYIEAEVIPAETGQETAYFILKLAGRWPVKTVHTDNGSNFTSATVKAAC WWAGVKQEFGIPYNPQSQGVVESMNNELKKIIGQIRDQAEHLKTAVQMAVFIHNFKRKGGIGGYSAGERIIDIIA TDIQTRELQKQITKIQNFRVYYRDNRDPL WKGPAKLLWKGEGAVVIQDNSEIKVVPRRKVKIIRDYGKQMAGDDC VAGRQDED SEQ ID NO: 742 HIV gag epigraph 1 QKTQQAKAADGKVSQNYPIVQNLQGQMVHQAISPRTLN AWVKVIEEKAFSPEVIPMFTALSEGATPQDLNTMLNTVGGHQAAMQMLKDTINEEAAEWDRLHPVHAGPIAPGQM REPRGSDIAGTTSTLQEQIAWMTSNPPIPVGDIYKRWIILGLNKIVRMYSPVSILDIKQGPKEPFRDYVDRFFKT LRAEQ ATQDVKNWMTDTLLVQNANPDCKTILRALGPGATLEEMMTACQGVGGPGHKARVLAEAMSQANSNIMMQR SNFKGPKRIVKCFNCGKEGHIARNCRAPRKKGCWKCGKEGHQMKDCTERQANFLGKIWPSHKGRPGNFLQSRPEP TAPPAEPTAPPAESFRFEETTPAPKQEPKDREPLTSLKSLFGSDPLSQ SEQ ID NO: 74 3 Epigraph 1 Preserved from gag of HIV C PIVQNLQGQMVHQAISPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNTMLNTVGGHQAAMQMLKDTINE EAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIAWMTSNPPIPVGDIYKRWIILGLNKIVRMYSPVSI LDIKQGPKEPFRDYVDRFFKTLRAEQATQDVKNWMTDTLLVQNANP DCKTILRALGPGATLEEMMTACQGVGGPG HKARVL SEQ ID NO: 744 HIV C gag Epigraph 2 MGARASVLRGEKLDKWERIRLRPGGKKRYMLKHIVWASRELEKFALNPGLLETAEGCKQIIKQLHPALQTGTEEL KSLFNTVATLYCVHKKIDVRDTKEALDKIEEEQNKCQQKTQQAEAADKGKVSQ NYPIVQNLQGQMVHQALSPRTL NAWVKVVEEKAFSPEIIPMFTALSEGATPTDLNTMLNTVGGHQAAMQMLKDTINEEAAEWDRVHPVHAGPVAPGQ MREPRGSDIAGTTSNLQEQIAWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSILDIRQGPKEPFRDYVDRFFK VLRAEQATQEVKNWMTETLLVQNANP DCKTILRALGPGASLEEMMTACQGVGGPSHKARVLAEAMSQANNANIMM QRSNFKGSKRIVKCFNCGKEGHIAKNCRAPRKKGCWKCGREGHQMKDCNERQANFLGKIWPSNKGRPGNFLQNRP EPTAPPAEPTAPPAESFKFEETTPAPKQESKDREPLISLKSLFGNDPLSQ SEQ ID NO: 745 Epigraph 2 Preserved HIV gag B NPDCKTILRALGPGASLEEMMTACQGVGGPS HKARVL SEQ ID NO: 746 Epigraph 1 de nef de HIV C MGGKWSKSSIVGWPAVRERIRRTEPAAEGVGAASQDLDKYGALTSSNTAHNNADCAWLQAQEEEEEVGFPVRPQV PLRPMTYKAAFDLSFFLKEKGGLEGLIYSKKRQEILDLWVYHTQGFFPDWQNYTPGPGVRYPLTFGWCFKLVPVD PREVEEANEGENNCLLHPMSQHGMEDEDREVLKWQFDSSLARRHMARELHPEYYKDC SEQ ID NO: 747 Epigraph 1 Conservado de nef de HIV C GFPVRPQVPLRPMTYKAAFDLSFFLKEKGGLEGLIYSKKRQEILDLWVYHTQGFFPDWQNYTPGPGVRYPLTFGW CFKLV SEQ ID NO: 748 Epigraph 2 de nef de HIV C MGSKWSKSSIVGWPAVRERMRRAEPAAEGVGAASRDLDKHGALTSSNTPANNADCAWLEAQEEEGEVGFPVKPQV PLRPMTYKGAFDLGFFLKEKGGLDGLIYSKKRQDILDLWVYNTQGYFPDWQNYTPGPGIRYPLTFGWCYKLVPVD PSEVEEANKGENNCLLHPMSLHGMEDEHREVLKWKFDSSLARRHLAREKHPEFYKDC SEQ ID NO: 749 Epigraph 2 Conservado de nef de HIV C GFPVKPQVPLRPMTYKGAFDLGFFLKEKGGLDGLIYSKKRQDILDLWVYNTQGYFPDWQNYTPGPGIRYPLTFGW CYKLV SEQ ID NO: 750 HIV Pol Epigraph 1 C FFRENLAFPQGEAREFPSEQTRANSPTSRANSPTSRELQVRGDNPRSEAGAERQGTLNFPQITLWQRPLVSIKVG GQIKEALLDTGA DDTVLEEINLPGKWKPKMIGGIGGFIKVRQYDQILIEICGKKAIGTVLVGPTPVNIIGRNMLT QLGCTLNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALTAICEEMEKEGKITKIGPENPYNTPVFAIKKKD STKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDEGFRKYTAFT IPSINNETPGI RYQYNVLPQGWKGSPAIFQSSMTKILEPFRAQNPEIVIYQYMDDLYVGSDLEIGQHRAKIEELREHLLKWGFTTP DKKHQKEPPFLWMGYELHPDKWTVQPIQLPEKDSWTVNDIQKLVGKLNWASQIYPGIKVRQLCKLLRGAKALTDI VPLTEEAELELAENREILKEPVHGVYYD PSKDLIAEIQKQGHDQWTYQIYQEPFKNLKTGKYAKMRTAHTNDVKQ LTEAVQKIAMESIVIWGKTPKFRLPIQKETWETWWTDYWQATWIPEWEFVNTPPLVKLWYQLEKEPIAGAETFYV DGAANRETKIGKAGYVTDRGRQKIVSLTETTNQKTELQAIQLALQDSGSEVNIVTDSQYAL GIIQAQPDKSESEL VNQIIEQLIKKERVYLSWVPAHKGIGGNEQVDKLVSSGIRKVLFLDGIDKAQEEHEKYHSNWRAMASEFNLPPIV AKEIVASCDKCQLKGEAIHGQVDCSPGIWQLDCTHLEGKIILVAVHVASGYIEAEVIPAETGQETAYYILKLAGR WPVKVIHTDNGSNFTSAAVKAACWWAGIQQEFG IPYNPQSQGVVESMNKELKKIIGQVRDQAEHLKTAVQMAVFI HNFKRKGGIGGGYSAGERIIDIIATDIQTKELQKQIIKIQNFRVYYRDSRDPIWKGPAKLLWKGEGAVVIQDNSDI KVVPRRKVKIIKDYGKQMAGADCVAGRQDEDQ SEQ ID NO: 751 Epigraph 1 Preserved from HIV C pol PQIT LWQRPLVSIKVGGQIKEALLDTGADDTVLEEINLPGKWKPKMIGGIGGFIKVRQYDQILIEICGKKAIGTV LVGPTPVNIIGRNMLTQLGCTLNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALTICEEMEKEGKITKIG PENPYNTPVFAIKKKDSTKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKK SVTVLDVGDAYFSVPLDEGFRK YTAFTIPSINNETPGIRYQYNVLPQGWKGSPAIFQSSMTKILEPFRAQNPEIVIYQYMDDLYVGSDLEIGQHRAK IEELREHLLKWGFTTPDKKHQKEPPFLWMGYELHPDKWTVQPIQLPEKDSWTVNDIQKLVGKLNWASQIYHGQVD CSPGIWQLDCTHLEGKI ILVAVHVASGYIEAEVIPAETGQETAYYILKLAGRWPVKVIHTDNGSNFTSAAVKAAC WWAGIQQEFGIPYNPQSQGVVESMNKELKKIIGQVRDQAEHLKTAVQMAVFIHNFKRKGGIGGYSAGERIIDIIA TDIQTKELQKQIIKIQNFRVYYRDSRDPIWKGPAKLLWKGEGAVVIQDNSDIK VVPRRKVKIIKDYGKQMAGADC VAGRQDEDQ SEQ ID NO: 752 HIV C Pol Epigraph 2 FFRENLAFQQGEAREFPSEQARANSPTSRANSPTSRELQVRGDNPCSEAGAERQGTFNFPQITLWQRPLVTIKVG GQIKEALLDTGADDTVLEDINLPGKWKPRMIGGIGGFIKVRQYDQIPIEICGKKAIGSVLVGPTPVNIIGRNLLT QLGCTLNFPISPIETI PVKLKPGMDGPRVKQWPLTEEKIKALTEICEEMEKEGKISKIGPENPYNTPIFAIKKKD STKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDESFRKYTAFTIPSTTNNETPGI RYQYNVLPQGWKGSPAIFQSSMTRILEPFRAKNPEIVIYQYMDDLYVGSDLEIEQHRAKIEELRE HLLRWGFTTP DKKHQKEPPFLWMGYELHPDKWTVQPIQLPEPKESWTVNDIQKLVGKLNWASQIYPGIKVKQLCKLLRGTKALTDI VPLTEEAELELAENREILREPVHGVYYDPSKELIAEIQKQGQDQWTYQIYQEPFKNLKTGKYAKRRTAHTNDVRQ LTEAVQKIALESIVIWGKIPKFR LPIQKETWEIWWTDYWQATWIPDWEFVNTPPLVKLWYQLEKEPIAGVETFYV DGAANRETKLGKAGYVTDKGRQKIVTLTETTNQKAELQAIQLALQDSGPEVNIVTDSQYALGIIQAQPDKSESEI VNQIIEQLINKERIYLSWVPAHKGIGGNEQVDKLVSNGIRKVLFLDGIDKAQEEHEKYHNNW RAMASDFNLPPVV AKEIVASCDQCQLKGEAMHGQVDCSPGIWQLDCTHLEGKVILVAVHVASGYMEAEVIPAETGQETAYFILKLAGR WPVKIIHTDNGSNFTSTAVKAACWWAGIKQEFGIPYNPQSQGVVESMNKELKKIIGQVREQAEHLKTAVQMAVFI HNFKRRGGIGGYSAGERIIDIIASDIQTKELQKQ ITKIQNFRVYYRDSRDPIWKGPAKLLWKGEGAVVLQDNSDI KVVPRRKAKIIRDYGKQMAGDDCVAGRQDED SEQ ID NO: 753 Epigraph 2 Conserved from HIV C pol PQITLWQRPLVTIKVGGQIKEALLDTGADDTVLEDINLPGKWKPRMIGGIGGFIKVRQYDQIPIEICGKKAIGSV LVGPTPVNIIGRN LLTQLGCTTLNFPISPIETIPVKLKPGMDGPRVKQWPLTEEKIKALTEICEEMEKEGKISKIG PENPYNTPIFAIKKKDSTKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDESFRK YTAFTIPSTTNNETPGIRYQYNVLPQGWKGSPAIFQSSMTRILEPFRAKNPEIVIYQYMDDLYV GSDLEIEQHRAK IEELREHLLRWGFTTPDKKHQKEPPFLWMGYELHPDKWTVQPIQLPEPKESWTVNDIQKLVGKLNWASQIYHGQVD CSPGIWQLDCTHLEGKVILVAVHVASGYMEAEVIPAETGQETAYFILKLAGRWPVKIIHTDNGSNFTSTAVKAAC WWAGIKQEFGIPYNPQSQGVVESMNKEL KKIIGQVREQAEHLKTAVQMAVFIHNFKRRGGIGGYSAGERIIDIIA SDIQTKELQKQITKIQNFRVYYRDSRDPIWKGPAKLLWKGEGAVVLQDNSDIKVVPRRKAKIIRDYGKQMAGDDC VAGRQDE SEQ ID NO: 754 EG-0 HIV M Gag episense, Custom MGARASVLSGGKLDAWEKIRLRPGGKKKYRLKHLVWASRELERFALNPGLLETSEGCRQILGQLQPSLQTGSEEL KSLYNTVATLYCVHQRIEVKDTKEALDKIEEEQNKSKKKAQQAAADTGNSSQVSQNYPIVQNLQGQMVHQAISPR TLNAWV KVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINEEAAEWDRLHPVHAGPIAP GQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSILDIRQGPKEPFRDYVDRF YKTLRAEQATQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPGHKARV LAEAMSQVTNSAT IMMQRGNFKGQKRIKCFNCGKEGHIARNCRAPRKKGCWKCGKEGHQMKDCTERQANFLGKIWPSHKGRPGNFLQS RPEPTAQSRPEPTAPPAESFRPQPTAPPEESFRFGEETTTPSQKQEPIDKELYPLASLKSLFGNDPLSQY SEQ ID NO: 755 EG-0 Conserved HIV M gag episense, Custom P IVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINE EAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSI LDIRQGPKEPFRDYVDRFYKTLRAEQATQEVKNWMTETLLVQNANPDCKTILK ALGPAATLEEMMTACQGVGGPG HKARVL SEQ ID NO: 756 CEN-1 HIV gag M, Custom MGARASVLTGGKLDAWERIRLRPGGKKKYRMKHLVWASRELERFAINPGLLETAEGCQQIIEQLQSTLKTGSEEL KSLFNTVATLWCVHQRIEIKDTKEALDKLEEVQNKSQQKTQQAAAGTGSSSKVSQNYPIVQNAQGQMVHQPLSPR TLNAWVKVVEEKGFNPEVIPM FSALSDGATPQDLNMMLNIVGGHQAAMQMLKDTINEEAAEWDRVHPVHAGPIPP GQMREPRESDIAGTTSNLQEQIGWMTSNPPIPVGDIYKRWIILGLHKIVRMYSPVGILDIKQGPKEPFRDYVDRF FKTLRAEQASQEVKNWMTETLLIQNANPDCKSILKALGTGATLEEMMTACQGVGGPSHKARVLAEAMSQA QHANI MMQRGNFKGQRKIKCFNCGKEGHLARNCRAPRKRGCWKCGQEGHQMKDCNERQANFLGKIWPSNKGRPGNFPQSR PEPTAPRTEPTAPPARPEPTAPPLQSRLEPTAPPAEPTAPPAENWGMGEEITSLLKQEQKDKEHPPPLVSLKSLF GNDPLLQ SEQ ID NO: 757 CEN-1 Preserved HIV M gag, Custom P IVQNAQGQMVHQPLSPRTLNAWVKVVEEKGFNPEVIPMFSALSDGATPQDLNMMLNIVGGHQAAMQMLKDTINE EAAEWDRVHPVHAGPIPPGQMREPRESDIAGTTSNLQEQIGWMTSNPPIPVGDIYKRWIILGLHKIVRMYSPVGI LDIKQGPKEPFRDYVDRFFKTLRAEQASQEVKNWMTETLLIQNANP DCKSILKALGTGATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 758 HIV M gag CEN-2, Custom MGARASILRGGKLDKWEKIRLRPGGKKHYMLKHIVWASRELEKFALNPDLLETSEGCKQIIKQLQPALQTGTEEL RSLFNTVATLYCVHEKIEVRDTKEALDKVEEEQNKSQQKTQQAKAADGKVSQNYPIVQNAQGQMVHQALSPRTLN AWVKVIEEKAFSPEVIPMFTALSEGATPSDLNTMLNTIGGHQ AAMQMLKDTINEEAAEWDRVHPVHAGPVAPGQM REPRGSDIAGSTSTLQEQIAWMTSNPPIPVGDIYKRWIILGLNKIVKMYSPVSILDIKQGPKEPFRDYVDRFFKT LRAEQATQDVKNWMTDTLLVQNANPDCKTILRALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQANSNIMMQR SNFKGPKRIVKCFNC GKEGHIAKNCRAPRKKGCWKCGREGHQMKDCNERQANFLGKIWPSNKGRPGNFLQNRPEP TAPPLQSRLEPTAPLEPTAPPEPTAPPAVVPTAPPVEPTAPPAEPTAPPAESFRFEETTPAPKQEPKDREPLTSL KSLFGSDPLSQ SEQ ID NO: 759 CEN-2 Conserved from HIV M gag, Custom PIVQNAQGQMVHQALSPRTL NAWVKVIEEKAFSPEVIPMFTALSEGATPSDLNTMLNTIGGHQAAMQMLKDTINE EAAEWDRVHPVHAGPVAPGQMREPRGSDIAGSTSTLQEQIAWMTSNPPIPVGDIYKRWIILGLNKIVKMYSPVSI LDIKQGPKEPFRDYVDRFFKTLRAEQATQDVKNWMTDTLLVQNANPDCKTILRALGPGATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 760 HIV M gag CEN-3, Custom MGSRASVLSGGELDRWEKIRLRPGGKKKYKLKHIVWASRELERFAVNPGLLETSEGCKQILGQLQPALQTGSEEL RSLYNTVAVLYCVHQRIDVKDTKEALEKIEEEQNKCKKKAQQAAAAADTGNNSQVSQNYPIVQNIQGQMVHQALS PRTLNA WVKVIEEKAFSPEVIPMFTALSEGATPSDLNTMLNTIGGHQAAMQMLKDTINEEAADWDRLHPVQAGPV APGQMRDPRGSDIAGTTSNLQEQIGWMTSNPPIPVGDIYKRWIIMGLNKIVRMYSPTSILDIKQGPKEPFRDYVD RFFKTLRAEQASQEVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPSHKAR VLAEAMSQATNS AAIMMQRGNFRNQRKIVKCFNCGKEGHIAKNCRAPRKRGCWKCGREGHQMKDCNERQANFLGRIWPSNKGRPGNF LQNRPEPTAPNFLQSRPEPSAPPEPTAPPEESFRFGEETATPSQKQEPTDKELYPLASLRSLFGNDPSSQ SEQ ID NO: 761 CEN-3 Preserved HIV M gag, Custom PIVQNIQGQMVHQALSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPSDLNTMLNTIGGHQAAMQMLKDTINE EAADWDRLHPVQAGPVAPGQMRDPRGSDIAGTTSNLQEQIGWMTSNPPIPVGDIYKRWIIMGLNKIVRMYSPTSI LDIKQGPKEPFRDY VDRFFKTLRAEQASQEVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 762 HIV M gag CEN-4, Custom MGTRASVLSGGELDRWEKIRLRPGGKKKYKLKHIVWASRELERFAVNPGLLETAEGCRQILEQLQPALQTGSEEL RSLYNTVAVLYCVHQRIDVKDT KEALEKIEEEQNKCKKKAQQTAADTGNNSQVSQNYPIVQNMQGQMVHQPISPR TLNAWVKVIEEKAFSPEVIPMFTALSEGATPHDLNTMLNTIGGHQAAMQMLKDTINEEAAEWDRVHPVHAGPVAP GQMREPKGSDIAGTTSNLQEQIGWMTHNPPIPVGDIYKRWIIMGLNKIVRMYSPTSILDIKQGPK EPFRDYVDRF FKTLRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMSACQGVGGPSHKARILAEAMSQATNSAN IMMQRGNFRNQRKTVKCFNCGKEGHIAKNCRAPRKRGCWKCGREGHQMKDCNERQANFLGKIWPSYKGRPGNFLQ NRPEPTAPPEPTAPPEESFGFGEETTTPPQKQEPIDKDLYPLASLRSL FGNDPSSQ SEQ ID NO: 763 CEN-4 Conserved from HIV gag M, Custom PIVQNMQGQMVHQPISPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPPHDLNTMLNTIGGHQAAMQMLKDTINE EAAEWDRVHPVHAGPVAPGQMREPKGSDIAGTTSNLQEQIGWMTHNPPIPVGDIYKRWIIMGLNKIVRMYSPTSI LDIKQGPKEPFRDYVDRFFKTLRAEQASQ DVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMSACQGVGGPS HKARIL SEQ ID NO: 764 HIV M gag CEN-5, Custom MGARASILSGGKLDAWERIRLRPGGKKKYRMKHLVWASRELDRFALNPSLLETAEGCQQIMEQLQPALKTGTEEL RSLFNTVATLYCVHQRIDVKDTKEALDKIEEIQNKSK QKTQQAAADTGNSSKVSQNYPIVQNAQGQMIHQSLSPR TLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNMMLNIVGGHQAAMQMLKDTINEEAAEWDRVHPVHAGPIPP GQMREPRGGDIAGTTSTPQEQIGWMTSNPPIPVGDIYKRWIILGLHKLVRMYSPVSILDIKQGPKEPFRDYVDRF FKTLRA EQATQEVKGWMTETLLIQNANPDCKSILRALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQVQHTNI MMQRGNFRGQKRIKCFNCGKEGHLARNCRAPRKRGCWKCGREGHQMKDCNERQANFLGKIWPSSKGRPGNFPQSR PEPTAPQNRLEPTAPPAEPTAPPAEIFGMGEEITSPPKQEQKDREQAPPLVSLK SLFGNDLLSQ SEQ ID NO: 765 CEN-5 Preserved HIV M gag, Custom PIVQNAQGQMIHQSLSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNMMLNIVGGHQAAMQMLKDTINE EAAEWDRVHPVHAGPIPPGQMREPRGGDIAGTTSTPQEQIGWMTSNPPIPVGDIYKRWIILGLHKLVRMYSPVSI LDIKQGPKEPFRDYVDRFFKTLRAEQATQEVKGWMTETLLIQNANP DCKSILRALGPGATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 766 EG-0 HIV C gag episense, Custom MGARASILRGGKLDKWEKIRLRPGGKKHYMLKHLVWASRELERFALNPGLLETSEGCKQIMKQLQPALQTGTEEL RSLYNTVATLYCVHEKIEVRDTKEALDKIEEEQNKSQQKTQQAKAADG LRAEQATQDVKNWMTDTL LVQNANPDCKTILRALGPGATLEEMMTACQGVGGPGHKARVLAEAMSQANSNIMMQR SNFKGPKRIVKCFNCGKEGHIARNCRAPRKKGCWKCGKEGHQMKDCTERQANFLGKIWPSHKGRPGNFLQSRPEP TAPPAEPTAPPAESFRFEETTPAPKQEPKDREPLTSLKSLFGSDPLSQ SEQ ID NO: 767 EG-0 episense Preserved from HIV C gag, Custom PIVQNLQGQMVHQAISPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPQDLNTMLNTVGGHQAAMQMLKDTINE EAAEWDRLHPVHAGPVAPGQMREPRGSDIAGTTSTLQEQIAWMTSNPPIPVGDIYKRWIILGLNKIVRMYSPVSI LDIKQGPKEPFRDYVDRFFKTLRAEQATQDVKNWM TDTLLVQNANPDCKTILRALGPGATLEEMMTACQGVGGPG HKARVL SEQ ID NO: 768 CEN-1 HIV C gag, Custom MGARASILRGEKLDKWEKIKLRPGGKKRYMLKHLIWASRELERFALNPSLLETSEGCKQIIKQLQPALKTGTEEL RSLFNTVATLYCVHAGIEVRDTKEALDRIEEEQNKCQQKTQQAEAADKGKVSQNYPIVQNAQGQMVHQALSPRTL NAWVKVVEEKAFSPEI IPMFTALSEGATPSDLNSMLNTVGGHQAAMQMLKDTINDEAAEWDRVHPVHAGPIAPGQ MREPRGSDIAGTTSNLQEQIAWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSILDIRQGPKEPFRDYVDRFFK CLRAEQATQEVKNWMTDTLLIQNANPDCKTILKALGPGASLEEMMTACQGVGGPSHKARVLAEAMSQVNNA NIMM QRGNFKGPKRIIKCFNCGKEGHLARNCRAPRKKGCWKCGQEGHQMKDCSNERQANFLGKLWPSHKGGRPGNFLQN RPEPTAPPVEPTAPPAEPTAPPAESFKFEETTPVPKQELKDREPLISLKSLFGNDPLSQ SEQ ID NO: 769 CEN-1 Preserved HIV C gag, Customized IVQNAQGQMVHQALSPRTLNAWV KVVEEKAFSPEIIPMFTALSEGATPSDLNSMLNTVGGHQAAMQMLKDTINDE AAEWDRVHPVHAGPIAPGQMREPRGSDIAGTTSNLQEQIAWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSIL DIRQGPKEPFRDYVDRFFKCLRAEQATQEVKNWMTDTLLIQNANPDCKTILKALGPGASLEEMMTACQGVGGPSH K ARVL SEQ ID NO: 770 CEN-2 HIV C gag, Custom MGARASILRGEKLDKWERIRLRPGGKKHYMIKHLVWASRELEKFALNPGLLETADGCKQIIKQLHPALQTGTEEL KSLYNTVATLYCVHERIEVRDTKEALDRIEEEQNKCQQKTQQAEAADKGKVSQNYPIVQNAQGQMVHQPISPRTL NAWVKVVEEKAFSPEIIPMFTALSEGATPTDLNTMLNTIGGH QAAMQILKDTINEEAVEWDRLHPVQAGPVAPGQ IREPRGSDIAGTTSNLQEQIAWMTGNPPVPVGDIYKRWIIMGLNKIVRMYSPVSILDIRQGPKEPFRDYVDRFFK VLRAEQATQEVKNWMTETLLVQNANPDCKIILKGLGPAATLEEMMTACQGVGGPSHKARVLAEAMSQVNNTNIMM QKSNFKGPKRTVKCFNC GKEGHIAKNCRAPRKKGCWKCGREGHQMKDCNERQANFLGKIWPSQKGRPGNFLQNRP EPTAPRPEPTAPPRLEPTAPPAEPSAPPAESFRFEGTTPAPKQESKDREPLISLKSLFGNDPLSQ SEQ ID NO: 771 CEN-2 Conserved HIV C gag, Custom PIVQNAQGQMVHQPISPRTLNAWVKVVEEKAFSPEIIPMF TALSEGATPTDLNTMLNTIGGHQAAMQILKDTINE EAVEWDRLHPVQAGPVAPGQIREPRGSDIAGTTSNLQEQIAWMTGNPPVPVGDIYKRWIIMGLNKIVRMYSPVSI LDIRQGPKEPFRDYVDRFFKVLRAEQATQEVKNWMTETLLVQNANPDCKIILKGLGPAATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 77 2 CEN-3 gag HIV C, Custom MGARASILRGEKLDRWERIRLRPGGKKCYMLKHIVWASRELERFSLNPGLLETAEGCKQIIKQLHPALQTGTEEL KSLFNTVATLYCVHKKIDVRDTKEALDKVEEEQNKCQQKTQQAKAADEKVSQNYPIVQNIQGQMVHQALSPRTLN AWVKVVEEKAFSPEIIPMFTAL SEEATPQDLNTMLNAVGGHQAAMQMLKETINEEAAEWDRVHPVHAGPIAPGQM REPRGSDIAGTTSNLQEQIAWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSILDIRQGPKEPFRDYVDRFFRV LRAEQATQEVKNWMTDTLLIQNANPDCKTILKALGPGASLEEMMTACQGVGGPSHKARVLAEAMSQANNINIMMQ RGNFKGPKRTVKCFNCGKEGHIAKNCRAPRKRGCWKCGKEGHQMKDCNERQANFLGRIWPSHKGRPGNFLQNRPE PTAPSAESFRQNRTEPTAPPARLEPTAPPAEPSAPPVESFRFEETTPALKQESKDREPLTSLRSLFGSDPLFQ SEQ ID NO: 773 CEN-3 Preserved HIV C gag, Custom PIVQNIQGQMVHQALSPRTLNAWVKVVEEKAFSPEIIPMFTALSEEATPQDLNTMLNAVGGHQAAMQMLKETINE EAAEWDRVHPVHAGPIAPGQMREPRGSDIAGTTSNLQEQIAWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPVSI LDIRQGPKEPFR DYVDRFFRVLRAEQATQEVKNWMTDTLLIQNANPDCKTILKALGPGASLEEMMTACQGVGGPS HKARVL SEQ ID NO: 774 CEN-4 HIV C gag, Custom MGARASVLRGEKLDKWERIRLRPGGKKQYMLKHIVWASRELEKFALNPGLLETAEGCKQIIKQLHPALQTGTEEL RSLFNTVATLYCVHKGIDVR DTKEALDKVEEEQNKCQQKTQQAEADKKVSQNYPIVQNIQGQMVHQPLSPRTLNA WVKVVEEKAFSPEVIPMFSALSEGATPGDLNTMLNTIGGHQAAMQMLKDTINDEAAEWDRLHPVHAGPIAPGQMR EPRGSDIAGTTSNLQEQIAWMTNNPPVPVGEIYKRWIVLGLNKIVRMYSPVSILDIRQGPKEPFRDYVD RFFRTL RAEQATQEVKNWMTETLLVQNANPDCKNILRALGPGASLEEMMTACQGVGGPSHKARVLAEAMSQANNTNIMMQK SNFKGPRRIVKCFNCGKEGHIAKNCRAPRKRGCWKCGKEGHQMKDCNERQANFLGKIWPSNKGRPGNFLQNRPEP TAPQSRPEPTAPLEPTAPPAEPTAPPAESFKFEETTPAPKQEQKDR EPLISLKSLFGNDPLSQ SEQ ID NO: 775 CEN-4 Preserved from HIV C gag, Custom PIVQNIQGQMVHQPLSPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPGDLNTMLNTIGGHQAAMQMLKDTIND EAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSNLQEQIAWMTNNPPVPVGEIYKRWIVLGLNKIVRMYSPVSI LDIRQGPKEPFRDYVDRFFRTLRAEQATQEVKNWM TETLLVQNANPDCKNILRALGPGASLEEMMTACQGVGGPS HKARVL SEQ ID NO: 776 HIV C gag CEN-5, Custom MGARASVLRGEKLDKWERIRLRPGGKKRYMLKHIVWASRELEKFALNPGLLETAEGCKQIIKQLQPALQTGTEEL KSLFNTVATLYCVHEKIDVRDTKEALDRIEEEQNKCQQKTQQA KAADEKVSQNYPIVQNAQGQMVHQALSPRTLN AWVKVIEEKGFNPEVIPMFTALSDGATPQDLNSMLNTVGGHQAAMQILKDTINEEAAEWDRVHPVHAGPIAPGQM REPRGSDIAGTTSNLQEQIAWMTGNPPIPVGEIYKRWIILGLNKIVRMYSPVSILDIRQGPKEPFRDYVDRFFKA LRAEQATQEVKN WMTETLLVQNANPDCKNILRALGPGASLEEMMTACQGVGGPSHKARVLAEAMSQANNTNIMMQ RNNFKGPKRIIKCFNCGKEGHIAKNCRAPRKKGCWKCGREGHQMKDCNERQANFLGRIWPSHKGGRPGNFLQNRP EPTAPPVEPTAPPAEPTAPPAESFKFEETTPTPKQEQKDREPLISLKSLFGNDPLSQ SEQ ID NO: 77 7 CEN-5 Preserved HIV C gag, Custom PIVQNAQGQMVHQALSPRTLNAWVKVIEEKGFNPEVIPMFTALSDGATPQDLNSMLNTVGGHQAAMQILKDTINE EAAEWDRVHPVHAGPIAPGQMREPRGSDIAGTTSNLQEQIAWMTGNPPIPVGEIYKRWIILGLNKIVRMYSPVSI LDIRQGPKEPFRDYVDRFFKALRA EQATQEVKNWMTETLLVQNANPDCKNILRALGPGASLEEMMTACQGVGGPS HKARVL SEQ ID NO: 778 EG-0 HIV B gag episense, Customized AISPR TLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINEEAAEWDRLHPVHAGPIAP GQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPTSILDIRQGPKEPFRDYVDRF YKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQG VGGPGHKARVLAEAMSQVTNSAT IMMQRGNFRNQRKTVKCFNCGKEGHIARNCRAPRKKGCWKCGKEGHQMKDCTERQANFLGKIWPSHKGRPGNFLQ SRPEPTAPPEPTAPPEESFRFGEETTTPSQKQEPIDKELYPLASLKSLFGNDPSSQ SEQ ID NO: 779 EG-0 Preserved HIV B gag episense, Custom PIVQNLQG QMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINE EAAEWDRLHPVHAGPIAPGQMREPRGSDIAGTTSTLQEQIGWMTNNPPIPVGEIYKRWIILGLNKIVRMYSPTSI LDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLE EMMTACQGVGGPG HKARVL SEQ ID NO: 780 HIV C gag CEN-1, Custom MGSRASVLSGGKLDQWEKIRLRPGGKKRYKLKHLVWASRELERFAVNPSLLETSEGCKQILGQLQPALQTGSEEL RSLYNTIAVLYCVHQRIEVKDTKEALEKIEEEQNKCKKKAQQAAAAAADTGNSNQVSQNYPIVQNMQGQMVHQAL SPRTLNAWVKVIEEKAFSPEVIPMF TALSEGATPADLNTMLNTIGGHQAAMQILKETINEEAAEWDRVHPVHAGP VAPGQMREPRGSDIAGSTSTLQEQIAWMTSNPPIPVGDIYKRWIIMGLNKIVRMYSPTSILDIKQGPKEPFRDYV DRFYKTLRAEQATQEVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQVTT PPAI MMQRGNFKNQRKIVKCFNCGKEGHLARNCRAPRKRGCWKCGREGHQMKDCSERQANFLGKIWPSYKGRPGN FLQNRPEPTAPPAEPTAPPAESFRFGEETATPPQKQEPIDKEMYPLTSLRSLFGNDPSQ SEQ ID NO: 781 CEN-1 Conserved from HIV B gag, Custom PIVQNMQGQMVHQALSPRTLNAWVKVIEE KAFSPEVIPMFTALSEGATPADLNTMLNTIGGHQAAMQILKETINE EAAEWDRVHPVHAGPVAPGQMREPRGSDIAGSTSTLQEQIAWMTSNPPIPVGDIYKRWIIMGLNKIVRMYSPTSI LDIKQGPKEPFRDYVDRFYKTLRAEQATQEVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 782 HIV C gag CEN-2 , custom NTMLNTIGGHQAAMQILKETINDEAAEWDRTHPVHAGPV APGQMRDPRGSDIAGTTSNLQEQIGWMTHNPPIPVGDIYKRWIIMGLNKIVRMYSPVSILDIKQGPKEPFRDYVD RFYKILRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQMTNS ATIMMQKGNFRNQRK TIKCFNCGKEGHLARNCRAPRKRGCWKCGQEGHQMKDCNERQANFLGKIWPSSKGRPGNF LQSRPESRPEPTAPPAEPTAPPAESFRFGEETATPPQKQEPIDKEMYPLASLRSLFGNDPSSK SEQ ID NO: 783 CEN-2 Preserved HIV B gag, Custom PIVQNIQGQMVHQALSPRTLNAWVKVIEEKAFSPEVIPMF TALSEGATPPHDLNTMLNTIGGHQAAMQILKETIND EAAEWDRTHPVHAGPVAPGQMRDPRGSDIAGTTSNLQEQIGWMTHNPPIPVGDIYKRWIIMGLNKIVRMYSPVSI LDIKQGPKEPFRDYVDRFYKILRAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 784 HIV C gag CEN-3, Customized EGATPGDLNLMLNAVGGHQAAMQMLKDTINEEAADWDRLHPVQAGP VAPGQLREPRGSDIAGTTSNLQEQIAWMTHNPPIPVGEIYKRWIIMGLNKIVRMYSPVSILDIKQGPKEPFRDYV DRFYRTLRAEQASQDVKNWMTETLLIQNANPDCRTILKALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQATS SATIMMQK GNFRNQRKIVKCFNCGKEGHIAKNCRAPRKRGCWKCGREGHQMKDCSERQANFLGKIWPSYKGRPGN FLQNRPEPTAPPAEPTAPPAESFRFGEETTTPPQKQEPTDKELYPLASLRSLFGNDPLSQ SEQ ID NO: 785 CEN-3 Conserved HIV B gag, Custom PIVQNIQGQMVHQALSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPGDLNLMLNAVGGHQAAMQMLKDTINE EAADWDRLHPVQAGPVAPGQLREPRGSDIA GTTSNLQEQIAWMTHNPPIPVGEIYKRWIIMGLNKIVRMYSPVSI LDIKQGPKEPFRDYVDRFYRTLRAEQASQDVKNWMTETLLIQNANPDCRTILKALGPGATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 786 CEN-4 HIV C gag, Custom MGARASILSGGELDKWEKIRLRPGGKKKYRLKHIVWASNELERF ALNPGLLETSDGCRQILGQLHPSLQTGSEEL RSLYNTVAVLYCVHQRIEIKDTKEALEKIEEEQNKCKKKAQQAAAAQQAAAGTGNNSQVSQNYPIVQNMQGQMVH QALSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPPHDLNTMLNTIGGHQAAMQILKETINEEAAEWDRVHPVH AGPIAPGQIREPRGSDIA GTTSNLQEQIGWMTHNPPIPVGEIYKKWIIMGLNKIVRMYSPVSILDIKQGPKEPFR DYVDRFYKTLRAEQATQEVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPAHKARVLAEAMSQ ATNSAAIMMQKGNFRNQRRTVKCFNCGKEGHIAKNCRAPRKKGCWKCGQEGHQMKDCNERQANFLGR SWPSLKGR PGNFLQNRPEPSAPPEESFKFGEETTTPPQKQEPIDKDLYPLASLRSLFGNDPSST SEQ ID NO: 787 CEN- 4 Preserved HIV B gag, Custom PIVQNMQGQMVHQALSPRTLNAWVKVIEEKAFSPEVIPMFTALSEGATPPHDLNTMLNTIGGHQAAMQILKETINE EAAEWDRVHPVHAGPIAPGQIREPRGSDIAGTTSNLQEQIGWMTHNPPIPVGEIYKKWIIMGLNKIVRMYSPVSI LDIKQGPKEPFRDYVDRFYKTLRAEQAT QEVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPA HKARVL SEQ ID NO: 788 HIV C gag CEN-5, Custom MGSRASVLSGGKLDKWEKIRLRPGGKKKYQLKHIVWASRELERYALNPGLLETAEGCRQILEQLQPALQTGSEEL RSLYNTVAVLYCVHQKIEVKDTKEALEKVEEEQNK SKKRIQQAQQAAAADTGNSSKVSQNYPIVRNLQGQMVHQP ISPRTLNAWVKVIEEKAFSPEVIPMFSALAEGATPQDLNLMLNAVGGHQAAMQMLKDTINEEAAEWDRMHPVHAG PVAPGQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGEIYKRWIIMGLNKIVRMYSPVSILDIKQGPKEPFRDY VDRFYRTL RAEQASQDVKNWMTETLLVQNSNPDCKTILKALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQVT NSTAIMMQRGNFKNQRKIVKCFNCGKEGHIAKNCRAPRKRGCWKCGREGHQMKECTERQVNFLGKIWPSYKGRPG NFLQNRPEPTAPPAPPEESFRFGEGTTTPSQKQGTIDKELYPLTSLRSLFGNDPS SEQ ID NO: 7 89 CEN-5 Preserved HIV B gag, Custom PIVRNLQGQMVHQPISPRTLNAWVKVIEEKAFSPEVIPMFSALAEGATPQDLNLMLNAVGGHQAAMQMLKDTINE EAAEWDRMHPVHAGPVAPGQMREPRGSDIAGTTSNLQEQIGWMTSNPPIPVGEIYKRWIIMGLNKIVRMYSPVSI LDIKQGPKEPFRDYVDRFYRTLRAEQASQDVKNWMTETLLVQNSNPDC KTILKALGPGATLEEMMTACQGVGGPS HKARVL SEQ ID NO: 790 VTSSNMNNA SEQ ID NO: 791 TSSNMNNAD SEQ ID NO: 792 TSSNMNNADSVWLRAQEEE SEQ ID NO: 793 TSSNMNNADCVWLRAQEEE SEQ ID NO: 794 ARCHSLM SEQ ID NO: 795 DEFGKLM SEQ ID NO: 796 EPTAPPAEPTAP SEQ ID NO : 797 PTAPPAEPTAPP SEQ ID NO: 798 EPTAPPAEPTAPP SEQ ID NO: 799 ARCGSLM SEQ ID NO: 800 ARCGSPM SEQ ID NO: 801 ARYGSLM SEQ ID NO: 802 AYCHSLM SEQ ID NO: 803 YRCHSLM SEQ ID NO: 804 DEFGSLM SEQ ID NO: 805 DEFGKLM SEQ ID NO: 806 ARCCDEGH SEQ ID NO: 807 ARCDEFGH SEQ ID NO: 808 ARCCDE-GH SEQ ID NO: 809 ARC-DEFGH SEQ ID NO: 810 DECHJLM SEQ ID NO: 811 DEFGJLM
Claims (18)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62/059.506 | 2014-10-03 | ||
US62/059.497 | 2014-10-03 |
Publications (1)
Publication Number | Publication Date |
---|---|
BR122021016789B1 true BR122021016789B1 (en) | 2023-08-22 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11554168B2 (en) | HIV vaccines comprising one or more population episensus antigens | |
Burns et al. | Protective effect of rotavirus VP6-specific IgA monoclonal antibodies that lack neutralizing activity | |
JP2018536433A (en) | Vaccine against hepatitis B virus | |
EA011557B1 (en) | Nucleic acid constructs | |
BR112020011976A2 (en) | immunogenic composition and kit against hepatitis b virus, uses thereof, and non-naturally occurring nucleic acid molecule | |
JP2022545530A (en) | Hepatitis B virus vaccine | |
Sexton et al. | Evaluation of recombinant influenza virus-simian immunodeficiency virus vaccines in macaques | |
BR122021016789B1 (en) | HIV-1 VACCINES COMPRISING ONE OR MORE POPULATION EPISSENSE ANTIGENS, USES THEREOF TO PROTECT AN INDIVIDUAL FROM AN HIV-1 INFECTION, TREAT HIV-1 AND INDUCE AN EFFECTOR MEMORY T CELL RESPONSE, AS WELL AS POLYPEPTIDE AND METHOD FOR DESIGN AND PRODUCE SAID VACCINES | |
BR112017006865B1 (en) | HIV-1 VACCINE COMPRISING ONE OR MORE POPULATION EPISSENSE ANTIGENS, USE THEREOF TO PROTECT AN INDIVIDUAL FROM AN HIV-1 INFECTION OR TO TREAT HIV-1 AND POLYPEPTIDE | |
van der Heijden et al. | Structural and functional studies on a unique linear neutralizing antigenic site (G5) of the rabies virus glycoprotein | |
US20220040284A1 (en) | Vaccines and methods | |
Chen et al. | Comparative analysis of antibody induction and protection against influenza virus infection by DNA immunization with HA, HAe, and HA1 in mice | |
EA040402B1 (en) | HUMAN IMMUNODEFICIENCY VIRUS (HIV) VACCINES CONTAINING ONE OR MORE EPISENSUS ANTIGENS FOR A POPULATION | |
Sundaram et al. | Structural and immunogenicity analysis of chimeric B‐cell epitope constructs derived from the gp46 and gp21 subunits of the envelope glycoproteins of HTLV‐1 | |
Kadam et al. | Molecular and structural insights into COVID-19 pandemic | |
Rhimi et al. | Prospective on Different Approaches for Vaccine Development Against COVID-19: past lessons and future challenges | |
BR102019025802A2 (en) | PROCESS OF PRODUCTION OF A PROPHYLATIC AND THERAPEUTIC DNA IMMUNOLOGICAL COMPOSITION AGAINST HPV AND VIRUS-ASSOCIATED CANCER, HYBRID PROTEIN, EXPRESSION VECTOR, IMMUNOLOGICAL COMPOSITION AND THEIR USES | |
CN110577585A (en) | Vesicular stomatitis virus envelope glycoprotein variant, and construction method and application thereof | |
KR20240057459A (en) | Vaccine composition against bunyamwera orthobuniavirus and method for preparing the same | |
CN114933640A (en) | New coronary vaccine with SARS-CoV-2 virus envelope E protein as target spot | |
Meng et al. | A pilot study comparing the development of EIAV Env-specific antibodies induced by DNA/recombinant vaccinia-vectored vaccines and an attenuated Chinese EIAV vaccine |