BR112021006149A2 - método para selecionar neoantígenos de câncer, método para a construção de um vetor, vetor e coleção de vetores - Google Patents

método para selecionar neoantígenos de câncer, método para a construção de um vetor, vetor e coleção de vetores Download PDF

Info

Publication number
BR112021006149A2
BR112021006149A2 BR112021006149-5A BR112021006149A BR112021006149A2 BR 112021006149 A2 BR112021006149 A2 BR 112021006149A2 BR 112021006149 A BR112021006149 A BR 112021006149A BR 112021006149 A2 BR112021006149 A2 BR 112021006149A2
Authority
BR
Brazil
Prior art keywords
neoantigens
mutation
neoantigen
list
binding affinity
Prior art date
Application number
BR112021006149-5A
Other languages
English (en)
Inventor
Alfredo Nicosia
Elisa Scarselli
Guido Leoni
Armin Lahm
Original Assignee
Nouscom Ag
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nouscom Ag filed Critical Nouscom Ag
Publication of BR112021006149A2 publication Critical patent/BR112021006149A2/pt

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/10Design of libraries
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/0005Vertebrate antigens
    • A61K39/0011Cancer antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4748Tumour specific antigens; Tumour rejection antigen precursors [TRAP], e.g. MAGE
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/555Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
    • A61K2039/55511Organic adjuvants
    • A61K2039/55516Proteins; Peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Library & Information Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Veterinary Medicine (AREA)
  • Oncology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Mycology (AREA)
  • Epidemiology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Toxicology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Hospice & Palliative Care (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)

Abstract

A presente invenção refere-se a um método para selecionar neoantígenos de câncer para uso em uma vacina personalizada. A presente invenção também diz respeito a um método para construir um vetor ou coleção de vetores que transportam os neoantígenos para uma vacina personalizada. Esta invenção refere-se ainda a vetores e coleção de vetores compreendendo a vacina genética personalizada e o uso dos referidos vetores no tratamento do câncer.

Description

“MÉTODO PARA SELECIONAR NEOANTÍGENOS DE CÂNCER, MÉTODO PARA A CONSTRUÇÃO DE UM VETOR, VETOR E COLEÇÃO DE VETORES”
[001] A presente invenção refere-se a um método para selecionar neoantígenos de câncer para uso em uma vacina personalizada. A presente invenção também se refere a um método para construir um vetor ou coleção de vetores que transportam os neoantígenos para uma vacina personalizada. Esta invenção refere-se ainda a vetores e coleções de vetores compreendendo a vacina personalizada e o uso dos referidos vetores no tratamento do câncer.
ANTECEDENTES DA INVENÇÃO
[002] Vários antígenos tumorais foram identificados e classificados em diferentes categorias: linhagem germinativa do câncer, antígenos de diferenciação de tecidos e neoantígenos derivados de proteínas próprias mutadas (Anderson et al., 2012). É uma questão de debate se as respostas imunológicas contra autoantígenos têm um impacto no crescimento do tumor (revisado em Anderson et al., 2012). Em contrapartida, recentes evidências convincentes apoiam a noção de que os neoantígenos, gerados no tumor como uma consequência de mutações em sequências codificantes de genes expressos, representam um alvo promissor para a vacinação contra o câncer (Fritsch et al., 2014).
[003] Os neoantígenos do câncer são antígenos presentes exclusivamente nas células tumorais e não nas células normais. Os neoantígenos são gerados por mutações do DNA nas células tumorais e demonstraram desempenhar um papel significativo no reconhecimento e na morte de células tumorais pela resposta imune mediada por células T, principalmente por células T CD8+ (Yarchoan et al., 2017). O advento de métodos de sequenciamento massivamente paralelo comumente referido com sequenciamento de próxima geração (NGS), que permite determinar a sequência completa de um genoma do câncer de maneira oportuna e barata, revelou os espectros mutacionais de tumores humanos (Kandoth et al., 2013).
O tipo de mutação mais frequente é uma variante de nucleotídeo único e o número médio de variantes de nucleotídeo único encontradas em tumores varia consideravelmente de acordo com sua histologia. Uma vez que muito poucas mutações são geralmente compartilhadas entre os pacientes, a identificação de mutações que geram neoantígenos requer uma abordagem personalizada.
[004] Na verdade, muitas mutações não são vistas pelo sistema imunológico, porque os epítopos potenciais não são processados/apresentados pelas células tumorais, ou porque a tolerância imunológica leva à eliminação de células T reativas com a sequência mutada. Portanto, é benéfico selecionar, entre todos os potenciais neoantígenos, aqueles que possuem a maior oportunidade para ser imunogênico, para definir o número ótimo para ser codificado por uma vacina e, finalmente, uma configuração de vacina preferida para otimizar a imunogenicidade. Além disso, não apenas neoantígenos gerados por mutações variantes de nucleotídeo único, mas também neoantígenos gerados por mutações de inserção/deleção que geram um peptídeo proveniente de mudança da fase de leitura (FSP, do inglês frameshift peptide) são importantes, e espera-se que estes últimos sejam particularmente imunogênicos. Recentemente, duas abordagens diferentes de vacinação personalizadas baseadas em RNA ou em peptídeos foram avaliadas em estudos clínicos de fase I. Os dados obtidos mostram que a vacinação pode, de fato, expandir células T específicas para neoantígenos pré-existentes e induzir um repertório mais amplo de nova especificidade de células T em pacientes com câncer (Sahin et al., 2017). A principal limitação de ambas as abordagens é o número máximo de neoantígenos que são visados por essas abordagens de vacinação. O limite superior da abordagem baseada em peptídeos, com base nos dados publicados, é de vinte peptídeos e não foi atingido em todos os pacientes, pois, em alguns casos, os peptídeos não puderam ser sintetizados. O limite superior descrito para a abordagem baseada em RNA é ainda mais baixo, uma vez que apenas 10 mutações foram incluídas em cada vacina (Sahin et al., 2017).
[005] O desafio de uma vacina contra o câncer na cura do câncer é induzir uma população diversificada de células T imunes, capaz de reconhecer e eliminar o maior número possível de células cancerosas ao mesmo tempo, para diminuir a chance das células cancerosas “escaparem” da resposta de células T e não serem reconhecidas pela resposta imune. Portanto, é desejável que a vacina codifique um número bastante grande de antígenos específicos para o câncer, ou seja, neoantígenos. Isso é particularmente relevante para uma abordagem de vacina genética personalizada com base em neoantígenos específicos para o câncer de um indivíduo. A fim de otimizar a probabilidade de sucesso, o maior número possível de neoantígenos deve ser visado pela vacina. Além disso, os dados experimentais apoiam a noção de que neoantígenos imunogênicos eficazes em pacientes cobrem uma ampla gama de afinidades previstas para os alelos MHC do paciente (por exemplo, Gros et al., 2016). A maioria dos métodos de priorização atuais, em vez disso, aplica um limite de afinidade, por exemplo, o limite de 500 nM frequentemente usado, que pode limitar a seleção de neoantígenos imunogênicos. Há, portanto, a necessidade de um método de priorização que evite as limitações dos métodos atuais (por exemplo, exclusão de vido à baixa afinidade prevista) e de uma abordagem de vacinação que permita uma vacina personalizada visando um conjunto grande e, portanto, mais amplo e completo, de neoantígenos.
DESCRIÇÃO RESUMIDA DA INVENÇÃO
[006] Em um primeiro aspecto, a presente invenção fornece um método para selecionar neoantígenos de câncer para uso em uma vacina personalizada que compreende as etapas de: (a) determinar neoantígenos em uma amostra de células de câncer obtida a partir de um indivíduo, em que cada neoantígeno - está compreendido em uma sequência codificante, - compreende pelo menos uma mutação na sequência codificante, resultando em uma alteração na sequência de aminoácidos codificada que não está presente em uma amostra de células não cancerosas do referido indivíduo, e - consiste em 9 a 40, de preferência 19 a 31, mais preferencialmente 23 a 25, mais preferencialmente 25 aminoácidos contíguos da sequência codificante na amostra de células de câncer, (b) determinar para cada neoantígeno a frequência do alelo mutante de cada uma das referidas mutações da etapa (a) dentro da sequência codificante, (c) determinar o nível de expressão de cada sequência codificante compreendendo pelo menos uma das referidas mutações, (i) na referida amostra de células cancerosas, ou (ii) a partir de um banco de dados de expressão do mesmo tipo de câncer que a amostra de células cancerosas, (d) predizer a afinidade de ligação ao MHC classe I dos neoantígenos, em que (I) os alelos HLA de classe I são determinados a partir da amostra de células não cancerosas do referido indivíduo, (II) para cada alelo HLA classe I determinado em (I), a afinidade de ligação ao MHC classe I de cada fragmento consistindo de 8 a 15,
de preferência 9 a 10, mais preferencialmente 9, aminoácidos contíguos do neoantígeno é prevista, em que cada fragmento compreende pelo menos uma alteração de aminoácido causada pela mutação da etapa (a), e (III) o fragmento com a maior afinidade de ligação ao MHC classe I determina a afinidade de ligação ao MHC classe I do neoantígeno, (e) classificar os neoantígenos de acordo com os valores determinados nas etapas (b) a (d) para cada neoantígeno a partir dos valores mais altos para os mais baixos, produzindo uma primeira, uma segunda e uma terceira lista de classificações, (f) calcular a soma de classificação da referida primeira, segunda e terceira lista de classificação e ordenar os neoantígenos pelo aumento da soma classificação, produzindo uma lista ordenada de neoantígenos, (g) selecionar de 30 - 240, de um modo preferido de 40-80, mais preferivelmente 60, neoantígenos a partir da lista de neoantígenos classificados obtida em (f) começando com a classificação mais baixa.
[007] Em um segundo aspecto, a presente invenção proporciona um método para a construção de um vetor personalizado que codifica uma combinação de neoantígenos de acordo com o primeiro aspecto da invenção para uso como uma vacina, compreendendo as etapas de: (i) ordenar a lista de neoantígenos em pelo menos 10 5 - 108, de preferência 106 combinações diferentes, (ii) gerar todos os pares possíveis de segmentos de junção de neoantígeno para cada combinação, em que cada segmento de junção compreende 15 aminoácidos contíguos adjacentes em cada lado da junção, (iii) predizer a afinidade de ligação de MHC classe I e/ou classe II para todos os epítopos em segmentos de junção, em que são testados apenas os alelos HLA que estão presentes no indivíduo para o qual o vetor é projetado, e (iv) selecionar a combinação de neoantígenos com o menor número de epítopos juncionais com um IC50 ≤ 1500nM, e em que se várias combinações tiverem o mesmo número de epítopos juncionais mais baixo, a primeira combinação encontrada é selecionada.
[008] Em um terceiro aspecto, a presente invenção provê um vetor que codifica a lista de neoantígenos de acordo com o primeiro aspecto da invenção ou a combinação de neoantígenos de acordo com o segundo aspecto da invenção.
[009] Em um quarto aspecto, a presente invenção fornece uma coleção de vetores que codificam cada conjunto diferente de neoantígenos de acordo com o primeiro aspecto da invenção ou a combinação de neoantígenos de acordo com o segundo aspecto da invenção, em que a coleção compreende 2 a 4, preferencialmente 2 vetores e preferencialmente as inserções de vetor que codificam a porção da lista são de tamanho aproximadamente igual em número de aminoácidos.
[010] Em um quinto aspecto, a presente invenção provê um vetor de acordo com o terceiro aspecto da invenção ou uma coleção de vetores de acordo com o quarto aspecto da invenção para uso na vacinação contra o câncer.
BREVE DESCRIÇÃO DAS FIGURAS
[011] A seguir, é descrito o conteúdo das figuras compreendidas neste relatório descritivo. Neste contexto, consulte também a descrição detalhada da invenção acima e/ou abaixo.
[012] Figura 1: Geração de neoantígenos derivados de uma SNV: (A) geração de neoantígenos de 25mer com a mutação centrada e flanqueada por 12 aa wt a montante e a jusante, (B) geração de neoantígenos de 25mer incluindo mais de uma mutação e (C) geração de um neoantígeno mais curto do que 25mer quando a mutação está próxima do final ou início da sequência de proteína.
[013] Figura 2: Geração de neoantígenos derivados de indels gerando um peptídeo proveniente de mudança da fase de leitura (FSP, do inglês frameshift peptide). O processo compreende a divisão de FSPs em fragmentos menores, de preferência de 25mers.
[014] Figura 3: Descrição esquemática da geração da lista de classificação RSUM a partir das três pontuações de classificação individuais.
[015] Figura 4: Descrição esquemática do procedimento para otimizar o comprimento de neoantígenos sobrepostos derivados de um FSP.
[016] Figura 5: Descrição esquemática do procedimento para dividir os neoantígenos K (de preferência 60) em duas listas menores com comprimento total aproximadamente igual.
[017] Figura 6: Exemplos de fusão de fragmentos FSP: O Exemplo 1 refere-se ao FSP gerado pela deleção de 2 nucleotídeos chr11: 1758971_AC. Quatro sequências de neoantígenos (fragmentos FSP) são fundidas em um neoantígeno de 30 aminoácidos de comprimento. O exemplo 2 refere-se ao FSP gerado pela inserção de um nucleotídeo chr6: 168310205_- _T. Duas sequências de neoantígenos (fragmentos FSP) são fundidas em um neoantígeno de 31 aminoácidos.
[018] Figura 7: Validação do método de priorização: Mutações de 14 pacientes com câncer foram classificadas aplicando o método de priorização do Exemplo 1. A Figura descreve a posição na lista classificada para mutações que foram experimentalmente mostradas como indutoras de uma resposta imune. As classificações são indicadas por um círculo (A) ou um quadrado (B) para a classificação RSUM, incluindo os dados NGS-RNA dos pacientes (A) ou sem os dados NGS-RNA dos pacientes (B).
[019] Figura 8: Imunogenicidade de um único vetor GAd ou de dois vetores GAd que codificam 62 neoantígenos. Um vetor GAd que codifica todos os 62 neoantígenos em um único cassete de expressão (GAd-CT26-1- 62) induz uma resposta imune mais fraca em comparação com dois vetores GAd coadministrados, cada um codificando 31 neoantígenos (GAd-CT26-1-31 + GAd-CT26 -32-62) ou um vetor GAd codificante de dois cassetes de 31 neoantígenos cada (GAd-CT26 dual 1-31 & 32-62). Camundongos BalbC (6 camundongos/grupo) foram imunizados por via intramuscular com (A) 5x108 v.p. de GAd-CT26-1-62 ou por coadministração de dois vetores GAd-CT26-1- 31 + GAd-CT26-32-62 (5x108 v.p. cada) e (B) 5x108 v.p. de GAd-CT26-1-62 ou 5x108 v.p. do vetor de cassete duplo GAd-CT26 dual 1-31 & 32-62. As respostas das células T foram medidas em esplenócitos de camundongos vacinados no pico da resposta (2 semanas após a vacinação) por ELISpot para IFNγ ex-vivo. As respostas foram avaliadas usando 2 conjuntos (pools) de peptídeos, cada um composto por 31 peptídeos codificados pelas construções de vacina (pool 1-31 de neoantígenos 1 a 31; pool 32-62 de neoantígenos 32 a 62). Cada um dos vetores polineoantígenos compreende uma sequência de intensificador de células T (TPA) adicionada no N-terminal dos polineoantígenos montados e um marcador (tag) HA de influenza no C-terminal para monitorar a expressão.
DESCRIÇÃO DETALHADA DA INVENÇÃO
[020] Antes de a presente invenção ser descrita em detalhes abaixo, deve ser entendido que a presente invenção não está limitada à metodologia, protocolos e reagentes específicos aqui descritos, pois estes podem variar. Também é preciso entender que a terminologia utilizada no presente é utilizada apenas para o propósito de descrever exemplos de realizações específicos, e não se destina a limitar o escopo da presente invenção, que será limitada apenas pelas reivindicações anexas. A menos que definido de outra forma, todos os termos técnicos e científicos utilizados no presente têm o mesmo significado que é comumente compreendido por um técnico hábil no assunto.
[021] Preferencialmente, os termos aqui utilizados são definidos como descrito em “A multilingual glossary of biotechnological terms: (IUPAC Recommendations)”, Leuenberger H.G.W., Nagel B. e Kölbl H., Eds., Helvetica Chimica Acta, CH-4010 Basileia, Suíça (1995).
[022] Ao longo do relatório descritivo e reivindicações a seguir, e a menos que o contexto dite o contrário, a palavra “compreender” e variações gramaticais como “compreendendo” e “compreendido”, será entendida por implicar a inclusão de um inteiro ou etapa ou grupo de inteiros ou etapas declarados, mas não a exclusão de qualquer outro inteiro ou etapa ou grupo de inteiros ou etapas. Nas passagens seguintes, diferentes aspectos da invenção são definidos em mais detalhes. Cada aspecto assim definido pode ser combinado com qualquer outro aspecto ou aspectos, a menos que seja declaradamente indicado de outra forma. Em particular, qualquer característica indicada como opcional, preferida ou vantajosa, pode ser combinada com qualquer outra característica ou características indicadas como opcionais, preferidas ou vantajosas.
[023] Vários documentos são citados ao longo do presente relatório descritivo. Cada um dos documentos aqui citado (incluindo todas as patentes, pedidos de patentes, publicações científicas, especificações de fabricantes, instruções etc.), seja supra ou infra citado, é integralmente incorporado ao presente pela referência. Nada na presente descrição deve ser interpretado como uma admissão de que a invenção não tem direito a antedatar tal divulgação em virtude de invenção anterior. Alguns dos documentos citados no presente são caracterizados como sendo “incorporados pela referência”. No caso de um conflito entre as definições ou ensinamentos de tais referências incorporadas e definições ou ensinamentos citados no presente relatório descritivo, o texto do presente relatório descritivo prevalecerá.
[024] A seguir, serão descritos os elementos da presente invenção. Estes elementos estão listados com exemplos de realização específicos, no entanto, deve ser compreendido que eles podem ser combinados de qualquer maneira e em qualquer número para criar exemplos de realização adicionais. Os diversos exemplos descritos e os exemplos de realização preferidos não devem ser interpretados como realizações que limitam a presente invenção apenas às formas explicitamente descritas. Esta descrição deve ser entendida para suportar e abranger exemplos de realização que combinam os exemplos de realização explicitamente descritos com qualquer número de elementos divulgados e/ou preferidos. Além disso, quaisquer permutações e combinações de todos os elementos descritos neste pedido devem ser consideradas divulgadas pela descrição do presente pedido, a menos que o contexto indique de outra forma.
DEFINIÇÕES
[025] A seguir, são fornecidas algumas definições de termos frequentemente usados neste relatório descritivo. Esses termos terão, em cada caso de seu uso, no restante do relatório descritivo, o significado e os significados preferidos definidos respectivamente.
[026] Tal como utilizado no relatório descritivo e nas reivindicações anexas, as formas singulares “um, uma” e “o, a” abrangem os referentes no plural, a menos que o contexto expresse claramente de outra maneira.
[027] O termo “cerca de” quando usado em conexão com um valor numérico deve abranger valores numéricos dentro de um intervalo com um limite inferior que é 5% menor que o valor numérico indicado e um limite superior que é 5% maior do que o valor numérico indicado.
[028] No contexto da presente especificação, o termo “complexo principal de histocompatibilidade” (MHC) é usado em seu significado conhecido no estado da técnica de biologia celular e imunologia; e refere-se a uma molécula da superfície celular que exibe uma fração específica (peptídeo), também chamada de epítopo, de uma proteína. Existem duas classes principais de moléculas de MHC: classe I e classe II. Dentro da classe I do MHC, dois grupos podem ser distinguidos com base em seu polimorfismo: a) o clássico (MHC-Ia) com os genes HLA-A, HLA-B e HLA-C polimórficos correspondentes, e b) não clássico (MHC -Ib) com os genes HLA-E, HLA-F, HLA-G e HLA-H menos polimórficos correspondentes.
[029] As moléculas de cadeia pesada do MHC classe I ocorrem como uma cadeia alfa ligada a uma unidade da molécula não MHC β2- microglobulina. A cadeia alfa compreende, na direção do N-terminal para o C- terminal, um peptídeo sinal, três domínios extracelulares (α1-3, com α1 estando no N-terminal), uma região transmembranar e uma cauda citoplasmática C- terminal. O peptídeo a ser exibido ou apresentado é mantido pelo sulco de ligação ao peptídeo, na região central dos domínios α1/α2.
[030] O termo “domínio β2-microglobulina” refere-se a uma molécula não MHC que faz parte da molécula do heterodímero de MHC classe I. Em outras palavras, ele constitui a cadeia β do heterodímero MHC classe I.
[031] A principal função das moléculas de MHC Ia clássicas é apresentar peptídeos como parte da resposta imune adaptativa. As moléculas MHC-Ia são estruturas triméricas que compreendem uma cadeia pesada ligada à membrana com três domínios extracelulares (α1, α2 e α3) que se associam de forma não covalente à β2-microglobulina (β2m) e um pequeno peptídeo que é derivado de proteínas próprias (autoproteínas), de vírus ou bactérias. Os domínios α1 e α2 são altamente polimórficos e formam uma plataforma que dá origem ao sulco de ligação ao peptídeo. Justaposto ao domínio α3 conservado está um domínio transmembranar seguido por uma cauda citoplasmática intracelular.
[032] Para iniciar uma resposta imune, as moléculas de MHC-Ia clássicas apresentam peptídeos específicos a serem reconhecidos pelo TCR (receptor de células T) presentes em linfócitos T citotóxicos (CTLs) CD8 +, enquanto os receptores de células NK presentes em células natural killer (NK) reconhecem motivos peptídicos, em vez de peptídeos individuais. No entanto, em condições fisiológicas normais, as moléculas de MHC Ia existem como complexos heterotriméricos responsáveis por apresentar peptídeos às células CD8 e NK.
[033] O termo “antígeno leucocitário humano” (HLA) é usado em seu significado conhecido no estado da técnica da biologia celular e bioquímica; refere-se a loci de genes que codificam as proteínas MHC de classe I humanas. Os três principais genes do MHC-Ia clássico são HLA-A, HLA-B e HLA-C, e todos esses genes têm um número variável de alelos. Alelos intimamente relacionados são combinados em subgrupos de um determinado alelo. A sequência completa ou parcial de todos os genes HLA conhecidos e seus respectivos alelos estão disponíveis para os versados na técnica em bancos de dados especializados, como IMGT / HLA (http://www.ebi.ac.uk/ipd/imgt/hla/)
[034] Os humanos têm moléculas MHC de classe I compreendendo as moléculas clássicas (MHC-Ia) HLA-A, HLA-B e HLA-C, e as moléculas não clássicas (MHC-Ib) HLA-E, HLA-F, HLA-G e HLA -H. Ambas as categorias são semelhantes em seus mecanismos de ligação de peptídeo, apresentação e respostas de células T induzidas. A característica mais notável do MHC-Ia clássico é seu alto polimorfismo, enquanto os genes do MHC-Ib não clássico são geralmente não polimórficos e tendem a mostrar um padrão de expressão mais restrito do que seus homólogos MHC-Ia.
[035] A nomenclatura HLA é dada pelo nome particular do locus gênico (por exemplo, HLA-A) seguido pelo antígeno sorológico da família de alelos (por exemplo, HLA-A*02) e subtipos de alelos atribuídos em números e na ordem em que as sequências de DNA foram determinadas (por exemplo, HLA-A*02:01). Os alelos que diferem apenas por substituições de nucleotídeos sinônimos (também chamadas de substituições silenciosas ou não codificantes) dentro da sequência codificante são distinguidos pelo uso do terceiro conjunto de dígitos (por exemplo, HLA-A*02:01:01). Alelos que diferem apenas por polimorfismos de sequência nos íntrons, ou nas regiões não traduzidas a 5' ou 3' que flanqueiam os éxons e íntrons, são distinguidos pelo uso do quarto conjunto de dígitos (por exemplo, HLA-A*02:01:01:02L).
[036] A predição de afinidade de ligação do MHC classe I e classe II; exemplo de métodos conhecidos na técnica para a predição de epítopos de MHC classe I ou II para e para a predição de afinidade de ligação de MHC classe I e II são Moutaftsi et al., 2006; Lundegaard et al., 2008; Hoof et al., 2009; Andreatta & Nielsen, 2016; Jurtz et al., 2017. Preferencialmente, é utilizado o método descrito em Andreatta & Nielsen, 2016 e, caso este método não cubra um dos alelos MHC do paciente, utiliza-se o método alternativo descrito por Jurtz et al., 2017.
[037] Genes e epítopos relacionados a reações autoimunes humanas e os alelos MHC associados podem ser identificados no banco de dados IEDB (https://www.iedb.org) pela aplicação dos seguintes critérios de consulta: “Epítopos lineares” (linear epitopes) para a categoria Epítopo, “Humanos” (humans) para categoria Hospedeiro e “Doença autoimune” (autoimmune disease) para a categoria Doença.
[038] O termo “elemento intensificador de células T” refere-se a um polipeptídeo ou sequência polipeptídica que quando fundida a uma sequência antigênica aumenta a indução de células T contra os neoantígenos no contexto de uma vacina genética. Exemplos de sequências intensificadoras de células T são sequências de cadeia invariante ou um fragmento da mesma; uma sequência líder do ativador de plasminogênio do tipo tecidual, incluindo opcionalmente seis resíduos de aminoácidos a jusante adicionais; uma sequência PEST; uma caixa de destruição de ciclina; um sinal de ubiquitinação; um sinal SUMOilação. Exemplos específicos de elementos intensificadores de células T são aqueles de SEQ ID NOs: 173 a 182.
[039] O termo “sequência codificante” refere-se a uma sequência de nucleotídeos que é transcrita e traduzida em uma proteína. Os genes que codificam proteínas são um exemplo particular de sequências codificantes.
[040] O termo “frequência de alelo” refere-se à frequência relativa de um alelo específico em um locus específico dentro de uma infinidade de elementos, como uma população ou uma população de células. A frequência do alelo é expressa como uma porcentagem ou proporção. Por exemplo, a frequência de alelo de uma mutação em uma sequência codificante seria determinada pela proporção de leituras mutadas versus não mutadas na posição da mutação. Uma frequência de alelo de mutação em que no local da mutação 2 leituras determinaram o alelo mutado e 18 leituras mostraram que o alelo não mutado definiria uma frequência de alelo de mutação de 10%. A frequência de alelo de mutação para neoantígenos gerados a partir de peptídeos provenientes de mudanças na fase de leitura (aqui definidos como peptídeos de frameshift ou FSP), ou seja, todos os aminoácidos mutados dentro do FSP teriam a mesma frequência de alelo de mutação, que é aquela do frameshift que causa inserção/deleção da mutação.
[041] O termo “neoantígeno” refere-se a antígenos específicos do câncer que não estão presentes em células normais não cancerosas.
[042] O termo “vacina contra o câncer” refere-se, no contexto da presente invenção, a uma vacina que é projetada para induzir uma resposta imune contra células cancerosas.
[043] O termo “vacina personalizada” refere-se a uma vacina que compreende sequências antigênicas que são específicas para um determinado indivíduo. Essa vacina personalizada é de particular interesse para uma vacina contra o câncer usando neoantígenos, uma vez que muitos neoantígenos são específicos para as células cancerosas particulares de um indivíduo.
[044] O termo “mutação” em uma sequência codificante refere- se, no contexto da presente invenção, a uma mudança na sequência de nucleotídeos de uma sequência codificante ao comparar a sequência de nucleotídeos de uma célula cancerosa com aquela de uma célula não cancerosa. As alterações na sequência de nucleotídeos que não resultam em uma alteração na sequência de aminoácidos do peptídeo codificado, isto é, uma mutação 'silenciosa', não é considerada como uma mutação no contexto da presente invenção. Os tipos de mutações que podem resultar na mudança da sequência de aminoácidos não se limitam as variantes de nucleotídeo único (SNV, do inglês Single Nucleotide Variant) não sinônimas, em que um único nucleotídeo de um tripleto codificante é alterado resultando em um aminoácido diferente na sequência traduzida. Outro exemplo de uma mutação que resulta em uma alteração na sequência de aminoácidos são as mutações de inserção/deleção (indel), em que um ou mais nucleotídeos são inseridos na sequência codificante ou excluídos dela. De particular relevância são as mutações indel que resultam na mudança do quadro de leitura que ocorre se um número de nucleotídeos são inseridos ou deletados que não são divisíveis por três. Tal mutação causa uma alteração importante na sequência de aminoácidos a jusante da mutação, que é referida como um peptídeo proveniente de mudança na fase de leitura (aqui definido como peptídeo de frameshift ou FSP).
[045] O termo “entropia de Shannon” refere-se à entropia associada ao número de conformações de uma molécula, por exemplo, uma proteína. Os métodos conhecidos no estado da técnica para calcular a entropia de Shannon são Strait & Dewey, 1996 e Shannon 1996. Para um polipeptídeo, a entropia de Shannon (SE) pode ser calculada como SE = (- ∑ pc(aai)*log(pc(aai)))/N em que pc (aai) é a frequência do aminoácido i no polipeptídeo e a soma é calculada ao longo de todos os 20 diferentes aminoácidos e N é o comprimento do polipeptídeo.
[046] O termo “cassete de expressão” é usado no contexto da presente invenção para se referir a uma molécula de ácido nucleico que compreende pelo menos uma sequência de ácido nucleico que deve ser expressa, por exemplo, um ácido nucleico que codifica uma seleção de neoantígenos da presente invenção ou uma parte do mesmo, operacionalmente ligado às sequências de controle da transcrição e tradução.
De preferência, um cassete de expressão inclui elementos de regulação cis para expressão eficiente de um determinado gene, como promotor, sítio de iniciação e/ou sítio de poliadenilação. Preferencialmente, um cassete de expressão contém todos os elementos adicionais necessários para a expressão do ácido nucleico na célula de um paciente. Assim, um cassete de expressão típico contém um promotor operacionalmente ligado à sequência de ácido nucleico a ser expressa e os sinais necessários para a poliadenilação eficiente do transcrito, sítios de ligação ao ribossomo e de terminação da tradução. Elementos adicionais do cassete podem incluir, por exemplo, facilitadores/acentuadores (enhancers). Um cassete de expressão preferencialmente também contém uma região de terminação da transcrição a jusante do gene estrutural para proporcionar uma terminação eficiente. A região de terminação pode ser obtida do mesmo gene que a sequência promotora ou pode ser obtida de um gene diferente.
[047] O valor “IC50” refere-se à metade da concentração inibitória máxima de uma substância e é, portanto, uma medida da eficácia de uma substância em inibir uma função biológica ou bioquímica específica. Os valores são tipicamente expressos como concentração molar. O IC50 de uma molécula pode ser experimentalmente determinado em ensaios antagônicos funcionais, construindo uma curva dose-resposta e examinando o efeito inibidor da molécula examinada em diferentes concentrações. Alternativamente, podem ser realizados ensaios de ligação de competição para determinar o valor de IC50. Tipicamente, fragmentos de neoantígenos da presente invenção exibem um valor de IC50 entre 1.500 nM - 1 pM, mais preferivelmente de 1.000 nM a 10 pM, e de modo mais preferido entre 500 nM e 100 pM.
[048] O termo “sequenciamento massivamente paralelo” refere- se a métodos de sequenciamento de ácidos nucleicos de alto rendimento. Os métodos de sequenciamento massivamente paralelos também são chamados de sequenciamento de próxima geração (NGS) ou sequenciamento de segunda geração. Muitos métodos diferentes de sequenciamento massivamente paralelo são conhecidos no estado da técnica e diferem na configuração e química utilizada. No entanto, todos esses métodos têm em comum o fato de realizarem um grande número de reações de sequenciamento em paralelo para aumentar a velocidade do sequenciamento.
[049] O termo “Transcrições por Quilobase Milhão” (TPM) refere- se a uma métrica centrada no gene usada no sequenciamento massivamente paralelo de amostras de RNA que normaliza para profundidade de sequenciamento e comprimento do gene. Ele é calculado dividindo as contagens de leitura pelo comprimento de cada gene em quilobases, resultando em leituras por quilobases (RPK). A divisão do número de todos os valores RPK em uma amostra por 1.000.000 resulta em um “fator de escala por milhão”. A divisão dos valores RPK pelo “fator de escala por milhão”, resulta em um TPM para cada gene.
[050] O nível de expressão geral do gene que possui a mutação é expresso como TPM. De preferência, os valores de expressão “mutação- específicos” (corrTPM) são então determinados a partir do número de leituras mutadas e não mutadas na posição da mutação.
[051] O valor de expressão corrigido (corrTPM) é calculado como corrTPM = TPM * (M + c) / (M + W + c). M é o número de leituras abrangendo a localização da mutação que gerou o neoantígeno e W é o número de leituras sem a mutação abrangendo a localização da mutação que gerou os neoantígenos. O valor c é uma constante maior do que 0, de preferência 0,1. O valor c é particularmente importante se M e/ou W for 0.
EXEMPLOS DE REALIZAÇÃO
[052] A seguir, diferentes aspectos da invenção são definidos em mais detalhes. Cada aspecto assim definido pode ser combinado com qualquer outro aspecto ou aspectos, a menos que seja declaradamente indicado de outra forma. Em particular, qualquer característica indicada como preferida ou vantajosa pode ser combinada com qualquer outra característica ou características indicadas como preferidas ou vantajosas.
[053] Em um primeiro aspecto, a presente invenção fornece um método para selecionar neoantígenos de câncer para uso em uma vacina personalizada que compreende as etapas de: (a) determinar neoantígenos em uma amostra de células de câncer obtida a partir de um indivíduo, em que cada neoantígeno - está compreendido em uma sequência codificante, - compreende pelo menos uma mutação na sequência codificante, resultando em uma alteração na sequência de aminoácidos codificada que não está presente em uma amostra de células não cancerosas do referido indivíduo, e - consiste em 9 a 40, de preferência 19 a 31, mais preferencialmente 23 a 25, mais preferencialmente 25 aminoácidos contíguos da sequência codificante na amostra de células de câncer,
(b) determinar para cada neoantígeno a frequência do alelo de mutação de cada uma das referidas mutações da etapa (a) dentro da sequência codificante,
(c) determinar o nível de expressão de cada sequência codificante compreendendo pelo menos uma das referidas mutações,
(i) na referida amostra de células cancerosas, ou
(ii) a partir de um banco de dados de expressão do mesmo tipo de câncer que a amostra de células cancerosas,
(d) predizer a afinidade de ligação ao MHC classe I dos neoantígenos, em que
(I) os alelos HLA de classe I são determinados a partir da amostra de células não cancerosas do referido indivíduo,
(II) para cada alelo HLA classe I determinado em (I), a afinidade de ligação ao MHC classe I de cada fragmento consistindo de 8 a 15,
de preferência 9 a 10, mais preferencialmente 9, aminoácidos contíguos do neoantígeno é prevista, em que cada fragmento compreende pelo menos uma alteração de aminoácido causada pela mutação da etapa (a), e
(III) o fragmento com a maior afinidade de ligação ao MHC classe I determina a afinidade de ligação ao MHC classe I do neoantígeno,
(e) classificar os neoantígenos de acordo com os valores determinados nas etapas (b) a (d) para cada neoantígeno a partir dos valores mais altos para os mais baixos, produzindo uma primeira, uma segunda e uma terceira lista de classificações,
(f) calcular a soma de classificação da referida primeira, segunda e terceira lista de classificação e ordenar os neoantígenos pelo aumento da soma classificação, produzindo uma lista ordenada de neoantígenos, (g) selecionar de 30- 240, de um modo preferido de 40-80, mais preferivelmente 60, neoantígenos a partir da lista de neoantígenos classificados obtida em (f) começando com a classificação mais baixa.
[054] Muitos neoantígenos de câncer não são “vistos” pelo sistema imunológico porque ou os epítopos potenciais não são processados/apresentados pelas células tumorais ou porque a tolerância imunológica leva à eliminação de células T reativas com a sequência mutada.
Portanto, é benéfico selecionar, entre todos os neoantígenos potenciais, aqueles com maior chance de serem imunogênicos. De modo ideal, um neoantígeno teria que estar presente em um grande número de células cancerosas, sendo expresso em quantidades suficientes e sendo apresentado de forma eficiente às células do sistema imunológico.
[055] Ao selecionar neoantígenos que compreendem mutações específicas do câncer que têm certa frequência de alelo de mutação, que são abundantemente expressos e previstos que tenham uma alta afinidade de ligação às moléculas MHC, a chance de uma resposta imune ser induzida é significativamente aumentada. Os presentes inventores descobriram surpreendentemente que esses parâmetros podem ser usados para selecionar, de forma mais eficiente, neoantígenos adequados que induzem uma resposta imunológica aumentada usando um método de priorização que leva em consideração os diferentes parâmetros. É importante ressaltar que o método da invenção também considera neoantígenos onde a frequência do alelo, o nível de expressão ou a afinidade de ligação ao MHC prevista não estão entre os mais elevados observados. Por exemplo, um neoantígeno com um alto nível de expressão e uma alta frequência de alelo de mutação, mas uma afinidade de ligação ao MHC prevista relativamente baixa, ainda pode ser incluído na lista de neoantígenos selecionados.
[056] O método da invenção, portanto, não usa critérios de corte comumente aplicados em processos de seleção, mas leva em consideração que os neoantígenos com uma adequação predita muito alta de acordo com um parâmetro não são simplesmente excluídos da lista devido à adequação subótima em outros parâmetros. Isto é de particular relevância para neoantígenos com parâmetros que carecem apenas ligeiramente de alguns critérios de corte.
[057] Qualquer mutação em uma sequência codificante (ou seja, uma sequência de ácido nucleico genômico sendo transcrita e traduzida) que está presente apenas em células cancerosas de um indivíduo e não em células saudáveis do mesmo indivíduo é potencialmente de interesse como neoantígeno imunogênico (ou seja, capaz de induzir uma resposta). A mutação na sequência codificante também deve resultar em alterações na sequência de aminoácidos traduzida, ou seja, uma mutação silenciosa presente apenas no nível de ácido nucleico e sem alterar a sequência de aminoácidos, portanto, não é adequada. É essencial que a mutação, independentemente do tipo exato de mutação (alteração de nucleotídeos de cadeia única, inserção ou deleções de nucleotídeos únicos ou múltiplos, etc.), resulta em uma sequência de aminoácido alterada da proteína traduzida. Cada aminoácido presente apenas na sequência de aminoácidos alterada, mas não na sequência de aminoácidos resultante do gene codificante como presente nas células não cancerosas, é considerado um aminoácido mutado no contexto deste relatório descritivo. Por exemplo, as mutações da sequência codificante, tais como inserções ou deleções de mutações que resultam em peptídeos de frameshift, resultariam em um peptídeo no qual cada um dos aminoácidos que é codificado por uma fase de leitura deslocada deve ser considerado como um aminoácido mutado.
[058] A mutação da sequência codificante pode, em princípio, ser identificada por qualquer método de sequenciamento de DNA da amostra obtida a partir de um indivíduo. Um método preferido para obter a sequência de DNA necessária para identificar a mutação na sequência codificante do indivíduo é um método de sequenciamento massivamente paralelo.
[059] A frequência do alelo da mutação (ou seja, a proporção de sequências não mutadas versus mutadas na posição da mutação) na sequência codificante também é um fator importante para neoantígenos sendo usados em uma vacina. Os neoantígenos com uma alta frequência de alelos estão presentes em um número substancial de células cancerosas, fazendo com que neoantígenos que compreendem essas mutações sejam um alvo promissor de uma vacina.
[060] De maneira semelhante, é importante quão abundantemente um neoantígeno é expresso nas células cancerosas. Quanto maior a expressão de um neoantígeno em células cancerosas, mais adequado é o neoantígeno e maior é a chance de uma resposta imune suficiente contra essas células. A presente invenção pode ser exercida com diferentes maneiras de avaliar os níveis de expressão de neoantígenos. A expressão dos neoantígenos pode ser avaliada diretamente na amostra de células cancerosas. A expressão pode ser medida por diferentes métodos que representam, de preferência, todo o transcriptoma, vários desses métodos são conhecidos pelos especialistas no assunto. De preferência, é usado um método que fornece um método rápido, confiável e de baixo custo para medir o transcriptoma. Um desses métodos preferidos é a sequenciamento massivamente paralelo.
[061] Alternativamente, se nenhuma medição direta estiver disponível, o que pode ocorrer, por exemplo, devido a razões técnicas ou econômicas, podem ser utilizados bancos de dados de expressão. O versado na técnica está ciente das bases de dados de expressão disponíveis contendo dados de expressão de genes de diferentes tipos de câncer. Um exemplo típico não limitante de tal banco de dados é o TCGA (https://portal.gdc.cancer.gov/).
A expressão de genes que compreendem a mutação identificada na etapa (a) do método no mesmo tipo de tumor que o indivíduo para o qual a vacina é projetada pode ser pesquisada nessas bases de dados e pode ser usada para determinar um valor de expressão.
[062] É importante ainda que os neoantígenos selecionados sejam eficientemente apresentados às células do sistema imunológico por moléculas de MHC nas células cancerosas. Existem diferentes métodos conhecidos na técnica para prever a afinidade de ligação de peptídeos às moléculas MHC de classe I (e classe II) (Moutaftsi et al., 2006; Lundegaard et al., 2008; Hoof et al., 2009; Andreatta & Nielsen, 2016; Jurtz et al., 2017). Uma vez que as moléculas MHC são altamente polimórficas, um grupo de proteínas com diferenças significativas entre os indivíduos é importante para determinar a afinidade de ligação ao MHC para o tipo de moléculas MHC presente nas células do indivíduo. As moléculas MHC são codificadas pelo grupo de genes HLA altamente polimórficos. O método, portanto, usa os resultados de sequenciamento de DNA utilizados na etapa (a) para identificar as mutações em sequências codificantes para identificar os alelos HLA presentes no indivíduo. Para cada molécula de MHC correspondente para os alelos HLA identificados no indivíduo, a afinidade de ligação ao MHC para os neoantígenos é determinada. Para isso, a sequência de aminoácidos do neoantígeno é determinada por tradução in silico da sequência codificante. A sequência de aminoácidos do neoantígeno resultante é então dividida em fragmentos consistindo de 8 a 15, preferencialmente 9 a 10, mais preferencialmente 9, aminoácidos contíguos, em que o fragmento deve conter pelo menos um dos aminoácidos mutados do neoantígeno. O tamanho do fragmento é restringido pelo tamanho dos peptídeos que a molécula de MHC pode apresentar. Para cada fragmento, a afinidade de ligação ao MHC é predita. A afinidade de ligação ao MHC é geralmente medida como metade da concentração inibitória máxima (IC50 em [nM]). Portanto, quanto menor o valor da IC50, maior é a afinidade de ligação do peptídeo à molécula MHC. O fragmento com a maior afinidade de ligação ao MHC determina a afinidade de ligação ao MHC do neoantígeno a partir do qual o fragmento é derivado.
[063] O método da presente invenção então utiliza os parâmetros determinados nas etapas (b) a (d), ou seja, frequência de alelo de mutação, nível de expressão e afinidade de ligação ao MHC classe I prevista do neoantígeno, para selecionar os neoantígenos mais adequados aplicando um método de priorização a esses parâmetros. Portanto, os parâmetros são ordenados em uma lista classificada. O neoantígeno com a maior frequência de alelo de mutação é atribuído à primeira classificação, ou seja, classificação 1, em uma primeira lista de classificações. O neoantígeno com a segunda maior frequência de mutação de alelo é atribuído a segunda posição na primeira lista classificações etc. até que todos os neoantígenos identificados sejam atribuídos a uma classificação na primeira lista de classificações.
[064] De mesma forma, o nível de expressão de cada sequência codificante é classificado do mais alto para o mais baixo, com o neoantígeno com o valor de expressão mais alto sendo atribuído a classificação 1, o neoantígeno com os segundos níveis mais altos é atribuído a classificação 2, etc. até sejam atribuídos uma classificação na segunda lista de classificações a todos os neoantígenos identificados.
[065] A afinidade de ligação ao MHC classe I dos neoantígenos é classificada da maior para a menor afinidade de ligação, com o neoantígeno com a maior afinidade de ligação ao MHC classe I sendo atribuído a classificação 1, o neoantígeno com a segunda maior afinidade de ligação sendo atribuído a classificação 2 etc. até que todos os neoantígenos sejam atribuídos a uma classificação na terceira lista de classificações.
[066] Se qualquer um dos neoantígenos tem uma frequência de alelo de mutação idêntica, nível de expressão e/ou afinidade de ligação ao MHC classe I como outros neoantígenos, ambos os antígenos são atribuídos à mesma classificação na lista de classificações relevante.
[067] O método então utiliza um método de priorização que leva em consideração todas as três classificações, calculando a soma das três listas de classificações. Por exemplo, um neoantígeno que possui classificação 3 na primeira lista de classificações, classificação 13 na segunda lista de classificações e classificação 2 na terceira lista classificações tem uma soma de classificação de 18 (3 + 13 + 2). Depois que a soma da classificação foi calculada para cada neoantígeno, as somas das classificações são classificadas de acordo com sua soma das classificações com a soma da classificação mais baixa sendo atribuída a classificação 1, etc., resultando em uma lista classificada de neoantígenos. Os neoantígenos com uma soma de classificação idêntica são atribuídos à mesma classificação na lista de classificação de neoantígenos.
[068] O número final de neoantígenos presentes na lista é dependente do número de mutações detectadas em cada paciente. O número de neoantígenos a serem usados em uma vacina é limitado pelo veículo ou veículos usados para administrar a vacina. Por exemplo, se um único vetor viral é usado como veículo de entrega, como pode ser o caso de uma vacina genética, o tamanho máximo da inserção desse vetor limitaria o número de neoantígenos que podem ser usados em cada vetor.
[069] Portanto, o método da presente invenção seleciona 25-250, 30-240, 30-150, 35-80, de preferência 55-65, mais preferencialmente 60 neoantígenos da lista de neoantígenos classificados começando com o neoantígeno que tem a classificação mais baixa (ou seja, o número da classificação mais baixa, classificação 1). No caso de os neoantígenos serem selecionados para estarem presentes em um conjunto (por exemplo, veículo único de uma vacina monovalente) 25-80, 30-70, 35-70, 40-70, 55-65, preferencialmente 60 neoantígenos são selecionados. Os neoantígenos não incluídos no primeiro conjunto podem, no entanto, ser codificados por vetores virais adicionais para uma vacinação multivalente com base na coadministração de até 4 vetores virais.
[070] Em um exemplo de realização preferido do primeiro aspecto da presente invenção, as etapas (a) e (d) (I) são realizadas utilizando sequenciamento de DNA massivamente paralelo das amostras.
[071] Em um exemplo de realização preferido do primeiro aspecto da presente invenção, as etapas (a) e (d) (I) são realizadas usando sequenciamento de DNA massivamente paralelo das amostras e o número de leituras na posição cromossômica da mutação identificada é: - de pelo menos 2, de preferência pelo menos 3, 4, 5 ou 6 na amostra de células cancerosas, - de 2 ou menos, ou seja, 2, 1 ou 0, de preferência 0, na amostra de células não cancerosas.
[072] Em um exemplo de realização alternativo preferido do primeiro aspecto da invenção, o número de leituras na posição cromossômica da mutação identificada é maior na amostra de células cancerosas do que na amostra de células não cancerosas, em que a diferença entre as amostras é estatisticamente significante. Uma diferença estatisticamente significante entre dois grupos pode ser determinada por uma série de testes estatísticos conhecidos pelo técnico hábil no assunto. Um exemplo de teste estatístico adequado é o teste exato de Fisher. Para o propósito da presente invenção, dois grupos são considerados diferentes entre si se o valor p for inferior a 0,05.
[073] Esses critérios são aplicados para selecionar neoantígenos em que a mutação identificada é detectada com uma alta confiabilidade técnica especifica.
[074] Em um exemplo de realização preferido do primeiro aspecto da presente invenção, o método compreende uma etapa (d') além ou alternativamente à etapa (d), em que a etapa (d') compreende: determinar os alelos HLA classe II na amostra de células não cancerosas do referido indivíduo, predizer a afinidade de ligação ao MHC classe II dos neoantígenos, em que - para cada alelo HLA classe II determinado, a afinidade de ligação ao MHC classe II de cada fragmento consistindo de 11 a 30, de preferência 15, aminoácidos contíguos do neoantígeno é prevista, em que cada fragmento compreende pelo menos um aminoácido mutado gerado pela mutação da etapa (a), e - o fragmento com a maior afinidade de ligação ao MHC classe II determina a afinidade de ligação ao MHC classe II do neoantígeno, em que a afinidade de ligação ao MHC de classe II é classificada da afinidade de ligação ao MHC classe II mais alta para a mais baixa, produzindo uma quarta lista de classificações que está incluída na soma das classificações da etapa (f).
[075] Neste exemplo de realização, um parâmetro de seleção alternativo ou adicional é adicionado. A afinidade de ligação ao MHC de classe II é prevista em fragmentos ligeiramente maiores devido aos peptídeos apresentados pelas moléculas de MHC classe II serem maiores em tamanho do que os dos peptídeos de MHC classe I. A afinidade de ligação ao MHC de classe II também é classificada da afinidade de ligação mais alta para a mais baixa, com o neoantígeno com a maior afinidade de ligação ao MHC classe II sendo atribuída classificação 1, etc. até que todos os neoantígenos sejam atribuídos a uma classificação na quarta lista de classificações.
[076] No caso da afinidade de ligação ao MHC classe II ser usada como um parâmetro de seleção adicional, a quarta lista é incluída adicionalmente no cálculo da soma da classificação. No caso da afinidade de ligação ao MHC classe II ser usada como alternativa à afinidade de ligação ao MHC classe I da etapa (d), a soma da classificação na etapa (f) é calculada apenas na primeira, segunda e quarta lista de classificações.
[077] Em um exemplo de realização preferido do primeiro aspecto da presente invenção, a pelo menos uma mutação da etapa (a) é uma variante de nucleotídeo único (SNV) ou uma mutação de inserção / deleção resultando em um peptídeo proveniente de mudança na fase de leitura (peptídeo de frameshift).
[078] Em um exemplo de realização preferido do primeiro aspecto da presente invenção, em que a mutação é uma SNV e o neoantígeno tem o tamanho total definido na etapa (a) e consiste no aminoácido causado pela mutação, flanqueado em cada lado por uma série de aminoácidos contíguos adjacentes, em que o número em cada lado não difere em mais de um, a menos que a sequência codificante não compreenda um número suficiente de aminoácidos em ambos os lados, em que o neoantígeno tem o tamanho total definido na etapa (a). De preferência, o aminoácido mutado resultante de uma SNV está localizado no 'meio' do neoantígeno (isto é, flanqueado por um número igual de aminoácidos). Isso fornece uma chance igual de a mutação estar presente no final ou no início de um epítopo. O neoantígeno é, portanto, selecionado com aproximadamente (isto é, diferindo em não mais de um) o mesmo número de aminoácidos flanqueadores resultante da sequência codificante em cada lado dos aminoácidos mutados.
[079] Em um exemplo de realização preferido do primeiro aspecto da presente invenção, em que a mutação resulta em um FSP e cada mudança de aminoácido único causada pela mutação resulta em um neoantígeno que tem o tamanho total definido na etapa (a) e consiste: (i) na referida alteração de aminoácido único causada pela mutação e 7 a 14, de preferência 8, aminoácidos contíguos adjacentes ao N- terminal, e (ii) em uma série de aminoácidos contíguos adjacentes ao fragmento da etapa (i) em ambos os lados, em que o número de aminoácidos em cada lado difere em não mais do que um, a menos que a sequência codificante não compreenda um número suficiente de aminoácidos em ambos os lados, em que a afinidade de ligação ao MHC classe I da etapa (d) e/ou a afinidade de ligação ao MHC classe II da etapa (d') é prevista para o fragmento da etapa (i).
[080] Cada aminoácido mutado do FSP define um neoantígeno distinto. Cada neoantígeno é constituído por um aminoácido mutado e diversos aminoácidos, sendo um aminoácido mais curto do que o tamanho do fragmento utilizado para determinar a afinidade de ligação ao MHC classe I (ou seja, 7 a 14), que estão N-terminalmente localizados em relação ao aminoácido mutado.
O neoantígeno consiste ainda em uma série de aminoácidos contíguos derivados da sequência codificante que formam com a sequência do fragmento de neoantígeno da etapa (i) uma sequência contígua na sequência codificante.
O número de aminoácidos em torno do fragmento do neoantígeno da etapa (i) em ambos os lados difere em apenas um, em que o tamanho total do neoantígeno é conforme definido na etapa (a). O fragmento de neoantígeno da etapa (i) é usado para determinar a afinidade de ligação ao MHC de classe I e/ou de classe II.
[081] Por exemplo, um aminoácido mutado na posição relativa 20 de uma sequência codificante traduzida definiria um fragmento de neoantígeno incluindo uma sequência de aminoácidos contígua de 8 aminoácidos contíguos (isto é, fragmento da etapa (i)) variando da posição 12 a 20. A sequência completa do neoantígeno de 25 aminoácidos de acordo com a etapa (ii) consistiria nos aminoácidos 4 a 28. O fragmento de neoantígeno variando da posição 12 a 20 consistindo em 9 aminoácidos seria usado para determinar a afinidade de ligação ao MHC.
[082] Em um exemplo de realização preferido do primeiro aspecto da presente invenção, a frequência do alelo de mutação do neoantígeno determinada na etapa (b) na amostra de células cancerosas é de pelo menos 2%, de preferência pelo menos 5%, mais preferencialmente pelo menos 10%.
[083] Em um exemplo de realização preferido do primeiro aspecto da presente invenção, a etapa (g) compreende ainda a remoção de neoantígenos de genes ligados à doença autoimune a partir da lista de neoantígenos classificados. O especialista no assunto está ciente dos neoantígenos associados a doenças autoimunes a partir de bancos de dados públicos. Um exemplo de banco de dados é o banco de dados IEDB (www.iedb.org). A exclusão de um neoantígeno candidato pode ser realizada tanto no nível do gene se o gene que abriga a mutação pertencer a um dos genes ligados à doença autoimune no banco de dados do IEDB ou, de maneira menos rigorosa, não apenas se o paciente tiver uma mutação em um gene conhecido por estar envolvido na autoimunidade, mas um dos alelos MHC do paciente também é idêntico ao alelo descrito no banco de dados IEDB para o epítopo de doença autoimune humana em conexão com o fenômeno autoimune descrito.
[084] Em um exemplo de realização preferido, os neoantígenos associados com uma doença autoimune não são removidos da lista ranqueada (de classificações) de neoantígenos se a base de dados especifica um determinado alelo MHC de classe I para essa associação e o alelo HLA correspondente não foi encontrado no indivíduo na etapa (d) (I).
[085] Em um exemplo de realização preferido do primeiro aspecto da presente invenção, a etapa (g) compreende ainda a remoção de neoantígenos com um valor de entropia de Shannon para a sua sequência de aminoácidos inferior a 0,1 a partir da referida lista ranqueada (de classificações) de neoantígenos.
[086] Em um exemplo de realização preferido do primeiro aspecto da presente invenção, o nível de expressão dos referidos genes codificadores na etapa (c) (i) é determinado por sequenciamento de transcriptoma massivamente paralelo.
[087] Em um exemplo de realização preferido do primeiro aspecto da presente invenção, o nível de expressão determinado na etapa (c) (i) usa um valor corrigido de transcritos por quilobase milhão (corrTPM) calculado de acordo com a seguinte fórmula; 𝑀+𝑐 𝑐𝑜𝑟𝑟𝑇𝑃𝑀 = 𝑇𝑃𝑀 × ( ) 𝑀+𝑊+𝑐 em que M é o número de leituras abrangendo a localização da mutação da etapa (a) que compreende a mutação; e W é o número de leituras abrangendo a localização da mutação da etapa (a) sem a mutação e TPM é os transcritos por milhão do gene que compreende a mutação e c é uma constante maior do que 0, de preferência c é 0,1.
[088] Em um exemplo de realização preferido do primeiro aspecto da presente invenção, a soma da classificação na etapa (f) é uma soma da classificação ponderada, em que o número de neoantígenos determinado na etapa (a) é adicionado ao valor da classificação de cada neoantígeno: na terceira lista de classificações para as quais a previsão de afinidade de ligação ao MHC classe I da etapa (d) resultou em um valor IC 50 superior a 1000 nM e/ou na quarta lista de classificações para as quais a previsão de afinidade de ligação ao MHC classe II da etapa (d’) resultou em um valor IC50 superior a 1000 nM.
[089] Esta ponderação da afinidade de ligação ao MHC penaliza uma afinidade de ligação ao MHC de classe I e/ou classe II muito baixa pela adição de classificações/categorizações.
[090] Em um exemplo de realização preferido do primeiro aspecto da presente invenção, a soma da classificação na etapa (f) é uma soma da classificação ponderada, em que no caso da etapa (c) (i) sendo realizada por sequenciamento de transcriptoma massivamente paralelo, a soma da classificação da etapa (f) é multiplicada por um fator de ponderação (WF), em que WF é 1, se o número de leituras do transcriptoma mapeado para a mutação for > 0, 2, se o número de leituras de transcriptoma mapeadas para a mutação for 0 e o número de leituras mapeadas para a sequência não mutada for 0; e o valor de transcrições por milhão (TPM) for pelo menos 0,5, 3, se o número de leituras de transcriptoma mapeadas para a mutação for 0 e o número de leituras mapeadas para a sequência não mutada for > 0; e o valor de transcrições por milhão (TPM) for pelo menos 0,5, 4, se o número de leituras de transcriptoma mapeadas para a mutação for 0 e o número de leituras mapeadas para a sequência não mutada for 0; e o valor de transcrições por milhão (TPM) for < 0,5, ou 5, se o número de leituras de transcriptoma mapeadas para a mutação for 0 e o número de leituras mapeadas para a sequência não mutada for > 0; e o valor de transcrições por milhão (TPM) for < 0,5.
[091] A matriz de ponderação penaliza certos neoantígenos para os quais os resultados do sequenciamento são de má qualidade (ou seja, o número de leituras mapeadas é baixo) e/ou se o valor da expressão (ou seja, o valor TPM) está abaixo de um determinado limite. Este modo de ponderação (ou seja, priorização) de certos parâmetros fornece neoantígenos com uma melhor imunogenicidade do que usar valores de corte para os parâmetros únicos, o que eliminaria certos neoantígenos devido a uma baixa adequação em um parâmetro, embora outro parâmetro qualifique o neoantígeno como adequado.
[092] Em um exemplo de realização preferencial do primeiro aspecto da presente invenção, a etapa (g) compreende um processo de seleção alternativo, em que os neoantígenos são selecionados a partir da lista classificada de neoantígenos começando com a classificação mais baixa até um tamanho máximo definido no comprimento total de aminoácidos para todos os neoantígenos selecionados é alcançado, em que o tamanho máximo está entre 1200 e 1800, de preferência 1500 aminoácidos para cada vetor. O processo pode ser repetido em uma abordagem de vacinação multivalente, em que o tamanho máximo indicado acima se aplica a cada veículo usado na abordagem multivalente. Por exemplo, uma abordagem multivalente baseada em 4 vetores poderia, por exemplo, permitir um limite total de 6000 aminoácidos. Este exemplo de realização leva em consideração o tamanho máximo para neoantígenos permitidos por um determinado veículo de entrega.
Portanto, o número de neoantígenos selecionados da lista classificada não é determinado pelo número de neoantígenos, mas leva em consideração o tamanho dos neoantígenos. Uma série de pequenos neoantígenos na lista classificada de antígenos permitiria incluir mais antígenos na lista de antígenos selecionados.
[093] Em um exemplo de realização preferido do primeiro aspecto da presente invenção, dois ou mais neoantígenos são fundidos em um novo neoantígeno se eles compreenderem segmentos de sequência de aminoácidos sobrepostos. Em alguns casos, os neoantígenos podem conter sequências de aminoácidos sobrepostas. Este é particularmente o caso de neoantígenos derivados de FSP. De modo a evitar sequências que se sobrepõem redundantes, os neoantígenos são fundidos em um único novo neoantígeno que consiste nas porções não redundantes dos neoantígenos fundidos. Um novo neoantígeno fundido pode ter um tamanho maior do que o definido na etapa (a) do primeiro aspecto da invenção, dependendo do número de neoantígenos fundidos e do grau de sobreposição.
[094] Em um exemplo de realização preferido do primeiro aspecto da presente invenção, a vacina personalizada é uma vacina genética personalizada. O termo “vacina genética” é usado como sinônimo de “vacina de DNA” e refere-se ao uso de informação genética como uma vacina e as células do indivíduo vacinado produzem o antígeno contra o qual a vacinação é dirigida.
[095] Em um exemplo de realização preferido do primeiro aspecto da presente invenção, a vacina personalizada é uma vacina contra o câncer personalizada.
[096] Em um segundo aspecto, a presente invenção proporciona um método para a construção de um vetor personalizado que codifica uma combinação de neoantígenos de acordo com o primeiro aspecto da invenção para uso como uma vacina, compreendendo as etapas de: (i) ordenar a lista de neoantígenos em pelo menos 10 5 -108, de preferência 106 combinações diferentes, (ii) gerar todos os pares possíveis de segmentos de junção de neoantígeno para cada combinação, em que cada segmento de junção compreende 15 aminoácidos contíguos adjacentes em cada lado da junção, (iii) predizer a afinidade de ligação de MHC classe I e/ou classe II para todos os epítopos em segmentos de junção, em que são testados apenas os alelos HLA que estão presentes no indivíduo para o qual o vetor é projetado, e (iv) selecionar a combinação de neoantígenos com o menor número de epítopos juncionais com um IC50 ≤ 1500nM e em que se várias combinações tiverem o mesmo número de epítopos juncionais mais baixo, a primeira combinação encontrada é selecionada.
[097] A lista de neoantígenos selecionados de acordo com o primeiro aspecto da invenção pode ser disposta em um único neoantígeno combinado. As junções onde os neoantígenos individuais são unidos podem resultar em novos epítopos que podem levar a efeitos indesejados fora do alvo não relacionados aos epítopos presentes em células cancerosas. Portanto, é vantajoso que os epítopos criados pela junção de neoantígenos individuais tenham uma baixa imunogenicidade. Para essas extremidades, os neoantígenos são organizados em ordens diferentes, resultando em epítopos de junção diferentes e a afinidade de ligação ao MHC classe I e classe II desses epítopos de junção é prevista. A combinação com o menor número de epítopos juncionais com um valor IC50 ≤ 1500nM é selecionada. O número de diferentes combinações de neoantígenos selecionados é limitado principalmente pelo poder computacional disponível. Um compromisso entre os recursos computacionais usados e a precisão necessária é se 10 5 – 108, de preferência 106 combinações diferentes de neoantígenos são usadas, em que a afinidade de ligação ao MHC classe I e/ou classe II dos epítopos juncionais de cada junção neoantígeno é prevista.
[098] Em um aspecto alternativo, a presente invenção proporciona um método para a construção de um vetor personalizado que codifica uma combinação de neoantígenos para uso como uma vacina, compreendendo as etapas de: (i) ordenar uma lista de neoantígenos em pelo menos 10 5 -
108, de preferência 106 combinações diferentes, (ii) gerar todos os pares possíveis de segmentos de junção de neoantígeno para cada combinação, em que cada segmento de junção compreende 15 aminoácidos contíguos adjacentes em cada lado da junção, (iii) predizer a afinidade de ligação de MHC classe I e/ou classe II para todos os epítopos em segmentos de junção, em que são testados apenas os alelos HLA que estão presentes no indivíduo para o qual o vetor é projetado, e (iv) selecionar a combinação de neoantígenos com o menor número de epítopos juncionais com um IC50 ≤ 1500nM e em que se várias combinações tiverem o mesmo número de epítopos juncionais mais baixo, a primeira combinação encontrada é selecionada.
[099] A lista de neoantígenos pode ser organizada em um único neoantígeno combinado. As junções onde os neoantígenos individuais são unidos podem resultar em novos epítopos que podem levar a efeitos indesejados fora do alvo não relacionados aos epítopos presentes em células cancerosas. Portanto, é vantajoso que os epítopos criados pela junção de neoantígenos individuais tenham uma baixa imunogenicidade. Para essas extremidades, os neoantígenos são organizados em ordens diferentes, resultando em epítopos de junção diferentes e a afinidade de ligação ao MHC classe I e classe II desses epítopos de junção é prevista. A combinação com o menor número de epítopos juncionais com um valor IC 50 ≤ 1500nM é selecionada. O número de diferentes combinações de neoantígenos selecionados é limitado principalmente pelo poder computacional disponível.
Um compromisso entre os recursos computacionais usados e a precisão necessária é se 105 – 108, de preferência 106, combinações diferentes de neoantígenos são usadas, em que a afinidade de ligação ao MHC classe I e/ou classe II dos epítopos juncionais de cada junção neoantígeno é prevista.
[100] Em um terceiro aspecto, a presente invenção provê um vetor que codifica a lista de neoantígenos de acordo com o primeiro aspecto da invenção ou a combinação de neoantígenos de acordo com o segundo aspecto da invenção.
[101] Prefere-se que o vetor compreenda um ou mais elementos que melhoram a imunogenicidade do vetor de expressão. Preferencialmente, tais elementos são expressos como uma fusão ao polipeptídeo do neoantígeno ou da combinação de neoantígenos ou são codificados por outro ácido nucleico compreendido no vetor, preferencialmente em um cassete de expressão.
[102] Em um exemplo de realização preferencial do terceiro aspecto da invenção, o vetor compreende adicionalmente um elemento intensificador de células T, de preferência (SEQ ID NO: 173 a 182), mais preferencialmente de SEQ ID NO: 175, que é fundido ao N-terminal do primeiro neoantígeno da lista.
[103] O vetor do terceiro aspecto ou a coleção de vetores do quarto aspecto, em que o vetor em cada caso é selecionado independentemente a partir do grupo que consiste em um plasmídeo; um cosmídeo; uma partícula lipossômica, um vetor viral ou uma partícula semelhante a vírus; preferencialmente, um vetor de alfavírus, um vetor de vírus da encefalite equina venezuelana (VEE), um vetor de vírus sindbis (SIN), um vetor de vírus da floresta semliki (SFV), um vetor de citomegalovírus símio ou humano (CMV), um vetor de citomegalovírus símio ou humano (CMV), um vetor de vírus de coriomeningite por linfócitos (LCMV), um vetor retroviral, um vetor lentiviral, um vetor adenoviral, um vetor de vírus adenoassociado, um vetor de poxvírus, um vetor de vírus vaccinia ou um vetor de vaccinia ankara modificado (MVA). Em geral, é preferível que uma coleção de vetores, em que cada membro da coleção compreende um polinucleotídeo que codifica um antígeno diferente ou fragmentos do mesmo e que, portanto, é tipicamente administrado simultaneamente, utiliza o mesmo tipo de vetor, por exemplo, um vetor derivado de adenovírus.
[104] Os vetores de expressão mais preferidos são vetores adenovirais, em particular vetores adenovirais derivados de grandes símios humanos ou não humanos. Os grandes símios preferidos dos quais os adenovírus são derivados são os de chimpanzé (Pan), gorila (gorila) e orangotangos (Pongo), de preferência Bonobo (Pan paniscus) e o chimpanzé comum (Pan troglodytes). Normalmente, os adenovírus não humanos de grandes primatas não humanos são isolados a partir de amostras de fezes do respectivo macaco. Os vetores mais preferidos são vetores adenovirais não replicantes baseados nos vetores hAd5, hAd11, hAd26, hAd35, hAd49, ChAd3, ChAd4, ChAd5, ChAd6, ChAd7, ChAd8, ChAd9, ChAd10, ChAd11, ChAd16, ChAd17, ChAd19, ChAd20, ChAd22, ChAd24, ChAd26, ChAd30, ChAd31, ChAd37, ChAd38, ChAd44, ChAd55, ChAd63, ChAd73, ChAd82, ChAd83, ChAd146, ChAd147, PanAd1, PanAd2 e PanAd3 ou vetores Ad4 e Ad7 competentes para replicação. Os adenovírus humanos hAd4, hAd5, hAd7, hAd11, hAd26, hAd35 e hAd49 são bem conhecidos no estado da técnica. Os vetores baseados no ChAd3, ChAd4, ChAd5, ChAd6, ChAd7, ChAd8, ChAd9, ChAd10, ChAd11, ChAd16, ChAd17, ChAd19, ChAd20, ChAd22, ChAd24, ChAd26, ChAd30, ChAd31, ChAd37, ChAd38, ChAd44, ChAd63 e ChAd82 de ocorrência natural estão descritos em detalhes no documento WO 2005/071093. Os vetores baseados nos vetores PanAd1, PanAd2, PanAd3, ChAd55, ChAd73, ChAd83, ChAd83, ChAd146 e ChAd147 de ocorrência natural estão descritos em detalhes no documento WO 2010/086189.
[105] Em um exemplo de realização do terceiro aspecto da presente invenção, o vetor compreende dois cassetes de expressão independentes em que cada cassete de expressão codifica uma porção da lista de neoantígenos de acordo com o primeiro aspecto da invenção, ou a combinação de neoantígenos de acordo com o segundo aspecto da invenção.
De preferência, a porção da lista codificada pelos cassetes de expressão tem aproximadamente o mesmo tamanho em número de aminoácidos.
[106] Em um exemplo de realização preferido do terceiro aspecto da presente invenção, o vetor compreende um cassete de expressão que codifica os neoantígenos selecionados a partir da lista classificada de neoantígenos de acordo com o primeiro aspecto da invenção, em que a lista de neoantígenos selecionados é dividida em duas partes de comprimentos aproximadamente iguais, em que as duas partes são separadas por um elemento sítio interno de entrada do ribossomo (IRES) ou uma região 2A viral (Luke et al., 2008), por exemplo, a região 2A do aftovírus da febre aftosa (SEQ ID NO: 184 APVKQTLNFDLLKLAGDVESNPGP) que medeia o processamento de poliproteínas por um efeito de tradução conhecido como salto ribossomal (Donnelly et al., J. Gen. Virology 2001). Opcionalmente, em cada uma das duas partes, um elemento intensificador de células T, de preferência de SEQ ID NO: 173 a 182, mais preferencialmente SEQ ID NO: 175, é fundido ao N-terminal do primeiro neoantígeno na lista.
[107] Em um quarto aspecto, a presente invenção fornece uma coleção de vetores que codificam cada parte da lista de neoantígenos de acordo com o primeiro aspecto da invenção ou a combinação de neoantígenos de acordo com o segundo aspecto da invenção, em que a coleção compreende 2 a 4, preferencialmente 2, vetores e preferencialmente em que as inserções de vetor que codificam a porção da lista são de tamanho aproximadamente igual em número de aminoácidos.
[108] Em um quinto aspecto, a presente invenção provê um vetor de acordo com o terceiro aspecto da invenção ou uma coleção de vetores de acordo com o quarto aspecto da invenção para uso na vacinação contra o câncer.
[109] O vetor do terceiro aspecto da invenção ou a coleção de vetores de acordo com o quarto aspecto da invenção para uso na vacinação contra o câncer, em que o câncer é selecionado a partir do grupo que consiste em neoplasias malignas de lábio, cavidade oral, faringe, um aparelho digestivo, órgão respiratório, órgão intratorácico, osso, cartilagem articular, pele, tecido mesotelial, tecido mole, mama, órgãos genitais femininos, órgãos genitais masculinos, trato urinário, cérebro e outras partes do sistema nervoso central, glândula tireoide, glândulas endócrinas, tecido linfoide e tecido hematopoiético.
[110] Em um exemplo de realização preferido do quinto aspecto da invenção, o regime de vacinação é um regime de vacinação por “dose inical-reforço” (prime-boost) heterólogo com dois vetores virais diferentes. As combinações preferidas são o vetor adenoviral derivado de grandes símios para a imunização inicial e um vetor de poxvírus, vetor de vírus vaccinia ou vetor de vaccinia ankara modificado (MVA) para a imunização de reforço. De preferência, estes são administrados sequencialmente com um intervalo de pelo menos 1 semana, preferencialmente de 6 semanas.
EXEMPLOS
[111] A presente invenção descreve um método para classificar mutações tumorais quanto à sua probabilidade de dar origem a neoantígenos imunogênicos. Esta abordagem analisa os dados de sequenciamento de DNA de próxima geração (NGS-DNA) e, opcionalmente, os dados de sequenciamento de RNA de próxima geração (NGS-RNA) de uma amostra de tumor e os dados de NGS-DNA de uma amostra normal obtida do mesmo paciente, conforme descrito abaixo.
[112] A abordagem personalizada baseia-se em dados NGS obtidos pela análise de amostras coletadas de um paciente com câncer. Para cada paciente, os dados de exoma NGS-DNA a partir do DNA tumoral são comparados aos obtidos a partir do DNA normal para identificar mutações somáticas presentes com segurança no tumor e não na amostra normal que geram alterações na sequência de aminoácidos de uma proteína.
[113] O DNA normal do exoma é posteriormente analisado para determinar os alelos HLA classe I e classe II do paciente. Os dados do NGS- RNA da amostra tumoral, se disponíveis, são analisados para determinar a expressão dos genes que abrigam as mutações.
[114] Os exemplos abaixo referem-se ao seguinte aspecto da invenção.
[115] Exemplo 1: Descrição do método de priorização.
[116] Exemplo 2: Aplicação do método de priorização de um conjunto de dados NGS existente na literatura.
[117] Exemplo 3: Validação do método de priorização.
[118] A validação do método de priorização foi realizada medindo seu desempenho em relação a um conjunto de dados (estudos publicados) em que tanto os dados NGS quanto os neoantígenos imunogênicos são descritos.
No exemplo, o método de priorização a e b são usados. Este exemplo mostra que, ao selecionar os 60 principais neoantígenos, uma porção muito elevada de neoantígenos imunogênicos conhecidos é incluída na vacina, tanto usando o método a (com NGS-RNA de pacientes) ou método b (sem NGS-RNA de pacientes).
[119] Exemplo 4: Otimização da disposição de neoantígeno para genes sintéticos que codificam neoantígenos a serem administrados por um vetor de vacina genética.
[120] A demonstração de que a divisão de 62 neoantígenos selecionados obtidos a partir de um modelo de camundongo em dois genes sintéticos (total 31 + 31 = 62 neoantígenos) resulta em imunogenicidade melhorada em comparação com o uso de um gene sintético que codifica 62 neoantígenos.
EXEMPLO 1
DESCRIÇÃO DO MÉTODO DE PRIORIZAÇÃO ETAPA 1: IDENTIFICAÇÃO DE MUTAÇÕES QUE PODEM GERAR UM NEOANTÍGENO
[121] As mutações definidas como confiança presentes no tumor idealmente, mas não exclusivamente, satisfazem os seguintes critérios: frequência do alelo de mutação (MF) na amostra de DNA do tumor ≥ 10%, proporção da MF entre a amostra de DNA de tumor e amostra de DNA de controle ≥ 5, número de leituras mutadas na posição cromossômica da variante somática no DNA do tumor > 2, número de leituras mutadas na posição cromossômica da variante somática no DNA normal < 2,
[122] Dois tipos de mutações somáticas são considerados dentro do método da presente invenção: variantes de nucleotídeo único (SNVs) gerando uma mudança de códon não sinônimo com um aminoácido mutado resultante em uma proteína e inserções/deleções (indels) que geram peptídeos de frameshift (FSPs) alterando a fase de leitura de um mRNA que codifica uma proteína.
ETAPA 2: GERAR A ESTRUTURA DE CADA NEOANTÍGENO ETAPA 2.1
[123] Para cada mutação, uma sequência de peptídeo neoantígeno é gerada da seguinte maneira: a) SNVs
[124] Uma sequência de 25 aminoácidos de comprimento é gerada com o amino mutado localizado no centro e preferencialmente flanqueado, em ambos os lados, por A = 12 aminoácidos não mutados (Figura 1). Nos casos em que a mutação está localizada perto da extremidade N-
terminal ou C-terminal da proteína, menos do que A = 12 aminoácidos não mutados serão incluídos. Um número mínimo de 8 aminoácidos não mutados é adicionado a montante ou a jusante da mutação. Isso garante que o neoantígeno possa conter um neoepítopo 9mer com pelo menos 1 aminoácido mutado. Adicionar, por exemplo, 4 aminoácidos não mutados a montante e 2 a jusante não é possível, isto corresponderia a uma proteína muito curta.
[125] Ocasionalmente, duas (ou até mais) mutações, SNVs e/ou indels, estão presentes a uma pequena distância (distância menor ou igual aos aminoácidos A) na proteína. Nestes casos, o segmento dos aminoácidos A não mutados que é adicionado no N-terminal ou C-terminal será modificado de modo que a mutação(ões) adicional(ais) esteja(ão) presente(s). (Figura 1).
(Figura 1).
[126] Para cada neoantígeno, uma predição de epítopo MHC classe I de 9mer é então realizada com os alelos HLA do paciente identificados a partir dos dados de exoma NGS-DNA. O valor de IC50 associado ao neoantígeno é então escolhido como aquele com o valor de IC50 mais baixo em todos os epítopos previstos que compreendem pelo menos 1 aminoácido mutado e em todos os alelos classe I do paciente.
b) Peptídeos de frameshift (FSPs):
[127] Para FSPs máximos N = 12 aminoácidos não mutados são adicionados ao N-terminal do FSP (Figura 2A); se menos de 12 aminoácidos não mutados estiverem presentes a montante do FSP, apenas estes serão adicionados. No caso de uma SNV que leva a um aminoácido mutado estar presente dentro do segmento não mutado adicionado, o aminoácido mutado é incluído. Isso gera uma sequência de peptídeo FSP expandida.
[128] A sequência de peptídeo FSP expandida resultante é então dividida em fragmentos de 9 aminoácidos de comprimento e, então, é realizada a predição do epítopo de 9mer de MHC classe I (com os alelos HLA do paciente) em todos os fragmentos contendo pelo menos 1 aminoácido mutado.
O valor IC50 associado a cada fragmento é então escolhido como o menor valor IC50 previsto em todos os alelos examinados.
[129] Cada fragmento de 9 aminoácidos é então expandido em uma sequência de neoantígeno de 25 aminoácidos adicionando os 8 aminoácidos a montante e 8 a jusante à extremidade N-terminal e C-terminal do fragmento, respectivamente (Figura 2B). Para fragmentos de 9 aminoácidos próximos da extremidade N- ou C-terminal do FSP expandido, menos aminoácidos são adicionados.
[130] As sequências de neoantígenos resultantes com seus IC 50 associados são então adicionadas à lista de sequências de neoantígenos obtidas a partir das SNVs.
ETAPA 2.2 (OPCIONAL)
[131] Um filtro de segurança opcional é então executado na lista de classificação de neoantígenos RSUM, a fim de remover os neoantígenos que representam um risco potencial de induzir autoimunidade. O filtro examina se o gene que codifica o neoantígeno faz parte de uma ‘lista negra’ de genes (por exemplo, recuperados do banco de dados IEDB) contendo epítopos MHC de classe I e classe II conhecidos ligados a doenças autoimunes. Se disponível, a lista também contém o alelo HLA do epítopo.
[132] Os neoantígenos são removidos se sua mutação de origem for um dos genes da lista negra e, ao mesmo tempo, um dos alelos HLA do paciente corresponder ao HLA ligado ao gene da doença autoimune.
[133] Para genes na lista negra onde nenhuma informação sobre o alelo HLA do epítopo está disponível, o neoantígeno é removido independentemente dos alelos HLA do paciente. ETAPA 2.3 (OPCIONAL)
[134] A lista de neoantígenos candidatos é então filtrada para remover neoantígenos que codificam peptídeos com uma sequência de aminoácidos de baixa complexidade (presença de segmentos na sequência onde um ou mais aminoácidos são repetidos várias vezes).
[135] Uma vez convertidos em sequências de nucleotídeos, esses segmentos provavelmente representam regiões com alto teor de nucleotídeos G ou C. Estas regiões podem, portanto, gerar problemas durante a construção/síntese inicial do cassete de expressão da vacina e/ou também podem afetar negativamente a expressão dos polipeptídeos codificados.
[136] A identificação de sequências de aminoácidos de baixa complexidade é realizada estimando-se a entropia de Shannon da sequência do neoantígeno dividida por seu comprimento em aminoácidos. A entropia de Shannon é uma métrica comumente usada na teoria da informação e mede o número mínimo médio de bits necessários para codificar uma sequência de símbolos com base no tamanho do alfabeto e na frequência dos símbolos.
[137] No presente método, a métrica foi aplicada à cadeia de aminoácidos presentes na sequência do neoantígeno. Os neoantígenos que têm um valor de entropia de Shannon inferior a 0,10 são removidos da lista.
ETAPA 3
DESCRIÇÃO DO PROCESSO DE PRIORIZAÇÃO DE NEOANTÍGENOS DE UM PACIENTE
[138] Os dados necessários para realizar a priorização são - Lista de M neoantígenos (a partir de SNVs não sinônimos ou indels de frameshift) da Etapa 2 - Dados da frequência de alelos mutantes para cada neoantígeno da Etapa 1 - Dados de expressão para cada neoantígeno: a partir de dados de sequenciamento de RNA (Etapa 1) ou, como um método alternativo (B) (se nenhum dado de NGS-RNA estiver disponível a partir da amostra tumoral), a partir de um banco de dados de expressão em nível de gene geral do mesmo tipo de tumor - Afinidade de ligação ao MHC classe I prevista para o melhor epítopo 9mer mutado para cada neoantígeno (da etapa 3).
[139] A estratégia de priorização é baseada em uma pontuação geral obtida pela combinação de três valores de pontuação de classificação independentes separados (RFREQ, REXPR, RIC50). Os três valores de pontuação de classificação são obtidos ordenando a lista de neoantígenos M de forma independente de acordo com um dos seguintes parâmetros (o resultado será, portanto, três listas ordenadas diferentes de neoantígenos, cada lista fornecendo, assim, uma pontuação (escore) de classificação).
ETAPA 3.1: PONTUAÇÃO DE CLASSIFICAÇÃO DE FREQUÊNCIA DE ALELO (RFREQ)
[140] Cada neoantígeno está associado à frequência do alelo tumoral observada da mutação que gera o neoantígeno. A lista de neoantígenos M é ordenada a partir da frequência de alelo mais alta para a frequência de alelo mais baixa. O neoantígeno com a maior frequência de alelo tem uma pontuação de classificação RFREQ igual a 1, já o segundo maior, uma pontuação de classificação RFREQ = 2 e assim por diante. Se os neoantígenos com frequência de alelo idêntica estão presentes, eles recebem a mesma pontuação de classificação RFREQ, ou seja, a pontuação de classificação mais baixa pode ser inferior a M (Tabela 1) TABELA 1
NEOANTÍGENOS COM FREQUÊNCIA DE ALELO MUTANTE IGUAL OBTÊM A MESMA
PONTUAÇÃO DE CLASSIFICAÇÃO RFREQ Frequência de alelo mutante RFREQ SNV101 0,48 1 SNV16 0,43 2 SNV34 0,35 3 SNV87 0,33 4 SNV23 0,32 5 FSP4_5 0,3 6 SNV120 0,28 7
Frequência de alelo mutante RFREQ SNV11 0,26 8 SNV67 0,21 9 SNV18 0,21 9 SNV109 0,2 10 ETAPA 3.2: PONTUAÇÃO DE CLASSIFICAÇÃO DA EXPRESSÃO DE RNA (REXPR)
[141] O nível de expressão de cada neoantígeno é determinado a partir dos dados de NGS-RNA do tumor calculando o valor de Transcritos por Milhão (TPM) centrado no gene (Li & Dewey, 2011) considerando todas as leituras mapeadas. O valor de TPM é então modificado levando em consideração o número de leituras mutadas e do tipo selvagem abrangendo a localização da mutação nos dados do transcriptoma NGS-RNA (corr TPM): 𝑛ú𝑚. 𝑙𝑒𝑖𝑡𝑢𝑟𝑎𝑠 (𝑚𝑢𝑡) + 0,1 𝑐𝑜𝑟𝑟𝑇𝑃𝑀 = 𝑇𝑃𝑀(𝑔𝑒𝑛𝑒) × ( ) 𝑛ú𝑚. 𝑙𝑒𝑖𝑡𝑢𝑟𝑎𝑠 (𝑚𝑢𝑡) + 𝑛𝑢𝑚. 𝑙𝑒𝑖𝑡𝑢𝑟𝑎𝑠 (𝑤𝑡) + 0,1
[142] Um valor preferido de 0,1 é adicionado ao numerador e ao enumerador para incluir também os casos em que nenhuma leitura está presente no local da mutação.
[143] Se nenhum dado de sequenciamento NGS-RNA do tumor do paciente estiver disponível, o corrTPM é substituído, para cada neoantígeno, pelo valor de TPM mediano do gene correspondente, conforme presente em um banco de dados de expressão do mesmo tipo de tumor.
[144] Os neoantígenos são então ranqueados (classificados) de acordo com o nível de expressão conforme determinado pelo valor corrTPM. A ordenação é da expressão mais alta (pontuação REXP igual a 1) até a expressão mais baixa. Os neoantígenos com o mesmo valor corrTPM recebem a mesma pontuação de classificação REXPR (Tabela 2).
TABELA 2
NEOANTÍGENOS COM VALOR DE EXPRESSÃO CORRTPM IGUAL OBTÊM A MESMA
PONTUAÇÃO DE CLASSIFICAÇÃO REXPR corrTPM REXPR SNV11 47,53 1 corrTPM REXPR SNV88 46,9 2 SNV34 37,64 3 SNV67 29,72 4 SNV23 26,12 5 SNV55 21,66 6 SNV63 21,37 7 SNV34 17,74 8 SNV93 17,74 8 SNV18 11,52 9 FSP4_5 10,41 10 ETAPA 3.3: PREVISÃO DE LIGAÇÃO AO HLA CLASSE I (RIC50)
[145] Para cada SNV ou peptídeo neoantígeno derivado de FSP, a probabilidade de ligação ao MHC classe I é definida como o melhor valor de IC50 previsto (mais baixo) entre todos os epítopos de 9mers previstos que incluem o(s) aminoácido(s) mutado(s) ou incluem um aminoácido mutado a partir de FSP. A predição é realizada apenas contra os alelos MHC classe I presentes no paciente, determinados pela análise da amostra de DNA normal.
[146] A lista de neoantígenos é então ordenada do menor valor de IC50 previsto (pontuação RIC50 igual a 1) para o maior valor de IC50 previsto. Os neoantígenos com o mesmo valor de IC50 recebem a mesma pontuação de classificação RIC50 (Tabela 3).
TABELA 3 NEOANTÍGENOS COM VALORES DE IC50 IGUAIS OBTÊM A MESMA PONTUAÇÃO DE CLASSIFICAÇÃO RIC50 IC50 RIC50 SNV67 1 1 SNV11 1,3 2 SNV23 3,5 3 SNV61 3,8 4 SNV26 4,2 5 SNV62 4,2 5 SNV105 7,2 6 SNV69 8,4 7 SNV18 9,6 8 SNV34 12,7 9
IC50 RIC50 FSP4_5 16,4 10 ETAPA 3.4
[147] A priorização final (classificação) dos neoantígenos é então feita calculando uma soma ponderada (RSUM) das 3 pontuações de classificação individuais e classificando os neoantígenos do menor para o maior valor de RSUM (Figura 3). A ponderação é aplicada da seguinte maneira: Fórmula (I): 𝑅𝑆𝑈𝑀 = (𝑅𝐹𝑅𝐸𝑄 + 𝑅𝐸𝑋𝑃𝑅 + (𝜅 + 𝑅𝐼𝐶50)) × 𝑊𝐹
[148] Na Fórmula (I) k é um valor constante que é adicionado ao valor RIC50 no caso do epítopo previsto ter um valor IC50 superior a 1000 nM (isto penaliza neoantígenos com um alto valor de pontuação RIC50, ou seja, com um valor IC50 alto).
[149] O valor de k é determinado da seguinte maneira. 𝑀 = 𝑛ú𝑚. 𝑑𝑒 𝑛𝑒𝑜𝑎𝑛𝑡í𝑔𝑒𝑛𝑜𝑠 𝑐𝑎𝑛𝑑𝑖𝑑𝑎𝑡𝑜𝑠 𝑠𝑒 𝑀𝐻𝐶𝐼𝑝𝑟𝑒𝑑𝑖çã𝑜 𝐼𝐶50 > 1000 𝑛𝑀 𝑘= { 𝑠𝑒 𝑀𝐻𝐶𝐼𝑝𝑟𝑒𝑑𝑖çã𝑜 𝐼𝐶50 ≤ 1000 𝑛𝑀 0
[150] Ocasionalmente, os dados de NGS-RNA, por razões técnicas, não fornecem cobertura no local da mutação, nem para os aminoácidos não mutados nem para os aminoácidos mutados em um gene de outra forma expresso. WF é um fator de redução de peso (redução da ponderação porque o valor RSUM resultante é aumentado e o neoantígeno é classificado mais abaixo na lista) levando em consideração os casos em que nenhuma leitura mutada foi observada nos dados do transcriptoma NGS-RNA. 1 𝑙𝑒𝑖𝑡. 𝑚𝑢𝑡. 𝑅𝑁𝐴𝑠𝑒𝑞 > 0 2 𝑙𝑒𝑖𝑡. 𝑚𝑢𝑡. 𝑅𝑁𝐴𝑠𝑒𝑞 = 0; 𝑙𝑒𝑖𝑡. 𝑤𝑡 𝑅𝑁𝐴𝑠𝑒𝑞 = 0; 𝑇𝑃𝑀 ≥ 0,50 𝑊𝐹 = 3 𝑙𝑒𝑖𝑡. 𝑚𝑢𝑡. 𝑅𝑁𝐴𝑠𝑒𝑞 = 0; 𝑙𝑒𝑖𝑡. 𝑤𝑡 𝑅𝑁𝐴𝑠𝑒𝑞 > 0; 𝑇𝑃𝑀 ≥ 0,50 4 𝑙𝑒𝑖𝑡. 𝑚𝑢𝑡. 𝑅𝑁𝐴𝑠𝑒𝑞 = 0; 𝑙𝑒𝑖𝑡. 𝑤𝑡 𝑅𝑁𝐴𝑠𝑒𝑞 = 0; 𝑇𝑃𝑀 < 0,50 {5 𝑙𝑒𝑖𝑡. 𝑚𝑢𝑡. 𝑅𝑁𝐴𝑠𝑒𝑞 = 0; 𝑙𝑒𝑖𝑡. 𝑤𝑡 𝑅𝑁𝐴𝑠𝑒𝑞 > 0; 𝑇𝑃𝑀 < 0,50
[151] Isso gera uma lista classificada RSUM de neoantígenos.
[152] Os neoantígenos que têm a mesma pontuação RSUM são ainda priorizados de acordo com sua pontuação RIC50 (Figura 3). Se a pontuação RSUM e a pontuação RIC50 forem idênticas, os neoantígenos são priorizados de acordo com sua pontuação REXPR. No caso de a pontuação RSUM, a pontuação RIC50 e a pontuação REXPR serem idênticas, os neoantígenos são ainda priorizados de acordo com sua pontuação RFREQ. No caso de a pontuação RSUM, pontuação RIC50, pontuação REXPR e a pontuação RFREQ serem idênticas, os neoantígenos são ainda priorizados de acordo com o valor de TPM em nível de gene não corrigido.
ETAPA 4 ETAPA 4.1
[153] A lista final do ranking de neoantígenos M é então analisada por um método que determina quais e quantos neoantígenos podem ser incluídos no vetor da vacina.
[154] O método funciona com um procedimento iterativo. Em cada iteração, é criada uma lista dos N neoantígenos melhor classificados, necessários para atingir o tamanho máximo da inserção de L aminoácidos (preferencialmente 1500 aminoácidos). Se a lista de N neoantígenos contiver mais de um neoantígeno parcialmente sobreposto derivado do mesmo FSP, é realizada uma etapa de fusão para evitar a inclusão de trecho redundante da mesma sequência de aminoácidos. (Figura 4). Se após a etapa de fusão, o comprimento total dos neoantígenos incluídos ainda não atingir o tamanho de inserção máximo desejado, uma nova iteração é realizada adicionando o próximo neoantígeno a partir da lista classificada.
[155] O procedimento é interrompido quando a adição do próximo neoantígeno à lista já selecionada de N neoantígenos excede o tamanho de inserção L máximo desejado.
[156] O valor preciso de N pode, portanto, diminuir devido à presença de neoantígenos derivados de FSP mesclados (comprimento maior que 25 mers) ou aumentar devido à presença de neoantígenos contendo mutações próximas ao N-terminal ou C-terminal da proteína (esses neoantígenos serão mais curtos do que 25 mers).
[157] O resultado é uma lista de N neoantígenos com um comprimento total menor ou igual a L = 1.500 aa.
ETAPA 4.2
[158] A lista ordenada é então dividida em duas partes com comprimentos aproximadamente iguais (Figura 5). O especialista versado na técnica está ciente de que uma variedade de maneiras diferentes para dividir a lista em duas partes é viável.
ETAPA 4.3
[159] A lista de N sequências de neoantígenos selecionadas é então reordenada de acordo com um método que minimiza a formação de epítopos de junção previstos que podem ser gerados pela justaposição de dois peptídeos de neoantígenos adjacentes em um polipeptídeo polineoantígeno montado. Um milhão de arranjos (layouts) embaralhados do polineoantígeno montado são gerados, cada um com uma ordem de neoantígeno diferente.
Cada layout é então analisado para determinar o número de epítopos juncionais previstos com um IC50 ≤ 1.500nM para um dos alelos HLA do paciente. Durante o loop em cada milhão de layouts, o layout com o número mínimo de epítopos juncionais previstos encontrados até aquele ponto é lembrado. Se, posteriormente, um segundo layout com o mesmo número mínimo de epítopos de junção previstos for encontrado, o primeiro layout encontrado é mantido.
EXEMPLO 2
APLICAÇÃO DO MÉTODO DE PRIORIZAÇÃO A UM CONJUNTO DE DADOS EXISTENTE NA LITERATURA
[160] O método de priorização descrito no Exemplo 1 foi aplicado a um conjunto de dados NGS de uma amostra de câncer pancreático (Pat_3942; Tran et al. 2015) para o qual uma reatividade imunogênica validada experimentalmente foi divulgada. Os dados brutos de exoma tumoral/normal e os dados brutos NGS do transcriptoma tumoral foram baixados do banco de dados NCBI SRA [SRA IDs: SRR2636946; SRR2636947; SRR4176783] e analisado com uma conduta que caracteriza o mutanoma do paciente.
[161] A conduta de detecção de mutação utilizada compreendeu 8 etapas: a) Controle de qualidade e otimização de leituras:
[162] O controle de qualidade preliminar dos dados da sequência bruta foi realizado com FastQC 0.11.5 (Andrews, https://www.bioinformatics.babraham.ac.uk/projects/fastqc/). As leituras pareadas com comprimento inferior a 50 bp foram filtradas. Após a inspeção visual, as leituras restantes foram opcionalmente aparadas na extremidade 5' e 3' usando Trimmomatic-0.33 (Bolger et al., 2014) para remover bases sequenciadas com baixa qualidade e para melhorar a qualidade das leituras adequadas (leituras filtradas por QC) para alinhamento com o genoma de referência.
b) Alinhamento lido em relação ao genoma de referência:
[163] As leituras de DNA filtradas por QC foram então alinhadas contra a versão do genoma humano de referência GRCh38/hg38 usando o algoritmo BWA-mem (Li & Durbin, 2009) com parâmetros padrão. As leituras de RNA filtradas por QC foram alinhadas usando o software Hisat2 2.2.0.4 (Kim et al., 2015) mantendo todos os parâmetros predefinidos (padrão). Os pares de leitura para os quais apenas uma leitura foi alinhada e leituras pareadas alinhadas com mais de um locus genômico com a mesma pontuação de mapeamento foram filtrados usando Samtools 1.4 (Li et al., 2009).
c) Otimização do alinhamento:
[164] Os alinhamentos das leituras de DNA foram posteriormente processados por um procedimento que otimizou o alinhamento local em torno de pequenas inserções ou deleções (indels), marcando leituras duplicadas e recalibrando a pontuação de qualidade de base final nas regiões realinhadas.
O realinhamento Indel foi realizado usando as ferramentas RealignerTargetCreator e IndelRealigner do software GATK, versão 3.7 (McKenna et al., 2010). Leituras duplicadas foram detectadas e marcadas usando MarkDuplicates da Picard, versão 2.12 (http://broadinstitute.github.io/picard). A recalibração da pontuação da qualidade de base foi realizada usando BaseRecalibrator e PrintReads da GATK, versão 3.7 (McKenna et al., 2010). Os polimorfismos anotados na versão humana dbSNP138 (https://www.ncbi.nlm.nih.gov/projects/SNP/snp_summary.cgi?view+summary= view+summary&build_id=138) foram usados como uma lista de sites conhecidos a fim de gerar o modelo de recalibração básico.
d) Determinação de HLA:
[165] A avaliação do tipo HLA classe I específica do paciente foi realizada alinhando as leituras de DNA filtradas por QC da amostra normal na porção do genoma hg38 que codifica os haplótipos humanos de classe I com BWA-mem (Li & Durbin, 2009). Os pares de leitura para os quais apenas uma leitura foi alinhada e os pares de leituras alinhadas com mais de um locus com a mesma pontuação de mapeamento foram filtrados usando Samtools 1.4 (Li et al., 2009). Por fim, a determinação dos haplótipos mais prováveis do paciente foi realizada com o software optytipe (Szolek et al., 2014). A avaliação do tipo HLA classe II específica do paciente foi realizada alinhando as leituras de DNA filtradas por QC da amostra normal na porção do genoma hg38 que codifica os haplótipos humanos de classe II com BWA-mem (Li & Durbin, 2009). A determinação dos haplótipos de classe II mais prováveis do paciente foi realizada com o software HLAminer (Warren et al., 2012).
e) Detecção / reconhecimento de variante:
[166] A detecção / reconhecimento de variantes somáticas de variantes de nucleotídeo único (SNVs) e pequenos indels é realizada nos dados de leitura de DNA recalibrados por mutect2 (Cibulskis et al., 2012) incluídos no GATK versão 3.7 [25] e por Varscan2 2.3.9 (Koboldt et al., 2012) comparando explicitamente a amostra de tumor com a amostra de controle normal. Todos os parâmetros foram mantidos como padrão. SCALPEL (Fang et al., 2014) com parâmetros padrão foi usado como ferramenta adicional para detecção/reconhecimento de variação por indels. Variantes somáticas significativas, detectadas por pelo menos um dos algoritmos, foram então mapeadas no transcriptoma Refseq humano usando o software Annovar (Wang et al., 2010) e posteriormente filtradas. Apenas SNVs que geram mudança não sinônima (missense) em um códon ou indels que geram uma mudança na fase de leitura dentro da sequência codificante de genes codificantes de proteínas (indels de frameshift) foram mantidas. As SNVs que geram códons de parada prematuros foram excluídas. Para cada variante detectada, o número de leituras mutadas e wt observadas nos dados NGS alinhados de amostras de DNA e RNA foi então determinado com uma ferramenta personalizada que utiliza mpileup de Samtools 1.4 (Li et al., 2009).
f) Geração de neoantígeno:
[167] Cada variante somática foi traduzida em um peptídeo contendo o aminoácido mutado. Para SNVs, os peptídeos neoantígenos foram gerados pela adição de 12 aminoácidos tipo selvagem a montante e a jusante do aminoácido mutado. Exceções de comprimento ocorreram para 5 mutações para as quais o aminoácido mutado foi mapeado a menos de 12 aminoácidos de distância do N-terminal ou do C-terminal. Vários peptídeos 25-mer foram gerados em 3 casos em que uma SNV induziu uma mudança de aminoácido em várias isoformas de splicing alternativo com sequências de proteínas distintas. Para os indels que geram FSP, foram adicionados 12 aminoácidos tipo selvagem a montante do primeiro novo aminoácido. FSPs modificados que têm um comprimento final de pelo menos nove aminoácidos foram retidos.
g) Predições de ligação HLA-I dos neoantígenos:
[168] A probabilidade de ligação ao MHC-I foi determinada como melhor valor de IC50 previsto (mais baixo) entre todos os epítopos de 9-mers previstos que incluem o(s) aminoácido(s) mutado(s). As predições foram realizadas usando o método IEDB_recommended do software IEDB (Moutaftsi et al., 2006). O método netMHCpan (Hoof et al., 2009) foi usado no caso de um haplótipo MHC I não ser coberto pelo método IEDB_recommended (Moutaftsi et al., 2006).
h) Seleção final de variantes confiáveis:
[169] A lista inicial de SNVs e indels que causam um frameshift foi então ainda mais reduzida, selecionando apenas as mutações que atendem aos seguintes critérios: frequência do alelo de mutação (MF) na amostra de DNA do tumor ≥ 10%, proporção da MF na amostra de DNA de tumor e amostra de DNA de controle ≥ 5, leituras mutadas na posição cromossômica da variante somática no DNA do tumor > 2, leituras mutadas na posição cromossômica da variante somática no DNA normal < 2,
[170] A lista final de 129 mutações codificantes de neoantígenos detectadas com segurança no paciente Pat_3942 incluiu 4 indels de geração de frameshift e 125 SNVs. As 125 SNVs geram 128 neoantígenos, 3 dos quais derivados de mutações mapeadas em múltiplas isoformas de splicing alternativo. Os 4 indels de frameshift geram 4 FSPs com um comprimento total de 307 aminoácidos e um total de 260 sequências de neoantígenos. O comprimento total de todos os 388 neoantígenos derivados de SNVs ou indels de frameshift foi de 3942 aminoácidos.
[171] O tamanho máximo da inserção (incluindo elementos de controle de expressão) que pode ser acomodado por vacinas genéticas, por exemplo, vetores adenovirais, é limitado, impondo assim um tamanho máximo de aminoácidos L ao polineoantígeno codificado. Os valores típicos de L para vetores adenovirais são da ordem de 1.500 aminoácidos, menores do que o comprimento cumulativo de 3942 aminoácidos para todos os neoantígenos. A estratégia de priorização descrita no Exemplo 1 foi, portanto, aplicada a fim de selecionar um subconjunto ideal de neoantígenos classificados compatíveis com o limite de 3.942 aminoácidos
[172] A Tabela 4 divulga todos os 60 neoantígenos selecionados para atingir um comprimento cumulativo de 1.485 aa. O processo de seleção incluiu 6 sequências de neoantígenos derivadas de FSP chr11:1758971_AC_- (deleção de 2 nucleotídeos), 2 sequências de neoantígenos de FSP chr6:168310205_-_T (inserção de 1 nucleotídeo) e 1 sequência de neoantígeno de FSP chr16_3757295_GATAGCTGTAGCAGCAGCAT_- (deleção 22 nucleotídeo; SEQ ID NO: 185). Durante a seleção, várias sequências de neoantígenos derivadas de FSP sobrepostas foram mescladas a fim de remover segmentos de sequência redutora (Tabela 5). Os detalhes das sequências de neoantígenos mesclados são mostrados na Figura 6.
[173] Todas as sequências de neoantígenos geradas pelas 129 mutações detectadas com segurança em Pat_3942 estão listadas na Tabela 6, incluindo os valores associados dos três parâmetros (frequência de alelo mutante MFREQ, valor de expressão corrigido corrTPM, melhor valor de IC50 previsto para MIC50 de epítopos MHC classe I de 9mers), o resultando em três pontuações de classificação independentes (RFREQ, REXPR, RIC50), o fator de ponderação WF, o valor RSUM ponderado e a classificação RSUM resultante.
[174] De maneira importante, todas as três sequências de neoantígenos relatadas como indutoras de reatividade de células T no paciente (Tran et al., 2015) foram selecionadas entre os 60 principais neoantígenos pela estratégia de priorização.
TABELA 4 LISTA DE 60 NEOANTÍGENOS SELECIONADOS PARA O PAT_3942.
[175] Os aa mutados em neoantígenos derivados de SNV são indicados em negrito. Os aminoácidos de neoantígenos derivados de FSP que são parte do peptídeo de frameshift também estão em negrito. As sequências de neoantígenos verificadas experimentalmente para induzir a reatividade das células T são rotuladas como TP na coluna “Classificação final”. As coordenadas genômicas fornecidas são em relação à montagem do genoma humano GRch38/hg38. Classificação final Melhor IC50 pred.
Classificação de neoantígeno
SE CorrTPM Compr.
AFREQ RFREQ REXPR Q
RSUM RIC50
TPM
WF ID (COORD; WT;MUT) ID Neoantígeno
N O: YIRLVEPGSPAENAGL 2 0,7 53,3 46, 269, 3 4 chr17:74748996_G_C 12 6 6 1 1 1 LAGDRLVEV 5 1 3 90 58 2 4 YFWNIATIAVFYV 2 0,4 4,0 84,4 3 3 1 7 chr11:117189364_C_T 13 9,30 1 2 2 LPVVQLVITYQT 5 2 1 0 1 5 2 8 VTLEDFYGVFSSL 2 0,3 88,0 37, 12,0 7 8 chr14:22875565_C_T 14 8 2 1 3 3 GYTHLASVSHPQ 5 3 8 64 2 1 1 EKCQFAHGFHELC 2 0,3 113, 47, 250, 5 3 8 chr2:43225254_G_A 15 5 1 4 4 SLTRHPKYKTEL 5 8 35 53 90 0 1 6 TPDFTSLDVLTFV 2 0,4 57,5 29, 289, 4 1 3 8 chr11:66492872_C_T 16 1 5 5 GSGIPAGINIPN 5 0 1 72 70 0 0 6 6 SAFGAGFCTTVIT 2 0,4 56,1 21, 416, 3 1 4 8 chr11:73975612_C_T 17 1 6 6 SPVDVVKTRYMN 5 2 6 37 00 4 4 0 8 ESLHSILAGSDMM 2 0,6 12,4 11, 795, 1 1 5 8 chr22:19355853_G_A 18 1 7 7 VSQILLTQHGIP 5 3 2 52 10 2 9 7 8
Classificação final Melhor IC50 pred.
Classificação de neoantígeno
SE CorrTPM Compr.
AFREQ RFREQ REXPR Q
RSUM RIC50
TPM
WF ID (COORD; WT;MUT) ID Neoantígeno
N O: AMRLLHDQVGVIL 2 0,3 33,4 17, 204, 4 1 2 8 chr1:160292592_T_A 19 1 8 8 FGPYKQLFLQTY 5 9 0 74 82 5 5 9 9 APTEHKALVSHNA 2 0,4 56,9 26, 487, 3 1 4 8 chr8:22618914_G_C 20 1 9 9 SLINVGSLLQRA 5 2 1 12 10 3 1 5 9 LPRGLSLSSLGSV 2 0,3 5,7 108, 4 2 1 9 1 chr3:184338462_C_T 21 5,70 1 10 RTLRGWSRSSRP 5 8 0 60 6 9 8 3 0 ERWEDVKEEMTSD 2 0,3 43,6 21, 207, 5 1 3 9 1 chr1:206732591_C_A 22 1 11 LATMRVDYEQIK 5 7 8 66 98 2 3 0 5 1 LYSCIALKVTANK 2 0,7 3,1 761, 3 5 9 1 chr1:92843466_G_T 23 3,15 4 1 12 MEMEHSLILNNL 5 2 5 20 7 6 7 2 1 LVLSLVFICFYIR 2 0,3 24,5 10, 183, 5 2 2 1 chr6:137200930_T_C 24 0 1 13 KINPLKEKSIIL 5 7 4 41 20 4 1 5 3 0 1 PFSTLTPRLHLPY 2 0,3 26,4 9,1 48,5 7 2 1 chrX:53192998_C_T 25 7 0 1 14 PQQPPQQQL 2 3 1 5 8 0 5 4 2 1 AANIPRSISSDGH 2 0,4 5,7 683, 3 2 5 1 chr14:71685616_G_A 26 7,69 1 1 15 PLERRLSPGSDI 5 0 8 30 7 8 2 5 7 1 YYIVRVLGTLGIM 2 0,3 0,8 31,8 6 5 1 chr8:70734206_T_A 27 1,02 6 2 1 16 TVFWVCPLTIFN 5 5 2 0 5 3 6 4 1 WQLRFSHLVGYGG 2 0,2 28,0 9,8 17,8 9 2 1 chr13:23760177_G_C 28 4 2 1 17 RYYSYLMSRAVA 5 4 4 7 6 8 3 7 5 1 HYTQSETEFLLSS 2 0,4 0,4 483, 2 6 4 1 chr1:237783918_G_C 29 0,88 2 1 18 AETDENETLDYE 5 4 6 56 4 1 4 8 9 1 QSISRNHVVDISK 2 0,3 10,3 10, 930, 5 2 6 1 19 chr2:156568935_G_A 30 4 1 SGLITIAGGKWT 5 7 3 33 40 4 2 5 9 TP 1 1 LLQCVQKMADGLQ 2 0,3 2,2 181, 7 4 2 2 chr2:203049917_G_C 31 5,52 4 1 20 EQQQALSILLVK 5 1 7 12 7 3 4 0 4 1 TGLFGQTNTGFGD 2 0,2 12,5 5,4 184, 8 3 2 2 21 chr11:3762912_G_T 32 4 1 VGSTLFGNNKLT 5 8 6 8 10 8 0 7 1 TP 5 1 LQENGLAGLSAST 2 0,2 43,4 24, 559, 8 1 4 2 chr7:6041002_A_T 33 4 1 22 IVEQQLPLRRNS 5 8 6 50 50 8 2 9 2 9 279; 2 1126 3; GSLSGYLSQDTV 1 3 0,3 460, 2,0 ,6; 7 4 3 5 chr11:1758971_AC_- 34 GALPVSVVSLCP 5 1 23 0 1 80 3 1161 9 4 4 2; GRCQSG 7 ,9; 5 1694 3;
Classificação final Melhor IC50 pred.
Classificação de neoantígeno
SE CorrTPM Compr.
AFREQ RFREQ REXPR Q
RSUM RIC50
TPM
WF ID (COORD; WT;MUT) ID Neoantígeno
N O: ,6 5 9 1
SYAEQGTNCDEAV 2 0,6 0,8 131, 5 2 2 chr18:8244173_T_G 35 0,89 9 6 2 24
SFMDTHNLNGRS 5 4 9 70 2 0 4 2 1 NAMDQLEQRVSEL 2 0,3 2,8 795, 7 3 5 2 chr7:120953341_C_G 36 4,53 6 1 25 FMNAKKNKPEWR 5 3 0 92 2 9 8 5 9 1 GDAEAEALARSAS 2 0,2 28,5 12, 944, 8 1 6 2 chr7:100866373_A_G 37 7 1 26 ALVRAQQGRGTG 5 9 6 60 20 7 7 7 6 1 1 MRNLKF 1 0,4 6,2 419, 2 2 4 2 chr9:108931129_T_A 38 6,22 7 2 27 FRTLEFRDIQGP 8 5 2 90 1 7 1 7 8 391, 2 ARPPGSVEDAGQ 1 3 0,2 1,3 51; 9 4 3 8; chr6:168310205_-_T 39 AVGHILAQACVY 2,65 7 1 28 1 7 4 841, 2 8 8 3 RAVQCSR 8 6 1 1 PEHLLLLPEQGP 1 0,3 460, 2,0 833, 7 4 6 2 chr11:1758971_AC_- 40 8 1 29 RCAAWG 8 1 80 3 33 9 4 0 9 3 1 VHWTVDQQSQYIK 2 0,4 0,7 15,8 3 5 3 chr3:78661237_G_T 41 0,77 3 8 2 30 GYKILYRPSGAN 5 1 7 1 6 4 0 6 1 2 ETTSHSTPGFTSL 2 0,2 9,6 104, 2 1 3 chr7:100958504_C_T 42 9,63 0 8 2 31 ITTTETTSHSTP 5 3 3 10 4 6 2 0 0 2 PVFTHENIQGGGV 2 0,6 0,0 50,3 8 3 chr4:185593889_T_A 43 0,77 7 8 9 3 32 PFQALYNYTPRN 5 7 7 2 3 3 4 2 TTLSSIKVEVASR 2 0,4 0,7 937, 2 5 6 3 chrX:3321328_T_G 44 0,75 9 2 33 QAETTTLDQDHL 5 3 5 87 7 6 6 4 8 chr16:3757295_ 1 3 CCYGKQLCTIPRR 2 0,1 4,8 689, 3 5 3 GATAGCTGTAGTAG 45 4,88 0 7 2 34 IGIISVRSVSQ 4 3 8 40 3 3 5 GCAGCATC_- 2 6 4 DVLADDRDDYDFM 2 0,3 0,0 5 8 3 chr1:237591836_T_A 46 0,88 2,77 1 1 3 35 MQTSTYYYSVRI 5 7 8 7 0 6 4 4 ALTGAWAMEDFYM 2 0,3 0,1 22,0 7 7 3 chr16:3597422_G_A 47 1,15 5 6 3 36 ARLVPPLVPQRP 5 3 0 0 3 7 7 5 4 CPNQKVLKYYYVW 2 0,5 0,0 100, 1 9 1 3 chr6:49733209_G_C 48 0,03 9 4 37 QYCPAGNWANRL 5 0 3 85 7 2 5 8 6 chr13:24222901_G_T 49 QDGIPGDEGLELL 2 0,2 5,20 0,2 53,8 9 6 9 5 3 3 38
Classificação final Melhor IC50 pred.
Classificação de neoantígeno
SE CorrTPM Compr.
AFREQ RFREQ REXPR Q
RSUM RIC50
TPM
WF ID (COORD; WT;MUT) ID Neoantígeno
N O: SADSAVPVAMTQ 5 5 5 0 7 6 1 9 6 5 5 TNSTAASRPPVTQ 2 0,4 372, 166 2115 2 4 chr2:70088042_T_A 50 2 0 3 1 39 RLVVPATQCGSL 5 3 90 ,15 ,34 8 0 0 0 4 5 QEIEEKLIEEETL 2 0,3 68,7 31, 1381 5 4 chr13:106559614_C_A 51 9 7 3 1 40 RRVEELVAKRVE 5 75 6 79 ,75 1 1 6 6 4 5 TDFIREEYHKRDI 2 0,6 1,8 1618 1 4 4 chr15:101686041_A_T 52 1,82 8 3 1 41 TEVLSPNMYNSK 5 1 2 ,50 3 6 2 0 9 4 5 MSEAC 1 0,3 27,8 16, 1144 6 1 4 chr16:65003_G_A 53 6 4 1 42 RDSTSSLQRKKP 7 5 7 09 ,35 2 6 3 6 4 5 5 HDKEVYDIAFSRT 2 0,7 11,8 11, 3393 1 4 chr17:63583526_G_A 54 5 2 4 1 43 GGGRDMFASVGA 5 1 7 87 ,50 8 4 6 9 4 5 EIPTAALVLGVNI 2 0,3 13,0 8,8 1039 6 2 4 chr6:87605925_G_A 55 6 5 1 44 TDHDLTFGSLTE 5 5 8 6 ,10 5 6 5 1 2 4 5 SSLIIHQRTHTGK 2 0,4 0,4 1629 1 6 4 chr16:25240154_C_T 56 0,43 8 6 1 45 KPYQCGECGKSF 5 7 3 ,60 9 2 6 2 3 5 5 SGNLLGRNSFEVC 2 0,7 43,4 43, 4847 4 chr17:7673803_G_A 57 3 7 5 6 1 46 VCACPGRDRRTE 5 3 6 46 ,50 7 3 3 1 5 SCLLILEFVMIVI 2 0,4 0,0 75,8 2 1 4 chr6:73041954_G_A 58 0,01 0 6 4 47 FGLEFIIRIWSA 5 3 1 9 8 0 8 3 4 5 LTEGQKRYFEKLL 2 0,3 0,0 83,7 4 8 1 4 chr19:12753303_G_C 59 0,07 6 4 48 IYCDQYASLIPV 5 8 7 4 8 2 1 9 4 5 5 QAPTPAPSTIPGL 2 0,4 1190 550 4742 2 5 chr6:30744439_G_A 60 1 4 7 1 49 RRGSGPEIFTFD 5 5 ,79 ,66 ,67 2 0 9 2 5 VAIIPYFITLGTQ 2 0,6 0,0 357, 1 9 3 5 chr1:110603966_C_G 61 0,02 7 4 50 LAEKPEDAQQGQ 5 3 2 40 1 6 7 1 6 4 5 PGHGLPPHLRQQR 2 0,3 460, 2,0 1202 7 4 5 chr11:1758971_AC_- 62 6 9 1 51 AARLRQPDAAEA 5 1 80 3 ,07 9 4 4 8 1 4 5 IIEKHFGEEEDER 2 0,3 1,0 2045 4 5 5 52 chr7:99173780_G_C 63 2,82 9 9 1 QTLLSQVIDQDY 5 8 0 ,92 8 1 5 TP 8 7 YEIGRQFRNEGIH 2 0,3 150, 71, 4282 5 5 6 5 chr16:75631789_C_G 64 3 1 53 LTHNPEFTTCEF 5 7 39 89 ,32 6 4 0 6
Classificação final Melhor IC50 pred.
Classificação de neoantígeno
SE CorrTPM Compr.
AFREQ RFREQ REXPR Q
RSUM RIC50
TPM
WF ID (COORD; WT;MUT) ID Neoantígeno
N O: 2 1 6 RLMWKSQYVPYDE 2 0,3 0,0 281, 7 9 3 5 chr2:202961406_G_A 65 0,73 0 3 54 IPFVNAGSRAVV 5 1 3 00 6 1 5 7 6 5 6 QAQSKFKSEKQNQ 2 0,3 13,3 5,3 2391 6 3 5 chr9:113176616_C_T 66 0 0 1 55 KQLELKVTSLEE 5 5 5 8 ,60 7 1 8 8 6 5 6 chr12:122986679_G_ SFCDGLVHDPLRQ 2 0,4 1,1 3437 3 4 6 67 2,27 2 0 1 56 C KANFLKLLISEL 5 2 9 ,40 3 9 0 7 9 5 6 LDGGDFVSLSSRK 2 0,3 18,7 4,2 3526 5 3 6 chr9:127953924_C_T 68 3 1 1 57 EVQENCVRWRKR 5 8 2 4 ,80 0 4 1 2 6 1 6 QSLPLETFSFLLI 2 0,7 0,0 502, 4 6 chr3:154427638_G_A 69 0,00 1 0 2 4 58 LLATTVTPVFVL 5 5 0 77 7 2 7 0 4 6 GKFDELATENHCH 2 0,3 0,1 2006 6 7 6 chr7:45648683_G_A 70 0,13 9 2 1 59 RIKILGDCYYCV 5 5 3 ,53 3 2 3 3 8 5 6 VGSSLPEASPPAL 2 0,2 169, 50, 3489 9 6 chr20:35954142_G_A 71 4 3 3 1 60 EPSSPNAAVPEA 5 6 84 85 ,10 6 4 1 1 TABELA 5 NEOANTÍGENOS DERIVADOS DE FSP FUNDIDOS PARA PAT_3492.
[176] Os aminoácidos que fazem parte do peptídeo de frameshift (aminoácidos mutados) são indicados em negrito. As coordenadas genômicas fornecidas são em relação à montagem do genoma humano GRch38/hg38. Class. NEOAG Classificação (SEQ ID NO) Melhor IC50 FSP fund CorrTPM PEPTÍD.
NEOAG AFREQ RFREQ REXPR
RSUM RIC50 pred.
TPM final
WF ID GSLSGY
GSLSGYL LSQDTV chr11: SQDTVG GALPVS 0,31 460,8 2,03 279 79 44 34 157 1 23 1758971_AC_- ALPVSV VVSLC VSLCPG 23 (SEQ ID RCQSG NO: 73) (SEQ ID chr11: NO: 72) YLSQDT 0,31 460,8 2,03 1126,6 79 44 465 588 1 52 1758971_AC_- VGALPV
Class. NEOAG Classificação (SEQ ID NO) Melhor IC50 FSP fund CorrTPM PEPTÍD.
NEOAG AFREQ RFREQ REXPR
RSUM RIC50 pred.
TPM final
WF ID SVVSLC PGRCQS
G (SEQ ID NO: 74)
LSGYLS QDTVGA
LPVSVV chr11: SLCPGR 0,31 460,8 2,03 1161,9 79 44 467 590 1 53 1758971_AC_-
C (SEQ ID NO: 75)
SGYLSQ DTVGAL
PVSVVS chr11: LCPGRC 0,31 460,8 2,03 1694,6 79 44 483 606 1 59 1758971_AC_-
Q (SEQ ID NO: 76)
ARPPGS
VEDAG chr6: ARPPGS QAVGHI 0,27 2,65 1,34 841,6 92 48 61 201 1 31 168310205_-_T VEDAGQ LAQAC AVGHIL (SEQ ID AQACV NO: 78) 28
YRAVQC EDAGQA
SR VGHILA chr6: (SEQ ID QACVYR 0,27 2,65 1,34 391,51 92 48 38 178 1 28 168310205_-_T NO: 77) AVQCSR (SEQ ID NO: 79) TABELA 6 TODOS OS 388 NEOANTÍGENOS PARA PAT_3492 ORDENADOS POR SUAS CLASSIFICAÇÕES RSUM.
[177] Os aminoácidos de neoantígenos derivados de FSP que são parte do peptídeo de frameshift também estão em negrito. As sequências de neoantígenos verificadas experimentalmente para induzir a reatividade das células T são rotuladas como TP na coluna “Classificação final”. As coordenadas genômicas fornecidas são em relação à montagem do genoma humano GRch38/hg38.
Class. NEOAG melhor IC50 corrTPM
AFREQ RFREQ REXPR
RSUM RIC50
TYPE TPM WF
ID SN 46,9 chr17:74748996_G_C 0,71 53,33 269,58 6 6 32 44 1 1 V 0
SN chr11:117189364_C_T 0,42 9,30 4,01 84,40 31 35 12 78 1 2
V SN 37,6 chr14:22875565_C_T 0,33 88,08 12,02 71 8 2 81 1 3 V 4 SN 113,3 47,5 chr2:43225254_G_A 0,38 250,90 50 5 31 86 1 4 V 5 3 SN 29,7 chr11:66492872_C_T 0,40 57,51 289,70 40 10 36 86 1 5 V 2 SN 21,3 chr11:73975612_C_T 0,42 56,16 416,00 34 14 40 88 1 6 V 7 SN 11,5 chr22:19355853_G_A 0,63 12,42 795,10 12 19 57 88 1 7 V 2 SN 17,7 chr1:160292592_T_A 0,39 33,40 204,82 45 15 29 89 1 8 V 4 SN 26,1 chr8:22618914_G_C 0,42 56,91 487,10 33 11 45 89 1 9 V 2
SN chr3:184338462_C_T 0,38 5,70 5,70 108,60 46 29 18 93 1 10
V SN 21,6 chr1:206732591_C_A 0,37 43,68 207,98 52 13 30 95 1 11 V 6
SN chr1:92843466_G_T 0,72 3,15 3,15 761,20 4 37 56 97 1 12
V SN 10,4 chr6:137200930_T_C 0,37 24,54 183,20 54 21 25 100 1 13 V 1
SN chrX:53192998_C_T 0,33 26,41 9,15 48,58 70 25 7 102 1 14
V
SN chr14:71685616_G_A 0,40 7,69 5,78 683,30 37 28 52 117 1 15
V
SN chr8:70734206_T_A 0,35 1,02 0,82 31,80 65 53 6 124 1 16
V
SN chr13:23760177_G_C 0,24 28,04 9,87 17,86 98 23 4 125 1 17
V
SN chr1:237783918_G_C 0,44 0,88 0,46 483,56 24 61 44 129 1 18
V SN 10,3 chr2:156568935_G_A 0,37 10,33 930,40 54 22 65 141 1 19 V 3
SN chr2:203049917_G_C 0,31 5,52 2,27 181,12 77 43 24 144 1 20
V
SN chr11:3762912_G_T 0,28 12,56 5,48 184,10 88 30 27 145 1 21
V SN 24,5 chr7:6041002_A_T 0,28 43,46 559,50 88 12 49 149 1 22 V 0
Class. NEOAG melhor IC50 corrTPM
AFREQ RFREQ REXPR
RSUM RIC50
TYPE TPM WF
ID FS 460,8 chr11:1758971_AC_- 0,31 2,03 279,00 79 44 34 157 1 23 P 0
SN chr18:8244173_T_G 0,64 0,89 0,89 131,70 9 52 20 162 2 24
V
SN chr7:120953341_C_G 0,33 4,53 2,80 795,92 72 39 58 169 1 25
V SN 12,6 chr7:100866373_A_G 0,29 28,56 944,20 87 17 67 171 1 26 V 0
SN chr9:108931129_T_A 0,45 6,22 6,22 419,90 21 27 41 178 2 27
V
FS chr6:168310205_-_T 0,27 2,65 1,34 391,51 92 48 38 178 1 28
P FS 460,8 chr11:1758971_AC_- 0,31 2,03 833,33 79 44 60 183 1 29 P 0
SN chr3:78661237_G_T 0,41 0,77 0,77 15,81 36 54 3 186 2 30
V
FS chr6:168310205_-_T 0,27 2,65 1,34 841,60 92 48 61 201 1 31
P SN 10 chr7:100958504_C_T 0,23 9,63 9,63 104,10 24 16 280 2 32 V 0
SN chr4:185593889_T_A 0,67 0,77 0,07 50,32 7 83 8 294 3 33
V
SN chrX:3321328_T_G 0,43 0,75 0,75 937,87 27 56 66 298 2 34
V chr16:3757295_GATAGCTGTAGTAGGC FS 10 0,13 4,88 4,88 689,40 33 53 376 2 35 AGCATC_- P 2
SN chr1:237591836_T_A 0,37 0,88 0,08 2,77 57 80 1 414 3 36
V
SN chr16:3597422_G_A 0,33 1,15 0,10 22,00 73 77 5 465 3 37
V
SN chr6:49733209_G_C 0,50 0,03 0,03 100,85 17 92 15 496 4 38
V
SN chr13:24222901_G_T 0,25 5,20 0,25 53,80 97 66 9 516 3 39
V SN 372,9 166, 2115,3 50 chr2:70088042_T_A 0,43 28 2 530 1 40 V 0 15 4 0 SN 375, 31,7 1381,7 47 chr13:106559613_G_A 68,76 51 9 536 1 41 V 00 9 5 6 SN 1618,5 48 chr15:101686041_A_T 0,61 1,82 1,82 13 46 539 1 42 V 0 0 SN 16,0 1144,3 46 chr16:65003_G_A 0,35 27,87 62 16 544 1 43 V 9 5 6 SN 11,8 3393,5 52 chr17:63583526_G_A 0,71 11,87 5 18 549 1 44 V 7 0 6
Class. NEOAG melhor IC50 corrTPM
AFREQ RFREQ REXPR
RSUM RIC50
TYPE TPM WF
ID SN 1039,1 46 chr6:87605925_G_A 0,35 13,08 8,86 65 26 552 1 45 V 0 1 SN 1629,6 48 chr16:25240154_C_T 0,47 0,43 0,43 19 62 563 1 46 V 0 2 SN 43,4 4847,5 55 chr17:7673803_G_A 0,73 43,46 3 7 563 1 47 V 6 0 3 SN 10 chr6:73041954_G_A 0,43 0,01 0,01 75,89 28 10 564 4 48 V 3
SN chr19:12753303_G_C 0,38 0,07 0,07 83,74 48 82 11 564 4 49
V SN 1190, 550, 4742,6 54 chr6:30744439_G_A 0,45 22 1 572 1 50 V 79 66 7 9
SN chr1:110603966_C_G 0,63 0,02 0,02 357,40 11 96 37 576 4 51
V FS 460,8 1126,6 46 chr11:1758971_AC_- 0,31 2,03 79 44 588 1 52 P 0 0 5 FS 460,8 1161,9 46 chr11:1758971_AC_- 0,31 2,03 79 44 590 1 53 P 0 0 7 FS 460,8 1202,0 46 chr11:1758971_AC_- 0,31 2,03 79 44 591 1 54 P 0 7 8 SN 2045,9 49 chr7:99173780_G_C 0,38 2,82 1,00 48 51 597 1 55 V 2 8 SN 150,3 71,8 4282,3 54 chr16:75631789_C_G 0,37 56 3 601 1 56 V 9 9 2 2
SN chr2:202961406_G_A 0,31 0,73 0,03 281,00 76 91 35 606 3 57
V SN 2391,6 50 chr9:113176616_C_T 0,35 13,35 5,38 67 31 606 1 58 V 0 8 FS 460,8 1694,6 48 chr11:1758971_AC_- 0,31 2,03 79 44 606 1 59 P 0 0 3 SN 3437,4 52 chr12:122986679_G_C 0,42 2,27 1,19 33 49 609 1 60 V 0 7 SN 3526,8 53 chr9:127953924_C_T 0,38 18,72 4,24 50 34 616 1 61 V 0 2 SN 10 chr3:154427638_G_A 0,75 0,00 0,00 502,77 1 47 620 4 62 V 7 SN 2006,5 49 chr7:45648683_G_A 0,35 0,13 0,13 63 72 628 1 63 V 3 3 SN 169,8 50,8 3489,1 53 chr20:35954142_G_A 0,26 96 4 631 1 64 V 4 5 0 1 FS 460,8 2532,9 51 chr11:1758971_AC_- 0,31 2,03 79 44 633 1 65 P 0 6 0 FS 460,8 2839,1 51 chr11:1758971_AC_- 0,31 2,03 79 44 636 1 66 P 0 8 3
Class. NEOAG melhor IC50 corrTPM
AFREQ RFREQ REXPR
RSUM RIC50
TYPE TPM WF
ID SN 10,8 3223,3 52 chr14:105147346_G_A 0,27 25,00 95 20 638 1 67 V 1 9 3
SN chr1:50195710_G_T 0,37 0,06 0,06 141,47 53 85 22 640 4 68
V SN 375, chr10:7172643_C_G 0,22 0,22 466,80 51 67 42 640 4 69 V 00 FS 460,8 3107,7 51 chr11:1758971_AC_- 0,31 2,03 79 44 640 1 70 P 0 0 7 FS 460,8 3108,9 51 chr11:1758971_AC_- 0,31 2,03 79 44 641 1 71 P 0 8 8 FS 460,8 3214,8 52 chr11:1758971_AC_- 0,31 2,03 79 44 645 1 72 P 0 2 2 FS 2289,1 50 chr6:168310205_-_T 0,27 2,65 1,34 92 48 645 1 73 P 3 5 FS 460,8 3653,3 53 chr11:1758971_AC_- 0,31 2,03 79 44 656 1 74 P 0 7 3 FS 460,8 3971,2 53 chr11:1758971_AC_- 0,31 2,03 79 44 661 1 75 P 0 0 8 FS 460,8 4165,9 54 chr11:1758971_AC_- 0,31 2,03 79 44 663 1 76 P 0 0 0 FS 3305,8 52 chr6:168310205_-_T 0,27 2,65 1,34 92 48 664 1 77 P 0 4 FS 460,8 4356,2 54 chr11:1758971_AC_- 0,31 2,03 79 44 668 1 78 P 0 5 5 FS 3463,6 52 chr6:168310205_-_T 0,27 2,65 1,34 92 48 669 1 79 P 0 9 SN 6845,7 58 chr19:15238949_C_T 0,37 11,00 5,09 58 32 670 1 80 V 6 0 FS 460,8 4759,1 55 chr11:1758971_AC_- 0,31 2,03 79 44 673 1 81 P 0 2 0 FS 460,8 4946,0 55 chr11:1758971_AC_- 0,31 2,03 79 44 677 1 82 P 0 7 4 SN 10 chr6:125081449_C_A 0,47 0,13 0,01 89,20 19 13 680 5 83 V 4
SN chr11:56642316_T_C 0,31 0,16 0,16 138,80 78 71 21 680 4 84
V FS 460,8 5336,0 55 chr11:1758971_AC_- 0,31 2,03 79 44 681 1 85 P 0 3 8 FS 460,8 6066,9 56 chr11:1758971_AC_- 0,31 2,03 79 44 690 1 86 P 0 0 7 FS 460,8 6138,9 56 chr11:1758971_AC_- 0,31 2,03 79 44 692 1 87 P 0 4 9 FS 4806,9 55 chr6:168310205_-_T 0,27 2,65 1,34 92 48 692 1 88 P 4 2
Class. NEOAG melhor IC50 corrTPM
AFREQ RFREQ REXPR
RSUM RIC50
TYPE TPM WF
ID FS 460,8 6399,4 57 chr11:1758971_AC_- 0,31 2,03 79 44 699 1 89 P 0 4 6 SN 7055,4 58 chr9:35396877_G_C 0,32 8,21 1,43 75 47 706 1 90 V 9 4 FS 460,8 7057,3 58 chr11:1758971_AC_- 0,31 2,03 79 44 708 1 91 P 0 0 5 FS 460,8 7128,5 58 chr11:1758971_AC_- 0,31 2,03 79 44 710 1 92 P 0 0 7 SN 10099, 61 chr12:100142632_C_T 0,37 2,69 2,69 56 41 714 1 93 V 80 7 SN 6183,3 57 chr9:72245167_G_T 0,27 3,02 1,03 93 50 715 1 94 V 4 2 SN 6183,3 57 chr9:72245168_A_T 0,27 3,02 1,03 93 50 715 1 95 V 4 2 FS 460,8 8182,3 59 chr11:1758971_AC_- 0,31 2,03 79 44 718 1 96 P 0 8 5 FS 460,8 8737,4 60 chr11:1758971_AC_- 0,31 2,03 79 44 723 1 97 P 0 0 0 FS 460,8 9175,6 60 chr11:1758971_AC_- 0,31 2,03 79 44 731 1 98 P 0 5 8 FS 8785,5 60 chr6:168310205_-_T 0,27 2,65 1,34 92 48 741 1 99 P 8 1 FS 460,8 10356, 61 10 chr11:1758971_AC_- 0,31 2,03 79 44 742 1 P 0 18 9 0 FS 460,8 10624, 62 10 chr11:1758971_AC_- 0,31 2,03 79 44 745 1 P 0 37 2 1 SN 10 chr9:104504822_T_C 0,38 0,08 0,08 822,70 47 81 59 748 4 V 2 FS 460,8 10920, 62 10 chr11:1758971_AC_- 0,31 2,03 79 44 750 1 P 0 75 7 3 FS 9878,8 61 10 chr6:168310205_-_T 0,27 2,65 1,34 92 48 753 1 P 0 3 4 SN 9976,9 61 10 chr2:23758023_T_A 0,30 0,64 0,64 82 57 755 1 V 4 6 5 FS 460,8 11571, 63 10 chr11:1758971_AC_- 0,31 2,03 79 44 755 1 P 0 94 2 6 FS 460,8 11865, 63 10 chr11:1758971_AC_- 0,31 2,03 79 44 762 1 P 0 32 9 7 FS 460,8 11993, 64 10 chr11:1758971_AC_- 0,31 2,03 79 44 763 1 P 0 50 0 8 FS 460,8 12302, 64 10 chr11:1758971_AC_- 0,31 2,03 79 44 767 1 P 0 10 4 9 SN 10 11 chr14:20014472_C_A 0,35 0,00 0,00 125,40 66 19 768 4 V 7 0
Class. NEOAG melhor IC50 corrTPM
AFREQ RFREQ REXPR
RSUM RIC50
TYPE TPM WF
ID SN 10 11 chr16:48139305_G_C 0,34 0,00 0,00 106,10 68 17 768 4 V 7 1 FS 10951, 62 11 chr6:168310205_-_T 0,27 2,65 1,34 92 48 768 1 P 63 8 2 FS 460,8 12791, 65 11 chr11:1758971_AC_- 0,31 2,03 79 44 773 1 P 0 00 0 3 FS 11784, 63 11 chr6:168310205_-_T 0,27 2,65 1,34 92 48 775 1 P 46 5 4 SN 11 chr5:13735855_G_A 0,30 0,11 0,11 411,75 81 74 39 776 4 V 5 FS 460,8 12923, 65 11 chr11:1758971_AC_- 0,31 2,03 79 44 776 1 P 0 30 3 6 FS 11857, 63 11 chr6:168310205_-_T 0,27 2,65 1,34 92 48 778 1 P 00 8 7 FS 460,8 13652, 66 11 chr11:1758971_AC_- 0,31 2,03 79 44 783 1 P 0 17 0 8 FS 460,8 14287, 66 11 chr11:1758971_AC_- 0,31 2,03 79 44 786 1 P 0 03 3 9 FS 12583, 64 12 chr6:168310205_-_T 0,27 2,65 1,34 92 48 786 1 P 44 6 0 FS 460,8 14296, 66 12 chr11:1758971_AC_- 0,31 2,03 79 44 787 1 P 0 31 4 1 FS 460,8 14693, 66 12 chr11:1758971_AC_- 0,31 2,03 79 44 788 1 P 0 10 5 2 SN 12 chr13:35159543_G_C 0,29 0,05 0,05 183,73 85 87 26 792 4 V 3 FS 460,8 15452, 67 12 chr11:1758971_AC_- 0,31 2,03 79 44 794 1 P 0 22 1 4 FS 460,8 15454, 67 12 chr11:1758971_AC_- 0,31 2,03 79 44 795 1 P 0 40 2 5 FS 460,8 15751, 67 12 chr11:1758971_AC_- 0,31 2,03 79 44 797 1 P 0 50 4 6 FS 460,8 15852, 67 12 chr11:1758971_AC_- 0,31 2,03 79 44 799 1 P 0 90 6 7 FS 13712, 66 12 chr6:168310205_-_T 0,27 2,65 1,34 92 48 801 1 P 13 1 8 FS 460,8 16323, 68 12 chr11:1758971_AC_- 0,31 2,03 79 44 804 1 P 0 72 1 9 FS 460,8 16590, 68 13 chr11:1758971_AC_- 0,31 2,03 79 44 807 1 P 0 60 4 0 FS 460,8 17904, 68 13 chr11:1758971_AC_- 0,31 2,03 79 44 811 1 P 0 32 8 1 FS 460,8 18021, 69 13 chr11:1758971_AC_- 0,31 2,03 79 44 813 1 P 0 12 0 2
Class. NEOAG melhor IC50 corrTPM
AFREQ RFREQ REXPR
RSUM RIC50
TYPE TPM WF
ID FS 460,8 18197, 69 13 chr11:1758971_AC_- 0,31 2,03 79 44 814 1 P 0 08 1 3 SN 16039, 10 67 13 chr20:41421411_C_G 0,21 3,16 3,16 36 815 1 V 05 1 8 4 FS 460,8 18340, 69 13 chr11:1758971_AC_- 0,31 2,03 79 44 815 1 P 0 60 2 5 SN 10 13 chrX:22273538_G_C 0,30 0,00 0,00 92,50 83 14 816 4 V 7 6 FS 460,8 19542, 69 13 chr11:1758971_AC_- 0,31 2,03 79 44 820 1 P 0 38 7 7 FS 460,8 19699, 69 13 chr11:1758971_AC_- 0,31 2,03 79 44 822 1 P 0 47 9 8 FS 460,8 20295, 70 13 chr11:1758971_AC_- 0,31 2,03 79 44 825 1 P 0 52 2 9 FS 16675, 68 14 chr6:168310205_-_T 0,27 2,65 1,34 92 48 825 1 P 60 5 0 FS 460,8 20605, 70 14 chr11:1758971_AC_- 0,31 2,03 79 44 826 1 P 0 06 3 1 FS 460,8 20630, 70 14 chr11:1758971_AC_- 0,31 2,03 79 44 828 1 P 0 27 5 2 FS 460,8 20638, 70 14 chr11:1758971_AC_- 0,31 2,03 79 44 829 1 P 0 98 6 3 FS 17925, 68 14 chr6:168310205_-_T 0,27 2,65 1,34 92 48 829 1 P 30 9 4 FS 460,8 20708, 70 14 chr11:1758971_AC_- 0,31 2,03 79 44 831 1 P 0 55 8 5 SN 14 chr2:167245082_T_G 0,37 0,03 0,03 902,70 53 91 64 832 4 V 6 FS 460,8 20766, 70 14 chr11:1758971_AC_- 0,31 2,03 79 44 832 1 P 0 88 9 7 FS 460,8 21556, 71 14 chr11:1758971_AC_- 0,31 2,03 79 44 835 1 P 0 30 2 8 FS 460,8 21623, 71 14 chr11:1758971_AC_- 0,31 2,03 79 44 836 1 P 0 54 3 9 FS 460,8 22010, 71 15 chr11:1758971_AC_- 0,31 2,03 79 44 841 1 P 0 18 8 0 FS 460,8 22110, 71 15 chr11:1758971_AC_- 0,31 2,03 79 44 842 1 P 0 20 9 1 FS 460,8 22153, 72 15 chr11:1758971_AC_- 0,31 2,03 79 44 843 1 P 0 29 0 2 FS 460,8 22354, 72 15 chr11:1758971_AC_- 0,31 2,03 79 44 844 1 P 0 83 1 3 FS 460,8 22550, 72 15 chr11:1758971_AC_- 0,31 2,03 79 44 846 1 P 0 39 3 4
Class. NEOAG melhor IC50 corrTPM
AFREQ RFREQ REXPR
RSUM RIC50
TYPE TPM WF
ID FS 460,8 23193, 72 15 chr11:1758971_AC_- 0,31 2,03 79 44 848 1 P 0 80 5 5 FS 460,8 23265, 72 15 chr11:1758971_AC_- 0,31 2,03 79 44 849 1 P 0 15 6 6 FS 460,8 23324, 72 15 chr11:1758971_AC_- 0,31 2,03 79 44 850 1 P 0 88 7 7 FS 21707, 71 15 chr6:168310205_-_T 0,27 2,65 1,34 92 48 856 1 P 50 6 8 FS 460,8 24982, 73 15 chr11:1758971_AC_- 0,31 2,03 79 44 859 1 P 0 10 6 9 FS 460,8 25114, 73 16 chr11:1758971_AC_- 0,31 2,03 79 44 861 1 P 0 40 8 0 FS 22541, 72 16 chr6:168310205_-_T 0,27 2,65 1,34 92 48 862 1 P 60 2 1 SN 16 chr20:54157259_C_T 0,30 0,09 0,09 710,20 83 79 54 864 4 V 2 SN 16 chr20:54157259_C_T 0,30 0,09 0,09 710,20 83 79 54 864 4 V 3 FS 460,8 25633, 74 16 chr11:1758971_AC_- 0,31 2,03 79 44 864 1 P 0 30 1 4 FS 460,8 25736, 74 16 chr11:1758971_AC_- 0,31 2,03 79 44 865 1 P 0 92 2 5 FS 460,8 25960, 74 16 chr11:1758971_AC_- 0,31 2,03 79 44 867 1 P 0 10 4 6 FS 23828, 72 16 chr6:168310205_-_T 0,27 2,65 1,34 92 48 869 1 P 67 9 7 FS 460,8 27215, 74 16 chr11:1758971_AC_- 0,31 2,03 79 44 871 1 P 0 57 8 8 SN 10 16 chr11:26721564_C_G 0,33 0,01 0,01 493,20 69 46 872 4 V 3 9 FS 460,8 27397, 75 17 chr11:1758971_AC_- 0,31 2,03 79 44 873 1 P 0 60 0 0 FS 460,8 28238, 75 17 chr11:1758971_AC_- 0,31 2,03 79 44 875 1 P 0 14 2 1 FS 10 17 chr3:32818692_G_- 0,23 0,02 0,02 150,50 96 23 876 4 P 0 2 FS 460,8 28447, 75 17 chr11:1758971_AC_- 0,31 2,03 79 44 877 1 P 0 59 4 3 FS 460,8 29421, 75 17 chr11:1758971_AC_- 0,31 2,03 79 44 879 1 P 0 77 6 4 FS 460,8 29826, 75 17 chr11:1758971_AC_- 0,31 2,03 79 44 880 1 P 0 27 7 5 FS 460,8 31274, 76 17 chr11:1758971_AC_- 0,31 2,03 79 44 884 1 P 0 12 1 6
Class. NEOAG melhor IC50 corrTPM
AFREQ RFREQ REXPR
RSUM RIC50
TYPE TPM WF
ID FS 460,8 31497, 76 17 chr11:1758971_AC_- 0,31 2,03 79 44 888 1 P 0 22 5 7 FS 460,8 32523, 76 17 chr11:1758971_AC_- 0,31 2,03 79 44 889 1 P 0 71 6 8 FS 460,8 33278, 77 17 chr11:1758971_AC_- 0,31 2,03 79 44 893 1 P 0 00 0 9 FS 460,8 33437, 77 18 chr11:1758971_AC_- 0,31 2,03 79 44 894 1 P 0 17 1 0 FS 460,8 34250, 77 18 chr11:1758971_AC_- 0,31 2,03 79 44 895 1 P 0 42 2 1 FS 460,8 34429, 77 18 chr11:1758971_AC_- 0,31 2,03 79 44 896 1 P 0 49 3 2 FS 460,8 38230, 77 18 chr11:1758971_AC_- 0,31 2,03 79 44 899 1 P 0 68 6 3 FS 31468, 76 18 chr6:168310205_-_T 0,27 2,65 1,34 92 48 904 1 P 96 4 4 SN 10 18 chr3:77596673_A_T 0,23 0,01 0,01 203,50 99 28 908 4 V 0 5 FS 10 18 chr3:32818692_G_- 0,23 0,02 0,02 270,50 96 33 916 4 P 0 6 FS 10 18 chr3:32818692_G_- 0,23 0,02 0,02 479,90 96 43 956 4 P 0 7 FS 10 18 chr3:32818692_G_- 0,23 0,02 0,02 505,00 96 48 976 4 P 0 8 FS 10 18 chr3:32818692_G_- 0,23 0,02 0,02 661,08 96 50 984 4 P 0 9 FS 10 100 19 chr3:32818692_G_- 0,23 0,02 0,02 714,80 96 55 4 P 0 4 0 SN 10 103 19 chr5:140842565_G_A 0,27 0,01 0,01 884,93 94 63 4 V 1 2 1 FS 10 103 19 chr3:32818692_G_- 0,23 0,02 0,02 877,84 96 62 4 P 0 2 2 FS 10 105 19 chr3:32818692_G_- 0,23 0,02 0,02 949,20 96 68 4 P 0 6 3 SN 1734,7 48 113 19 chr1:228340587_G_T 0,46 0,56 0,56 20 59 2 V 0 6 0 4 SN 2190,3 50 115 19 chr18:56691285_G_T 0,54 0,61 0,61 15 58 2 V 0 2 0 5 SN 1552,8 47 116 19 chrX:50598303_G_T 0,36 1,99 1,99 59 45 2 V 0 8 4 6 SN 1340,5 47 119 19 chr7:6551366_G_C 0,35 0,50 0,50 64 60 2 V 0 5 8 7 SN 2031,4 49 120 19 chr12:89610020_C_T 0,35 2,77 2,77 67 40 2 V 0 6 6 8
Class. NEOAG melhor IC50 corrTPM
AFREQ RFREQ REXPR
RSUM RIC50
TYPE TPM WF
ID SN 10 123 19 chr6:107707925_A_G 0,28 0,04 0,00 662,40 89 51 5 V 6 0 9 chr16:3757295_GATAGCTGTAGTAGGC FS 1628,9 10 48 123 20 0,13 4,88 4,88 33 2 AGCATC_- P 0 2 1 2 0 SN 3122,4 51 128 20 chrX:18258064_C_T 0,35 0,76 0,76 66 55 2 V 3 9 0 1 chr16:3757295_GATAGCTGTAGTAGGC FS 2896,9 10 51 129 20 0,13 4,88 4,88 33 2 AGCATC_- P 0 2 4 8 2 SN 9946,4 61 131 20 chr19:48735476_G_T 0,74 2,60 2,60 2 42 2 V 4 4 6 3 SN 4704,3 54 135 20 chrX:152936478_C_G 0,27 2,82 2,82 92 38 2 V 9 8 6 4 chr16:3757295_GATAGCTGTAGTAGGC FS 4689,6 10 54 136 20 0,13 4,88 4,88 33 2 AGCATC_- P 0 2 7 4 5 chr16:3757295_GATAGCTGTAGTAGGC FS 5611,1 10 55 138 20 0,13 4,88 4,88 33 2 AGCATC_- P 2 2 9 8 6 chr16:3757295_GATAGCTGTAGTAGGC FS 8166,4 10 59 145 20 0,13 4,88 4,88 33 2 AGCATC_- P 6 2 4 8 7 chr16:3757295_GATAGCTGTAGTAGGC FS 8978,4 10 60 148 20 0,13 4,88 4,88 33 2 AGCATC_- P 5 2 6 2 8 chr16:3757295_GATAGCTGTAGTAGGC FS 11787, 10 63 154 20 0,13 4,88 4,88 33 2 AGCATC_- P 80 2 6 2 9 chr16:3757295_GATAGCTGTAGTAGGC FS 12052, 10 64 155 21 0,13 4,88 4,88 33 2 AGCATC_- P 00 2 2 4 0 chr16:3757295_GATAGCTGTAGTAGGC FS 12434, 10 64 156 21 0,13 4,88 4,88 33 2 AGCATC_- P 20 2 5 0 1 chr16:3757295_GATAGCTGTAGTAGGC FS 20628, 10 70 167 21 0,13 4,88 4,88 33 2 AGCATC_- P 70 2 4 8 2 chr16:3757295_GATAGCTGTAGTAGGC FS 20993, 10 71 169 21 0,13 4,88 4,88 33 2 AGCATC_- P 02 2 0 0 3 chr16:3757295_GATAGCTGTAGTAGGC FS 21762, 10 71 170 21 0,13 4,88 4,88 33 2 AGCATC_- P 73 2 7 4 4 chr16:3757295_GATAGCTGTAGTAGGC FS 24607, 10 73 173 21 0,13 4,88 4,88 33 2 AGCATC_- P 60 2 1 2 5 chr16:3757295_GATAGCTGTAGTAGGC FS 24793, 10 73 173 21 0,13 4,88 4,88 33 2 AGCATC_- P 40 2 4 8 6 chr16:3757295_GATAGCTGTAGTAGGC FS 26390, 10 74 176 21 0,13 4,88 4,88 33 2 AGCATC_- P 85 2 5 0 7 chr16:3757295_GATAGCTGTAGTAGGC FS 27260, 10 74 176 21 0,13 4,88 4,88 33 2 AGCATC_- P 40 2 9 8 8 chr16:3757295_GATAGCTGTAGTAGGC FS 27813, 10 75 177 21 0,13 4,88 4,88 33 2 AGCATC_- P 60 2 1 2 9 SN 1732,9 48 192 22 chr12:6817323_C_A 0,29 6,71 0,13 84 73 3 V 8 5 6 0
Class. NEOAG melhor IC50 corrTPM
AFREQ RFREQ REXPR
RSUM RIC50
TYPE TPM WF
ID SN 3074,0 51 192 22 chr8:8377042_G_A 0,37 4,62 0,11 52 75 3 V 0 6 9 1 SN 5164,0 55 195 22 chr3:13614024_C_T 0,43 6,35 0,20 26 69 3 V 0 6 3 2 SN 6187,5 57 203 22 chrX:136044485_C_T 0,40 3,38 0,31 41 65 3 V 5 3 7 3 SN 2317,8 50 233 22 chr19:37565848_G_C 0,67 0,20 0,20 8 70 4 V 9 6 6 4 SN 1287,3 47 237 22 chr14:79861690_G_A 0,42 0,04 0,04 32 90 4 V 0 2 6 5 SN 1287,3 47 237 22 chr14:79861690_G_A 0,42 0,04 0,04 32 90 4 V 0 2 6 6 SN 1287,3 47 237 22 chr14:79861690_G_A 0,42 0,04 0,04 32 90 4 V 0 2 6 7 SN 2413,5 50 238 22 chr17:44778052_C_T 0,64 0,09 0,09 10 78 4 V 8 9 8 8 SN 1259,6 10 47 240 22 chrX:152766846_A_G 0,44 0,00 0,00 23 4 V 0 7 1 4 9 SN 2378,1 50 251 23 chr2:1267461_G_A 0,40 0,07 0,07 38 84 4 V 0 7 6 0 SN 2009,5 10 49 252 23 chr16:76467454_T_G 0,42 0,00 0,00 30 4 V 0 7 4 4 1 SN 1111,5 46 252 23 chr20:35434630_T_C 0,32 0,03 0,03 74 94 4 V 3 4 8 2 SN 1325,9 10 47 254 23 chr1:152314593_C_G 0,37 0,00 0,00 55 4 V 1 7 4 4 3 SN 1227,9 10 47 254 23 chr5:157343307_C_G 0,36 0,00 0,00 60 4 V 8 7 0 8 4 SN 1857,3 10 49 255 23 chr5:153811068_G_A 0,40 0,00 0,00 42 4 V 6 7 0 6 5 SN 2013,5 49 255 23 chr10:105255724_C_G 0,38 0,02 0,02 49 95 4 V 8 5 6 6 SN 1793,8 10 48 261 23 chr7:134568320_A_T 0,36 0,00 0,00 60 4 V 0 7 7 6 7 SN 4334,6 54 262 23 chr6:159804633_C_T 0,39 0,21 0,21 43 68 4 V 2 4 0 8 SN 2276,4 10 50 262 23 chrX:34131242_C_T 0,39 0,00 0,00 44 4 V 5 7 4 0 9 FS 1058,5 10 46 263 24 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 2 2 0 FS 1087,9 10 46 263 24 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 3 6 1 SN 4779,7 55 265 24 chr4:176168671_G_A 0,57 0,02 0,02 14 98 4 V 0 1 2 2
Class. NEOAG melhor IC50 corrTPM
AFREQ RFREQ REXPR
RSUM RIC50
TYPE TPM WF
ID SN 1898,1 49 266 24 chr2:184936876_A_G 0,30 0,03 0,03 80 93 4 V 5 2 0 3 SN 3345,7 10 52 266 24 chrX:105220039_G_A 0,41 0,00 0,00 35 4 V 6 7 5 8 4 FS 1290,9 10 47 267 24 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 3 6 5 SN 6137,6 56 268 24 chr17:80090197_A_G 0,40 0,40 0,40 39 63 4 V 8 8 0 6 FS 1405,5 10 47 269 24 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 7 2 7 FS 1717,7 10 48 272 24 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 5 0 4 0 8 FS 1815,4 10 48 273 24 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 8 6 9 FS 1849,5 10 48 274 25 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 9 0 0 FS 1870,2 10 49 274 25 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 2 0 1 8 1 SN 6377,6 57 276 25 chrX:151180935_T_A 0,43 0,04 0,04 29 88 4 V 7 5 8 2 FS 2034,3 10 49 277 25 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 7 2 3 FS 2096,0 10 49 278 25 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 9 0 9 0 4 FS 2202,4 10 50 279 25 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 3 6 5 FS 2769,9 10 51 282 25 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 4 0 1 8 6 FS 2800,7 10 51 283 25 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 1 0 2 2 7 FS 2973,2 10 51 284 25 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 4 0 5 4 8 FS 3183,1 10 52 286 25 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 1 0 0 4 9 SN 6187,8 57 288 26 chr2:206177163_C_G 0,36 0,06 0,06 60 86 4 V 2 4 0 0 SN 12623, 64 288 26 chr19:31279054_C_T 0,64 0,32 0,32 10 64 4 V 68 7 4 1 FS 3454,0 10 52 289 26 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 2 0 8 6 2 SN 5983,3 10 56 290 26 chr3:87264320_G_C 0,37 0,00 0,00 53 4 V 0 7 6 4 3 FS 3477,0 10 53 290 26 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 0 4 4
Class. NEOAG melhor IC50 corrTPM
AFREQ RFREQ REXPR
RSUM RIC50
TYPE TPM WF
ID SN 8898,9 10 60 291 26 chr18:32677240_C_G 0,49 0,00 0,00 18 4 V 5 7 3 2 5 FS 3686,0 10 53 292 26 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 4 0 4 0 6 FS 3708,9 10 53 292 26 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 7 0 5 4 7 FS 3775,4 10 53 292 26 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 5 0 6 8 8 FS 3822,9 10 53 293 26 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 7 2 9 FS 4006,6 10 53 294 27 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 9 0 0 FS 4278,4 10 54 294 27 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 7 0 1 8 1 FS 4312,3 10 54 295 27 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 3 6 2 SN 12000, 64 296 27 chr17:35746314_G_A 0,63 0,04 0,04 11 89 4 V 37 1 4 3 SN 5031,7 55 296 27 chr10:25221118_G_C 0,28 0,02 0,02 90 97 4 V 3 5 8 4 FS 4492,5 10 54 296 27 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 6 8 5 SN 1613,4 10 47 299 27 chr9:17342330_A_C 0,52 0,06 0,01 16 5 V 0 4 9 5 6 FS 5285,9 10 55 301 27 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 7 2 7 FS 5612,0 10 56 302 27 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 9 0 0 4 8 FS 5630,2 10 56 302 27 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 8 0 1 8 9 FS 5659,8 10 56 303 28 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 2 2 0 FS 5689,9 10 56 303 28 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 3 6 1 FS 5930,9 10 56 304 28 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 5 4 2 SN 5746,6 10 56 304 28 chr20:49373631_G_C 0,28 0,00 0,00 91 4 V 0 7 4 8 3 FS 6139,4 10 57 306 28 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 1 0 0 4 4 FS 6160,5 10 57 306 28 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 1 8 5 FS 6454,3 10 57 309 28 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 7 2 6
Class. NEOAG melhor IC50 corrTPM
AFREQ RFREQ REXPR
RSUM RIC50
TYPE TPM WF
ID FS 6638,5 10 57 309 28 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 3 0 8 6 7 FS 6804,1 10 57 310 28 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 1 0 9 0 8 FS 6848,8 10 58 310 28 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 1 8 9 FS 7034,1 10 58 311 29 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 2 2 0 FS 7048,2 10 58 311 29 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 4 0 3 6 1 FS 7114,7 10 58 312 29 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 6 8 2 SN 7601,3 10 58 313 29 chr6:26506794_A_G 0,29 0,00 0,00 87 4 V 1 7 9 2 3 FS 7381,5 10 58 313 29 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 8 6 4 FS 7750,6 10 59 314 29 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 4 0 0 4 5 FS 7925,4 10 59 314 29 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 1 8 6 FS 7949,1 10 59 315 29 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 2 0 2 2 7 FS 8085,7 10 59 315 29 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 4 0 3 6 8 SN 10648, 10 62 316 29 chr1:237004287_C_G 0,36 0,00 0,00 61 4 V 42 7 3 4 9 FS 8191,5 10 59 316 30 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 8 0 6 8 0 SN 1019,1 10 46 317 30 chr2:109449244_T_C 0,33 0,25 0,01 72 5 V 0 2 0 0 1 FS 8271,9 10 59 317 30 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 3 0 7 2 2 FS 8567,0 10 59 317 30 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 5 0 8 6 3 FS 8612,1 10 59 318 30 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 9 0 4 FS 8877,8 10 60 319 30 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 9 0 2 2 5 FS 8963,6 10 60 320 30 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 9 0 4 0 6 FS 8974,3 10 60 320 30 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 7 0 5 4 7 FS 9105,7 10 60 321 30 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 7 2 8
Class. NEOAG melhor IC50 corrTPM
AFREQ RFREQ REXPR
RSUM RIC50
TYPE TPM WF
ID FS 9348,3 10 60 322 30 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 9 0 9 FS 9448,6 10 61 322 31 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 0 4 0 FS 9647,5 10 61 322 31 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 4 0 1 8 1 FS 9671,3 10 61 323 31 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 0 0 2 2 2 FS 9950,6 10 61 324 31 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 3 0 5 4 3 FS 10203, 10 61 325 31 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 10 0 8 6 4 FS 10520, 10 62 326 31 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 50 0 0 4 5 FS 10583, 10 62 326 31 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 18 0 1 8 6 SN 19366, 69 327 31 chr2:178590588_T_G 0,38 0,11 0,11 46 76 4 V 19 6 2 7 FS 10665, 10 62 328 31 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 70 0 4 0 8 FS 10733, 10 62 328 31 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 44 0 5 4 9 FS 10905, 10 62 328 32 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 52 0 6 8 0 FS 11377, 10 62 330 32 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 89 0 9 0 1 FS 11520, 10 63 330 32 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 50 0 0 4 2 FS 11539, 10 63 330 32 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 68 0 1 8 3 SN 1205,5 10 46 331 32 chr19:53141032_C_A 0,23 0,33 0,03 94 5 V 0 0 9 5 4 FS 11753, 10 63 331 32 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 52 0 3 6 5 FS 11765, 10 63 332 32 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 10 0 4 0 6 FS 11842, 10 63 333 32 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 62 0 7 2 7 FS 12102, 10 64 335 32 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 86 0 3 6 8 SN 3199,8 10 52 336 32 chr12:40364940_T_A 0,38 0,06 0,01 47 5 V 0 5 1 5 9 FS 12656, 10 64 337 33 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 64 0 8 6 0
Class. NEOAG melhor IC50 corrTPM
AFREQ RFREQ REXPR
RSUM RIC50
TYPE TPM WF
ID FS 12691, 10 64 338 33 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 33 0 9 0 1 FS 12828, 10 65 338 33 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 00 0 1 8 2 FS 12851, 10 65 339 33 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 35 0 2 2 3 FS 12946, 10 65 340 33 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 10 0 4 0 4 FS 12961, 10 65 340 33 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 52 0 5 4 5 FS 13342, 10 65 340 33 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 29 0 6 8 6 FS 13355, 10 65 341 33 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 58 0 7 2 7 FS 13399, 10 65 341 33 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 40 0 8 6 8 FS 13632, 10 65 342 33 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 20 0 9 0 9 SN 2142,3 50 343 34 chr2:40429308_C_G 0,29 0,18 0,02 86 99 5 V 9 1 0 0 FS 14044, 10 66 343 34 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 57 0 2 2 1 FS 14772, 10 66 344 34 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 61 0 6 8 2 FS 15038, 10 66 345 34 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 22 0 7 2 3 FS 15092, 10 66 345 34 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 20 0 8 6 4 FS 15276, 10 66 346 34 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 50 0 9 0 5 FS 15414, 10 67 346 34 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 60 0 0 4 6 FS 15700, 10 67 347 34 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 12 0 3 6 7 FS 15851, 10 67 348 34 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 40 0 5 4 8 FS 15910, 10 67 349 34 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 46 0 7 2 9 FS 16085, 10 67 350 35 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 80 0 9 0 0 FS 16257, 10 68 350 35 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 45 0 0 4 1 FS 16325, 10 68 351 35 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 14 0 2 2 2
Class. NEOAG melhor IC50 corrTPM
AFREQ RFREQ REXPR
RSUM RIC50
TYPE TPM WF
ID FS 16570, 10 68 351 35 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 20 0 3 6 3 FS 17462, 10 68 352 35 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 94 0 6 8 4 FS 17746, 10 68 353 35 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 36 0 7 2 5 FS 28309, 10 75 354 35 chr4:41626984_A_- 0,43 0,00 0,00 25 4 P 42 7 3 0 6 FS 18668, 10 69 355 35 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 33 0 3 6 7 FS 18966, 10 69 356 35 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 40 0 4 0 8 FS 18997, 10 69 356 35 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 40 0 5 4 9 FS 19654, 10 69 357 36 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 12 0 8 6 0 FS 19765, 10 70 358 36 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 22 0 0 4 1 FS 20186, 10 70 358 36 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 50 0 1 8 2 FS 20672, 10 70 361 36 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 50 0 7 2 3 FS 21269, 10 71 362 36 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 90 0 1 8 4 FS 21631, 10 71 364 36 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 73 0 4 0 5 FS 21665, 10 71 364 36 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 22 0 5 4 6 FS 22959, 10 72 368 36 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 31 0 4 0 7 FS 23755, 10 72 369 36 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 06 0 8 6 8 FS 23864, 10 73 370 36 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 03 0 0 4 9 FS 24620, 10 73 371 37 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 96 0 2 2 0 FS 24726, 10 73 371 37 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 14 0 3 6 1 FS 24803, 10 73 372 37 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 80 0 5 4 2 FS 25104, 10 73 373 37 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 30 0 7 2 3 FS 25420, 10 73 374 37 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 90 0 9 0 4
Class. NEOAG melhor IC50 corrTPM
AFREQ RFREQ REXPR
RSUM RIC50
TYPE TPM WF
ID FS 25464, 10 74 374 37 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 08 0 0 4 5 FS 25831, 10 74 375 37 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 50 0 3 6 6 FS 26890, 10 74 376 37 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 66 0 6 8 7 FS 26967, 10 74 377 37 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 88 0 7 2 8 FS 28923, 10 75 380 37 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 39 0 5 4 9 FS 29869, 10 75 381 38 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 22 0 8 6 0 FS 30437, 10 75 382 38 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 50 0 9 0 1 FS 30767, 10 76 382 38 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 65 0 0 4 2 FS 31304, 10 76 383 38 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 90 0 2 2 3 FS 31310, 10 76 383 38 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 69 0 3 6 4 FS 32580, 10 76 385 38 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 77 0 7 2 5 FS 32618, 10 76 385 38 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 86 0 8 6 6 FS 33215, 10 76 386 38 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 41 0 9 0 7 FS 35308, 10 77 388 38 chr3:32818692_G_- 0,23 0,02 0,02 96 4 P 13 0 5 4 8 EXEMPLO 3
VALIDAÇÃO DO MÉTODO DE PRIORIZAÇÃO
[178] A fim de validar o método de priorização, foram analisados conjuntos de dados com um total de 30 neoantígenos imunogênicos experimentalmente validados com reatividade para células T CD8 + (Tabela 7).
Os conjuntos de dados compreendem biópsias de 13 pacientes com câncer em 5 tipos diferentes de tumor para os quais dados NGS brutos (NGS-DNA exoma normal / tumoral e transcriptoma NGS-RNA tumoral) estão disponíveis.
[179] Os dados NGS foram baixados do site NCBI SRA e processados com a mesma conduta de processamento NGS aplicado no Exemplo 1. As mutações para 28 dos 30 neoantígenos validados experimentalmente relatados foram identificados aplicando a conduta de processamento NGS divulgada no Exemplo 2 (duas mutações não foram detectadas devido o baixo número de leituras mutadas). Para cada amostra de paciente, a lista total de todos os neoantígenos identificados foi então classificada de acordo com o método descrito na Etapa 3 do Exemplo 1, assumindo um tamanho de polipeptídeo máximo alvo (polineoantígeno) de
1.500 aminoácidos.
[180] A Tabela 8 mostra os valores de IC50 do MHC classe I previstos para os 28 neoantígenos, apenas para predição de epítopo de 9mers ou para predições de incluindo epítopos de 8 até 11 aminoácidos. Em ambos os casos, vários neoantígenos estão presentes quando os melhores valores de IC50 (mais baixos) estão bem acima (mais altos) do que o valor limite de 500 nM frequentemente aplicado no estado da técnica para a seleção de candidatos a vacinas de neoantígenos e, consequentemente, teriam sido excluídos da vacina personalizada.
[181] A Figura 7 A mostra a classificação RSUM obtida pelo método de priorização para os 28 neoantígenos experimentalmente validados detectados. Uma linha tracejada (Figura 5A) indica o número máximo de neoantígenos de 25mers (60) que podem ser acomodados em um vetor de vacina de adenovírus personalizado com uma capacidade de inserção (com exceção dos elementos de controle da expressão) de cerca de 1.500 aminoácidos.
[182] 27 dos 30 neoantígenos validados experimentalmente (90%) estão presentes nos 60 principais neoantígenos e, portanto, teriam sido incluídos no vetor de vacina personalizado. A priorização foi então repetida assumindo que nenhum dado de expressão de NGS-RNA do tumor do paciente estava disponível. O valor de expressão corrTPM para cada neoantígeno foi estimado como o valor TPM mediano do gene correspondente nos dados de expressão TCGA para esse tipo de tumor específico [acesso NCBI GEO: GSE62944]. A Figura 7 B mostra também que neste caso uma grande porção (25 de 30 = 83%) de neoantígenos validados experimentalmente teria sido incluída no vetor de vacina. É importante ressaltar que para cada um dos conjuntos de dados examinados, havia pelo menos um neoantígeno validado que teria sido incluído no vetor de vacina personalizado.
Detalhes adicionais, incluindo os resultados de classificação RSUM com e sem dados NGS-RNA para os 28 neoantígenos validados, estão listados na Tabela
7.
[183] Ambos os resultados, portanto, confirmaram que o método de priorização é capaz de selecionar, na presença, mas também na ausência de dados de transcriptoma do tumor do paciente, uma lista de neoantígenos que inclui os neoantígenos mais relevantes, ou seja, aqueles neoantígenos com imunogenicidade experimentalmente verificada que deveriam ser incluído em um vetor de vacina personalizado.
TABELA 7
LISTA DE CONJUNTOS DE DADOS DA LITERATURA E NEOANTÍGENOS USADOS COMO REFERÊNCIA.
[184] Para cada conjunto de dados, são listados neoantígenos com reatividade de células T experimentalmente validada. O aminoácido mutado está indicado em negrito e sublinhado. Para mutações que geram dois neoantígenos distintos devido à presença de duas isoformas de splicing alternativo, apenas o neoantígeno com a classificação RSUM mais baixa é relatado (indicado com um *). As coordenadas genômicas fornecidas são em relação à montagem do genoma humano GRch38/hg38.
Seq. do NeoAg (com RNASeq) (sem RNASeq) ID do paciente ID da mutação Tipo de tumor Class. RSUM Class. RSUM ID do estudo
SEQ ID NO
PUBMED chrX: Melanom 2690140 DSLQLVFGIELMKVDPIGHVYIFA Pat3998 152767149_C_ 1 2 80 a 7 T
T chr4: Melanom 2690140 SLLPEFVVPYMIYLLAHDPDFTRS Pat3998 39862286_G_ 3* 4* 81 a 7 Q
A chr17: Melanom 2690140 PHIKSTVSVQIISCQYLLQPVKHE Pat3998 61961773_G_ 13 23 82 a 7 D
A chrX: Melanom 2690140 VVISQSEIGDASCVRVSGQGLHE Pat3784 154353082_G 5 4 83 a 7 GH _A chr21: Melanom 2690140 RKTVRARSRTPSCRSRSHTPSR Pat3784 33555010_C_ 36 53 84 a 7 RRR
T chr20: Melanom 2690140 REKQQREALERAPARLERRHSAL Pat3784 16378976_A_ 112 247 85 a 7 QR
G chr10: Melanom 2690140 TLKRQLEHNAYHSIEWAINAATL Pat3903 69005862_C_ 8 6 86 a 7 SQ
T CTE001 chr11: VTVRVADINDHALAFPQARAALQ Ovariano 2954554 16 6 87 0 6641192_G_A VP CTE001 chr6: LRPRRVGIALDYDWGTVTFTNAE Ovariano 2954554 31 41 88 0 30186008_T_A SQ chr17: CTE001 GYVGIDSILEQMHRKAMKQGFEF Ovariano 2954554 77482288_G_ 18 1 89 1 NI
A chr1: CTE001 Ovariano 2954554 13614365_G_ 40 5 90 IIVGVLLAIGFICAIIVVVMRKMSG 2
T chr11: CTE001 PREGSGGSTSDYLSQSYSYSSIL Ovariano 2954554 11892058_G_ 2 1 91 4 NK
C chr4: CTE001 RRAGGAQSWLWFVTVKSLIGKG Ovariano 2954554 182799720_C_ 3 14 92 9 VML
T chr2: 2651620 QSISRNHVVDISKSGLITIAGGKW Retal Pat3942 156568935_G 19 27 93 0 T _A 2651620 chr11: TGLFGQTNTGFGD Retal Pat3942 21 34 94 0 3762912_G_T VGSTLFGNNKLT chr16: 2651620 YEIGRQFRNEGIHLTHNPEFTTCE Retal Pat3942 75631789_C_ 54 83 95 0 F
G
Seq. do NeoAg (com RNASeq) (sem RNASeq) ID do paciente ID da mutação Tipo de tumor Class. RSUM Class. RSUM ID do estudo
SEQ ID NO
PUBMED chr6: 2651620 PILKEIVEMLFSHGLVKVLFATET Cólon Pat4007 31964329_G_ 3 2 96 0 F
A chr17: 2651620 VKKPHRYRPGTVTLREIRRYQKS Cólon Pat4007 75778950_C_ 6 10 97 0 TE
T Chr17: 2651620 FVTQKRMEHFYLSFYTAEQLVYL Cólon Pat3995 80339472_A_ 13 7 98 0 ST
G chr10: 2651620 Cólon Pat3995 133293592_G 20 11 99 DLSIRELVHRILLVAASYSAVTRFI 0 _A 2651620 chr12: 10 Cólon Pat3995 28 52 MTEYKLVVVGADGVGKSALTIQLI 0 25245350_C/T 0 2651620 chr11: 10 DPDCVDRLLQCTQQAVPLFSKNV Cólon Pat4032 2 2 0 43323614_G/A 1 HS 2651620 chr18: 10 VNRWTRRQVILCETCLIVSSVKDS Cólon Pat4032 4 9 0 62830155_G/A 2 L chr12: 2651620 10 RHRYLSHLPLTCKFSICELALQPP Cólon Pat4032 120565120_G/ 16 26 0 3 V
A 2986722 chr11: 10 LLASSDPPALASTNAEVTGTMSQ Mama Pat4136 40* 41* 7 62871652_A/C 4 DT chr7: 2986722 10 TLNSKTYDTVHRHLTVEEATASV Mama Pat4136 122320259_C/ 41 44 7 5 SE
T chr8: 2986722 10 GYNSYSVSNSEKHIMAEIYKNGP Mama Pta4136 11847133_C_ 47 50 7 6 VE
G chr9: 2986722 10 MPYGYVLNEFQSCQNSSSAQGS Mama Pta4136 111437083_G 53 74 7 7 SSN _A TABELA 8 VALORES DE IC50 DE MHC CLASSE I PREDITOS (NM) PARA OS 28 NEOANTÍGENOS.
[185] As coordenadas genômicas fornecidas são em relação à montagem do genoma humano GRch38/hg38.
ID do paciente ID da mutação Neoantígeno 8-11mer(nM) melhor IC50 melhor IC50
SEQ ID NO pontuação pontuação Alelo MHC 9mer(nM) 8-11mer classe I melhor melhor 9mer Pat399 chrX: DSLQLVFGIELMKVDPIGHV HLA- 80 0,3 52,24 0,3 52,24 8 152767149_C_T YIFAT A*30:02 Pat399 chr4: SLLPEFVVPYMIYLLAHDPD HLA- 81 2,4 3,92 2,4 3,92 8 39862286_G_A FTRSQ C*03:03 Pat399 chr17: PHIKSTVSVQIISCQYLLQPV HLA- 0,3 0,3 82 39,15 39,15 8 61961773_G_A KHED A*30:02 5 5 Pat378 chrX: VVISQSEIGDASCVRVSGQG HLA- 741,5 741,5 83 2 2 4 154353082_G_A LHEGH B*07:02 9 9 Pat378 chr21: RKTVRARSRTPSCRSRSHT HLA- 468,7 468,7 84 0,5 0,5 4 33555010_C_T PSRRRR B*07:02 2 2 Pat378 chr20: REKQQREALERAPARLERR HLA- 4030, 0,8 156,7 85 2,3 4 16378976_A_G HSALQR B*07:02 25 5 8 Pat390 chr10: TLKRQLEHNAYHSIEWAINA HLA- 0,5 180,5 0,5 180,5 86 3 69005862_C_T ATLSQ A*24:02 5 2 5 2 CTE00 chr11: VTVRVADINDHALAFPQARA HLA- 33, 33, 87 16,81 16,81 10 6641192_G_A ALQVP C*03:03 1 1 CTE00 chr6: RPRRVGIALDYDWGTVTFTN HLA- 154,5 1,1 88 2,3 92,02 10 30186007_C_A AESQE A*02:01 6 5 CTE00 chr17: GYVGIDSILEQMHRKAMKQ HLA- 0,3 0,3 89 20,44 20,44 11 77482288_G_A GFEFNI A*11:01 5 5 CTE00 chr1: IIVGVLLAIGFICAIIVVVMRK HLA- 90 0,6 32,33 0,6 32,33 12 13614365_G_T MSG A*02:01 CTE00 chr11: PREGSGGSTSDYLSQSYSY HLA- 0,1 0,1 91 4,13 4,13 14 11892058_G_C SSILNK A*01:01 5 5 CTE00 chr4: RRAGGAQSWLWFVTVKSLI HLA- 2,5 2,5 92 5,66 5,66 19 182799720_C_T GKGVML A*02:11 5 5 Pat394 chr2: QSISRNHVVDISKSGLITIAG HLA- 93 7,2 930,4 7,2 930,4 2 156568935_G_A GKWT C*16:01 Pat394 chr11: TGLFGQTNTGFGDVGSTLF HLA- 94 2,2 184,1 2,2 184,1 2 3762912_G_T GNNKLT C*16:01 Pat394 chr16: YEIGRQFRNEGIHLTHNPEF HLA- 4,5 4282, 2679, 95 10 2 75631789_C_G TTCEF A*29:02 5 32 82 Pat400 chr6: PILKEIVEMLFSHGLVKVLFA HLA- 96 0,1 6,25 0,1 6,25 7 31964329_G_A TETF A*03:01 Pat400 chr17: VKKPHRYRPGTVTLREIRRY HLA- 97 0,2 31 0,2 31 7 75778950_C_T QKSTE C*07:02 Pat399 chr17: FVTQKRMEHFYLSFYTAEQL HLA- 0,1 0,1 98 5,49 5,49 5 80339472_A_G VYLST B*18:01 5 5 Pat399 chr10:133293592 DLSIRELVHRILLVAASYSAV HLA- 106,5 106,5 99 1,3 1,3 5 _G_A TRFI A*32:01 6 6 Pat399 chr12: MTEYKLVVVGADGVGKSAL 10 HLA- 1,2 4671, 1,2 4671, 5 25245350_C_T TIQLI 0 C*05:01 5 02 5 02 Pat403 chr11:43323614_ DPDCVDRLLQCTQQAVPLF 10 HLA- 1,1 26,4 1,1 26,4 2 G_A SKNVHS 1 A*02:13
ID do paciente ID da mutação Neoantígeno 8-11mer(nM) melhor IC50 melhor IC50
SEQ ID NO pontuação pontuação Alelo MHC 9mer(nM) 8-11mer classe I melhor melhor 9mer Pat403 chr18: VNRWTRRQVILCETCLIVSS 10 HLA- 2,3 120,9 2,3 120,9 2 62830155_G_A VKDSL 2 A*02:13 Pat403 chr12: RHRYLSHLPLTCKFSICELA 10 HLA- 1,1 339,3 3,5 190,4 2 120565120_G_A LQPPV 3 A*03:01 5 4 Pat413 chr11: LLASSDPPALASTNAEVTGT 10 HLA- 1066, 1066, 4,4 4,4 6 62871652_A_C MSQDT 4 B*35:01 8 8 Pat413 chr7: TLNSKTYDTVHRHLTVEEAT 10 HLA- 1,7 1314, 2,1 560,5 6 122320259_C_T ASVSE 5 B*57:01 5 73 Pat413 chr8: GYNSYSVSNSEKHIMAEIYK 10 HLA- 2822, 2822, 2,5 2,5 6 11847133_C_G NGPVE 6 B*57:01 89 89 Pat413 chr9: MPYGYVLNEFQSCQNSSSA 10 HLA- 9289, 9289, 19 19 6 111437083_G_A QGSSSN 7 B*35:01 43 43 EXEMPLO 4
OTIMIZAÇÃO DA DISPOSIÇÃO DE NEOANTÍGENO PARA GENES SINTÉTICOS QUE CODIFICAM NEOANTÍGENOS A SEREM ADMINISTRADOS POR UM VETOR DE VACINA GENÉTICA.
[186] Um polineoantígeno contendo 60 neoantígenos resultará em uma proteína artificial com um comprimento total de cerca de 1.500 aminoácidos que precisam ser codificados por um cassete de expressão inserido em um vetor de vacina genética. A expressão de tais proteínas artificiais longas pode ser subótima, afetando assim o nível de imunogenicidade induzida contra os neoantígenos codificados. Dividir o polineoantígeno em duas partes, portanto, poderia ajudar a obter níveis mais elevados de imunogenicidade induzida.
[187] Um polineoantígeno composto por 62 neoantígenos (Tabela 9) derivados da linhagem celular tumoral murina CT26 foi, portanto, testado, usando o vetor adenoviral GAd20, em diferentes layouts (Figura 8A e 8B) quanto à sua capacidade de induzir imungenicidade in vivo: em um único layout de vetor com todos os 62 neoantígenos codificados por um único polineoantígeno (GAd20-CT26-62, SEQ ID NO: 170), em um layout de dois vetores, cada um codificando metade dos 62 neoantígenos (GAd-CT26-1-31 + GAd-CT26- 32-62, SEQ ID NOs: 171, 172), e em um terceiro layout com os mesmos dois cassetes de expressão separados presentes em um único vetor (GAd-CT26 dual 1-31 e 32-62). Um elemento potenciador de células T, TPA (SEQ ID NO: 173), estava presente no N-terminal do polineoantígeno contendo 62 neoantígenos e um elemento intensificador de células T, TPA, estava presente no N-terminal de cada uma das duas construções de 31 neoantígenos. Uma sequência de peptídeo HA (SEQ ID NO: 183) foi adicionada na extremidade C-terminal dos neoantígenos montados com o propósito de monitorar a expressão.
[188] A imunogenicidade foi determinada in vivo por grupos de imunização (n = 6) de camundongos BalbC naïves por via intramuscular, por uma vez, com uma dose de 5 × 108 partículas virais (v.p.). As respostas de células T foram medidas 2 semanas após a imunização em esplenócitos por ELISpot para INFγ para o reconhecimento de conjuntos de peptídeos contendo os neoantígenos de 25mers.
[189] GA d20-CT26-62, expressando o polineoantígeno longo, demonstrou uma indução subótima de respostas de células T específicas do neoantígeno quando comparado com o layout de dois vetores coadministrados, GAd-CT26-1-31 / GAd-CT26-32-62 (Figura 8A). Portanto, a divisão de um polineoantígeno longo em dois polineoantígenos mais curtos de comprimento aproximadamente igual proporcionou uma resposta imunogênica significativamente melhorada. É importante ressaltar que o vetor de cassete duplo GAd-CT26 dual 1-31 e 32-62 (Figura 8 B) também induziu um nível de imunogenicidade que foi significativamente maior do que o da construção GAd- CT26-1-62, e comparável ao observado para o combinação de dois vetores adenovirais GAd-CT26-1-31 + GAd-CT26-31-62 (Figura 8 A e B).
[190] Dividir o poliantígeno longo em dois polineoantígenos menores de tamanho aproximadamente igual fornece uma composição de vetor de vacina (um vetor de cassete duplo ou dois vetores distintos) com propriedades imunogênicas superiores.
TABELA 9 LISTA DE 62 NEOANTÍGENOS CT26. É MOSTRADA A ORDEM DOS NEOANTÍGENOS
INDIVIDUAIS NO POLINEOANTÍGENO CODIFICADO PELAS DIVERSAS CONSTRUÇÕES dual GAd-CT26-1- 31 + GAd-CT26- GAd-CT26-1-62 GAd-CT26-1-31 Ordem Ordem Ordem Ordem
SEQ -32-62 32-62 GAd- CT26 ID Neoantígenos CT26
NO 1 1 1 (cassete1) 108 PGPQNFPPQNMFEFPPHLSPPLLPP 2 2 2 (cassete1) 109 GAQEEPQVEPLDFSLPKQQGELLER 3 3 3 (cassete1) 110 AVFAGSDDPFATPLSMSEMDRRNDA 4 4 4 (cassete1) 111 HSGQNHLKEMAISVLEARACAAAGQ 5 5 5 (cassete1) 112 ILPQAPSGPSYATYLQPAQAQMLTP 6 6 6 (cassete1) 113 MSYAEKSDEITKDEWMEKL 7 7 7 (cassete1) 114 GAGKGKYYAVNFSMRDGIDDESYGQ 8 8 8 (cassete1) 115 YRGADKLCRKASSVKLVKTSPELSE 9 9 9 (cassete1) 116 DSNLQARLTSYETLKKSLSKIREES 10 10 10 (cassete1) 117 HSFIHAAMGMAVTWCAAIMTKGQYS 11 11 11 (cassete1) 118 LRTAAYVNAIEKIFKVYNEAGVTFT 12 12 12 (cassete1) 119 FEGSLAKNLSLNFQAVKENLYYEVG 13 13 13 (cassete1) 120 DPRAAYFRQAENDMYIRMALLATVL 14 14 14 (cassete1) 121 LRSQMVMKMREYFCNLHGFVDIETP 15 15 15 (cassete1) 122 DLLAFERKLDQTVMRKRLDIQEALK 16 16 16 (cassete1) 123 IKREKCWKDATYPESFHTLESVPAT 17 17 17 (cassete1) 124 GRSSQVYFTINVNLDLSEAAVVTFS 18 18 18 (cassete1) 125 KPLRRNNSYTSYIMAICGMPLDSFR 19 19 19 (cassete1) 126 TTCLAVGGLDVKFQEAALRAAPDIL 20 20 20 (cassete1) 127 IYEFDYHLYGQNITMIMTSVSGHLL 21 21 21 (cassete1) 128 PDSFSIPYLTALDDLLGTALLALSF 22 22 22 (cassete1) 129 YATILEMQAMMTLDPQDILLAGNMM 23 23 23 (cassete1) 130 SWIHCWKYLSVQSQLFRGSSLLFRR 24 24 24 (cassete1) 131 YDNKGITYLFDLYYESDEFTVDAAR 25 25 25 (cassete1) 132 AQAAKNKGNKYFQAGKYEQAIQCYT 26 26 26 (cassete1) 133 QPMLPIGLSDIPDEAMVKLYCPKCM 27 27 27 (cassete1) 134 HRGAIYGSSWKYFTFSGYLLYQD 28 28 28 (cassete1) 135 VIQTSKYYMRDVIAIESAWLLELAP dual GAd-CT26-1- 31 + GAd-CT26- GAd-CT26-1-62 GAd-CT26-1-31 Ordem Ordem Ordem Ordem
SEQ -32-62 32-62 GAd- CT26 ID Neoantígenos CT26
NO 29 29 29 (cassete1) 136 PRGVDLYLRILMPIDSELVDRDVVH 30 30 30 (cassete1) 137 QIEQDALCPQDTYCDLKSRAEVNGA 31 31 31 (cassete1) 138 ALASAILSDPESYIKKLKELRSMLM 32 1 1 (cassete2) 139 VIVLDSSQGNSVCQIAMVHYIKQKY 33 2 2 (cassete2) 140 MKSVSIQYLEAVKRLKSEGHRFPRT 34 3 3 (cassete2) 141 KGGPVKIDPLALMQAIERYLVVRGY 35 4 4 (cassete2) 142 LQDDPDLQALLKASQLLKVKSSSWR 36 5 5 (cassete2) 143 LIAHMILGYRYWTGIGVLQSCESAL 37 6 6 (cassete2) 144 TSVDQHLAPGAVAMPQAASLHAVIV 38 7 7 (cassete2) 145 EISVRIATIPAFDTIMETVIQRELL 39 8 8 (cassete2) 146 KTSREIKISGAIEPCVSLNSKGPCV 40 9 9 (cassete2) 147 QGLANYVITTMGTICAPVRDEDIRE 41 10 10 (cassete2) 148 ELSRRQYAEQELKQVRMALKKAEKE 42 11 11 (cassete2) 149 IETQQRKFKASRASILSEMKMLKEK 43 12 12 (cassete2) 150 SIFLDDDSNQPMAVSRFFGNVELMQ 44 13 13 (cassete2) 151 RPDSYVRDMEIEAASHHVYADQPHI 45 14 14 (cassete2) 152 TLSAMSNPRAMQVLLQIQQGLQTLA 46 15 15 (cassete2) 153 VMKGTLEYLMSNTPTAQSLRESYIF 47 16 16 (cassete2) 154 AAELFHQLSQALKVLTDAAARAAYD 48 17 17 (cassete2) 155 TGLYFRKSYYMQKYFLDTVTEDAKV 49 18 18 (cassete2) 156 CRNNVHYLNDGDAIIYHTASIGILH 50 19 19 (cassete2) 157 DINDNNPSFPTGKMKLEISEALAPG 51 20 20 (cassete2) 158 REGILQEESIYKPQKQEQELRALQA 52 21 21 (cassete2) 159 INPTMIISNTLSKSAIATPKISYLL 53 22 22 (cassete2) 160 QDLHNLNLLSLYANKLQTVAKGTFS 54 23 23 (cassete2) 161 QEIQTYAIALINVLFLKAPEDKRQD 55 24 24 (cassete2) 162 CYNYLYRMKALDGIRASEIPFHAEG 56 25 25 (cassete2) 163 QSIHSFQSLEESISVLPSFQEPHLQ 57 26 26 (cassete2) 164 TDFCLRNLDGTLCYLLDKETLRLHP 58 27 27 (cassete2) 165 CEVTRVKAVRILPCGVAKVLWMQGS 59 28 28 (cassete2) 166 GYDSRSARAFPYANVAFPHLTSSAP 60 29 29 (cassete2) 167 TDKELREAMALLAAQQTALEVIVNM 61 30 30 (cassete2) 168 LSRPDLPFLIAAVFFLVVAVWGETL 62 31 31 (cassete2) 169 LYYTTVRALTRHNTMLKAMFSGRME
REFERÊNCIAS
[191] Andersen RS, Kvistborg P, Frøsig TM, Pedersen NW, Lyngaa R, Bakker AH, Shu CJ, Straten Pt, Schumacher TN, Hadrup SR.
(2012). Parallel detection of antigen-specific T cell responses by combinatorial encoding of MHC multimers. Nat Protoc, 7(5), 891-902.
doi:10.1038/nprot.2012.037.
[192] Andreatta M & Nielsen M. (2016). Gapped sequence alignment using artificial neural networks: application to the MHC class I system. Bioinformatics, 32(4), 511-517. doi:10.1093/bioinformatics/btv639.
[193] Andrews, S. FastQC A Quality Control tool for High Throughput Sequence Data. disponível online em: http://www.bioinformatics.babraham.ac.uk/projects/fastqc.
[194] Bolger AM, Lohse M, Usadel B. (2014). Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics, 30(15), 2114-2120.
doi:10.1093/bioinformatics/btu170.
[195] Cibulskis K1, Lawrence MS, Carter SL, Sivachenko A, Jaffe D, Sougnez C, Gabriel S, Meyerson M, Lander ES, Getz G. (2013). Sensitive detection of somatic point mutations in impure and heterogeneous cancer samples. Nat Biotechnol, 31(3), 213-219. doi:10.1038/nbt.2514.
[196] Donnelly ML, Hughes LE, Luke G, Mendoza H, ten Dam E, Gani D, Ryan MD.(2001) The 'cleavage' activities of foot-and-mouth disease virus 2A site-directed mutants and naturally occurring '2A-like' sequences. J Gen Virol. 2001 82(Pt 5):1027-41.
[197] Fang H, Wu Y, Narzisi G, O'Rawe JA, Barrón LT, Rosenbaum J, Ronemus M, Iossifov I, Schatz MC, Lyon GJ. (2014). Reducing INDEL calling errors in whole genome and exome sequencing data. Genome Med, 6(10), 89. doi:10.1186/s13073-014-0089-z.
[198] Fritsch EF, Rajasagi M, Ott PA, Brusic V, Hacohen N, Wu CJ. (2014). HLA-binding properties of tumor neoepitopes in humans. Cancer Immunol Res, 2(6), 522-529. doi:10.1158/2326-6066.CIR-13-0227.
[199] Gros A, Parkhurst MR, Tran E, Pasetto A, Robbins PF,
Ilyas S, Prickett TD, Gartner JJ, Crystal JS, Roberts IM, Trebska-McGowan K, Wunderlich JR, Yang JC1, Rosenberg SA. (2016). Prospective identification of neoantigen-specific lymphocytes in the peripheral blood of melanoma patients.
Nat Med. 22(4):433-8. doi: 10.1038/nm.4051.
[200] Hoof I, Peters B, Sidney J, Pedersen LE, Sette A, Lund O, Buus S, Nielsen M. (2009). NetMHCpan, a method for MHC class I binding prediction beyond humans. Immunogenetics, 61(1), 1-13. doi:10.1007/s00251- 008-0341-z.
[201] Jurtz V, Paul S, Andreatta M, Marcatili P, Peters B, Nielsen M. (2017). NetMHCpan-4.0: Improved Peptide-MHC Class I Interaction Predictions Integrating Eluted Ligand and Peptide Binding Affinity Data. J Immunol, 199(9), 3360-3368. doi:10.4049/jimmunol.1700893.
[202] Kandoth C, McLellan MD, Vandin F, Ye K, Niu B, Lu C, Xie M, Zhang Q, McMichael JF, Wyczalkowski MA, Leiserson MDM, Miller CA, Welch JS, Walter MJ, Wendl MC, Ley TJ, Wilson RK, Raphael BJ, Ding L.
(2013). Mutational landscape and significance across 12 major cancer types.
Nature, 502(7471), 333-339. doi:10.1038/nature12634.
[203] Kim D, Langmead B, Salzberg SL. (2015). HISAT: a fast spliced aligner with low memory requirements. Nat Methods, 12(4), 357-360.
doi:10.1038/nmeth.3317.
[204] Koboldt DC, Zhang Q, Larson DE, Shen D, McLellan MD, Lin L, Miller CA, Mardis ER, Ding L, Wilson RK. (2012). VarScan 2: somatic mutation and copy number alteration discovery in cancer by exome sequencing.
Genome Res, 22(3), 568-576. doi:10.1101/gr.129684.111.
[205] Li B & Dewey CN. (2011). RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics, 12, 323. doi:10.1186/1471-2105-12-323.
[206] Li H & Durbin R. (2009). Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics, 25(14), 1754-1760.
doi:10.1093/bioinformatics/btp324.
[207] Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R; 1000 Genome Project Data Processing Subgroup. Genome Project Data Processing, S. (2009). The Sequence Alignment/Map format and SAMtools. Bioinformatics, 25(16), 2078-2079.
doi:10.1093/bioinformatics/btp352.
[208] Luke GA, de Felipe P, Lukashev A, Kallioinen SE, Bruno EA, Ryan MD. (2008) Occurrence, function and evolutionary origins of '2A-like' sequences in virus genomes.J Gen Virol. 2008 89(Pt 4):1036-42. doi:
10.1099/vir.0.83428-0.
[209] Lundegaard C, Lamberth K, Harndahl M, Buus S, Lund O, Nielsen M. (2008). NetMHC-3.0: accurate web accessible predictions of human, mouse and monkey MHC class I affinities for peptides of length 8-11. Nucleic Acids Res, 36(Web Server issue), W509-512. doi:10.1093/nar/gkn202.
[210] McKenna A, Hanna M, Banks E, Sivachenko A, Cibulskis K, Kernytsky A, Garimella K, Altshuler D, Gabriel S, Daly M, DePristo MA. (2010).
The Genome Analysis Toolkit: a MapReduce framework for analyzing next- generation DNA sequencing data. Genome Res, 20(9), 1297-1303.
doi:10.1101/gr.107524.110.
[211] Moutaftsi M, Peters B, Pasquetto V, Tscharke DC, Sidney J, Bui HH, Grey H, Sette A. (2006). A consensus epitope prediction approach identifies the breadth of murine T(CD8+)-cell responses to vaccinia virus. Nat Biotechnol, 24(7), 817-819. doi:10.1038/nbt1215.
[212] Sahin U, Derhovanessian E, Miller M, Kloke BP, Simon P, Löwer M, Bukur V, Tadmor AD, Luxemburger U, Schrörs B, Omokoko T, Vormehr M, Albrecht C, Paruzynski A, Kuhn AN, Buck J, Heesch S, Schreeb KH, Müller F, Ortseifer I, Vogler I, Godehardt E, Attig S, Rae R, Breitkreuz A,
Tolliver C, Suchan M, Martic G, Hohberger A, Sorn P, Diekmann J, Ciesla J, Waksmann O, Brück AK, Witt M, Zillgen M, Rothermel A, Kasemann B, Langer D, Bolte S, Diken M, Kreiter S, Nemecek R, Gebhardt C, Grabbe S, Höller C, Utikal J, Huber C, Loquai C, Türeci Ö. Personalized RNA mutanome vaccines mobilize poly-specific therapeutic immunity against cancer. Nature, 547(7662), 222-226. doi:10.1038/nature23003.
[213] Shannon, C. E. (1997). The mathematical theory of communication. 1963. MD Comput, 14(4), 306-317.
[214] Strait & Dewey. (1996). The Shannon information entropy of protein sequences. Biophys. J. 1996 Biophys J. 71(1),148-55.
[215] Szolek A, Schubert B, Mohr C, Sturm M, Feldhahn M, Kohlbacher O. (2014). OptiType: precision HLA typing from next-generation sequencing data. Bioinformatics, 30(23), 3310-3316.
doi:10.1093/bioinformatics/btu548.
[216] Tran E, Ahmadzadeh M, Lu YC, Gros A, Turcotte S, Robbins PF, Gartner JJ, Zheng Z, Li YF, Ray S, Wunderlich JR, Somerville RP, Rosenberg SA. (2015). Immunogenicity of somatic mutations in human gastrointestinal cancers. Science, 350(6266), 1387-1390.
doi:10.1126/science.aad1253.
[217] Wang K, Li M, Hakonarson H. (2010). ANNOVAR: functional annotation of genetic variants from high-throughput sequencing data.
Nucleic Acids Res, 38(16), e164. doi:10.1093/nar/gkq603.
[218] Warren RL, Choe G, Freeman DJ, Castellarin M, Munro S, Moore R, Holt RA. (2012). Derivation of HLA types from shotgun sequence datasets. Genome Med, 4(12), 95. doi:10.1186/gm396.
[219] Yarchoan M, Johnson BA3rd, Lutz ER, Laheru DA, Jaffee EM. (2017). Targeting neoantigens to augment antitumour immunity. Nat Rev Cancer, 17(9), 569. doi:10.1038/nrc.2017.74.

Claims (15)

REIVINDICAÇÕES
1. MÉTODO PARA SELECIONAR NEOANTÍGENOS DE CÂNCER para uso em uma vacina personalizada, caracterizado por compreender as etapas de: (a) determinar neoantígenos em uma amostra de células de câncer obtida a partir de um indivíduo, em que cada neoantígeno - está compreendido em uma sequência codificante, - compreende pelo menos uma mutação na sequência codificante, resultando em uma alteração na sequência de aminoácidos codificada que não está presente em uma amostra de células não cancerosas do referido indivíduo, e - consiste em 9 a 40, de preferência 19 a 31, mais preferencialmente 23 a 25, mais preferencialmente 25 aminoácidos contíguos da sequência codificante na amostra de células de câncer, (b) determinar para cada neoantígeno a frequência do alelo de mutação de cada uma das referidas mutações da etapa (a) dentro da sequência codificante, (c) determinar o nível de expressão de cada sequência codificante compreendendo pelo menos uma das referidas mutações, (i) na referida amostra de células cancerosas, ou (ii) a partir de um banco de dados de expressão do mesmo tipo de câncer que a amostra de células cancerosas, (d) predizer a afinidade de ligação ao MHC classe I dos neoantígenos, em que (I) os alelos HLA de classe I são determinados a partir da amostra de células não cancerosas do referido indivíduo, (II) para cada alelo HLA classe I determinado em (I), a afinidade de ligação ao MHC classe I de cada fragmento consistindo de 8 a 15,
de preferência 9 a 10, mais preferencialmente 9, aminoácidos contíguos do neoantígeno é prevista, em que cada fragmento compreende pelo menos uma alteração de aminoácido causada pela mutação da etapa (a), e (III) o fragmento com a maior afinidade de ligação ao MHC classe I determina a afinidade de ligação ao MHC classe I do neoantígeno, (e) classificar os neoantígenos de acordo com os valores determinados nas etapas (b) a (d) para cada neoantígeno a partir dos valores mais altos para os mais baixos, produzindo uma primeira, uma segunda e uma terceira lista de classificações, (f) calcular a soma de classificação da referida primeira, segunda e terceira lista de classificação e ordenar os neoantígenos pelo aumento da soma classificação, produzindo uma lista ordenada de neoantígenos, (g) selecionar de 30- 240, de um modo preferido de 40-80, mais preferivelmente 60, neoantígenos a partir da lista de neoantígenos classificados obtida em (f) começando com a classificação mais baixa.
2. MÉTODO, de acordo com a reivindicação 1, caracterizado pelas etapas (a) e (d) (I) serem realizadas usando sequenciamento de DNA massivamente paralelo das amostras e em que o número de leituras compreendendo a mutação na posição cromossômica da mutação identificada é: - de pelo menos 2, de preferência pelo menos 3, na amostra de células cancerosas, - de 2 ou menos, de preferência 0, na amostra de células não cancerosas.
3. MÉTODO, de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo método compreender uma etapa (d') além de ou alternativamente à etapa (d), em que a etapa (d') compreende:
determinar os alelos HLA classe II na amostra de células não cancerosas do referido indivíduo, predizer a afinidade de ligação ao MHC classe II dos neoantígenos, em que - para cada alelo HLA classe II determinado, a afinidade de ligação ao MHC classe II de cada fragmento consistindo de 11 a 30, de preferência 15, aminoácidos contíguos do neoantígeno é prevista, em que cada fragmento compreende pelo menos um aminoácido mutado gerado pela mutação da etapa (a), e - o fragmento com a maior afinidade de ligação ao MHC classe II determina a afinidade de ligação ao MHC classe II do neoantígeno, em que a afinidade de ligação ao MHC de classe II é classificada da afinidade de ligação ao MHC classe II mais alta para a mais baixa, produzindo uma quarta lista de classificações que está incluída na soma das classificações da etapa (f).
4. MÉTODO, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado por pelo menos uma mutação da etapa (a) ser uma variante de nucleotídeo único (SNV) ou uma mutação de inserção / deleção resultando em um peptídeo proveniente de mudança na fase de leitura (peptídeo de frameshift ou FSP).
5. MÉTODO, de acordo com a reivindicação 4, caracterizado pela mutação ser uma SNV e o neoantígeno ter o tamanho total definido na etapa (a) e consistir no aminoácido causado pela mutação, flanqueado em cada lado por uma série de aminoácidos contíguos adjacentes, em que o número em cada lado não difere em mais de um, a menos que a sequência codificante não compreenda um número suficiente de aminoácidos em ambos os lados, e em que o neoantígeno tem o tamanho total definido na etapa (a).
6. MÉTODO, de acordo com a reivindicação 4, caracterizado pela mutação resultar em um FSP e cada alteração de aminoácido única causada pela mutação resultar em um neoantígeno que tem o tamanho total definido na etapa (a) e consiste: (i) na referida alteração de aminoácido único causada pela mutação e 7 a 14, de preferência 8, aminoácidos contíguos adjacentes ao N- terminal, e (ii) em uma série de aminoácidos contíguos adjacentes ao fragmento da etapa (i) em ambos os lados, em que o número de aminoácidos em cada lado difere em não mais do que um, a menos que a sequência codificante não compreenda um número suficiente de aminoácidos em ambos os lados, em que a afinidade de ligação ao MHC classe I da etapa (d) e/ou a afinidade de ligação ao MHC classe II da etapa (d') é prevista para o fragmento da etapa (i).
7. MÉTODO, de acordo com qualquer uma das reivindicações anteriores, caracterizado pela frequência do alelo de mutação do neoantígeno determinada na etapa (b) na amostra de células cancerosas ser de pelo menos 2%, de preferência pelo menos 5%, mais preferencialmente pelo menos 10%.
8. MÉTODO, de acordo com qualquer uma das reivindicações anteriores, caracterizado pela etapa (g) compreender ainda a remoção de neoantígenos de genes ligados a doenças autoimunes e/ou neoantígenos com um valor de entropia de Shannon para sua sequência de aminoácidos inferior a 0,1 a partir da referida lista classificada de neoantígenos.
9. MÉTODO, de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo nível de expressão dos referidos genes codificantes na etapa (c) (i) ser determinado por sequenciamento de transcriptoma massivamente paralelo, e em que o nível de expressão determinado na etapa (c) (i) usa um valor corrigido de Transcrições por
Quilobase Milhão (corrTPM) calculado de acordo com a seguinte fórmula; 𝑀+𝑐 𝑐𝑜𝑟𝑟𝑇𝑃𝑀 = 𝑇𝑃𝑀 × ( ) 𝑀+𝑊+𝑐 em que M é o número de leituras abrangendo a localização da mutação da etapa (a) que compreende a mutação; e W é o número de leituras abrangendo a localização da mutação da etapa (a) sem a mutação; TPM, os transcritos por milhão do gene que compreende a mutação; e c é uma constante maior do que 0, de preferência c é 0,1.
10. MÉTODO, de acordo com qualquer uma das reivindicações anteriores, caracterizado pela soma da classificação na etapa (f) ser uma soma da classificação ponderada, em que - o número de neoantígenos determinado na etapa (a) é adicionado ao valor de classificação de cada neoantígeno: na terceira lista de classificações para as quais a previsão de afinidade de ligação ao MHC classe I da etapa (d) resultou em um valor IC 50 superior a 1000 nM e/ou na quarta lista de classificações para as quais a previsão de afinidade de ligação ao MHC classe II da etapa (d’) resultou em um valor IC50 superior a 1000 nM; e/ou - no caso da etapa (c) (i) ser realizada por sequenciamento massivamente paralelo de transcriptoma, a soma da classificação da etapa (f) é multiplicada por um fator de ponderação (WF), em que WF é; 1, se o número de leituras do transcriptoma mapeado para a mutação for > 0, 2, se o número de leituras de transcriptoma mapeadas para a mutação for 0 e o número de leituras mapeadas para a sequência não mutada for 0; e o valor de transcrições por milhão (TPM) for pelo menos 0,5, 3, se o número de leituras de transcriptoma mapeadas para a mutação for 0 e o número de leituras mapeadas para a sequência não mutada for > 0; e o valor de transcrições por milhão (TPM) for pelo menos 0,5, 4, se o número de leituras de transcriptoma mapeadas para a mutação for 0 e o número de leituras mapeadas para a sequência não mutada for 0; e o valor de transcrições por milhão (TPM) for < 0,5, ou 5, se o número de leituras de transcriptoma mapeadas para a mutação for 0 e o número de leituras mapeadas para a sequência não mutada for > 0; e o valor de transcrições por milhão (TPM) for < 0,5.
11. MÉTODO, de acordo com qualquer uma das reivindicações anteriores, caracterizado pela etapa (g) compreender um processo de seleção alternativo, em que os neoantígenos são selecionados a partir da lista de neoantígenos classificados (ranqueados) começando com a classificação mais baixa até um tamanho máximo definido no comprimento total de aminoácidos para todos os neoantígenos selecionados ser alcançado, em que o tamanho máximo está entre 1.200 e 1.800, de preferência 1.500 aminoácidos para cada vetor de vacina monovalente ou multivalente; e opcionalmente em que dois ou mais neoantígenos são fundidos em um novo neoantígeno se eles compreenderem segmentos de sequência de aminoácidos sobrepostos.
12. MÉTODO PARA A CONSTRUÇÃO DE UM VETOR personalizado que codifica uma combinação de neoantígenos, conforme definida em qualquer uma das reivindicações 1 a 11, para uso como vacina, caracterizado por compreender as etapas de: (i) ordenar a lista de neoantígenos em pelo menos 10 5 -108, de preferência 106 combinações diferentes, (ii) gerar todos os pares possíveis de segmentos de junção de neoantígeno para cada combinação, em que cada segmento de junção compreende 15 aminoácidos contíguos adjacentes em cada lado da junção, (iii) predizer a afinidade de ligação de MHC classe I e/ou classe II para todos os epítopos em segmentos de junção, em que são testados apenas os alelos HLA que estão presentes no indivíduo para o qual o vetor é projetado, e (iv) selecionar a combinação de neoantígenos com o menor número de epítopos juncionais com um IC50 ≤ 1.500 nM, e em que se várias combinações tiverem o mesmo de epítopos juncionais número mais baixo, a primeira combinação encontrada é selecionada.
13. VETOR, que codifica a lista de neoantígenos, conforme definida em qualquer uma das reivindicações 1 a 11, ou a combinação de neoantígenos conforme definida na reivindicação 12, caracterizado por compreender opcionalmente, ou adicionalmente, um elemento potencializador de células T, de preferência de SEQ ID NO: 173 a 182, mais preferencialmente de SEQ ID NO: 175, fundido ao N-terminal do primeiro neoantígeno da lista e, opcionalmente, o vetor compreende dois cassetes de expressão independentes, em que cada cassete de expressão codifica uma porção da lista de neoantígenos conforme definida em qualquer uma das reivindicações 1 a 12 ou da combinação de neoantígenos conforme definida na reivindicação 13; e em que a porção da lista codificada pelos cassetes de expressão tem aproximadamente o mesmo tamanho em número de aminoácidos.
14. COLEÇÃO DE VETORES codificantes de cada porção da lista de neoantígenos, conforme definida em qualquer uma das reivindicações 1 a 11, ou da combinação de neoantígenos, conforme definida na reivindicação 12, caracterizada por compreender 2 a 4, de preferência 2, vetores e preferencialmente as inserções nestes vetores que codificam a porção da lista são de tamanho aproximadamente igual em número de aminoácidos.
15. VETOR, de acordo com a reivindicação 13 ou coleção de vetores de acordo com a reivindicação 14, caracterizado por ser para uso na vacinação contra o câncer.
BR112021006149-5A 2018-11-15 2019-11-15 método para selecionar neoantígenos de câncer, método para a construção de um vetor, vetor e coleção de vetores BR112021006149A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18206599.5 2018-11-15
EP18206599 2018-11-15
PCT/EP2019/081428 WO2020099614A1 (en) 2018-11-15 2019-11-15 Selection of cancer mutations for generation of a personalized cancer vaccine

Publications (1)

Publication Number Publication Date
BR112021006149A2 true BR112021006149A2 (pt) 2021-06-29

Family

ID=64331838

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112021006149-5A BR112021006149A2 (pt) 2018-11-15 2019-11-15 método para selecionar neoantígenos de câncer, método para a construção de um vetor, vetor e coleção de vetores

Country Status (12)

Country Link
US (1) US20210379170A1 (pt)
EP (1) EP3881324A1 (pt)
JP (1) JP7477888B2 (pt)
KR (1) KR20210092723A (pt)
CN (1) CN113424264B (pt)
AU (1) AU2019379306A1 (pt)
BR (1) BR112021006149A2 (pt)
CA (1) CA3114265A1 (pt)
IL (1) IL283143A (pt)
MX (1) MX2021005656A (pt)
SG (1) SG11202103243PA (pt)
WO (1) WO2020099614A1 (pt)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW202043256A (zh) 2019-01-10 2020-12-01 美商健生生物科技公司 前列腺新抗原及其用途
WO2022170067A1 (en) * 2021-02-05 2022-08-11 Amazon Technologies, Inc. Ranking neoantigens for personalized cancer vaccine
BR112023024815A2 (pt) 2021-06-21 2024-02-20 Nouscom Ag Composição de vacina, composição ou kit de vacina para induzir uma resposta imune e regime de vacinação
CN114005489B (zh) * 2021-12-28 2022-03-22 成都齐碳科技有限公司 基于三代测序数据检测点突变的分析方法和装置
CN116564405B (zh) * 2023-04-19 2023-12-15 江苏先声医学诊断有限公司 一种基于平均无序度的基因组测序突变位点过滤方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003000894A1 (fr) * 2001-06-25 2003-01-03 Anges Mg, Inc. Vaccins polynucleotides
CN102719478A (zh) 2004-01-23 2012-10-10 P.安杰莱蒂分子生物学研究所 黑猩猩腺病毒疫苗载运体
WO2009109855A2 (en) * 2008-03-06 2009-09-11 University Of Medicine And Dentistry Of New Jersey Immunotherapy for unresectable pancreatic cancer
EP3385387B1 (en) 2009-02-02 2021-08-25 GlaxoSmithKline Biologicals SA Simian adenovirus nucleic acid- and amino acid-sequences, vectors containing same, and uses thereof
PL3473267T3 (pl) * 2011-05-24 2022-01-10 BioNTech SE Zindywidualizowane szczepionki przeciwnowotworowe
WO2012159643A1 (en) * 2011-05-24 2012-11-29 Biontech Ag Individualized vaccines for cancer
RS62497B1 (sr) * 2011-05-24 2021-11-30 BioNTech SE Individualizovane vakcine protiv kancera
MX364370B (es) * 2012-07-12 2019-04-24 Persimmune Inc Vacunas contra el cancer personalizadas y terapias de celulas inmunes adoptivas.
WO2016128060A1 (en) * 2015-02-12 2016-08-18 Biontech Ag Predicting t cell epitopes useful for vaccination
US10563266B2 (en) * 2015-07-14 2020-02-18 Personal Genome Diagnostics Inc. Neoantigen treatment prioritization using multivariate analysis based on: HLA genotype, self-similarity, similarity to known antigens, antigen expression levels and mutant allele frequency
EP3328394A4 (en) * 2015-07-30 2019-03-13 ModernaTX, Inc. PEPTIDE CONCATEMERIC EPITAOPE RNA
CN108430456B (zh) * 2015-10-22 2022-01-18 摩登纳特斯有限公司 癌症疫苗
US20170199961A1 (en) * 2015-12-16 2017-07-13 Gritstone Oncology, Inc. Neoantigen Identification, Manufacture, and Use

Also Published As

Publication number Publication date
JP7477888B2 (ja) 2024-05-02
IL283143A (en) 2021-06-30
CA3114265A1 (en) 2020-05-22
CN113424264A (zh) 2021-09-21
WO2020099614A1 (en) 2020-05-22
CN113424264B (zh) 2024-04-12
JP2022513047A (ja) 2022-02-07
MX2021005656A (es) 2021-07-07
AU2019379306A1 (en) 2021-04-29
EP3881324A1 (en) 2021-09-22
US20210379170A1 (en) 2021-12-09
SG11202103243PA (en) 2021-04-29
KR20210092723A (ko) 2021-07-26

Similar Documents

Publication Publication Date Title
JP7477888B2 (ja) 個別化された癌ワクチンの作製のための癌変異の選択
Gfeller et al. Predicting antigen presentation—what could we learn from a million peptides?
AU2020200208B2 (en) Compositions and methods for viral cancer neoepitopes
AU2019280006B2 (en) Improved compositions and methods for viral delivery of neoepitopes and uses thereof
JP2019513021A (ja) ネオエピトープ提示のための配列の配置および配列
Schrörs et al. HLA class I loss in metachronous metastases prevents continuous T cell recognition of mutated neoantigens in a human melanoma model
BR112021005702A2 (pt) método para selecionar neoepítopos
US20230091256A1 (en) Hidden Frame Neoantigens
CA3217623A1 (en) Compositions and method for optimized peptide vaccines using residue optimization
Aranha et al. Combining three-dimensional modeling with artificial intelligence to increase specificity and precision in peptide–MHC binding predictions
RU2809620C2 (ru) Выбор раковых мутаций для создания персонализированной противораковой вакцины
WO2023068931A1 (en) Cancer neoantigens
US20230197192A1 (en) Selecting neoantigens for personalized cancer vaccine
Sverchkova Integrative Approaches to Study the HLA Region in Humans: Applications in Cancer Genomics
Papp et al. Synergy of HLA class I and II shapes the timing of antitumor immune response
Shen APPLICATION OF MACHINE LEARNING APPROACHES TO EMPOWER DRUG DEVELOPMENT
Wallace Neoantigen prediction for the SSM3 oestrogen receptor positive breast cancer mouse model
Bird Development of an Analysis Pipeline for HLA Genotyping Using Illumina Short Reads
Pyke The Role of MHC Variation in Tumor Progression
CN113272419A (zh) 制备治疗性t淋巴细胞的方法

Legal Events

Date Code Title Description
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]
B12B Appeal against refusal [chapter 12.2 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 15/11/2019, OBSERVADAS AS CONDICOES LEGAIS