BR112020018049A2 - Composições de cartirina e métodos para uso - Google Patents

Composições de cartirina e métodos para uso Download PDF

Info

Publication number
BR112020018049A2
BR112020018049A2 BR112020018049-1A BR112020018049A BR112020018049A2 BR 112020018049 A2 BR112020018049 A2 BR 112020018049A2 BR 112020018049 A BR112020018049 A BR 112020018049A BR 112020018049 A2 BR112020018049 A2 BR 112020018049A2
Authority
BR
Brazil
Prior art keywords
seq
amino acid
sequence
certain embodiments
cell
Prior art date
Application number
BR112020018049-1A
Other languages
English (en)
Inventor
Eric Ostertag
Devon Shedlock
Original Assignee
Poseida Therapeutics, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Poseida Therapeutics, Inc. filed Critical Poseida Therapeutics, Inc.
Publication of BR112020018049A2 publication Critical patent/BR112020018049A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/30Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants from tumour cells
    • C07K16/3069Reproductive system, e.g. ovaria, uterus, testes, prostate
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/14Blood; Artificial blood
    • A61K35/17Lymphocytes; B-cells; T-cells; Natural killer cells; Interferon-activated or cytokine-activated lymphocytes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K40/00Cellular immunotherapy
    • A61K40/10Cellular immunotherapy characterised by the cell type used
    • A61K40/11T-cells, e.g. tumour infiltrating lymphocytes [TIL] or regulatory T [Treg] cells; Lymphokine-activated killer [LAK] cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K40/00Cellular immunotherapy
    • A61K40/30Cellular immunotherapy characterised by the recombinant expression of specific molecules in the cells of the immune system
    • A61K40/31Chimeric antigen receptors [CAR]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K40/00Cellular immunotherapy
    • A61K40/30Cellular immunotherapy characterised by the recombinant expression of specific molecules in the cells of the immune system
    • A61K40/36Immune checkpoint inhibitors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K40/00Cellular immunotherapy
    • A61K40/40Cellular immunotherapy characterised by antigens that are targeted or presented by cells of the immune system
    • A61K40/41Vertebrate antigens
    • A61K40/42Cancer antigens
    • A61K40/4231Cytokines
    • A61K40/4232Tumor necrosis factors [TNF] or CD70
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K40/00Cellular immunotherapy
    • A61K40/40Cellular immunotherapy characterised by antigens that are targeted or presented by cells of the immune system
    • A61K40/41Vertebrate antigens
    • A61K40/42Cancer antigens
    • A61K40/4274Prostate associated antigens e.g. Prostate stem cell antigen [PSCA]; Prostate carcinoma tumor antigen [PCTA]; Prostatic acid phosphatase [PAP]; Prostate-specific G-protein-coupled receptor [PSGR]
    • A61K40/4276Prostate specific membrane antigen [PSMA]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/7051T-cell receptor (TcR)-CD3 complex
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/70517CD8
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70575NGF/TNF-superfamily, e.g. CD70, CD95L, CD153, CD154
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70578NGF-receptor/TNF-receptor superfamily, e.g. CD27, CD30, CD40, CD95
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/78Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2887Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against CD20
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0634Cells from the blood or the immune system
    • C12N5/0636T lymphocytes
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/12Animals modified by administration of exogenous cells
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0331Animal model for proliferative diseases
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/70Immunoglobulins specific features characterized by effect upon binding to a cell or to an antigen
    • C07K2317/73Inducing cell death, e.g. apoptosis, necrosis or inhibition of cell proliferation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2318/00Antibody mimetics or scaffolds
    • C07K2318/20Antigen-binding scaffold molecules wherein the scaffold is not an immunoglobulin variable region or antibody mimetics
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/33Fusion polypeptide fusions for targeting to specific cell types, e.g. tissue specific targeting, targeting of a bacterial subspecies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/90Vectors containing a transposable element

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Cell Biology (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Hematology (AREA)
  • Reproductive Health (AREA)
  • Pregnancy & Childbirth (AREA)
  • Gynecology & Obstetrics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Mycology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Virology (AREA)
  • Developmental Biology & Embryology (AREA)

Abstract

são descritos receptores de antígeno quimérico de centirina (cartiri-nas), transposons de cartirina codificando cartirinas da invenção, células modificadas para expresser cartirinas da invenção, bem como métodos de preparação e métodos de uso dos mesmos para terapia celular adotiva. em modalidades preferidas, cartirinas da invenção especificamente se ligam a uma sequência de antígeno de membrane específica da próstata (psma).

Description

Relatório Descritivo da Patente de Invenção para "COM- POSIÇÕES DE CARTirina E MÉTODOS PARA USO".
PEDIDOS RELACIONADOS
[001] Este pedido reivindica o benefício de prioridade dos Esta- dos Unidos No. 62/639.978 depositado em 7 de março de 2018, Pedi- do provisional dos Estados Unidos No. 62/745.151 depositado em 12 e outubro de 2018 e Pedido provisional dos Estados Unidos No. 62/783.140 depositado em 20 de dezembro de 2018, o teor dos quais é aqui incorporado por referência em sua íntegra. INCORPORAÇÃO POR REFERÊNCIA DE LISTAGEM DE SEQUÊN-
CIA
[002] O teor do arquivo denominado "POTH- 033_001WO_SequenceListing_ST25_R.txt", que foi criado em 7 de março de 2019, e é de 6 KB de tamanho é pelo presente incorporado por referência em sua íntegra.
CAMPO DA PRESENTE INVENÇÃO
[003] A presente invenção é direcionada à biologia molecular, e mais especificamente, a receptors de antígeno quimérico, e a transpo- sons contendo uma ou mais CARTirinaas, bem como métodos de pre- paração e uso das mesmas.
ANTECEDENTES
[004] Há uma necessidade há muito sentida, mas não atendida na técnica de um método para direcionar a especificidade de uma cé- lula imune sem o uso de sequências de anticorpos tradicionais ou seus fragmentos. A presente invenção oferece um receptor de antígeno quimérico superior.
SUMÁRIO
[005] A presente invenção fornece um receptor de antígeno qui- mérico (CAR) compreendendo: (a) um ectodomínio compreendendo uma região de reconhecimento do antígeno, em que a região de reco-
nhecimento do antígeno compreende pelo menos uma Centirina; (b) um domínio de transmembrana, e (c) um endodomínio compreenden- do pelo menos um domínio coestimulatório. Como usado em toda a descrição, um CAR compreendendo uma Centirina referida como uma CARTirina. Em certas modalidades, a região de reconhecimento do antígeno pode compreender duas Centirinas para produzir uma CAR- Tirina biespecífica ou tandem. Em certas modalidades, a região de re- conhecimento do antígeno pode compreender três Centirinas para produzir uma CARTirina triespecífica. Em certas modalidades, o ecto- domínio pode também compreender um peptídeo sinal. Alternativa- mente, ou em adição, em certas modalidades, o ectodomínio pode também compreender uma articulação entre a região de reconheci- mento do antígeno e o domínio de transmembrana. Em certas modali- dades, o ectodomínio pode também compreender um peptídeo sinal. Alternativamente, ou em adição, em certas modalidades, o ectodomí- nio pode também compreender uma articulação entre a região de re- conhecimento do antígeno e o domínio de transmembrana.
[006] A presente invenção compreende um receptor de antígeno quimérico (CAR) compreendendo: (a) um ectodomínio compreendendo uma região de reconhecimento do antígeno, em que a região de reco- nhecimento do antígeno compreende pelo menos uma Centirina e em que a referida pelo menos uma Centirina liga-se especificamente a uma sequência de antígeno de membrana específico da próstata (PSMA); (b) um domínio de transmembrana, e (c) um endodomínio compreendendo pelo menos um domínio coestimulatório. Conforme utilizado ao longo da descrição, um CAR compreendendo uma Centiri- na é referido como uma CARTirina. Em certas modalidades, a região de reconhecimento do antígeno pode compreender duas centirinas para produzir uma CARTirina bi-específica ou tandem. Em certas mo- dalidades, incluindo aqueles em que a região de reconhecimento do antígeno podem compreender duas Centirinas para produzir uma CARTirina bi-específica ou em tandem, uma ou ambas as duas Centi- rinas especificamente vinculadas a uma sequência de PSMA.
Em al- gumas modalidades, uma primeira Centirina pode ligar-se especifica- mente a uma primeira sequência de PSMA e uma segunda Centirina pode ligar-se especificamente a uma segunda sequência de PSMA.
Em algumas modalidades, a primeira sequência de PSMA e a segun- da sequência de PSMA são idênticas.
Em algumas modalidades, a primeira sequência de PSMA e a segunda sequência de PSMA não são idênticas.
Em certas modalidades, a região de reconhecimento do antígeno pode compreender três centirinas para produzir uma CARTi- rina tri-específica.
Em certas modalidades, incluindo aqueles em que a região de reconhecimento do antígeno pode compreender três Centiri- nas para produzir um CARTirina tri-específica ou tandem, um, dois, ou três das três Centirinas, especificamente vinculadas a uma sequência de PSMA.
Em certas modalidades, uma primeira Centirina pode ligar- se especificamente a uma primeira sequência de PSMA, uma segunda Centirina pode ligar-se especificamente a uma segunda sequência de PSMA e uma terceira Centirina pode ligar-se especificamente a uma terceira sequência de PSMA.
Em certas modalidades, o ectodomínio pode também compreender um peptídeo sinal.
Em certas modalida- des, duas ou mais das primeira, segunda ou terceira sequências de PSMA são idênticas.
Em certas modalidades, duas ou mais das pri- meira, segunda ou terceira sequências de PSMA não são idênticas.
Em certas modalidades, a primeira sequência de PSMA, a segunda sequência de PSMA e a terceira sequência de PSMA não são idênti- cas.
Alternativamente, ou em adição, em certas modalidades, o ecto- domínio pode também compreender uma articulação entre uma região de reconhecimento do antígeno e o domínio de transmembrana.
Em certas modalidades, o ectodomínio pode também compreender um peptídeo sinal. Alternativamente, ou em adição, em certas modalida- des, o ectodomínio pode também compreender uma articulação entre uma região de reconhecimento do antígeno e o domínio de transmem- brana. Conforme usado neste documento, o termo "CARTirina anti- PSMA" refere-se a uma CARTirina compreendendo pelo menos uma centirina que se liga especificamente a uma sequência de PSMA.
[007] Em certas modalidades de uma CARTirina anti-PSMA da presente invenção, uma Centirina compreende ou consiste em uma sequência de aminoácido de
MLPAPKNLVVSRVTEDSARLSWDIDEQRDWFESFLIQYQESEKVGEA IVLTVPGSERSYDLTGLKPGTEYTVSIYGVYHVYRSNPLSAIFTT (SEQ ID NO: 18000) ("PSMA5 Centyrin") ou a sequência de ácido nucleico de
ATGCTGCCTGCACCAAAGAACCTGGTGGTGTCTCGGGTGACCGA GGACTCTGCCAGACTGAGCTGGGACATCGATGAGCAGAGGGATT GGTTCGAGAGCTTTCTGATCCAGTATCAGGAGTCCGAGAAAGTGG GCGAGGCCATCGTGCTGACAGTGCCTGGCAGCGAGCGGTCCTAT GACCTGACCGGCCTGAAGCCAGGCACAGAGTACACCGTGTCCAT
CTACGGCGTGTATCACGTGTACAGGTCCAATCCTCTGTCTGCCAT CTTCACCACA(SEQ ID NO: 18001) ("PSMA5 Centirina").
[008] Em certas modalidades de uma CARTirina anti-PSMA da presente invenção, a referida pelo menos uma Centirina específica de PSMA compreende uma sequência de aminoácido tendo pelo menos 70% de identidade para a sequência de aminoácido de
MLPAPKNLVVSRVTEDSARLSWDIDEQRDWFESFLIQYQESEKVGEA IVLTVPGSERSYDLTGLKPGTEYTVSIYGVYHVYRSNPLSAIFTT (SEQ ID NO: 18000). Em certas modalidades, a referida pelo menos uma Centirina específica de PSMA compreende uma sequência de aminoácido tendo pelo menos 75%, 80%, 85%, 90%, 95%, 97%, 99%, ou qualquer percentage entre elas de identidade para uma sequência de aminoácido de
MLPAPKNLVVSRVTEDSARLSWDIDEQRDWFESFLIQYQESEKVGEA IVLTVPGSERSYDLTGLKPGTEYTVSIYGVYHVYRSNPLSAIFTT (SEQ ID NO: 18000).
[009] Em certas modalidades de uma CARTirina anti-PSMA da presente invenção, uma Centirina compreende ou consiste em uma sequência de aminoácido de
MLPAPKNLVVSRVTEDSARLSWAIDEQRDWFESFLIQYQESEKVGEAI VLTVPGSERSYDLTGLKPGTEYTVSIYGVYHVYRSNPLSAIFTT (SEQ ID NO: 18002) ("Centirina PSMA8") ou a sequência de ácido nucleico de
ATGCTGCCTGCACCAAAGAACCTGGTGGTGTCTCGGGTGACCGA GGACTCTGCCAGACTGAGCTGGGCCATCGACGAGCAGAGGGATT GGTTCGAGAGCTTTCTGATCCAGTATCAGGAGTCCGAGAAAGTGG GCGAGGCCATCGTGCTGACAGTGCCTGGCAGCGAGCGGTCCTAT GATCTGACCGGCCTGAAGCCAGGCACAGAGTACACCGTGTCCAT
CTACGGCGTGTATCACGTGTACAGGTCCAATCCTCTGTCTGCCAT CTTCACCACA (SEQ ID NO: 18003) ("Centirina PSMA8").
[0010] Em certas modalidades de uma CARTirina anti-PSMA da presente invenção, a referida pelo menos uma Centirina específica de PSMA compreende uma sequência de aminoácido tendo pelo menos 70% de identidade para a sequência de aminoácido de
MLPAPKNLVVSRVTEDSARLSWAIDEQRDWFESFLIQYQESEKVGEAI VLTVPGSERSYDLTGLKPGTEYTVSIYGVYHVYRSNPLSAIFTT (SEQ ID NO: 18002). Em certas modalidades, a referida pelo menos uma Centirina específica de PSMA compreende uma sequência de aminoácido tendo pelo menos 75%, 80%, 85%, 90%, 95%, 97%, 99%, ou qualquer percentqagem entre elas de identidade para a sequência de aminoácido de
MLPAPKNLVVSRVTEDSARLSWAIDEQRDWFESFLIQYQESEKVGEAI
VLTVPGSERSYDLTGLKPGTEYTVSIYGVYHVYRSNPLSAIFTT (SEQ ID NO: 18002).
[0011] Em certas modalidades do CARTirinas da presente inven- ção, o peptídeo sinal podem compreender uma sequência codificando um peptídeo sinal CD2, CD3δ, CD3ε, CD3γ, CD3ζ, CD4, CD8α, CD19, CD28, 4-1BB or GM-CSFR humano. Em certas modalidades das CARTirinas da presente invenção, o peptídeo sinal pode compreender uma sequência codificando um peptídeo sinal CD8α humano. O peptí- deo sinal CD8α humano pode compreender uma sequência de amino- ácido sequence compreendendo MALPVTALLLPLALLLHAARP (SEQ ID NO: 18004). O peptídeo sinal CD8α humano pode compreender uma sequência de aminoácido compreendendo MALPVTALLL- PLALLLHAARP (SEQ ID NO: 18004) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para uma se- quência de aminoácido compreendendo MALPVTALLLPLALLLHAARP (SEQ ID NO: 18004). O peptídeo sinal CD8α humano pode ser codifi- cado por uma sequência de ácido nucleico compreendendo atggcactg- ccagtcaccgccctgctgctgcctctggctctgctgctgcacgcagctagacca (SEQ ID NO: 18005).
[0012] Em certas modalidades das CARTirinas da presente inven- ção, o domínio de transmembrana podem compreender uma sequên- cia codificando um domínio de transmembrana CD2, CD3δ, CD3ε, CD3γ, CD3ζ, CD4, CD8α, CD19, CD28, 4-1BB ou domínio GM-CSFR humano. Em certas modalidades do CARTirinas da presente invenção, o domínio de transmembrana pode compreender uma sequência codi- ficando um domínio de transmembrana CD8α humano. O domínio de transmembrana CD8α pode compreender uma sequência de aminoá- cido sequence compreendendo IYIWAPLAGTCGVLLLSLVITLYC (SEQ ID NO: 18006) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo IYIWAPLAGTCGVLLLSLVITLYC (SEQ ID NO: 18006). O domínio CD8α de transmembrana pode ser codificado pela sequência de ácido nucleico compreendendo atctacatttgggcaccactgg- ccgggacctgtggagtgctgctgctgagcctggtcatcacactgtactgc (SEQ ID NO: 18007).
[0013] Em certas modalidades das CARTirinas da presente inven- ção, o endodomínio podem compreender um endodomínio CD3ζ hu- mano.
[0014] Em certas modalidades das CARTirinas da presente invenção, o referido pelo menos um domínio coestimulatório pode compreender segmentos intraacelulares 4-1BB, CD28, CD40, ICOS, MyD88, OX-40 humanos, ou qualquer combinação dos mesmos. Em certas modalidades do CARTirinas da presente invenção, o referido pelo menos um domínio coestimulatório pode compreender um domínio coestimulatório CD28 e/ou 4-1BB. O domínio coestimulatório CD3ζ pode compreender uma sequência de aminoácido compreendendo
RVKFSRSADAPAYKQGQNQLYNELNLGRREEYDVLDKRRGRDPEM
GGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLY QGLSTATKDTYDALHMQALPPR(SEQ ID NO: 18008) OU UMA SEQUÊNCIA tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo
RVKFSRSADAPAYKQGQNQLYNELNLGRREEYDVLDKRRGRDPEM
GGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLY QGLSTATKDTYDALHMQALPPR (SEQ ID NO: 18009). o domínio coestimulatório CD3ζ pode ser codificado pela sequência de ácido nucleico compreendendo cgcgtgaagtttagtcgatcagcagatgccccagcttacaaacagggacagaaccagctgtata acgagctgaatctgggccgccgagaggaatatgacgtgctggataagcggagaggacgcgac cccgaaatgggaggcaagcccaggcgcaaaaaccctcaggaaggcctgtataacgagctgc agaaggacaaaatggcagaagcctattctgagatcggcatgaagggggagcgacggagagg caaagggcacgatgggctgtaccagggactgagcaccgccacaaaggacacctatgatgctct gcatatgcaggcactgcctccaagg (SEQ ID NO: 18010). O domínio coestimulatório 4-1BB pode compreender uma sequência de aminoácido compreendendo KRGRKKLLYIFKQPFMRPVQTTQEEDGCSCRFPEEEEGGCEL(SEQ ID NO: 18011) OU UMA SEQUÊNCIA tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo KRGRKKLLYIFKQPFMRPVQTTQEEDGCSCRFPEEEEGGCEL (SEQ ID NO: 18012). O domínio coestimulatório 4-1BB pode ser codificado pela sequência de ácido nucleico compreendendo aagagaggcaggaagaaactgctgtatattttcaaacagcccttcatgcgccccgtgcagactac ccaggaggaagacgggtgctcctgtcgattccctgaggaagaggaaggcgggtgtgagctg (SEQ ID NO: 18013). O domínio coestimulatório 4-1BB pode ser localizado entre o domínio de transmembrana e o domínio coestimulatório CD28.
[0015] Em certas modalidades das CARTirins da presente invenção, a articulação podem compreender uma sequência derivada de uma sequência CD8α, IgG4, e/ou CD4 humana.Em certas modalidades das CARTirinas da presente invenção, a articulação pode compreender uma sequência derivada de uma sequência CD8α humana. A articulação podem compreender uma sequência de aminoácido CD8 humana compreendendo
TTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACD (SEQ ID NO: 18014) OU UMA SEQUÊNCIA tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo
TTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACD (SEQ ID NO: 18015). A sequência de aminoácido de articulação CD8 humana pode ser codificado pela sequência de ácido nucleico compreendendo
ACCACAACCCCTGCCCCCAGACCTCCCACACCCGCCCCTACCAT CGCGAGTCAGCCCCTGAGTCTGAGACCTGAGGCCTGCAGGCCAG
CTGCAGGAGGAGCTGTGCACACCAGGGGCCTGGACTTCGCCTGC GAC (SEQ ID NO: 18016) ou
ACCACAACCCCTGCCCCCAGACCTCCCACACCCGCCCCTACCAT CGCGAGTCAGCCCCTGAGTCTGAGACCTGAGGCCTGCAGGCCAG
CTGCAGGAGGAGCTGTGCACACCAGGGGCCTGGACTTCGCCTGC GAC (SEQ ID NO: 18017).
[0016] Centirinas da presente invenção podem compreender pelo menos um domínio de fibronectina tipo III (FN3). Centirinas da presen- te invenção podem ser capazes de especificamente se ligarem a um antígeno. Centirinas preferidas da presente invenção especificamente se ligam a uma sequência de PSMA. O referido pelo menos um domí- nio de fibronectina tipo III (FN3) pode ser derivado de uma proteína humana. A proteína humana pode ser Tenascin-C. A sequência de consenso pode compreender LPAPKNLVVSEVTEDSLRLSWTAP- DAAFDSFLIQYQESEKVGEAINLTVPGSERSYDLTGLKPG- TEYTVSIYGVKGGHRSNPLSAEFTT (SEQ ID NO: 18018) ou MLPA- PKNLVVSEVTEDSLRLSWTAPDAAFDSFLIQYQESEKVGEAINLTV- PGSERSYDLTGLKPGTEYTVSIYGVKGGHRSNPLSAEFTT (SEQ ID NO: 18019). A sequência de consenso ‘’’um ou mais positions within (a) uma alça A-B compreendendo ou consistindo nos resíduos de ami- noácido TEDS (SEQ ID NO: 18020) nas posições 13 a 16 da sequên- cia de consenso; (b) uma alça B-C compreendendo ou consistindo nos resíduos de aminoácido TAPDAAF (SEQ ID NO: 18021) nas posições 22-28 da sequência de consenso; (c) uma alça C-D compreendendo ou consistindo nos resíduos de aminoácido SEKVGE (SEQ ID NO: 18022) nas posições 38 a 43 da sequência de consenso; (d) uma alça
D-E compreendendo ou consistindo nos resíduos de aminoácido GSER (SEQ ID NO: 18023) nas posições 51 a 54 da sequência de consenso; (e) uma alça E-F compreendendo ou consistindo nos resí- duos de aminoácido GLKPG (SEQ ID NO: 18024) nas posições 60 a 64 da sequência de consenso; (f) uma alça F-G compreendendo ou consistindo nos resíduos de aminoácido KGGHRSN (SEQ ID NO: 18025) nas posições 75 a 81 da sequência de consenso; ou (g) qual- quer combinação de (a)-(f). Centirinas da presente invenção podem compreender uma sequência de consenso de pelo menos 5 domínios de fibronectina tipo III (FN3), pelo menos 10 domínios de fibronectina tipo III (FN3) ou pelo menos 15 domínios de fibronectina tipo III (FN3). Centirinas e/ou CARTirinas da presente invenção may bind um antíge- no com pelo menos uma afinidade selecionada de um KD menor que ou igual a 10−9M, menor que ou igual a 10−10M, menor que ou igual a 10−11M, menor que ou igual a 10−12M, menor que ou igual a 10−13M, menor que ou igual a 10−14M, e menor que ou igual a 10−15M. A KD po- de ser determinada por ressonância de plasmônio de superfície.
[0017] A presente invenção fornece uma composição compreen- dendo a CARTirina da presente invenção e pelo menos um veículo farmaceuticamente aceitável.
[0018] A presente invenção fornece um transposon compreenden- do a CARTirina da presente invenção.
[0019] Transposons da presente invenção podem compreender um gene de seleção para identificação, enriquecimento e/ou isolamen- to de células que expressam o transposon. Genes de seleção exem- plares codificam qualquer produto de gene (por exemplo, transcrição, proteína, enzima) essencial para viabilidade e sobrevivência celular. Genes de seleção exemplares codificam qualquer produto de gene (por exemplo, transcrição, proteína, enzima) essencial para conferir resistência a um desafio de fármaco contra o qual a célula é sensível
(ou que pode ser letal para a célula) na ausência do produto de gene codificado pelo gene de seleção. Genes de seleção exemplares codi- ficam qualquer produto de gene (por exemplo, transcrição, proteína, enzima) essencial para viabilidadae e/ou sobrevivência em um meio celular sem um ou mais nutrientes essenciais para a viabilidade ea/ou sobrevivência celular na lausência do gene de seleção. Genes de se- leção exemplares incluem, mas não estão limitadas a, neo (conferindo resistência à neomicina), TYMS (codificando Timidilato Sintetase), MGMT (codificando O(6)-metilguanina-DNA metiltransferase), gene de resistência a múltiplos fármacos (MDR1), ALDH1 (codificando família aldeído desidrogenase 1, membro A1), FRANCF, RAD51C (codifican- do RAD51 Parálogo C), GCS (codificando glucosilsíntese da cerami- da), e NKX2.2 (codificando NK2 Homeocaixa 2).
[0020] Transposons da presente invenção podem compreender um polipeptídeo proapoptótico induzível compreendendo (a) uma regi- ão de ligação ao ligante, (b) um ligante, e (c) um polipeptídeo proapop- tótico, em que o polipeptídeo proapoptótico induzível não compreende uma sequência não humana. Em certas modalidades, a sequência não humana compreende um sítio de restrição. Em certas modalidades, a região de ligação ao ligante pode ser uma região de ligação ao ligante multimérico. Polipeptídeos proapoptóticos induzíveis da presente in- venção podem também ser referidos como um "interruptor de segu- rança iC9". Em certas modalidades, transposons da presente invenção podem compreender um polipeptídeo de caspase induzível compreen- dendo (a) uma região de ligação ao ligante, (b) um ligante, e (c) um polipeptídeo de caspase, em que o polipeptídeo proapoptótico induzí- vel não compreende uma sequência não humana. Em certas modali- dades, transposons da presente invenção podem compreender um polipeptídeo de caspase induzível compreendendo (a) uma região de ligação ao ligante, (b) um ligante, e (c) um polipeptídeo de caspase,
em que o polipeptídeo proapoptótico induzível não compreende uma sequência não humana. Em certas modalidades, transposons da pre- sente invenção podem compreender um polipeptídeo de caspase in- duzível compreendendo (a) uma região de ligação ao ligante, (b) um ligante, e (c) um polipeptídeo de caspase 9 truncado, em que o poli- peptídeo proapoptótico induzível não compreende uma sequência não humana. Em certas modalidades dos polipeptídeos proapoptóticos in- duzíveis, polipeptídeos de caspase induzíveis ou polipeptídeos de caspase 9 truncados da presente invenção, a região de ligação ao li- gante podem compreender um polipeptídeo de proteína 12 de ligação a FK506 (FKBP12). Em certas modalidades, a sequência de aminoá- cido da região de ligação ao ligante que compreende um polipeptídeo de proteína 12 de ligação a FK506 (FKBP12) podem compreender uma modificação na posição 36 da sequência. A modificação pode ser uma substituição de valina (V) por fenilalanina (F) na posição 36 (F36V). Em certas modalidades, o polipeptídeo FKBP12 é codificado por uma sequência de aminoácido compreendendo
GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPF
KFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPP HATLVFDVELLKLE (SEQ ID NO: 18026). Em certas modalidades, o polipeptídeo FKBP12 é codificado por uma sequência de ácido nucleico compreendendo
GGGGTCCAGGTCGAGACTATTTCACCAGGGGATGGGCGAACATT TCCAAAAAGGGGCCAGACTTGCGTCGTGCATTACACCGGGATGCT GGAGGACGGGAAGAAAGTGGACAGCTCCAGGGATCGCAACAAGC CCTTCAAGTTCATGCTGGGAAAGCAGGAAGTGATCCGAGGATGG GAGGAAGGCGTGGCACAGATGTCAGTCGGCCAGCGGGCCAAACT GACCATTAGCCCTGACTACGCTTATGGAGCAACAGGCCACCCAG
GGATCATTCCCCCTCATGCCACCCTGGTCTTCGAT GTGGAACTGCTGAAGCTGGAG (SEQ ID NO: 18027). Em certas modalidades, o agente de indução específico para a região de ligação ao ligante pode compreender um polipeptídeo de proteína 12 de ligação a FK506 (FKBP12) tendo uma substituição de valina (V) por fenilalanina (F) na posição 36 (F36V) compreende AP20187 e/ou AP1903, ambos os fármacos sintéticos.
[0021] Em certas modalidades dos polipeptídeos proapoptóticos induzíveis, polipeptídeos de caspase induzíveis ou polipeptídeos de caspase 9 truncados da presente invenção, a região ligante é codifica- da por um aminoácido compreendendo GGGGS (SEQ ID NO: 18028) ou uma sequência de ácido nucleico compreendendo GGAGGAGGA- GGATCC (SEQ ID NO: 18029). Em certas modalidades, a sequência de ácido nucleico codificando o ligante não compreende um sítio de restrição.
[0022] Em certas modalidades do polipeptídeo de caspase 9 trun- cados da presente invenção, o polipeptídeo de caspase 9 truncado é codificado por uma sequência de aminoácido que não compreende uma arginina (R) na posição 87 da sequência. Alternativamente, ou em adição, em certas modalidades dos polipeptídeos proapoptóticos indu- zíveis, polipeptídeos de caspase induzíveis ou polipeptídeos de cas- pase 9 truncados da presente invenção, o polipeptídeo de caspase 9 truncado é codificado por uma sequência de aminoácido que não compreende uma alanina (A) na posição 282 d’a sequência. Em certas modalidades dos polipeptídeos proapoptóticos induzíveis, polipeptí- deos de caspase induzíveis ou polipeptídeos de caspase 9 truncados da presente invenção, o polipeptídeo de caspase 9 truncado é codifi- cado por um aminoácido compreendendo
GFGDVGALESLRGNADLAYILSMEPCGHCLIINNVNFCRESGLRTRT GSNIDCEKLRRRFSSLHFMVEVKGDLTAKKMVLALLELAQQDHGALD CCVVVILSHGCQASHLQFPGAVYGTDGCPVSVEKIVNIFNGTSCPSL GGKPKLFFIQACGGEQKDHGFEVASTSPEDESPGSNPEPDATPFQE GLRTFDQLDAISSLPTPSDIFVSYSTFPGFVSWRDPKSGSWYVETLD
DIFEQWAHSEDLQSLLLRVANAVSVKGIYKQMPGCFNFLRKKLFFKT S(SEQ ID NO: 18030) ou uma sequência de ácido nucleico compreendendo
GGATTTGGGGACGTGGGGGCCCTGGAGTCTCTGCGAGGAAATGC CGATCTGGCTTACATCCTGAGCATGGAACCCTGCGGCCACTGTCT GATCATTAACAATGTGAACTTCTGCAGAGAAAGCGGACTGCGAAC ACGGACTGGCTCCAATATTGACTGTGAGAAGCTGCGGAGAAGGTT CTCTAGTCTGCACTTTATGGTCGAAGTGAAAGGGGATCTGACCGC CAAGAAAATGGTGCTGGCCCTGCTGGAGCTGGCTCAGCAGGACC ATGGAGCTCTGGATTGCTGCGTGGTCGTGATCCTGTCCCACGGG TGCCAGGCTTCTCATCTGCAGTTCCCCGGAGCAGTGTACGGAACA GACGGCTGTCCTGTCAGCGTGGAGAAGATCGTCAACATCTTCAAC GGCACTTCTTGCCCTAGTCTGGGGGGAAAGCCAAAACTGTTCTTT ATCCAGGCCTGTGGCGGGGAACAGAAAGATCACGGCTTCGAGGT GGCCAGCACCAGCCCTGAGGACGAATCACCAGGGAGCAACCCTG AACCAGATGCAACTCCATTCCAGGAGGGACTGAGGACCTTTGACC AGCTGGATGCTATCTCAAGCCTGCCCACTCCTAGTGACATTTTCG TGTCTTACAGTACCTTCCCAGGCTTTGTCTCATGGCGCGATCCCA AGTCAGGGAGCTGGTACGTGGAGACACTGGACGACATCTTTGAA CAGTGGGCCCATTCAGAGGACCTGCAGAGCCTGCTGCTGCGAGT GGCAAACGCTGTCTCTGTGAAGGGCATCTACAAACAGATGCCCG
GGTGCTTCAATTTTCTGAGAAAGAAACTGTTCTTTAAGACTTCC (SEQ ID NO: 18031).
[0023] Em certas modalidades dos polipeptídeos proapoptóticos induzíveis, em que o polipeptídeo compreende um polipeptídeo de caspase 9 truncado, o polipeptídeo proapoptótico induzível é codifica- do por uma sequência de aminoácido compreendendo
GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPF KFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPP HATLVFDVELLKLEGGGGSGFGDVGALESLRGNADLAYILSMEPCGH CLIINNVNFCRESGLRTRTGSNIDCEKLRRRFSSLHFMVEVKGDLTAK KMVLALLELAQQDHGALDCCVVVILSHGCQASHLQFPGAVYGTDGC PVSVEKIVNIFNGTSCPSLGGKPKLFFIQACGGEQKDHGFEVASTSPE DESPGSNPEPDATPFQEGLRTFDQLDAISSLPTPSDIFVSYSTFPGFV
SWRDPKSGSWYVETLDDIFEQWAHSEDLQSLLLRVANAVSVKGIYK QMPGCFNFLRKKLFFKTS(SEQ ID NO: 18032) ou a sequência de ácido nucleico compreendendo ggggtccaggtcgagactatttcaccaggggatgggcgaacatttccaaaaaggggccagactt gcgtcgtgcattacaccgggatgctggaggacgggaagaaagtggacagctccagggatcgc aacaagcccttcaagttcatgctgggaaagcaggaagtgatccgaggatgggaggaaggcgt ggcacagatgtcagtcggccagcgggccaaactgaccattagccctgactacgcttatggagca acaggccacccagggatcattccccctcatgccaccctggtcttcgatgtggaactgctgaagctg gagggaggaggaggatccggatttggggacgtgggggccctggagtctctgcgaggaaatgc cgatctggcttacatcctgagcatggaaccctgcggccactgtctgatcattaacaatgtgaacttct gcagagaaagcggactgcgaacacggactggctccaatattgactgtgagaagctgcggaga aggttctctagtctgcactttatggtcgaagtgaaaggggatctgaccgccaagaaaatggtgctg gccctgctggagctggctcagcaggaccatggagctctggattgctgcgtggtcgtgatcctgtcc cacgggtgccaggcttctcatctgcagttccccggagcagtgtacggaacagacggctgtcctgt cagcgtggagaagatcgtcaacatcttcaacggcacttcttgccctagtctggggggaaagccaa aactgttctttatccaggcctgtggcggggaacagaaagatcacggcttcgaggtggccagcacc agccctgaggacgaatcaccagggagcaaccctgaaccagatgcaactccattccaggaggg actgaggacctttgaccagctggatgctatctcaagcctgcccactcctagtgacattttcgtgtctta cagtaccttcccaggctttgtctcatggcgcgatcccaagtcagggagctggtacgtggagacact ggacgacatctttgaacagtgggcccattcagaggacctgcagagcctgctgctgcgagtggca aacgctgtctctgtgaagggcatctacaaacagatgcccgggtgcttcaattttctgagaaagaaa ctgttctttaagacttcc(SEQ ID NO: 18033).
[0024] Transposons da presente invenção podem compreender pelo menos um peptídeo autoclivável localizado, por exemplo, entre uma ou mais Cetirinas ou CARTirinas da presente invenção e um gene de seleção da presente invenção. Transposons da presente invenção podem compreender pelo menos um peptídeo autoclivável(s) localiza- do, por exemplo, entre um ou mais Centirina(s) ou CARTirina(s) da presente invenção e um polipeptídeo proapoptótico induzível da pre- sente invenção. Transposons da presente invenção podem compreen- der pelo menos two peptídeos autocliváveis, um primeiro peptídeo au- toclivável localizado, por exemplo, um montante oui imediatamente uim montante de um polipeptídeo proapoptótico induzível da presente invenção e um segundo primeiro peptídeo autoclivável localizado, por exemplo, a jusante ou imediatamente um montante de um polipeptídeo proapoptótico induzível da presente invenção.
[0025] O referido pelo menos um peptídeo autoclivável pode com- preender, por exemplo, um peptídeo T2A, peptídeo GSG-T2A, um peptídeo E2A, um peptídeo GSG-E2A, um peptídeo F2A, um peptídeo GSG-F2A, um peptídeo P2A, ou um peptídeo GSG-P2A. Um peptídeo T pode compreender uma sequência de aminoácido compreendendo EGRGSLLTCGDVEENPGP (SEQ ID NO: 18034) OU UMA SEQUÊN- CIA tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo EGRGS- LLTCGDVEENPGP (SEQ ID NO: 18035). UM peptídeo GSG-T2A pode compreender uma sequência de aminoácido compreendendo GSGE- GRGSLLTCGDVEENPGP (SEQ ID NO: 18036) OU UMA SEQUÊNCIA tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo GSGEGRGSLLTCGDVE- ENPGP (SEQ ID NO: 18037). UM peptídeo AGSG-T2A peptide pode compreender uma sequência de ácido nucleico compreendendo gga- tctggagagggaaggggaagcctgctgacctgtggagacgtggaggaaaacccaggacca (SEQ ID NO: 18038). Um peptídeo E2A peptide pode compreender uma sequência de aminoácido compreendendo QCTNYALLKLAG- DVESNPGP (SEQ ID NO: 18039) ou uma sequência tendo pelo me-
nos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo QCTNYALLKLAGDVESNPGP (SEQ ID NO: 18040). UM peptídeo GSG-E2A GSGQCTNYALLKLAGDVESN- PGP (SEQ ID NO: 18041) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoáci- do compreendendo GSGQCTNYALLKLAGDVESNPGP (SEQ ID NO: 18042). UM peptídeo F2A peptide podem compreender uma sequên- cia de aminoácido compreendendo VKQTLNFDLLKLAGDVESNPGP (SEQ ID NO: 18043) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo VKQTLNFDLLKLAGDVESNPGP (SEQ ID NO: 18044).A GSG-F2A peptide podem compreender uma sequência de aminoácido compreendendo GSGVKQTLNFDLLKLAGDVESNPGP (SEQ ID NO: 18045) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo GSGVKQTLNFDLLKLAGDVESNPGP (SEQ ID NO: 18046). A P2A peptide podem compreender uma sequência de amino- ácido compreendendo ATNFSLLKQAGDVEENPGP (SEQ ID NO: 18047) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo ATNFSLLKQAGDVEENPGP (SEQ ID NO: 18048). UM PEPTÍDEO GSG-P2A podem compreender uma sequência de aminoácido com- preendendo GSGATNFSLLKQAGDVEENPGP (SEQ ID NO: 18049) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo GSGATNFSLLKQAGDVEENPGP (SEQ ID NO: 18050).
[0026] Transposons da presente invenção podem compreender um primeiro e um Segundo peptídeo de auto-clivagem, o primeiro pep- tídeo autoclivável localizadao, por exemplo, a montante de uma ou mais Centirinas ou CARTirinas da presente invenção o segundo peptí-
deo autoclivável localizado, por exemplo, a jusante das referidas uma ou mais Cetirinas ou CARTirinas da presente invenção.
O primeiro e/ou o segundo peptídeo autoclivável pode compreender, por exemplo, um peptídeo T2A, peptídeo GSG-T2A, um peptídeo E2A, um peptídeo GSG-E2A, um peptídeo F2A, um peptídeo GSG-F2A, um peptídeo P2A, ou um peptídeo GSG-P2A.
Um peptídeo T pode compreender uma sequência de aminoácido compreendendo EGRGSLLTCGDVE- ENPGP (SEQ ID NO: 18034) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo EGRGSLLTCGDVEENPGP (SEQ ID NO: 18035). UM peptídeo GSG-T2A pode compreender uma sequência de aminoácido compreendendo GSGEGRGSLLTCGDVEENPGP (SEQ ID NO: 18036) OU UMA SEQUÊNCIA tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compre- endendo GSGEGRGSLLTCGDVEENPGP (SEQ ID NO: 18037). UM PEPTÍDEO GSG-T2A pode compreender uma sequência de ácido nucleico compreendendo ggatctggagagggaaggggaagcctgctgacctgtg- gagacgtggaggaaaacccaggacca (SEQ ID NO: 18038). Um peptídeo E2A pode compreender uma sequência de aminoácido compreen- dendo QCTNYALLKLAGDVESNPGP (SEQ ID NO: 18039) ou uma se- quência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identida- de para a sequência de aminoácido compreendendo QCTNYALL- KLAGDVESNPGP (SEQ ID NO: 18040). A GSG-E2A peptide podem compreender uma sequência de aminoácido compreendendo GSGQCTNYALLKLAGDVESNPGP (SEQ ID NO: 18041) ou uma se- quência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identida- de para a sequência de aminoácido compreendendo GSGQCTNYALLKLAGDVESNPGP (SEQ ID NO: 18042). Um peptí- deo F2A pode compreender uma sequência de aminoácido compreen- dendo VKQTLNFDLLKLAGDVESNPGP (SEQ ID NO: 18043) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identi- dade para a sequência de aminoácido compreendendo VKQTLN- FDLLKLAGDVESNPGP (SEQ ID NO: 18044). A GSG-F2A peptide po- dem compreender uma sequência de aminoácido compreendendo GSGVKQTLNFDLLKLAGDVESNPGP (SEQ ID NO: 18045) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identi- dade para a sequência de aminoácido compreendendo GSGVKQTLN- FDLLKLAGDVESNPGP (SEQ ID NO: 18046). A P2A peptide podem compreender uma sequência de aminoácido compreendendo ATNFS- LLKQAGDVEENPGP (SEQ ID NO: 18047) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a se- quência de aminoácido compreendendo ATNFSLLKQAGDVEENPGP (SEQ ID NO: 18048). UM peptídeo GSG-P2A pode compreender uma sequência de aminoácido compreendendo GSGATNFSLLKQAGDVE- ENPGP (SEQ ID NO: 18049) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo GSGATNFSLLKQAGDVEENPGP (SEQ ID NO: 18050).
[0027] Em algumas modalidades dos transposons da presente in- venção, incluindo aqueles compreendendo um CAR da presente in- venção, o transposon também compreende uma sequência codifican- do um receptor estimulatório quimérico (CSR). Em algumas modalida- des, o CSR compreende: (a) um ectodomínio compreendendo um componente de ativação; (b) um domínio de transmembrana; e (c) um endodomínio compreendendo pelo menos um domínio de transdução de sinal; em que a combinação de (a), (b) e (c) é de ocorrência não natural. Em algumas modalidades, o componente de ativação de (a) é isolado ou derivado de uma primeira proteína. Em algumas modalida- des, o referido pelo menos um domínio de transdução de sinal de (c) é isolado ou derivado de uma segunda proteína. Em algumas modalida-
des, a primeira proteína e a segunda proteína não são idênticas.
Em algumas modalidades, o componente de ativação compreende um ou mais dentre um componente de um receptor de transmembrana hu- mana, um receptor de superfície celular humano, um receptor de célu- la T (TCR), um componente de um complexo de TCR, um componente de um correceptor de TCR, um componente de uma proteína coesti- mulatória de TCR, um componente de uma proteína inibitória de TCR, um receptor de citocina, e um receptor de quimiocina.
Em algumas modalidades, o componente de ativação compreende uma porção de um ou mais dentre um componente de um receptor de célula T (TCR), um componente de um complexo de TCR, um componente de um cor- receptor de TCR, um componente de uma proteína coestimulatória de TCR, um componente de uma proteína inibitória de TCR, um receptor de citocina, e um receptor de quimiocina ao qual um agonista do com- ponente de ativação se liga.
Em algumas modalidades, o componente de ativação compreende uma proteína CD2 ou uma porção da mesma ao qual um agonista se liga.
Em algumas modalidades, o domínio de transdução de sinal compreende um ou mais dentre um componente de um domínio de transdução de sinal humano, receptor de célula T (TCR), um componente de um complexo de TCR, um componente de um correceptor de TCR, um componente de uma proteína coestimula- tória de TCR, um componente de uma proteína inibitória de TCR, um receptor de citocina, e um receptor de quimiocina.
Em algumas moda- lidades, o domínio de transdução de sinal compreende uma proteína CD3. Em algumas modalidades, a proteína CD3 compreende uma pro- teína CD3ζ.
Em algumas modalidades, o endodomínio também com- preende um domínio citoplásmico.
Em algumas modalidades, o domí- nio citoplásmico é isolado ou derivado de uma terceira proteína.
Em algumas modalidades, a primeira proteína e a terceira proteína são idênticas.
Em algumas modalidades, o ectodomínio também compre-
ende um peptídeo sinal. Em algumas modalidades, o peptídeo sinal é derivado de uma quarta proteína. Em algumas modalidades, a primeira proteína e a quarta proteína são idênticas. Em algumas modalidades, o domínio de transmembrana é isolado ou derivado de uma quinta pro- teína. Em algumas modalidades, a primeira proteína e a quinta proteí- na são idênticas. Em algumas modalidades, o componente de ativação não se liga a uma molécula de ocorrência natural. Em algumas moda- lidades, o CSR não transduz um sinal após ligação do componente de ativação a uma molécula de ocorrência natural. Em algumas modali- dades, o ectodomínio compreende uma modificação. Em algumas mo- dalidades, a modificação compreende uma mutação ou uma truncação de uma sequência codificando o componente de ativação quando comparado a uma sequência do tipo selvagem de uma primeira prote- ína. Em algumas modalidades, o componente de ativação liga-se a uma molécula de ocorrência não natural. Em algumas modalidades, o CSR seletivamente transduz um sinal após ligação do componente de ativação a uma molécula de ocorrência não natural.
[0028] Em algumas modalidades dos transposons da presente in- venção, o transposon é um transposon piggyBac ou um semelhante a piggyBac.
[0029] Em algumas modalidades dos transposons da presente in- venção, o transposon é um transposon TcBuster.
[0030] Em algumas modalidades dos transposons da presente in- venção, o transposon é um transposon Sleeping Beauty.
[0031] Em algumas modalidades dos transposons da presente in- venção, o transposon é um transposon Helraiser.
[0032] Em algumas modalidades dos transposons da presente in- venção, o transposon é um Transposon Tol2.
[0033] A presente invenção fornece uma composição compreen- dendo o transposon da presente invenção. Em certas modalidades, a composição pode também compreender um plasmídeo compreenden- do uma sequência codificando um enzima transposase. A sequência codificando a enzima transposase pode ser uma sequência de mRNA.
[0034] A presente invenção fornece uma composição compreen- dendo um CAR da presente invenção. Em algumas modalidades, a composição também compreende a CSR da presente invenção ou uma sequência codificando o CSR. Em algumas modalidades,a se- quência codificando o CSR compreende DNA. Em algumas modalida- des, a sequência codificando o CSR compreende RNA. Em algumas modalidades, a sequência codificando o CSR compreende RNA men- sageiro (mRNA). Em algumas modalidades, após introdução a uma célula da presente invenção, o CSR ou a sequência codificando o CSR é estavelmente integrada pela célula. Em algumas modalidades, após introdução a uma célula da presente invenção, o CSR ou a sequência codificando o CSR não é estavelmente integrada pela célula. Em al- gumas modalidades, após introdução a uma célula da presente inven- ção, o CSR ou a sequência codificando o CSR é estavelmente expres- so pela célula. Em algumas modalidades, após introdução a uma célu- la da presente invenção, o CSR ou a sequência codificando o CSR é transitoriamente expresso pela célula. Em algumas modalidades, após introdução a uma célula da presente invenção, o CSR ou a sequência codificando o CSR compreende um RNA ou um mRNA e o CSR ou a sequência codificando o CSR é transitoriamente expresso pela célula.
[0035] A presente invenção fornece uma célula compreendendo um CAR da presente invenção. Em algumas modalidades, a célula também compreende a CSR da presente invenção ou uma sequência codificando o CSR. Em algumas modalidades, a sequência codifican- do o CSR compreende DNA. Em algumas modalidades, a sequência codificando o CSR compreende RNA. Em algumas modalidades, a se- quência codificando o CSR compreende RNA mensageiro (mRNA).
Em algumas modalidades, o CSR ou a sequência codificando o CSR é estavelmente ligada em um locus ou loci genômicos da célula. Em al- gumas modalidades, o CSR ou a sequência codificando o CSR não é estavelmente integrado em um locus ou loci genômicos da célula. Em algumas modalidades, o CSR ou a sequência codificando o CSR é es- tavelmente expresso pela célula. Em algumas modalidades, o CSR ou a sequência codificando o CSR é transitoriamente expresso pela célu- la. Em algumas modalidades, o CSR ou a sequência codificando o CSR compreende um RNA ou um mRNA e o CSR ou a sequência co- dificando o CSR é transitoriamente expresso pela célula.
[0036] Transposons da presente invenção podem compreender transposons piggyBac. Em certas modalidades deste método, o trans- poson é um um transposon de DNA plasmídeo com uma sequência codificando o receptor de antígeno quimérico flanqueado por dois ele- metos isolates cis-regulatórios. Em certas modalidades, o transposon é um transposon piggyBac ou um semelhante a piggyBac.
[0037] Enzimas transposases da presente invenção podem incluir- transposases piggyBac ou enzimas compatíveis. Enzimas transposa- ses da presente invenção podem incluir transposases semelhantes à piggyBac ou enzimas compatíveis. Em certas modalidades, e, em par- ticular, aquelas modalidades em que o transposon é um transposon piggyBac, a transposase é uma transposase piggyBac™ ou uma Su- per piggyBac™ (SPB). Em certas modalidades, e, em particular, aque- las modalidades em que a transposase é uma transposase Super piggyBac™ (SPB), a sequência codificando a transposase é uma se- quência de mRNA.
[0038] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac™ (PB). A enzima transposase piggyBac (PB) pode compreender ou consistir em uma sequência de aminoácido pelo menos 75%, 80%, 85%, 90%,
95%, 99% ou qualquer percentagem entre estas idêntica a: 1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEI SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG 61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG 121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTGATFRD TNEDEIYAFF 181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV 241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RMYIPNKPSK YGIKILMMCD 301 SGTKYMINGM PYLGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ 361 EPYKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVYLLSSC 421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN 481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRYLRD NISNILPNEV 541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF (SEQ ID NO: 14487).
[0039] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac™ (PB) que compreende ou consiste em uma sequência de aminoácido tendo uma substituição de aminoácido em uma ou mais das posições 30, 165, 282, ou 538 da sequência: 1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEI SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG 61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG 121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTGATFRD TNEDEIYAFF 181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV 241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RMYIPNKPSK YGIKILMMCD 301 SGTKYMINGM PYLGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ 361 EPYKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVYLLSSC 421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN 481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRYLRD NISNILPNEV 541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF (SEQ ID NO: 14487).
[0040] Em certas modalidades, a enzima transposase é uma en- zima transposase piggyBac™ (PB) que compreende ou consiste em uma sequência de aminoácido tendo uma substituição de aminoácido em duas ou mais das posições 30, 165, 282, ou 538 da sequência de SEQ ID NO: 14487. Em certas modalidades, a enzima transposase é uma enzima transposase piggyBac™ (PB) que compreende ou consis- te em uma sequência de aminoácido tendo uma substituição de ami- noácido em três ou mais das posições 30, 165, 282, ou 538 da se- quência de SEQ ID NO: 14487. Em certas modalidades, a enzima transposase é uma enzima transposase piggyBac™ (PB) que compre- ende ou consiste em uma sequência de aminoácido tendo uma substi- tuição de aminoácido em cada uma das seguintes posições 30, 165, 282, e 538 da sequência de SEQ ID NO: 14487. Em certas modalida- des, a substituição de aminoácido na posição 30 da sequência de SEQ ID NO: 14487 é uma substituição de uma valina (V) por uma isoleucina (I). Em certas modalidades, a substituição de aminoácido na posição 165 da sequência de SEQ ID NO: 14487 é uma substituição de uma serina (S) por uma glicina (G). Em certas modalidades, a substituição de aminoácido na posição 282 da sequência de SEQ ID NO: 14487 é uma substituição de uma valina (V) por uma metionina (M). Em certas modalidades, a substituição de aminoácido na posição 538 da se- quência de SEQ ID NO: 14487 é uma substituição de uma lisina (K) por uma asparagina (N).
[0041] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase Super piggyBac™ (sPBo). Em certas modalidades, as enzimas transposases Super piggyBac™ (sPBo) da presente invenção podem compreender ou con- sistir em uma sequência de aminoácido da sequência de SEQ ID NO: 14487 em que a substituição de aminoácido na posição 30 é uma substituição de uma valina (V) por uma isoleucina (I), a substituição de aminoácido na posição 165 é uma substituição de uma serina (S) por uma glicina (G), a substituição de aminoácido na posição 282 é uma substituição de uma valina (V) por uma metionina (M), e uma substitui- ção de aminoácido na posição 538 é uma substituição de uma lisina (K) por uma asparagina (N). Em certas modalidades, a enzima trans- posase Super piggyBac™ (sPBo) pode compreender ou consistir em uma sequência de aminoácido pelo menos 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idêntica a: 1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEV SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG 61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG
121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTSATFRD TNEDEIYAFF 181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV 241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RVYIPNKPSK YGIKILMMCD 301 SGTKYMINGM PYLGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ 361 EPYKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVYLLSSC 421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN 481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRYLRD NISNILPKEV 541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF (SEQ ID NO: 14484).
[0042] Em certas modalidades dos métodos da presente invenção, a enzima transposase é um transposon TcBuster e em que a enzima transposase é uma enzima transposase TcBuster. Em algumas moda- lidades, a enzima transposase TcBuster é uma enzima transposase TcBuster hiperativa. Em algumas modalidades, a enzima transposase TcBuster compreende uma sequência tendo pelo menos 75% de iden- tidade para:
MMLNWLKSGK LESQSQEQSS CYLENSNCLP PTLDSTDIIG EENKAGTTSR KKRKYDEDYL NFGFTWTGDK DEPNGLCVIC EQVVNNSSLN PAKLKRHLDT KHPTLKGKSE YFKRKCNELN QKKHTFERYV RDDNKNLLKA SYLVSLRIAK QGEAYTIAEK LIKPCTKDLT TCVFGEKFAS KVDLVPLSDT TISRRIEDMS YFCEAVLVNR LENAKCGFTL QMDESTDVAG LAILLVFVRY IHESSFEEDM LFCKALPTQT TGEEIFNLLN AYFEKHSIPW NLCYHICTDG AKAMVGVIKG VIARIKKLVP DIKASHCCLH RHALAVKRIP NALHEVLNDA VKMINFIKSR PLNARVFALL CDDLGSLHKN LLLHTEVRWL SRGKVLTRFW ELRDEIRIFF NEREFAGKLN DTSWLQNLAY IADIFSYLNE VNLSLQGPNS TIFKVNSRIN SIKSKLKLWE ECITKNNTEC FANLNDFLET SNTALDPNLK SNILEHLNGL KNTFLEYFPP TCNNISWVEN PFNECGNVDT LPIKEREQLI
DIRTDTTLKS SFVPDGIGPF WIKLMDEFPE ISKRAVKELM PFVTTYLCEK SFSVYVATKT KYRNRLDAED DMRLQLTTIH PDIDNLCNNK QAQKSH (SEQ ID NO: 17900).
[0043] Em certas modalidades dos métodos da presente invenção, a enzima transposase é um transposon Sleeping Beauty e a enzima transposase é uma enzima transposase Sleeping Beauty. Em algumas modalidades, a enzima transposase Sleeping Beauty compreende a sequência de SEQ ID NO: 14485. Em algumas modalidades, a enzima transposase Sleeping Beauty é uma transposase Sleeping Beauty hi- perativa (SB100X). Em algumas modalidades, a transposase Sleeping Beauty hiperativa (SB100X) compreende a sequência de SEQ ID NO:
14486.
[0044] Em certas modalidades dos métodos da presente invenção,
a enzima transposase é um transposon Helraiser e em que a enzima transposase é uma enzima transposase Helraiser. Em algumas moda- lidades, a enzima transposase Helraiser compreende a sequência de SEQ ID NO: 14501.
[0045] Em certas modalidades dos métodos da presente invenção, a enzima transposase é um transposon Tol2 e em que a enzima trans- posase é uma enzima transposase Tol2. Em algumas modalidades, a enzima transposase Tol2 compreende a sequência de SEQ ID NO:
14502.
[0046] A presente invenção fornece um vetor compreendendo a CARTirina da presente invenção. Em certas modalidades, o vetor é um vetor viral. O vetor pode ser um vetor recombinante.
[0047] Vetores virais da presente invenção podem compreender uma sequência isolada ou derivada de um retrovírus, um lentivírus, um adenovírus, um vírus adenoassociado ou qualquer combinação dos mesmos. O vetor viral pode compreender uma sequência isolada ou derivada de um vírus adenoassociado (AAV). O vetor viral pode com- preender um AAV recombinante (rAAV). Exemplos de viroses adeno- associadas e viroses adenoassociadas recombinantes da presente invenção compreendem duas ou mais sequências de repetição de terminal invertido (ITR) localizada em cis próximo a uma sequência codificando uma Centirina or CARTirina da presente invenção. Exem- plos de viroses adenoassociadas e viroses adenoassociadas recombi- nantes da presente invenção incluem, mas não estão limitadas a todos os sorotipos (por exemplo, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, e AAV9). Exemplos de viroses adenoassociadas e viro- ses adenoassociadas recombinantes da presente invenção incluem, mas não estão limitados a, AAV autocomplementares (scAAV) híbridos de AAV contendo o genoma de um sorotipo e o capsídeo de outro so- rotipo (por exemplo, AAV2/5, AAV-DJ e AAV-DJ8). Exemplos de viro-
ses adenoassociadas e viroses adenoassociadas recombinantes da presente invenção incluem, mas não estão limitados a, rAAV-LK03.
[0048] Vetores virais da presente invenção podem compreender um gene de seleção. O gene de seleção pode codificar um produto de gene essencial para a viabilidade e sobrevivência celular. O gene de seleção pode codificar um produto de gene essencial para a viabilida- de e sobrevivência celular quando desafiado por condições de cultura celular seletiva. Condições de cultura celular seletiva podem compre- ender um composto prejudicial à viabilidade ou sobrevivência celular e em que o produto de gene confere resistência ao composto. Genes de seleção exemplares da presente invenção podem incluir, mas não es- tão limitados a, neo (conferindo resistência à neomicina), TYMS (codi- ficando Timidilato Sintetase), MGMT (codificando O(6)-metilguanina- DNA metiltransferase), gene de resistência a múltiplos fármacos (MDR1), ALDH1 (codificando família aldeído desidrogenase 1, mem- bro A1), FRANCF, RAD51C (codificando RAD51 Parálogo C), GCS (codificando glucosilsíntese da ceramida), NKX2.2 (codificando NK2 Homeocaixa 2) ou qualquer combinação dos mesmos.
[0049] Vetores virais da presente invenção podem compreender um polipeptídeo proapoptótico induzível compreendendo (a) uma regi- ão de ligação ao ligante, (b) um ligante, e (c) um polipeptídeo proapop- tótico, em que o polipeptídeo proapoptótico induzível não compreende uma sequência não humana. Em certas modalidades, a sequência não humana compreende um sítio de restrição. Em certas modalidades, a região de ligação ao ligante pode ser uma região de ligação ao ligante multimérico. Polipeptídeos proapoptóticos induzíveis da presente in- venção podem também ser referidos como um "interruptor de segu- rança iC9". Em certas modalidades, vetores virais da presente inven- ção podem compreender um polipeptídeo de caspase induzível com- preendendo (a) uma região de ligação ao ligante, (b) um ligante, e (c)
um polipeptídeo de caspase, em que o polipeptídeo proapoptótico in- duzível não compreende uma sequência não humana. Em certas mo- dalidades, vetores virais da presente invenção podem compreender um polipeptídeo de caspase induzível compreendendo (a) uma região de ligação ao ligante, (b) um ligante, e (c) um polipeptídeo de caspase, em que o polipeptídeo proapoptótico induzível não compreende uma sequência não humana. Em certas modalidades, vetores virais da pre- sente invenção podem compreender um polipeptídeo de caspase in- duzível compreendendo (a) uma região de ligação ao ligante, (b) um ligante, e (c) um polipeptídeo de caspase 9 truncado, em que o poli- peptídeo proapoptótico induzível não compreende uma sequência não humana. Em certas modalidades dos polipeptídeos proapoptóticos in- duzíveis, polipeptídeos de caspase induzíveis ou polipeptídeos de caspase 9 truncados da presente invenção, a região de ligação ao li- gante podem compreender um polipeptídeo de proteína 12 de ligação a FK506 (FKBP12). Em certas modalidades, a sequência de aminoá- cido da região de ligação ao ligante que compreende um polipeptídeo de proteína 12 de ligação a FK506 (FKBP12) podem compreender uma modificação na posição 36 da sequência. A modificação pode ser uma substituição de valina (V) por fenilalanina (F) na posição 36 (F36V). Em certas modalidades, o polipeptídeo FKBP12 é codificado por uma sequência de aminoácido compreendendo GVQVETISPGD- GRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQE- VIRGWEEGVAQMSVGQRAKLTISP- DYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID NO: 18026). Em certas modalidades, o polipeptídeo FKBP12 é codificado por uma se- quência de ácido nucleico compreendendo
GGGGTCCAGGTCGAGACTATTTCACCAGGGGATGGGCGAACATT TCCAAAAAGGGGCCAGACTTGCGTCGTGCATTACACCGGGATGCT GGAGGACGGGAAGAAAGTGGACAGCTCCAGGGATCGCAACAAGC CCTTCAAGTTCATGCTGGGAAAGCAGGAAGTGATCCGAGGATGG GAGGAAGGCGTGGCACAGATGTCAGTCGGCCAGCGGGCCAAACT GACCATTAGCCCTGACTACGCTTATGGAGCAACAGGCCACCCAG
GGATCATTCCCCCTCATGCCACCCTGGTCTTCGAT GTGGAACTGCTGAAGCTGGAG (SEQ ID NO: 18027). Em certas modalidades, o agente de indução específico para a região de ligação ao ligante podem compreender um polipeptídeo de proteína 12 de ligação a FK506 (FKBP12) tendo uma substituição de valina (V) por fenilalanina (F) na posição 36 (F36V) compreende AP20187 e/ou AP1903, ambos os fármacos sintéticos.
[0050] Em certas modalidades dos polipeptídeos proapoptóticos induzíveis, polipeptídeos de caspase induzíveis ou polipeptídeos de caspase 9 truncados da presente invenção, a região ligante é codifica- da por um aminoácido compreendendo GGGGS (SEQ ID NO: 18028) ou uma sequência de ácido nucleico compreendendo o peptídeo GGAGGAG A GSG-T2A podem A GSG-T2A peptide podem GAGGA- TCC (SEQ ID NO: 18029). Em certas modalidades, a sequência de ácido nucleico codificando o ligante não compreende um sítio de res- trição.
[0051] Em certas modalidades do polipeptídeo de caspase 9 trun- cados da presente invenção, o polipeptídeo de caspase 9 truncado é codificado por uma sequência de aminoácido que não compreende uma arginina (R) na posição 87 da sequência. Alternativamente, ou em adição, em certas modalidades dos polipeptídeos proapoptóticos indu- zíveis, polipeptídeos de caspase induzíveis ou polipeptídeos de cas- pase 9 truncados da presente invenção, o polipeptídeo de caspase 9 truncado é codificado por uma sequência de aminoácido que não compreende uma alanina (A) na posição 282 da sequência. Em certas modalidades dos polipeptídeos proapoptóticos induzíveis, polipeptí- deos de caspase induzíveis ou polipeptídeos de caspase 9 truncados da presente invenção, o polipeptídeo de caspase 9 truncado é codifi- cado por um aminoácido compreendendo GFGDVGALESLRG- NADLAYILSMEPCGHCLIINNVNFCRESGLRTRTGSNIDCEKL- RRRFSSLHFMVEVKGDLTAKKMVLALLE- LAQQDHGALDCCVVVILSHGCQASHLQFPGAVYGTDG- CPVSVEKIVNIFNGTSCPSLGGKPKLFFIQACGGEQKDHGFEVASTS- PEDESPGSNPEPDATPFQEGLRTFDQLDAISSLPTPSDIFVSYST- FPGFVSWRDPKSGSWYVETLDDIFEQWAHSEDLQSLLLRVANA- VSVKGIYKQMPGCFNFLRKKLFFKTS (SEQ ID NO: 18030) ou uma sequência de ácido nucleico compreendendo GGATTTGGGGACG- TGGGGGCCCTGGAGTCTCTGCGAGGAAATGCCGATCTGGCTTA- CATCCTGAGCATGGAACCCTGCGGCCACTGTCTGATCATTAACA- ATGTGAACTTCTGCAGAGAAAGCGGACTGCGAACACGGACTGG- CTCCAATATTGACTGTGAGAAGCTGCGGAGAAGGTTCTCTAG- TCTGCACTTTATGGTCGAAGTGAAAGGGGATCTGACCG- CCAAGAAAATGGTGCTGGCCCTGCTGGAGCTGGCTCAGCAGGA- CCATGGAGCTCTGGATTGCTGCGTGGTCGTGATCCTG- TCCCACGGGTGCCAGGCTTCTCATCTGCAGTTCCCCGGAGCAG- TGTACGGAACAGACGGCTGTCCTGTCAGCGTGGAGAAGATCGT- CAACATCTTCAACGGCACTTCTTGCCCTAGTCTGGGGGGAAAG- CCAAAACTGTTCTTTATCCAGGCCTGTGGCGGGGAACAGAAAGA- TCACGGCTTCGAGGTGGCCAGCACCAGCCCTGAGGACGAAT- CACCAGGGAGCAACCCTGAACCAGATGCAACTCCATTCCAGGA- GGGACTGAGGACCTTTGACCAGCTGGATGCTATCTCAAGCCTG- CCCACTCCTAGTGACATTTTCGTGTCTTACAGTACCTTCCCAGG- CTTTGTCTCATGGCGCGATCCCAAGTCAGGGAGCTGGTACGTG- GAGACACTGGACGACATCTTTGAACAGTGGGCCCATTCAGAGGA- CCTGCAGAGCCTGCTGCTGCGAGTGGCAAACGCTGTCTCTG- TGAAGGGCATCTACAAACAGATGCCCGGGTGCTTCAATTTT- CTGAGAAAGAAACTGTTCTTTAAGACTTCC (SEQ ID NO: 18031).
[0052] Em certas modalidades dos polipeptídeos proapoptóticos induzíveis, em que o polipeptídeo compreende um polipeptídeo de caspase 9 truncado, o polipeptídeo proapoptótico induzível é codifica- do por uma sequência de aminoácido compreendendo
GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPF KFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPP HATLVFDVELLKLEGGGGSGFGDVGALESLRGNADLAYILSMEPCGH CLIINNVNFCRESGLRTRTGSNIDCEKLRRRFSSLHFMVEVKGDLTAK KMVLALLELAQQDHGALDCCVVVILSHGCQASHLQFPGAVYGTDGC PVSVEKIVNIFNGTSCPSLGGKPKLFFIQACGGEQKDHGFEVASTSPE DESPGSNPEPDATPFQEGLRTFDQLDAISSLPTPSDIFVSYSTFPGFV
SWRDPKSGSWYVETLDDIFEQWAHSEDLQSLLLRVANAVSVKGIYK QMPGCFNFLRKKLFFKTS (SEQ ID NO: 18032) ou a sequência de ácido nucleico compreendendo ggggtccaggtcgagactatttcaccaggggatgggcgaacatttccaaaaaggggccagactt gcgtcgtgcattacaccgggatgctggaggacgggaagaaagtggacagctccagggatcgc aacaagcccttcaagttcatgctgggaaagcaggaagtgatccgaggatgggaggaaggcgt ggcacagatgtcagtcggccagcgggccaaactgaccattagccctgactacgcttatggagca acaggccacccagggatcattccccctcatgccaccctggtcttcgatgtggaactgctgaagctg gagggaggaggaggatccggatttggggacgtgggggccctggagtctctgcgaggaaatgc cgatctggcttacatcctgagcatggaaccctgcggccactgtctgatcattaacaatgtgaacttct gcagagaaagcggactgcgaacacggactggctccaatattgactgtgagaagctgcggaga aggttctctagtctgcactttatggtcgaagtgaaaggggatctgaccgccaagaaaatggtgctg gccctgctggagctggctcagcaggaccatggagctctggattgctgcgtggtcgtgatcctgtcc cacgggtgccaggcttctcatctgcagttccccggagcagtgtacggaacagacggctgtcctgt cagcgtggagaagatcgtcaacatcttcaacggcacttcttgccctagtctggggggaaagccaa aactgttctttatccaggcctgtggcggggaacagaaagatcacggcttcgaggtggccagcacc agccctgaggacgaatcaccagggagcaaccctgaaccagatgcaactccattccaggaggg actgaggacctttgaccagctggatgctatctcaagcctgcccactcctagtgacattttcgtgtctta cagtaccttcccaggctttgtctcatggcgcgatcccaagtcagggagctggtacgtggagacact ggacgacatctttgaacagtgggcccattcagaggacctgcagagcctgctgctgcgagtggca aacgctgtctctgtgaagggcatctacaaacagatgcccgggtgcttcaattttctgagaaagaaa ctgttctttaagacttcc(SEQ ID NO: 18033).
[0053] Vetores virais da presente invenção podem compreender pelo menos um peptídeo autoclivável. Em algumas modalidades, o ve- tor podem compreender pelo menos um peptídeo autoclivável e em que um peptídeo autoclivável é localizado entre a CARtirina e um gene de seleção. Em algumas modalidades, o vetor podem compreender pelo menos um peptídeo autoclivável e em que um primeiro peptídeo autoclivável é localizado a montante de uma CARtirina e um segundo peptídeo autoclivável é localizado a jusante de uma CARTirina. Veto- res virais da presente invenção podem compreender pelo menos um peptídeo autoclivável localizado, por exemplo, entre um ou mais dentre uma CARTirina, CAR ou CAR da presente invenção e um polipeptídeo proapoptótico induzível da presente invenção. Vetores virais da pre- sente invenção podem compreender pelo menos dois peptídeos auto- cliváveis, um primeiro peptídeo autoclivável localizado, por exemplo, a montante ou imediatamente a montante de um polipeptídeo proapoptó- tico induzível da presente invenção e um segundo primeiro peptídeo autoclivável localizado, por exemplo, a jusante ou imediatamente a montante de um polipeptídeo proapoptótico induzível da presente in- venção. O peptídeo autoclivável pode compreender, por exemplo, um peptídeo T2A, peptídeo GSG-T2A, um peptídeo E2A, um peptídeo GSG-E2A, um peptídeo F2A, um peptídeo GSG-F2A, um peptídeo P2A, ou um peptídeo GSG-P2A. Um peptídeo T pode compreender uma sequência de aminoácido compreendendo EGRGSLLTCGDVE- ENPGP (SEQ ID NO: 18034) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo EGRGSLLTCGDVEENPGP (SEQ ID NO: 18035). Um peptídeo GSG-T2A pode compreender uma sequência de aminoácido compreendendo GSGEGRGSLLTCGDVEENPGP (SEQ ID NO: 18036) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compre- endendo GSGEGRGSLLTCGDVEENPGP (SEQ ID NO: 18037). UM peptídeo GSG-T2A pode compreender uma sequência de ácido nu- cleico compreendendo ggatctggagagggaaggggaagcctgctgacctgtgga- gacgtggaggaaaacccaggacca (SEQ ID NO: 18038). Um peptídeo E2A pode compreender uma sequência de aminoácido compreendendo QCTNYALLKLAGDVESNPGP (SEQ ID NO: 18039) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo QCTNYALLKLAGDVESN- PGP (SEQ ID NO: 18040). Um peptídeo GSG-E2A pode compreender uma sequência de aminoácido compreendendo GSGQCTNYALL- KLAGDVESNPGP (SEQ ID NO: 18041) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo GSGQCTNYALLKLAGDVESNPGP (SEQ ID NO: 18042). UM peptídeo F2A pode compreender uma se- quência de aminoácido compreendendo VKQTLNFDLLKLAGDVESN- PGP (SEQ ID NO: 18043) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoáci- do compreendendo VKQTLNFDLLKLAGDVESNPGP (SEQ ID NO: 18044). Um peptídeo GSG-F2A pode compreender uma sequência de aminoácido compreendendo GSGVKQTLNFDLLKLAGDVESNPGP (SEQ ID NO: 18045) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo GSGVKQTLNFDLLKLAGDVESNPGP (SEQ ID NO: 18046). UM peptídeo P2A peptide podem compreender uma sequên- cia de aminoácido compreendendo ATNFSLLKQAGDVEENPGP (SEQ ID NO: 18047) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compre-
endendo ATNFSLLKQAGDVEENPGP (SEQ ID NO: 18048). UM PEP- TÍDEO GSG-P2A podem compreender uma sequência de aminoácido compreendendo GSGATNFSLLKQAGDVEENPGP (SEQ ID NO: 18049) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo GSGATNFSLLKQAGDVEENPGP (SEQ ID NO: 18050).
[0054] A presente invenção fornece um vetor compreendendo uma CARTirina da presente invenção. Em certas modalidades, o vetor é uma nanopartícula. Exemplos de vetores de nanopartícula da presente invenção incluem, mas não estão limitado a, ácidos nucleicos (por exemplo, RNA, DNA, nucleotídeos sintéticos, nucleotídeos modifica- dos ou qualquer combinação dos mesmos ), aminoácidos (L- aminoácidos, D-aminoácidos, aminoácidos sintéticos, aminoácidos modificados, ou qualquer combinação dos mesmos), polímeros (por exemplo, polimersomas), micelas, lipídeos (por exemplo, lipossomas), moléculas orgânicas (por exemplo, átomos de carbono, folhas, fibras, tubos), moléculas inorgânicas (por exemplo, fosfato de cálcio ou ouro) ou qualquer combinação dos mesmos. Um vetor de nanopartícula po- de ser passivelmente ou ativamente transportado através de uma membrana celular.
[0055] Vetores de nanopartícula da presente invenção podem compreender um gene de seleção. O gene de seleção pode codificar um produto de gene essencial para a viabilidade e sobrevivência celu- lar. O gene de seleção pode codificar um produto de gene essencial para a viabilidade e sobrevivência celular quando desafiado por condi- ções de cultura celular seletiva. Condições de cultura celular seletiva podem compreender um composto prejudicial à viabilidade ou sobrevi- vência celular e em que o produto de gene confere resistência ao composto. Genes de seleção exemplares da presente invenção podem incluir, mas não estão limitados a, neo (conferindo resistência à neo-
micina), TYMS (codificando Timidilato Sintetase), MGMT (codificando O(6)-metilguanina-DNA metiltransferase), gene de resistência a múlti- plos fármacos (MDR1), ALDH1 (codificando família aldeído desidroge- nase 1, membro A1), FRANCF, RAD51C (codificando RAD51 Parálo- go C), GCS (codificando glucosilsíntese da ceramida), NKX2.2 (codifi- cando NK2 Homeocaixa 2) ou qualquer combinação dos mesmos.
[0056] Vetores de nanopartícula da presente invenção podem compreender um polipeptídeo proapoptótico induzível compreendendo (a) uma região de ligação ao ligante, (b) um ligante, e (c) um polipeptí- deo proapoptótico, em que o polipeptídeo proapoptótico induzível não compreende uma sequência não humana. Em certas modalidades, a sequência não humana compreende um sítio de restrição. Em certas modalidades, a região de ligação ao ligante pode ser uma região de ligação ao ligante multimérico. Polipeptídeos proapoptóticos induzíveis da presente invenção podem também ser referidos como um "interrup- tor de segurança iC9". Em certas modalidades, vetores de nanopartí- cula da presente invenção podem compreender um polipeptídeo de caspase induzível compreendendo (a) uma região de ligação ao ligan- te, (b) um ligante, e (c) um polipeptídeo de caspase, em que o polipep- tídeo proapoptótico induzível não compreende uma sequência não humana. Em certas modalidades, Vetores de nanopartícula da presen- te invenção podem compreender um polipeptídeo de caspase induzí- vel compreendendo (a) uma região de ligação ao ligante, (b) um ligan- te, e (c) um polipeptídeo de caspase, em que o polipeptídeo proapop- tótico induzível não compreende uma sequência não humana. Em cer- tas modalidades, Vetores de nanopartícula da presente invenção po- dem compreender um polipeptídeo de caspase induzível compreen- dendo (a) uma região de ligação ao ligante, (b) um ligante, e (c) um polipeptídeo de caspase 9 truncado, em que o polipeptídeo proapoptó- tico induzível não compreende uma sequência não humana. Em certas modalidades dos polipeptídeos proapoptóticos induzíveis, polipeptí- deos de caspase induzíveis ou polipeptídeos de caspase 9 truncados da presente invenção, a região de ligação ao ligante podem compre- ender um polipeptídeo de proteína 12 de ligação a FK506 (FKBP12). Em certas modalidades, a sequência de aminoácido da região de liga- ção ao ligante que compreende um polipeptídeo de proteína 12 de li- gação a FK506 (FKBP12) pode compreender uma modificação na po- sição 36 da sequência. A modificação pode ser uma substituição de valina (V) por fenilalanina (F) na posição 36 (F36V). Em certas modali- dades, o polipeptídeo FKBP12 é codificado por uma sequência de aminoácido compreendendo
GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPF
KFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPP HATLVFDVELLKLE (SEQ ID NO: 18026). Em certas modalidades, o polipeptídeo FKBP12 é codificado por uma sequência de ácido nucleico compreendendo
GGGGTCCAGGTCGAGACTATTTCACCAGGGGATGGGCGAACATT TCCAAAAAGGGGCCAGACTTGCGTCGTGCATTACACCGGGATGCT GGAGGACGGGAAGAAAGTGGACAGCTCCAGGGATCGCAACAAGC CCTTCAAGTTCATGCTGGGAAAGCAGGAAGTGATCCGAGGATGG GAGGAAGGCGTGGCACAGATGTCAGTCGGCCAGCGGGCCAAACT GACCATTAGCCCTGACTACGCTTATGGAGCAACAGGCCACCCAG
GGATCATTCCCCCTCATGCCACCCTGGTCTTCGAT GTGGAACTGCTGAAGCTGGAG (SEQ ID NO: 18027). Em certas modalidades, o agente de indução específico para a região de ligação ao ligante podem compreender um polipeptídeo de proteína 12 de ligação a FK506 (FKBP12) tendo uma substituição de valina (V) por fenilalanina (F) na posição 36 (F36V) compreende AP20187 e/ou AP1903, ambos os fármacos sintéticos.
[0057] Em certas modalidades dos polipeptídeos proapoptóticos induzíveis, polipeptídeos de caspase induzíveis ou polipeptídeos de caspase 9 truncados da presente invenção, a região ligante é codifica- da por um aminoácido compreendendo GGGGS (SEQ ID NO: 18028) ou uma sequência de ácido nucleico compreendendo GGAGGAGGA- GGATCC (SEQ ID NO: 18029). Em certas modalidades, a sequência de ácido nucleico codificando o ligante não compreende um sítio de restrição.
[0058] Em certas modalidades do polipeptídeo de caspase 9 trun- cados da presente invenção, o polipeptídeo de caspase 9 truncado é codificado por uma sequência de aminoácido que não compreende uma arginina (R) na posição 87 da sequência. Alternativamente, ou em adição, em certas modalidades dos polipeptídeos proapoptóticos indu- zíveis, polipeptídeos de caspase induzíveis ou polipeptídeos de cas- pase 9 truncados da presente invenção, o polipeptídeo de caspase 9 truncado é codificado por uma sequência de aminoácido que não compreende uma alanina (A) na posição 282 da sequência. Em certas modalidades dos polipeptídeos proapoptóticos induzíveis, polipeptí- deos de caspase induzíveis ou polipeptídeos de caspase 9 truncados da presente invenção, o polipeptídeo de caspase 9 truncado é codifi- cado por um aminoácido compreendendo
GFGDVGALESLRGNADLAYILSMEPCGHCLIINNVNFCRESGLRTRT GSNIDCEKLRRRFSSLHFMVEVKGDLTAKKMVLALLELAQQDHGALD CCVVVILSHGCQASHLQFPGAVYGTDGCPVSVEKIVNIFNGTSCPSL GGKPKLFFIQACGGEQKDHGFEVASTSPEDESPGSNPEPDATPFQE GLRTFDQLDAISSLPTPSDIFVSYSTFPGFVSWRDPKSGSWYVETLD
DIFEQWAHSEDLQSLLLRVANAVSVKGIYKQMPGCFNFLRKKLFFKT S (SEQ ID NO: 18030) ou uma sequência de ácido nucleico compreendendo
GGATTTGGGGACGTGGGGGCCCTGGAGTCTCTGCGAGGAAATGC CGATCTGGCTTACATCCTGAGCATGGAACCCTGCGGCCACTGTCT GATCATTAACAATGTGAACTTCTGCAGAGAAAGCGGACTGCGAAC ACGGACTGGCTCCAATATTGACTGTGAGAAGCTGCGGAGAAGGTT CTCTAGTCTGCACTTTATGGTCGAAGTGAAAGGGGATCTGACCGC CAAGAAAATGGTGCTGGCCCTGCTGGAGCTGGCTCAGCAGGACC ATGGAGCTCTGGATTGCTGCGTGGTCGTGATCCTGTCCCACGGG TGCCAGGCTTCTCATCTGCAGTTCCCCGGAGCAGTGTACGGAACA GACGGCTGTCCTGTCAGCGTGGAGAAGATCGTCAACATCTTCAAC GGCACTTCTTGCCCTAGTCTGGGGGGAAAGCCAAAACTGTTCTTT ATCCAGGCCTGTGGCGGGGAACAGAAAGATCACGGCTTCGAGGT GGCCAGCACCAGCCCTGAGGACGAATCACCAGGGAGCAACCCTG AACCAGATGCAACTCCATTCCAGGAGGGACTGAGGACCTTTGACC AGCTGGATGCTATCTCAAGCCTGCCCACTCCTAGTGACATTTTCG TGTCTTACAGTACCTTCCCAGGCTTTGTCTCATGGCGCGATCCCA AGTCAGGGAGCTGGTACGTGGAGACACTGGACGACATCTTTGAA CAGTGGGCCCATTCAGAGGACCTGCAGAGCCTGCTGCTGCGAGT GGCAAACGCTGTCTCTGTGAAGGGCATCTACAAACAGATGCCCG
GGTGCTTCAATTTTCTGAGAAAGAAACTGTTCTTTAAGACTTCC (SEQ ID NO: 18031).
[0059] Em certas modalidades dos polipeptídeos proapoptóticos induzíveis, em que o polipeptídeo compreende um polipeptídeo de caspase 9 truncado, o polipeptídeo proapoptótico induzível é codifica- do por uma sequência de aminoácido compreendendo
GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPF KFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPP HATLVFDVELLKLEGGGGSGFGDVGALESLRGNADLAYILSMEPCGH CLIINNVNFCRESGLRTRTGSNIDCEKLRRRFSSLHFMVEVKGDLTAK KMVLALLELAQQDHGALDCCVVVILSHGCQASHLQFPGAVYGTDGC PVSVEKIVNIFNGTSCPSLGGKPKLFFIQACGGEQKDHGFEVASTSPE DESPGSNPEPDATPFQEGLRTFDQLDAISSLPTPSDIFVSYSTFPGFV SWRDPKSGSWYVETLDDIFEQWAHSEDLQSLLLRVANAVSVKGIYK
QMPGCFNFLRKKLFFKTS (SEQ ID NO: 18032) ou a sequência de ácido nucleico compreendendo ggggtccaggtcgagactatttcaccaggggatgggcgaacatttccaaaaaggggccagactt gcgtcgtgcattacaccgggatgctggaggacgggaagaaagtggacagctccagggatcgc aacaagcccttcaagttcatgctgggaaagcaggaagtgatccgaggatgggaggaaggcgt ggcacagatgtcagtcggccagcgggccaaactgaccattagccctgactacgcttatggagca acaggccacccagggatcattccccctcatgccaccctggtcttcgatgtggaactgctgaagctg gagggaggaggaggatccggatttggggacgtgggggccctggagtctctgcgaggaaatgc cgatctggcttacatcctgagcatggaaccctgcggccactgtctgatcattaacaatgtgaacttct gcagagaaagcggactgcgaacacggactggctccaatattgactgtgagaagctgcggaga aggttctctagtctgcactttatggtcgaagtgaaaggggatctgaccgccaagaaaatggtgctg gccctgctggagctggctcagcaggaccatggagctctggattgctgcgtggtcgtgatcctgtcc cacgggtgccaggcttctcatctgcagttccccggagcagtgtacggaacagacggctgtcctgt cagcgtggagaagatcgtcaacatcttcaacggcacttcttgccctagtctggggggaaagccaa aactgttctttatccaggcctgtggcggggaacagaaagatcacggcttcgaggtggccagcacc agccctgaggacgaatcaccagggagcaaccctgaaccagatgcaactccattccaggaggg actgaggacctttgaccagctggatgctatctcaagcctgcccactcctagtgacattttcgtgtctta cagtaccttcccaggctttgtctcatggcgcgatcccaagtcagggagctggtacgtggagacact ggacgacatctttgaacagtgggcccattcagaggacctgcagagcctgctgctgcgagtggca aacgctgtctctgtgaagggcatctacaaacagatgcccgggtgcttcaattttctgagaaagaaa ctgttctttaagacttcc(SEQ ID NO: 18033).
[0060] Vetores de nanopartícula da presente invenção podem compreender pelo menos um peptídeo autoclivável. Em algumas mo- dalidades, o vetor de nanopartícula pode compreender pelo menos um peptídeo autoclivável e em que um peptídeo autoclivável é localizado entre a CARTirina e a nanopartícula. Em algumas modalidades, o ve- tor de nanopartícula pode compreender pelo menos um peptídeo auto- clivável e em que um primeiro peptídeo autoclivável é localizado a montante de uma CARTirina e um segundo peptídeo autoclivável é localizado a jusante de uma CARTirina. Em algumas modalidades, o vetor de nanopartícula pode compreender pelo menos um peptídeo autoclivável e em que um primeiro peptídeo autoclivável é localizado entre a CARTirina e a nanopartícula e um segundo peptídeo autoclivá- vel é localizado a jusante da CARTirina. Em algumas modalidades, o vetor de nanopartícula pode compreender pelo menos um peptídeo autoclivável e em que um primeiro peptídeo autoclivável é localizado entre a CARTirina e a nanopartícula e um segundo peptídeo autoclivá- vel é localizado a jusante da CARTirina por exemplo, entre a CARTiri- na e um gene de seleção.
[0061] Vetores de nanopartícula da presente invenção podem compreender pelo menos um peptídeo autoclivável localizado, por exemplo, entre um ou mais Centirinas(s) or CARTirinas da presente invenção e um polipeptídeo proapoptótico induzível da presente inven- ção. Vetores de nanopartícula da presente invenção podem compre- ender pelo menos dois peptídeos autocliváveis, um primeiro peptídeo autoclivável localizado, por exemplo, a montante ou imediatamente a montante de um polipeptídeo proapoptótico induzível da presente in- venção e um segundo primeiro peptídeo autoclivável localizado, por exemplo, a jusante ou imediatamente a montante de um polipeptídeo proapoptótico induzível da presente invenção. O peptídeo autoclivável pode compreender, por exemplo, um peptídeo T2A, peptídeo GSG- T2A, um peptídeo E2A, um peptídeo GSG-E2A, um peptídeo F2A, um peptídeo GSG-F2A, um peptídeo P2A, ou um peptídeo GSG-P2A. Um peptídeo T pode compreender uma sequência de aminoácido compre- endendo EGRGSLLTCGDVEENPGP (SEQ ID NO: 18034) ou uma se- quência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identida- de para a sequência de aminoácido compreendendo EGRGS- LLTCGDVEENPGP (SEQ ID NO: 18034). UM peptídeo GSG-T2A pode compreender uma sequência de aminoácido compreendendo GSGE- GRGSLLTCGDVEENPGP (SEQ ID NO: 18036)or uma sequência ten-
do pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo GSGEGRGSLLTCGDVE- ENPGP (SEQ ID NO: 18036). UM PEPTÍDEO GSG-T2A pode com- preender uma sequência de ácido nucleico compreendendo ggatctg- gagagggaaggggaagcctgctgacctgtggagacgtggaggaaaacccaggacca (SEQ ID NO:18038). Um peptídeo E2A pode compreender uma se- quência de aminoácido compreendendo QCTNYALLKLAGDVESNPGP (SEQ ID NO: 18039) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo QCTNYALLKLAGDVESNPGP (SEQ ID NO: 18039). UM peptído GSG-E2A pode compreender uma sequência de aminoá- cido compreendendo GSGQCTNYALLKLAGDVESNPGP (SEQ ID NO: 18041) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo GSGQCTNYALLKLAGDVESNPGP (SEQ ID NO: 18041). UM peptídeo F2A pode compreender uma sequência de aminoácido compreenden- do VKQTLNFDLLKLAGDVESNPGP (SEQ ID NO: 18043) ou uma se- quência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identida- de para a sequência de aminoácido compreendendo VKQTLNFDLL- KLAGDVESNPGP (SEQ ID NO: 18043). UM peptídeo GSG-F2A pode compreender uma sequência de aminoácido compreendendo GSGVKQTLNFDLLKLAGDVESNPGP (SEQ ID NO: 18045) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identi- dade para a sequência de aminoácido compreendendo GSGVKQTLN- FDLLKLAGDVESNPGP (SEQ ID NO: 18045). A P2A peptide podem compreender uma sequência de aminoácido compreendendo ATNFS- LLKQAGDVEENPGP (SEQ ID NO: 18047) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a se- quência de aminoácido compreendendo ATNFSLLKQAGDVEENPGP (SEQ ID NO: 18047). UM peptídeo GSG-P2A pode compreender uma sequência de aminoácido compreendendo GSGATNFSLLKQAGDVE- ENPGP (SEQ ID NO: 18050) ou uma sequência tendo pelo menos 70%, 80%, 90%, 95%, ou 99% de identidade para a sequência de aminoácido compreendendo GSGATNFSLLKQAGDVEENPGP (SEQ ID NO: 18050).
[0062] A presente invenção fornece uma composição compreen- dendo um vetor da presente invenção. A presente invenção fornece uma célula compreendendo uma CARTirina da presente invenção. A presente invenção fornece uma célula compreendendo um transposon da presente invenção. Em certas modalidades, uma célula compreen- dendo uma CARTirina, um transposon, ou um vetor da presente in- venção pode expressar uma CARTirina sobre a superfície celular. A célula pode ser qualquer tipo de célula. Preferivelmente, a célula é uma célula imune. A célula imune pode ser uma célula T, uma célula exterminadora natural (NK), uma célula semelhante à exterminadora natural (NK), célula externinadora induzida por citocina (CiK)), uma célula progenitora hematopoiética, uma célula T derivada de sangue periférico (PB) ou uma célula T derivada de sangue do cordão umbili- cal (UCB). Preferivelmente, a célula imune é uma célula T. A célula T pode ser uma célula de memória precoce, uma célula T semelhante à célula-tronco, uma célula semelhante à TSCM, uma TSCM ou uma TCM. A célula T pode ser uma TSCM. A célula pode ser uma célula apresen- tando antígeno artificial, que, optionalmente, pode ser usada para es- timular e expandir uma célula imune modificada ou célula T da presen- te invenção. A célula pode ser uma célula de tumor, que, opcional- mente, pode ser usada como uma célula apresentando antígeno artifi- cial ou modificado.
[0063] Células modificadas da presente invenção que podem ser usadas para terapia adotiva podem ser autólogas ou alogeneicas.
[0064] A presente invenção fornece um método para expressar uma CARTirina sobre a superfície de uma célula, compreendendo: (a) obter uma população celular; (b) contatar a população celular com uma composição compreendendo a CARTirina da presente invenção ou uma sequência codificando a CARTirina, sob condições suficientes para transferir a CARTirina através de uma membrana celular de pelo menos uma célula na população celular, desse modo gerando uma população celular modificada; (c) cultivar a população celular modifi- cada sob condições adequadas para integração do transposon; e (d) expandir e/ou selecionar pelo menos uma célula da população celular modificada que expressa a CARTirina sobre a superfície celular.
[0065] Em certas modalidades deste método de expressão de uma CARTirina, a população celular pode compreender leucócitos e/ou leu- cócitos CD4+ e CD8+. A população celular pode compreender leucóci- tos CD4+ e CD8+ em uma relação otimizada. A relação otimizada de leucócitos CD4+ para CD8+ não ocorre naturalmente in vivo. A popu- lação celular pode compreender uma célula de tumor.
[0066] Em certas modalidades deste método de expressão de uma CARTirina, um transposon ou vetor compreende uma CARTirina ou a sequência codificando a CARTirina. Em certas modalidades, um transposon compreende uma CARTirina anti-PMSA ou a sequência codificado uma CARTirina anti-PSMA. Em certas modalidades, o transposon compreende um transposon piggyBac. Em certas modali- dades, o transposon também compreende uma composição compre- endendo um plasmídeo compreendendo uma sequência codificando um enzima transposase. Em certas modalidades, incluindo aquelas modalidades em que a transposase é uma transposase piggyBac, a enzima transpose é uma sequência de mRNA. Em certas modalida- des, a transpDosase piggyBac compreende uma sequência de amino- ácido compreendendo SEQ ID NO: 18017. Em certas modalidades, a transposase piggyBac é uma variante hiperativa e em que a variante hiperativa compreende uma substituição de aminoácido em uma ou mais das posições 30, 165, 282 e 538 de SEQ ID NO: 18017. Em cer- tas modalidades, a substituição de aminoácido na posição 30 de SEQ ID NO: 18017 é uma substituição de uma valina (V) por uma isoleucina (I) (I30V). Em certas modalidades, a substituição de aminoácido na posição 165 de SEQ ID NO: 18017 é uma substituição de uma serina (S) por uma glicina (G) (G165S). Em certas modalidades, em que a substituição de aminoácido na posição 282 de SEQ ID NO: 18017 é uma substituição de uma valina (V) por uma metionina (M) (M282V). Em certas modalidades, a substituição de aminoácido na posição 538 de SEQ ID NO: 18017 é uma substituição de uma lisina (K) por uma asparagina (N) (N538K). Em certas modalidades, a transposase é uma transposase Super piggyBac (sPBo). Em certas modalidades, a trans- posase Super piggyBac (sPBo) compreende uma sequência de ami- noácido compreendendo SEQ ID NO: 14484.
[0067] A presente invenção fornece um vetor compreendendo a CARTirina ou uma sequência codificando uma CARTirina da presente invenção. Em certas modalidades, o vetor compreende uma CARTirina anti-PMSA ou uma sequência codificando uma CARTirina anti-PSMA da presente invenção.
[0068] Em certas modalidades deste método de expressão de uma CARTirina, as condições suficientes para transferir a sequência codifi- cando a CARTirina através de uma membrana celular de pelo menos uma célula em uma população celular compreende nucleofecção.
[0069] Em certas modalidades deste método de expressão de uma CARTirina, em que as condições suficientes para transferir a sequên- cia codificando a CARTirina através de uma membrana celular de pelo menos uma célula em uma população celular compreende pelo menos um de uma aplicação de um ou mais pulsos de eletricidade em uma voltagem especificada, um tampão, e um ou mais fatores suplemen-
tais.
Em certas modalidades, o tampão pode compreender PBS, HBSS, OptiMEM, BTXpress, Amaxa Núcleofector, tampão de nucleo- fecção de célula T humana ou qualquer combinação dos mesmos.
Em certas modalidades, o referido um ou mais fatores suplementais po- dem compreender (a) uma citocina humana recombinante, uma quimi- ocina, uma interleucina ou qualquer combinação das mesmas; (b) um sal, um mineral, um metabólito ou qualquer combinação dos mesmos; (c) um meio celular; (d) um inibidor de sensibilização de DNA celular, metabolismo, diferenciação, transdução de sinal, uma ou mais vias apoptóticas ou combinações dos mesmos; e (e) um reagente que mo- difica ou estabiliza um ou mais ácidos nucleicos.
A citocina humana recombinante, a quimiocina, a interleucina ou qualquer combinação das mesmas podem compreender IL2, IL7, IL12, IL15, IL21, IL1, IL3, IL4, IL5, IL6, IL8, CXCL8, IL9, IL10, IL11, IL13, IL14, IL16, IL17, IL18, IL19, IL20, IL22, IL23, IL25, IL26, IL27, IL28, IL29, IL30, IL31, IL32, IL33, IL35, IL36, GM-CSF, IFN-gama, IL-1 alfa/IL-1F1, IL-1 beta/IL- 1F2, IL-12 p70, IL-12/IL-35 p35, IL-13, IL-17/IL-17A, Heterodímero IL- 17A/F, IL-17F, IL-18/IL-1F4, IL-23, IL-24, IL-32, IL-32 beta, IL-32 gama, IL-33, LAP (TGF-beta 1), Linfotoxina-alfa/TNF-beta, TGF-beta, TNF- alfa, TRANCE/TNFSF11/RANK L ou qualquer combinação dos mes- mos. o sal, o mineral, o metabólito ou qualquer combinação dos mes- mos podem compreender HEPES, Nicotinamida, Heparina, Piruvato de Sódio, L-Glutamina, Solução de Aminoácido Não Essencial MEM, Ácido Ascórbico, Nucleosídeos, FBS/FCS, soro humano, substituto de soro, antibióticos, ajustadores de pH, Sais de Earle, 2-Mercaptoetanol, transferrina humana, Insulina humana recombinante, albumina sérica humana, Suplemento Núcleofector PLUS, KCL, MgCl2, Na2HPO4, NAH2PO4, lactobionato de sódio, Manitol, succinato de sódio, cloreto de sódio, CINa, Glicose, Ca(NO3)2, Tris/HCl, K2HPO4, KH2PO4, Poli- etilenimina, Polietilenoglicol, Poloxâmero 188, Poloxâmero 181, Po-
loxâmero 407, Polivinilpirrolidona, Pop313, Crown-5, ou qualquer com- binação dos mesmos. o meio celular podem compreender PBS, HBSS, OptiMEM, DMEM, RPMI 1640, AIM-V, X-VIVO 15, Meio CellGro DC, CTS OpTimizer T Cell Expansion SFM, Meio TexMACS, PRIME-XV T Cell Expansion Medium, ImmunoCult-XF T Cell Expansion Medium ou qualquer combinação dos mesmos. o inibidor de sensibilização de DNA celular, metabolismo, diferenciação, transdução de sinal, um ou mais vias apoptóticas ou combinações dos mesmos compreendem inibidores de TLR9, MyD88, IRAK, TRAF6, TRAF3, IRF-7, NF-KB, in- terferons tipo 1, citocinas proinflamatórias, cGAS, STING, Sec5, TBK1, IRF-3, RNA pol III, RIG-1, IPS-1, FADD, RIP1, TRAF3, AIM2, ASC, Caspase1, Pro-IL1B, PI3K, Akt, Wnt3A, inibidores de glicogênio sin- tase cinase-3β (GSK-3 β) (por exemplo, TWS119), Bafilomicina, Clo- roquina, Quinacrina, AC-YVAD-CMK, Z-VAD-FMK, Z-IETD-FMK ou qualquer combinação dos mesmos. O reagente que modifica ou esta- biliza um ou mais ácidos nucleicos compreende um modificador de pH, uma proteína de ligação ao DNA, um lipídeo, um fosfolipídeo, CaPO4, um peptídeo de ligação ao DNA de carga neutra líquida com ou sem a sequência de NLS, uma enzima TREX1 ou qualquer combinação dos mesmos.
[0070] Em certas modalidades deste método de expressão de uma CARTirina, as condições adequadas para integração do CARTirina ou uma sequência codificando a CARTirina da presente invenção com- preende pelo menos um dentre um tampão e um ou mais fatores su- plementais. Em certas modalidades, um transposon ou vector da pre- sente invenção compreende a CARTirina ou uma sequência codifican- do a CARTirina da presente invenção. Em certas modalidades, o tam- pão pode compreender PBS, HBSS, OptiMEM, BTXpress, Amaxa Nú- cleofector, tampão de nucleofecção de célula T humana ou qualquer combinação dos mesmos. Em certas modalidades, os referidos um ou mais fatores suplementais podem compreender (a) uma citocina hu- mana recombinante, uma quimiocina, uma interleucina ou qualquer combinação das mesmas; (b) um sal, um mineral, um metabólito ou qualquer combinação dos mesmos; (c) um meio celular; (d) um inibidor de sensibilização de DNA celular, metabolismo, diferenciação, trans- dução de sinal, um ou mais vias apoptóticas ou combinações dos mesmos; e (e) um reagente que modifica ou estabiliza um ou mais ácidos nucleicos.
A citocina humana recombinante, a quimiocina, a interleucina ou qualquer combinação das mesmas podem compreen- der IL2, IL7, IL12, IL15, IL21, IL1, IL3, IL4, IL5, IL6, IL8, CXCL8, IL9, IL10, IL11, IL13, IL14, IL16, IL17, IL18, IL19, IL20, IL22, IL23, IL25, IL26, IL27, IL28, IL29, IL30, IL31, IL32, IL33, IL35, IL36, GM-CSF, IFN- gama, IL-1 alfa/IL-1F1, IL-1 beta/IL-1F2, IL-12 p70, IL-12/IL-35 p35, IL- 13, IL-17/IL-17A, Heterodímero IL-17A/F, IL-17F, IL-18/IL-1F4, IL-23, IL-24, IL-32, IL-32 beta, IL-32 gama, IL-33, LAP (TGF-beta 1), Linfoto- xina-alfa/TNF-beta, TGF-beta, TNF-alfa, TRANCE/TNFSF11/RANK L ou qualquer combinação dos mesmos.
O sal, o mineral, o metabólito ou qualquer combinação dos mesmos podem compreender HEPES, Nicotinamida, Heparina, Piruvato de Sódio, L-Glutamina, Solução de Aminoácido Não Essencial MEM, Ácido Ascórbico, Nucleosídeos, FBS/FCS, soro humano, substituto de soro, antibióticos, ajustadores de pH, Sais de Earle, 2-Mercaptoetanol, transferrina humana, Insulina humana recombinante, albumina sérica humana, Suplemento Núcleo- fector PLUS, KCL, MgCl2, Na2HPO4, NAH2PO4, lactobionato de só- dio, Manitol, succinato de sódio, cloreto de sódio, CINa, Glicose, Ca(NO3)2, Tris/HCl, K2HPO4, KH2PO4, Polietilenimina, Polietilenogli- col, Poloxâmero 188, Poloxâmero 181, Poloxâmero 407, Polivinilpirro- lidona, Pop313, Coroa-5, ou qualquer combinação dos mesmos.
O meio celular pode compreender PBS, HBSS, OptiMEM, DMEM, RPMI 1640, AIM-V, X-VIVO 15, Meio CellGro DC, CTS OpTimizer T Cell Ex-
pansion SFM, Meio TexMACS, PRIME-XV T Cell Expansion Medium, ImmunoCult-XF T Cell Expansion Medium ou qualquer combinação dos mesmos. O inibidor de sensibilização de DNA celular, metabolis- mo, diferenciação, transdução de sinal, um ou mais vias apoptóticas ou combinações dos mesmos compreendem inibidores de TLR9, MyD88, IRAK, TRAF6, TRAF3, IRF-7, NF-KB, interferons tipo 1, citoci- nas proinflamatórias, cGAS, STING, Sec5, TBK1, IRF-3, RNA pol III, RIG-1, IPS-1, FADD, RIP1, TRAF3, AIM2, ASC, Caspase1, Pro-IL1B, PI3K, Akt, Wnt3A, inibidores de glicogênio sintase cinase-3β (GSK-3 β) (por exemplo, TWS119), Bafilomicina, Cloroquina, Quinacrina, AC- YVAD-CMK, Z-VAD-FMK, Z-IETD-FMK ou qualquer combinação dos mesmos. O reagente que modifica ou estabiliza um ou mais ácidos nucleicos compreende um modificador de pH, uma proteína de ligação ao DNA, um lipídeo, um fosfolipídeo, CaPO4, um peptídeo de ligação ao DNA de carga neutra líquida com ou sem a sequência de NLS, uma enzima TREX1 ou qualquer combinação dos mesmos.
[0071] Em certas modalidades deste método de expressão de uma CARTirina, as etapas de expansão e seleção ocorrem sequencialmen- te. A expansão pode ocorrer antes da seleção. A expansão pode se- guir a seleção, e, opcionalmente, outra (isto é, segunda) seleção pode ocorer após a expansão.
[0072] Em certas modalidades deste método de expressão de uma CARTirina, as etapas de expansão e seleçãomay ocorrem simultane- amente.
[0073] Em certas modalidades deste método de expressão de uma CARTirina, a expansão podem compreender contatar pelo menos uma célula da população celular modificada com um antígeno para estimu- lar a referida pelo menos uma célula através da CARTirina desse mo- do gerando uma população celular expandida. O antígeno pode ser apresentado sobre a superfície de um substrato. O substrato pode ter qualquer forma, incluindo, porém não limitada a uma superfície, uma cavidade, uma conta ou uma pluralidade da mesma, e uma matriz. O substrato pode também compreender um componente paramagnético ou magnético. Em certas modalidades deste método de expressão de uma CARTirina, o antígeno pode ser apresentado sobre a superfície de um substrato, em que o substrato é uma conta magnética, e em que um magneto pode ser usado para remover ou separar as contas magnéticas da população celular modificada e expandida. O antígeno pode ser apresentado sobre a superfície de uma célula ou uma célula apresentando antígeno artificial. Células que apresentam antígeno arti- ficial da presente invenção podem incluir, mas não estão limitadas a, células tumorais e células-tronco.
[0074] Em certas modalidades deste método de expressão de uma CARTirina, em que o transposon ou vetor compreende um gene de seleção e em que a etapa de seleção compreende contatar pelo me- nos uma célula da população celular modificada com um composto ao qual o gene de seleção confere resistência, desse modo identificando uma célula expressando o gene de seleção como sobrevivendo à se- leção e identificando uma célula que não expressa o gene de seleção não sobrevivendo à etapa de seleção.
[0075] Em certas modalidades deste método de expressão de uma CARTirina, as etapas de expasão e/ou seleção podem prosseguir du- rante um período de 10 a 14 dias, incluindo os pontos de extremidade.
[0076] A presente invenção fornece uma composição compreen- dendo a população celular modificada, expandida e selecionada dos métodos da presente invenção.
[0077] A presente invenção fornece um método de tratamento de câncer em um indivíduo em necessidade do mesmo, compreendendo administrar ao indivíduo uma composição da presente invenção, em que a CARTirina especificamente se liga a um antígeno sobre uma célula tumoral. Em certas modalidades, a célula tumoral pode ser uma célula tumoral malígna. Em certas modalidades, compreendendo ad- ministrar ao indivíduo a composição compreendendo uma célula modi- ficada ou população celular da presente invenção, a célula ou popula- ção celular pode ser autóloga. Em certas modalidades, compreenden- do administrar ao indivíduo a composição compreendendo uma célula modificada ou população celular da presente invenção, a célula ou po- pulação celular podem ser alogeneicas.
[0078] A presente invenção fornece um método de tratamento de câncer em um indivíduo em necessidade do mesmo, compreendendo administrar ao indivíduo uma composição da presente invenção, em que a CARTirina anti-PSMA especificamente se liga a um antíteno PSMA sobre uma célula tumoral ou um componente de uma vascula- tura de uma célula tumoral. Em certas modalidades, a célula tumoral é uma célula da próstata. Em certas modalidades, a célula tumoral pode ser uma célula tumoral malígna. Em certas modalidades, compreen- dendo administrar ao indivíduo a composição compreendendo uma célula modificada ou população celular da presente invenção, a célula ou população celular pode ser autóloga. Em certas modalidades, com- preendendo administrar ao indivíduo a composição compreendendo uma célula modificada ou população celular da presente invenção, a célula ou população celular podem ser alogeneicas.
[0079] Métodos de modificação de uma terapia celular da presente invenção podem ser usadas para terminar ou diminuir uma terapia em resposta a, por exemplo, um sinal de recuperação ou um sinal de re- dução da severidade/progressão da doença, um sinal de remis- são/cessação da doença, e/ou a ocorrência de um evento adverso. Terapias celulares da presente invenção podem ser resumidas por ini- bição do agente de indução, o que deve ser um sinal ou sintoma do reaparecimento da doença ou aumento da severidade e/ou um evento adverso é resolvido.
BREVE DESCRIÇÃO DAS FIGURAS
[0080] A patente ou arquivo de pedido contém pelo menos uma figura executada em cor. Cópias desta patente ou publicação de pedi- do de patente com figures coloridas serão fornecidos pelo Escritório após pedido e pagamento da taxa necessária.
[0081] A Figura 1 é um diagrama esquemático representando um plasmídeo P-PSMA-101 de CARTirina piggyBac de 7738 pares de ba- se que inclui um promotor EF1α, um interruptor de segurança (iC9), uma CARTirina PSMA e um cassete de gene de seleção.
[0082] A Figura 2 é um diagrama esquemático representando uma CARTirina piggyBac que inclui um transposon P-PSMA-101 compre- endendo uma CARTirina PSMA (compreendendo um peptídeo sinal CD8α, uma Centirina anti-PSMA, um espaçador CD8α, uma sequência de transmembrana CD8α, um domínio coestimulatório 4-1BB e um domínio coestimulatório CD3ζ).
[0083] A Figura 3A é um diagrama esquemático da sequência de aminoácido de uma construção P-PSMA5-101 da presente invenção.
[0084] A Figura 3B é um diagrama esquemático da sequência de ácido nucleico de uma construção P-PSMA5-101 da presente inven- ção.
[0085] A Figura 3C é um diagrama esquemático da sequência de ácido nucleico de uma construção P-PSMA5-101 da presente inven- ção.
[0086] A Figura 4A é um diagrama esquemático da sequência de aminoácido de uma construção P-PSMA8-101 da presente invenção.
[0087] A Figura 4B é um diagrama esquemático da sequência de aminoácido de uma construção P-PSMA8-101 da presente invenção.
[0088] A Figura 4C é um diagrama esquemático da sequência de aminoácido de uma construção P-PSMA8-101 da presente invenção.
[0089] A Figura 5 é um diagrama esquemático representando a construção de uma CARtirina da presente invenção e uma tabela con- trastando características de Centirinas e anticorpos.
[0090] Figura 6A-6E mostra a expressão transitória e função de CARTirinas de PSMA. Ensaios in vitro foram realizados para testar a expressão e função das de CARTirinas de PSMA de chumbo usadas para produzir P-PSMA5-101 e P-PSMA8-101. CARTirinas de PSMA foram detectadas sobre a superfície de células T humanas primárias que foram transitoriamente transfectadas com mRNA codificando as CARTirinas de PSMA na noite anterior (Figura 6A). Em síntese, célu- las T Pan previamente ativada, em seguida congeladas foran descon- geladas e descansadas durante a noite em Meio de cultura de célula T, as células foram eletroporadas com 10 µg demRNA de CARTirina PSMA na noite seguinte, e em seguida a análide de expressão de su- perfície foi realizada na manhã seguinte por FACS usando proteína PSMA humana recombinante solúvel (rPSMA) para marcação. Para testar a função destas células T in vitro, as células foram cocultivadas com um painel de Células expressando PSMA durante 4 horas e em seguida morte celular alvo foi medida por expressão de CD107a, que é um marcador para degranulação e um substituto para a morte de célu- las T. Expressão de superfície de PSMA foi analisada sobre células K562 modificadas para estavelmete expressarem PSMA (K562.PSMA) e LNCaP, a human próstata cancer cell line that endogenously ex- pressed PSMA (Figura 6B). Células T expressando CARTirina de PSMA foram capazes de se desgranularem junto a todas as linhagens celulares expressando PSMA (LNCaP, K562.PSMA) com poucas para nenhuma desgranulação acima da base junto a linhagens celulares PSMA (K562, PC-3) (Figura 6C). PSMA codificando mRNA foi titulado em uma linhagem de célula PSMA, K562, para controlar o nível de expressão de superfície de PSMA (Figura 6D). Células de CARTirina+ de PSMA exibiram forte função citotóxica junto a células K562 expres- sando várias quantidades de PSMA de superfície (Figura 6E). Estes dados mostram que as CARTirinas de PSMA podem ser expressas sobre a superfície de células T e facilitam a função citotóxica junto a alvos de célula PSMA+.
[0091] Figura 7A-7F mostra o fenótipo e função deP-PSMA-101 fabricado de piggyBac. para apoiar a avaliação in vivo das CARTirinas de PSMA de chumbo, P-PSMA-101 foi construído usando o sistema de modificação de DNA piggyBac. CARTirina de PSMA foi detectada sobre a superfície de células T humanas primárias de um doador re- presentativo que foram transpostas com plasmídeos P-PSMA5-101 ou P-PSMA8-101, mas não sobre células transpostas com o controle de plasmídeo P-BCMA-101 (Figura 7A). Em ambos os casos, a maioria das células CAR-T CD8+ foi duplo positive para expressão de CD45RA e CD62L, marcadores geralmente associados um fenótipo de memória de célula-tronco T (Tscm), após manchamento e análise FACS (Figura 7B). Além disso, estas células (fechadas em CD8+ ou CD4+) expressas abaixo de nenhum nível de PD-1, Tim-3 e Lag-3 por análise FACS, que são moléculas associadas à ativação e/ou exaus- tão de célula T funcional (Figura 7C). Em seguida, a função efetora destas células CAR-T foi analisada in vitro após cocultura com Células expressando PSMA. Secreção de IFN- foi medida por ELISA padrão após 24 horas e detectada no meio quando células CAR-T (de 3 doa- dores indepedentes) foram incubadas na presença de seus antígenos alvo cognatos; P-BCMA-101 Secretada IFN- apenas na presença de células K562 modificadas para expressar BCMA sobre a superfície (K562.BCMA), ao passo que P-PSMA-101 Secretada IFN- apenas na presença de linhagens de células tumorais expressando PSMA sobre a superfície (LNCaP e K562.PSMA) (Figura 7D). Além disso, P-PSMA- 101 exibiram forte função citotóxica junto LNCaP quando medido por um ensaio de morte padrão, ao passo que P-BCMA-101 exibiu pouca capacidade de morte; dados de 2 doadores indepedetes (Figura 7E). A capacidade de proliferação celular após a cocultura com diversas li- nhagens de células tumorais foi analisada após 96 horas. P-PSMA- 101 exibiu uma robusta capacidade de proliferação contra PSMA+ LNCaP e 22Rv1 e P-BCMA-101 floriferaram junto a BCMA+ H929, ao passo que nem células CAR-T floriferaram junto a linhages de célula PSMA-BCMA- K562 nem DU145 (Figura 7F). Estes dados mostram que células P-PSMA-101 expressaram a CARTirina de PSMA sobre a superfície e demonstraram função citotóxica e capacidade proliferativa in vitro junto a alvos de célula PSMA+.
[0092] As Figuras 8A a 8F mostram a avaliação pré-clínica de P- PSMA8-101 usando um modelo de xenoenxerto murino. A figura 8A é um esquema da escala de tratamento. Um modelo de xenoenxerto murino usando uma linhagem de célula LNCaP expressando luciferase (LNCaP.luc) injetada subcutaneamente (SC) em camundongos NSG foi utilizada para avaliar a eficácia antitumor in vivo de P-PSMA8-101. Para estes estudos in vivo, todas as células CAR-T foram produzidas usando liberação de PB do plasmídeo P-PSMA8-101 e o processo de fabricação Poseida. Camundongos foram injetados na axila com LNCaP (n=25 para contabilizar para a taxa "de adesão" de LUCap fra- ca) e tratados quando os tumores foram estabelecidos (100-300 mm3 por medição com compasso de calibre 17 dias após o implante). Os camundongos foram tratados com diversas doses incluindo doses ul- tra-baixas (1x106), ‘estresse’ (5x106), e padrão (10x106) de P-PSMA- 101 por injeção IV. A figura 8B é um gráfico da curva de sobrevivência de atividade antitumor. A figura 8C é um gráfico de barras mostrando a expansão e detexção de célula T CD8+ no sangue. A figura 8D é uma série de gráficos de linhas mostrando a avaliação do volume de tumor por medição por compasso de calibre. A Figura 8E é um gráfico de li-
nhas mostrando a bioluminescência de tumor LNCaP por BLI. Figura 8F mostra fotografias representativas da bioluminescência de tumor LNCaP em camundongos quantificados na Figura 8E.
[0093] As Figuras 9A a 9G mostra a avaliação preclinical de cadi- datos de P-PSMA5-101 e P-PSMA8-101 de chumbo como uma dose "estresse" usando o modelo de xenoenxerto murino. Figura 9A é um diagrama esquemático representando a linha do tempo de um estudo para a avaliação preclínica de candidatos de P-PSMA-101 em uma dose ‘estresse" usando o modelo de xenoenxerto murino. Um modelo de xenoenxerto murino usando a linhagem de célula LNCaP expres- sando luciferase (LNCaP.luc) injetadas subcutaneamente (SC) em camundongos NSG foi utilizada para avaliar a eficácia antitumor in vivo de P-PSMA5-101 e P-PSMA8-101 em uma dose ‘estresse" (4x10^6) total células CAR-T. Para estes estudos in vivo, todas as células CAR- T foram produzidas usando liberação de PB do plasmídeo P-PSMA5- 101 ou P-PSMA8-101 usando o processo de fabricação Poseida. Ca- mundongos foram injetados na axila com LNCaP e tratados quando os tumores foram estabelecidos (100-300 mm3 por medição por compas- so de calibre). Os camundongos foram tratados com uma dose "es- tresse" (4x106) de P-PSMA-101 por injeção IV a fim de descobrir quaisquer diferenças possíveis em eficácia entre os CARs PSMA5 e PSMA8. A atividade antitumor foi avaliada pela sobrevivência, expan- são e detecção de célula T CD8+ no sangue, avaliação do volume de tumor por medição com compasso de calibre e bioluminescência de tumor LNCaP. P-PSMA5-101 e P-PSMA8-101 em uma dose ‘estresse" demonstraram eficácia e sobrevivência antitumor significantemente realçada em comparação aos camundongos de controle de células T (nenhum CAR) contra tumores sólidos SC LNCaP.luc estabelecidos em camundonngos NSG. Especificamente, não houce nenhuma so- brevivência em animais de controle de células T (nenhum CAR), 25%
de sobrevivência no no grupo tratado com P-BCMA-101, 75% de so- brevivência no grupo tratado com P-PSMA5-101, e 100% de sobrevi- vência em animais tratados com uma dose "estresse" de P-PSMA8-
101. No sangue periférico, P-PSMA5-101 e P-PSMA8-101 expandi- ram-se e deram origem a células T de CARTirina+ efetoras diferenci- adas que foram concomitantes com um decréscimo em carga de tumor abaixo do detectável por compasso de calibre e limites de imageamen- to bioluminescente. Estas células então contraídas, ainda persistiram no sangue periférico. A Figura 9B é um gráfico da curva de sobrevi- vência de atividade antitumor. A Figura 9C é um gráfico de barras mostrando a P-PSMA5-101 e expansão e detexção de célula T CD8+ no sangue. A Figura 9D é uma série de gráficos de linha mostrando a avaliação do volume de tumor por medição por compasso de calibre. O painel esquerdo mostra a média dos dados de volume de tumor mostrada na série de gráficos no painel direito. A Figura 9E é um gráfi- co de linhas mostrando a bioluminescência de tumor LNCaP por BLI. A Figura 9F mostra fotografias representativas da bioluminescência de camundongos de tumor LNCaP quantificada na Figura 9E. A Figura 9G é uma série de plotes de citometria de fluxo mostrando que P- PSMA-101 (TSCM/TCM) deu origem a CARTirina+ TCM, TEM, e Teff para atacar tumor sólido. Após eliminação de tumor sólido, uma população de P-PSMA-101 TSCM persiste.
[0094] A Figura 10 é uma série de plotes de citometria de fluxo representando a abundância de células se movendo de uma área de células vivas (o quadrante direito inferior fechado) para uma área po- pulada por células apoptóticas (o quadrante esquerdo superior) como uma função de aumento da dosagem do agente de indução (AP1903) em células modificadas para expressar um agente terapêutico (a CARTirina) sozinho ou em combinação com um polipeptídeo de cas- pase induzível da presente invenção (codificado por uma construção iC9 (também conhecida como uma "interruptor de segurança") introdu- zida nas células por uma transposase piggyBac (PB)) no dia 12 após a nucleofecção.
[0095] A Figura 11 é uma série de plotes de citometria de fluxo representando a abundância de células se movendo de uma área de células vivas (o quadrante direito inferior fechado) para uma área po- pulada por células apoptóticas (o quadrante esquerdo superior) como uma função de aumento da dosagem do agente de indução (AP1903) em células modificadas para expressar um agente terapêutico (a CARTirina) sozinho ou em combinação com um polipeptídeo de cas- pase induzível da presente invenção (codificado por uma construção iC9 (também conhecida como uma "interruptor de segurança") introdu- zida nas células por uma transposase piggyBac (PB)) no dia 19 após a nucleofecção.
[0096] A Figura 12 é um par de gráficos representando uma quan- tificação dos resultados agregados mostrados na Figura 10 (gráfico à esquerda) ou Figura 11 (gráficos à direita)). Especificamente, estes gráficos mostram o impacto do interruptor de segurança iC9 sobre a viabilidade celular percentual como uma função da concentração do agente de indução (AP1903) do interruptor iC9 para cada tipo celular modificado no dia 12 (Figura 10 e gráfico à esquerda) ou dia 19 (Figu- ra 11 e gráficos à direita)).
[0097] A Figura 13 é um gráfico de barras representando a efici- ência reduzida de várias proteínas de sinalização do ponto de verifica- ção que poderiam ser usadas para blindar células T. Cas-CLOVER foi usado para reduzir os receptores de ponto de verificação, PD-1, TGFBR2, LAG-3, TIM-3 e CTLA-4 em células T pan humanas primá- rias em repouso. A redução percentual é mostrada no eixo-y. A edição de gene resultou em 30 a 70% de perda de expressão de proteína na superfície celular quando medida por citometria de fluxo.
[0098] A Figura 14 é de diagramas esquemáticos de receptores de tipo selvagem, nulos e interruptores e seus efeitos sobre a sinaliza- ção intracelular, ou inibitória ou estimulatória, em células T primárias.
A ligação do receptor inibitório do tipo selvagem expressado endoge- namente sobre uma célula T com seu ligante endógeno resulta em transmissão de um sinal inibitório que, em parte, reduz a função efeto- ra de célula T.
Entretanto, mutação (Nulo mutado) ou deleção (Nulo truncado) do domínio intracelular (ICD) de uma proteína receptora do ponto de verificação, tal como, PD1 (painel de topo) ou TGFBRII (pai- nel de base), reduz ou elimina sua capacidade de sinalização quando ligantes cognatos são ligados.
Desse modo, expressão de receptores nulos mutados ou truncados modificados sobre a superfície de células T modificadas resulta em uma competição com receptores de tipo sel- vagem endogenamente expressos para ligação dos ligantes endóge- nos livres, eficazmente reduzindo ou eliminado a liberação de sinais inibitórios por receptores do tipo selvagem endogenamente expressos.
Especificamente, qualquer ligação por um receptor mutado ou nulo sequestra o (s) ligante (s) endógeno (s) da ligação ao receptor de tipo selvagem e resulta na diluição do nível geral de sinalização de ponto de verificação efetivamente liberada à célula T modificada, reduzindo ou bloqueando a inibição do ponto de verificação e exaustão funcional das células T modificadas.
Um receptor comutador é criado pela subs- tituição do ICD de tipo selvagem com um ICD de uma molécula coes- timuladora (como CD3z, CD28, 4-1BB) ou de uma molécula inibitória diferente (como CTLA4, PD1, Lag3). No primeiro caso, a ligação do (s) ligante (s) endógeno (s) pelo receptor comutado modificado resulta na liberação de um sinal positivo para as células T, ajudando assim a re- alçar a estimulação da célula T modificada e potencialmente realçar a exterminação de célula tumoral alvo.
No último caso, a ligação do (s) ligante (s) endógeno (s) pelo receptor comutado modificado resulta na liberação de um sinal negativo às células T, eliminando assim a esti- mulação da célula T modificada e reduzindo potencialmente a extermi- nação das células tumorais alvo. O peptídeo de sinal (seta roxa), do- mínio extracelular (ECD) (verde brilhante), domínio de transmembrana (amarelo), domínio de sinalização intracelular (ICD) (laranja), e ICD de substituição (verde) são exibidos nos diagramas do receptor. "*" indica um ICD mutado. "+" Indica a presença de um sinal de ponto de verifi- cação. "-" indica a ausência de um sinal de ponto de verificação.
[0099] A Figura 15A é um diagrama esquemático que mostra um exemplo de desenho de receptores nulos com alterações específicas que podem ajudar a aumentar a expressão do receptor sobre a super- fície de células T modificadas. São apresentados exemplos para os receptores nulos PD1 e TGFBRII e o domínio do peptídeo de sinal (SP), domínio de transmembrana (TM) e domínio extracelular (ECD) dos receptores nulos truncados para PD1 (painel de topo) e TGFBRII (painel de base) são exibidos. A primeira das quatro moléculas princi- pais é o receptor PD-1 do tipo selvagem, que codifica o PD-1 SP e TM de tipo selvagem. Para o receptor PD1 nulo, é representada a substi- tuição de domínio TM ou SP de PD1 de tipo selvagem (verde; verde claro) com o domínio SP ou TM de um receptor CD8a de células T humanas (vermelho). A segunda molécula codifica o CD8a SP junta- mente com o TM de PD-1 nativo, a terceira codifica o SP de PD-1 de tipo selvagem e o TM de CD8a alternativo, e a quarta codifica ambos os SP e TM de CD8a alternativos. Da mesma forma, para o receptor nulo de TGFβRII, a substituição do TGFBRII SP de tipo selvagem (ro- sa) com um domínio SP de um receptor CD8a de células T humanas (vermelho). Os nomes dos construtos e os comprimentos de aminoá- cido (aa) de cada proteína de construto estão listados à esquerda do diagrama.
[00100] Figura 15B é uma série de histogramas representando a expressão dos receptores PD1 e TGFBRII nulos sobre a superfície de células T humanas primárias modificadas conforme determinado por citometria de fluxo. Cada um dos seis construtos nulos truncados da Figura 15A foi expresso sobre a superfície de células T humanas pri- márias. As células T foram manchadas com anti-PD1 (topo; histogra- mas azuis) ou anti-TGFβRII (base; histogramas azuis), ou controle iso- típico ou apenas secundário (histogramas cinzas). As células com co- loração positiva para expressão de PD-1 ou TGFβRII foram bloquea- das (frequência mostrada acima da porta) e o valor de intensidade média de fluorescência (MFI) é exibido acima de cada histograma po- sitivo. Os nomes dos construtos de receptor nulo estão representados acima de cada gráfico. Ambas as estratégias de gene de receptor nu- lo, substituição do SP de tipo selvagem com o CD8a alternativo foram expressas com sucesso. 02.8aSP-PD-1 e 02.8aSP-TGFβRII resulta- ram no maior nível de expressão na superfície das células T. O recep- tor nulo 02.8aSP-PD-1 exibiu um MFI de 43.680, que é 177 vezes maior do que a expressão de PD-1 em células T endógenas e 2,8 ve- zes maior do que o receptor nulo de PD-1 de tipo selvagem. O recep- tor nulo 02.8aSP-TGFβRII exibiu um MFI de 13.809, que é 102 vezes maior do que a expressão de TGFβRII em células T endógenas e 1,8 vezes maior do que o receptor nulo de TGFβRII de tipo selvagem. A substituição de SP de tipo selvagem com o SP de CD8a alternativo para PD1 e TGRBRII resulta em expressão de superfície realçada do receptor nulo ou comutado, que pode ajudar a maximizar a redução ou bloqueio da inibição do ponto de verificação após a ligação e seques- tro do (s) ligante (s) endógeno (s).
[00101] A Figura 16A-B é um par de diagramas esquemáticos re- presentando vetores induzíveis de NF-KB para expressão em células T. Dois vetores induzíveis de NF-KB de ativação de células T foram desenvolvidos; um com o sistema de expressão gênica (GES) na ori-
entação direta (A) e o outro na direção complementar (B), ambos pre- cedendo o promotor EF1a constitutivo. Esses vetores também direcio- nam a expressão de uma molécula CAR e um gene de seleção DHFR, separados por uma sequência T2A. Tanto o sistema indutível condici- onal de NF-KB quanto os genes direcionados por EF1a fazem parte de um transposon piggyBac que pode ser permanentemente integrada às células T usando eletroporação (EP). Uma vez integrada ao genoma, as células T expressarão constitutivamente o CAR na superfície da membrana e o DHFR dentro da célula, enquanto a expressão do gene induzível de NF-KB, GFP, será expressa ao nível mais alto somente após a ativação das células T.
[00102] Figura 17 é um par de gráficos representando expressão indutível de NF-KB de GFP em células T ativadas. As células T foram núcleofetadas com um vetor piggyBac expressando um gene da mute- ína CAR anti-BCMA e DHFR sob controle de um promotor EF1a jun- tamente com a ausência (sem controle de GES) ou presença de um sistema de expressão induzível de NF-KB dirigindo a expressão de GFP na orientação direta (pNFKB-GFP direto) ou reversa (pNFKB- GFP reverso). As células foram cultivadas na presença de seleção de metotrexato até que as células estivessem quase completamente em repouso (Dia 19) e a expressão de GFP foi analisada no Dia 5 e Dia
19. No Dia 5, todas as células T estão proliferando e altamente estimu- ladas, células com portadoras do cassete de expressão induzível NF- KB produzindo altos níveis de GFP devido à forte atividade de NFκB. As células de sem controle de GES não expressaram níveis detectá- veis de GFP. No Dia 19, as células T de GES estavam quase em re- pouso e a expressão de GFP foi significativamente menor do que no Dia 5 (~ 1/8 MFI), uma vez que a atividade do NFκB é menor. A ex- pressão de GFP ainda é observada no Dia 19, o que pode ser devido à longa meia-vida da proteína de GFP (~ 30 horas), ou ao nível basal de atividade de NFκB através, por exemplo, de um TCR, um CAR, um receptor de citocina, ou um sinal do receptor do fator de crescimento.
[00103] Figura 18 é uma série de gráficos representando a ativação mediada por CAR anti-BCMA da expressão induzível de NF-KB de GFP na presença de células tumorais BCMA +. As células T foram não modificadas (células T Mock) ou núcleofetadas com um vetor piggyBac expressando um gene muteína CAR anti-BCMA e DHFR sob controle de um promotor EF1a juntamente com a ausência (sem controle de GES) ou presença de um sistema de expressão induzível de NF-KB que conduz a expressão de GFP na orientação direta (pNFKB-GFP direta) ou reversa (pNFKB-GFP reversa). Todas as células foram culti- vadas durante 22 dias, com ou sem seleção de metotrexato (células T Mock), até que as células estivessem quase completamente em re- pouso. As células foram então estimuladas durante 3 dias na ausência (sem estimulação) ou na presença de BCMA- (K562), BMCA + (RPMI 8226), ou reagente de ativação anti-CD3 anti-CD28 de controle positi- vo (estimulação CD3 / 28). A expressão de GFP era indetectável em todas as condições com o controle sem GES ou células T Mock. Entre- tanto, enquanto as células pNFKB-GFP com transposição direta e re- versa exibiram pouca expressão de GFP sobre o controle sem estimu- lação quando cultivadas com células BCMA-K562, ambas demonstra- ram regulação positiva dramática da expressão gênica na presença de células tumorais BCMA + ou sob condições de controle positivo. Pouca diferença na expressão de GFP foi observada entre as células pNFKB- GFP com transposição direta e reversa que foram cocultivadas com células tumorais BCMA +.
[00104] Figura 19 é uma série de gráficos demonstrando que o ní- vel de expressão do gene induzível pode ser regulado por um número de elementos de resposta precedendo as células T promotoras que foram núcleofetadas com um vetor piggyBac que codifica uma CARTi-
rina anti-BCMA seguido por um gene de seleção, ambos sob o contro- le de um promotor EF1a humano.
Além disso, os vetores codificaram adicionalmente o sistema de expressão gênica indutível de NF-KB condicional que conduz a expressão de uma proteína de CD19 trunca- da (dCD19) e incluíram uma série de elementos de resposta de NFKB (RE) variando de 0 a 5, sem GES (sem GES), ou receberam um pulso de eletroporação, mas nenhum ácido nucleico piggyBac (Mock). Os dados são mostrados apenas para o GES na direção / orientação re- versa (oposta). Todas as células foram cultivadas durante 18 dias e incluída a seleção para células T modificadas por piggyBac utilizando a adição de metotrexato.
As células foram então estimuladas durante 3 dias utilizando o reagente de ativação de conta anti-CD3 anti-CD28 e a expressão de superfície dCD19 foi analisada por FACS nos dias 0, 3 e 18, e os dados são apresentados como histogramas FACS e MFI de manchamento de proteína alvo.
Os eixos x de cada um dos histogra- mas FACS são representados em escala logarítmica (0, 103, 104, 105). As amostras plotadas de cada um dos histogramas FACS são NFKB- A08-DHFR_Rev002.fcs, NFKB-A08_DHFR_Rev-RE4X_12.fcs, NFKB- A08_DHFR_Rev-RE3X_011.fcs, NFKB-A08_DHFR_Rev- RE2X_010.fcs, NFKB-A08_DHFR_Rev-RE1X_009.fcs, NFKB- A08_DHFR_Rev-RE0X_008.fcs, NFKB-A08_DHFR_v5_013.fcs e NFKB-A08_DHFR_MOCK_014.fcs, do topo à base.
A expressão de superfície de dCD19 foi detectada em níveis baixos no Dia 0 em todas as células T transpostas com vetores codificando o GES.
Aos 3 dias pós-estimulação, foi observada uma suprarregulação dramática da ex- pressão de dCD19 para todas as células T expressando o GES, com um aumento maior na expressão de superfície naquelas com maior número de REs.
Desse modo, a expressão de dCD19 de superfície foi diretamente proporcional ao número de ERs codificados no GES.
Ne- nhum dCD19 foi detectado sobre a superfície de células T que não abrigava os controles GES: sem GES e Mock.
[00105] A Figura 20 é uma representação esquemática do mapa de construto dCas9 ligado a Csy4-T2A-Clo051-G4S (Modalidade 2).
[00106] A Figura 21 é uma representação esquemática do mapa de construto NLS duplo de pRT1-Clo051-dCas9 (Modalidade 1).
[00107] Figura 22 é um diagrama esquemático representando a li- nha do tempo de um estudo para a avaliação pré-clínica de candidatos a P-PSMA-101 de chumbo em um Modelo de Xenoenxerto de Murino de metástase óssea de próstata cancerígena. Um modelo de xenoen- xerto murino usando uma linhagem celular de PC3 expressando lucife- rase modificada para expressar proteína de PSMA humano (PC3.lucGFP.hPSMA) foi injetado peritibialmente (IT) em camundon- gos NSG e foi utilizado para avaliar a eficácia um antitumoral in vivo de P- PSMA5-101 e P-PSMA8-101 em duas doses diferentes - uma dose de 'estresse' de 4x10^6 e a dose padrão de 12x10^6 células CAR-T totais. Como controles negativos, células T sozinhas (não expressando um CAR; dose 12e6) ou células T P-BCMA-101 (expressando um CAR anti-BCMA irrelevante; dose 12e6) também foram incluídas. Para es- tes estudos in vivo, todas as células CAR-T foram produzidas usando a liberação de PB do plasmídeo P-PSMA5-101 ou P-PSMA8-101 usando o processo de fabricação Poseida. Os camundongos foram injetados peritibialmente com Pc3.lucGFP.hPSMA e tratados com célu- las CAR-T quatro dias depois (todos os camundongos desafiados com tumor tinham tumores detectáveis por imagem bioluminescente (BLI) variando de 1-5x10^6 em fluxo luminescente total (p/seg/m2)).
[00108] A Figura 23 é um gráfico que mostra a eficácia da dose de P-PSMA5-101 e P-PSMA8-101 em uma dose de 'estresse' ou dose padrão que demonstrou eficácia antitumoral em comparação às célu- las T (sem CAR) sozinhas ou camundongos de controle tratados com P-BCMA-101 contra tumores sólidos IT PC3.lucGFP.hPSMA em ca-
mundongos NSG.
[00109] Figura 24 é um diagrama esquemático representando um nanotransposon piggyBac P-PSMA-101 da presente invenção.
[00110] A Figura 25 é um gráfico que mostra que a liberação de ele- troporação (EP) de plasmídeo P-PSMA-101 piggyBac (barras cinza claro) ou nanotransposon P-PSMA-101 piggyBac (barras cinza escuro) em combinação com enzima transposase super piggyBac resultou em alta eficiência de transposição em células T pan humanas (5 dias pós- EP) como medido pela expressão de superfície de CARTirina de PSMA (Percentagem de Transposição (%)).
[00111] Figura 26 é uma série de gráficos mostrando que células CAR-T humanas produzidas usando nanotransposons CAR anti-PSMA (NT) foram capazes de matar células tumorais alvo. As células CAR T anti-PSMA produzidas usando plasmídeos piggyBac de tamanho total (FP) ou nanotransposon piggyBac (NT) foram produzidas usando o processo padrão Poseida. Morte de células K562 modificadas para expressar PSMA (K562.PSMA) por células CAR-T nas relações efeto- ras para alvo indicadas. Estes dados mostram que todas as células CAR-T, produzidas usando FP ou NT, foram capazes de matar células tumorais alvo de uma forma dependente de antígeno. Isso foi verdade para as células CAR-T que foram produzidas a partir de células T pan humanas de dois doadores normais diferentes.
[00112] A Figura 27 é uma série de gráficos que mostram que as células CAR-T humanas produzidas usando nanotransposons CAR anti-PSMA (NT) eram comparáveis em composição fenotípica. As cé- lulas anti-PSMA CAR T produzidas usando plasmídeos piggyBac de tamanho total (FP) ou nanotransposon piggyBac (NT) foram fabricadas usando o processo padrão Poseida. Análise fenotípica de marcadores de células T de memória e marcadores de ativação / exaustão (dados não mostrados) foi realizada. Estes dados mostram que todas as célu-
las CAR-T, produzidas usando FP ou NT, exibiram uma composição fenotípica semelhante de células CD45RA + CD62L + (Tscm), CD45RA-CD62L + (Tcm), CD45RA-CD62L- (Tem), e CD45RA + CD62L- (Teff). Além disso, observaram-se níveis comparáveis de ex- pressão de CCR7 (CD197), CD127, CD27, LAG3, TIM3, CXCR3, PD- 1, e CD25 (dados não mostrados). Isso foi verdade para as células CAR-T que foram produzidas a partir de células T pan humanas de dois doadores normais diferentes.
[00113] A Figura 28 é uma série de gráficos que mostram que as células CAR-T humanas produzidas usando nanotransposons CAR anti-PSMA (NT) possuem um número de cópias integrado similar. As células anti-PSMA CAR T produzidas usando plasmídeos piggyBac de tamanho total (FP) ou nanotransposon piggyBac (NT) foram fabricadas usando o processo padrão Poseida. O número médio de cópias de transposons integrados foi medido por PCR quantitativo. Estes dados mostram que em dois doadores diferentes, todas as células CAR-T, quer produzidas utilizando FP ou NT, exibiram um número de cópias integradas semelhante de transposons.
[00114] Figura 29A é um diagrama esquemático que mostra a ava- liação pré-clínica do transposon P-PSMA-101 quando liberado por um plasmídeo de comprimento total (FLP) versus um nanotransposon (NT) em doses de ‘estresse’ usando o modelo de xenoenxerto de mu- rino. O modelo de xenoenxerto de murino usando uma linhagem de célula LNCaP expressando luciferase (LNCaP.luc) injetada subcuta- neamente (SC) em camundongos NSG foi utilizado para avaliar a efi- caz antitumoral in vivo do transposon P-PSMA-101 como liberado por um plasmídeo comprimento total (FLP) ou um nanotransposon (NT) em duas diferentes doses de 'estresse' (2,5x10^6 ou 4x10^6) de célu- las CAR-T totais de dois doadores normais diferentes. Todas as célu- las CAR-T foram produzidas usando a liberação de piggyBac (PB) do transposon P-PSMA-101 utilizando a liberação de FLP ou NT. Os ca- mundongos foram injetados na axila com LNCaP e tratados quando os tumores foram estabilizados (100-200 mm3 por medição por compasso de calibre). Os camundongos foram tratados com duas doses diferen- tes de 'estresse' (2,5x10^6 ou 4x10^6) de P-PSMA-101 CAR-Ts por injeção IV para maior resolução na detecção de possíveis diferenças funcionais na eficácia entre a liberação de transposon pelo FLP e o NT.
[00115] Figura 29B é uma série de gráficos mostrando a avaliação do volume de tumor de camundongos tratados conforme descrito na Figura 29A. Avaliação do volume do tumor por medição por compasso de calibre para camundongos de controle (preto), camundongos Doa- dores # 1 FLP (vermelho), camundongos Doadores # 1 NT (azul), ca- mundongos Doadores # 2 FLP (laranja), e camundongos doadores # 2 NT (verde) conforme apresentado como médias de grupo com barras de erro (topo) e camundongos individuais (base). O eixo y mostra o volume do tumor (mm3) avaliado por medição por compasso de cali- bre. O eixo x mostra o número de dias após o tratamento com células T. O transposon P-PSMA-101 liberado por NT, em uma dose 'es- tresse' demonstrou eficácia antitumoral realçada conforme medido pe- lo compasso de calibre em comparação com os camundongos de con- trole e FLP contra tumores sólidos SC LNCaP.luc estabelecidos.
[00116] Figura 30 é um diagrama esquemático representando um receptor de célula T (TCR) e correceptores CD28 e CD2.
[00117] Figura 31 é um diagrama esquemático representando coes- timulação primária e secundária que é liberada às células T através da ligação de agonistas mAbs (anti-CD3, anti-CD28, e anti-CD2). A ativa- ção total das células T depende criticamente do envolvimento do TCR em conjunto com um segundo sinal por receptores coestimuladores que aumentam a resposta imune. A coestimulação primária e secun-
dária pode ser liberada às células T por meio de tratamento e envolvi- mento de receptores de superfície com reagentes exibindo agonistas mAbs (por exemplo, anti-CD3, anti-CD28, anti-CD2, contas conjuga- das com esses mAbs, complexos multiméricos destes mAbs, etc ...).
[00118] Figura 32 é um diagrama esquemático mostrando que, na ausência de TCR, a estimulação é realçada com a expressão de Re- ceptores Estimuladores Quiméricos (CSRs). Na presença de CSR/s expressos na superfície, transitoriamente ou estavelmente expressos, sinais coestimulatórios primários e secundários realçados são libera- dos quando a célula T é tratada com reagentes exibindo agonistas mAbs. Uma vez que uma ativação mais completa de células T é al- cançada por meio de sinais estimuladores mediados por CSR, a ativa- ção e expansão de células T é realçada.
[00119] Figura 33A é um diagrama esquemático representando um CSR CD28z exemplar da presente invenção.
[00120] A Figura 33B é uma sequência de aminoácidos que codifica o CSR CD28z mostrado na Figura 33A.
[00121] A Figura 33C é uma sequência de nucleotídeos que codifi- ca o CSR CD28z mostrado na Figura 33A.
[00122] Figura 34A é um diagrama esquemático representando um CSR CD2z exemplar da presente invenção.
[00123] A Figura 34B é uma sequência de aminoácidos codificando CSR CD2z mostrado na Figura 34A.
[00124] A Figura 34C é uma sequência de nucleotídeos que codifi- ca o CSR CD2z mostrado na Figura 34A.
[00125] Figura 35 é uma série de gráficos mostrando que os CSRs são expressos sobre a superfície das células T e não levam à ativação celular na ausência de estimulação exógena. As células T pan de doa- dores de sangue normais foram estimuladas com contas anti-CD3 / anti-CD28 no meio de cultura de célula T padrão e, em seguida, des-
cansaram. Estas células foram então eletroporadas (eletroporador BTX ECM 830 @ 500V por 700 µs) com 10 µg de mRNA que codifica controle de CD28 CSR, CD2 CSR, ou CD19 de tipo selvagem. Dois dias depois, as células eletroporadas foram examinadas por citometria de fluxo para expressão de superfície de cada molécula e os dados são mostrados como histogramas empilhados. Além disso, tamanho de célula (FSC-A) e expressão de CD69 foram avaliados como uma possível indicação de ativação celular acima das células de controle Mock eletroporadas. O aumento da expressão de superfície de CD28, CD2, e CD19 foi detectado em células T eletroporadas com CD28z CSR, CD2z CSR ou CD19, respectivamente. A expressão dessas mo- léculas sobre a superfície das células T não ativou intrinsecamente as células na ausência de estimulação exógena.
[00126] A Figura 36 é um gráfico que mostra que a liberação do CSR realça a expansão das células CAR-T. Os CSRs foram liberados às células CAR-T transitoriamente por mRNA ou de forma estável por piggyBac™. As células T Pan isoladas do sangue de um doador nor- mal foram geneticamente modificadas utilizando o sistema de modifi- cação de DNA piggyBac™ e o processo padrão Poseida. As células foram coeletroporadas em uma única reação com mRNA codificando a enzima transposase Super piggyBac (SPB), um transposon que codifi- ca um gene de seleção e BCMA CAR, juntamente com um mRNA adi- cional que codifica um CSR (CD28z ou CD2z; resultando em expres- são transitória) ou um controle de mRNA CD19, ou, com um transpo- son que codifica um BCMA CAR, gene de seleção e CSR (CD28z ou CD2z; resultando em expressão estável). As células foram subsequen- temente estimuladas com agonista mAbs anti-CD2, anti-CD3 e anti- CD28 e foram posteriormente selecionadas para modificação genética ao longo de um período de cultura de 19 dias. No final do período de cultura inicial, todas as células T expressaram o CAR, indicando uma seleção bem-sucedida para células modificadas geneticamente (dados não mostrados). As barras representam as células CAR-T vivas totais em cavidade e números indicam aumento de expansão acima das cé- lulas CAR-T produzidas na ausência de um controle de mRNA de CSR ou CD19. Nas amostras expressando CD2z ou CD28z CSR, transitori- amente ou estavelmente, um maior grau de expansão das células CAR-T.
[00127] A Figura 37 é uma série de gráficos de barras que mostram que a expressão de CSRs não afeta significativamente a citotoxicidade das células CAR-T. Os CSRs foram liberados às células CAR-T transi- toriamente por mRNA ou de forma estável por piggyBac™. As células T Pan isoladas do sangue de um doador normal foram geneticamente modificadas utilizando o sistema de modificação de DNA piggyBac™ e o processo padrão Poseida. As células foram coeletroporadas em uma única reação com mRNA codificando a enzima transposase Super piggyBac (SPB), um transposon que codifica um gene de seleção e BCMA CAR, juntamente com um mRNA adicional que codifica um CSR (CD28z ou CD2z; resultando em expressão transitória), ou, com um transposon que codifica um BCMA CAR, gene de seleção e CSR (CD28z ou CD2z; resultando em expressão estável). As células foram subsequentemente estimuladas com agonista mAbs anti-CD2, anti- CD3 e anti-CD28 e foram posteriormente selecionadas para modifica- ção genética ao longo de um período de cultura de 19 dias. No final do período de cultura inicial, todas as células T expressaram o CAR, indi- cando seleção bem-sucedida para células modificadas geneticamente (dados não mostrados). Para avaliar a capacidade das células CAR-T de matar, as células foram cocultivadas com K562-BCMA-Luciferase modificada (eK562-Luc.BCMA) ou linhagem de controle negativo K562-Luciferase (eK562-Luc) durante 48 horas em relações E:T de 10:1, 3:1 ou 1:1. O sinal da luciferase foi medido para determinar a ci-
totoxicidade. A morte do eK562-Luc é mostrada no gráfico de barras à esquerda, enquanto a morte de eK562-Luc.BCMA é mostrada no grá- fico de barras à direita. Todas as células T CAR+ expressaram um CAR específico de anti-BCMA e exibiram citotoxicidade in vitro similar contra células alvo BCMA+. Em resumo, esta atividade não foi signifi- cativamente afetada pela coexpressão transitória ou estável de CSR.
DESCRIÇÃO DETALHADA
[00128] A presente invenção fornece receptores de antígeno quimé- ricos (CARs) compreendendo pelo menos uma Centirina (CARTirina). Receptores de antígeno quiméricos da presente invenção podem compreender mais do que uma Centirina. Por exemplo, uma CARTiri- na biespecífica pode compreender duas Centirinas que especificamen- te se ligam a dois antígenos distintos. Em modalidades preferidas, CARTirinas da presente invenção compreendem pelo menos uma Centririna que especificamente se liga a uma sequência de PSMA, e, portanto, são referidas como Centrinas específicas de PSMA. CARTi- rinas da presente invenção que compreendem pelo menos uma Centri- rina específica de PSMA são referidas aqui como CARTirinas de anti- PSMA para especificamente ligar uma sequência de PSMA.
[00129] Centirinas da presente invenção especificamente se ligam a um antígeno. Receptores de antígeno quiméricos da presente inven- ção compreendendo uma ou mais Centirinas que especificamente se ligam a um antígeno podem ser usados para direcionar a especificida- de de uma célula, (por exemplo, uma célula imune citotóxica) relativa- mente ao antígeno específico.
[00130] Centirinas da presente invenção podem compreender uma sequência de consenso compreendendo
LPAPKNLVVSEVTEDSLRLSWTAPDAAFDSFLIQYQESEKVGEAINLT VPGSERSYDLTGLKPGTEYTVSIYGVKGGHRSNPLSAEFTT (SEQ ID NO: 18018).
[00131] Receptores de antígeno quiméricos da presente invenção podem compreender um peptídeo sinal de CD2, CD3δ, CD3ε, CD3γ, CD3ζ, CD4, CD8α, CD19, CD28, 4-1BBor GM-CSFR humano. Um domínio de espaçador/articulação da presente invenção pode compre- ender uma articulação/espaçador/haste de CD8α, IgG4 e/ou CD4 hu- mano. Um domínio intracelular ou endodomínio da presente invenção pode compreender um domínio intracelular de sinal de CD3ζ humano e pode também compreender segmento intracelular 4-1BB, CD28, CD40, ICOS, MyD88, OX-40 humano, ou qualquer combinação dos mesmos. Os domínios de transmembrana exemplares incluem, porém, não estão limitados a, um domínio de transmembrana de GM-CSFR CD2, CD3δ, CD3ε, CD3γ, CD3ζ, CD4, CD8α, CD19, CD28, 4-1BBor humano.
[00132] A presente invenção fornece células geneticamente modifi- cadas, tais como, células T, células NK, células progenitoras hemato- poiéticas, células T derivadas de sangue periférico (PB) (incluindo cé- lulas T de sangue periférico mobilizadas por G-CSF), células T deriva- das de sangue do cordão umbilical (UCB) tornadas específicas para um ou mais antígenos introduzindo a estas células uma CARTirina da presente invenção. As células da presente invenção podem ser modifi- cadas por eletrotransferência de um transposon codificando uma CARTirina da presente invenção e um plasmídeo compreendendo uma sequência codificando uma transposase da presente invenção (prefe- rivelmente, a sequência codificando uma transposase da presente in- venção é uma sequência de mRNA). Outras Modificações de Composições de Células
[00133] A presente invenção fornece um receptor estimulatório quimérico (CSR) compreendendo: (a) um ectodomínio compreendendo um componente de ativação e (b) a domínio de transmembrana ou uma região de ligação à membrana de célula, em que a combinação de (a) e (b) é de ocorrência não natural. Em algumas modalidades, esta CSR se liga a um componente do ambiente e muda a conse- quência celular daquela sinalização competindo com versões de com- primento total ou transmembrana do receptor para reduzir o sinal intra- celular resultando da ligação do componente do ambiente para o com- ponente de ativação.
[00134] A presente invenção fornece um receptor estimulatório quimérico (CSR) compreendendo: (a) um ectodomínio compreendendo um componente de ativação; (b) um domínio de transmembrana; e (c) um endodomínio compreendendo pelo menos um domínio de transdu- ção de sinal; em que a combinação de (a), (b) e (c) é de ocorrência não natural.
[00135] Em algumas modalidades dos CSRs da presente invenção, o componente de ativação de (a) é isolado ou derivado de uma primei- ra proteína. Em algumas modalidades, o domínio de transdução de sinal de (c) é isolado ou derivado de uma segunda proteína. Em algu- mas modalidades, a primeira proteína e a segunda proteína não são idênticas.
[00136] Em algumas modalidades dos CSRs da presente invenção, o CSR é um receptor comutador que traduz ligação do componente de ativação extracelular com supressão de um sinal ou transdução de um sinal qualitativamente diferente do que seria transduzido por uma ver- são de tipo selvagem, comprimento total ou transmembrana de uma primeira proteína. Porque um receptor interruptor CSR é quimérico com respeito aos domínios extracelulares e intracelulares, o CSR pode interromper a sequência de ligação do componente de ativação extra- celular do cenário de ocorrência natural para um cenário de ocorrência não natural modificado.
[00137] Em algumas modalidades dos CSRs da presente invenção, o componente de ativação compreende um ou mais dentre um com-
ponente de um receptor de transmembrana humana, um receptor de superfície celular humano, um receptor de célula T (TCR), um compo- nente de um complexo de TCR, um componente de um correceptor de TCR, um componente de uma proteína coestimulatória de TCR, um componente de uma proteína inibitória de TCR, um receptor de citoci- na, e um receptor de quimiocina. Em algumas modalidades, o compo- nente de ativação compreende uma porção de um ou mais dentre um componente de um receptor de transmembrana humana, um receptor de superfície celular humano, um receptor de célula T (TCR), um com- ponente de um complexo de TCR, um componente de um correceptor de TCR, um componente de uma proteína coestimulatória de TCR, um componente de uma proteína inibitória de TCR, um receptor de citoci- na, e um receptor de quimiocina ao qual um agonista do componente de ativação se liga.
[00138] Em algumas modalidades dos CSRs da presente invenção, o agonista compreende um ou mais dentre uma molécula orgânica ou inorgânica pequena, um ácido nucleico, um aminoácido, um anticorpo ou um fragmento dos mesmos, um mimético de anticorpo, um aptâme- ro, uma estrutura de proteína, um ligante, um receptor, uma biomolé- cula de ocorrência natural, e uma molécula de ocorrência não natural (orgânica ou inorgânica).
[00139] Em algumas modalidades dos CSRs da presente invenção, o componente de ativação compreende uma proteína CD2 ou uma porção da mesma ao qual um agonista se liga.
[00140] Em algumas modalidades dos CSRs da presente invenção, o domínio de transdução de sinal compreende um ou mais dentre um componente de domínio de transdução de sinal humano, um receptor de célula T (TCR), um componente de um complexo de TCR, um componente de um correceptor de TCR, um componente de uma pro- teína coestimulatória de TCR, um componente de uma proteína inibitó-
ria de TCR, um receptor de citocina, e um receptor de quimiocina. Em algumas modalidades, o domínio de transdução de sinal compreende uma proteína CD3. Em algumas modalidades, a proteína CD3 com- preende uma proteína CD3ζ.
[00141] Em algumas modalidades dos CSRs da presente invenção, o endodomínio também compreende um domínio citoplásmico. Em al- gumas modalidades, a sequência codificando o domínio citoplásmico compreende uma sequência codificando uma proteína coestimulatória. Em algumas modalidades, o domínio citoplásmico é isolado ou deriva- do de uma terceira proteína. Em algumas modalidades, a primeira pro- teína e a terceira proteína são idênticas.
[00142] Em algumas modalidades dos CSRs da presente invenção, o ectodomínio também compreende um peptídeo sinal. Em algumas modalidades, o peptídeo sinal é derivado de uma quarta proteína. Em algumas modalidades, a primeira proteína e a quarta proteína são idênticas.
[00143] Em algumas modalidades dos CSRs da presente invenção, o domínio de transmembrana é isolado ou derivado de uma quinta pro- teína. Em algumas modalidades, a primeira proteína e a quinta proteí- na são idênticas.
[00144] Em algumas modalidades dos CSRs da presente invenção, o CSR compreende um ectodomínio compreendendo um peptídeo de sinal tendo uma sequência isolada ou derivada de uma proteína CD2 e um componente de ativação compreendendo uma sequência isolada ou derivada de uma proteína CD2 ou uma porção da mesma ao qual um agonista se liga, um domínio de transmembrana compreendendo uma sequência isolada ou derivada de uma proteína CD2, e um en- dodomínio compreendendo um domínio citoplásmico compreendendo uma sequência isolada ou derivada de uma proteína CD2 e o domínio de transdução de sinal compreendendo uma sequência isolada ou de-
rivada de uma proteína CD3ζ.
[00145] Em algumas modalidades dos CSRs da presente invenção, o componente de ativação não se liga a uma molécula de ocorrência natural.
[00146] Em algumas modalidades dos CSRs da presente invenção, o CSR não transduz um sinal após ligação do componente de ativação a uma molécula de ocorrência natural. Em algumas modalidades, o ectodomínio compreende uma modificação. Em algumas modalidades, a modificação compreende uma mutação ou uma truncação de uma sequência codificando o componente de ativação quando comparada a uma sequência do tipo selvagem de uma primeira proteína.
[00147] Em algumas modalidades dos CSRs da presente invenção, o componente de ativação liga-se a uma molécula de ocorrência não natural.
[00148] Em algumas modalidades dos CSRs da presente invenção, o CSR seletivamente transduz um sinal após ligação do componente de ativação a uma molécula de ocorrência não natural.
[00149] A presente invenção fornece uma sequência de ácido nu- cleico codificando o CSR da presente invenção.
[00150] A presente invenção fornece um vetor compreendendo a sequência de ácido nucleico codificando o CSR da presente invenção.
[00151] A presente invenção fornece um vetor compreendendo a sequência de ácido nucleico codificando o CSR da presente invenção.
[00152] A presente invenção fornece um transposon compreenden- do a sequência de ácido nucleico codificando o CSR da presente in- venção.
[00153] A presente invenção fornece uma célula compreendendo o CSR da presente invenção.
[00154] A presente invenção fornece uma célula compreendendo o ácido nucleico codificando o CSR da presente invenção.
[00155] A presente invenção fornece uma célula compreendendo o vetor compreendendo a sequência de ácido nucleico codificando o CSR da presente invenção.
[00156] A presente invenção fornece uma célula compreendendo o transposon compreendendo a sequência de ácido nucleico codificando o CSR da presente invenção.
[00157] A presente invenção fornece uma composição compreen- dendo o CSR da presente invenção.
[00158] A presente invenção fornece uma composição compreen- dendo o ácido nucleico codificando o CSR da presente invenção.
[00159] A presente invenção fornece uma composição compreen- dendo o vetor compreendendo a sequência de ácido nucleico codifi- cando o CSR da presente invenção.
[00160] A presente invenção fornece uma composição compreen- dendo o transposon compreendendo a sequência de ácido nucleico codificando o CSR da presente invenção.
[00161] A presente invenção fornece uma composição compreen- dendo uma célula da presente invenção, incluindo aquelas compreen- dendo uma sequência codificando um CSR e/ou expressando um CSR da presente invenção. A presente invenção fornece uma composição compreendendo uma pluralidade de células da presente invenção, in- cluindo aquelas compreendendo uma sequência codificando um CSR e/ou expressando um CSR da presente invenção.
[00162] A presente invenção fornece uma célula modificada com- preendendo: (a) uma sequência codificando um CSR da presente in- venção e (b) uma sequência codificando um polipeptídeo proapoptóti- co indutível; e em que a célula é uma célula T.
[00163] A presente invenção fornece uma célula modificada com- preendendo: (a) uma sequência codificando um CSR da presente in- venção e (b) uma sequência codificando um polipeptídeo proapoptóti-
co indutível. Em algumas modalidades das células modificadas da presente invenção, as células modificadas também compreendem uma sequência codificando um receptor de antígeno de ocorrência não na- tural, e/ou uma sequência codificando um polipeptídeo terapêutico.
[00164] Em algumas modalidades das células modificadas da pre- sente invenção, incluindo aquelas em que a célula modificada com- preende uma sequência codificando um receptor de antígeno de ocor- rência não natural, o receptor de antígeno de ocorrência não natural compreende um receptor de antígeno quimérico (CAR). Em algumas modalidades, o CAR compreende: (a) um ectodomínio compreenden- do uma região de reconhecimento do antígeno, (b) um domínio de transmembrana, e (c) um endodomínio compreendendo pelo menos um domínio coestimulatório. Em algumas modalidades, o ectodomínio de (a) do CAR também compreende um peptídeo de sinal. Em algu- mas modalidades, o ectodomínio de (a) do CAR também compreende uma articulação entre a região de reconhecimento do antígeno e o domínio de transmembrana. Em algumas modalidades, o endodomínio compreende um endodomínio CD3ζ humano. Em algumas modalida- des, o referido pelo menos um domínio coestimulatório compreende um segmento intracelular 4-1BB, CD28, CD40, ICOS, MyD88, OX-40 humano, ou qualquer combinação dos mesmos. Em algumas modali- dades, o referido pelo menos um domínio coestimulatório compreende um domínio coestimulatório CD28 e/ou um 4-1BB humano.
[00165] Em algumas modalidades das células modificadas da pre- sente invenção, um transposon, um vetor, uma sequência doadora ou um plasmídeo doador compreende a sequência codificando o CSR e/ou a sequência codificando o polipeptídeo proapoptótico induzível. Em algumas modalidades, o transposon, o vetor, a sequência doadora ou o plasmídeo doador também compreende uma sequência codifi- cando um receptor de antígeno de ocorrência não natural ou uma se-
quência codificando uma proteína terapêutica. Em algumas modalida- des, o transposon, o vetor, a sequência doadora, ou o plasmídeo doa- dor também compreende a sequência codificando o marcador de sele- ção. Em algumas modalidades, o transposon é um transposon piggyBac or similar à piggy-Bac.
[00166] Em algumas modalidades das células modificadas da pre- sente invenção, a sequência codificando o CSR é transitoriamente ex- pressa na célula e a sequência codificando o polipeptídeo proapoptóti- co induzível é estavelmente expressa na célula. Em algumas modali- dades, uma sequência codificando um receptor de antígeno de ocor- rência não natural ou uma sequência codificando uma proteína tera- pêutica é estavelmente expressa na célula. Em algumas modalidades, um primeiro transposon, um primeiro vetor, uma primeira sequência doadora, ou um primeiro plasmídeo doador compreende a sequência codificando o CSR. Em algumas modalidades, um segundo transpo- son, um segundo vetor, uma segunda sequência doadora, ou um se- gundo plasmídeo doador compreende uma ou mais da sequência codi- ficando o polipeptídeo proapoptótico induzível, a sequência codifican- do um receptor de antígeno de ocorrência não natural, a sequência codificando a proteína terapêutica. Em algumas modalidades, o primei- ro transposon, o primeiro vetor, a primeira sequência doadora, ou o primeiro plasmídeo doador também compreende uma sequência codi- ficando um primeiro marcador de seleção. Em algumas modalidades, o segundo transposon, o segundo vetor, a segunda sequência doadora, ou o segundo plasmídeo doador também compreende uma sequência codificando um segundo marcador de seleção. Em algumas modalida- des, o primeiro marcador de seleção e o segundo marcador de sele- ção não são idênticos.
[00167] Em algumas modalidades das células modificadas da pre- sente invenção, o marcador de seleção é um marcador de superfície celular. Em algumas modalidades, um marcador de superfície celular distingue as células quando classificadas pelo marcador ou uma eti- queta detectável. Em algumas modalidades, a etiqueta detectável é fluorescente ou magnética.
[00168] Em algumas modalidades das células modificadas da pre- sente invenção, o marcador de seleção compreende uma proteína que é ativa em células divididas e não ativas em células não divididas. Em algumas modalidades, o marcador de seleção compreende um marca- dor metabólico. Em algumas modalidades, o marcador de seleção compreende uma enzima de muteína de di-hidrofolato redutase (DHFR). Em algumas modalidades, a enzima de muteína de DHFR compreende ou consiste em uma sequência de aminoácido de: 1 MVGSLNCIVA VSQNMGIGKN GDFPWPPLRN ESRYFQRMTT TSSVEGKQNL 61 VIMGKKTWFS IPEKNRPLKG RINLVLSREL KEPPQGAHFL SRSLDDALKL 121 TEQPELANKV DMVWIVGGSS VYKEAMNHPG HLKLFVTRIM QDFESDTFFP 181 EIDLEKYKLL PEYPGVLSDV QEEKGIKYKF EVYEKND (SEQ ID NO: 17012). Em algumas modalidades, a sequência de aminoácido da enzima de muteína de DHFR também compreende uma mutação em uma ou mais das posições 80, 113 ou 153. Em algumas modalidades, a se- quência de aminoácido da enzima de muteína de DHFR compreende uma ou mais dentre uma substituição de uma fenilalanina (F) ou uma Leucina (L) na posição 80, uma substituição de uma Leucina (L) ou uma Valina (V) na posição 113 e uma substituição de uma Valina (V) ou um ácido aspártico (D) na posição 153. Receptores Estimulatórios Quiméricos (CSRs)
[00169] A presente invenção fornece um receptor estimulatório quimérico (CSR) para liberar estimulação primária de CD3z às células T (e, consequentemente, um CD3ζ endógeno) quano estimulada usando reagentes de ativação/estimulação padrão, incluindo agonista mAb anti-CD3.
[00170] Receptores estimulatórios quiméricos (CSRs) da presente invenção fornecem um estímulo de CD3ζ para realçar ativação e ex- pansão de células T. Em algumas modalidades, CSRs da presente invenção compreendem um epítopo agonista mAb extracelularmente e um domínio estimulatório CD3ζ intracelularmente e, funcionalmente, convertem um evento de ligação anti-CD28 ou anti-CD2 sobre a super- fície em um evento de sinalização de CD3z em uma célula T alogenei- ca modificada para expressar o CSR. Em algumas modalidades, um CSR compreende uma proteína CD28 ou CD2 de tipo selvagem e um domínio de estimulação intracelular CD3z, para produzir CD28z CSR e CD2z CSR, respectivamente. Em modalidades preferidas, CSR de CD28z e/ou CSR de CD2z também expressam um receptor de antíge- no de ocorrência não natural e/ou uma proteína terapêutica. Em moda- lidades preferidas, o receptor de antígeno de ocorrência não natural compreende um receptor de antígeno quimérico.
[00171] Em certas modalidades, o CSR de CD28z é codificado por uma sequência de aminoácido compreendendo MLRLLLALNLFPSI- QVTGNKILVKQSPMLVAYDNAVNLSCKYSYNLFSREFRASLHKGL- DSAVEVCVVYGNYSQQLQVYSKTGFNCDGKLGNESVTFYLQNLY- VNQTDIYFCKIEVMYPPPYLDNEKSNGTIIHVKGKHLCPSPLFPG- PSKPFWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNM- TPRRPGPTRKHYQPYAPPRDFAAYRSRVKFSRSADAPAYKQGQN- QLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKN- PQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTAT- KDTYDALHMQALPPR (SEQ ID NO: 17910).
[00172] Em certas modalidades, o CSR de CD28z é codificado por uma sequência de ácido nucleico compreendendo atgctgagactgctgctggccctgaatctgttccccagcatccaagtgaccggcaacaagatcct ggtcaagcagagccctatgctggtggcctacgacaacgccgtgaacctgagctgcaagtacag ctacaacctgttcagcagagagttccgggccagcctgcacaaaggactggattctgctgtggaag tgtgcgtggtgtacggcaactacagccagcagctgcaggtctacagcaagaccggcttcaactg cgacggcaagctgggcaatgagagcgtgaccttctacctgcaaaacctgtacgtgaaccagac cgacatctatttctgcaagatcgaagtgatgtacccgcctccttacctggacaacgagaagtccaa cggcaccatcatccacgtgaagggcaagcacctgtgtccttctccactgttccccggacctagca agcctttctgggtgctcgttgttgttggcggcgtgctggcctgttatagcctgctggttacagtggccttc atcatcttttgggtccgaagcaagcggagccggctgctgcacagcgactacatgaacatgaccc ctagacggcccggaccaaccagaaagcactaccagccttacgctcctcctagagacttcgccg cctaccggtccagagtgaagttctccagatccgccgatgctcccgcctataagcagggccagaa ccagctgtacaacgagctgaacctggggagaagagaagagtacgatgtgctggacaagcgga gaggcagagatcctgagatgggcggcaagcccagacggaagaatcctcaagagggcctgta caatgaactgcagaaagacaagatggccgaggcctacagcgagatcggaatgaagggcgag cgcagaagaggcaagggacacgatggactgtaccagggcctgagcaccgccaccaaggata cctatgatgccctgcacatgcaggccctgcctccaaga (SEQ ID NO: 17911).
[00173] Em certas modalidades, o CSR de CD2z é codificado por uma sequência de aminoácido compreendendo
MSFPCKFVASFLLIFNVSSKGAVSKEITNALETWGALGQDINLDIPSFQ MSDDIDDIKWEKTSDKKKIAQFRKEKETFKEKDTYKLFKNGTLKIKHLK TDDQDIYKVSIYDTKGKNVLEKIFDLKIQERVSKPKISWTCINTTLTCEV MNGTDPELNLYQDGKHLKLSQRVITHKWTTSLSAKFKCTAGNKVSKE SSVEPVSCPEKGLDIYLIIGICGGGSLLMVFVALLVFYITKRKKQRSRR NDEELETRAHRVATEERGRKPHQIPASTPQNPATSQHPPPPPGHRS QAPSHRPPPPGHRVQHQPQKRPPAPSGTQVHQQKGPPLPRPRVQP KPPHGAAENSLSPSSNRVKFSRSADAPAYKQGQNQLYNELNLGRRE
EYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDKMAEAYSEIG MKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR (SEQ ID NO: 17912)
[00174] Em certas modalidades, o CSR de CD2z é codificado por uma sequência de ácido nucleico compreendendo atgagcttcccttgcaagttcgtggccagcttcctgctgatcttcaacgtgtcctctaagggcgccgt gtccaaagagatcacaaacgccctggaaacctggggagccctcggccaggatattaacctgga catccccagcttccagatgagcgacgacatcgatgacatcaagtgggagaaaaccagcgaca agaagaagatcgcccagttccggaaagagaaagagacattcaaagagaaggacacctacaa gctgttcaagaacggcaccctgaagatcaagcacctgaaaaccgacgaccaggacatctataa ggtgtccatctacgacaccaagggcaagaacgtgctggaaaagatcttcgacctcaagatccaa gagcgggtgtccaagcctaagatcagctggacctgcatcaacaccacactgacctgcgaagtg atgaacggcacagaccccgagctgaacctgtaccaggatggcaaacacctgaagctgagcca gcgcgtgatcacccacaagtggacaacaagcctgagcgccaagttcaagtgcaccgccggaa acaaagtgtctaaagagtccagcgtcgagcccgtgtcttgccctgaaaaaggactggacatctac ctgatcatcggcatctgtggcggcggaagcctgctgatggtgtttgtggctctgctggtgttctacatc accaagcggaagaagcagcggagcagacggaacgacgaggaactggaaacacgggccc atagagtggccaccgaggaaagaggcagaaagccccaccagattccagccagcacacccc agaatcctgccacctctcaacaccctccacctccacctggacacagatctcaggccccatctcac agacctccaccacctggtcatcgggtgcagcaccagcctcagaaaagacctcctgctcctagcg gcacacaggtgcaccagcaaaaaggacctccactgcctcggcctagagtgcagcctaaacctc ctcatggcgccgctgagaacagcctgtctccaagcagcaacagagtgaagttcagccgcagcg ccgatgctcctgcctataagcagggacagaaccagctgtacaacgagctgaatctggggcgca gagaagagtacgatgtgctggacaagcggagaggcagagatcctgagatgggcggcaagcc cagacggaagaatcctcaagagggcctgtataatgagctgcagaaagacaagatggccgagg cctacagcgagatcggaatgaagggcgagcgcagaagaggcaagggacacgatggactgta tcagggcctgagcaccgccaccaaggatacctatgatgccctgcacatgcaggccctgcctcca aga (SEQ ID NO: 17913).
[00175] As células T modificadas da presente invenção compreen- dendo/expressando um CSR da presente invenção melhora uma ex- pansão de células T quando comparadas àquelas células que não compreendem/expressam um CSR da presente invenção. Células Imunes e Precursoras Imunes
[00176] Em certas modalidades, as células imunes da presente in- venção compreendem células progenitoras linfoides, células extermi- nadoras naturais (NK), linfócitos T (células T), células T de memória tronco (células TSCM), células T de memória central (TCM), células T semelhantes à célula-tronco, linfócitos B (células B), células progenito- ras mieloides, neutrófilos, basófilos, eosinófilos, monócitos, macrófa- gos, plaquetas, eritrócitos, hemácias (RBCs), megacariócitos ou oste- oclastos.
[00177] Em certas modalidades, as células precursoras imunes compreendem quaisquer células que podem se diferenciar em um ou mais tipos de células imunes. Em certas modalidades, as células pre- cursoras imunes compreendem células-tronco multipotentes que po- dem se autorrenovar e se desenvolver em células imunes. Em certas modalidades, as células precursoras imunes compreendem as células- tronco hematopoiéticas (HSCs) ou descendentes das mesmas. Em certas modalidades, as células precursoras imunes compreendem as células precursoras que podem se desenvolver em células imunes. Em certas modalidades, as células precursoras imunes compreendem cé- lulas progenitoras hematopoiéticas (HPCs). Células-tronco hematopoiéticas (HSCs)
[00178] As células-tronco hematopoiéticas (HSCs) são células mul- tipotentes com autorrenovação. Todas as células sanguíneas diferen- ciadas das linhagens linfóide e mieloide surgem de HSCs. As HSCs podem ser encontradas na medula óssea adulta, sangue periférico, sangue periférico mobilizado, efluente de diálise peritoneal e sangue do cordão umbilical.
[00179] HSCs da presente invenção podem ser isoladas ou deriva- das de uma célula-tronco primária ou cultivada. As HSCs da presente invenção podem ser isoladas ou derivadas de uma célula-tronco em- brionária, uma célula-tronco multipotente, uma célula-tronco pluripo- tente, uma célula-tronco adulta ou uma célula-tronco pluripotente indu- zida (iPSC).
[00180] Células precursoras imunes da presente invenção podem compreender uma HSC ou uma célula descendente de HSC. Células descendentes de HSC exemplares da presente invenção incluem, po- rém, não estão limitadas a, células-tronco multipotentes, células pro- genitoras linfoides, células exterminadoras naturais (NK), células T lin- fócito (células T), células B linfócito (células B), células progenitoras mieloides, neutrófilos, basófilos, eosinófilos, monócitos e macrófagos.
[00181] HSCs produzidas pelos métodos da presente invenção po- dem reter características de células-tronco "primitivas" que, embora sejam obtidas ou derivadas de uma célula-tronco adulta e enquanto comprometidas com uma única linhagem, compartilham características de células-tronco embrionárias. Por exemplo, as HSCs "primitivas" produzidas pelos métodos da presente invenção retêm sua "resistên- cia" após a divisão e não se diferenciam. Consequentemente, como terapia de célula adotiva, as HSCs "primitivas" produzidas pelos méto- dos da presente invenção não só reabastecem seus números, mas se expandem in vivo. HSCs "primitivas" produzidas pelos métodos da presente invenção podem ser terapeuticamente eficazes quando ad- ministradas como uma dose única. Em algumas modalidades, as HSCs primitivas da presente invenção são CD34 +. Em algumas mo- dalidades, as HSCs primitivas da presente invenção são CD34 + e CD38-. Em algumas modalidades, HSCs primitivas da presente in- venção são CD34+, CD38- e CD90+. Em algumas modalidades, HSCs primitivas da presente invenção são CD34+, CD38-, CD90+ e CD45RA-. Em algumas modalidades, HSCs primitivas da presente in- venção são CD34+, CD38-, CD90+, CD45RA- e CD49f+. Em algumas modalidades, as HSCs mais primitivas da presente invenção são CD34+, CD38-, CD90+, CD45RA- e CD49f+.
[00182] Em algumas modalidades da presente invenção, HSCs primitivas, HSCs e/ou células descendentes de HSC podem ser modi- ficadas de acordo com os métodos da presente invenção para expres- sar uma sequência exógena (por exemplo, um receptor de antígeno quimérico ou proteína terapêutica). Em algumas modalidades da pre- sente invenção, HSCs primitivas modificadas, HSCs modificadas e/ou células descendentes de HSC modificadas podem ser dianteiras dife- renciadas para produzir uma célula imune modificada incluindo, po- rém, não limitada a, uma célula T modificada, uma célula exterminado- ra natural modificada e/ou uma célula B modificada da presente inven- ção. Células T
[00183] Células T modificadas da presente invenção podem ser de- rivadas de células-tronco hematopoiéticas e progenitoras modificadas (HSPCs) ou HSCs modificadas.
[00184] Ao contrário dos produtos biológicos e quimioterápicos tra- dicionais, as células T modificadas da presente invenção possuem a capacidade de se reproduzir rapidamente após o reconhecimento do antígeno, evitando potenciamente, assim, a necessidade de repetir tratamentos. Para conseguir isso, em algumas modalidades, as células T modificadas da presente invenção não apenas conduzem uma res- posta inicial, mas também persistem no paciente como uma população estável de células T de memória viáveis para prevenir potenciais reca- ídas. Alternativamente, em algumas modalidades, quando não é dese- jado, células T modificadas da presente invenção não persistem no paciente.
[00185] Esforços intensivos têm sido focados no desenvolvimento de moléculas receptoras de antígenos que não causam exaustão de células T por meio de sinalização independente de antígeno (tônica), bem como, de um produto de células T modificadas contendo células T de memória precoce, especialmente células-tronco de memória (TSCM) ou células T similares à célula-tronco. Células T modificadas similares à célula-tronco da presente invenção apresentam maior ca- pacidade de autorrenovação e capacidade multipotente para derivar células T de memória central (TCM) ou células tipo TCM, células T de memória efetora (TEM) e efetoras (TE), produzindo assim melhor erradi- cação do tumor e enxerto de células T modificadas em longo prazo. Uma via linear de diferenciação pode ser responsável pela geração destas células: células T Naïve (TN)> TSCM> TCM> TEM> TE> TTE, em que TN é a célula precursora origem que dá origem diretamente à TSCM, que então, por sua vez, dá origem diretamente à TCM, etc. As composições de células T da presente invenção podem compreender um ou mais dentre cada subconjunto de células T origens com células TSCM sendo as mais abundantes (por exemplo, TSCM> TCM> TEM> TE> TTE).
[00186] Em algumas modalidades dos métodos da presente inven- ção, um precursor de célula imune é diferenciado em ou é capaz de se diferenciar em uma célula T de memória precoce, uma célula T seme- lhante à célula-tronco, células T Naïve (TN), uma TSCM, uma TCM, uma TEM, uma TE ou uma TTE. Em algumas modalidades, o precursor de célula imune é uma HSC primitiva, uma HSC, ou uma célula descen- dente de HSC da presente invenção.
[00187] Em algumas modalidades dos métodos da presente inven- ção, a célula imune é uma célula T de memória precoce, uma célula T semelhante à célula-tronco, células T Naïve (TN), uma TSCM, uma TCM, uma TEM, uma TE ou uma TTE.
[00188] Em algumas modalidades dos métodos da presente inven- ção, a célula imune é uma célula T de memória precoce.
[00189] Em algumas modalidades dos métodos da presente in- venção, a célula imune é uma célula T tipo célula-tronco.
[00190] Em algumas modalidades dos métodos da presente in- venção, a célula imune é uma TSCM.
[00191] Em algumas modalidades dos métodos da presente in- venção, a célula imune é uma TCM.
[00192] Em algumas modalidades dos métodos da presente in- venção, os métodos modificam e/ou os métodos produzem uma plura- lidade de células T modificadas, em que pelo menos 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer porcentagem no meio da plu- ralidade de células T modificadas expressam um ou mais marca- dor(es) de superfície celular de uma célula T de memória precoce. Em certas modalidades, a pluralidade de células T de memória precoce modificadas compreende pelo menos uma célula T tipo célula-tronco modificada. Em certas modalidades, a pluralidade de células T de memória precoce modificadas compreende pelo menos uma TSCM mo- dificada. Em certas modalidades, a pluralidade de células T de memó- ria precoce modificada compreende pelo menos uma TCM modificada.
[00193] Em algumas modalidades dos métodos da presente in- venção, os métodos modificam e/ou os métodos produzem uma plura- lidade de células T modificadas, em que pelo menos 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer porcentagem no meio da plu- ralidade de células T modificadas expressam um ou mais marca- dor(es) de superfície celular de uma célula T tipo célula-tronco. Em certas modalidades, a pluralidade de células T tipo célula-tronco modi- ficadas compreende pelo menos uma TSCM modificada. Em certas mo- dalidades, a pluralidade de células T tipo célula-tronco modificadas compreende pelo menos uma TCM modificada.
[00194] Em algumas modalidades dos métodos da presente in- venção, os métodos modificam e/ou os métodos produzem uma plura- lidade de células T modificadas, em que pelo menos 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer porcentagem no meio da plu- ralidade de células T modificadas expressam um ou mais marca-
dor(es) de superfície celular de uma célula T de memória tronco (TSCM). Em certas modalidades, os marcadores de superfície celular compreendem CD62L e CD45RA. Em certas modalidades, os marca- dores de superfície celular compreendem um ou mais dentre CD62L, CD45RA, CD28, CCR7, CD127, CD45RO, CD95, CD95 e IL-2Rβ. Em certas modalidades, os marcadores de superfície celular compreen- dem um ou mais dentre CD45RA, CD95, IL-2Rβ, CCR7, e CD62L.
[00195] Em algumas modalidades dos métodos da presente in- venção, os métodos modificam e/ou os métodos produzem uma plura- lidade de células T modificadas, em que pelo menos 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer porcentagem no meio da plu- ralidade de células T modificadas expressam um ou mais marca- dor(es) de superfície celular de uma célula T de memória central (TCM). Em certas modalidades, os marcadores de superfície celular compre- endem um ou mais dentre CD45RO, CD95, IL-2Rβ, CCR7, e CD62L.
[00196] Em algumas modalidades dos métodos da presente in- venção, os métodos modificam e/ou os métodos produzem uma plura- lidade de células T modificadas, em que pelo menos 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer porcentagem no meio da plu- ralidade de células T modificadas expressam um ou mais marca- dor(es) de superfície celular de uma célula T naïve (TN). Em certas modalidades, os marcadores de superfície celular compreendem um ou mais dentre CD45RA, CCR7 e CD62L.
[00197] Em algumas modalidades dos métodos da presente in- venção, os métodos modificam e/ou os métodos produzem uma plura- lidade de células T modificadas, em que pelo menos 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer porcentagem no meio da plu-
ralidade de células T modificadas expressam um ou mais marca- dor(es) de superfície celular de uma célula T efetora (TEFF modificada). Em certas modalidades, os marcadores de superfície celular compre- endem um ou mais dentre CD45RA, CD95, e IL-2Rβ.
[00198] Em algumas modalidades dos métodos da presente in- venção, os métodos modificam e/ou os métodos produzem uma plura- lidade de células T modificadas, em que pelo menos 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer porcentagem no meio da plu- ralidade de células T modificadas expressam um ou mais marca- dor(es) de superfície celular de uma célula T tipo célula-tronco, uma célula T de memória tronco (TSCM) ou uma célula T de memória central (TCM).
[00199] Em algumas modalidades dos métodos da presente in- venção, um tampão compreende a célula imune ou precursor da mesma. O tampão mantém ou realça um nível de viabilidade celular e/ou um fenótipo tipo tronco de uma célula imune ou precursor da mesma, incluindo células T. Em certas modalidades, o tampão man- tém ou realça um nível de viabilidade celular e/ou um fenótipo tipo tronco das células T humanas primárias antes da nucleofecção. Em certas modalidades, o tampão mantém ou realça um nível de viabilida- de celular e/ou um fenótipo tipo tronco das células T humanas primá- rias durante a nucleofecção. Em certas modalidades, o tampão man- tém ou realça um nível de viabilidade celular e/ou um fenótipo tipo tronco das células T humanas primárias após a nucleofecção. Em cer- tas modalidades, o tampão compreende um ou mais dentre KCl, MgCl2, ClNa, Glicose e Ca(NO3)2 em qualquer concentração ou abun- dância absoluta ou relativa, e, opcionalmente, o tampão também com- preende um suplemento selecionado do grupo consistindo em HEPES, Tris/HCl, e um tampão de fosfato. Em certas modalidades, o tampão compreende KCl a 5 mM, MgCl2 a 15 mM, ClNa a 90 mM, glicose a 10 mM e Ca(NO3)2 a 0,4 mM. Em certas modalidades, o tampão compre- ende KCl a 5 mM, MgCl2 a 15 mM, ClNa a 90 mM, glicose a 10 mM e Ca(NO3)2 a 0,4 mM e um suplemento compreendendo HEPES a 20 mM e Tris/HCl a 75 mM. Em certas modalidades, o tampão compreen- de KCl a 5 mM, MgCl2 a 15 mM, ClNa a 90 mM, glicose a 10 mM e Ca(NO3)2 a 0,4 mM e um suplemento compreendendo Na2HPO4/NaH2PO4 a 40 mM a pH 7,2. Em certas modalidades, a composição compreendendo células T humanas primárias compreen- de 100 μl do tampão e entre 5 x 106 e 25 x 106 células. Em certas mo- dalidades, a composição compreende uma relação escalável de 250 x 106 células T humanas primárias por mililitro de tampão ou outro meio durante a etapa de introdução.
[00200] Em algumas modalidades dos métodos da presente in- venção, os métodos compreendem contactar uma célula imune da presente invenção, incluindo uma célula T da presente invenção, e uma composição de expansão de célula T. Em algumas modalidades dos métodos da presente invenção, a etapa de introduzir um transpo- son e/ou transposase da presente invenção em uma célula imune da presente invenção pode também compreender contactar a célula imu- ne e uma composição de expansão de célula T. Em algumas modali- dades, incluindo aquelas em que a etapa de introduzir dos métodos compreende uma eletroporação ou uma etapa de nucleofecção, a ele- troporação ou uma etapa de nucleofecção pode ser realizada com a célula imune contactando composição de expansão de célula T da presente invenção.
[00201] Em algumas modalidades dos métodos da presente in- venção, a composição de expansão de célula T compreende, consiste essencialmente em ou consiste em fósforo; um ou mais dentre um áci- do octanoico, um ácido palmítico, um ácido linoleico, e um ácido olei-
co; um esterol; e um alcano.
[00202] Em certas modalidades dos métodos de produzir uma cé- lula T modificada da presente invenção, o suplemento de expansão compreende uma ou mais citocina(s). Uma ou mais citocina(s) po- de(m) compreender qualquer citocina, incluindo, porém, não limitada a, linfocinas. Exemplares limpocinas incluem, mas não estão limitadas a, interleucina-2 (IL-2), interleucina-3 (IL-3), interleucina-4 (IL-4), interleu- cina-5 (IL-5), interleucina-6 (IL-6), interleucina-7 (IL-7), interleucina-15 (IL-15), interleucina-21 (IL-21), fator estimulante de colônia de macró- fago-granulócito (GM-CSF) e interferon-gama (INFγ). Uma ou mais citocina(s) pode(m) compreender IL-2.
[00203] Em algumas modalidades dos métodos da presente in- venção, a composição de expansão de célula T compreende albumina de soro humana, insulina humana recombinante, transferrina humana, 2-mercaptoetanol, e um suplemento de expansão. Em certas modali- dades deste método, a composição de expansão de célula T também compreende um ou mais dentre ácido octanoico, nicotinamida, 2,4,7,9- tetrametil-5-decin-4,7-diol (TMDD), diisopropil adipato (DIPA), n-butil- benzenossulfonamida, ácido 1,2-benzenodicarboxílico, bis(2- metilpropil) éster, ácido palmítico, ácido linoleico, ácido oleico, hidrazi- da de ácido esteárico, oleamida, um esterol e um alcano. Em certas modalidades deste método, a composição de expansão de célula T também compreende um ou mais dentre ácido octanoico, ácido palmí- tico, ácido linoleico, ácido oleico e um esterol. Em certas modalidades deste método, a composição de expansão de célula T também com- preende um ou mais dentre ácido octanoico em uma concentração en- tre 0,9 mg/kg a 90 mg/kg, inclusive dos pontos de extremidade; ácido palmítico em uma concentração entre 0,2 mg/kg a 20 mg/kg, inclusive dos pontos de extremidade; ácido linoleico em uma concentração en- tre 0,2 mg/kg a 20 mg/kg, inclusive dos pontos de extremidade; ácido oleico em uma concentração de 0,2 mg/kg a 20 mg/kg, inclusive dos pontos de extremidade; e um esterol em uma concentração de cerca de 0,1 mg/kg a 10 mg/kg, inclusive dos pontos de extremidade. Em certas modalidades deste método, a composição de expansão de célu- la T também compreende um ou mais dentre ácido octanoico em uma concentração de cerca de 9 mg/kg, ácido palmítico em uma concen- tração de cerca de 2 mg/kg, ácido linoleico em uma concentração de cerca de 2 mg/kg, ácido oleico em uma concentração de cerca de 2 mg/kg e um esterol em uma concentração de cerca de 1 mg/kg. Em certas modalidades deste método, a composição de expansão de célu- la T também compreende um ou mais dentre ácido octanoico em uma concentração entre 6,4 µmol/kg e 640 µmol/kg, inclusive dos pontos de extremidade; ácido palmítico em uma concentração entre 0,7 µmol/kg e 70 µmol/kg, inclusive dos pontos de extremidade; ácido linoleico em uma concentração entre 0,75 µmol/kg e 75 µmol/kg, inclusive dos pon- tos de extremidade; ácido oleico em uma concentração entre 0,75 µmol/kg e 75 µmol/kg, inclusive dos pontos de extremidade; e um este- rol em uma concentração entre 0,25 µmol/kg e 25 µmol/kg, inclusive dos pontos de extremidade. Em certas modalidades deste método, a composição de expansão de célula T também compreende um ou mais dentre ácido octanoico em uma concentração de cerca de 64 µmol/kg, ácido palmítico em uma concentração de cerca de 7 µmol/kg, ácido linoleico em uma concentração de cerca de 7,5 µmol/kg, ácido oleico em uma concentração de cerca de 7,5 µmol/kg e um esterol em uma concentração de cerca de 2,5 µmol/kg.
[00204] Em certas modalidades, a composição de expansão de célula T compreende um ou mais dentre albumina de soro humana, insulina humana recombinante, transferrina humana, 2- mercaptoetanol, e um suplemento de expansão para produzir uma plu- ralidade de células T modificadas expandidas, em que pelo menos 2%
de uma pluralidade de células T modificadas expressam um ou mais marcador(es) de superfície celular de uma célula T de memória preco- ce, uma célula T tipo célula-tronco, uma célula T de memória tronco (TSCM) e/ou uma célula T de memória central (TCM). Em certas modali- dades, a composição de expansão de célula T compreende ou tam- bém compreende um ou mais dentre ácido octanoico, nicotinamida, 2,4,7,9-tetrametil-5-decin-4,7-diol (TMDD), diisopropil adipato (DIPA), n-butil-benzenossulfonamida, ácido 1,2-benzenodicarboxílico, bis(2- metilpropil) éster, ácido palmítico, ácido linoleico, ácido oleico, hidrazi- da de ácido esteárico, oleamida, um esterol e um alcano.
Em certas modalidades, a composição de expansão de célula T compreende um ou mais dentre ácido octanoico, ácido palmítico, ácido linoleico, ácido oleico e um esterol (por exemplo, colesterol). Em certas modalidades, a composição de expansão de célula T compreende um ou mais den- tre ácido octanoico em uma concentração entre 0,9 mg/kg a 90 mg/kg, inclusive dos pontos de extremidade; ácido palmítico em uma concen- tração entre 0,2 mg/kg a 20 mg/kg, inclusive dos pontos de extremida- de; ácido linoleico em uma concentração entre 0,2 mg/kg a 20 mg/kg, inclusive dos pontos de extremidade; ácido oleico em uma concentra- ção de 0,2 mg/kg a 20 mg/kg, inclusive dos pontos de extremidade; e um esterol em uma concentração de cerca de 0,1 mg/kg a 10 mg/kg, inclusive dos pontos de extremidade (em que mg/kg = partes por mi- lhão). Em certas modalidades, a composição de expansão de célula T compreende um ou mais dentre ácido octanoico em uma concentração de cerca de 9 mg/kg, ácido palmítico em uma concentração de cerca de 2 mg/kg, ácido linoleico em uma concentração de cerca de 2 mg/kg, ácido oleico em uma concentração de cerca de 2 mg/kg, e um esterol em uma concentração de cerca de 1 mg/kg (em que mg/kg = partes por milhão). Em certas modalidades, a composição de expansão de célula T compreende um ou mais dentre ácido octanoico em uma con-
centração de 9,19 mg/kg, ácido palmítico em uma concentração de 1,86 mg/kg, ácido linoleico em uma concentração de cerca de 2,12 mg/kg, ácido oleico em uma concentração de cerca de 2,13 mg/kg, e um esterol em uma concentração de cerca de 1,01 mg/kg (em que mg/kg = partes por milhão). Em certas modalidades, a composição de expansão de célula T compreende ácido octanoico em uma concen- tração de 9,19 mg/kg, ácido palmítico em uma concentração de 1,86 mg/kg, ácido linoleico em uma concentração de 2,12 mg/kg, ácido oleico em uma concentração de cerca de 2,13 mg/kg, e um esterol em uma concentração de 1,01 mg/kg (em que mg/kg = partes por milhão). Em certas modalidades, a composição de expansão de célula T com- preende um ou mais dentre ácido octanoico em uma concentração en- tre 6,4 µmol/kg e 640 µmol/kg, inclusive dos pontos de extremidade; ácido palmítico em uma concentração entre 0,7 µmol/kg e 70 µmol/kg, inclusive dos pontos de extremidade; ácido linoleico em uma concen- tração entre 0,75 µmol/kg e 75 µmol/kg, inclusive dos pontos de ex- tremidade; ácido oleico em uma concentração entre 0,75 µmol/kg e 75 µmol/kg, inclusive dos pontos de extremidade; e um esterol em uma concentração entre 0,25 µmol/kg e 25 µmol/kg, inclusive dos pontos de extremidade.
Em certas modalidades, a composição de expansão de célula T compreende um ou mais dentre ácido octanoico em uma con- centração de cerca de 64 µmol/kg, ácido palmítico em uma concentra- ção de cerca de 7 µmol/kg, ácido linoleico em uma concentração de cerca de 7,5 µmol/kg, ácido oleico em uma concentração de cerca de 7,5 µmol/kg e um esterol em uma concentração de cerca de 2,5 µmol/kg.
Em certas modalidades, a composição de expansão de célula T compreende um ou mais dentre ácido octanoico em uma concentra- ção de cerca de 63,75 µmol/kg, ácido palmítico em uma concentração de cerca de 7,27 µmol/kg, ácido linoleico em uma concentração de cerca de 7,57 µmol/kg, ácido oleico em uma concentração de cerca de
7,56 µmol/kg e um esterol em uma concentração de cerca de 2,61 µmol/kg. Em certas modalidades, a composição de expansão de célula T compreende ácido octanoico em uma concentração de cerca de 63,75 µmol/kg, ácido palmítico em uma concentração de cerca de 7,27 µmol/kg, ácido linoleico em uma concentração de cerca de 7,57 µmol/kg, ácido oleico em uma concentração de 7,56 µmol/kg e um es- terol em uma concentração de 2,61 µmol/kg.
[00205] Como usado aqui, os termos "composição de expansão de célula T suplementada" ou "composição de expansão de célula T" po- dem ser usados alternadamente com um meio compreendendo um ou mais dentre albumina de soro humana, insulina humana recombinante, transferrina humana, 2-mercaptoetanol, e um suplemento de expansão a 37 °C. Alternativamente, ou em adição, os termos "composição de expansão de célula T suplementada" ou "composição de expansão de célula T" podem ser usados alternadamente com um meio compreen- dendo um ou mais dentre fósforo, um ácido graxo octanoico, um ácido graxo palmítico, um ácido graxo linoleico e um ácido oleico. Em certas modalidades, o meio compreende uma quantidade de fósforo que é 10 vezes maior do que pode ser encontrado em, por exemplo, meio de Dulbecco modificado por Iscove ((IMDM); disponível em ThermoFisher Scientific como número de catálogo 12440053).
[00206] Como usado aqui, os termos "composição de expansão de célula T suplementada" ou "composição de expansão de célula T" po- dem ser usados alternadamente com um meio compreendendo um ou mais dentre albumina de soro humana, insulina humana recombinante, transferrina humana, 2-mercaptoetanol, MDM por Iscove, e um suple- mento de expansão a 37 °C. Alternativamente, ou em adição, os ter- mos "composição de expansão de célula T suplementada" ou "compo- sição de expansão de célula T" podem ser usados alternadamente com um meio compreendendo um ou mais dentre os seguintes ele-
mentos: bóro, sódio, magnésio, fósforo, potássio e cálcio. Em certas modalidades, os termos "composição de expansão de célula T suple- mentada" ou "composição de expansão de célula T" podem ser usa- dos alternadamente com um meio compreendendo um ou mais dentre os seguintes elementos presentes nas correspondentes concentrações médias: bóro a 3,7 mg/L, sódio a 3000 mg/L, magnésio a 18 mg/L, fós- foro a 29 mg/L, potássio a 15 mg/L e cálcio a 4 mg/L.
[00207] Como usado aqui, os termos "composição de expansão de célula T suplementada" ou "composição de expansão de célula T" po- dem ser usados alternadamente com um meio compreendendo um ou mais dentre albumina de soro humana, insulina humana recombinante, transferrina humana, 2-mercaptoetanol, e um suplemento de expansão a 37 °C. Alternativamente, ou em adição, os termos "composição de expansão de célula T suplementada" ou "composição de expansão de célula T" podem ser usados alternadamente com um meio compreen- dendo um ou mais dentre os seguintes componentes: ácido octanoico (CAS No. 124-07-2), nicotinamida (CAS No. 98-92-0), 2,4,7,9- tetrametil-5-decin-4,7-diol (TMDD) (CAS No. 126-86-3), diisopropil adi- pato (DIPA) (CAS No. 6938-94-9), n-butil-benzenossulfonamida (CAS No. 3622-84-2), ácido 1,2-benzenodicarboxílico, bis(2-metilpropil) éster (CAS No. 84-69-5), ácido palmítico (CAS No. 57-10-3), ácido linoleico (CAS No. 60-33-3), ácido oleico (CAS No. 112-80-1), hidrazida de áci- do esteárico (CAS No. 4130-54-5), oleamida (CAS No. 3322-62-1), es- terol (por exemplo, colesterol) (CAS No. 57-88-5), e alcanos (por exemplo, nonadecano) (CAS No. 629-92-5). Em certas modalidades, os termos "composição de expansão de célula T suplementada" ou "composição de expansão de célula T" podem ser usados alternada- mente com um meio compreendendo um ou mais dentre os seguintes componentes: ácido octanoico (CAS No. 124-07-2), nicotinamida (CAS No. 98-92-0), 2,4,7,9-tetrametil-5-decin-4,7-diol (TMDD) (CAS No. 126-
86-3), diisopropil adipato (DIPA) (CAS No. 6938-94-9), n-butil- benzenossulfonamida (CAS No. 3622-84-2), ácido 1,2- benzenodicarboxílico, bis(2-metilpropil) éster (CAS No. 84-69-5), ácido palmítico (CAS No. 57-10-3), ácido linoleico (CAS No. 60-33-3), ácido oleico (CAS No. 112-80-1), hidrazida de ácido esteárico (CAS No. 4130-54-5), oleamida (CAS No. 3322-62-1), esterol (por exemplo, co- lesterol) (CAS No. 57-88-5), alcanos (por exemplo, nonadecano) (CAS No. 629-92-5), e fenol vermelho (CAS No. 143-74-8). Em certas moda- lidades, os termos "composição de expansão de célula T suplementa- da" ou "composição de expansão de célula T" podem ser usados al- ternadamente com um meio compreendendo um ou mais dentre os seguintes componentes: ácido octanoico (CAS No. 124-07-2), nicoti- namida (CAS No. 98-92-0), 2,4,7,9-tetrametil-5-decin-4,7-diol (TMDD) (CAS No. 126-86-3), diisopropil adipato (DIPA) (CAS No. 6938-94-9), n-butil-benzenossulfonamida (CAS No. 3622-84-2), ácido 1,2- benzenodicarboxílico, bis(2-metilpropil) éster (CAS No. 84-69-5), ácido palmítico (CAS No. 57-10-3), ácido linoleico (CAS No. 60-33-3), ácido oleico (CAS No. 112-80-1), hidrazida de ácido esteárico (CAS No. 4130-54-5), oleamida (CAS No. 3322-62-1), fenol vermelho (CAS No. 143-74-8) e álcool de lanolina.
[00208] Em certas modalidades, os termos "composição de ex- pansão de célula T suplementada" ou "composição de expansão de célula T" podem ser usados alternadamente com um meio compreen- dendo um ou mais dentre albumina de soro humana, insulina humana recombinante, transferrina humana, 2-mercaptoetanol, e um suple- mento de expansão a 37 °C. Alternativamente, ou em adição, os ter- mos "composição de expansão de célula T suplementada" ou "compo- sição de expansão de célula T" podem ser usados alternadamente com um meio compreendendo um ou mais dentre os seguintes íons: sódio, amônio, potássio, magnésio, cálcio, cloreto, sulfato e fosfato.
[00209] Como usado aqui, os termos "composição de expansão de célula T suplementada" ou "composição de expansão de célula T" po- dem ser usados alternadamente com um meio compreendendo um ou mais dentre albumina de soro humana, insulina humana recombinante, transferrina humana, 2-mercaptoetanol, e um suplemento de expansão a 37 °C.
Alternativamente, ou em adição, os termos "composição de expansão de célula T suplementada" ou "composição de expansão de célula T" podem ser usados alternadamente com um meio compreen- dendo um ou mais dentre os seguintes aminoácidos livres: histidina, asparagina, serina, glutamato, arginina, glicina, ácido aspártico, ácido glutâmico, treonina, alanina, prolina, cisteína, lisina, tirosina, metionina, valina, isoleucina, leucina, fenilalanina e triptofano.
Em certas modali- dades, os termos "composição de expansão de célula T suplementa- da" ou "composição de expansão de célula T" podem ser usados al- ternadamente com um meio compreendendo um ou mais dentre os seguintes aminoácidos livres nas correspondentes porcentagens mol médias: histidina (cerca de 1%), asparagina (cerca de 0,5%), serina (cerca de 1,5%), glutamina (cerca de 67%), arginina (cerca de 1,5%), glicina (cerca de 1,5%), ácido aspártico (cerca de 1%), ácido glutâmico (cerca de 2%), treonina (cerca de 2%), alanina (cerca de 1%), prolina (cerca de 1,5%), cisteína (cerca de 1,5%), lisina (cerca de 3%), tirosina (cerca de 1,5%), metionina (cerca de 1%), valina (cerca de 3,5%), iso- leucina (cerca de 3%), leucina (cerca de 3,5%), fenilalanina (cerca de 1,5%) e triptofano (cerca de 0,5%). Em certas modalidades, os termos "composição de expansão de célula T suplementada" ou "composição de expansão de célula T" podem ser usados alternadamente com um meio compreendendo um ou mais dentre os seguintes aminoácidos livres nas correspondentes porcentagens mol médias: histidina (cerca de .78%), asparagina (cerca de 0,4%), serina (cerca de 1,6%), gluta- mina (cerca de 67,01%), arginina (cerca de 1,67%), glicina (cerca de
1,72%), ácido aspártico (cerca de 1,00%), ácido glutâmico (cerca de 1,93%), treonina (cerca de 2,38%), alanina (cerca de 1,11%), prolina (cerca de 1,49%), cisteína (cerca de 1,65%), lisina (cerca de 2,84%), tirosina (cerca de 1,62%), metionina (cerca de 0,85%), valina (cerca de 3,45%), isoleucina (cerca de 3,14%), leucina (cerca de 3,3%), fenilala- nina (cerca de 1,64%) e triptofano (cerca de 0,37%).
[00210] Como usado aqui, os termos "composição de expansão de célula T suplementada" ou "composição de expansão de célula T" po- dem ser usados alternadamente com um meio compreendendo um ou mais dentre albumina de soro humana, insulina humana recombinante, transferrina humana, 2-mercaptoetanol, MDM por Iscove, e um suple- mento de expansão a 37 °C. Alternativamente, ou em adição, os ter- mos "composição de expansão de célula T suplementada" ou "compo- sição de expansão de célula T" podem ser usados alternadamente com um meio compreendendo um ou mais dentre fósforo, um ácido graxo octanoico, um ácido graxo palmítico, um ácido graxo linoleico e um ácido oleico. Em certas modalidades, o meio compreende uma quantidade de fósforo que é 10 vezes maior do que pode ser encon- trado em, por exemplo, meio de Dulbecco modificado por Iscove ((IMDM); disponível em ThermoFisher Scientific como número de catá- logo 12440053).
[00211] Em certas modalidades, os termos "composição de ex- pansão de célula T suplementada" ou "composição de expansão de célula T" podem ser usados alternadamente com um meio compreen- dendo um ou mais dentre ácido octanoico, ácido palmítico, ácido lino- leico, ácido oleico e um esterol (por exemplo, colesterol). Em certas modalidades, os termos "composição de expansão de célula T suple- mentada" ou "composição de expansão de célula T" podem ser usa- dos alternadamente com um meio compreendendo um ou mais dentre ácido octanoico em uma concentração entre 0,9 mg/kg a 90 mg/kg,
inclusive dos pontos de extremidade; ácido palmítico em uma concen- tração entre 0,2 mg/kg a 20 mg/kg, inclusive dos pontos de extremida- de; ácido linoleico em uma concentração entre 0,2 mg/kg a 20 mg/kg, inclusive dos pontos de extremidade; ácido oleico em uma concentra- ção de 0,2 mg/kg a 20 mg/kg, inclusive dos pontos de extremidade; e um esterol em uma concentração de cerca de 0,1 mg/kg a 10 mg/kg, inclusive dos pontos de extremidade (em que mg/kg = partes por mi- lhão). Em certas modalidades, os termos "composição de expansão de célula T suplementada" ou "composição de expansão de célula T" po- dem ser usados alternadamente com um meio compreendendo um ou mais dentre ácido octanoico em uma concentração de cerca de 9 mg/kg, ácido palmítico em uma concentração de cerca de 2 mg/kg, ácido linoleico em uma concentração de cerca de 2 mg/kg, ácido olei- co em uma concentração de cerca de 2 mg/kg, e um esterol em uma concentração de cerca de 1 mg/kg (em que mg/kg = partes por mi- lhão). Em certas modalidades, os termos "composição de expansão de célula T suplementada" ou "composição de expansão de célula T" po- dem ser usados alternadamente com um meio compreendendo um ou mais dentre ácido octanoico em uma concentração de 9,19 mg/kg, ácido palmítico em uma concentração de 1,86 mg/kg, ácido linoleico em uma concentração de cerca de 2,12 mg/kg, ácido oleico em uma concentração de cerca de 2,13 mg/kg, e um esterol em uma concen- tração de cerca de 1,01 mg/kg (em que mg/kg = partes por milhão). Em certas modalidades, os termos "composição de expansão de célu- la T suplementada" ou "composição de expansão de célula T" podem ser usados alternadamente com um meio compreendendo um ou mais dentre ácido octanoico em uma concentração de 9,19 mg/kg, ácido palmítico em uma concentração de 1,86 mg/kg, ácido linoleico em uma concentração de 2,12 mg/kg, ácido oleico em uma concentração de cerca de 2,13 mg/kg, e um esterol em uma concentração de 1,01 mg/kg (em que mg/kg = partes por milhão). Em certas modalidades, os termos "composição de expansão de célula T suplementada" ou "com- posição de expansão de célula T" podem ser usados alternadamente com um meio compreendendo um ou mais dentre ácido octanoico em uma concentração entre 6,4 µmol/kg e 640 µmol/kg, inclusive dos pon- tos de extremidade; ácido palmítico em uma concentração entre 0,7 µmol/kg e 70 µmol/kg, inclusive dos pontos de extremidade; ácido lino- leico em uma concentração entre 0,75 µmol/kg e 75 µmol/kg, inclusive dos pontos de extremidade; ácido oleico em uma concentração entre 0,75 µmol/kg e 75 µmol/kg, inclusive dos pontos de extremidade; e um esterol em uma concentração entre 0,25 µmol/kg e 25 µmol/kg, inclusi- ve dos pontos de extremidade. Em certas modalidades, os termos "composição de expansão de célula T suplementada" ou "composição de expansão de célula T" podem ser usados alternadamente com um meio compreendendo um ou mais dentre ácido octanoico em uma concentração de cerca de 64 µmol/kg, ácido palmítico em uma con- centração de cerca de 7 µmol/kg, ácido linoleico em uma concentração de cerca de 7,5 µmol/kg, ácido oleico em uma concentração de cerca de 7,5 µmol/kg e um esterol em uma concentração de cerca de 2,5 µmol/kg.
[00212] Em certas modalidades, os termos "composição de ex- pansão de célula T suplementada" ou "composição de expansão de célula T" podem ser usados alternadamente com um meio compreen- dendo um ou mais dentre ácido octanoico em uma concentração de cerca de 63,75 µmol/kg, ácido palmítico em uma concentração de cer- ca de 7,27 µmol/kg, ácido linoleico em uma concentração de cerca de 7,57 µmol/kg, ácido oleico em uma concentração de cerca de 7,56 µmol/kg e um esterol em uma concentração de cerca de 2,61 µmol/kg. Em certas modalidades, os termos "composição de expansão de célu- la T suplementada" ou "composição de expansão de célula T" podem ser usados alternadamente com um meio compreendendo um ou mais dentre ácido octanoico em uma concentração de cerca de 63,75 µmol/kg, ácido palmítico em uma concentração de cerca de 7,27 µmol/kg, ácido linoleico em uma concentração de cerca de 7,57 µmol/kg, ácido oleico em uma concentração de 7,56 µmol/kg e um es- terol em uma concentração de 2,61 µmol/kg.
[00213] Em certas modalidades dos métodos de produzir uma cé- lula T modificada (por exemplo, uma célula T tipo célula-tronco, uma TSCM e/ou uma TCM) da presente invenção, o método compreende con- tactar uma célula T modificada e um inibidor da via P13K-Akt-mTOR. Células T modificadas da presente invenção, incluindo células T tipo célula-tronco modificadas, TSCM e/ou TCM da presente invenção, podem ser incubadas, cultivadas, desenvolvidas, armazenadas, ou de outro modo, combinadas em qualquer etapa nos métodos do procedimento com um meio de desenvolvimento compreendendo um ou mais inibi- dores um componente de uma via PI3K. Os inibidores exemplares um componente de uma via PI3K incluem, mas não estão limitados a, um inibidor de GSK3β, tal como, TWS119 (também conhecido como inhi- bitor GSK 3B XII; número CAS 601514-19-6 tendo uma fórmula quími- ca C18H14N4O2). Inibidores exemplares de um componente de uma via PI3K incluem, mas não estão limitados a, bb007 (BLUEBIRDBIO™). Inibidores exemplares adicionais de um componente de uma via PI3K incluem, mas não estão limitados a, um inibidor Akt alostérico VIII (também referido como Akti-1/2 tendo número de composto 10196499), inibidores competitivos de ATP (Inibidores ortostérico alve- jando o bolso de ligação de ATP da proteína cinase B (Akt)), Isoquino- lina-5-sulfonamidas (H-8, H-89, e NL-71-101), derivados de azepano (Um série de estruturas derivadas de (−)-balanol), aminofurazanos (GSK690693), aneis heterocíclicos (7-azaindol, derivados de 6- fenilpurina, derivados de pirrolo[2,3-d]pirimidina, CCT128930, 3-
aminopirrolidina, derivados de anilinotriazol, derivados de espiroindoli- na, AZD5363, ipatasertib (GDC-0068, RG7440), A-674563, e A- 443654), derivados de fenilpirazol (AT7867 e AT13148), derivados de tiofenocarboxamida (Afuresertib (GSK2110183), derivado de 2- pirimidil-5-amidotiofeno (DC120), uprosertib (GSK2141795)), inibidores alostéricos (Superiores aos inibidores ortostérico fornecendo maior es- pecificidade, efeitos colaterais reduzidos e menos toxicidade), análo- gos de 2,3-difenilquinoxalina (derivados de 2,3-difenilquinoxalina, deri- vado de triazolo[3,4-f][1,6]naftiridin-3(2H)-ona (MK-2206)), Alquilfosfo- lipídeos (Edelfosina (1-O-octadecil-2-O-metil-rac-glicero-3-fosfocolina, ET-18-OCH3) ilmofosina (BM 41,440), miltefosina (hexadecilfosfocoli- na, HePC), perifosina (D-21266), erucilfosfocolina (ErPC), erufosina (ErPC3, erucilfosfo-homocolina), análogos de Indol-3-carbinol (Indol-3- carbinol, 3-cloroacetilindol, di-indolilmetano, dietil 6-metóxi-5,7-di- hidroindolo [2,3-b]carbazol-2,10-dicarboxilato (SR13668), OSU-A9), derivados de Sulfonamida (PH-316 e PHT-427), derivados de tioureia (PIT-1, PIT-2, DM-PIT-1, N-[(1-metil-1H-pirazol-4-il)carbonil]-N′-(3- bromofenil)-tioureia), derivados de purina (Triciribina (TCN, NSC 154020), análogo ativo de mono-fosfato de triciribina (TCN-P), deriva- do de 4-amino-pirido[2,3-d]pirimidina API-1, derivados de 3-fenil-3H- imidazo[4,5-b]piridina, ARQ 092), BAY 1125976, 3-metil-xantina, qui- nolina-4-carboxamida e 2-[4-(ciclo-hexa-1,3-dien-1-il)-1H-pirazol-3- il]fenol, ácido 3-oxo-tirucálico, ácidos 3α- e 3β-acetóxi-tirucálicos, ácido acetóxi-tirucálico, e inibidores irreversíveis (antibióticos, Lactoquinomi- cina, Frenolicina B, kalafungina, medermicina, Boc-Phe-vinil cetona, 4- hidroxinonenal (4-HNE), derivados de 1,6-naftiridinona, e derivados de imidazo-1,2-piridina).
[00214] Em certas modalidades dos métodos de produzir uma cé- lula T modificada (por exemplo, uma célula T tipo célula-tronco, uma TSCM e/ou uma TCM) da presente invenção, o método compreende con-
tactar uma célula T modificada e um inibidor de diferenciação efetora de célula T. Inibidores exemplares de diferenciação efetora de célula T incluem, mas não estão limitados a, um inibidor BET (por exemplo, JQ1, um hienotriazolodiazepina) e/ou um inibidor da família BET de proteínas (por exemplo, BRD2, BRD3, BRD4, e BRDT).
[00215] Em certas modalidades dos métodos de produzir uma cé- lula T modificada (por exemplo, uma célula T tipo célula-tronco, uma TSCM e/ou uma TCM) da presente invenção, o método compreende con- tactar uma célula T modificada e um agente que reduz Acetil-CoA nú- cleo-citoplásmico. Agentes exemplares que reduzem Acetil-CoA nú- cleo-citoplásmico incluem, mas não estão limitados a, 2-hidróxi-citrato (2-HC), bem como, agentes que aumentam expressão de Acss1.
[00216] Em certas modalidades dos métodos de produzir uma cé- lula T modificada (por exemplo, uma célula T tipo célula-tronco, uma TSCM e/ou a TCM) da presente invenção, o método compreende con- tactar uma célula T modificada e uma composição compreendendo um inibidor de histona deacetilase (HDAC). Em algumas modalidades, a composição compreendendo um inibidor de HDAC compreende ou consiste em ácido valproico, fenilbutirato de sódio (NaPB) ou uma combinação dos mesmos. Em algumas modalidades, a composição compreendendo um inibidor de HDAC compreende ou consiste em ácido valproico. Em algumas modalidades, a composição compreen- dendo um inibidor de HDAC compreende ou consiste em fenilbutirato de sódio (NaPB).
[00217] Em certas modalidades dos métodos de produzir uma cé- lula T modificada (por exemplo, uma célula T tipo célula-tronco, uma TSCM e/ou uma TCM) da presente invenção, o suplemento de ativação pode compreender uma ou mais citocina(s). Uma ou mais citocina(s) pode(m) compreender qualquer citocina, incluindo porém, não limitada a, linfocinas. Exemplares limpocinas incluem, mas não estão limitadas a, interleucina-2 (IL-2), interleucina-3 (IL-3), interleucina-4 (IL-4), inter- leucina-5 (IL-5), interleucina-6 (IL-6), interleucina-7 (IL-7), interleucina- 15 (IL-15), interleucina-21 (IL-21), fator estimulante de colônia de ma- crófago-granulócito (GM-CSF) e interferon-gama (INFγ). Uma ou mais citocina(s) pode(m) compreender IL-2.
[00218] Em certas modalidades dos métodos de produzir uma cé- lula T modificada (por exemplo, uma célula T tipo célula-tronco, uma TSCM e/ou uma TCM) da presente invenção, o suplemento de ativação pode compreender um ou mais complexos ativadores. Complexos ati- vadores exemplares e não limitantes podem compreender um comple- xo de anticorpo monomérico, dimérico, trimérico ou tetramérico que se liga a um ou mais dentre CD3, CD28, e CD2. Em algumas modalida- des, o suplemento de ativação compreende ou consiste em um com- plexo ativador que compreende um anticorpo humano, humanizado ou recombinante ou quimérico. Em algumas modalidades, o suplemento de ativação compreende ou consiste em um complexo ativador que se liga a CD3 e CD28. Em algumas modalidades, o suplemento de ativa- ção compreende ou consiste em um complexo ativador que se liga a CD3, CD28 e CD2, Células Exterminadoras Naturais (NK)
[00219] Em certas modalidades, as células imunes ou precursoras imunes modificadas da presente invenção são células exterminadoras naturais (NK). Em certas modalidades, as células NK são linfócitos ci- totóxicos que se diferenciam das células progenitoras linfoides.
[00220] Células NK modificadas da presente invenção podem ser derivadas de células-tronco hematopoiéticas modificadas e progenito- ras (HSPCs) ou HSCs modificadas.
[00221] Em certas modalidades, as células NK não ativadas são derivadas de leucoforese depletada em CD3 (contendo células CD14 / CD19 / CD56+).
[00222] Em certas modalidades, as células NK são eletroporadas usando um núcleofetor Lonza 4D ou BTX ECM 830 (500 V, compri- mento de pulso de 700 usec, lacuna de eletrodo de 0,2 mm, um pulso). Todos os programas de núcleofetores Lonza 4D estão contemplados dentro do escopo dos métodos da presente invenção.
[00223] Em certas modalidades, as células 5x10E6 foram eletropo- radas por eletroporação em tampão P3 de 100 µL em cuvetes. No en- tanto, essa relação de células por volume é escalonável para métodos de fabricação comerciais.
[00224] Em certas modalidades, as células NK foram estimuladas por cocultura com uma linhagem celular adicional. Em certas modali- dades, a linhagem celular adicional compreende células apresentado- ras de antígeno artificial (aAPCs). Em certas modalidades, a estimula- ção ocorre nos dias 1, 2, 3, 4, 5, 6, ou 7 após a eletroporação. Em cer- tas modalidades, a estimulação ocorre no segundo dia após a eletro- poração.
[00225] Em certas modalidades, as células NK expressam CD56. Células B
[00226] Em certas modalidades, as células imunes ou precursoras imunes modificadas da presente invenção são células B. As células B são um tipo de linfócito que expressa receptores de células B na su- perfície de uma célula. Os receptores de células B se ligam a antíge- nos específicos.
[00227] Células B modificadas da presente invenção podem ser de- rivadas de células-tronco hematopoiéticas modificadas e progenitoras (HSPCs) ou HSCs modificadas.
[00228] Em certas modalidades, as HSPCs são modificadas usando os métodos da presente invenção, e então iniciadas para a diferencia- ção de células B na presença de IL-3, Flt3L, TPO, SCF, e G-CSF hu- mana durante pelo menos 3 dias, pelo menos 4 dias, pelo menos 5 dias, pelo menos 6 dias ou pelo menos 7 dias. Em certas modalidades, as HSPCs são modificadas usando os métodos da presente invenção e, em seguida, iniciadas para a diferenciação de células B na presença de IL-3, Flt3L, TPO, SCF, e G-CSF humana durante 5 dias.
[00229] Em certas modalidades, após a iniciação, as células HSPC modificadas são transferidas para uma camada de células alimentado- ras e alimentadas duas vezes por semana, juntamente com a transfe- rência para uma nova camada de alimentadores uma vez por semana. Em certas modalidades, as células alimentadoras são células alimen- tadoras MS-5.
[00230] Em certas modalidades, as células HSPC modificadas são cultivadas com células alimentadoras MS-5 durante pelo menos 7, 14, 21, 28, 30, 33, 35, 42 ou 48 dias. Em certas modalidades, células HSPC modificadas foram cultivadas com células alimentadoras MS-5 durante 33 dias. Sistemas de Transposição
[00231] Exemplos de sistemas transposon / transposase da presen- te invenção incluem, porém, não estão limitados a, transposons e transposases piggyBac, transposon e transposases Sleeping Beauty, transposon e transposases Helraisers, Transposon e transposases Tol2s e transposon e transposases TcBusters.
[00232] A transposase piggyBac reconhece sequências de repeti- ção invertidas terminais específicas do transposon (ITRs) nas extremi- dades do transposon, e move o conteúdo entre as ITRs para os sítios cromossômicos TTAA. O sistema de transposon piggyBac não possui limite de carga útil para os genes de interesse que podem ser incluídos entre as ITRs. Em certas modalidades, e, em particular, aquelas mo- dalidades em que o transposon é um transposon piggyBac, a transpo- sase é uma transposase piggyBac™ ou um Super piggyBac™ (SPB). Em certas modalidades, e, em particular, aquelas modalidades em que a transposase é uma transposase Super piggyBac™ (SPB), a sequên- cia codifica a transposase é uma sequência de mRNA.
[00233] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac™ (PB). A enzima transposase piggyBac (PB) pode compreender ou consistir em uma sequência de aminoácido de pelo menos 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idêntica a: 1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEI SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG 61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG 121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTGATFRD TNEDEIYAFF 181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV 241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RMYIPNKPSK YGIKILMMCD 301 SGTKYMINGM PILGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ 361 EPIKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVILLSSC 421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN 481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRILRD NISNILPNEV 541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF(SEQ ID NO: 14487).
[00234] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac™ (PB) que compreende ou consiste em uma sequência de aminoácido tendo uma substituição de aminoácido em uma ou mais das posições 30, 165, 282, ou 538 da sequência: 1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEI SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG 61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG 121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTGATFRD TNEDEIYAFF 181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV 241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RMYIPNKPSK YGIKILMMCD 301 SGTKYMINGM PILGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ 361 EPIKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVILLSSC 421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN 481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRILRD NISNILPNEV 541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF (SEQ ID NO: 14487).
[00235] Em certas modalidades, a enzima transposase é uma en- zima transposase piggyBac™ (PB) que compreende ou consiste em uma sequência de aminoácido tendo uma substituição de aminoácido em duas ou mais das posições 30, 165, 282, ou 538 da sequência de SEQ ID NO: 14487. Em certas modalidades, a enzima transposase é uma enzima transposase piggyBac™ (PB) que compreende ou consis- te em uma sequência de aminoácido tendo uma substituição de ami- noácido em três ou mais das posições 30, 165, 282, ou 538 da se- quência de SEQ ID NO: 14487. Em certas modalidades, a enzima transposase é uma enzima transposase piggyBac™ (PB) que compre- ende ou consiste em uma sequência de aminoácido tendo uma substi- tuição de aminoácido em cada uma das seguintes posições 30, 165, 282, e 538 da sequência de SEQ ID NO: 14487. Em certas modalida- des, a substituição de aminoácido na posição 30 da sequência de SEQ ID NO: 14487 é uma substituição de uma valina (V) por uma isoleucina (I). Em certas modalidades, a substituição de aminoácido na posição 165 da sequência de SEQ ID NO: 14487 é uma substituição de uma serina (S) por uma glicina (G). Em certas modalidades, a substituição de aminoácido na posição 282 da sequência de SEQ ID NO: 14487 é uma substituição de uma valina (V) por uma metionina (M). Em certas modalidades, a substituição de aminoácido na posição 538 da se- quência de SEQ ID NO: 14487 é uma substituição de uma lisina (K) por uma asparagina (N).
[00236] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase Super piggyBac™ (SPB). Em certas modalidades, as enzimas transposases Super piggyBac™ (SPB) da presente invenção podem compreender ou con- sistir em uma sequência de aminoácido da sequência de SEQ ID NO: 14487 em que a substituição de aminoácido na posição 30 é uma substituição de uma valina (V) por uma isoleucina (I), a substituição de aminoácido na posição 165 é uma substituição de uma serina (S) por uma glicina (G), a substituição de aminoácido na posição 282 é uma substituição de uma valina (V) por uma metionina (M), e uma substitui-
ção de aminoácido na posição 538 é uma substituição de uma lisina (K) por uma asparagina (N). Em certas modalidades, a enzima trans- posase Super piggyBac™ (SPB) pode compreender ou consistir em uma sequência de aminoácido pelo menos 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idêntica a: 1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEV SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG 61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG 121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTSATFRD TNEDEIYAFF 181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV 241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RVYIPNKPSK YGIKILMMCD 301 SGTKYMINGM PILGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ 361 EPIKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVILLSSC 421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN 481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRILRD NISNILPKEV 541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF (SEQ ID NO: 14484).
[00237] Em certas modalidades dos métodos da presente invenção, incluindo aquelas modalidades em que a transposase compreende as mutações descritas acima nas posições 30, 165, 282 e/ou 538, a en- zima transposase piggyBac™ ou Super piggyBac™ pode também compreender uma substituição de aminoácido em uma ou mais das posições 3, 46, 82, 103, 119, 125, 177, 180, 185, 187, 200, 207, 209, 226, 235, 240, 241, 243, 258, 296, 298, 311, 315, 319, 327, 328, 340, 421, 436, 456, 470, 486, 503, 552, 570 e 591 da sequência de SEQ ID NO: 14487 ou SEQ ID NO: 14484. Em certas modalidades, incluindo aquelas modalidades em que a transposase compreende as mutações descritas acima nas posições 30, 165, 282 e/ou 538, a enzima trans- posase piggyBac™ ou Super piggyBac™ pode também compreender uma substituição de aminoácido em uma ou mais das posições 46, 119, 125, 177, 180, 185, 187, 200, 207, 209, 226, 235, 240, 241, 243, 296, 298, 311, 315, 319, 327, 328, 340, 421, 436, 456, 470, 485, 503, 552 e 570. Em certas modalidades, a substituição de aminoácido na posição 3 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substi- tuição de uma asparagina (N) por uma serina (S). Em certas modali-
dades, a substituição de aminoácido na posição 46 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma serina (S) por uma alanina (A). Em certas modalidades, a substituição de aminoácido na posição 46 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma treonina (T) por uma alanina (A). Em certas moda- lidades, a substituição de aminoácido na posição 82 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de um triptofano (W) por uma isoleucina (I). Em certas modalidades, a substituição de ami- noácido na posição 103 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma prolina (P) por uma serina (S). Em certas modalidades, a substituição de aminoácido na posição 119 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma prolina (P) por uma arginina (R). Em certas modalidades, a substituição de aminoácido na posição 125 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma alanina (A) por uma cisteína (C). Em certas modalidades, a substituição de aminoácido na posição 125 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma leucina (L) por uma cisteína (C). Em certas modalidades, a substitui- ção de aminoácido na posição 177 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma lisina (K) por uma tirosina (Y). Em certas modalidades, a substituição de aminoácido na posição 177 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma histidina (H) por uma tirosina (Y). Em certas modalidades, a subs- tituição de aminoácido na posição 180 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma leucina (L) por uma fenilala- nina (F). Em certas modalidades, a substituição de aminoácido na po- sição 180 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substi- tuição de uma isoleucina (I) por uma fenilalanina (F). Em certas moda- lidades, a substituição de aminoácido na posição 180 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma valina (V) por uma fenilalanina (F). Em certas modalidades, a substituição de amino- ácido na posição 185 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma leucina (L) por uma metionina (M). Em certas modalidades, a substituição de aminoácido na posição 187 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma glicina (G) por uma alanina (A). Em certas modalidades, a substituição de aminoácido na posição 200 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de um triptofano (W) por uma fenilalanina (F). Em certas modalidades, a substituição de aminoácido na posição 207 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma prolina (P) por uma valina (V). Em certas modalidades, a subs- tituição de aminoácido na posição 209 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma fenilalanina (F) por uma vali- na (V). Em certas modalidades, a substituição de aminoácido na posi- ção 226 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substitui- ção de uma fenilalanina (F) por uma metionina (M). Em certas modali- dades, a substituição de aminoácido na posição 235 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma arginina (R) por uma leucina (L). Em certas modalidades, a substituição de amino- ácido na posição 240 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma lisina (K) por uma valina (V). Em certas mo- dalidades, a substituição de aminoácido na posição 241 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma leucina (L) por uma fenilalanina (F). Em certas modalidades, a substituição de aminoácido na posição 243 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma lisina (K) por uma prolina (P). Em certas modalidades, a substituição de aminoácido na posição 258 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma serina (S) por uma asparagina (N). Em certas modalidades, a substi- tuição de aminoácido na posição 296 de SEQ ID NO: 14487 ou SEQ
ID NO: 14484 é uma substituição de um triptofano (W) por uma leucina (L). Em certas modalidades, a substituição de aminoácido na posição 296 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma tirosina (Y) por uma leucina (L). Em certas modalidades, a substituição de aminoácido na posição 296 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma fenilalanina (F) por uma leucina (L). Em certas modalidades, a substituição de aminoácido na posição 298 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma subs- tituição de uma leucina (L) por uma metionina (M). Em certas modali- dades, a substituição de aminoácido na posição 298 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma alanina (A) por uma metionina (M). Em certas modalidades, a substituição de ami- noácido na posição 298 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma valina (V) por uma metionina (M). Em cer- tas modalidades, a substituição de aminoácido na posição 311 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma iso- leucina (I) por uma prolina (P). Em certas modalidades, a substituição de aminoácido na posição 311 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma valina por uma prolina (P). Em cer- tas modalidades, a substituição de aminoácido na posição 315 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma lisina (K) por uma arginina (R). Em certas modalidades, a substituição de aminoácido na posição 319 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma glicina (G) por uma treonina (T). Em certas modalidades, a substituição de aminoácido na posição 327 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma arginina (R) por uma tirosina (Y). Em certas modalidades, a substitui- ção de aminoácido na posição 328 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma valina (V) por uma tirosina (Y). Em certas modalidades, a substituição de aminoácido na posição 340 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma glicina (G) por uma cisteína (C). Em certas modalidades, a substi- tuição de aminoácido na posição 340 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma leucina (L) por uma cisteína (C). Em certas modalidades, a substituição de aminoácido na posição 421 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma histidina (H) pelo ácido aspártico (D). Em certas modalidades, a substituição de aminoácido na posição 436 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma isoleucina (I) por uma valina (V). Em certas modalidades, a substituição de aminoácido na posição 456 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma subs- tituição de uma tirosina (Y) por uma metionina (M). Em certas modali- dades, a substituição de aminoácido na posição 470 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma fenilalanina (F) por uma leucina (L). Em certas modalidades, a substituição de aminoácido na posição 485 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma lisina (K) por uma serina (S). Em certas modalidades, a substituição de aminoácido na posição 503 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma leucina (L) por uma metionina (M). Em certas modalidades, a substitui- ção de aminoácido na posição 503 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma isoleucina (I) por uma metionina (M). Em certas modalidades, a substituição de aminoácido na posição 552 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma lisina (K) por uma valina (V). Em certas modalidades, a substi- tuição de aminoácido na posição 570 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma treonina (T) por uma alanina (A). Em certas modalidades, a substituição de aminoácido na posição 591 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma prolina (P) por uma glutamina (Q). Em certas modalidades, a substituição de aminoácido na posição 591 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma arginina (R) por uma glutamina (Q).
[00238] Em certas modalidades dos métodos da presente invenção, incluindo aquelas modalidades em que a transposase compreende as mutações descritas acima nas posições 30, 165, 282 e/ou 538, a en- zima transposase piggyBac™ pode compreender ou a enzima trans- posase Super piggyBac™ pode também compreender uma substitui- ção de aminoácido em uma ou mais das posições 103, 194, 372, 375, 450, 509 e 570 da sequência de SEQ ID NO: 14487 ou SEQ ID NO:
14484. Em certas modalidades dos métodos da presente invenção, incluindo aquelas modalidades em que a transposase compreende as mutações descritas acima nas posições 30, 165, 282 e/ou 538, a en- zima transposase piggyBac™ pode compreender ou a enzima trans- posase Super piggyBac™ pode também compreender uma substitui- ção de aminoácido em duas, três, quatro, cinco, seis ou mais das po- sições 103, 194, 372, 375, 450, 509 e 570 da sequência de SEQ ID NO: 14487 ou SEQ ID NO: 14484. Em certas modalidades, incluindo aquelas modalidades em que a transposase compreende as mutações descritas acima nas posições 30, 165, 282 e/ou 538, a enzima trans- posase piggyBac™ pode compreender ou a enzima transposase Su- per piggyBac™ pode também compreender uma substituição de ami- noácido nas posições 103, 194, 372, 375, 450, 509 e 570 da sequên- cia de SEQ ID NO: 14487 ou SEQ ID NO: 14484. Em certas modalida- des, a substituição de aminoácido na posição 103 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma prolina (P) por uma serina (S). Em certas modalidades, a substituição de aminoá- cido na posição 194 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma valina (V) por uma metionina (M). Em certas modalidades, a substituição de aminoácido na posição 372 de SEQ ID
NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma alanina (A) por uma arginina (R). Em certas modalidades, a substituição de aminoácido na posição 375 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma alanina (A) por uma lisina (K). Em certas modalidades, a substituição de aminoácido na posição 450 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma asparagina (N) por um ácido aspártico (D). Em certas modalidades, a substituição de aminoácido na posição 509 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma glicina (G) por uma se- rina (S). Em certas modalidades, a substituição de aminoácido na po- sição 570 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substi- tuição de uma serina (S) por uma asparagina (N). Em certas modali- dades, a enzima transposase piggyBac™ pode compreender uma substituição de uma valina (V) por uma metionina (M) na posição 194 de SEQ ID NO: 14487. Em certas modalidades, incluindo aquelas mo- dalidades em que a enzima transposase piggyBac™ pode compreen- der uma substituição de uma valina (V) por uma metionina (M) na po- sição 194 de SEQ ID NO: 14487, a enzima transposase piggyBac™ pode também compreender uma substituição de aminoácido nas posi- ções 372, 375 e 450 da sequência de SEQ ID NO: 14487 ou SEQ ID NO: 14484. Em certas modalidades, a enzima transposase piggyBac™ pode compreender uma substituição de uma valina (V) por uma metio- nina (M) na posição 194 de SEQ ID NO: 14487, uma substituição de uma alanina (A) por uma arginina (R) na posição 372 de SEQ ID NO: 14487, e uma substituição de uma alanina (A) por uma lisina (K) na posição 375 de SEQ ID NO: 14487. Em certas modalidades, a enzima transposase piggyBac™ pode compreender uma substituição de uma valina (V) por uma metionina (M) na posição 194 de SEQ ID NO: 14487, uma substituição de uma alanina (A) por uma arginina (R) na posição 372 de SEQ ID NO: 14487, uma substituição de uma alanina
(A) por uma lisina (K) na posição 375 de SEQ ID NO: 14487 e uma substituição de uma asparagina (N) por um ácido aspártico (D) na po- sição 450 de SEQ ID NO: 14487,
[00239] A transposão da Sleeping Beauty é transposta no genoma alvo pela transposase da Sleeping Beauty que reconhece ITRs, e mo- ve os conteúdos entre as ITRs em sítios cromossômicos TA. Em vá- rias modalidades, transferência de gene mediada por transposon SB ou transferência de gene usando qualuqer de um número de similares transposons pode ser usada nas composições e métodos da presente invenção.
[00240] Em certas modalidades, e, em particular, aquelas modali- dades em que o transposon é um transposon Sleeping Beauty, a transposase é uma transposase Sleeping Beauty ou uma transposase Sleeping Beauty hiperativa (SB100X).
[00241] Em certas modalidades dos métodos da presente invenção, a enzima transposase Sleeping Beauty compreende uma sequência de aminoácido de pelo menos 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idênticas a: 1 MGKSKEISQD LRKKIVDLHK SGSSLGAISK RLKVPRSSVQ TIVRKYKHHG TTQPSYRSGR 61 RRVLSPRDER TLVRKVQINP RTTAKDLVKM LEETGTKVSI STVKRVLYRH NLKGRSARKK 121 PLLQNRHKKA RLRFATAHGD KDRTFWRNVL WSDETKIELF GHNDHRYVWR KKGEACKPKN 181 TIPTVKHGGG SIMLWGCFAA GGTGALHKID GIMRKENYVD ILKQHLKTSV RKLKLGRKWV 241 FQMDNDPKHT SKVVAKWLKD NKVKVLEWPS QSPDLNPIEN LWAELKKRVR ARRPTNLTQL 301 HQLCQEEWAK IHPTYCGKLV EGYPKRLTQV KQFKGNATKY (SEQ ID NO: 14485).
[00242] Em certas modalidades dos métodos da presente invenção, a enzima transposase Sleeping Beauty hiperativa (SB100X) compre- ende uma sequência de aminoácido de pelo menos 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idênticas a: 1 MGKSKEISQD LRKRIVDLHK SGSSLGAISK RLAVPRSSVQ TIVRKYKHHG TTQPSYRSGR 61 RRVLSPRDER TLVRKVQINP RTTAKDLVKM LEETGTKVSI STVKRVLYRH NLKGHSARKK 121 PLLQNRHKKA RLRFATAHGD KDRTFWRNVL WSDETKIELF GHNDHRYVWR KKGEACKPKN 181 TIPTVKHGGG SIMLWGCFAA GGTGALHKID GIMDAVQYVD ILKQHLKTSV RKLKLGRKWV 241 FQHDNDPKHT SKVVAKWLKD NKVKVLEWPS QSPDLNPIEN LWAELKKRVR ARRPTNLTQL 301 HQLCQEEWAK IHPNYCGKLV EGYPKRLTQV KQFKGNATKY (SEQ ID NO: 14486).
[00243] O transposon Helraiser é transposto pela transposase Heli- tron.
As transposases Helitron mobilizam o transposon Helraiser, um elemento antigo do genoma de morcego que foi ativo cerca de 30 a 36 milhões de anos atrás.
Um transposon Helraiser exemplar da presente invenção inclui Helibat1, que compreende uma sequência de ácido nu- cleico compreendendo: 1 TCCTATATAA TAAAAGAGAA ACATGCAAAT TGACCATCCC TCCGCTACGC TCAAGCCACG 61 CCCACCAGCC AATCAGAAGT GACTATGCAA ATTAACCCAA CAAAGATGGC AGTTAAATTT 121 GCATACGCAG GTGTCAAGCG CCCCAGGAGG CAACGGCGGC CGCGGGCTCC CAGGACCTTC 181 GCTGGCCCCG GGAGGCGAGG CCGGCCGCGC CTAGCCACAC CCGCGGGCTC CCGGGACCTT 241 CGCCAGCAGA GAGCAGAGCG GGAGAGCGGG CGGAGAGCGG GAGGTTTGGA GGACTTGGCA 301 GAGCAGGAGG CCGCTGGACA TAGAGCAGAG CGAGAGAGAG GGTGGCTTGG AGGGCGTGGC 361 TCCCTCTGTC ACCCCAGCTT CCTCATCACA GCTGTGGAAA CTGACAGCAG GGAGGAGGAA 421 GTCCCACCCC CACAGAATCA GCCAGAATCA GCCGTTGGTC AGACAGCTCT CAGCGGCCTG 481 ACAGCCAGGA CTCTCATTCA CCTGCATCTC AGACCGTGAC AGTAGAGAGG TGGGACTATG 541 TCTAAAGAAC AACTGTTGAT ACAACGTAGC TCTGCAGCCG AAAGATGCCG GCGTTATCGA 601 CAGAAAATGT CTGCAGAGCA ACGTGCGTCT GATCTTGAAA GAAGGCGGCG CCTGCAACAG 661 AATGTATCTG AAGAGCAGCT ACTGGAAAAA CGTCGCTCTG AAGCCGAAAA ACAGCGGCGT 721 CATCGACAGA AAATGTCTAA AGACCAACGT GCCTTTGAAG TTGAAAGAAG GCGGTGGCGA 781 CGACAGAATA TGTCTAGAGA ACAGTCATCA ACAAGTACTA CCAATACCGG TAGGAACTGC 841 CTTCTCAGCA AAAATGGAGT ACATGAGGAT GCAATTCTCG AACATAGTTG TGGTGGAATG 901 ACTGTTCGAT GTGAATTTTG CCTATCACTA AATTTCTCTG ATGAAAAACC ATCCGATGGG 961 AAATTTACTC GATGTTGTAG CAAAGGGAAA GTCTGTCCAA ATGATATACA TTTTCCAGAT 1021 TACCCGGCAT ATTTAAAAAG ATTAATGACA AACGAAGATT CTGACAGTAA AAATTTCATG 1081 GAAAATATTC GTTCCATAAA TAGTTCTTTT GCTTTTGCTT CCATGGGTGC AAATATTGCA 1141 TCGCCATCAG GATATGGGCC ATACTGTTTT AGAATACACG GACAAGTTTA TCACCGTACT 1201 GGAACTTTAC ATCCTTCGGA TGGTGTTTCT CGGAAGTTTG CTCAACTCTA TATTTTGGAT 1261 ACAGCCGAAG CTACAAGTAA AAGATTAGCA ATGCCAGAAA ACCAGGGCTG CTCAGAAAGA 1321 CTCATGATCA ACATCAACAA CCTCATGCAT GAAATAAATG AATTAACAAA ATCGTACAAG 1381 ATGCTACATG AGGTAGAAAA GGAAGCCCAA TCTGAAGCAG CAGCAAAAGG TATTGCTCCC 1441 ACAGAAGTAA CAATGGCGAT TAAATACGAT CGTAACAGTG ACCCAGGTAG ATATAATTCT 1501 CCCCGTGTAA CCGAGGTTGC TGTCATATTC AGAAACGAAG ATGGAGAACC TCCTTTTGAA 1561 AGGGACTTGC TCATTCATTG TAAACCAGAT CCCAATAATC CAAATGCCAC TAAAATGAAA 1621 CAAATCAGTA TCCTGTTTCC TACATTAGAT GCAATGACAT ATCCTATTCT TTTTCCACAT 1681 GGTGAAAAAG GCTGGGGAAC AGATATTGCA TTAAGACTCA GAGACAACAG TGTAATCGAC 1741 AATAATACTA GACAAAATGT AAGGACACGA GTCACACAAA TGCAGTATTA TGGATTTCAT 1801 CTCTCTGTGC GGGACACGTT CAATCCTATT TTAAATGCAG GAAAATTAAC TCAACAGTTT 1861 ATTGTGGATT CATATTCAAA AATGGAGGCC AATCGGATAA ATTTCATCAA AGCAAACCAA 1921 TCTAAGTTGA GAGTTGAAAA ATATAGTGGT TTGATGGATT ATCTCAAATC TAGATCTGAA 1981 AATGACAATG TGCCGATTGG TAAAATGATA ATACTTCCAT CATCTTTTGA GGGTAGTCCC
2041 AGAAATATGC AGCAGCGATA TCAGGATGCT ATGGCAATTG TAACGAAGTA TGGCAAGCCC 2101 GATTTATTCA TAACCATGAC ATGCAACCCC AAATGGGCAG ATATTACAAA CAATTTACAA 2161 CGCTGGCAAA AAGTTGAAAA CAGACCTGAC TTGGTAGCCA GAGTTTTTAA TATTAAGCTG 2221 AATGCTCTTT TAAATGATAT ATGTAAATTC CATTTATTTG GCAAAGTAAT AGCTAAAATT 2281 CATGTCATTG AATTTCAGAA ACGCGGACTG CCTCACGCTC ACATATTATT GATATTAGAT 2341 AGTGAGTCCA AATTACGTTC AGAAGATGAC ATTGACCGTA TAGTTAAGGC AGAAATTCCA 2401 GATGAAGACC AGTGTCCTCG ACTTTTTCAA ATTGTAAAAT CAAATATGGT ACATGGACCA 2461 TGTGGAATAC AAAATCCAAA TAGTCCATGT ATGGAAAATG GAAAATGTTC AAAGGGATAT 2521 CCAAAAGAAT TTCAAAATGC GACCATTGGA AATATTGATG GATATCCCAA ATACAAACGA 2581 AGATCTGGTA GCACCATGTC TATTGGAAAT AAAGTTGTCG ATAACACTTG GATTGTCCCT 2641 TATAACCCGT ATTTGTGCCT TAAATATAAC TGTCATATAA ATGTTGAAGT CTGTGCATCA 2701 ATTAAAAGTG TCAAATATTT ATTTAAATAC ATCTATAAAG GGCACGATTG TGCAAATATT 2761 CAAATTTCTG AAAAAAATAT TATCAATCAT GACGAAGTAC AGGACTTCAT TGACTCCAGG 2821 TATGTGAGCG CTCCTGAGGC TGTTTGGAGA CTTTTTGCAA TGCGAATGCA TGACCAATCT 2881 CATGCAATCA CAAGATTAGC TATTCATTTG CCAAATGATC AGAATTTGTA TTTTCATACC 2941 GATGATTTTG CTGAAGTTTT AGATAGGGCT AAAAGGCATA ACTCGACTTT GATGGCTTGG 3001 TTCTTATTGA ATAGAGAAGA TTCTGATGCA CGTAATTATT ATTATTGGGA GATTCCACAG 3061 CATTATGTGT TTAATAATTC TTTGTGGACA AAACGCCGAA AGGGTGGGAA TAAAGTATTA 3121 GGTAGACTGT TCACTGTGAG CTTTAGAGAA CCAGAACGAT ATTACCTTAG ACTTTTGCTT 3181 CTGCATGTAA AAGGTGCGAT AAGTTTTGAG GATCTGCGAA CTGTAGGAGG TGTAACTTAT 3241 GATACATTTC ATGAAGCTGC TAAACACCGA GGATTATTAC TTGATGACAC TATCTGGAAA 3301 GATACGATTG ACGATGCAAT CATCCTTAAT ATGCCCAAAC AACTACGGCA ACTTTTTGCA 3361 TATATATGTG TGTTTGGATG TCCTTCTGCT GCAGACAAAT TATGGGATGA GAATAAATCT 3421 CATTTTATTG AAGATTTCTG TTGGAAATTA CACCGAAGAG AAGGTGCCTG TGTGAACTGT 3481 GAAATGCATG CCCTTAACGA AATTCAGGAG GTATTCACAT TGCATGGAAT GAAATGTTCA 3541 CATTTCAAAC TTCCGGACTA TCCTTTATTA ATGAATGCAA ATACATGTGA TCAATTGTAC 3601 GAGCAACAAC AGGCAGAGGT TTTGATAAAT TCTCTGAATG ATGAACAGTT GGCAGCCTTT 3661 CAGACTATAA CTTCAGCCAT CGAAGATCAA ACTGTACACC CCAAATGCTT TTTCTTGGAT 3721 GGTCCAGGTG GTAGTGGAAA AACATATCTG TATAAAGTTT TAACACATTA TATTAGAGGT 3781 CGTGGTGGTA CTGTTTTACC CACAGCATCT ACAGGAATTG CTGCAAATTT ACTTCTTGGT 3841 GGAAGAACCT TTCATTCCCA ATATAAATTA CCAATTCCAT TAAATGAAAC TTCAATTTCT 3901 AGACTCGATA TAAAGAGTGA AGTTGCTAAA ACCATTAAAA AGGCCCAACT TCTCATTATT 3961 GATGAATGCA CCATGGCATC CAGTCATGCT ATAAACGCCA TAGATAGATT ACTAAGAGAA 4021 ATTATGAATT TGAATGTTGC ATTTGGTGGG AAAGTTCTCC TTCTCGGAGG GGATTTTCGA 4081 CAATGTCTCA GTATTGTACC ACATGCTATG CGATCGGCCA TAGTACAAAC GAGTTTAAAG 4141 TACTGTAATG TTTGGGGATG TTTCAGAAAG TTGTCTCTTA AAACAAATAT GAGATCAGAG 4201 GATTCTGCTT ATAGTGAATG GTTAGTAAAA CTTGGAGATG GCAAACTTGA TAGCAGTTTT 4261 CATTTAGGAA TGGATATTAT TGAAATCCCC CATGAAATGA TTTGTAACGG ATCTATTATT 4321 GAAGCTACCT TTGGAAATAG TATATCTATA GATAATATTA AAAATATATC TAAACGTGCA 4381 ATTCTTTGTC CAAAAAATGA GCATGTTCAA AAATTAAATG AAGAAATTTT GGATATACTT 4441 GATGGAGATT TTCACACATA TTTGAGTGAT GATTCCATTG ATTCAACAGA TGATGCTGAA 4501 AAGGAAAATT TTCCCATCGA ATTTCTTAAT AGTATTACTC CTTCGGGAAT GCCGTGTCAT
4561 AAATTAAAAT TGAAAGTGGG TGCAATCATC ATGCTATTGA GAAATCTTAA TAGTAAATGG 4621 GGTCTTTGTA ATGGTACTAG ATTTATTATC AAAAGATTAC GACCTAACAT TATCGAAGCT 4681 GAAGTATTAA CAGGATCTGC AGAGGGAGAG GTTGTTCTGA TTCCAAGAAT TGATTTGTCC 4741 CCATCTGACA CTGGCCTCCC ATTTAAATTA ATTCGAAGAC AGTTTCCCGT GATGCCAGCA 4801 TTTGCGATGA CTATTAATAA ATCACAAGGA CAAACTCTAG ACAGAGTAGG AATATTCCTA 4861 CCTGAACCCG TTTTCGCACA TGGTCAGTTA TATGTTGCTT TCTCTCGAGT TCGAAGAGCA 4921 TGTGACGTTA AAGTTAAAGT TGTAAATACT TCATCACAAG GGAAATTAGT CAAGCACTCT 4981 GAAAGTGTTT TTACTCTTAA TGTGGTATAC AGGGAGATAT TAGAATAAGT TTAATCACTT 5041 TATCAGTCAT TGTTTGCATC AATGTTGTTT TTATATCATG TTTTTGTTGT TTTTATATCA 5101 TGTCTTTGTT GTTGTTATAT CATGTTGTTA TTGTTTATTT ATTAATAAAT TTATGTATTA 5161 TTTTCATATA CATTTTACTC ATTTCCTTTC ATCTCTCACA CTTCTATTAT AGAGAAAGGG 5221 CAAATAGCAA TATTAAAATA TTTCCTCTAA TTAATTCCCT TTCAATGTGC ACGAATTTCG 5281 TGCACCGGGC CACTAG (SEQ ID NO: 18061).
[00244] Ao contrário de outras transposases, a transposase Helitron não contém um domínio catalítico tipo RNase-H, mas em vez disso compreende um motivo RepHel preparado de um domínio iniciador de replicação (Rep) e um domínio de DNA helicase. O domínio Rep é um domínio nuclease da superfamília HUH de nucleases.
[00245] Um transposase Helitron exemplar da presente invenção compreende uma sequência de aminoácido compreendendo: 1 MSKEQLLIQR SSAAERCRRY RQKMSAEQRA SDLERRRRLQ QNVSEEQLLE KRRSEAEKQR 61 RHRQKMSKDQ RAFEVERRRW RRQNMSREQS STSTTNTGRN CLLSKNGVHE DAILEHSCGG 121 MTVRCEFCLS LNFSDEKPSD GKFTRCCSKG KVCPNDIHFP DYPAILKRLM TNEDSDSKNF 181 MENIRSINSS FAFASMGANI ASPSGYGPIC FRIHGQVYHR TGTLHPSDGV SRKFAQLYIL 241 DTAEATSKRL AMPENQGCSE RLMININNLM HEINELTKSY KMLHEVEKEA QSEAAAKGIA 301 PTEVTMAIKY DRNSDPGRYN SPRVTEVAVI FRNEDGEPPF ERDLLIHCKP DPNNPNATKM 361 KQISILFPTL DAMTYPILFP HGEKGWGTDI ALRLRDNSVI DNNTRQNVRT RVTQMQYYGF 421 HLSVRDTFNP ILNAGKLTQQ FIVDSYSKME ANRINFIKAN QSKLRVEKYS GLMDILKSRS 481 ENDNVPIGKM IILPSSFEGS PRNMQQRYQD AMAIVTKYGK PDLFITMTCN PKWADITNNL 541 QRWQKVENRP DLVARVFNIK LNALLNDICK FHLFGKVIAK IHVIEFQKRG LPHAHILLIL 601 DSESKLRSED DIDRIVKAEI PDEDQCPRLF QIVKSNMVHG PCGIQNPNSP CMENGKCSKG 661 YPKEFQNATI GNIDGYPKYK RRSGSTMSIG NKVVDNTWIV PINPILCLKY NCHINVEVCA 721 SIKSVKILFK YIYKGHDCAN IQISEKNIIN HDEVQDFIDS RYVSAPEAVW RLFAMRMHDQ 781 SHAITRLAIH LPNDQNLYFH TDDFAEVLDR AKRHNSTLMA WFLLNREDSD ARNYYYWEIP 841 QHYVFNNSLW TKRRKGGNKV LGRLFTVSFR EPERYILRLL LLHVKGAISF EDLRTVGGVT 901 YDTFHEAAKH RGLLLDDTIW KDTIDDAIIL NMPKQLRQLF AYICVFGCPS AADKLWDENK 961 SHFIEDFCWK LHRREGACVN CEMHALNEIQ EVFTLHGMKC SHFKLPDYPL LMNANTCDQL 1021 YEQQQAEVLI NSLNDEQLAA FQTITSAIED QTVHPKCFFL DGPGGSGKTY LYKVLTHYIR 1081 GRGGTVLPTA STGIAANLLL GGRTFHSQYK LPIPLNETSI SRLDIKSEVA KTIKKAQLLI 1141 IDECTMASSH AINAIDRLLR EIMNLNVAFG GKVLLLGGDF RQCLSIVPHA MRSAIVQTSL
1201 KYCNVWGCFR KLSLKTNMRS EDSAYSEWLV KLGDGKLDSS FHLGMDIIEI PHEMICNGSI 1261 IEATFGNSIS IDNIKNISKR AILCPKNEHV QKLNEEILDI LDGDFHTILS DDSIDSTDDA 1321 EKENFPIEFL NSITPSGMPC HKLKLKVGAI IMLLRNLNSK WGLCNGTRFI IKRLRPNIIE 1381 AEVLTGSAEG EVVLIPRIDL SPSDTGLPFK LIRRQFPVMP AFAMTINKSQ GQTLDRVGIF 1441 LPEPVFAHGQ LYVAFSRVRR ACDVKVKVVN TSSQGKLVKH SESVFTLNVV YREILE (SEQ ID NO: 14501).
[00246] Em transposições Helitron, um grampo de cabelo perto da extremidade 3’ das funções de transposon como um terminador. Con- tudo, este grampo de cabelo this hairpin pode ser contornado por uma transposase, resultando na transdução de sequências de flanquea- mento. Em adição, transposição Helraiser gera intermediários circula- res covalentemente fechados. Além disso, transposições Helitron po- dem faltar duplicações de sítio alvo. Na sequência Helraiser, a trans- posase é flanqueada por sequências terminais 5’ e 3’ denominadas LTS e RTS. Estas sequências terminam com um motivo 5’-TC/CTAG- 3’ conservado. Uma sequência palindrômica 19 bp com o potencial para formar a estrutura de terminação de grampo de cabelo é localiza- da 11 nucleotídeos a montante do RTS e consistes na sequência GTGCACGAATTTCGTGCACCGGGCCACTAG (SEQ ID NO: 14500).
[00247] Transposon Tol2s pode ser isolado ou derivado do genoma do peixe medaka, e pode ser similar aos transposons da família hAT. Transposon Tol2s exemplares da presente invenção são codificados por uma sequência compreendendo cerca de 4,7 kilobases e contêm um gene codificando a Tol2 transposase, que contém quatro exons. Uma Tol2 transposase exemplar da presente invenção compreende uma sequência de aminoácido compreendendo os seguintes: 1 MEEVCDSSAA ASSTVQNQPQ DQEHPWPILR EFFSLSGVNK DSFKMKCVLC LPLNKEISAF 61 KSSPSNLRKH IERMHPNILK NYSKLTAQKR KIGTSTHASS SKQLKVDSVF PVKHVSPVTV 121 NKAILRYIIQ GLHPFSTVDL PSFKELISTL QPGISVITRP TLRSKIAEAA LIMKQKVTAA 181 MSEVEWIATT TDCWTARRKS FIGVTAHWIN PGSLERHSAA LACKRLMGSH TFEVLASAMN 241 DIHSEYEIRD KVVCTTTDSG SNFMKAFRVF GVENNDIETE ARRCESDDTD SEGCGEGSDG 301 VEFQDASRVL DQDDGFEFQL PKHQKCACHL LNLVSSVDAQ KALSNEHYKK LYRSVFGKCQ 361 ALWNKSSRSA LAAEAVESES RLQLLRPNQT RWNSTFMAVD RILQICKEAG EGALRNICTS 421 LEVPMFNPAE MLFLTEWANT MRPVAKVLDI LQAETNTQLG WLLPSVHQLS LKLQRLHHSL 481 RYCDPLVDAL QQGIQTRFKH MFEDPEIIAA AILLPKFRTS WTNDETIIKR GMDYIRVHLE
541 PLDHKKELAN SSSDDEDFFA SLKPTTHEAS KELDGILACV SDTRESLLTF PAICSLSIKT 601 NTPLPASAAC ERLFSTAGLL FSPKRARLDT NNFENQLLLK LNLRFYNFE (SEQ ID NO: 14502).
[00248] Um Transposon Tol2 exemplar da presente invenção, inclu- indo repetições invertidas, sequências subterminais e a Tol2 transpo- sase, é codificado por uma sequência de ácido nucleico compreen- dendo os seguintes: 1 CAGAGGTGTA AAGTACTTGA GTAATTTTAC TTGATTACTG TACTTAAGTA TTATTTTTGG 61 GGATTTTTAC TTTACTTGAG TACAATTAAA AATCAATACT TTTACTTTTA CTTAATTACA 121 TTTTTTTAGA AAAAAAAGTA CTTTTTACTC CTTACAATTT TATTTACAGT CAAAAAGTAC 181 TTATTTTTTG GAGATCACTT CATTCTATTT TCCCTTGCTA TTACCAAACC AATTGAATTG 241 CGCTGATGCC CAGTTTAATT TAAATGTTAT TTATTCTGCC TATGAAAATC GTTTTCACAT 301 TATATGAAAT TGGTCAGACA TGTTCATTGG TCCTTTGGAA GTGACGTCAT GTCACATCTA 361 TTACCACAAT GCACAGCACC TTGACCTGGA AATTAGGGAA ATTATAACAG TCAATCAGTG 421 GAAGAAAATG GAGGAAGTAT GTGATTCATC AGCAGCTGCG AGCAGCACAG TCCAAAATCA 481 GCCACAGGAT CAAGAGCACC CGTGGCCGTA TCTTCGCGAA TTCTTTTCTT TAAGTGGTGT 541 AAATAAAGAT TCATTCAAGA TGAAATGTGT CCTCTGTCTC CCGCTTAATA AAGAAATATC 601 GGCCTTCAAA AGTTCGCCAT CAAACCTAAG GAAGCATATT GAGGTAAGTA CATTAAGTAT 661 TTTGTTTTAC TGATAGTTTT TTTTTTTTTT TTTTTTTTTT TTTTTGGGTG TGCATGTTTT 721 GACGTTGATG GCGCGCCTTT TATATGTGTA GTAGGCCTAT TTTCACTAAT GCATGCGATT 781 GACAATATAA GGCTCACGTA ATAAAATGCT AAAATGCATT TGTAATTGGT AACGTTAGGT 841 CCACGGGAAA TTTGGCGCCT ATTGCAGCTT TGAATAATCA TTATCATTCC GTGCTCTCAT 901 TGTGTTTGAA TTCATGCAAA ACACAAGAAA ACCAAGCGAG AAATTTTTTT CCAAACATGT 961 TGTATTGTCA AAACGGTAAC ACTTTACAAT GAGGTTGATT AGTTCATGTA TTAACTAACA 1021 TTAAATAACC ATGAGCAATA CATTTGTTAC TGTATCTGTT AATCTTTGTT AACGTTAGTT 1081 AATAGAAATA CAGATGTTCA TTGTTTGTTC ATGTTAGTTC ACAGTGCATT AACTAATGTT 1141 AACAAGATAT AAAGTATTAG TAAATGTTGA AATTAACATG TATACGTGCA GTTCATTATT 1201 AGTTCATGTT AACTAATGTA GTTAACTAAC GAACCTTATT GTAAAAGTGT TACCATCAAA 1261 ACTAATGTAA TGAAATCAAT TCACCCTGTC ATGTCAGCCT TACAGTCCTG TGTTTTTGTC 1321 AATATAATCA GAAATAAAAT TAATGTTTGA TTGTCACTAA ATGCTACTGT ATTTCTAAAA 1381 TCAACAAGTA TTTAACATTA TAAAGTGTGC AATTGGCTGC AAATGTCAGT TTTATTAAAG 1441 GGTTAGTTCA CCCAAAAATG AAAATAATGT CATTAATGAC TCGCCCTCAT GTCGTTCCAA 1501 GCCCGTAAGA CCTCCGTTCA TCTTCAGAAC ACAGTTTAAG ATATTTTAGA TTTAGTCCGA 1561 GAGCTTTCTG TGCCTCCATT GAGAATGTAT GTACGGTATA CTGTCCATGT CCAGAAAGGT 1621 AATAAAAACA TCAAAGTAGT CCATGTGACA TCAGTGGGTT AGTTAGAATT TTTTGAAGCA 1681 TCGAATACAT TTTGGTCCAA AAATAACAAA ACCTACGACT TTATTCGGCA TTGTATTCTC 1741 TTCCGGGTCT GTTGTCAATC CGCGTTCACG ACTTCGCAGT GACGCTACAA TGCTGAATAA 1801 AGTCGTAGGT TTTGTTATTT TTGGACCAAA ATGTATTTTC GATGCTTCAA ATAATTCTAC 1861 CTAACCCACT GATGTCACAT GGACTACTTT GATGTTTTTA TTACCTTTCT GGACATGGAC 1921 AGTATACCGT ACATACATTT TCAGTGGAGG GACAGAAAGC TCTCGGACTA AATCTAAAAT 1981 ATCTTAAACT GTGTTCCGAA GATGAACGGA GGTGTTACGG GCTTGGAACG ACATGAGGGT
2041 GAGTCATTAA TGACATCTTT TCATTTTTGG GTGAACTAAC CCTTTAATGC TGTAATCAGA 2101 GAGTGTATGT GTAATTGTTA CATTTATTGC ATACAATATA AATATTTATT TGTTGTTTTT 2161 ACAGAGAATG CACCCAAATT ACCTCAAAAA CTACTCTAAA TTGACAGCAC AGAAGAGAAA 2221 GATCGGGACC TCCACCCATG CTTCCAGCAG TAAGCAACTG AAAGTTGACT CAGTTTTCCC 2281 AGTCAAACAT GTGTCTCCAG TCACTGTGAA CAAAGCTATA TTAAGGTACA TCATTCAAGG 2341 ACTTCATCCT TTCAGCACTG TTGATCTGCC ATCATTTAAA GAGCTGATTA GTACACTGCA 2401 GCCTGGCATT TCTGTCATTA CAAGGCCTAC TTTACGCTCC AAGATAGCTG AAGCTGCTCT 2461 GATCATGAAA CAGAAAGTGA CTGCTGCCAT GAGTGAAGTT GAATGGATTG CAACCACAAC 2521 GGATTGTTGG ACTGCACGTA GAAAGTCATT CATTGGTGTA ACTGCTCACT GGATCAACCC 2581 TGGAAGTCTT GAAAGACATT CCGCTGCACT TGCCTGCAAA AGATTAATGG GCTCTCATAC 2641 TTTTGAGGTA CTGGCCAGTG CCATGAATGA TATCCACTCA GAGTATGAAA TACGTGACAA 2701 GGTTGTTTGC ACAACCACAG ACAGTGGTTC CAACTTTATG AAGGCTTTCA GAGTTTTTGG 2761 TGTGGAAAAC AATGATATCG AGACTGAGGC AAGAAGGTGT GAAAGTGATG ACACTGATTC 2821 TGAAGGCTGT GGTGAGGGAA GTGATGGTGT GGAATTCCAA GATGCCTCAC GAGTCCTGGA 2881 CCAAGACGAT GGCTTCGAAT TCCAGCTACC AAAACATCAA AAGTGTGCCT GTCACTTACT 2941 TAACCTAGTC TCAAGCGTTG ATGCCCAAAA AGCTCTCTCA AATGAACACT ACAAGAAACT 3001 CTACAGATCT GTCTTTGGCA AATGCCAAGC TTTATGGAAT AAAAGCAGCC GATCGGCTCT 3061 AGCAGCTGAA GCTGTTGAAT CAGAAAGCCG GCTTCAGCTT TTAAGGCCAA ACCAAACGCG 3121 GTGGAATTCA ACTTTTATGG CTGTTGACAG AATTCTTCAA ATTTGCAAAG AAGCAGGAGA 3181 AGGCGCACTT CGGAATATAT GCACCTCTCT TGAGGTTCCA ATGTAAGTGT TTTTCCCCTC 3241 TATCGATGTA AACAAATGTG GGTTGTTTTT GTTTAATACT CTTTGATTAT GCTGATTTCT 3301 CCTGTAGGTT TAATCCAGCA GAAATGCTGT TCTTGACAGA GTGGGCCAAC ACAATGCGTC 3361 CAGTTGCAAA AGTACTCGAC ATCTTGCAAG CGGAAACGAA TACACAGCTG GGGTGGCTGC 3421 TGCCTAGTGT CCATCAGTTA AGCTTGAAAC TTCAGCGACT CCACCATTCT CTCAGGTACT 3481 GTGACCCACT TGTGGATGCC CTACAACAAG GAATCCAAAC ACGATTCAAG CATATGTTTG 3541 AAGATCCTGA GATCATAGCA GCTGCCATCC TTCTCCCTAA ATTTCGGACC TCTTGGACAA 3601 ATGATGAAAC CATCATAAAA CGAGGTAAAT GAATGCAAGC AACATACACT TGACGAATTC 3661 TAATCTGGGC AACCTTTGAG CCATACCAAA ATTATTCTTT TATTTATTTA TTTTTGCACT 3721 TTTTAGGAAT GTTATATCCC ATCTTTGGCT GTGATCTCAA TATGAATATT GATGTAAAGT 3781 ATTCTTGCAG CAGGTTGTAG TTATCCCTCA GTGTTTCTTG AAACCAAACT CATATGTATC 3841 ATATGTGGTT TGGAAATGCA GTTAGATTTT ATGCTAAAAT AAGGGATTTG CATGATTTTA 3901 GATGTAGATG ACTGCACGTA AATGTAGTTA ATGACAAAAT CCATAAAATT TGTTCCCAGT 3961 CAGAAGCCCC TCAACCAAAC TTTTCTTTGT GTCTGCTCAC TGTGCTTGTA GGCATGGACT 4021 ACATCAGAGT GCATCTGGAG CCTTTGGACC ACAAGAAGGA ATTGGCCAAC AGTTCATCTG 4081 ATGATGAAGA TTTTTTCGCT TCTTTGAAAC CGACAACACA TGAAGCCAGC AAAGAGTTGG 4141 ATGGATATCT GGCCTGTGTT TCAGACACCA GGGAGTCTCT GCTCACGTTT CCTGCTATTT 4201 GCAGCCTCTC TATCAAGACT AATACACCTC TTCCCGCATC GGCTGCCTGT GAGAGGCTTT 4261 TCAGCACTGC AGGATTGCTT TTCAGCCCCA AAAGAGCTAG GCTTGACACT AACAATTTTG 4321 AGAATCAGCT TCTACTGAAG TTAAATCTGA GGTTTTACAA CTTTGAGTAG CGTGTACTGG 4381 CATTAGATTG TCTGTCTTAT AGTTTGATAA TTAAATACAA ACAGTTCTAA AGCAGGATAA 4441 AACCTTGTAT GCATTTCATT TAATGTTTTT TGAGATTAAA AGCTTAAACA AGAATCTCTA 4501 GTTTTCTTTC TTGCTTTTAC TTTTACTTCC TTAATACTCA AGTACAATTT TAATGGAGTA
4561 CTTTTTTACT TTTACTCAAG TAAGATTCTA GCCAGATACT TTTACTTTTA ATTGAGTAAA 4621 ATTTTCCCTA AGTACTTGTA CTTTCACTTG AGTAAAATTT TTGAGTACTT TTTACACCTC 4681 TG (SEQ ID NO: 18062).
[00249] Os sistemas de transposon/transposase exemplares da presente invenção incluem, mas não estão limitados a, transposons e transposases tipo piggyBac e piggyBac.
[00250] PiggyBac e transposases semelhantes a piggyBac reco- nhecem sequências de repetição terminal invertida específicas de transposon (ITRs) nas extremidades do transposon, e movem os con- teúdos entre as ITRs em sítios cromossômicos TTAA ou TTAT. O sis- tema de transposon piggyBac ou semelhante a piggyBac não tem ne- nhum limite de carregamento para os genes de interesse que podem ser incluídos entre as ITRs.
[00251] Em certas modalidades, e, em particular, aquelas modali- dades em que o transposon é um transposon piggyBac, a transposase é uma transposase piggyBac™, Super piggyBac™ (SPB). Em certas modalidades, e, em particular, aquelas modalidades em que a trans- posase é uma piggyBac™, Super piggyBac™ (SPB), a sequência co- dificando o transposase é uma sequência de mRNA.
[00252] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac ou seme- lhante à piggyBac.
[00253] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac ou tipo piggyBac. A enzima transposase piggyBac (PB) ou semelhante à piggyBac pode compreender ou consistir em uma sequência de ami- noácido de pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idêntica a: 1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEI SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG 61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG 121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTGATFRD TNEDEIYAFF
181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV 241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RMYIPNKPSK YGIKILMMCD 301 SGTKYMINGM PILGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ 361 EPIKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVILLSSC 421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN 481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRILRD NISNILPNEV 541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF (SEQ ID NO: 14487).
[00254] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac ou seme- lhante à piggyBac que compreende ou consiste em uma sequência de aminoácido tendo uma substituição de aminoácido em uma ou mais das posições 30, 165, 282, ou 538 da sequência: 1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEI SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG 61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG 121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTGATFRD TNEDEIYAFF 181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV 241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RMYIPNKPSK YGIKILMMCD 301 SGTKYMINGM PILGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ 361 EPIKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVILLSSC 421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN 481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRILRD NISNILPNEV 541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF (SEQ ID NO: 14487).
[00255] Em certas modalidades, a enzima transposase é uma en- zima transposase piggyBac ou semelhante à piggyBac que compreen- de ou consiste em uma sequência de aminoácido tendo uma substitui- ção de aminoácido em duas ou mais das posições 30, 165, 282, ou 538 da sequência de SEQ ID NO: 14487. Em certas modalidades, a enzima transposase é uma enzima transposase piggyBac ou seme- lhante à piggyBac que compreende ou consiste em uma sequência de aminoácido tendo uma substituição de aminoácido em três ou mais das posições 30, 165, 282, ou 538 da sequência de SEQ ID NO:
14487. Em certas modalidades, a enzima transposase é uma enzima transposase piggyBac ou semelhante à piggyBac que compreende ou consiste em uma sequência de aminoácido tendo uma substituição de aminoácido em cada uma das seguintes posições 30, 165, 282, e 538 da sequência de SEQ ID NO: 14487. Em certas modalidades, a substi- tuição de aminoácido na posição 30 da sequência de SEQ ID NO: 14487 é uma substituição de uma valina (V) por uma isoleucina (I). Em certas modalidades, a substituição de aminoácido na posição 165 da sequência de SEQ ID NO: 14487 é uma substituição de uma serina (S) por uma glicina (G). Em certas modalidades, a substituição de amino- ácido na posição 282 da sequência de SEQ ID NO: 14487 é uma substituição de uma valina (V) por uma metionina (M). Em certas mo- dalidades, a substituição de aminoácido na posição 538 da sequência de SEQ ID NO: 14487 é uma substituição de uma lisina (K) por uma asparagina (N).
[00256] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase Super piggyBac™ (SPB) ou semelhante à piggyBac. Em certas modalidades, uma enzi- ma transposase Super piggyBac™ (SPB) ou semelhante à piggyBac da presente invenção pode compreender ou consistir em uma sequên- cia de aminoácido da sequência de SEQ ID NO: 14487 em que a substituição de aminoácido na posição 30 é uma substituição de uma valina (V) por uma isoleucina (I), a substituição de aminoácido na posi- ção 165 é uma substituição de uma serina (S) por uma glicina (G), a substituição de aminoácido na posição 282 é uma substituição de uma valina (V) por uma metionina (M), e uma substituição de aminoácido na posição 538 é uma substituição de uma lisina (K) por uma aspara- gina (N). Em certas modalidades, uma enzima transposase Super piggyBac™ (SPB) ou semelhante à piggyBac pode compreender ou consistir em uma sequência de aminoácido de pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre es- tas idêntica a: 1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEV SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG
61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG 121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTSATFRD TNEDEIYAFF 181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV 241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RVYIPNKPSK YGIKILMMCD 301 SGTKYMINGM PILGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ 361 EPIKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVILLSSC 421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN 481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRILRD NISNILPKEV 541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF (SEQ ID NO: 14484).
[00257] Em certas modalidades dos métodos da presente invenção, incluindo aquelas modalidades em que a transposase compreende as mutações descritas acima nas posições 30, 165, 282 e/ou 538, a en- zima transposase piggyBac™, Super piggyBac™ ou semelhante à piggyBac pode também compreender uma substituição de aminoácido em uma ou mais das posições 3, 46, 82, 103, 119, 125, 177, 180, 185, 187, 200, 207, 209, 226, 235, 240, 241, 243, 258, 296, 298, 311, 315, 319, 327, 328, 340, 421, 436, 456, 470, 486, 503, 552, 570 e 591 da sequência de SEQ ID NO: 14487 ou SEQ ID NO: 14484. Em certas modalidades, incluindo aquelas modalidades em que a transposase compreende as mutações descritas acima nas posições 30, 165, 282 e/ou 538, a enzima transposase piggyBac™, Super piggyBac™ ou semelhante à piggyBac pode também compreender uma substituição de aminoácido em uma ou mais das posições 46, 119, 125, 177, 180, 185, 187, 200, 207, 209, 226, 235, 240, 241, 243, 296, 298, 311, 315, 319, 327, 328, 340, 421, 436, 456, 470, 485, 503, 552 e 570. Em cer- tas modalidades, a substituição de aminoácido na posição 3 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma aspa- ragina (N) por uma serina (S). Em certas modalidades, a substituição de aminoácido na posição 46 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma serina (S) por uma alanina (A). Em certas modalidades, a substituição de aminoácido na posição 46 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma treonina (T) por uma alanina (A). Em certas modalidades, a substitui- ção de aminoácido na posição 82 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de um triptofano (W) por uma isoleucina (I). Em certas modalidades, a substituição de aminoácido na posição 103 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma prolina (P) por uma serina (S). Em certas modalidades, a substituição de aminoácido na posição 119 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma prolina (P) por uma ar- ginina (R). Em certas modalidades, a substituição de aminoácido na posição 125 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma subs- tituição de uma alanina (A) a cisteína (C). Em certas modalidades, a substituição de aminoácido na posição 125 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma leucina (L) por uma cis- teína (C). Em certas modalidades, a substituição de aminoácido na posição 177 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma subs- tituição de uma lisina (K) por uma tirosina (Y). Em certas modalidades, a substituição de aminoácido na posição 177 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma histidina (H) por uma tirosina (Y). Em certas modalidades, a substituição de aminoácido na posição 180 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma subs- tituição de uma leucina (L) por uma fenilalanina (F). Em certas modali- dades, a substituição de aminoácido na posição 180 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma isoleucina (I) por uma fenilalanina (F). Em certas modalidades, a substituição de aminoácido na posição 180 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma valina (V) por uma fenilalanina (F). Em certas modalidades, a substituição de aminoácido na posição 185 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma leucina (L) por uma metionina (M). Em certas modalidades, a substituição de aminoácido na posição 187 de SEQ ID NO: 14487 ou
SEQ ID NO: 14484 é uma substituição de uma glicina (G) por uma alanina (A). Em certas modalidades, a substituição de aminoácido na posição 200 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma subs- tituição de um triptofano (W) por uma fenilalanina (F). Em certas moda- lidades, a substituição de aminoácido na posição 207 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma prolina (P) por uma valina (V). Em certas modalidades, a substituição de aminoá- cido na posição 209 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma fenilalanina (F) por uma valina (V). Em certas modalidades, a substituição de aminoácido na posição 226 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma fenilala- nina (F) por uma metionina (M). Em certas modalidades, a substituição de aminoácido na posição 235 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma arginina (R) por uma leucina (L). Em certas modalidades, a substituição de aminoácido na posição 240 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma lisina (K) por uma valina (V). Em certas modalidades, a substituição de aminoácido na posição 241 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma leucina (L) por uma fenilalanina (F). Em certas modalidades, a substituição de aminoácido na posição 243 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma lisina (K) por uma prolina (P). Em certas modalidades, a substitui- ção de aminoácido na posição 258 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma serina (S) por uma asparagina (N). Em certas modalidades, a substituição de aminoácido na posição 296 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de um triptofano (W) por uma leucina (L). Em certas modalidades, a substituição de aminoácido na posição 296 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma tirosina (Y) por uma leucina (L). Em certas modalidades, a substituição de aminoácido na posição 296 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma subs- tituição de uma fenilalanina (F) por uma leucina (L). Em certas modali- dades, a substituição de aminoácido na posição 298 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma leucina (L) por uma metionina (M). Em certas modalidades, a substituição de ami- noácido na posição 298 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma alanina (A) por uma metionina (M). Em cer- tas modalidades, a substituição de aminoácido na posição 298 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma valina (V) por uma metionina (M). Em certas modalidades, a substituição de aminoácido na posição 311 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma isoleucina (I) por uma prolina (P). Em certas modalidades, a substituição de aminoácido na posição 311 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma valina por uma prolina (P). Em certas modalidades, a substituição de aminoácido na posição 315 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma lisina (K) por uma arginina (R). Em certas modalidades, a substituição de aminoácido na posição 319 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma glicina (G) por uma treonina (T). Em certas modalidades, a substitui- ção de aminoácido na posição 327 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma arginina (R) por uma tirosina (Y). Em certas modalidades, a substituição de aminoácido na posição 328 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma valina (V) por uma tirosina (Y). Em certas modalidades, a substituição de aminoácido na posição 340 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma glicina (G) por uma cis- teína (C). Em certas modalidades, a substituição de aminoácido na posição 340 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma subs- tituição de uma leucina (L) por uma cisteína (C). Em certas modalida-
des, a substituição de aminoácido na posição 421 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma histidina (H) pelo ácido aspártico (D). Em certas modalidades, a substituição de aminoácido na posição 436 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma isoleucina (I) por uma valina (V). Em certas modalidades, a substituição de aminoácido na posição 456 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma tirosina (Y) por uma metionina (M). Em certas modalidades, a substi- tuição de aminoácido na posição 470 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma fenilalanina (F) por uma leu- cina (L). Em certas modalidades, a substituição de aminoácido na po- sição 485 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substi- tuição de uma lisina (K) por uma serina (S). Em certas modalidades, a substituição de aminoácido na posição 503 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma leucina (L) por uma metionina (M). Em certas modalidades, a substituição de aminoácido na posição 503 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma isoleucina (I) por uma metionina (M). Em certas modalidades, a substituição de aminoácido na posição 552 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma lisina (K) por uma valina (V). Em certas modalidades, a substituição de aminoá- cido na posição 570 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma treonina (T) por uma alanina (A). Em certas modalidades, a substituição de aminoácido na posição 591 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma prolina (P) por uma glutamina (Q). Em certas modalidades, a substituição de aminoácido na posição 591 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma arginina (R) por uma glutamina (Q).
[00258] Em certas modalidades dos métodos da presente invenção, incluindo aquelas modalidades em que a transposase compreende as mutações descritas acima nas posições 30, 165, 282 e/ou 538, a en- zima transposase piggyBac™ ou semelhante á piggyBac pode com- preender ou a enzima transposase Super piggyBac™ pode também compreender uma substituição de aminoácido em uma ou mais das posições 103, 194, 372, 375, 450, 509 e 570 da sequência de SEQ ID NO: 14487 ou SEQ ID NO: 14484. Em certas modalidades dos méto- dos da presente invenção, incluindo aquelas modalidades em que a transposase compreende as mutações descritas acima nas posições 30, 165, 282 e/ou 538, a enzima transposase piggyBac™ ou seme- lhante á piggyBac pode compreender ou a enzima transposase Super piggyBac™ pode també compreender uma substituição de aminoáci- do em duas, três, quatro, cinco, seis ou mais das posições 103, 194, 372, 375, 450, 509 e 570 da sequência de SEQ ID NO: 14487 ou SEQ ID NO: 14484. Em certas modalidades, incluindo aquelas modalidades em que a transposase compreende as mutações descritas acima nas posições 30, 165, 282 e/ou 538, a enzima transposase piggyBac™ ou semelhante á piggyBac pode compreender ou a enzima transposase Super piggyBac™ pode também compreender uma substituição de aminoácido nas posições 103, 194, 372, 375, 450, 509 e 570 da se- quência de SEQ ID NO: 14487 ou SEQ ID NO: 14484. Em certas mo- dalidades, a substituição de aminoácido na posição 103 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma prolina (P) por uma serina (S). Em certas modalidades, a substituição de ami- noácido na posição 194 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma valina (V) por uma metionina (M). Em cer- tas modalidades, a substituição de aminoácido na posição 372 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma alani- na (A) por uma arginina (R). Em certas modalidades, a substituição de aminoácido na posição 375 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma alanina (A) por uma lisina (K). Em certas modalidades, a substituição de aminoácido na posição 450 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma asparagina (N) por um ácido aspártico (D). Em certas modalidades, a substituição de aminoácido na posição 509 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substituição de uma glicina (G) por uma se- rina (S). Em certas modalidades, a substituição de aminoácido na po- sição 570 de SEQ ID NO: 14487 ou SEQ ID NO: 14484 é uma substi- tuição de uma serina (S) por uma asparagina (N). Em certas modali- dades, a enzima transposase piggyBac™ ou semelhante á piggyBac pode compreender uma substituição de uma valina (V) por uma metio- nina (M) na posição 194 de SEQ ID NO: 14487. Em certas modalida- des, incluindo aquelas modalidades em que a enzima transposase piggyBac™ ou semelhante á piggyBac pode compreender uma substi- tuição de uma valina (V) por uma metionina (M) na posição 194 de SEQ ID NO: 14487, a enzima transposase piggyBac™ ou semelhante á piggyBac pode também compreender uma substituição de aminoáci- do nas posições 372, 375 e 450 da sequência de SEQ ID NO: 14487 ou SEQ ID NO: 14484. Em certas modalidades, a enzima transposase piggyBac™ ou semelhante á piggyBac pode compreender uma substi- tuição de uma valina (V) por uma metionina (M) na posição 194 de SEQ ID NO: 14487, uma substituição de uma alanina (A) por uma ar- ginina (R) na posição 372 de SEQ ID NO: 14487, e uma substituição de uma alanina (A) por uma lisina (K) na posição 375 de SEQ ID NO:
14487. Em certas modalidades, a enzima transposase piggyBac™ ou semelhante á piggyBac pode compreender uma substituição de uma valina (V) por uma metionina (M) na posição 194 de SEQ ID NO: 14487, uma substituição de uma alanina (A) por uma arginina (R) na posição 372 de SEQ ID NO: 14487, uma substituição de uma alanina (A) por uma lisina (K) na posição 375 de SEQ ID NO: 14487 e uma substituição de uma asparagina (N) por um ácido aspártico (D) na po-
sição 450 de SEQ ID NO: 14487,
[00259] Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de um inseto. Em certas modalidades, o inseto é Trichoplusia ni (Número de acesso GenBank AAA87375; SEQ ID NO: 16796), Argyrogramma agnata (Número de acesso GenBank GU477713; SEQ ID NO: 14534, SEQ ID NO: 16797), Anopheles gambiae (Número de acesso GenBank XP_312615 (SEQ ID NO: 16798); Número de acesso GenBank XP_320414 (SEQ ID NO: 16799); Número de acesso GenBank XP_310729 (SEQ ID NO: 16800)), Aphis gossypii (Número de acesso GenBank GU329918; SEQ ID NO: 16801, SEQ ID NO: 16802), Acirthosiphon pisum (Núme- ro de acesso GenBank XP_001948139; SEQ ID NO: 16803), Agroti- sipsilon (Número de acesso GenBank GU477714; SEQ ID NO: 14537, SEQ ID NO: 16804), Bombyx mori (Número de acesso GenBank BAD11135; SEQ ID NO: 14505), Chilosuppressalis (Número de aces- so GenBank JX294476; SEQ ID NO: 16805, SEQ ID NO: 16806), Dro- sophila melanogaster (Número de acesso GenBank AAL39784; SEQ ID NO: 16807), Helicoverpa armigera (Número de acesso GenBank ABS18391; SEQ ID NO: 14525), Heliothisvirescens (Número de aces- so GenBank ABD76335; SEQ ID NO: 16808), Macdunnoughia crassi- signa (Número de acesso GenBank EU287451; SEQ ID NO: 16809, SEQ ID NO: 16810), Pectinophora gossypiella (Número de acesso GenBank GU270322; SEQ ID NO: 14530, SEQ ID NO: 16811), Tribo- lium castaneum (Número de acesso GenBank XP_001814566; SEQ ID NO: 16812), Ctenoplusia agnata (also called Argyrogramma agnata), Messour bouvieri, Megachile rotundata, Bombus impatiens, Mamestra brassicae, Mayetiola destructor ou Apis mellifera.
[00260] Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de um inseto. Em certas modalidades, o inseto é Trichoplusia ni (AAA87375).
[00261] Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de um inseto. Em certas modalidades, o inseto é Bombyx mori (BAD11135).
[00262] Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de um crustáceo. Em certas modalidades, o crustáceo é Daphnia pulicaria (AAM76342, SEQ ID NO: 16813).
[00263] Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de um vertebrado. Em certas modalidades, o vertebrado é Xenopus tropicalis (número de acesso GenBank BAF82026; SEQ ID NO: 14518), Homo sapiens (nú- mero de acesso GenBank NP_689808; SEQ ID NO: 16814), Mus musculus (número de acesso GenBank NP_741958; SEQ ID NO: 16815), Macaca fascicularis (número de acesso GenBank AB179012; SEQ ID NO: 16816, SEQ ID NO: 16817), Rattusnorvegicus (número de acesso GenBank XP_220453; SEQ ID NO: 16818) ou Myotis lucifugus.
[00264] Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de um urocordata. Em certas modalidades, o urocordata é Ciona intestinalis (número de acesso GenBank XP_002123602; SEQ ID NO: 16819).
[00265] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac insere um transposon na sequência 5’-TTAT-3’ den- tro de um sítio cromossômico (uma sequência alvo de TTAT).
[00266] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac insere um transposon na sequência 5’-TTAA-3’ den- tro de um sítio cromossômico (uma sequência alvo TTAA).
[00267] Em certas modalidades, a sequência alvo do transposon piggyBac ou semelhante a piggyBac compreende ou consiste em 5’- CTAA-3’, 5’-TTAG-3’, 5’-ATAA-3’, 5’-TCAA-3’, 5’AGTT-3’, 5’-ATTA-3’, 5’-GTTA-3’, 5’-TTGA-3’, 5’-TTTA-3’, 5’-TTAC-3’, 5’-ACTA-3’, 5’-AGGG-
3’, 5’-CTAG-3’, 5’-TGAA-3’, 5’-AGGT-3’, 5’-ATCA-3’, 5’-CTCC-3’, 5’- TAAA-3’, 5’-TCTC-3’, 5’TGAA-3’, 5’-AAAT-3’, 5’-AATC-3’, 5’-ACAA-3’, 5’-ACAT-3’, 5’-ACTC-3’, 5’-AGTG-3’, 5’-ATAG-3’, 5’-CAAA-3’, 5’- CACA-3’, 5’-CATA-3’, 5’-CCAG-3’, 5’-CCCA-3’, 5’-CGTA-3’, 5’-GTCC- 3’, 5’-TAAG-3’, 5’-TCTA-3’, 5’-TGAG-3’, 5’-TGTT-3’, 5’-TTCA-3’5’- TTCT-3’ e 5’-TTTT-3’.
[00268] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac ou seme- lhante à piggyBac. Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de Bombyx mori. A enzima transposase semelhante à piggyBac ou piggyBac po- de compreender ou consistir em uma sequência de aminoácido de pe- lo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idêntica a: 1 MDIERQEERI RAMLEEELSD YSDESSSEDE TDHCSEHEVN YDTEEERIDS VDVPSNSRQE 61 EANAIIANES DSDPDDDLPL SLVRQRASAS RQVSGPFYTS KDGTKWYKNC QRPNVRLRSE 121 NIVTEQAQVK NIARDASTEY ECWNIFVTSD MLQEILTHTN SSIRHRQTKT AAENSSAETS 181 FYMQETTLCE LKALIALLIL AGLIKSNRQS LKDLWRTDGT GVDIFRTTMS LQRFQFLQNN 241 IRFDDKSTRD ERKQTDNMAA FRSIFDQFVQ CCQNAYSPSE FLTIDEMLLS FRGRCLFRVY 301 IPNKPAKYGI KILALVDAKN FDVVNLEVYA GKQPSGPIAV SNRPFEVVER LIQPVARSHR 361 NVTFDNWFTG YELMLHLLNE YRLTSVGTVR KNKRQIPESF IRTDRQPNSS VFGFQKDITL 421 VSYAPKKNKV VVVMSTMHHD NSIDESTGEK QKPEMITFYN STKAGVDVVD ELSANYNVSR 481 NSKRWPMTLF YGVLNMAAIN ACIIYRANKN VTIKRTEFIR SLGLSMIYEH LHSRNKKKNI 541 PTILRQRIEK QLGEPSPRHV NVPGRYVRCQ DCPIKKDRKT KHSCNACAKP ICMEHAKFLC 601 ENCAELDSSL (SEQ ID NO: 14504).
[00269] A enzima transposase piggyBac (PB) ou semelhante à piggyBac pode compreender ou consistir em uma sequência de ami- noácido de pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idêntica a: 1 MDIERQEERI RAMLEEELSD YSDESSSEDE TDHCSEHEVN YDTEEERIDS VDVPSNSRQE 61 EANAIIANES DSDPDDDLPL SLVRQRASAS RQVSGPFYTS KDGTKWYKNC QRPNVRLRSE 121 NIVTEQAQVK NIARDASTEY ECWNIFVTSD MLQEILTHTN SSIRHRQTKT AAENSSAETS 181 FYMQETTLCE LKALIALLIL AGLIKSNRQS LKDLWRTDGT GVDIFRTTMS LQRFQFLQNN
241 IRFDDKSTRD ERKQTDNMAA FRSIFDQFVQ CCQNAYSPSE FLTIDEMLLS FRGRCLFRVY 301 IPNKPAKYGI KILALVDAKN FYVVNLEVYA GKQPSGPIAV SNRPFEVVER LIQPVARSHR 361 NVTFDNWFTG YELMLHLLNE YRLTSVGTVR KNKRQIPESF IRTDRQPNSS VFGFQKDITL 421 VSYAPKKNKV VVVMSTMHHD NSIDESTGEK QKPEMITFYN STKAGVDVVD ELCANYNVSR 481 NSKRWPMTLF YGVLNMAAIN ACIIYRTNKN VTIKRTEFIR SLGLSMIYEH LHSRNKKKNI 541 PTILRQRIEK QLGEPSPRHV NVPGRYVRCQ DCPIKKDRKT KRSCNACAKP ICMEHAKFLC 601 ENCAELDSSL (SEQ ID NO: 14505).
[00270] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac é fundida a um sinal de localização nuclear. Em cer- tas modalidades, a sequência de aminoácido de uma transposase piggyBac ou semelhante à piggyBac fundida a um sinal de localização nuclear é codificada por uma sequência de polinucleotídeo compreen- dendo: 1 atggcaccca aaaagaaacg taaagtgatg gacattgaaa gacaggaaga aagaatcagg 61 gcgatgctcg aagaagaact gagcgactac tccgacgaat cgtcatcaga ggatgaaacc 121 gaccactgta gcgagcatga ggttaactac gacaccgagg aggagagaat cgactctgtg 181 gatgtgccct ccaactcacg ccaagaagag gccaatgcaa ttatcgcaaa cgaatcggac 241 agcgatccag acgatgatct gccactgtcc ctcgtgcgcc agcgggccag cgcttcgaga 301 caagtgtcag gtccattcta cacttcgaag gacggcacta agtggtacaa gaattgccag 361 cgacctaacg tcagactccg ctccgagaat atcgtgaccg aacaggctca ggtcaagaat 421 atcgcccgcg acgcctcgac tgagtacgag tgttggaata tcttcgtgac ttcggacatg 481 ctgcaagaaa ttctgacgca caccaacagc tcgattaggc atcgccagac caagactgca 541 gcggagaact catcggccga aacctccttc tatatgcaag agactactct gtgcgaactg 601 aaggcgctga ttgcactgct gtacttggcc ggcctcatca aatcaaatag gcagagcctc 661 aaagatctct ggagaacgga tggaactgga gtggatatct ttcggacgac tatgagcttg 721 cagcggttcc agtttctgca aaacaatatc agattcgacg acaagtccac ccgggacgaa 781 aggaaacaga ctgacaacat ggctgcgttc cggtcaatat tcgatcagtt tgtgcagtgc 841 tgccaaaacg cttatagccc atcggaattc ctgaccatcg acgaaatgct tctctccttc 901 cgggggcgct gcctgttccg agtgtacatc ccgaacaagc cggctaaata cggaatcaaa 961 atcctggccc tggtggacgc caagaatttc tacgtcgtga atctcgaagt gtacgcagga 1021 aagcaaccgt cgggaccgta cgctgtttcg aaccgcccgt ttgaagtcgt cgagcggctt 1081 attcagccgg tggccagatc ccaccgcaat gttaccttcg acaattggtt caccggctac 1141 gagctgatgc ttcaccttct gaacgagtac cggctcacta gcgtggggac tgtcaggaag 1201 aacaagcggc agatcccaga atccttcatc cgcaccgacc gccagcctaa ctcgtccgtg 1261 ttcggatttc aaaaggatat cacgcttgtc tcgtacgccc ccaagaaaaa caaggtcgtg 1321 gtcgtgatga gcaccatgca tcacgacaac agcatcgacg agtcaaccgg agaaaagcaa 1381 aagcccgaga tgatcacctt ctacaattca actaaggccg gcgtcgacgt cgtggatgaa 1441 ctgtgcgcga actataacgt gtcccggaac tctaagcggt ggcctatgac tctcttctac 1501 ggagtgctga atatggccgc aatcaacgcg tgcatcatct accgcaccaa caagaacgtg 1561 accatcaagc gcaccgagtt catcagatcg ctgggtttga gcatgatcta cgagcacctc 1621 cattcacgga acaagaagaa gaatatccct acttacctga ggcagcgtat cgagaagcag 1681 ttgggagaac caagcccgcg ccacgtgaac gtgccggggc gctacgtgcg gtgccaagat
1741 tgcccgtaca aaaaggaccg caaaaccaaa agatcgtgta acgcgtgcgc caaacctatc 1801 tgcatggagc atgccaaatt tctgtgtgaa aattgtgctg aactcgattc ctccctg (SEQ ID NO: 14629).
[00271] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac é hiperativa. Uma transposase piggyBac ou seme- lhante à piggyBac hiperativa é uma transposase que é mais ativa do que a variante de ocorrência natural da qual é derivada. Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac hiperativa é isolada ou derivada de Bombyx mori. Em certas modalidades, a transposase piggyBac ou semelhante à piggyBac é uma variante hiperativa de SEQ ID NO: 14505. Em certas modalida- des, a transposase piggyBac ou semelhante à piggyBac hiperativa compreende uma sequência que é pelo menos 90% idêntica a: 1 MDIERQEERI RAMLEEELSD YSDESSSEDE TDHCSEHEVN YDTEEERIDS VDVPSNSRQE 61 EANAIIANES DSDPDDDLPL SLVRQRASAS RQMSGPHYTS KDGTKWYKNC QRPNVRLRSE 121 NIVTEQAQVK NIARDASTEY ECWNIFVTSD MLQEILTHTN SSIRWRQTKT AAENSSASTS 181 FYMQETTLCE LKALIGLLYI AGLIKSNRQS LKDLWRTDGT GVDIFRTTMS LQRFQFLQNN 241 IRFDDKSTRD ERKQTDNMAA FRSIFDQFVQ SCQNAYSPSE FLTIDEMLLS FRGRCLFRVY 301 IPNKPAKYGI KILALVDAKN FYVKNLEVYA GKQPSGPIAV SNRPFEVVER LIQPVARSHR 361 NVTFDNWFTG YELMLHLLNE YRLTSVGTVR KNKRQIPESF IRTDRQPNSS VFGFQKDITL 421 VSYAPKKNKV VVVMSTMHHD NSIDESTGEK QKPEMITFYN STKAGVDVVD ELCANYNVSR 481 NSKRWPMTLF YGVLNMAAIN ACIIYRTNKN VTIKRTEFIR SLGLSMIYEH LHSRNKKKNI 541 PTILRQRIEK QLGEPSPRHV NVPGRYVRCQ DCPIKKDRKT KRSCNACAKP ICMEHAKFLC 601 ENCAELDSHL (SEQ ID NO: 14576).
[00272] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac hiperativa compreende SEQ ID NO: 14576. Em cer- tas modalidades, a transposase piggyBac ou semelhante à piggyBac hiperativa compreende uma sequência de: 1 MDIERQEERI RAMLEEELSD YSDESSSEDE TDHCSEHEVN YDTEEERIDS VDVPSNSRQE 61 EANAIIANES DSDPDDDLPL SLVRQRASAS RQVSGPFYTS KDGTKWYKNC QRPNVRLRSE 121 NIVTEQAQVK NIARDASTEY ECWNIFVTSD MLQEILTHTN SSIRWRQTKT AAENSSAETS 181 FYMQETTLCE LKALIGLLYI AGLIKSNRQS LKDLWRTDGT GVDIFRTTMS LQRFQFLLNN 241 IRFDDKSTRD ERKQTDNMAA FRSIFDQFVQ SCQNAYSPSE FLTIDEMLLS FRGRCLFRVY 301 IPNKPAKYGI KILALVDAKN FYVHNLEVYA GKQPSGPIAV SNRPFEVVER LIQPVARSHR 361 NVTFDNWFTG YEVMLHLLNE YRLTSVGTVR KNKRQIPESF IRTDRQPNSS VFGFQKDITL 421 VSYAPKKNKV VVVMSTMHHD NSIDESTGEK QKPEMITFYN STKAGVDVVD ELCANYNVSR 481 NSKRWPMTLF YGVLNMAAIN ACIIYRTNKN VTIKRTEFIR SLGLSMIYEH LHSRNKKKNI 541 PTILRQRIEK QLGEPSPRHV NVPGRYVRCQ DCPIKKDRKT KRSCNACAKP ICMEHAKFLC
601 ENCAHLDS (SEQ ID NO: 14630).
[00273] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac hiperativa compreende uma sequência de: 1 MDIERQEERI RAMLEEELSD YSDESSSEDE TDHCSEHEVN YDTEEERIDS VDVPSNSRQE 61 EANAIIANES DSDPDDDLPL SLVRQRASAS RQVSGPFYTS KDGTKWYKNC QRPNVRLRSE 121 NIVTEQAQVK NIARDASTEY ECWNIFVTSD MLQEILTHTN SSIRWRQTKT AAENSSASTS 181 FYMQETTLCE LKALIGLLYI AGLIKSNRQS LKDLWRTDGT GVDIFRTTMS LQRFQFLLNN 241 IRFDDKSTRD ERKQTDNMAA FRSIFDQFVQ SCQNAYSPSE FLTIDEMLLS FRGRCLFRVY 301 IPNKPAKYGI KILALVDAKN FYVKNLEVYA GKQPSGPIAV SNRPFEVVER LIQPVARSHR 361 NVTFDNWFTG YELMLHLLNE YRLTSVGTVR KNKRQIPESF IRTDRQPNSS VFGFQKDITL 421 VSYAPKKNKV VVVMSTMHHD NSIDESTGEK QKPEMITFYN STKAGVDVVD ELCANYNVSR 481 NSKRWPMTLF YGVLNMAAIN ACIIYRTNKN VTIKRTEFIR SLGLSMIYEH LHSRNKKKNI 541 PTILRQRIAM QLGEPSPRHV NVPGRYVRCQ DCPIKKDRKT KRSCNACAKP ICMEHAKFLC 601 ENCAELDSSL (SEQ ID NO: 14631).
[00274] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac hiperativa compreende uma sequência de: 1 MDIERQEERI RAMLEEELSD YSDESSSEDE TDHCSEHEVN YDTEEERIDS VDVPSNSRQE 61 EANAIIANES DSDPDDDLPL SLVRQRASAS RQVSGPFYTS KDGTKWYKNC QRPNVRLRSE 121 NIVTEQAQVK NIARDASTEY ECWNIFVTSD MLQEILTHTN SSIRWRQTKT AAENSSAETS 181 FYMQETTLCE LKALIGLLYI AGLIKSNRQS LKDLWRTDGT GVDIFRTTMS LQRFQFLLNN 241 IRFDDKSTRD ERKQTDNMAA FRSIFDQFVQ SCQNAYSPSE FLTIDEMLLS FRGRCLFRVY 301 IPNKPAKYGI KILALVDAKN FYVKNLEVYA GKQPSGPIAV SNRPFEVVER LIQPVARSHR 361 NVTFDNWFTG YELMLHLLNE YRLTSVGTVR KNKTQIPENF IRTDRQPNSS VFGFQKDITL 421 VSYAPKKNKV VVVMSTMHHD NSIDESTGEK QKPEMITFYN STKAGVDVVD ELQANYNVSR 481 NSKRWPMTLF YGVLNMAAIN ACIIYRTNKN VTIKRTEFIR SLGLSMIYEH LHSRNKKKNI 541 PTILRQRIEK QLGEPSPRHV NVPGRYVRCQ DCPIKKDRKT KRSCNACAKP ICMEHAKFLC 601 ENCAELDSSL (SEQ ID NO: 14632).
[00275] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac hiperativa compreende uma sequência de: 1 MDIERQEERI RAMLEEELSD YSDESSSEDE TDHCSEHEVN YDTEEERIDS VDVPSNSRQE 61 EANAIIANES DSDPDDDLPL SLVRQRASAS RQVSGPFYTS KDGTKWYKNC QRPNVRLRSE 121 NIVTEQAQVK NIARDASTEY ECWNIFVTSD MLQEILTHTN SSIRWRQTKT AAENSSAETS 181 FYMQETTLCE LKALIGLLYI AGLIKSNRQS LKDLWRTDGT GVDIFRTTMS LQRFQFLQNN 241 IRFDDKSTRD ERKQTDNMAA FRSIFDQFVQ SCQNAYSPSE FLTIDEMLLS FRGRCLFRVY 301 IPNKPAKYGI KILALVDAKN FYVKNLEVYA GKQPSGPIAV SNRPFEVVER LIQPVARSHR 361 NVTFDNWFTG YELMLHLLNE YRLTSVGTVR KNKRQIPESF IRTDRQPNSS VFGFQKDITL 421 VSYAPKKNKV VVVMSTMHHD NSIDESTGEK QKPEMITFYN STKAGVDVVD ELCANYNVSR 481 NSKRWPMTLF YGVLNMAAIN ACIIYRTNKN VTIKRTEFIR SLGLSMIYEH LHSRNKKKNI 541 PTILRQRIEK QLGEPSPRHV NVPGRYVRCQ DCPIKKDRKT KRSCNACAKP ICMEHAKFLC 601 ENCAELDSSL (SEQ ID NO: 14633).
[00276] Em certas modalidades, a transposase piggyBac ou seme-
lhante à piggyBac hiperativa compreende uma sequência de: 1 MDIERQEERI RAMLEEELSD YSDESSSEDE TDHCSEHEVN YDTEEERIDS VDVPSNSRQE 61 EANAIIANES DSDPDDDLPL SLVRQRASAS RQVSGPFYTS KDGTKWYKNC QRPNVRLRSE 121 NIVTEQAQVK NIARDASTEY ECWNIFVTSD MLQEILTHTN SSIRHRQTKT AAENSSAETS 181 FYMQETTLCE LKALIALLIL AGLIKSNRQS LKDLWRTDGT GVDIFRTTMS LQRFQFLQNN 241 IRFDDKSTRD ERKQTDNMAA FRSIFDQFVQ CCQNAYSPSE FLTIDEMLLS FRGRCLFRVY 301 IPNKPAKYGI KILALVDAKN DYVVNLEVYA GKQPSGPIAV SNRPFEVVER LIQPVARSHR 361 NVTFDNWFTG YELMLHLLNE YRLTSVGTVR KNKRQIPESF IRTDRQPNSS VFGFQKDITL 421 VSYAPKKNKV VVVMSTMHHD NSIDESTGEK QKPEMITFYN STKAGVDVVD ELCANYNVSR 481 NSKRWPMTLF YGVLNMAAIN ACIIYRTNKN VTIKRTEFIR SLGLSMIYEH LHSRNKKKNI 541 PTILRQRIEK QLGEPSSRHV NVKGRYVRCQ DCPIKKDRKT KRSCNACAKP ICMEHAKFLC 601 ENCAELDSSL (SEQ ID NO: 14634).
[00277] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac hiperativa é mais ativa do que a transposase de SEQ ID NO: 14505. Em certas modalidades, a transposase piggyBac ou semelhante à piggyBac hiperativa é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% ou qualquer percentagem entre estas idêntica a SEQ ID NO: 14505.
[00278] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac hiperativa compreende uma substituição de amino- ácido em uma posição selecionada de 92, 93, 96, 97, 165, 178, 189, 196, 200, 201, 211, 215, 235, 238, 246, 253, 258, 261, 263, 271, 303, 321, 324, 330, 373, 389, 399, 402, 403, 404, 448, 473, 484, 507,5 23, 527, 528, 543, 549, 550, 557,6 01, 605, 607, 609, 610 ou uma combi- nação das mesmas (relativas à SEQ ID NO: 14505). Em certas moda- lidades, a transposase piggyBac ou semelhante à piggyBac hiperativa compreende uma substituição de aminoácido de Q92A, V93L, V93M, P96G, F97H, F97C, H165E, H165W, E178S, E178H, C189P, A196G, L200I, A201Q, L211A, W215Y, G219S, Q235Y, Q235G, Q238L, K246I, K253V, M258V, F261L, S263K, C271S, N303R, F321W, F321D, V324K, V324H, A330V, L373C, L373V, V389L, S399N, R402K, T403L, D404Q, D404S, D404M, N441R, G448W, E449A, V469T, C473Q, R484K T507C, G523A, I527M, Y528K Y543I, E549A, K550M, P557S,
E601V, E605H, E605W, D607H, S609H, L610I ou qualquer combina- ção dos mesmos. Em certas modalidades, a transposase piggyBac ou semelhante à piggyBac hiperativa compreende uma substituição de aminoácido de Q92A, V93L, V93M, P96G, F97H, F97C, H165E, H165W, E178S, E178H, C189P, A196G, L200I, A201Q, L211A, W215Y, G219S, Q235Y, Q235G, Q238L, K246I, K253V, M258V, F261L, S263K, C271S, N303R, F321W, F321D, V324K, V324H, A330V, L373C, L373V, V389L, S399N, R402K, T403L, D404Q, D404S, D404M, N441R, G448W, E449A, V469T, C473Q, R484K T507C, G523A, I527M, Y528K Y543I, E549A, K550M, P557S, E601V, E605H, E605W, D607H, S609H e L610I.
[00279] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac hiperativa compreende um ou mais substituições de um aminoácido que é não tipo selvagem, em que uma ou mais substi- tuições para um aminoácido de tipo selvagem compreende uma subs- tituição de E4X, A12X, M13X,L14X, E15X, D20X, E24X, S25X, S26X, S27X, D32X, H33X, E36X, E44X, E45X, E46X, I48X, D49X, R58X, A62X, N63X, A64X, I65X, I66X, N68X, E69X, D71X, S72X, D76X, P79X, R84X, Q85X, A87X, S88X, Q92X, V93X, S94X, G95X, P96X, F97X, Y98X, T99X, I145X, S149X, D150X, L152X, E154X, T157X, N160X, S161X, S162X, H165X, R166X, T168X, K169X, T170X, A171X, E173X, S175X, S176X, E178X, T179X, M183X, Q184X, T186X, T187X, L188X, C189X, L194X, I195X, A196X, L198X, L200X, A201X, L203X, I204X, K205X, A206X, N207X, Q209X, S210X, L211X, K212X, D213X, L214X, W215X, R216X, T217X, G219X, V222X, D223X, I224X, T227X, M229X, Q235X, L237X, Q238X, N239X, N240X, P302X, N303X, P305X, A306X, K307X, Y308X, I310X, K311X, I312X, L313X, A314X, L315X, V316X,D317X, A318X, K319X, N320X, F321X, Y322X, V323X, V324X, L326X, E327X, V328X, A330X, Q333X, P334X, S335X, G336X, P337X, A339X, V340X, S341X,
N342X, R343X, P344X, F345X, E346X, V347X, E349X, I352X, Q353X, V355X, A356X, R357X, N361X, D365X, W367X, T369X, G370X, L373X, M374X, L375X, H376X, N379X, E380X, R382X, V386X, V389X, N392X, R394X, Q395X, S399X, F400X, I401X, R402XT403X, D404X, R405X, Q406X, P407X, N408X, S409X, S410X, V411X, F412X, F414X, Q415X, I418X, T419X, L420X, N428XV432X, M434X, D440X, N441X, S442X, I443X, D444X, E445X, G448X, E449X, Q451X, K452X, M455X, I456X, T457X, F458X, S461X, A464X, V466X, Q468X, V469X, E471X, L472X, C473X, A474X, K483X, W485X, T488X, L489X, Y491X, G492X, V493X, M496X, I499X, C502X, I503X, T507X, K509X, N510X, V511X, T512X, I513X, R515X, E517X, S521X, G523X, L524X, S525X, I527X, Y528X, E529X, H532X, S533X, N535X, K536X, K537X, N539X, I540X, T542X, Y543X, Q546X, E549X, K550X, Q551X, G553X, E554X, P555X, S556X, P557X, R558X, H559X, V560X, N561X, V562X, P563X, G564X, R565X, Y566X, V567X, Q570X, D571X, P573X, Y574X, K576X, K581X, S583X, A586X, A588X, E594X, F598X, L599X, E601X, N602X, C603X, A604X, E605X, L606X, D607X, S608X, S609X ou L610X (relativos à SEQ ID NO: 14505). Uma lista de substituições de aminoácido hiperativo pode ser encontrada em patente dos Estados Unidos No. 10.041.077, os conteúdos dos quais são incorporados aqui por referência em sua tota- lidade.
[00280] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac é deficiente de integração. Em certas modalidades, uma transposase piggyBac ou semelhante à piggyBac deficiente de integração é uma transposase que pode cortar seu correspondente transposon, porém que integra o transposon cortado em uma frequên- cia menor do que uma correspondente transposase de tipo selvagem. Em certas modalidades, a transposase piggyBac ou semelhante à piggyBac é um variante deficiente de integração de SEQ ID NO:
14505.
[00281] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac deficiente de integração, de excisão competente compreende uma ou mais substituições de um aminoácido que é não tipo selvagem, em que uma ou mais substituições para aminoácido de tipo selvagem compreende uma substituição de R9X, A12X, M13X, D20X, Y21K, D23X, E24X, S25X, S26X, S27X, E28X, E30X, D32X, H33X, E36X, H37X, A39X, Y41X, D42X, T43X, E44X, E45X, E46X, R47X, D49X, S50X, S55X, A62X, N63X, A64X, I66X, A67X, N68X, E69X, D70X, D71X, S72X, D73X, P74X, D75X, D76X, D77X,I78X, S81X,V83X, R84X, Q85X, A87X, S88X, A89X,S90X,R91X, Q92X, V93X, S94X, G95X, P96X, F97X, Y98X, T99X, W012X, G103X, Y107X, K108X, L117X, I122X, Q128X, I312X, D135X, S137X, E139X, Y140X, I145X, S149X, D150X, Q153X, E154X, T157X, S161X, S162X, R164X, H165X, R166X, Q167X, T168X, K169X, T170X, A171X, A172X, E173X, R174X, S175X, S176X, A177X, E178X, T179X, S180X,Y182X, Q184X, E185X, T187X, L188X, C189X, L194X, I195X, A196X, L198X, L200X, A201X, L203X, I204X, K205X, N207X, Q209X, L211X, D213X, L214X, W215X, R216X, T217X, G219X, T220X, V222X, D223X, I224X, T227X, T228X, F234X, Q235X, L237X, Q238X, N239X, N240X, N303X, K304X, I310X, I312X, L313X, A314X, L315X, V316X,D317X, A318X, K319X, N320X, F321X, Y322X, V323X, V324X, N325X, L326X, E327X, V328X, A330X, G331X, K332X, Q333X, S335X, P337X, P344X, F345X, E349X, H359X, N361X, V362X, D365X, F368X, Y371X, E372X, L373X, H376X, E380X, R382X, R382X, V386X, G387X, T388X, V389X, K391X, N392X, R394X, Q395X, E398X, S399X, F400X, I401X, R402XT403X, D404X, R405X, Q406X, P407X, N408X, S409X, S410X, Q415X,K416X, A424X, K426X, N428X, V430X, V432X, V433X, M434X, D436X, D440X, N441X, S442X, I443X, D444X, E445X, S446X, T447X, G448X,
E449X, K450X, Q451X, E454X, M455X, I456X, T457X, F458X, S461X, A464X, V466X, Q468X, V469X, C473X, A474X, N475X, N477X, K483X, R484X, P486X, T488X, L489X, G492X, V493X, M496X, I499X, I503X, Y505X, T507X, N510X, V511X, T512X, I513X, K514X, T516X, E517X, S521X, G523X, L524X, S525X, I527X, Y528X, L531X, H532X, S533X, N535X, I540X, T542X, Y543X, R545X, Q546X, E549X, L552X, G553X, E554X, P555X, S556X, P557X, R558X, H559X, V560X, N561X, V562X, P563X, G564X, V567X, Q570X, D571X, P573X, Y574X, K575X, K576X, N585X, A586X, M593X, K596X, E601X, N602X, A604X, E605X, L606X, D607X, S608X, S609X ou L610X (rela- tivos à SEQ ID NO: 14505). Uma lista de substituições de aminoácido deficiente de integração pode ser encontrada em patente dos Estados Unidos No. 10.041.077, os conteúdos dos quais são incorporados por referência em sua totalidade.
[00282] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac deficiente de integração compreende uma sequên- cia de: 1 MDIERQEERI RAMLEEELSD YSDESSSEDE TDHCSEHEVN YDTEEERIDS VDVPSNSRQE 61 EANAIIANES DSDPDDDLPL SLVRQRASAS RQVSGPFYTS KDGTKWYKNC QRPNVRLRSE 121 NIVTEQAQVK NIARDASTEY ECWNIFVTSD MLQEILTHTN SSIRHRQTKT AAENSSAETS 181 FYMQETTLCE LKALIALLIL AGLIKSNRQS LKDLWRKDGT GVDIFRTTMS LQRFQFLLNN 241 IRFDDISTRD ERKQTDNMAA FRSIFDQFVQ CCQNAYSPSE FLTIDEMLLS FRGRCLFRVY 301 IPNKPAKYGI KILALVDAKN FYVVNLEVYA GKQPSGPIAV SNRPFEVVER LIQPVARSHR 361 NVTFDNWFTG YELMLHLLNE YRLTSVGTVR KNKRQIPESF IRTDRQPNSS VFGFQKDITL 421 VSYAPKKNKV VVVMSTMHHD NSIDESTGEK QKPEMITFYN STKAGVDVVD ELCANYNVSR 481 NSKKWPMTLF YGVLNMAAIN ACIIYRTNKN VTIKRTEFIR SLGLSMMYEH LHSRNKKKNI 541 PTILRQRIEK QLGEPVPRHV NVPGRYVRCQ DCPIKKDRKT KRSCNACAKP ICMEHAKFLC 601 ENCAELDSSL (SEQ ID NO: 14606).
[00283] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac deficiente de integração compreende uma sequên- cia de: 1 MDIERQEERI RAMLEEELSD YSDESSSEDE TDHCSEHEVN YDTEEERIDS VDVPSNSRQE 61 EANAIIANES DSDPDDDLPL SLVRQRASAS RQVSGPFYTS KDGTKWYKNC QRPNVRLRSE 121 NIVTEQAQVK NIARDASTEY ECWNIFVTSD MLQEILTHTN SSIRHRQTKT AAENSSAETS 181 FYMQETTLCE LKALIGLLIL AGLIKSNRQS LKDLWRTDGT GVDIFRTTMS LQRFYFLQNN
241 IRFDDKSTLD ERKQTDNMAA FRSIFDQFVQ SCQNAYSPSE FLTIDEMLLS FRGRCLFRVY 301 IPNKPAKYGI KILALVDAKN FYVVNLEVYA GKQPSGPIAV SNRPFEVVER LIQPVARSHR 361 NVTFDNWFTG YELMLHLLNE YRLTSVGTVR KNKRQIPESF IRTDRQPNSS VFGFQKDITL 421 VSYAPKKNKV VVVMSTMHHD NSIDESTGEK QKPEMITFYN STKAGVDVVD ELCANYNVSR 481 NSKRWPMTLF YGVLNMAAIN ACIIYRTNKN VTIKRTEFIR SLGLSMIYEH LHSRNKKKNI 541 PTILRQRIEK QLGEPSPRHV NYPGRYVRCQ DCPIKKDRKT KRSCNACAKP ICMEHAKFLC 601 VNCAELDSSL (SEQ ID NO: 14607).
[00284] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac que é deficiente de integração compreende uma se- quência de: 1 MDIERQEERI RAMLEEELSD YSDESSSEDE TDHCSEHEVN YDTEEERIDS VDVPSNSRQE 61 EANAIIANES DSDPDDDLPL SLVRQRASAS RQVSGPFYTS KDGTKWYKNC QRPNVRLRSE 121 NIVTEQAQVK NIARDASTEY ECWNIFVTSD MLQEILTHTN SSIRHRQTKT AAENSSAETS 181 FYMQETTLCE LKALIALLIL AGLIKSNRQS LKDLWRKDGT GVDIFRTTMS LQRFQFLLNN 241 IRFDDKSTRD ERKQTDNMAA FRSIFDQFVQ CCQNAYSPSE FLTIDEMLLS FRGRCLFRVY 301 IPNKPAKYGI KILALVDAKN DYVVNLEVYA GKQPSGPIAV SNRPFEVVER LIQPVARSHR 361 NVTFDNWFTG YECMLHLLNE YRLTSVGTVR KNKRQIPESF IRTDRQPNSS VFGFQKDITL 421 VSYAPKKNKV VVVMSTMHHD NSIDESTGEK QKPEMITFYN STKAGVDVVD ELCANYNVSR 481 NSKKWPMTLF YGVLNMAAIN ACIIYRTNKN VTIKRTEFIR SLGLSMIKEH LHSRNKKKNI 541 PTILRQRIEK QLGEPSPRHV NVPGRYVRCQ DCPIKKDRKT KRSCNACAKP ICMEHAKFLC 601 ENCAELDSSL (SEQ ID NO: 14608).
[00285] Em certas modalidades, a transposase deficiente de inte- gração compreende uma sequência que é pelo menos 90% idêntica à SEQ ID NO: 14608.
[00286] Em certas modalidades, o transposon piggyBac ou seme- lhante a piggyBac é isolado ou derivado de Bombyx mori. Em certas modalidades, o transposon piggyBac ou semelhante a piggyBac com- preende uma sequência de: 1 ttatcccggc gagcatgagg cagggtatct cataccctgg taaaatttta aagttgtgta 61 ttttataaaa ttttcgtctg acaacactag cgcgctcagt agctggaggc aggagcgtgc 121 gggaggggat agtggcgtga tcgcagtgtg gcacgggaca ccggcgagat attcgtgtgc 181 aaacctgttt cgggtatgtt ataccctgcc tcattgttga cgtatttttt ttatgtaatt 241 tttccgatta ttaatttcaa ctgttttatt ggtattttta tgttatccat tgttcttttt 301 ttatgattta ctgtatcggt tgtctttcgt tcctttagtt gagttttttt ttattatttt 361 cagtttttga tcaaa (SEQ ID NO: 14506).
[00287] Em certas modalidades, o transposon piggyBac ou seme- lhante a piggyBac compreende uma sequência de: 1 tcatattttt agtttaaaaa aataattata tgttttataa tgaaaagaat ctcattatct 61 ttcagtatta ggttgattta tattccaaag aataatattt ttgttaaatt gttgattttt
121 gtaaacctct aaatgtttgt tgctaaaatt actgtgttta agaaaaagat taataaataa 181 taataatttc ataattaaaa acttctttca ttgaatgcca ttaaataaac cattatttta 241 caaaataaga tcaacataat tgagtaaata ataataagaa caatattata gtacaacaaa 301 atatgggtat gtcataccct gccacattct tgatgtaact ttttttcacc tcatgctcgc 361 cgggttat (SEQ ID NO: 14507).
[00288] Em certas modalidades, o transposon piggyBac ou seme- lhante a piggyBac compreende uma sequência de: 1 ttatcccggc gagcatgagg cagggtatct cataccctgg taaaatttta aagttgtgta 61 ttttataaaa ttttcgtctg acaacactag cgcgctcagt agctggaggc aggagcgtgc 121 gggaggggat agtggcgtga tcgcagtgtg gcacgggaca ccggcgagat attcgtgtgc 181 aaacctgttt cgggtatgtt ataccctgcc tcat (SEQ ID NO: 14508).
[00289] Em certas modalidades, o transposon piggyBac™ (PB) ou semelhante à piggyBac compreende uma sequência de: 1 taaataataa taatttcata attaaaaact tctttcattg aatgccatta aataaaccat 61 tattttacaa aataagatca acataattga gtaaataata ataagaacaa tattatagta 121 caacaaaata tgggtatgtc ataccctgcc acattcttga tgtaactttt tttcacctca 181 tgctcgccgg gttat (SEQ ID NO: 14509).
[00290] Em certas modalidades, o transposon piggyBac ou seme- lhante a piggyBac compreende uma sequência 5’ correspondendo à SEQ ID NO: 14506 e uma sequência 3’ correspondendo à SEQ ID NO:
14507. Em certas modalidades, uma extremidade de transposon piggyBac ou semelhante à piggyBac é pelo menos 85%, pelo menos 90%, pelo menos 95%, pelo menos 98%, pelo menos 99% idêntica ou qualquer percentagem entre estas idêntica à SEQ ID NO: 14506 e a outra extremidade de transposon piggyBac ou semelhante à piggyBac é pelo menos 85%, pelo menos 90%, pelo menos 95%, pelo menos 98%, pelo menos 99% ou qualquer percentagem entre estas idêntica à SEQ ID NO: 14507. Em certas modalidades, o transposon piggyBac ou semelhante a piggyBac compreende SEQ ID NO: 14506 e SEQ ID NO: 14507 ou SEQ ID NO: 14509. Em certas modalidades, o transpo- son piggyBac ou semelhante à piggyBac compreende SEQ ID NO: 14508 e SEQ ID NO: 14507 ou SEQ ID NO: 14509. Em certas modali- dades, as extremidades transposon 5’ e 3’ dividem uma sequência de repetição de 16 bp em suas extremidades de CCCGGCGAG- CATGAGG (SEQ ID NO: 14510) imediatamente adjacentes ao sítio de inserção de alvo 5'-TTAT-3, que é invertido na orientação nas duas extremidades. Em certas modalidades, extremidade de transposon 5’ começa com uma sequência compreendendo 5'- TTATCCCGGCGAGCATGAGG-3 (SEQ ID NO: 14511), e as extremi- dades transposon 3’ com uma sequência compreendendo o comple- mento reverso desta sequência: 5'-CCTCATGCTCGCCGGGTTAT-3' (SEQ ID NO: 14512).
[00291] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma extremidade compreendendo pelo menos 14, 16, 18, 20, 30 ou 40 nucleotídeos contíguos de SEQ ID NO: 14506 ou SEQ ID NO: 14508. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma extremidade compreendendo pelo menos 14, 16, 18, 20, 30 ou 40 nucleotídeos contíguos de SEQ ID NO: 14507 ou SEQ ID NO: 14509. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac com- preende uma extremidade com pelo menos 90% de identidade para SEQ ID NO: 14506 ou SEQ ID NO: 14508. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma ex- tremidade com pelo menos 90% de identidade para SEQ ID NO: 14507 ou SEQ ID NO: 14509,
[00292] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 ttaacccggc gagcatgagg cagggtatct cataccctgg taaaatttta aagttgtgta 61 ttttataaaa ttttcgtctg acaacactag cgcgctcagt agctggaggc aggagcgtgc 121 gggaggggat agtggcgtga tcgcagtgtg gcacgggaca ccggcgagat attcgtgtgc 181 aaacctgttt cgggtatgtt ataccctgcc tcattgttga cgtatttttt ttatgtaatt 241 tttccgatta ttaatttcaa ctgttttatt ggtattttta tgttatccat tgttcttttt 301 ttatgattta ctgtatcggt tgtctttcgt tcctttagtt gagttttttt ttattatttt 361 cagtttttga tcaaa (SEQ ID NO: 14515).
[00293] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 tcatattttt agtttaaaaa aataattata tgttttataa tgaaaagaat ctcattatct 61 ttcagtatta ggttgattta tattccaaag aataatattt ttgttaaatt gttgattttt
121 gtaaacctct aaatgtttgt tgctaaaatt actgtgttta agaaaaagat taataaataa 181 taataatttc ataattaaaa acttctttca ttgaatgcca ttaaataatt cattatttta 241 caaaataaga tcaacataat tgagtaaata ataataagaa caatattata gtacaacaaa 301 atatgggtat gtcataccct tttttttttt tttttttttt ttttttcggg tagagggccg 361 aacctcctac gaggtccccg cgcaaaaggg gcgcgcgggg tatgtgagac tcaacgatct 421 gcatggtgtt gtgagcagac cgcgggccca aggattttag agcccaccca ctaaacgact 481 cctctgcact cttacacccg acgtccgatc ccctccgagg tcagaacccg gatgaggtag 541 gggggctacc gcggtcaaca ctacaaccag acggcgcggc tcaccccaag gacgcccagc 601 cgacggagcc ttcgaggcga atcgaaggct ctgaaacgtc ggccgtctcg gtacggcagc 661 ccgtcgggcc gcccagacgg tgccgctggt gtcccggaat accccgctgg accagaacca 721 gcctgccggg tcgggacgcg atacaccgtc gaccggtcgc tctaatcact ccacggcagc 781 gcgctagagt gctggta (SEQ ID NO: 14516).
[00294] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de CCCGGCGAG- CATGAGG (SEQ ID NO: 14510). Em certas modalidades, o transpo- son piggyBac ou semelhante à piggyBac compreende uma sequência ITR de SEQ ID NO: 14510. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência de TTATCCCGGCGAGCATGAGG (SEQ ID NO: 14511). Em certas mo- dalidades, o transposon piggyBac ou semelhante à piggyBac compre- ende pelo menos 16 nucleotídeos contíguos de SEQ ID NO: 14511. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência de CCTCATGCTCGCCGGGT- TAT (SEQ ID NO: 14512). Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende pelo menos 16 nu- cleotídeos contíguos de SEQ ID NO: 14512. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma ex- tremidade compreendendo pelo menos 16 nucleotídeos contíguos de SEQ ID NO: 14511 e uma extremidade compreendendo pelo menos 16 nucleotídeos contíguos de SEQ ID NO: 14512. Em certas modali- dades, o transposon piggyBac ou semelhante à piggyBac compreende SEQ ID NO: 14511 e SEQ ID NO: 14512. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma se- quência de TTAACCCGGCGAGCATGAGG (SEQ ID NO: 14513). Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência de CCTCATGCTCGCCGGGTTAA (SEQ ID NO: 14514).
[00295] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac pode ter extremidades compreendendo SEQ ID NO: 14506 e SEQ ID NO: 14507, ou um variante de qualquer um destes tendo pelo menos 90% de identidade de sequência para SEQ ID NO: 14506 ou SEQ ID NO: 14507, e a transposase piggyBac ou semelhan- te à piggyBac tem a sequência de SEQ ID NO: 14504 ou SEQ ID NO: 14505, ou uma sequência de pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer porcentagem entre a identidade para SEQ ID NO: 14504 ou SEQ ID NO: 14505. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende um poli- nucleotídeo heterólogo inserido entre um par de repetições invertidas, onde o transposon é capaz de transposição por uma transposase piggyBac ou semelhante à piggyBac tendo pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer porcentagem entre a identi- dade para SEQ ID NO: 14504 ou SEQ ID NO: 14505. Em certas mo- dalidades, o transposon compreende duas extremidades transposon, cada das quais compreende SEQ ID NO: 14510 em orientações inver- tidas nas duas extremidades transposon. Em certas modalidades, ca- da repetição terminal invertida (ITR) é pelo menos 90% idêntica à SEQ ID NO: 14510,
[00296] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é capaz de inserção por uma transposase piggyBac ou semelhante à piggyBac na sequência 5'-TTAT-3 dentro de um ácido nucleico alvo. Em certas modalidades, uma extremidade do transpo- son piggyBac ou semelhante à piggyBac compreende pelo menos 16 nucleotídeos contíguos de SEQ ID NO: 14506 e a outra extremidade de transposon compreende pelo menos 16 nucleotídeos contíguos de SEQ ID NO: 14507. Em certas modalidades, uma extremidade do transposon piggyBac ou semelhante à piggyBac compreende pelo menos 17, pelo menos 18, pelo menos 19, pelo menos 20, pelo menos 22, pelo menos 25, pelo menos 30 nucleotídeos contíguos de SEQ ID NO: 14506 e a outra extremidade de transposon compreende pelo menos 17, pelo menos 18, pelo menos 19, pelo menos 20, pelo menos 22, pelo menos 25, pelo menos 30 nucleotídeos contíguos de SEQ ID NO: 14507,
[00297] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende extremidades transposon (cada extre- midade compreendendo uma ITR) correspondendo à SEQ ID NO: 14506 e SEQ ID NO: 14507, e tem uma sequência alvo corresponden- do à 5'-TTAT3'. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac também compreende uma sequência codifi- cando um transposase (por exemplo, SEQ ID NO: 14505). Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac com- preende uma extremidade de transposon correspondendo à SEQ ID NO: 14506 e uma segunda extremidade de transposon corresponden- do à SEQ ID NO: 14516. SEQ ID NO: 14516 é muito similar à SEQ ID NO: 14507, porém tem uma inserção grande um pouco antes da ITR. Embora as sequências de ITR para as duas extremidades transposon sejam idênticas (elas são idênticas à SEQ ID NO: 14510), elas têm diferentes sequências alvo: o segundo transposon tem uma sequência alvo correspondendo à 5'-TTAA-3', fornecendo evidência de que ne- nhuma mudança na sequência de ITR é necessária para modificar a especificidade de sequência alvo. A transposase piggyBac ou seme- lhante à piggyBac (SEQ ID NO: 14504), que é associada com o sítio alvo 5'-TTAA-3’ difere da transposase associada a 5'-TTAT-3' (SEQ ID
NO: 14505) por somente 4 mudanças de aminoácido (D322Y, S473C, A507T, H582R). Em certas modalidades, a transposase piggyBac ou semelhante à piggyBac (SEQ ID NO: 14504), que é associada com o sítio alvo 5'-TTAA-3’ é menos ativa do que a transposase piggyBac ou semelhante à piggyBac associada a 5'-TTAT-3' (SEQ ID NO: 14505) sobre o transposon com extremidades 5'-TTAT-3'. Em certas modali- dades, transposons piggyBac ou semelhantes à piggyBac com sítios alvo 5’-TTAA-3’ podem ser convertidos em transposases piggyBac ou semelhantes à piggyBac com sítios alvo 5’-TTAT-3 substituindo sítios alvo 5’-TTAA-3’ com 5'-TTAT-3'. Tais transposons podem ser usados com uma transposase piggyBac ou semelhante à piggyBac, tal como, SEQ ID NO: 14504 que reconhece a sequência alvo 5’-TTAT-3’, ou com uma variante da transposase originalmente associada com o transposon 5'-TTAA-3'. Em certas modalidades, a similaridade elevada entre as transposases piggyBac ou semelhantes a piggyBac 5'-TTAA- 3' e 5'-TTAT-3' demonstra que muitas mudanças para a sequência de aminoácido de uma transposase piggyBac ou semelhante à piggyBac alteram especificidade de sequência alvo.
Em certas modalidades, modificação de qualquer sistema de transferência de gene transposon- transposase piggyBac ou semelhante à piggyBac, em que sequências alvo 5'-TTAA-3’ são substituídas com sequências alvo 5'-TTAT-3', as ITRs permanecem as mesmas, e a transposase é a transposase piggyBac ou semelhante à piggyBac original ou uma variante da mes- ma resultante do uso de uma mutagênese de nível baixo para introdu- zir mutações em uma transposase.
Em certas modalidades, sistemas de transferência de transposon-transposase piggyBac ou semelhante à piggyBac podem ser formados por uma modificação de um sistema de transferência de gene transposon-transposase piggyBac ou seme- lhante à piggyBac ativo por 5'-TTAT-3' em que sequências alvo 5'- TTAT-3’ são substituídas com sequências alvo 5'-TTAA-3'-, as ITRs permanecem as mesmas, e a transposase piggyBac ou semelhante à piggyBac é a transposase original ou uma variante da mesma.
[00298] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é isolado ou derivado de Bombyx mori. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac com- preende uma sequência de: 1 cccggcgagc atgaggcagg gtatctcata ccctggtaaa attttaaagt tgtgtatttt 61 ataaaatttt cgtctgacaa cactagcgcg ctcagtagct ggaggcagga gcgtgcggga 121 ggggatagtg gcgtgatcgc agtgtggcac gggacaccgg cgagatattc gtgtgcaaac 181 ctgtttcggg tatgttatac cctgcctcat tgttgacgta t (SEQ ID NO: 14577).
[00299] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 tttaagaaaa agattaataa ataataataa tttcataatt aaaaacttct ttcattgaat 61 gccattaaat aaaccattat tttacaaaat aagatcaaca taattgagta aataataata 121 agaacaatat tatagtacaa caaaatatgg gtatgtcata ccctgccaca ttcttgatgt 181 aacttttttt cacctcatgc tcgccggg (SEQ ID NO: 14578).
[00300] Em certas modalidades, o transposon compreende pelo menos 16 bases contíguas de SEQ ID NO: 14577 e pelo menos 16 bases contíguas de SEQ ID NO: 14578, e repetições terminais inverti- das que são pelo menos 87% idênticos à CCCGGCGAGCATGAGG (SEQ ID NO: 14510).
[00301] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 cccggcgagc atgaggcagg gtatctcata ccctggtaaa attttaaagt tgtgtatttt 61 ataaaatttt cgtctgacaa cactagcgcg ctcagtagct ggaggcagga gcgtgcggga 121 ggggatagtg gcgtgatcgc agtgtggcac gggacaccgg cgagatattc gtgtgcaaac 181 ctgtttcggg tatgttatac cctgcctcat tgttgacgta ttttttttat gtaatttttc 241 cgattattaa tttcaactgt tttattggta tttttatgtt atccattgtt ctttttttat 301 gatttactgt atcggttgtc tttcgttcct ttagttgagt ttttttttat tattttcagt 361 ttttgatcaa a (SEQ ID NO: 14595).
[00302] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 tcatattttt agtttaaaaa aataattata tgttttataa tgaaaagaat ctcattatct 61 ttcagtatta ggttgattta tattccaaag aataatattt ttgttaaatt gttgattttt 121 gtaaacctct aaatgtttgt tgctaaaatt actgtgttta agaaaaagat taataaataa 181 taataatttc ataattaaaa acttctttca ttgaatgcca ttaaataaac cattatttta 241 caaaataaga tcaacataat tgagtaaata ataataagaa caatattata gtacaacaaa
301 atatgggtat gtcataccct gccacattct tgatgtaact ttttttcacc tcatgctcgc 361 cggg (SEQ ID NO: 14596).
[00303] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende SEQ ID NO: 14595 e SEQ ID NO: 14596, e é transposto por uma transposase piggyBac ou semelhante à piggyBac de SEQ ID NO: 14505. Em certas modalidades, as ITRs de SEQ ID NO: 14595 e SEQ ID: 14596 não são flanqueadas por uma sequência 5’-TTAA-3’. Em certas modalidades, as ITRs de SEQ ID NO: 14595 e SEQ ID: 14596 são flanqueadas por uma sequência 5’- TTAT-3’.
[00304] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 cccggcgagc atgaggcagg gtatctcata ccctggtaaa attttaaagt tgtgtatttt 61 ataaaatttt cgtctgacaa cactagcgcg ctcagtagct ggaggcagga gcgtgcggga 121 ggggatagtg gcgtgatcgc agtgtggcac gggacaccgg cgagatattc gtgtgcaaac 181 ctgtttcggg tatgttatac cctgcctcat tgttgacgta ttttttttat gtaatttttc 241 cgattattaa tttcaactgt tttattggta tttttatgtt atccattgtt ctttttttat 301 g (SEQ ID NO: 14597).
[00305] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 cagggtatct cataccctgg taaaatttta aagttgtgta ttttataaaa ttttcgtctg 61 acaacactag cgcgctcagt agctggaggc aggagcgtgc gggaggggat agtggcgtga 121 tcgcagtgtg gcacgggaca ccggcgagat attcgtgtgc aaacctgttt cgggtatgtt 181 ataccctgcc tcattgttga cgtatttttt ttatgtaatt tttccgatta ttaatttcaa 241 ctgttttatt ggtattttta tgttatccat tgttcttttt ttatg (SEQ ID NO: 14598).
[00306] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 cagggtatct cataccctgg taaaatttta aagttgtgta ttttataaaa ttttcgtctg 61 acaacactag cgcgctcagt agctggaggc aggagcgtgc gggaggggat agtggcgtga 121 tcgcagtgtg gcacgggaca ccggcgagat attcgtgtgc aaacctgttt cgggtatgtt 181 ataccctgcc tcattgttga cgtat (SEQ ID NO: 14599).
[00307] Em certas modalidades, a extremidade 5’ do transposon piggyBac ou semelhante à piggyBac compreende uma sequência de SEQ ID NO: 14577, SEQ ID NO: 14595, ou SEQ ID NOs: 14597-
14599. Em certas modalidades, a extremidade 5’ do transposon piggyBac ou semelhante à piggyBac é precedida por uma sequência alvo 5’.
[00308] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 tcatattttt agtttaaaaa aataattata tgttttataa tgaaaagaat ctcattatct 61 ttcagtatta ggttgattta tattccaaag aataatattt ttgttaaatt gttgattttt 121 gtaaacctct aaatgtttgt tgctaaaatt actgtgttta agaaaaagat taataaataa 181 taataatttc ataattaaaa acttctttca ttgaatgcca ttaaataaac cattatttta 241 caaaataaga tcaacataat tgagtaaata ataataagaa caatattata gtacaacaaa 301 atatgggtat gtcataccct gccacattct tgatgtaact ttttttcacc tcatgctcgc 361 cggg (SEQ ID NO: 14600).
[00309] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 tttaagaaaa agattaataa ataataataa tttcataatt aaaaacttct ttcattgaat 61 gccattaaat aaaccattat tttacaaaat aagatcaaca taattgagta aataataata 121 agaacaatat tatagtacaa caaaatatgg gtatgtcata ccctgccaca ttcttgatgt 181 aacttttttt ca (SEQ ID NO: 14601).
[00310] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 cccggcgagc atgaggcagg gtatctcata ccctggtaaa attttaaagt tgtgtatttt 61 ataaaatttt cgtctgacaa cactagcgcg ctcagtagct ggaggcagga gcgtgcggga 121 ggggatagtg gcgtgatcgc agtgtggcac gggacaccgg cgagatattc gtgtgcaaac 181 ctgtttcggg tatgttatac cctgcctcat tgttgacgta ttttttttat gtaatttttc 241 cgattattaa tttcaactgt tttattggta tttttatgtt atccattgtt ctttttttat 301 gatttactgt atcggttgtc tttcgttcct ttagttgagt ttttttttat tattttcagt 361 ttttgatcaa a (SEQ ID NO: 14602).
[00311] Em certas modalidades, a extremidade 3’ do transposon piggyBac ou semelhante à piggyBac compreende uma sequência de SEQ ID NO: 14578, SEQ ID NO: 14596, ou SEQ ID NOs: 14600-
14601. Em certas modalidades, a extremidade 3’ do transposon piggyBac ou semelhante à piggyBac é seguida por uma sequência al- vo 3’. Em certas modalidades, o transposon é transposto por uma transposase de SEQ ID NO: 14505. Em certas modalidades, as extre- midades 5’ e 3’ do transposon piggyBac ou semelhante à piggyBac dividem uma sequência de repetição de 16 bp de SEQ ID NO: 14510 em orientação invertida e imediatamente adjacente à sequência alvo. Em certas modalidades, a extremidade 5’ de transposon começa com
SEQ ID NO: 14510, e a extremidade 3’ de extremidades transposon com o complemento reverso de SEQ ID NO: 14510, 5’- CCTCATG- CTCGCCGGG-3’ (SEQ ID NO: 14603). Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma ITR com pelo menos 93%, pelo menos 87%, ou pelo menos 81% ou qual- quer porcentagem entre a identidade para SEQ ID NO: 14510 ou SEQ ID NO: 14603. Em certas modalidades, o transposon piggyBac ou se- melhante à piggyBac compreende uma sequência alvo seguida por uma extremidade 5’ de transposon compreendendo uma sequência selecionada de SEQ ID NOs: 14577, 14595 ou 14597 e uma extremi- dade 3’ de transposon compreendendo SEQ ID NO: 14578 ou 14596 seguidas por uma sequência alvo. Em certas modalidades, o transpo- son piggyBac ou semelhante à piggyBac compreende uma extremida- de que compreende uma sequência que é pelo menos 90%, pelo me- nos 95% ou pelo menos 99% ou qualquer percentagem entre estas idêntica à SEQ ID NO: 14577 e uma extremidade que compreende uma sequência que é pelo menos 90%, pelo menos 95% ou pelo me- nos 99% ou qualquer percentagem entre estas idêntica à SEQ ID NO:
14578. Em certas modalidades, uma extremidade de transposon com- preende pelo menos 14, pelo menos 16, pelo menos 18 ou pelo menos 20 bases contíguas de SEQ ID NO: 14577 e uma extremidade de transposon compreende pelo menos 14, pelo menos 16, pelo menos 18 ou pelo menos 20 bases contíguas de SEQ ID NO: 14578.
[00312] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende duas extremidades transposon em que cada extremidade transposon compreende uma sequência que é pelo menos 81% idêntica, pelo menos 87% idêntica ou pelo menos 93% idêntica ou qualquer percentagem entre estas idêntica à SEQ ID NO: 14510 em orientação invertida nas duas extremidades transposon. Uma extremidade pode também compreender pelo menos 14, pelo menos 16, pelo menos 18 ou pelo menos 20 bases contíguas de SEQ ID NO: 14599, e a outra extremidade pode também compreender pelo menos 14, pelo menos 16, pelo menos 18 ou pelo menos 20 bases contíguas de SEQ ID NO: 14601. O transposon piggyBac ou seme- lhante à piggyBac pode ser transposto por uma transposase de SEQ ID NO: 14505, e a transposase pode opcionalmente ser fundida a um sinal de localização nuclear.
[00313] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende SEQ ID NO: 14595 e SEQ ID NO: 14596 e a transposase piggyBac ou semelhante à piggyBac compre- ende SEQ ID NO: 14504 ou SEQ ID NO: 14505. Em certas modalida- des, o transposon piggyBac ou semelhante à piggyBac compreende SEQ ID NO: 14597 e SEQ ID NO: 14596 e a transposase piggyBac ou semelhante à piggyBac compreende SEQ ID NO: 14504 ou SEQ ID NO: 14505. Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende SEQ ID NO: 14595 e SEQ ID NO: 14578 e a transposase piggyBac ou semelhante à piggyBac compre- ende SEQ ID NO: 14504 ou SEQ ID NO: 14505. Em certas modalida- des, o transposon piggyBac ou semelhante à piggyBac compreende SEQ ID NO: 14602 e SEQ ID NO: 14600 e a transposase piggyBac ou semelhante à piggyBac compreende SEQ ID NO: 14504 ou SEQ ID NO: 14505.
[00314] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma extremidade 5’ compreendendo 1, 2, 3, 4, 5, 6, ou 7 sequências selecionadas de ATGAGGCAGGGTAT (SEQ ID NO: 14614), ATACCCTGCCTCAT (SEQ ID NO: 14615), GGCAGGGTAT (SEQ ID NO: 14616), ATACCCTGCC (SEQ ID NO: 14617), TAAAATTTTA (SEQ ID NO: 14618), ATTTTATAAAAT (SEQ ID NO: 14619), TCATACCCTG (SEQ ID NO: 14620) e TAAATAATAA- TAA (SEQ ID NO: 14621). Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma extremidade 3’ compreendendo 1, 2 ou 3 sequências selecionadas de SEQ ID NO: 14617, SEQ ID NO: 14620 e SEQ ID NO: 14621,
[00315] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac ou seme- lhante à piggyBac. Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de Xenopus tropicalis. A enzima transposase piggyBac ou semelhante à piggyBac pode compreender ou consistir em uma sequência de aminoácido de pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idêntica a: 1 MAKRFYSAEE AAAHCMASSS EEFSGSDSEY VPPASESDSS TEESWCSSST VSALEEPMEV 61 DEDVDDLEDQ EAGDRADAAA GGEPAWGPPC NFPPEIPPFT TVPGVKVDTS NFEPINFFQL 121 FMTEAILQDM VLYTNVYAEQ ILTQNPLPRY ARAHAWHPTD IAEMKRFVGL TLAMGLIKAN 181 SLESYWDTTT VLSIPVFSAT MSRNRYQLLL RFLHFNNNAT AVPPDQPGHD RLHKLRPLID 241 SLSERFAAVY TPCQNICIDE SLLLFKGRLQ FRQYIPSKRA RYGIKFYKLC ESSSGYTSYF 301 LIYEGKDSKL DPPGCPPDLT VSGKIVWELI SPLLGQGFHL YVDNFYSSIP LFTALYCLDT 361 PACGTINRNR KGLPRALLDK KLNRGETYAL RKNELLAIKF FDKKNVFMLT SIHDESVIRE 421 QRVGRPPKNK PLCSKEYSKY MGGVDRTDQL QHYYNATRKT RAWYKKVGIY LIQMALRNSY 481 IVYKAAVPGP KLSYYKYQLQ ILPALLFGGV EEQTVPEMPP SDNVARLIGK HFIDTLPPTP 541 GKQRPQKGCK VCRKRGIRRD TRYYCPKCPR NPGLCFKPCF EIYHTQLHY (SEQ ID NO: 14517).
[00316] Em algumas modalidades, a transposase piggyBac ou se- melhante à piggyBac é uma variante hiperativa de SEQ ID NO: 14517. Em certas modalidades, a transposase piggyBac ou semelhante à piggyBac é uma variante com defeito de integração de SEQ ID NO:
14517. A enzima transposase piggyBac ou semelhante à piggyBac pode compreender ou consistir em uma sequência de aminoácido de pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idêntica a: 1 MAKRFYSAEE AAAHCMAPSS EEFSGSDSEY VPPASESDSS TEESWCSSST VSALEEPMEV 61 DEDVDDLEDQ EAGDRADAAA GGEPAWGPPC NFPPEIPPFT TVPGVKVDTS NFEPINFFQL 121 FMTEAILQDM VLYTNVYAEQ ILTQNPLPRY ARAHAWHPTD IAEMKRFVGL TLAMGLIKAN
181 SLESYWNTTT VLSIPVFSAT MSRNRYQLLL RFLHFNNNAT AVPPDQPDHD RLHKLRPLID 241 SLSERFAAVY TPCQNICIDE SLLLFKGRLR FRQYIPSKRA RYGIKFYKLC ESSSGYTSYF 301 LIYEGKDSKL DPPGCPPDLT VSGKIVWELI SPLLGQGFHL YVDNFYSSIP LFTALYCLDT 361 PACGTINRTR KGLPRALLDK KLNRGETYAL RKNELLAIKF FDKKNVFMLT SIHDESVIRE 421 QRVGRPPKNK PLCSKEYSKY MGGVDRTDQL QHYYNATRKT SAWYKKVGIY LIQMALRNSY 481 IVYKAAVPGP KLSYYKYQLQ ILPALLFGGV EEQTVPEMLP SDNVARLIGK HFIDTLPPTP 541 GKQRPQKGCK VCRKRGIRRD TRYYCPKCPR NPGLCFKPCF EIYHTQLHY (SEQ ID NO: 14518).
[00317] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac é isolada ou derivada de Xenopus tropicalis. Em certas modalidades, a transposase piggyBac ou semelhante à piggyBac é uma transposase piggyBac ou semelhante à piggyBac hi- perativa. Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac hiperativa compreende uma sequência pelo menos 90% idêntica à: 1 MAKRFYSAEE AAAHCSASSS EEFSGSDSEY VPPASESDSS TEESWCSSST VSALEEPMEV 61 DEDVDDLEDQ EAGDRADAAA GGEPAWGPPC NFPPEIPPFT TVPGVKVDTS NFEPINFFQL 121 FMTEAILQDM VLYTNVYAEQ ILTQNPLTRG ARAHAWHPTD IAEMKRFVGL TLAMGLIKAN 181 SIESYWDTTT VLSIPVFGAT MSRNRYQLLL RFLHFNNNAT AVPPDQPGHD RLHKLRPLID 241 SLSERFANVY TPCQNICIDE SLMLFKGRLQ FRQYIPSKRA RYGIKFYKLC ESSTGYTSYF 301 LIYEGKDSKL DPPGCPPDLT VSGKIVWELI SPLLGQGFHL YVDNFYSSIP LFTALYCLNT 361 PACGTINRNR KGLPRALLDK KLNRGETYAL RKNELLAIKF FDKKNVFMLT SIHDESVIRE 421 QRVGRPPKNK PLCSKEYSKY MGGVDRTDQL QHYYNATRKT RHWYKKVGIY LIQMALRNSY 481 IVYKAAVPGP KLSYYKYQLQ ILPALLFGGV EEQTVPEMPD SDNVARLIGK HFIDTLPPTP 541 GKQRPQKGCK VCRKRGIRRD TRYYCPKCPR NPGLCRKPCF EIYHTQLHY (SEQ ID NO: 14572).
[00318] Em certas modalidades, transposase piggyBac ou seme- lhante à piggyBac é uma transposase piggyBac ou semelhante à piggyBac hiperativa. A transposase piggyBac ou semelhante à piggyBac hiperativa é uma transposase que é mais ativa do que a va- riante de ocorrência natural da qual ela é derivada. Em certas modali- dades, a transposase piggyBac ou semelhante à piggyBac hiperativa é mais ativa do que a transposase de SEQ ID NO: 14517. Em certas modalidades, a transposase piggyBac ou semelhante à piggyBac hipe- rativa compreende uma sequência de: 1 MAKRFYSAEE AAAHCSASSS EEFSGSDSEY VPPASESDSS TEESWCSSST VSALEEPMEV 61 DEDVDDLEDQ EAGDRADAAA GGEPAWGPPC NFPPEIPPFT TVPGVKVDTS NFEPINFFQL
121 FMTEAILQDM VLYTNVYAEQ ILTQNPLTRG ARAHAWHPTD IAEMKRFVGL TLAMGLIKAN 181 SIESYWDTTT VLSIPVFGAT MSRNRYQLLL RFLHFNNNAT AVPPDQPGHD RLHKLRPLID 241 SLSERFANVY TPCQNICIDE SLMLFKGRLQ FRQYIPSKRA RYGIKFYKLC ESSTGYTSYF 301 LIYEGKDSKL DPPGCPPDLT VSGKIVWELI SPLLGQGFHL YVDNFYSSIP LFTALYCLNT 361 PACGTINRNR KGLPRALLDK KLNRGETYAL RKNELLAIKF FDKKNVFMLT SIHDESVIRE 421 QRVGRPPKNK PLCSKEYSKY MGGVDRTDQL QHYYNATRKT RHWYKKVGIY LIQMALRNSY 481 IVYKAAVPGP KLSYYKYQLQ ILPALLFGGV EEQTVPEMPD SDNVARLIGK HFIDTLPPTP 541 GKQRPQKGCK VCRKRGIRRD TRYYCPKCPR NPGLCRKPCF EIYHTQLHY (SEQ ID NO: 14572).
[00319] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac hiperativa compreende uma sequência de: 1 MAKRFYSAEE AAAHCMASSS EEFSGSDSEY VPPASESDSS TEESWCSSST VSALEEPMEV 61 DEDVDDLEDQ EAGDRADAAA GGEPAWGPPC NFPPEIPPFT TVPGVKVDTS NFEPINFFQL 121 FMTEAILQDM VLYTNVYAEQ ILTQNPLTRY ARAHAWHPTD IAEMKRFVGL TLAMGLIKAN 181 SLESYWDTTT VLSIPVFSAT MSRNRYQLLL RFLHFNNNAT AVPPDQPGHD RLHKLRPLID 241 SLSERFAAVY TPCQNICIDE SLLLFKGRLQ FRQYIPSKRA RYGIKFYKLC ESSSGYTSYF 301 LIYEGKDSKL DPPGCPPDLT VSGKIVWELI SPLLGQGFHL YVDNFYSSIP LFTALYCLNT 361 PACGTINRNR KGLPRALLDK KLNRGETYAL RKNELLAIKF FDKKNVFMLT SIHDESVIRE 421 QRVGRPPKNK PLCSKEYSKY MGGVDRTDQL QHYYNATRKT RHWYKKVGIY LIQMALRNSY 481 IVYKAAVPGP KLSYYKYQLQ ILPALLFGGV EEQTVPEMPP SDNVARLIGK HFIDTLPPTP 541 GKQRPQKGCK VCRKRGIRRD TRYYCPKCPR NPGLCRKPCF EIYHTQLHY (SEQ ID NO: 14624).
[00320] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac hiperativa compreende uma sequência de: 1 MAKRFYSAEE AAAHCMASSS EEFSGSDSEY VPPASESDSS TEESWCSSST VSALEEPMEV 61 DEDVDDLEDQ EAGDRADAAA GGEPAWGPPC NFPPEIPPFT TVPGVKVDTS NFEPINFFQL 121 FMTEAILQDM VLYTNVYAEQ ILTQNPLPRY ARAHAWHPTD IAEMKRFVGL TLAMGLIKAN 181 SLESYWDTTT VLKIPVFSAT MSRNRYQLLL RFLHFNNNAT AVPPDQPGHD RLHKLRPLID 241 SLSERFAAVY TPCQNICIDE SLLLFKGRLQ FRQYIPSKRA RYGIKFYKLC ESSSGYTSYF 301 LIYEGKDSKL DPPGCPPDLT VSGKIVWELI SPLLGQGFHL YVDNFYSSIP LFTALYCLNT 361 PACGTINRNR KGLPRALLDK KLNRGETYAL RKNELLAIKF FDKKNVFMLT SIHDESVIRE 421 QRVGRPPKNK PLCSKEYSKY MGGVDRTDQL QHYYNATRKT RHWYKKVGIY LIQMALRNSY 481 IVYKAAVPGP KLSYYKYQLQ ILPALLFGGV EEQTVPEMPP SDNVARLIGK HFIDTLPPTP 541 GKQRPQKGCK VCRKRGIRRD TRYYCPKCPR NPGLCFKPCF EIYHTQLHY (SEQ ID NO: 14625).
[00321] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac hiperativa compreende uma sequência de: 1 MAKRFYSAEE AAAHCMASSS EQTSGSDSEY VPPASESDSS TEESWCSSST VSALEEPMEV 61 DEDVDDLEDQ EAGDRADAAA GGEPAWGPPC NFPPEIPPFT TVPGVKVDTS NFEPINFFQL 121 FMTEAILQDM VLYTNVYAEQ ILTQNPLTRY ARAHAWHPTD IAEMKRFVGL TLAMGLIKAN 181 SIESYWDTTT VLSIPVFGAT MSRNRYQLLL RFLHFNNNAT AVPPDQPGHD RLHKLRPLID 241 SLSERFANVY TPCQNICIDE SLLLFKGRLQ FRQYIPSKRA RYGIKFYKLC ESSSGYTSYF
301 LIYEGKDSKL DPPGCPPDLT VSGKIVWELI SPLLGQGFHL YVDNFYSSIP LFTALYCLNT 361 PACGTINRNR KGLPRALLDK KLNRGETYAL RKNELLAIKF FDKKNVFMLT SIHDESVIRE 421 QRVGRKPKNK PLCSKEYSKY MGGVDRTDQL QHYYNATRKT RHWYKKVGIY LIQMALRNSY 481 IVYKAAVPGP KLSYYKYQLQ ILPALLFGGV EEQTVPEMPP SDNVARLIGK HFIDTLPPTP 541 GKQRPQKGCK VCRKRGIRRD TRYYCPKCPR NPGLCRKPCF EIYHTQLHY (SEQ ID NO: 14627).
[00322] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac hiperativa compreende uma sequência de: 1 MAKRFYSAEE AAAHCSASSS EEFSGSDSEY VPPASESDSS TEESWCSSST VSALEEPMEV 61 DEDVDDLEDQ EAGDRADAAA GGEPAWGPPC NFPPEIPPFT TVPGVKVDTS NFEPINFFQL 121 FMTEAILQDM VLYTNVYAEQ ILTQNPLTRG ARAHAWHPTD IAEMKRFVGL TLAMGLIKAN 181 SLESYWDTTT VLSIPVFGAT MSRNRYQLLL RFLHFNNNAT AVPPDQPGHD RLHKLRPLID 241 SLSERFANVY TPCQNICIDE SLMLFKGRLQ FRQYIPSKRA RYGIKFYKLC ESSTGYTSYF 301 LIYEGKDSKL DPPGCPPDLT VSGKIVWELI SPLLGQGFHL YVDNFYSSIP LFTALYCLNT 361 PACGTINRNR KGLPRALLDK KLNRGETYAL RKNELLAIKF FDKKNVFMLT SIHDESVIRE 421 QRVGRPPKNK PLCSKEYSKY MGGVDRTDQL QHYYNATRKT RHWYKKVGIY LIQMALRNSY 481 IVYKAAVPGP KLSYYKYQLQ ILPALLFGGV EEQTVPEMPP SDNVARLIGK HFIDTLPPTP 541 GKQRPQKGCK VCRKRGIRRD TRYYCPKCPR NPGLCRKPCF EIYHTQLHY (SEQ ID NO: 14628).
[00323] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac hiperativa compreende uma sequência de: 1 MAKRFYSAEE AAAHCMASSS EEFSGSDSEY VPPASESDSS TEESWCSSST VSALEEPMEV 61 DEDVDDLEDQ EAGDRADAAA GGEPAWGPPC NFPPEIPPFT TVPGVKVDTS NFEPINFFQL 121 FMTEAILQDM VLYTNVYAEQ ILTQNPLTRY ARAHAWHPTD IAEMKRFVGL TLAMGLIKAN 181 SLESYWDTTT VLSIPVFGAT MSRNRYQLLL RFLHFNNNAT AVPPDQPGHD RLHKLRPLID 241 SLSERFANVY TPCQNICIDE SLLLFKGRLQ FRQYIPSKRA RYGIKFYKLC ESSSGYTSYF 301 LIYEGKDSKL DPPGCPPDLT VSGKIVWELI SPLLGQGFHL YVDNFYSSIP LFTALYCLNT 361 PACGTINRNR KGLPRALLDK KLNRGETYAL RKNELLAIKF FDKKNVFMLT SIHDESVIRE 421 QRVGRPPKNK PLCSKEYSKY MGGVDRTDQL QHYYNATRKT RHWYKKVGIY LIQMALRNSY 481 IVYKAAVPGP KLSYYKYQLQ ILPALLFGGV EEQTVPEMPP SDNVARLIGK HFIDTLPPTP 541 GKQRPQKGCK VCRKRGIRRD TRYYCPKCPR NPGLCRKPCF EIYHTQLHY (SEQ ID NO: 16820).
[00324] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac hiperativa compreende uma substituição de amino- ácido em uma posição selecionada de aminoácido 6, 7, 16, 19, 20, 21, 22, 23, 24, 26, 28, 31, 34, 67, 73, 76, 77, 88, 91, 141, 145, 146, 148, 150, 157, 162, 179, 182, 189, 192, 193, 196, 198, 200, 210, 212, 218, 248, 263, 270, 294, 297, 308, 310, 333, 336, 354, 357, 358, 359, 377, 423, 426, 428, 438, 447, 450, 462, 469, 472, 498, 502, 517, 520, 523,
533, 534, 576, 577, 582, 583 ou 587 (relativos à SEQ ID NO: 14517). Em certas modalidades, a transposase piggyBac ou semelhante à piggyBac hiperativa compreende uma substituição de aminoácido de Y6C, S7G, M16S, S19G, S20Q, S20G, S20D, E21D, E22Q, F23T, F23P, S24Y, S26V, S28Q, V31K, A34E, L67A, G73H, A76V, D77N, P88A, N91D, Il41Q, Y141A, N145E, N145V, P146T, P146V, P146K, P148T, P148H, Y150G, Y150S, Y150C, H157Y, A162C, A179K, L182I, L182V, T189G, L192H, S193N, S193K, V196I, S198G, T200W, L210H, F212N, N218E, A248N, L263M, Q270L, S294T, T297M, S308R, L310R, L333M, Q336M, A354H, C357V, L358F, D359N, L377I, V 423H, P426K, K428R, S438A, T447G, T447A, L450V, A462H, A462Q, I469V, I472L, Q498M, L502V, E5171, P520D, P520G, N523S, I533E, D534A, F576R, F576E, K577I, I582R, Y583F, L587Y ou L587W, ou qualquer combinação dos mesmos incluindo pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ou todos destas mutações (relativos à SEQ ID NO: 14517).
[00325] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac hiperativa compreende uma ou mais substituições de um aminoácido que é não tipo selvagem, em que uma ou mais substituições para aminoácido de tipo selvagem compreende uma substituição de A2X, K3X, R4X, F5X, Y6X, S7X, A11X, A13X, C15X, M16X, A17X, S18X, S19X, S20X, E21X, E22X, F23X, S24X, G25X, 26X, D27X, S28X, E29X, E42X, E43X, S44X, C46X, S47X, S48X, S49X, T50X, V51X, S52X, A53X, L54X, E55X, E56X, P57X, M58X, E59X, E62X, D63X, V64X, D65X, D66X, L67X, E68X, D69X, Q70X, E71X, A72X, G73X, D74X, R75X, A76X, D77X, A78X, A79X, A80X, G81X, G82X, E83X, P84X, A85X, W86X, G87X, P88X, P89X, C90X, N91X, F92X, P93X, E95X, I96X, P97X, P98X, F99X, T100X, T101X, P103X, G104X, V105X, K106X, V107X, D108X, T109X, N111X, P114X, I115X, N116X, F117X, F118X, Q119X, M122X, T123X, E124X,
A125X, I126X, L127X, Q128X, D129X, M130X, L132X, Y133X, V126X, Y127X, A138X, E139X, Q140X, Y141X, L142X, Q144X, N145X, P146X, L147X, P148X, Y150X, A151X, A155X, H157X, P158X , I161X, A162X, V168X, T171X, L172X, A173X, M174X, I177X, A179X, L182X, D187X, T188X, T189X, T190X, L192X, S193X, I194X, P195X, V196X, S198X, A199X, T200X, S202X, L208X, L209X, L210X, R211X, F212X, F215X, N217X, N218X, A219X, T220X, A221X, V222X, P224X, D225X, Q226X, P227X, H229X, R231X, H233X, L235X, P237X, I239X, D240X, L242X, S243X, E244X, R244X, F246X, A247X, A248X, V249X, Y250X, T251X, P252X, C253X, Q254X, I256X, C257X, I258X, D259X, E260X, S261X, L262X, L263X, L264X, F265X, K266X, G267X, R268X, L269X, Q270X, F271X, R272X, Q273X, Y274X, I275X, P276X, S277X, K278X, R279X, A280X, R281X, Y282X, G283X, I284X, K285X, F286X, Y287X, K288X, L289X, C290X, E291X, S292X, S293XS294X, G295X, Y296X, T297X, S298X, Y299X, F300X, E304X, L310X, P313X, G314X, P316X, P317X, D318X, L319X, T320X, V321X, K324X, E328X, I330X, S331X, P332X, L333X, L334X, G335X, Q336X, F338X, L340X, D343X, N344X, F345X, Y346X, S347X, L351X, F352X, A354X, L355X, Y356X, C357X, L358X, D359X, T360X, R422X, Y423X, G424X, P426X, K428X, N429X, K430X, P431X, L432X, S434X, K435X, E436X, S438X, K439X, Y440X, G443X, R446X, T447X, L450X, Q451X, N455X, T460X, R461X, A462X, K465X, V467X, G468X, I469X, Y470X, L471X, I472X, M474X, A475X, L476X, R477X, S479X, Y480X, V482XY483X, K484X, A485X, A486X, V487X, P488X, P490X, K491X, S493X, Y494X, Y495X, K496X, Y497T, Q498X, L499X, Q500X, I501X, L502X, P503X, A504X, L505X, L506X, F507X, G508X, G509X, V510X, E511X, E512X, Q513X, T514X, V515X, E517X, M518X, P519X, P520X, S521X, D522X, N523X, V524X, A525X, L527X, I528X, K530X, H531X, F532X, I533X, D534X, T535X, L536X, T539X, P540X,Q546X, K550X, R553X, K554X, R555X,
G556X, I557X, R558X, R559X, D560X, T561X, Y564X, P566X, K567X, P569X, R570X, N571X, L574X, C575X, F576X, K577X, P578X, F580X, E581X, I582X, Y583X, T585X, Q586X, L587X, H588X ou Y589X (relativos à SEQ ID NO: 14517). Uma lista de substituições de aminoácido hiperativo pode ser encontrada em patente dos Estados Unidos No. 10.041.077, os conteúdos dos quais são incorporados por referência em sua totalidade.
[00326] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac é deficiente de integração. Em certas modalidades, uma transposase piggyBac ou semelhante à piggyBac deficiente de integração é uma transposase que pode cortar seu correspondente transposon, porém que integra o transposon cortado em uma frequên- cia menor do que uma correspondente transposase de ocorrência na- tural. Em certas modalidades, a transposase piggyBac ou semelhante à piggyBac é uma variante deficiente de integração de SEQ ID NO:
14517. Em certas modalidades, a transposase piggyBac ou semelhan- te à piggyBac deficiente de integração é deficiente com relação à SEQ ID NO: 14517.
[00327] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac é ativa para excisão, porém, deficiente em integra- ção. Em certas modalidades, a transposase piggyBac ou semelhante à piggyBac deficiente de integração compreende uma sequência que é pelo menos 90% idêntica a uma sequência de: 1 MAKRFYSAEE AAAHCMASSS EEFSGSDSEY VPPASESDSS TEESWCSSST VSALEEPMEV 61 DEDVDDLEDQ EAGDRVDAAA GGEPAWGPPC NFPPEIPPFT TVPGVKVDTS NFEPINFFQL 121 FMTEAILQDM VLYTNVYAEQ ILTQNPLPRY ARAHAWHPTD IAEMKRFVGL TLAMGLIKAN 181 SLESYWDTTT VLSIPVFSAT MSRNRYQLLL KFLHFNNEAT AVPPDQPGHD RLHKLRPLID 241 SLSERFAAVY TPCQNICIDE SLLLFKGRLQ FRQYIPSKRA RYGIKFYKLC ESSSGYTSYF 301 LIYEGKDSKL DPPGCPPDLT VSGKIVWELI SPLLGQGFHL YVDNFYSSIP LFTALYCLDT 361 PACGTINRNR KGLPRALLDK KLNRGETYAL RKNELLAIKF FDKKNVFMLT SIHDESVIRE 421 QRVGRPPKNK PLCSKEYSKY MGGVDRTDQL QHYYNATRKT RAWYKKVGIY LIQMALRNSY 481 IVYKAAVPGP KLSYYKYQLQ ILPALLFGGV EEQTVPEMPP SDNVARLIGK HFIDTLPPTP 541 GKQRPQKGCK VCRKRGIRRD TRYYCPKCPR NPGLCFKPCF EIYHTQLHYG RR (SEQ ID NO: 14605).
[00328] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac deficiente de integração compreende uma sequên- cia que é pelo menos 90% idêntica a uma sequência de: 1 MAKRFYSAEE AAAHCMASSS EEFSGSDSEY VPPASESDSS TEESWCSSST VSALEEPMEV 61 DEDVDDLEDQ EAGDRADAAA GGEPAWGPPC NFPPEIPPFT TVPGVKVDTS NFEPINFFQL 121 FMTEAILQDM VLYTNVYAEQ ILTQVPLPRY ARAHAWHPTD IAEMKRFVGL TLAMGLIKAN 181 SLESYWDTTT VLNIPVFSAT MSRNRYQLLL RFLEFNNEAT AVPPDQPGHD RLHKLRPLID 241 SLSERFAAVY TPCQNICIDE SLLLFKGRLQ FRQYIPSKRA RYGIKFYKLC ESSSGYTSYF 301 LIYEGKDSKL DPPGCPPDLT VSGKIVWELI SPLLGQGFHL YVDNFYSSIP LFTALYCLDT 361 PACGTINRNR KGLPRALLDK KLNRGETYAL RKNELLAIKF FDKKNVFMLT SIHDESVIRE 421 QRVGRPPKNK PLCSKEYSKY MGGVDRTDQL QHYYNATRKT RAWYKKVGIY LIQMALRNSY 481 IVYKAAVPGP KLSYYKYQLQ ILPALLFGGV EEQTVPEMPP SDNVARLIGK HFIDTLPPTP 541 GKQRPQKGCK VCRKRGIRRD TRYYCPKCPR NPGLCFKPCF EIYHTQLHY (SEQ ID NO: 14604).
[00329] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac deficiente de integração compreende uma sequên- cia que é pelo menos 90% idêntica a uma sequência de: 1 MAKRFYSAEE AAAHCMASSS EEFSGSDSEY VPPASESDSS TEESWCSSST VSALEEPMEV 61 DEDVDDLEDQ EAGDRADAAA GGEPAWGPPC NFPPEIPPFT TVPGVKVDTS NFEPINFFQL 121 FMTEAILQDM VLYTNVYAEQ ILTQNVLPRY ARAHAWHPTD IAEMKRFVGL TLAMGLIKAN 181 SLESYWDTTT VLSIPVFSAT MSRNRYQLLL RFLHFNNDAT AVPPDQPGHD RLHKLRPLID 241 SLTERFAAVY TPCQNICIDE SLLLFKGRLQ FRQYIPSKRA RYGIKFYKLC ESSSGYTSYF 301 LIYEGKDSKL DPPGCPPDLT VSGKIVWELI SPLLGQGFHL YVDNFYSSIP LFTALYCLDT 361 PACGTINRNR KGLPRALLDK KLNRGETYAL RKNELLAIKF FDKKNVFMLT SIHDESVIRE 421 QRVGRPPKNK PLCSKEYSKY MGGVDRTDQL QHYYNATRKT RAWYKKVGIY LIQMALRNSY 481 IVYKAAVPGP KLSYYKYQLQ ILPALLFGGV EEQTVPEMPP SDNVARLIGK HFIDTLPPTP 541 GKQRPQKGCK VCRKRGIRRD TRYYCPKCPR NPGLCFKPCF EIYHTQLHYG RR (SEQ ID NO: 14611).
[00330] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac deficiente de integração compreende SEQ ID NO:
14611. Em certas modalidades, a transposase piggyBac ou semelhan- te à piggyBac deficiente de integração compreende uma sequência que é pelo menos 90% idêntica a uma sequência de: 1 MAKRFYSAEE AAAHCMASSS EEFSGSDSEY VPPASESDSS TEESWCSSST VSALEEPMEV 61 DEDVDDLEDQ EAGDRADAAP GGEPAWGPPC NFPPEIPPFT TVPGVKVDTS NFEPINFFQL 121 FMTEAILQDM VLYTNVYAEQ ILTQVPLPRY ARAHAWHPTD IAEMKRFVGL TLAMGLIKAN 181 SLESYWDTTT VLSIPVFSAT MSRNRYQLLL RFLHFNNEAT AVPPDQPGHD RLHKLRPLID 241 SLSERFAAVY TPCQNICIDE SLLLFKGRLQ FRQYIPSKRA RYGIKFYKLC ESSSGYTSYF 301 LIYEGKDSKL DPPGCPPDLT VSGKIVWELI SPLLGQGFHL YVDNFYSSIP LFTALYCLDT 361 PACGTINRNR KGLPRALLDK KLNRGETYAL RKNELLAIKF FDKKNVFMLT SIHDESVIRE
421 QRVGRPPKNK PLCSKEYSKY MGGVDRTDQL QHYYNATRKT RAWYKKVGIY LIQMALRNSY 481 IVYKAAVPGP KLSYYKYQLQ ILPALLFGGV EEQTVPEMPP SDNVARLIGK HFIDTLPPTP 541 GKQRPQKGCK VCRKRGIRRD TRYYCPKCPR NPGLCFKPCF EIYHTQLHYG RR (SEQ ID NO: 14612).
[00331] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac deficiente de integração compreende SEQ ID NO:
14612. Em certas modalidades, a transposase piggyBac ou semelhan- te à piggyBac deficiente de integração compreende uma sequência que é pelo menos 90% idêntica a uma sequência de: 1 MAKRFYSAEE AAAHCMASSS EEFSGSDSEY VPPASESDSS TEESWCSSST VSALEEPMEV 61 DEDVDDLEDQ EAGDRADAAA GGEPAWGPPC NFPPEIPPFT TVPGVKVDTS NFEPINFFQL 121 FMTEAILQDM VLYTNVYAEQ ILTQVPLPRY ARAHAWHPTD IAEMKRFVGL TLAMGLIKAN 181 SLESYWDTTT VLNIPVFSAT MSRNRYQLLL RFLEFNNNAT AVPPDQPGHD RLHKLRPLID 241 SLSERFAAVY TPCQNICIDE SLLLFKGRLQ FRQYIPSKRA RYGIKFYKLC ESSSGYTSYF 301 LIYEGKDSKL DPPGCPPDLT VSGKIVWELI SPLLGQGFHL YVDNFYSSIP LFTALYCLDT 361 PACGTINRNR KGLPRALLDK KLNRGETYAL RKNELLAIKF FDKKNVFMLT SIHDESVIRE 421 QRVGRPPKNK PLCSKEYSKY MGGVDRTDQL QHYYNATRKT RAWYKKVGIY LIQMALRNSY 481 IVYKAAVPGP KLSYYKYQLQ ILPALLFGGV EEQTVPEMPP SDNVARLIGK HFIDTLPPTP 541 GKQRPQKGCK VCRKRGIRRD TRYYCPKCPR NPGLCFKPCF EIYHTQLHYG RR (SEQ ID NO: 14613).
[00332] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac deficiente de integração compreende SEQ ID NO:
14613. Em certas modalidades, a transposase piggyBac ou semelhan- te à piggyBac deficiente de integração compreende uma substituição de aminoácido em que a Asn na posição 218 é substituída por Glu ou Asp (N218D ou N218E) (relativos à SEQ ID NO: 14517).
[00333] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac deficiente de integração, competente de excisão compreende uma ou mais substituições de um aminoácido que é não tipo selvagem, em que uma ou mais substituições para aminoácido de tipo selvagem compreende uma substituição de A2X, K3X, R4X, F5X, Y6X, S7X, A8X, E9X, E10X, A11X, A12X, A13X, H14X, C15X, M16X, A17X, S18X, S19X, S20X, E21X, E22X, F23X, S24X, G25X, 26X, D27X, S28X, E29X, V31X, P32X, P33X, A34X, S35X, E36X, S37X, D38X, S39X, S40X, T41X, E42X, E43X, S44X, W45X, C46X, S47X,
S48X, S49X, T50X, V51X, S52X, A53X, L54X, E55X, E56X, P57X, M58X, E59X, V60X, M122X, T123X, E124X, A125X, L127X, Q128X, D129X, L132X, Y133X, V126X, Y127X, E139X, Q140X, Y141X, L142X, T143X, Q144X, N145X, P146X, L147X, P148X, R149X, Y150X, A151X, H154X, H157X, P158X, T159X, D160X, I161X, A162X, E163X, M164X, K165X, R166X, F167X, V168X, G169X, L170X, T171X, L172X, A173X, M174X, G175X, L176X, I177X, K178X, A179X, N180X, S181X, L182X, S184X, Y185X, D187X, T188X, T189X, T190X, V191X, L192X, S193X, I194X, P195X, V196X, F197X, S198X, A199X, T200X, M201X, S202X, R203X, N204X, R205X, Y206X, Q207X, L208X, L209X, L210X, R211X, F212X, L213X, H241X, F215X, N216X, N217X, N218X, A219X, T220X, A221X, V222X, P223X, P224X, D225X, Q226X, P227X, G228X, H229X, D230X, R231X, H233X, K234X, L235X, R236X, L238X, I239X, D240X, L242X, S243X, E244X, R244X, F246X, A247X, A248X, V249X, Y250X, T251X, P252X, C253X, Q254X, N255X, I256X, C257X, I258X, D259X, E260X, S261X, L262X, L263X, L264X, F265X, K266X, G267X, R268X, L269X, Q270X, F271X, R272X, Q273X, Y274X, I275X, P276X, S277X, K278X, R279X, A280X, R281X, Y282X, G283X, I284X, K285X, F286X, Y287X, K288X, L289X, C290X, E291X, S292X, S293X, S294X, G295X, Y296X, T297X, S298X, Y299X, F300X, I302X, E304X, G305X,K306X, D307X, S308X, K309X, L310X, D311X, P312X, P313X, G314X, C315X, P316X, P317X, D318X, L319X, T320X, V321X, S322X, G323X, K324X, I325X, V326X, W327X, E328X, L329X, I330X, S331X, P332X, L333X, L334X, G335X, Q336X, F338X, H339X, L340X, V342X, N344X, F345X, Y346X, S347X, S348X, I349X, L351X, T353X, A354X, Y356X, C357X, L358X, D359X, T360X, P361X, A362X, C363X, G364X, I366X, N367X, R368X, D369X, K371X, G372X, L373X, R375X, A376X, L377X, L378X, D379X, K380X, K381X, L382X, N383X, R384XG385X, T387X, Y388X, A389X, L390X, K392X, N393X, E394X,
A397X, K399X, F400X, F401X, D402X, N405X, L406X, L409X, R422X, Y423X, G424X, E425X, P426X, K428X, N429X, K430X, P431X, L432X, S434X, K435X, E436X, S438X, K439X, Y440X, G442X, G443X, V444X, R446X, T447X, L450X, Q451X, H452X, N455X, T457X, R458X, T460X, R461X, A462X, Y464X, K465X, V467X, G468X, I469X, L471X, I472X, Q473X, M474X, L476X, R477X, N478X, S479X, Y480X, V482XY483X, K484X, A485X, A486X, V487X, P488X, G489X, P490X, K491X, L492X, S493X, Y494X, Y495X, K496X, Q498X, L499X, Q500X, I501X, L502X, P503X, A504X, L505X, L506X, F507X, G508X, G509X, V510X, E511X, E512X, Q513X, T514X, V515X, E517X, M518X, P519X, P520X, S521X, D522X, N523X, V524X, A525X, L527X, I528X, G529X, K530X, F532X, I533X, D534X, T535X, L536X, P537X, P538X, T539X, P540X, G541X, F542X, Q543X, R544X, P545X, Q546X, K547X, G548X, C549X, K550X, V551X, C552X, R553X, K554X, R555X, G556X, I557X, R558X, R559X, D560X, T561X, R562X, Y563X, Y564X, C565X, P566X, K567X, C568X, P569X, R570X, N571X, P572X, G573X, L574X, C575X, F576X, K577X, P578X, C579X, F580X, E581X, I582X, Y583X, H584X, T585X, Q586X, L587X, H588X ou Y589X (relativos à SEQ ID NO: 14517). Uma lista de substituições de aminoácido deficiente de integração, competente de excisão pode ser encontrada em patente dos Estados Unidos No. 10.041.077, os conteúdos dos quais são in- corporados por referência em sua totalidade.
[00334] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac é fundida a um sinal de localização nuclear. Em cer- tas modalidades, SEQ ID NO: 14517 ou SEQ ID NO: 14518 é fundida a um sinal de localização nuclear. Em certas modalidades, a sequên- cia de aminoácido da transposase piggyBac ou semelhante à piggyBac fundida a um sinal de localização nuclear é codificada por uma sequência de polinucleotídeo compreendendo: 1 atggcaccca aaaagaaacg taaagtgatg gccaaaagat tttacagcgc cgaagaagca
61 gcagcacatt gcatggcatc gtcatccgaa gaattctcgg ggagcgattc cgaatatgtc 121 ccaccggcct cggaaagcga ttcgagcact gaggagtcgt ggtgttcctc ctcaactgtc 181 tcggctcttg aggagccgat ggaagtggat gaggatgtgg acgacttgga ggaccaggaa 241 gccggagaca gggccgacgc tgccgcggga ggggagccgg cgtggggacc tccatgcaat 301 tttcctcccg aaatcccacc gttcactact gtgccgggag tgaaggtcga cacgtccaac 361 ttcgaaccga tcaatttctt tcaactcttc atgactgaag cgatcctgca agatatggtg 421 ctctacacta atgtgtacgc cgagcagtac ctgactcaaa acccgctgcc tcgctacgcg 481 agagcgcatg cgtggcaccc gaccgatatc gcggagatga agcggttcgt gggactgacc 541 ctcgcaatgg gcctgatcaa ggccaacagc ctcgagtcat actgggatac cacgactgtg 601 cttagcattc cggtgttctc cgctaccatg tcccgtaacc gctaccaact cctgctgcgg 661 ttcctccact tcaacaacaa tgcgaccgct gtgccacctg accagccagg acacgacaga 721 ctccacaagc tgcggccatt gatcgactcg ctgagcgagc gattcgccgc ggtgtacacc 781 ccttgccaaa acatttgcat cgacgagtcg cttctgctgt ttaaaggccg gcttcagttc 841 cgccagtaca tcccatcgaa gcgcgctcgc tatggtatca aattctacaa actctgcgag 901 tcgtccagcg gctacacgtc atacttcttg atctacgagg ggaaggactc taagctggac 961 ccaccggggt gtccaccgga tcttactgtc tccggaaaaa tcgtgtggga actcatctca 1021 cctctcctcg gacaaggctt tcatctctac gtcgacaatt tctactcatc gatccctctg 1081 ttcaccgccc tctactgcct ggatactcca gcctgtggga ccattaacag aaaccggaag 1141 ggtctgccga gagcactgct ggataagaag ttgaacaggg gagagactta cgcgctgaga 1201 aagaacgaac tcctcgccat caaattcttc gacaagaaaa atgtgtttat gctcacctcc 1261 atccacgacg aatccgtcat ccgggagcag cgcgtgggca ggccgccgaa aaacaagccg 1321 ctgtgctcta aggaatactc caagtacatg gggggtgtcg accggaccga tcagctgcag 1381 cattactaca acgccactag aaagacccgg gcctggtaca agaaagtcgg catctacctg 1441 atccaaatgg cactgaggaa ttcgtatatt gtctacaagg ctgccgttcc gggcccgaaa 1501 ctgtcatact acaagtacca gcttcaaatc ctgccggcgc tgctgttcgg tggagtggaa 1561 gaacagactg tgcccgagat gccgccatcc gacaacgtgg cccggttgat cggaaagcac 1621 ttcattgata ccctgcctcc gacgcctgga aagcagcggc cacagaaggg atgcaaagtt 1681 tgccgcaagc gcggaatacg gcgcgatacc cgctactatt gcccgaagtg cccccgcaat 1741 cccggactgt gtttcaagcc ctgttttgaa atctaccaca cccagttgca ttac (SEQ ID NO: 14626).
[00335] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é isolado ou derivado de Xenopus tropicalis. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência de: 1 ttaacctttt tactgccaat gacgcatggg atacgtcgtg gcagtaaaag ggcttaaatg 61 ccaacgacgc gtcccatacg ttgttggcat tttaagtctt ctctctgcag cggcagcatg 121 tgccgccgct gcagagagtt tctagcgatg acagcccctc tgggcaacga gccggggggg 181 ctgtc (SEQ ID NO: 14519).
[00336] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 tttgcatttt tagacattta gaagcctata tcttgttaca gaattggaat tacacaaaaa 61 ttctaccata ttttgaaagc ttaggttgtt ctgaaaaaaa caatatattg ttttcctggg
121 taaactaaaa gtcccctcga ggaaaggccc ctaaagtgaa acagtgcaaa acgttcaaaa 181 actgtctggc aatacaagtt ccactttgac caaaacggct ggcagtaaaa gggttaa (SEQ ID NO: 14520).
[00337] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende SEQ ID NO: 14519 e SEQ ID NO:
14520. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência de: 1 ttaacccttt gcctgccaat cacgcatggg atacgtcgtg gcagtaaaag ggcttaaatg 61 ccaacgacgc gtcccatacg ttgttggcat tttaagtctt ctctctgcag cggcagcatg 121 tgccgccgct gcagagagtt tctagcgatg acagcccctc tgggcaacga gccggggggg 181 ctgtc (SEQ ID NO: 14521).
[00338] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 tttgcatttt tagacattta gaagcctata tcttgttaca gaattggaat tacacaaaaa 61 ttctaccata ttttgaaagc ttaggttgtt ctgaaaaaaa caatatattg ttttcctggg 121 taaactaaaa gtcccctcga ggaaaggccc ctaaagtgaa acagtgcaaa acgttcaaaa 181 actgtctggc aatacaagtt ccactttggg acaaatcggc tggcagtgaa agggttaa (SEQ ID NO: 14522).
[00339] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 ttaacctttt tactgccaat gacgcatggg atacgtcgtg gcagtaaaag ggcttaaatg 61 ccaacgacgc gtcccatacg ttgttggcat tttaattctt ctctctgcag cggcagcatg 121 tgccgccgct gcagagagtt tctagcgatg acagcccctc tgggcaacga gccggggggg 181 ctgtc (SEQ ID NO: 14523).
[00340] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende SEQ ID NO: 14520 e SEQ ID NO: 14519, SEQ ID NO: 14521 ou SEQ ID NO: 14523. Em certas modali- dades, o transposon piggyBac ou semelhante à piggyBac compreende SEQ ID NO: 14522 e SEQ ID NO: 14519, SEQ ID NO: 14521 ou SEQ ID NO: 14523. Em certas modalidades, o transposon piggyBac ou se- melhante à piggyBac compreende uma extremidade compreendendo pelo menos 14, 16, 18, 20, 30 ou 40 nucleotídeos contíguos de SEQ ID NO: 14519, SEQ ID NO: 14521 ou SEQ ID NO: 14523. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac com- preende uma extremidade compreendendo pelo menos 14, 16, 18, 20, 30 ou 40 nucleotídeos contíguos de SEQ ID NO: 14520 ou SEQ ID
NO: 14522. Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma extremidade com pelo menos 90% de identidade para SEQ ID NO: 14519, SEQ ID NO: 14521 ou SEQ ID NO: 14523. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma extremidade com pelo menos 90% de identidade para SEQ ID NO: 14520 ou SEQ ID NO:
14522. Em uma modalidade, uma extremidade de transposon é pelo menos 90% idêntica à SEQ ID NO: 14519 e a outra extremidade de transposon é pelo menos 90% idêntica à SEQ ID NO: 14520.
[00341] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de TTAACCTTTTTAC- TGCCA (SEQ ID NO: 14524). Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência de TTAACCCTTTGCCTGCCA (SEQ ID NO: 14526). Em certas modali- dades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência de TTAACCITTTTACTGCCA (SEQ ID NO: 14527). Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência de TGGCAGTAAAAGGGTTAA (SEQ ID NO: 14529). Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de TGGCAG- TGAAAGGGTTAA (SEQ ID NO: 14531). Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma se- quência de TTAACCITTTKMCTGCCA (SEQ ID NO: 14533). Em certas modalidades, uma extremidade do transposon piggyBac ou semelhan- te à piggyBac compreende uma sequência selecionada de SEQ ID NO: 14524, SEQ ID NO: 14526 e SEQ ID NO: 14527. Em certas mo- dalidades, uma extremidade do transposon piggyBac™ (PB) ou seme- lhante à piggyBac compreende uma sequência selecionada de SEQ ID NO: 14529 e SEQ ID NO: 14531. Em certas modalidades, cada repeti- ção de terminal invertido do transposon piggyBac ou semelhante à piggyBac compreende uma sequência de ITR de CCITTTKMCTGCCA (SEQ ID NO: 14563). Em certas modalidades, cada extremidade do transposon piggyBac™ (PB) ou semelhante à piggyBac compreende SEQ ID NO: 14563 em orientações invertidas. Em certas modalidades, uma ITR do transposon piggyBac ou semelhante à piggyBac compre- ende uma sequência selecionada de SEQ ID NO: 14524, SEQ ID NO: 14526 e SEQ ID NO: 14527. Em certas modalidades, uma ITR do transposon piggyBac ou semelhante à piggyBac compreende uma se- quência selecionada de SEQ ID NO: 14529 e SEQ ID NO: 14531. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende SEQ ID NO: 14533 em orientação invertida nas duas ex- tremidades transposon.
[00342] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac pode ter extremidades compreendendo SEQ ID NO: 14519 e SEQ ID NO: 14520 ou uma variante de qualquer uma destas tendo pelo menos 90% de identidade de sequência para SEQ ID NO: 14519 ou SEQ ID NO: 14520, e a transposase piggyBac ou semelhan- te à piggyBac tem a sequência de SEQ ID NO: 14517 ou uma variante mostrando pelo menos %, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer porcentagem entre identidade de sequência para SEQ ID NO: 14517 ou SEQ ID NO: 14518. Em certas modalidades, uma ex- tremidade de transposon piggyBac ou semelhante à piggyBac com- preende pelo menos 14 nucleotídeos contíguos de SEQ ID NO: 14519, SEQ ID NO: 14521 ou SEQ ID NO: 14523, e a outra extremidade de transposon compreende pelo menos 14 nucleotídeos contíguos de SEQ ID NO: 14520 ou SEQ ID NO: 14522. Em certas modalidades, uma extremidade de transposon compreende pelo menos 15, pelo menos 16, pelo menos 17, pelo menos 18, pelo menos 19, pelo menos 20, pelo menos 22, pelo menos 25, pelo menos 30 nucleotídeos contí-
guos de SEQ ID NO: 14519, SEQ ID NO: 14521 ou SEQ ID NO: 14523, e a outra extremidade de transposon compreende pelo menos 15, pelo menos 16, pelo menos 17, pelo menos 18, pelo menos 19, pelo menos 20, pelo menos 22, pelo menos 25 ou pelo menos 30 nu- cleotídeos contíguos de SEQ ID NO: 14520 ou SEQ ID NO: 14522.
[00343] Em certas modalidades, a transposase piggyBac ou seme- lhante à piggyBac reconhece a extremidade de transposon com uma sequência 5’ correspondendo à SEQ ID NO: 14519, e uma sequência 3’ correspondendo à SEQ ID NO: 14520. Ela irá extirpar o transposon de uma molécula de DNA cortando o DNA na sequência 5'-TTAA-3' em uma extremidade 5’ de uma extremidade de transposon para a 5'- TTAA-3' em uma extremidade 3’ da segunda extremidade de transpo- son, incluindo qualquer DNA heterólogo que é colocado entre elas, e inserir a sequência extirpada emo uma segunda molécula de DNA. Em certas modalidades, versões truncadas e modificadas das extremida- des transposon 5’ e 3’ também funcionará como parte de um transpo- son que pode ser transposto por uma transposase piggyBac ou seme- lhante à piggyBac. Por exemplo, a extremidade 5’ de transposon pode ser substituída por uma sequência correspondendo à SEQ ID NO: 14521 ou SEQ ID NO: 14523, a extremidade 3’ de transposon pode ser substituída por uma sequência mais curta correspondendo à SEQ ID NO: 14522. Em certas modalidades, as extremidades 5’ e 3’ trans- poson dividem uma sequência quase perfeitamente repetida de 18 bp em suas extremidades (5'-TTAACCITTTKMCTGCCA: SEQ ID NO: 14533) que incluem o sítio de inserção de 5'-TTAA-3', cuja sequência é invertida na orientação nas duas extremidades. Que está na SEQ ID NO: 14519 e SEQ ID NO: 14523, a extremidade 5’ de transposon co- meça com a sequência 5'-TTAACCTTTTTACTGCCA-3' (SEQ ID NO: 14524), ou na SEQ ID NO: 14521, a extremidade 5’ de transposon começa com a sequência 5'-TTAACCCTTTGCCTGCCA-3' (SEQ ID
NO: 14526); as extremidades 3’ de transposon com aproximadamente o complemento reverso desta sequência: na SEQ ID NO: 14520 finali- za 5' TGGCAGTAAAAGGGTTAA-3' (SEQ ID NO: 14529), na SEQ ID NO: 14522 finaliza 5'-TGGCAGTGAAAGGGTTAA-3' (SEQ ID NO: 14531). Uma modalidade da presente invenção é um transposon que compreende um polinucleotídeo heterólogo inserido entre duas extre- midades transposon cada compreendendo SEQ ID NO: 14533 em ori- entações invertidas nas duas extremidades transposon. Em certas modalidades, uma extremidade de transposon compreende uma se- quência selecionada de SEQ ID NOS: 14524, SEQ ID NO: 14526 e SEQ ID NO: 14527. Em algumas modalidades, uma extremidade de transposon compreende uma sequência selecionada de SEQ ID NO: 14529 e SEQ ID NO: 14531.
[00344] Em certas modalidades, o transposon piggyBac™ (PB) ou semelhante à piggyBac é isolado ou derivado de Xenopus tropicalis. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência de: 1 ccctttgcct gccaatcacg catgggatac gtcgtggcag taaaagggct taaatgccaa 61 cgacgcgtcc catacgtt (SEQ ID NO: 14573).
[00345] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 cctgggtaaa ctaaaagtcc cctcgaggaa aggcccctaa agtgaaacag tgcaaaacgt 61 tcaaaaactg tctggcaata caagttccac tttgggacaa atcggctggc agtgaaaggg (SEQ ID NO: 14574).
[00346] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende pelo menos 16 bases contíguas de SEQ ID NO: 14573 ou SEQ ID NO: 14574, e repetição terminal inverti- da de CCITTTBMCTGCCA (SEQ ID NO: 14575).
[00347] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 ccctttgcct gccaatcacg catgggatac gtcgtggcag taaaagggct taaatgccaa 61 cgacgcgtcc catacgttgt tggcatttta agtcttctct ctgcagcggc agcatgtgcc 121 gccgctgcag agagtttcta gcgatgacag cccctctggg caacgagccg ggggggctgt
181 c (SEQ ID NO: 14579).
[00348] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 cctttttact gccaatgacg catgggatac gtcgtggcag taaaagggct taaatgccaa 61 cgacgcgtcc catacgttgt tggcatttta attcttctct ctgcagcggc agcatgtgcc 121 gccgctgcag agagtttcta gcgatgacag cccctctggg caacgagccg ggggggctgt 181 c (SEQ ID NO: 14580).
[00349] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 cctttttact gccaatgacg catgggatac gtcgtggcag taaaagggct taaatgccaa 61 cgacgcgtcc catacgttgt tggcatttta agtcttctct ctgcagcggc agcatgtgcc 121 gccgctgcag agagtttcta gcgatgacag cccctctggg caacgagccg ggggggctgt 181 c (SEQ ID NO: 14581).
[00350] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 cctttttact gccaatgacg catgggatac gtcgtggcag taaaagggct taaatgccaa 61 cgacgcgtcc catacgttgt tggcatttta agtcttctct ctgcagcggc agcatgtgcc 121 gccgctgcag agag (SEQ ID NO: 14582).
[00351] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 cctttttact gccaatgacg catgggatac gtcgtggcag taaaagggct taaatgccaa 61 cgacgcgtcc catacgttgt tggcatttta agtctt (SEQ ID NO: 14583).
[00352] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 ccctttgcct gccaatcacg catgggatac gtcgtggcag taaaagggct taaatgccaa 61 cgacgcgtcc catacgttgt tggcatttta agtctt (SEQ ID NO: 14584).
[00353] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 ttatcctttt tactgccaat gacgcatggg atacgtcgtg gcagtaaaag ggcttaaatg 61 ccaacgacgc gtcccatacg ttgttggcat tttaagtctt ctctctgcag cggcagcatg 121 tgccgccgct gcagagagtt tctagcgatg acagcccctc tgggcaacga gccggggggg 181 ctgtc (SEQ ID NO: 14585).
[00354] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 tttgcatttt tagacattta gaagcctata tcttgttaca gaattggaat tacacaaaaa 61 ttctaccata ttttgaaagc ttaggttgtt ctgaaaaaaa caatatattg ttttcctggg 121 taaactaaaa gtcccctcga ggaaaggccc ctaaagtgaa acagtgcaaa acgttcaaaa 181 actgtctggc aatacaagtt ccactttggg acaaatcggc tggcagtgaa aggg (SEQ ID NO:
14586).
[00355] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma extremidade 5’ de sequência de transposon selecionada de SEQ ID NO: 14573 e SEQ ID NOs: 14579-
14585. Em certas modalidades, a extremidade 5’ de sequência de transposon é precedida por uma sequência alvo 5’. Em certas modali- dades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência de: 1 tttgcatttt tagacattta gaagcctata tcttgttaca gaattggaat tacacaaaaa 61 ttctaccata ttttgaaagc ttaggttgtt ctgaaaaaaa caatatattg ttttcctggg 121 taaactaaaa gtcccctcga ggaaaggccc ctaaagtgaa acagtgcaaa acgttcaaaa 181 actgtctggc aatacaagtt ccactttgac caaaacggct ggcagtaaaa ggg (SEQ ID NO: 14587).
[00356] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 ttgttctgaa aaaaacaata tattgttttc ctgggtaaac taaaagtccc ctcgaggaaa 61 ggcccctaaa gtgaaacagt gcaaaacgtt caaaaactgt ctggcaatac aagttccact 121 ttgaccaaaa cggctggcag taaaaggg (SEQ ID NO: 14588).
[00357] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 tttgcatttt tagacattta gaagcctata tcttgttaca gaattggaat tacacaaaaa 61 ttctaccata ttttgaaagc ttaggttgtt ctgaaaaaaa caatatattg ttttcctggg 121 taaactaaaa gtcccctcga ggaaaggccc ctaaagtgaa acagtgcaaa acgttcaaaa 181 actgtctggc aatacaagtt ccactttgac caaaacggct ggcagtaaaa gggttat (SEQ ID NO: 14589).
[00358] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 ttgttctgaa aaaaacaata tattgttttc ctgggtaaac taaaagtccc ctcgaggaaa 61 ggcccctaaa gtgaaacagt gcaaaacgtt caaaaactgt ctggcaatac aagttccact 121 ttgggacaaa tcggctggca gtgaaaggg (SEQ ID NO: 14590).
[00359] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma extremidade 3’ de sequência de transposon selecionada de SEQ ID NO: 14574 e SEQ ID NOs: 14587-
14590. Em certas modalidades, a extremidade 3’ de sequência de transposon é seguida por uma sequência alvo 3’. Em certas modalida- des, as extremidades 5’ e 3’ de transposon dividem uma sequência repetida 14 invertida em orientação nas duas extremidades (SEQ ID NO: 14575) adjacentes à sequência alvo. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma ex- tremidade 5’ de transposon compreendendo uma sequência alvo e uma sequência que é selecionada de SEQ ID NOs: 14582-14584 e 14573, e uma extremidade 3’ de transposon compreendendo uma se- quência selecionada de SEQ ID NOs: 14588-14590 e 14574 seguida por uma sequência alvo 3’.
[00360] Em certas modalidades, a extremidade 5’ de transposon do transposon piggyBac ou semelhante à piggyBac compreende 1 atcacgcatg ggatacgtcg tggcagtaaa agggcttaaa tgccaacgac gcgtcccata 61 cgtt (SEQ ID NO: 14591), e uma ITR. Em certas modalidades, a extremidade 5’ de transposon compreende 1 atgacgcatg ggatacgtcg tggcagtaaa agggcttaaa tgccaacgac gcgtcccata 61 cgttgttggc attttaagtc tt (SEQ ID NO: 14592) e uma ITR. Em certas modalidades, a extremidade 3’ de transposon do transposon piggyBac ou semelhante à piggyBac compreende 1 cctgggtaaa ctaaaagtcc cctcgaggaa aggcccctaa agtgaaacag tgcaaaacgt 61 tcaaaaactg tctggcaata caagttccac tttgggacaa atcggc (SEQ ID NO: 14593) e uma ITR. Em certas modalidades, a extremidade 3’ de transposon compreende 1 ttgttctgaa aaaaacaata tattgttttc ctgggtaaac taaaagtccc ctcgaggaaa 61 ggcccctaaa gtgaaacagt gcaaaacgtt caaaaactgt ctggcaatac aagttccact 121 ttgaccaaaa cggc (SEQ ID NO: 14594) e uma ITR.
[00361] Em certas modalidades, uma extremidade de transposon compreende uma sequência que é pelo menos 90%, pelo menos 95%, pelo menos 99% ou qualquer percentagem entre estas idênticas a SEQ ID NO: 14573 e a outra extremidade de transposon compreende uma sequência que é pelo menos 90%, pelo menos 95%, pelo menos 99% ou qualquer percentagem entre estas idênticas a SEQ ID NO:
14574. Em certas modalidades, uma extremidade de transposon com-
preende pelo menos 14, pelo menos 16, pelo menos 18, pelo menos 20 ou pelo menos 25 nucleotídeos contíguos de SEQ ID NO: 14573 e uma extremidade de transposon compreende pelo menos 14, pelo menos 16, pelo menos 18, pelo menos 20 ou pelo menos 25 nucleotí- deos contíguos de SEQ ID NO: 14574. Em certas modalidades, uma extremidade de transposon compreende pelo menos 14, pelo menos 16, pelo menos 18, pelo menos 20 de SEQ ID NO: 14591, e a outra extremidade compreende pelo menos 14, pelo menos 16, pelo menos 18, pelo menos 20 de SEQ ID NO: 14593. Em certas modalidades, ca- da extremidade de transposon compreende SEQ ID NO: 14575 em orientações invertidas.
[00362] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência selecionada de SEQ ID NO: 14573, SEQ ID NO: 14579, SEQ ID NO: 14581, SEQ ID NO: 14582, SEQ ID NO: 14583, e SEQ ID NO: 14588, e uma sequência selecionada de SEQ ID NO: 14587, SEQ ID NO: 14588, SEQ ID NO: 14589 e SEQ ID NO: 14586 e a transposase piggyBac ou semelhante à piggyBac compreende SEQ ID NO: 14517 ou SEQ ID NO: 14518.
[00363] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende ITRs de CCCTTTGCCTGCCA (SEQ ID NO: 14622) (5’ ITR) e TGGCAGTGAAAGGG (SEQ ID NO: 14623) (3’ ITR) adjacentes às sequências alvo.
[00364] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac ou seme- lhante à piggyBac. Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de Helico- verpa armigera. A enzima transposase piggyBac ou semelhante à piggyBac pode compreender ou consistir em uma sequência de ami- noácido pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idênticas a: 1 MASRQRLNHD EIATILENDD DYSPLDSESE KEDCVVEDDV WSDNEDAIVD FVEDTSAQED 61 PDNNIASRES PNLEVTSLTS HRIITLPQRS IRGKNNHVWS TTKGRTTGRT SAINIIRTNR 121 GPTRMCRNIV DPLLCFQLFI TDEIIHEIVK WTNVEIIVKR QNLKDISASY RDTNTMEIWA 181 LVGILTLTAV MKDNHLSTDE LFDATFSGTR YVSVMSRERF EFLIRCIRMD DKTLRPTLRS 241 DDAFLPVRKI WEIFINQCRQ NHVPGSNLTV DEQLLGFRGR CPFRMYIPNK PDKYGIKFPM 301 MCAAATKYMI DAIPILGKST KTNGLPLGEF YVKDLTKTVH GTNRNITCDN WFTSIPLAKN 361 MLQAPINLTI VGTIRSNKRE MPEEIKNSRS RPVGSSMFCF DGPLTLVSYK PKPSKMVFLL 421 SSCDENAVIN ESNGKPDMIL FYNQTKGGVD SFDQMCKSMS ANRKTNRWPM AVFYGMLNMA 481 FVNSYIIYCH NKINKQEKPI SRKEFMKKLS IQLTTPWMQE RLQAPTLKRT LRDNITNVLK 541 NVVPASSENI SNEPEPKKRR YCGVCSYKKR RMTKAQCCKC KKAICGEHNI DVCQDCI (SEQ ID NO: 14525).
[00365] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é isolado ou derivado de Helicoverpa armigera. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência de: 1 ttaaccctag aagcccaatc tacgtaaatt tgacgtatac cgcggcgaaa tatctctgtc 61 tctttcatgt ttaccgtcgg atcgccgcta acttctgaac caactcagta gccattggga 121 cctcgcagga cacagttgcg tcatctcggt aagtgccgcc attttgttgt actctctatt 181 acaacacacg tcacgtcacg tcgttgcacg tcattttgac gtataattgg gctttgtgta 241 acttttgaat ttgtttcaaa ttttttatgt ttgtgattta tttgagttaa tcgtattgtt 301 tcgttacatt tttcatataa taataatatt ttcaggttga gtacaaa (SEQ ID NO: 14570).
[00366] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 agactgtttt tttctaagag acttctaaaa tattattacg agttgattta attttatgaa 61 aacatttaaa actagttgat tttttttata attacataat tttaagaaaa agtgttagag 121 gcttgatttt tttgttgatt ttttctaaga tttgattaaa gtgccataat agtattaata 181 aagagtattt tttaacttaa aatgtatttt atttattaat taaaacttca attatgataa 241 ctcatgcaaa aatatagttc attaacagaa aaaaatagga aaactttgaa gttttgtttt 301 tacacgtcat ttttacgtat gattgggctt tatagctagt taaatatgat tgggcttcta 361 gggttaa (SEQ ID NO: 14528).
[00367] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac ou seme- lhante à piggyBac. Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de Pecti- nophora gossypiella. A enzima transposase piggyBac ou semelhante à piggyBac pode compreender ou consistir em uma sequência de ami- noácido de pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%,
45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idênticas a: 1 MDLRKQDEKI RQWLEQDIEE DSKGESDNSS SETEDIVEME VHKNTSSESE VSSESDYEPV 61 CPSKRQRTQI IESEESDNSE SIRPSRRQTS RVIDSDETDE DVMSSTPQNI PRNPNVIQPS 121 SRFLYGKNKH KWSSAAKPSS VRTSRRNIIH FIPGPKERAR EVSEPIDIFS LFISEDMLQQ 181 VVTFTNAEML IRKNKYKTET FTVSPTNLEE IRALLGLLFN AAAMKSNHLP TRMLFNTHRS 241 GTIFKACMSA ERLNFLIKCL RFDDKLTRNV RQRDDRFAPI RDLWQALISN FQKWYTPGSY 301 ITVDEQLVGF RGRCSFRMYI PNKPNKYGIK LVMAADVNSK YIVNAIPILG KGTDPQNQPL 361 ATFFIKEITS TLHGTNRNIT MDNWFTSVPL ANELLMAPIN LTLVGTLRSN KREIPEKLKN 421 SKSRAIGTSM FCIDGDKTLV SYKAKSNKVV FILSTIHDQP DINQETGKPE MIHFYNSTKG 481 AVDTVDQMCS SISTNRKTQR WPLCVFYNML NLSIINAYVV YVYNNVRNNK KPMSRRDFVI 541 KLGDQLMEPW LRQRLQTVTL RRDIKVMIQD ILGESSDLEA PVPSVSNVRK IYILCPSKAR 601 RMTKHRCIKC KQAICGPHNI DICSRCIE (SEQ ID NO: 14530).
[00368] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é isolado ou derivado de Pectinophora gossypiella. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência de: 1 ttaaccctag ataactaaac attcgtccgc tcgacgacgc gctatgccgc gaaattgaag 61 tttacctatt attccgcgtc ccccgccccc gccgcttttt ctagcttcct gatttgcaaa 121 atagtgcatc gcgtgacacg ctcgaggtca cacgacaatt aggtcgaaag ttacaggaat 181 ttcgtcgtcc gctcgacgaa agtttagtaa ttacgtaagt ttggcaaagg taagtgaatg 241 aagtattttt ttataattat tttttaattc tttatagtga taacgtaagg tttatttaaa 301 tttattactt ttatagttat ttagccaatt gttataaatt ccttgttatt gctgaaaaat 361 ttgcctgttt tagtcaaaat ttattaactt ttcgatcgtt ttttag (SEQ ID NO: 14532).
[00369] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 tttcactaag taattttgtt cctatttagt agataagtaa cacataatta ttgtgatatt 61 caaaacttaa gaggtttaat aaataataat aaaaaaaaaa tggtttttat ttcgtagtct 121 gctcgacgaa tgtttagtta ttacgtaacc gtgaatatag tttagtagtc tagggttaa (SEQ ID NO: 14571).
[00370] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac ou seme- lhante à piggyBac. Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de Cteno- plusia agnata. A enzima transposase piggyBac ou semelhante à piggyBac pode compreender ou consistir em uma sequência de ami- noácido de pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%,
45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idênticas a: 1 MASRQHLYQD EIAAILENED DYSPHDTDSE MEDCVTQDDV RSDVEDEMVD NIGNGTSPAS 61 RHEDPETPDP SSEASNLEVT LSSHRIIILP QRSIREKNNH IWSTTKGQSS GRTAAINIVR 121 TNRGPTRMCR NIVDPLLCFQ LFIKEEIVEE IVKWTNVEMV QKRVNLKDIS ASYRDTNEME 181 IWAIISMLTL SAVMKDNHLS TDELFNVSYG TRYVSVMSRE RFEFLLRLLR MGDKLLRPNL 241 RQEDAFTPVR KIWEIFINQC RLNYVPGTNL TVDEQLLGFR GRCPFRMYIP NKPDKYGIKF 301 PMVCDAATKY MVDAIPILGK STKTQGLPLG EFYVKELTQT VHGTNRNVTC DNWFTSVPLA 361 KSLLNSPINL TLVGTIRSNK REIPEEVKNS RSRQVGSSMF CFDGPLTLVS YKPKPSKMVF 421 LLSSCNEDAV VNQSNGKPDM ILFYNQTKGG VDSFDQMCSS MSTNRKTNRW PMAVFYGMLN 481 MAFVNSYIIY CHNMLAKKEK PLSRKDFMKK LSTDLTTPSM QKRLEAPTLK RSLRDNITNV 541 LKIVPQAAID TSFDEPEPKK RRYCGFCSYK KKRMTKTQCF KCKKPVCGEH NIDVCQDCI (SEQ ID NO: 14534).
[00371] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é isolado ou derivado de Ctenoplusia agnata. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência de: 1 ttaaccctag aagcccaatc tacgtcattc tgacgtgtat gtcgccgaaa atactctgtc 61 tctttctcct gcacgatcgg attgccgcga acgctcgatt caacccagtt ggcgccgaga 121 tctattggag gactgcggcg ttgattcggt aagtcccgcc attttgtcat agtaacagta 181 ttgcacgtca gcttgacgta tatttgggct ttgtgttatt tttgtaaatt ttcaacgtta 241 gtttattatt gcatcttttt gttacattac tggtttattt gcatgtatta ctcaaatatt 301 atttttattt tagcgtagaa aataca (SEQ ID NO: 14535).
[00372] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 agactgtttt ttttgtattt gcattatata ttatattcta aagttgattt aattctaaga 61 aaaacattaa aataagtttc tttttgtaaa atttaattaa ttataagaaa aagtttaagt 121 tgatctcatt ttttataaaa atttgcaatg tttccaaagt tattattgta aaagaataaa 181 taaaagtaaa ctgagtttta attgatgttt tattatatca ttatactata tattacttaa 241 ataaaacaat aactgaatgt atttctaaaa ggaatcacta gaaaatatag tgatcaaaaa 301 tttacacgtc atttttgcgt atgattgggc tttataggtt ctaaaaatat gattgggcct 361 ctagggttaa (SEQ ID NO: 14536).
[00373] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência ITR de CCCTAGAAG- CCCAATC (SEQ ID NO: 14564).
[00374] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac ou seme- lhante à piggyBac. Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de Agrotis ipsilon. A enzima transposase piggyBac (PB) ou semelhante à piggyBac pode compreender ou consistir em uma sequência de ami- noácido de pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idêntica a: 1 MESRQRLNQD EIATILENDD DYSPLDSDSE AEDRVVEDDV WSDNEDAMID YVEDTSRQED 61 PDNNIASQES ANLEVTSLTS HRIISLPQRS ICGKNNHVWS TTKGRTTGRT SAINIIRTNR 121 GPTRMCRNIV DPLLCFQLFI TDEIIHEIVK WTNVEMIVKR QNLIDISASY RDTNTMEMWA 181 LVGILTLTAV MKDNHLSTDE LFDATFSGTR YVSVMSRERF EFLIRCMRMD DKTLRPTLRS 241 DDAFIPVRKL WEIFINQCRL NYVPGGNLTV DEQLLGFRGR CPFRMYIPNK PDKYGIRFPM 301 MCDAATKYMI DAIPILGKST KTNGLPLGEF YVKELTKTVH GTNRNVTCDN WFTSIPLAKN 361 MLQAPINLTI VGTIRSNKRE IPEEIKNSRS RPVGSSMFCF DGPLTLVSYK PKPSRMVFLL 421 SSCDENAVIN ESNGKPDMIL FYNQTKGGVD SFDQMCKSMS ANRKTNRWPM AVFYGMLNMA 481 FVNSYIIYCH NKINKQKKPI NRKEFMKNLS TDLTTPWMQE RLKAPTLKRT LRDNITNVLK 541 NVVPPSPANN SEEPGPKKRS YCGFCSYKKR RMTKTQFYKC KKAICGEHNI DVCQDCV (SEQ ID NO: 14537).
[00375] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é isolado ou derivado de Agrotis ipsilon. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac com- preende uma sequência de: 1 ttaaccctag aagcccaatc tacgtaaatt tgacgtatac cgcggcgaaa tatatctgtc 61 tctttcacgt ttaccgtcgg attcccgcta acttcggaac caactcagta gccattgaga 121 actcccagga cacagttgcg tcatctcggt aagtgccgcc attttgttgt aatagacagg 181 ttgcacgtca ttttgacgta taattgggct ttgtgtaact tttgaaatta tttataattt 241 ttattgatgt gatttatttg agttaatcgt attgtttcgt tacatttttc atatgatatt 301 aatattttca gattgaatat aaa (SEQ ID NO: 14538).
[00376] Em certas modalidades, o transposon piggyBac ou seme- lhante a piggyBac compreende uma sequência de: 1 agactgtttt ttttaaaagg cttataaagt attactattg cgtgatttaa ttttataaaa 61 atatttaaaa ccagttgatt tttttaataa ttacctaatt ttaagaaaaa atgttagaag 121 cttgatattt ttgttgattt ttttctaaga tttgattaaa aggccataat tgtattaata 181 aagagtattt ttaacttcaa atttatttta tttattaatt aaaacttcaa ttatgataat 241 acatgcaaaa atatagttca tcaacagaaa aatataggaa aactctaata gttttatttt 301 tacacgtcat ttttacgtat gattgggctt tatagctagt caaatatgat tgggcttcta 361 gggttaa (SEQ ID NO: 14539).
[00377] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac ou seme-
lhante à piggyBac. Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de Mega- chile rotundata. A enzima transposase piggyBac (PB) ou semelhante à piggyBac pode compreender ou consistir em uma sequência de ami- noácido de pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idêntica a: 1 MNGKDSLGEF ILDDLSDCLD CRSASSTDDE SDSSNIAIRK RCPIPLIYSD SEDEDMNNNV 61 EDNNHFVKES NRYHYQIVEK YKITSKTKKW KDVTVTEMKK FLGLIILMGQ VKKDVLYDYW 121 STDPSIETPF FSKVMSRNRF LQIMQSWHFY NNNDISPNSH RLVKIQPVID YFKEKFNNVY 181 KSDQQLSLDE CLIPWRGRLS IKTYNPAKIT KYGILVRVLS EARTGYVSNF CVYAADGKKI 241 EETVLSVIGP YKNMWHHVYQ DNYYNSVNIA KIFLKNKLRV CGTIRKNRSL PQILQTVKLS 301 RGQHQFLRNG HTLLEVWNNG KRNVNMISTI HSAQMAESRN RSRTSDCPIQ KPISIIDYNK 361 YMKGVDRADQ ILSYYSIFRK TKKWTKRVVM FFINCALFNS FKVYTTLNGQ KITYKNFLHK 421 AALSLIEDCG TEEQGTDLPN SEPTTTRTTS RVDHPGRLEN FGKHKLVNIV TSGQCKKPLR 481 QCRVCASKKK LSRTGFACKY CNVPLHKGDC FERYHSLKKY (SEQ ID NO: 14540).
[00378] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é isolado ou derivado de Megachile rotundata. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência de: 1 ttaaataatg cccactctag atgaacttaa cactttaccg accggccgtc gattattcga 61 cgtttgctcc ccagcgctta ccgaccggcc atcgattatt cgacgtttgc ttcccagcgc 121 ttaccgaccg gtcatcgact tttgatcttt ccgttagatt tggttaggtc agattgacaa 181 gtagcaagca tttcgcattc tttattcaaa taatcggtgc ttttttctaa gctttagccc 241 ttagaa (SEQ ID NO: 14541).
[00379] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 acaacttctt ttttcaacaa atattgttat atggattatt tatttattta tttatttatg 61 gtatatttta tgtttattta tttatggtta ttatggtata ttttatgtaa ataataaact 121 gaaaacgatt gtaatagatg aaataaatat tgttttaaca ctaatataat taaagtaaaa 181 gattttaata aatttcgtta ccctacaata acacgaagcg tacaatttta ccagagttta 241 ttaa (SEQ ID NO: 14542).
[00380] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac ou seme- lhante à piggyBac. Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de Bombus impatiens. A enzima transposase piggyBac (PB) ou semelhante à piggyBac pode compreender ou consistir em uma sequência de ami- noácido de pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idêntica a: 1 MNEKNGIGEF ILDDLSDCPD SYSRSNSGDE SDGSDTIIRK RGSVLPPRYS DSEDDEINNV 61 EDNANNVENN DDIWSTNDEA IILEPFEGSP GLKIMPSSAE SVTDNVNLFF GDDFFEHLVR 121 ESNRYHYQVM EKYKIPSKAK KWTDITVPEM KKFLGLIVLM GQIKKDVLYD YWSTDPSIET 181 PFFSQVMSRN RFVQIMQSWH FCNNDNIPHD SHRLAKIQPV IDYFRRKFND VYKPCQQLSL 241 DESIIPWRGR LSIKTYNPAK ITKYGILVRV LSEAVTGYVC NFDVYAADGK KLEDTAVIEP 301 YKNIWHQIYQ DNYYNSVKMA RILLKNKVRV CGTIRKNRGL PRSLKTIQLS RGQYEFRRNH 361 QILLEVWNNG RRNVNMISTI HSAQLMESRS KSKRSDVPIQ KPNSIIDYNK YMKGVDRADQ 421 ILAYYSIFRK TKKWTKRVVM FFINCALFNS FRVYTILNGK NITYKNFLHK VAVSWIEDGE 481 TNCTEQDDNL PNSEPTRRAP RLDHPGRLSN YGKHKLINIV TSGRSLKPQR QCRVCAVQKK 541 RSRTCFVCKF CNVPLHKGDC FERYHTLKKY (SEQ ID NO: 14543).
[00381] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é isolado ou derivado de Bombus impatiens. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência de: 1 ttaatttttt aacattttac cgaccgatag ccgattaatc gggtttttgc cgctgacgct 61 taccgaccga taacctatta atcggctttt tgtcgtcgaa gcttaccaac ctatagccta 121 cctatagtta atcggttgcc atggcgataa acaatctttc tcattatatg agcagtaatt 181 tgttatttag tactaaggta ccttgctcag ttgcgtcagt tgcgttgctt tgtaagctcc 241 cacagtttta taccaattcg aaaaacttac cgttcgcg (SEQ ID NO: 14544).
[00382] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 actatttcac atttgaacta aaaaccgttg taatagataa aataaatata atttagtatt 61 aatattatgg aaacaaaaga ttttattcaa tttaattatc ctatagtaac aaaaagcggc 121 caattttatc tgagcatacg aaaagcacag atactcccgc ccgacagtct aaaccgaaac 181 agagccggcg ccagggagaa tctgcgcctg agcagccggt cggacgtgcg tttgctgttg 241 aaccgctagt ggtcagtaaa ccagaaccag tcagtaagcc agtaactgat cagttaacta 301 gattgtatag ttcaaattga acttaatcta gtttttaagc gtttgaatgt tgtctaactt 361 cgttatatat tatattcttt ttaa (SEQ ID NO: 14545).
[00383] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac ou seme- lhante à piggyBac. Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de Mames-
tra brassicae. A enzima transposase piggyBac (PB) ou semelhante à piggyBac pode compreender ou consistir em uma sequência de ami- noácido de pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idêntica a: 1 MFSFVPNKEQ TRTVLIFCFH LKTTAAESHR PLVEAFGEQV PTVKTCERWF QRFKSGDFDV 61 DDKEHGKPPK RYEDAELQAL LDEDDAQTQK QLAEQLEVSQ QAVSNRLREG GKIQKVGRWV 121 PHELNERQRE RRKNTCEILL SRYKRKSFLH RIVTGEEKWI FFVNPKRKKS YVDPGQPATS 181 TARPNRFGKK TRLCVWWDQS GVIYYELLKP GETVNTARYQ QQLINLNRAL QRKRPEYQKR 241 QHRVIFLHDN APSHTARAVR DTLETLNWEV LPHAAYSPDL APSDYHLFAS MGHALAEQRF 301 DSYESVEEWL DEWFAAKDDE FYWRGIHKLP ERWDNCVASD GKYFE (SEQ ID NO: 14546).
[00384] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é isolado ou derivado de Mamestra brassicae. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência de: 1 ttattgggtt gcccaaaaag taattgcgga tttttcatat acctgtcttt taaacgtaca 61 tagggatcga actcagtaaa actttgacct tgtgaaataa caaacttgac tgtccaacca 121 ccatagtttg gcgcgaattg agcgtcataa ttgttttgac tttttgcagt caac (SEQ ID NO: 14547).
[00385] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 atgatttttt ctttttaaac caattttaat tagttaattg atataaaaat ccgcaattac 61 tttttgggca acccaataa (SEQ ID NO: 14548).
[00386] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac ou seme- lhante à piggyBac. Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de Mayetio- la destructor. A enzima transposase piggyBac (PB) ou semelhante à piggyBac pode compreender ou consistir em uma sequência de ami- noácido de pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idêntica a: 1 MENFENWRKR RHLREVLLGH FFAKKTAAES HRLLVEVYGE HALAKTQCFE WFQRFKSGDF 61 DTEDKERPGQ PKKFEDEELE ALLDEDCCQT QEELAKSLGV TQQAISKRLK AAGYIQKQGN 121 WVPHELKPRD VERRFCMSEM LLQRHKKKSF LSRIITGDEK WIHYDNSKRK KSYVKRGGRA
181 KSTPKSNLHG AKVMLCIWWD QRGVLYYELL EPGQTITGDL YRTQLIRLKQ ALAEKRPEYA 241 KRHGAVIFHH DNARPHVALP VKNILENSGW EVLPHPPISP DLAPSDYHLF RSMQNDLAGK 301 RFTSEQGIRK WLDSFLAAKP AKFFEKGIHE LSERWEKVIA SDGQYFE (SEQ ID NO: 14549).
[00387] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é isolado ou derivado de Mayetiola destructor. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência de: 1 taagacttcc aaaatttcca cccgaacttt accttccccg cgcattatgt ctctcttttc 61 accctctgat ccctggtatt gttgtcgagc acgatttata ttgggtgtac aacttaaaaa 121 ccggaattgg acgctagatg tccacactaa cgaatagtgt aaaagcacaa atttcatata 181 tacgtcattt tgaaggtaca tttgacagct atcaaaatca gtcaataaaa ctattctatc 241 tgtgtgcatc atattttttt attaact (SEQ ID NO: 14550).
[00388] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 tgcattcatt cattttgtta tcgaaataaa gcattaattt tcactaaaaa attccggttt 61 ttaagttgta cacccaatat catccttagt gacaattttc aaatggcttt cccattgagc 121 tgaaaccgtg gctctagtaa gaaaaacgcc caacccgtca tcatatgcct tttttttctc 181 aacatccg (SEQ ID NO: 14551).
[00389] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac ou seme- lhante à piggyBac. Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de Apis mellifera. A enzima transposase piggyBac (PB) ou semelhante à piggyBac pode compreender ou consistir em uma sequência de ami- noácido de pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idêntica a: 1 MENQKEHYRH ILLFYFRKGK NASQAHKKLC AVYGDEALKE RQCQNWFDKF RSGDFSLKDE 61 KRSGRPVEVD DDLIKAIIDS DRHSTTREIA EKLHVSHTCI ENHLKQLGYV QKLDTWVPHE 121 LKEKHLTQRI NSCDLLKKRN ENDPFLKRLI TGDEKWVVYN NIKRKRSWSR PREPAQTTSK 181 AGIHRKKVLL SVWWDYKGIV YFELLPPNRT INSVVYIEQL TKLNNAVEEK RPELTNRKGV 241 VFHHDNARPH TSLVTRQKLL ELGWDVLPHP PISPDLAPSD YFLFRSLQNS LNGKNFNNDD 301 DIKSILIQFF ANKNQKFYER GIMMLPERWQ KVIDQNGQHI TE (SEQ ID NO: 14552).
[00390] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é isolado ou derivado de Apis mellifera. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac com-
preende uma sequência de: 1 ttgggttggc aactaagtaa ttgcggattt cactcataga tggcttcagt tgaattttta 61 ggtttgctgg cgtagtccaa atgtaaaaca cattttgtta tttgatagtt ggcaattcag 121 ctgtcaatca gtaaaaaaag ttttttgatc ggttgcgtag ttttcgtttg gcgttcgttg 181 aaaa (SEQ ID NO: 14553).
[00391] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 agttatttag ttccatgaaa aaattgtctt tgattttcta aaaaaaatcc gcaattactt 61 agttgccaat ccaa (SEQ ID NO: 14554).
[00392] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac ou seme- lhante à piggyBac. Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de Messor bouvieri. A enzima transposase piggyBac (PB) ou semelhante à piggyBac pode compreender ou consistir em uma sequência de ami- noácido de pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idêntica a: 1 MSSFVPENVH LRHALLFLFH QKKRAAESHR LLVETYGEHA PTIRTCETWF RQFKCGDFNV 61 QDKERPGRPK TFEDAELQEL LDEDSTQTQK QLAEKLNVSR VAICERLQAM GKIQKMGRWV 121 PHELNDRQME NRKIVSEMLL QRYERKSFLH RIVTGDEKWI YFENPKRKKS WLSPGEAGPS 181 TARPNRFGRK TMLCVWWDQI GVVYYELLKP GETVNTDRYR QQMINLNCAL IEKRPQYAQR 241 HDKVILQHDN APSHTAKPVK EMLKSLGWEV LSHPPISPDL APSDYHLFAS MGHALAEQHF 301 ADFEEVKKWL DEWFSSKEKL FFWNGIHKLS ERWTKCIESN GQYFE (SEQ ID NO: 14555).
[00393] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é isolado ou derivado de Messor bouvieri. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac com- preende uma sequência de: 1 agtcagaaat gacacctcga tcgacgacta atcgacgtct aatcgacgtc gattttatgt 61 caacatgtta ccaggtgtgt cggtaattcc tttccggttt ttccggcaga tgtcactagc 121 cataagtatg aaatgttatg atttgataca tatgtcattt tattctactg acattaacct 181 taaaactaca caagttacgt tccgccaaaa taacagcgtt atagatttat aattttttga 241 aa (SEQ ID NO: 14556).
[00394] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 ataaatttga actatccatt ctaagtaacg tgttttcttt aacgaaaaaa ccggaaaaga
61 attaccgaca ctcctggtat gtcaacatgt tattttcgac attgaatcgc gtcgattcga 121 agtcgatcga ggtgtcattt ctgact (SEQ ID NO: 14557).
[00395] Em certas modalidades dos métodos da presente invenção, a enzima transposase é uma enzima transposase piggyBac ou seme- lhante à piggyBac. Em certas modalidades, a enzima transposase piggyBac ou semelhante à piggyBac é isolada ou derivada de Tricho- plusia ni. A enzima transposase piggyBac (PB) ou semelhante à piggyBac pode compreender ou consistir em uma sequência de ami- noácido de pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou qualquer percentagem entre estas idêntica a: 1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEV SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG 61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG 121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTSATFRD TNEDEIYAFF 181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV 241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RVYIPNKPSK YGIKILMMCD 301 SGTKYMINGM PILGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ 361 EPIKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVILLSSC 421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN 481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRILRD NISNILPKEV 541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF (SEQ ID NO: 14558).
[00396] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é isolado ou derivado de Trichoplusia ni. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac com- preende uma sequência de: 1 ttaaccctag aaagatagtc tgcgtaaaat tgacgcatgc attcttgaaa tattgctctc 61 tctttctaaa tagcgcgaat ccgtcgctgt gcatttagga catctcagtc gccgcttgga 121 gctcccgtga ggcgtgcttg tcaatgcggt aagtgtcact gattttgaac tataacgacc 181 gcgtgagtca aaatgacgca tgattatctt ttacgtgact tttaagattt aactcatacg 241 ataattatat tgttatttca tgttctactt acgtgataac ttattatata tatattttct 301 tgttatagat atc (SEQ ID NO: 14559).
[00397] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 tttgttactt tatagaagaa attttgagtt tttgtttttt tttaataaat aaataaacat 61 aaataaattg tttgttgaat ttattattag tatgtaagtg taaatataat aaaacttaat 121 atctattcaa attaataaat aaacctcgat atacagaccg ataaaacaca tgcgtcaatt 181 ttacgcatga ttatctttaa cgtacgtcac aatatgatta tctttctagg gttaa (SEQ ID NO:
14560).
[00398] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 ccctagaaag atagtctgcg taaaattgac gcatgcattc ttgaaatatt gctctctctt 61 tctaaatagc gcgaatccgt cgctgtgcat ttaggacatc tcagtcgccg cttggagctc 121 ccgtgaggcg tgcttgtcaa tgcggtaagt gtcactgatt ttgaactata acgaccgcgt 181 gagtcaaaat gacgcatgat tatcttttac gtgactttta agatttaact catacgataa 241 ttatattgtt atttcatgtt ctacttacgt gataacttat tatatatata ttttcttgtt 301 atagatatc (SEQ ID NO: 14561).
[00399] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 tttgttactt tatagaagaa attttgagtt tttgtttttt tttaataaat aaataaacat 61 aaataaattg tttgttgaat ttattattag tatgtaagtg taaatataat aaaacttaat 121 atctattcaa attaataaat aaacctcgat atacagaccg ataaaacaca tgcgtcaatt 181 ttacgcatga ttatctttaa cgtacgtcac aatatgatta tctttctagg g (SEQ ID NO: 14562).
[00400] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 tctaaatagc gcgaatccgt cgctgtgcat ttaggacatc tcagtcgccg cttggagctc 61 ccgtgaggcg tgcttgtcaa tgcggtaagt gtcactgatt ttgaactata acgaccgcgt 121 gagtcaaaat gacgcatgat tatcttttac gtgactttta agatttaact catacgataa 181 ttatattgtt atttcatgtt ctacttacgt gataacttat tatatatata ttttcttgtt 241 atagatatc (SEQ ID NO: 14609).
[00401] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende uma sequência de: 1 tttgttactt tatagaagaa attttgagtt tttgtttttt tttaataaat aaataaacat 61 aaataaattg tttgttgaat ttattattag tatgtaagtg taaatataat aaaacttaat 121 atctattcaa attaataaat aaacctcgat atacagaccg ataaaacaca tgcgtcaatt 181 ttacgcatga ttatctttaa cgtacgtcac aatatgatta tctttctagg g (SEQ ID NO: 14610).
[00402] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac compreende SEQ ID NO: 14561 e SEQ ID NO: 14562, e a transposase piggyBac ou semelhante à piggyBac compre- ende SEQ ID NO: 14558. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende SEQ ID NO: 14609 e SEQ ID NO: 14610, e a transposase piggyBac ou semelhante à piggyBac compreende SEQ ID NO: 14558.
[00403] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é isolado ou derivado de Aphis gossypii. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac com- preende uma sequência ITR de CCTTCCAGCGGGCGCGC (SEQ ID NO: 14565).
[00404] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é isolado ou derivado de Chilo suppressalis. Em cer- tas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência ITR de CCCAGATTAGCCT (SEQ ID NO: 14566).
[00405] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é isolado ou derivado de Heliothis virescens. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência ITR de CCCTTAATTACTCGCG (SEQ ID NO: 14567).
[00406] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é isolado ou derivado de Pectinophora gossypiella. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência ITR de CCCTAGATAACTAAAC (SEQ ID NO: 14568).
[00407] Em certas modalidades, o transposon piggyBac ou seme- lhante à piggyBac é isolado ou derivado de Anopheles stephensi. Em certas modalidades, o transposon piggyBac ou semelhante à piggyBac compreende uma sequência ITR de CCCTAGAAAGATA (SEQ ID NO: 14569).
[00408] Os transposons de DNA da família hAT são comuns em plantas e animais. Vários sistemas de transposon hAT ativos foram identificados e considerados funcionais, incluindo, porém, não limita- dos a, o transposon Hermes, transposon Ac, transposon hobo, e o transposon Tol2. A família hAT é composta por duas famílias que fo-
ram classificadas como a subfamília AC e a subfamília Buster, com base na sequência primária de suas transposases. Os membros da família hAT pertencem aos elementos transponíveis da Classe II. Os elementos móveis de Classe II utilizam um mecanismo de recorte e cola de transposição. Os elementos hAT dividem transposases seme- lhantes, repetições invertidas terminais curtas e uma duplicação de oito pares de bases do alvo genômico.
[00409] Composições e métodos da presente invenção podem compreender um transposon TcBuster e/ou uma transposase TcBus- ter.
[00410] Composições e métodos da presente invenção podem compreender um transposon TcBuster e/ou uma transposase hiperati- va TcBuster. Uma transposase hiperativa TcBuster demonstra aumen- to da excisão e/ou frequência de inserção quando comparada a uma excisão e/ou frequência de inserção de uma transposase TcBuster tipo selvagem. Uma transposase TcBuster hiperativa demonstra aumento da frequência de transposição quando comparada a uma frequência de transposição de uma transposase TcBuster tipo selvagem.
[00411] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster tipo selvagem compre- ende ou consiste em uma sequência de aminoácido de: 1 MMLNWLKSGK LESQSQEQSS CILENSNCLP PTLDSTDIIG EENKAGTTSR KKRKYDEDIL 61 NFGFTWTGDK DEPNGLCVIC EQVVNNSSLN PAKLKRHLDT KHPTLKGKSE YFKRKCNELN 121 QKKHTFERYV RDDNKNLLKA SILVSLRIAK QGEAYTIAEK LIKPCTKDLT TCVFGEKFAS 181 KVDLVPLSDT TISRRIEDMS YFCEAVLVNR LENAKCGFTL QMDESTDVAG LAILLVFVRY 241 IHESSFEEDM LFCKALPTQT TGEEIFNLLN AYFEKHSIPW NLCIHICTDG AKAMVGVIKG 301 VIARIKKLVP DIKASHCCLH RHALAVKRIP NALHEVLNDA VKMINFIKSR PLNARVFALL 361 CDDLGSLHKN LLLHTEVRWL SRGKVLTRFW ELRDEIRIFF NEREFAGKLN DTSWLQNLAY 421 IADIFSILNE VNLSLQGPNS TIFKVNSRIN SIKSKLKLWE ECITKNNTEC FANLNDFLET 481 SNTALDPNLK SNILEHLNGL KNTFLEYFPP TCNNISWVEN PFNECGNVDT LPIKEREQLI 541 DIRTDTTLKS SFVPDGIGPF WIKLMDEFPE ISKRAVKELM PFVTTILCEK SFSVYVATKT 601 KYRNRLDAED DMRLQLTTIH PDIDNLCNNK QAQKSH (número de acesso GenBank ABF20545 e SEQ ID NO: 17900).
[00412] Em algumas modalidades das composições e métodos da presente invenção, a transposase TcBuster compreende ou consiste em uma sequência tendo pelo menos 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 99% ou qualquer identidade de porcentagem entre para uma transpo- sase TcBuster tipo selvagem compreendendo ou consistindo em uma sequência de aminoácido de: 1 MMLNWLKSGK LESQSQEQSS CILENSNCLP PTLDSTDIIG EENKAGTTSR KKRKYDEDIL 61 NFGFTWTGDK DEPNGLCVIC EQVVNNSSLN PAKLKRHLDT KHPTLKGKSE YFKRKCNELN 121 QKKHTFERYV RDDNKNLLKA SILVSLRIAK QGEAYTIAEK LIKPCTKDLT TCVFGEKFAS 181 KVDLVPLSDT TISRRIEDMS YFCEAVLVNR LENAKCGFTL QMDESTDVAG LAILLVFVRY 241 IHESSFEEDM LFCKALPTQT TGEEIFNLLN AYFEKHSIPW NLCIHICTDG AKAMVGVIKG 301 VIARIKKLVP DIKASHCCLH RHALAVKRIP NALHEVLNDA VKMINFIKSR PLNARVFALL 361 CDDLGSLHKN LLLHTEVRWL SRGKVLTRFW ELRDEIRIFF NEREFAGKLN DTSWLQNLAY 421 IADIFSILNE VNLSLQGPNS TIFKVNSRIN SIKSKLKLWE ECITKNNTEC FANLNDFLET 481 SNTALDPNLK SNILEHLNGL KNTFLEYFPP TCNNISWVEN PFNECGNVDT LPIKEREQLI 541 DIRTDTTLKS SFVPDGIGPF WIKLMDEFPE ISKRAVKELM PFVTTILCEK SFSVYVATKT 601 KYRNRLDAED DMRLQLTTIH PDIDNLCNNK QAQKSH (número de acesso GenBank ABF20545 e SEQ ID NO: 17900).
[00413] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster tipo selvagem é codifi- cada por uma sequência de ácido nucleico compreendendo ou consis- tindo em: 1 atgatgttga attggctgaa aagtggaaag cttgaaagtc aatcacagga acagagttcc 61 tgctaccttg agaactctaa ctgcctgcca ccaacgctcg attctacaga tattatcggt 121 gaagagaaca aagctggtac cacctctcgc aagaagcgga aatatgacga ggactatctg 181 aacttcggtt ttacatggac tggcgacaag gatgagccca acggactttg tgtgatttgc 241 gagcaggtag tcaacaattc ctcacttaac ccggccaaac tgaaacgcca tttggacaca 301 aagcatccga cgcttaaagg caagagcgaa tacttcaaaa gaaaatgtaa cgagctcaat 361 caaaagaagc atacttttga gcgatacgta agggacgata acaagaacct cctgaaagct 421 tcttatctcg tcagtttgag aatagctaaa cagggcgagg catataccat agcggagaag 481 ttgatcaagc cttgcaccaa ggatctgaca acttgcgtat ttggagaaaa attcgcgagc 541 aaagttgatc tcgtccccct gtccgacacg actatttcaa ggcgaatcga agacatgagt 601 tacttctgtg aagccgtgct ggtgaacagg ttgaaaaatg ctaaatgtgg gtttacgctg 661 cagatggacg agtcaacaga tgttgccggt cttgcaatcc tgcttgtgtt tgttaggtac 721 atacatgaaa gctcttttga ggaggatatg ttgttctgca aagcacttcc cactcagacg 781 acaggggagg agattttcaa tcttctcaat gcctatttcg aaaagcactc catcccatgg 841 aatctgtgtt accacatttg cacagacggt gccaaggcaa tggtaggagt tattaaagga 901 gtcatagcga gaataaaaaa actcgtccct gatataaaag ctagccactg ttgcctgcat 961 cgccacgctt tggctgtaaa gcgaataccg aatgcattgc acgaggtgct caatgacgct 1021 gttaaaatga tcaacttcat caagtctcgg ccgttgaatg cgcgcgtctt cgctttgctg
1081 tgtgacgatt tggggagcct gcataaaaat cttcttcttc ataccgaagt gaggtggctg 1141 tctagaggaa aggtgctgac ccgattttgg gaactgagag atgaaattag aattttcttc 1201 aacgaaaggg aatttgccgg gaaattgaac gacaccagtt ggttgcaaaa tttggcatat 1261 atagctgaca tattcagtta tctgaatgaa gttaatcttt ccctgcaagg gccgaatagc 1321 acaatcttca aggtaaatag ccgcattaac agtattaaat caaagttgaa gttgtgggaa 1381 gagtgtataa cgaaaaataa cactgagtgt tttgcgaacc tcaacgattt tttggaaact 1441 tcaaacactg cgttggatcc aaacctgaag tctaatattt tggaacatct caacggtctt 1501 aagaacacct ttctggagta ttttccacct acgtgtaata atatctcctg ggtggagaat 1561 cctttcaatg aatgcggtaa cgtcgataca ctcccaataa aagagaggga acaattgatt 1621 gacatacgga ctgatacgac attgaaatct tcattcgtgc ctgatggtat aggaccattc 1681 tggatcaaac tgatggacga atttccagaa attagcaaac gagctgtcaa agagctcatg 1741 ccatttgtaa ccacttacct ctgtgagaaa tcattttccg tctatgtagc cacaaaaaca 1801 aaatatcgaa atagacttga tgctgaagac gatatgcgac tccaacttac tactatccat 1861 ccagacattg acaacctttg taacaacaag caggctcaga aatcccactg a (número de acesso GenBank DQ481197 e SEQ ID NO: 17901).
[00414] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster compreende ou consis- te em uma sequência tendo pelo menos 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 99% ou qualquer identidade de porcentagem entre para uma transpo- sase TcBuster tipo selvagem codificada por uma sequência de ácido nucleico compreendendo ou consistindo em: 1 atgatgttga attggctgaa aagtggaaag cttgaaagtc aatcacagga acagagttcc 61 tgctaccttg agaactctaa ctgcctgcca ccaacgctcg attctacaga tattatcggt 121 gaagagaaca aagctggtac cacctctcgc aagaagcgga aatatgacga ggactatctg 181 aacttcggtt ttacatggac tggcgacaag gatgagccca acggactttg tgtgatttgc 241 gagcaggtag tcaacaattc ctcacttaac ccggccaaac tgaaacgcca tttggacaca 301 aagcatccga cgcttaaagg caagagcgaa tacttcaaaa gaaaatgtaa cgagctcaat 361 caaaagaagc atacttttga gcgatacgta agggacgata acaagaacct cctgaaagct 421 tcttatctcg tcagtttgag aatagctaaa cagggcgagg catataccat agcggagaag 481 ttgatcaagc cttgcaccaa ggatctgaca acttgcgtat ttggagaaaa attcgcgagc 541 aaagttgatc tcgtccccct gtccgacacg actatttcaa ggcgaatcga agacatgagt 601 tacttctgtg aagccgtgct ggtgaacagg ttgaaaaatg ctaaatgtgg gtttacgctg 661 cagatggacg agtcaacaga tgttgccggt cttgcaatcc tgcttgtgtt tgttaggtac 721 atacatgaaa gctcttttga ggaggatatg ttgttctgca aagcacttcc cactcagacg 781 acaggggagg agattttcaa tcttctcaat gcctatttcg aaaagcactc catcccatgg 841 aatctgtgtt accacatttg cacagacggt gccaaggcaa tggtaggagt tattaaagga 901 gtcatagcga gaataaaaaa actcgtccct gatataaaag ctagccactg ttgcctgcat 961 cgccacgctt tggctgtaaa gcgaataccg aatgcattgc acgaggtgct caatgacgct 1021 gttaaaatga tcaacttcat caagtctcgg ccgttgaatg cgcgcgtctt cgctttgctg 1081 tgtgacgatt tggggagcct gcataaaaat cttcttcttc ataccgaagt gaggtggctg
1141 tctagaggaa aggtgctgac ccgattttgg gaactgagag atgaaattag aattttcttc 1201 aacgaaaggg aatttgccgg gaaattgaac gacaccagtt ggttgcaaaa tttggcatat 1261 atagctgaca tattcagtta tctgaatgaa gttaatcttt ccctgcaagg gccgaatagc 1321 acaatcttca aggtaaatag ccgcattaac agtattaaat caaagttgaa gttgtgggaa 1381 gagtgtataa cgaaaaataa cactgagtgt tttgcgaacc tcaacgattt tttggaaact 1441 tcaaacactg cgttggatcc aaacctgaag tctaatattt tggaacatct caacggtctt 1501 aagaacacct ttctggagta ttttccacct acgtgtaata atatctcctg ggtggagaat 1561 cctttcaatg aatgcggtaa cgtcgataca ctcccaataa aagagaggga acaattgatt 1621 gacatacgga ctgatacgac attgaaatct tcattcgtgc ctgatggtat aggaccattc 1681 tggatcaaac tgatggacga atttccagaa attagcaaac gagctgtcaa agagctcatg 1741 ccatttgtaa ccacttacct ctgtgagaaa tcattttccg tctatgtagc cacaaaaaca 1801 aaatatcgaa atagacttga tgctgaagac gatatgcgac tccaacttac tactatccat 1861 ccagacattg acaacctttg taacaacaag caggctcaga aatcccactg a (número de acesso GenBank DQ481197 e SEQ ID NO: 17901).
[00415] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster compreende ou con- siste em uma sequência de aminoácido de ocorrência natural.
[00416] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster compreende ou con- siste em um sequência de aminoácido de ocorrência não natural.
[00417] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster é codificada por uma sequência compreendendo ou consistindo em uma sequência de ácido nucleico de ocorrência natural.
[00418] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster é codificada por uma sequência compreendendo ou consistindo em uma sequência de ácido nucleico de ocorrência não natural.
[00419] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster mutante compreende um ou mais variações de sequência quando comparada a uma trans- posase TcBuster tipo selvagem. Em algumas modalidades, a transpo- sase TcBuster de tipo selvagem compreende ou consiste em uma se- quência de aminoácido de SEQ ID NO: 17900. Em algumas modalida- des, a transposase TcBuster de tipo selvagem é codificada por uma sequência compreendendo ou consistindo na sequência de ácido nu- cleico de SEQ ID NO: 17901. Em algumas modalidades, as referidas uma ou mais variações de sequência compreendem uma ou mais den- tre uma substituição, inversão, inserção, deleção, transposição e mu- dança do quatro. Em algumas modalidades, as referidas uma ou mais variações de sequência compreendem um aminoácido de ocorrência não natural, modificado, sintético ou artificial. Em algumas modalida- des, as referidas uma ou mais variações de sequência compreendem um ácido nucleico modificado, sintético, artificial ou de ocorrência não natural.
[00420] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster mutante compreende uma ou mais variações de sequência quando comparada a uma trans- posase TcBuster tipo selvagem. Em algumas modalidades, as referi- das uma ou mais variações de sequência compreendem uma substi- tuição de aminoácido em um ou mais dentre um domínio de oligomeri- zação e ligação de DNA, uma dompinio de inserção e um domínio de Zn-BED.
[00421] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster mutante compreende uma ou mais variações de sequência quando comparada a uma trans- posase TcBuster tipo selvagem. Em algumas modalidades, as referi- das uma ou mais variações de sequência compreendem uma substi- tuição de aminoácido que aumenta uma carga líquida para um pH neu- tro quando comparada a uma transposase TcBuster tipo selvagem. Em algumas modalidades, a transposase TcBuster de tipo selvagem compreende ou consiste em uma sequência de aminoácido de SEQ ID NO: 17900. Em algumas modalidades, a transposase TcBuster de tipo selvagem é codificada por uma sequência compreendendo ou consis- tindo na sequência de ácido nucleico de SEQ ID NO: 17901. Em al-
gumas modalidades, as referidas uma ou mais variações de sequência compreendem uma substituição de aminoácido do ácido aspártico (D) na posição 223 (D223), o ácido aspártico (D) na posição 289 (D289) e o ácido aspártico (E) na posição 589 (E289) de SEQ ID NO: 17900. Em algumas modalidades, as referidas uma ou mais variações de se- quência compreendem uma substituição de aminoácido dentro de 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 ou qualquer número de aminoácidos entre as posições 223, 289 e/ou 289 de SEQ ID NO: 17900. Em algumas modalidades, as referi- das uma ou mais variações de sequência compreendem uma substi- tuição de aminoácido dentro de 70 aminoácidos de posição 223, 289 e/ou 289 de SEQ ID NO: 17900. Em algumas modalidades, as referi- das uma ou mais variações de sequência compreendem uma substi- tuição de aminoácido dentro de 80 aminoácidos de posição 223, 289 e/ou 289 de SEQ ID NO: 17900. Em algumas modalidades, as referi- das uma ou mais variações de sequência compreendem uma substi- tuição de aminoácido de um ácido aspártico (D) ou um ácido aspártico (E) por um aminoácido neutro, uma lisina (L) ou uma arginina (R) (por exemplo, D223L, D223R, D289L, D289R, E289L, E289R de SEQ ID NO: 17900).
[00422] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster mutante compreende uma ou mais variações de sequência quando comparada a uma trans- posase TcBuster tipo selvagem. Em algumas modalidades, as referi- das uma ou mais variações de sequência compreendem um ou mais dentre Q82E, N85S, D99A, D132A, Q151S, Q151A, E153K, E153R, A154P, Y155H, E159A, T171K, T171R, K177E, D183K, D183R, D189A, T191E, S193K, S193R, Y201A, F202D, F202K, C203I, C203V, Q221T, M222L, I223Q, E224G, S225W, D227A, R239H, E243A, E247K, P257K, P257R, Q258T, E263A, E263K, E263R,
E274K, E274R, S278K, N281E, L282K, L282R, K292P, V297K, K299S, A303T, H322E, A332S, A358E, A358K, A358S, D376A, V377T, L380N, I398D, I398S, I398K, F400L, V431L, S447E, N450K, N450R, I452F, E469K, K469K, P510D, P510N, E517R, R536S, V553S, P554T, P559D, P559S, P559K, K573E, E578L, K590T, Y595L, V596A, T598I, K599A, Q615A, T618K, T618K, T618R, D622K e D622R de SEQ ID NO: 17900. Em algumas modalidades, as referidas uma ou mais variações de sequência compreendem uma substituição de aminoácido dentro de 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 ou qualquer número de aminoácidos entre as posições 154, 155, 159, 171, 177, 183, 189, 191, 193, 201, 202, 203, 221, 223, 224, 225, 227, 239, 243, 247, 257, 258, 263, 274, 278, 281, 282, 292, 297, 299, 303, 322, 332, 358, 376, 377, 380, 398, 400, 431, 447, 450, 452, 469, 510, 517, 536, 553, 554, 559, 573, 578, 590, 595, 596, 598, 599, 615, 618, e 622 de SEQ ID NO: 17900.
[00423] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster mutante compreende uma ou mais variações de sequência quando comparada a uma trans- posase TcBuster tipo selvagem. Em algumas modalidades, as referi- das uma ou mais variações de sequência compreendem um ou mais dentre E247K, V297K, A358K, S278K, E247R, E274R, V297R, A358R, S278R, T171R, D183R, S193R, P257K, E263R, L282K, T618K, D622R, E153K, N450K, T171K, D183K, S193K, P257R, E263K, L282R, T618R, D622K, E153R e N450R de SEQ ID NO: 17900. Em algumas modalidades, as referidas uma ou mais variações de sequên- cia compreendem uma substituição de aminoácido dentro de 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 ou qualquer número de aminoácidos entre as posições 153, 171, 183, 193, 247, 257, 263, 274, 278, 282, 297, 358, 450, 618, 622 de SEQ ID NO: 17900,
[00424] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster mutante compreende uma ou mais variações de sequência quando comparada a uma trans- posase TcBuster tipo selvagem. Em algumas modalidades, as referi- das uma ou mais variações de sequência compreendem um ou mais dentre V377T/E469K, V377T/E469K/R536S, A332S, V553S/P554T, E517R, K299S, Q615A/T618K, S278K, A303T, P510D, P510N, N281S, N281E, K590T, Q258T, E247K, S447E, N85S, V297K, A358K, I452F, V377T/E469K/D189A, K573E/E578L, I452F/V377T/E469K/D189A, A358K/V377T/E469K/D189A, K573E/E578L/V377T/E469K/D189A, T171R, D183R, S193R, P257K, E263R, L282K, T618K, D622R, E153K, N450K, T171K, D183K, S193K, P257R, E263K, L282R, T618R, D622K, E153R, N450R, E247K/E274K/V297K/A358K de SEQ ID NO: 17900. Em algumas mo- dalidades, as referidas uma ou mais variações de sequência compre- endem uma substituição de aminoácido dentro de 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 ou qualquer nú- mero de aminoácidos entre as posições 85, 153, 171, 189, 193, 247, 257, 258, 263, 274, 278, 281, 282, 297, 299, 303, 332, 358, 377, 450, 469, 447, 452, 469, 510, 517, 536, 553, 554, 573, 578, 590, 615, 618, 622 de SEQ ID NO: 17900.
[00425] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster mutante compreende uma ou mais variações de sequência quando comparada a uma trans- posase TcBuster tipo selvagem. Em algumas modalidades, as referi- das uma ou mais variações de sequência compreendem um ou mais dentre V377T/E469K, V377T/E469K/R536S, V553S/P554T, Q615A/T618K, S278K, A303T, P510D, P510N, N281S, N281E, K590T, Q258T, E247K, S447E, N85S, V297K, A358K, I452F, V377T/E469K/D189A e K573E/E578L. Em algumas modalidades, as referidas uma ou mais variações de sequência compreendem uma substituição de aminoácido dentro de 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 ou qualquer número de ami- noácidos entre as posições 85, 189, 247, 258, 278, 281, 297, 303, 358, 377, 447, 452, 469, 510, 536, 553, 554, 573, 578, 590, 615, 618 de SEQ ID NO: 17900.
[00426] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster mutante compreende uma ou mais variações de sequência quando comparada a uma trans- posase TcBuster tipo selvagem. Em algumas modalidades, as referi- das uma ou mais variações de sequência compreendem um ou mais dentre Q151S, Q151A, A154P, Q615A, V553S, Y155H, Y201A, F202D, F202K, C203I, C203V, F400L, I398D, I398S, I398K, V431L, P559D, P559S, P559K, M222L de SEQ ID NO: 17900. Em algumas modalidades, as referidas uma ou mais variações de sequência com- preendem uma substituição de aminoácido dentro de 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 ou qualquer número de aminoácidos entre as posições 151, 154, 615, 553, 155, 201, 202, 203, 400, 398, 431, 559, 222 de SEQ ID NO: 17900.
[00427] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster mutante compreende uma ou mais variações de sequência quando comparada a uma trans- posase TcBuster tipo selvagem. Em algumas modalidades, as referi- das uma ou mais variações de sequência compreendem um ou mais dentre V377T, E469K, e D189A, quando numeradas de acordo com a SEQ ID NO: 17900.
[00428] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster mutante compreende uma ou mais variações de sequência quando comparada a uma trans- posase TcBuster tipo selvagem. Em algumas modalidades, as referi-
das uma ou mais variações de sequência compreendem um ou mais dentre K573E e E578L, quando numeradas de acordo com a SEQ ID NO: 17900.
[00429] Em algumas modalidades, a transposase TcBuster mutante compreende substituição de aminoácido I452K, quando numerada de acordo com a SEQ ID NO: 17900,
[00430] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster mutante compreende uma ou mais variações de sequência quando comparada a uma trans- posase TcBuster tipo selvagem. Em algumas modalidades, as referi- das uma ou mais variações de sequência compreendem um ou mais dentre A358K, quando numeradas de acordo com a SEQ ID NO:
17900.
[00431] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster mutante compreende uma ou mais variações de sequência quando comparada a uma trans- posase TcBuster tipo selvagem. Em algumas modalidades, as referi- das uma ou mais variações de sequência compreendem um ou mais dentre V297K, quando numeradas de acordo com a SEQ ID NO:
17900.
[00432] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster mutante compreende uma ou mais variações de sequência quando comparada a uma trans- posase TcBuster tipo selvagem. Em algumas modalidades, as referi- das uma ou mais variações de sequência compreendem um ou mais dentre N85S, quando numeradas de acordo com a SEQ ID NO: 17900.
[00433] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster mutante compreende uma ou mais variações de sequência quando comparada a uma trans- posase TcBuster tipo selvagem. Em algumas modalidades, as referi-
das uma ou mais variações de sequência compreendem um ou mais dentre I452F, V377T, E469K, e D189A, quando numeradas de acordo com a SEQ ID NO: 17900.
[00434] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster mutante compreende uma ou mais variações de sequência quando comparada a uma trans- posase TcBuster tipo selvagem. Em algumas modalidades, as referi- das uma ou mais variações de sequência compreendem um ou mais dentre A358K, V377T, E469K, e D189A, quando numeradas de acordo com a SEQ ID NO: 17900.
[00435] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster mutante compreende uma ou mais variações de sequência quando comparada a uma trans- posase TcBuster tipo selvagem. Em algumas modalidades, as referi- das uma ou mais variações de sequência compreendem um ou mais dentre V377T, E469K, D189A, K573E e E578L, quando numeradas de acordo com a SEQ ID NO: 17900.
[00436] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster reconhece uma repeti- ção invertida 5’ compreendendo ou consistindo na sequência de: 1 Cagtgttctt caacctttgc catccggcgg aaccctttgt cgagatattt ttttttatgg 61 aacccttcat ttagtaatac acccagatga gattttaggg acagctgcgt tgacttgtta 121 cgaacaaggt gagcccgtgc tttggtctag ccaagggcat ggtaaagact atattcgcgg 181 cgttgtgaca atttaccgaa caactccgcg gccgggaagc cgatctcggc ttgaacgaat 241 tgttaggtgg cggtacttgg gtcgatatca aagtgcatca cttcttcccg tatgcccaac 301 tttgtataga gagccactgc gggatcgtca ccgtaatctg cttgcacgta gatcacataa 361 gcaccaagcg cgttggcctc atgcttgagg agattgatga gcgcggtggc aatgccctgc 421 ctccggtgct cgccggagac tgcgagatca tagatata (SEQ ID NO: 17902).
[00437] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster reconhece uma repeti- ção invertida 3’ compreendendo ou consistindo na sequência de: 1 gatatcaagc ttatcgatac cgtcgacctc gagatttctg aacgattcta ggttaggatc 61 aaacaaaata caatttattt taaaactgta agttaactta cctttgcttg tctaaaccaa
121 aaacaacaac aaaactacga ccacaagtac agttacatat ttttgaaaat taaggttaag 181 tgcagtgtaa gtcaactatg cgaatggata acatgtttca acatgaaact ccgattgacg 241 catgtgcatt ctgaagagcg gcgcggccga cgtctctcga attgaagcaa tgactcgcgg 301 aaccccgaaa gcctttgggt ggaaccctag ggttccgcgg aacacaggtt gaagaacact 361 g (SEQ ID NO: 17903).
[00438] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster reconhece uma repeti- ção invertida 5’ compreendendo ou consistindo na sequência de SEQ ID NO: 17902 e uma repetição invertida 3’ compreendendo ou consis- tindo na sequência de SEQ ID NO: 17903.
[00439] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster reconhece uma repeti- ção invertida 5’ compreendendo ou consistindo na sequência de: 1 Cctgcaggag tgttcttcaa cctttgccat ccggcggaac cctttgtcga gatatttttt 61 tttatggaac ccttcattta gtaatacacc cagatgagat tttagggaca gctgcgttga 121 cttgttacga acaaggtgag cccgtgcttt ggtaataaaa actctaaata agatttaaat 181 ttgcatttat ttaaacaaac tttaaacaaa aagataaata ttccaaataa aataatatat 241 aaaataaaaa ataaaaatta atgacttttt tgcgcttgct tattattgca caaattatca 301 atatcgggat ggatcgttgt ttttt (SEQ ID NO: 17904).
[00440] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster reconhece uma repeti- ção invertida 3’ compreendendo ou consistindo na sequência de: 1 Gagccaattc agcatcatat ttctgaacga ttctaggtta ggatcaaaca aaatacaatt 61 tattttaaaa ctgtaagtta acttaccttt gcttgtctaa acctaaaaca acaacaaaac 121 tacgaccaca agtacagtta catatttttg aaaattaagg ttaagtgcag tgtaagtcaa 181 ctatgcgaat ggataacatg tttcaacatg aaactccgat tgacgcatgt gcattctgaa 241 gagcggcgcg gccgacgtct ctcgaattga agcaatgact cgcggaaccc cgaaagcctt 301 tgggtggaac cctagggttc cgcggaacac aggttgaaga acactg (SEQ ID NO: 17905).
[00441] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster reconhece uma repeti- ção invertida 5’ compreendendo ou consistindo na sequência de SEQ ID NO: 17904 e uma repetição invertida 3’ compreendendo ou consis- tindo na sequência de SEQ ID NO: 17905.
[00442] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster reconhece uma repeti- ção invertida compreendendo ou consistindo em uma sequência tendo pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95,% 97%, 99% ou qualquer identidade de porcentagem entre para um ou mais dentre SEQ ID NO: 17902, 17903, 17904 ou 17905.
[00443] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster reconhece uma repeti- ção invertida compreendendo ou consistindo em uma sequência tendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 97, 99 ou qualquer número de nucleotídeos contíguos ten- do entre 90 e 100% de identidade para SEQ ID NO: 17902, 17903, 17904 ou 17905 ou qualquer porção dos mesmos.
[00444] Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster reconhece uma repeti- ção invertida compreendendo ou consistindo em uma sequência tendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 97, 99 ou qualquer número de nucleotídeos descontínuos tendo entre 90 e 100% de identidade para SEQ ID NO: 17902, 17903, 17904 ou 17905 ou qualquer porção dos mesmos.
[00445] Em algumas modalidades das composições e métodos da presente invenção, um transposon TcBuster compreende uma repeti- ção invertida 3’ e uma repetição invertida 5’. Em algumas modalidades das composições e métodos da presente invenção, uma transposase TcBuster reconhece um transposon TcBuster compreendendo uma repetição invertida 3’ e uma repetição invertida 5’ compreendendo ou consistindo em uma sequência tendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80 85, 90, 95, 97, 99 ou qualquer número de nucleotídeos descontínuos tendo entre 90 e 100% de iden- tidade para SEQ ID NO: 17902, 17903, 17904 ou 17905 ou qualquer porção dos mesmos. Métodos com Base em Não Transposição de Modificação Genéti- ca
[00446] Em algumas modalidades dos métodos da presente inven- ção, um HSC modificado ou célula descendente de HSC modificado da presente invenção pode ser produzido pela introdução de um transgene em uma célula descendente de HSC ou HSC da presente invenção. A etapa de introdução pode compreender a liberação de uma sequência de ácido nucleico e/ou um construto de edição genô- mica por meio de um sistema de liberação de não transposição.
[00447] Em algumas modalidades dos métodos da presente inven- ção, introdução de uma sequência de ácido nucleico e/ou um construto de edição genômica em um HSC ou célula descendente de HSC ex vivo, in vivo, in vitro ou in situ compreende uma ou mais liberação tópi- ca, adsorção, absorção, eletroporação, spinfection, cocultura, trans- fecção, liberação mecânica, liberação sônica, liberação vibracional, magnetofecção ou por liberação mediada por nanopartículas. Em al- gumas modalidades dos métodos da presente invenção, introdução de uma sequência de ácido nucleico e/ou um construto de edição genô- mica em um HSC ou célula descendente de HSC ex vivo, in vivo, in vitro ou in situ compreende transfecção lipossomal, transfecção de fos- fato de cálcio, transfecção de fugene, e transfecção mediada por den- drímero. Em algumas modalidades dos métodos da presente inven- ção, introdução de uma sequência de ácido nucleico e/ou um construto de edição genômica em um HSC ou célula descendente de HSC ex vivo, in vivo, in vitro ou in situ por transfecção mecânica compreende compactação celular, bombardeamento celular ou técnicas de armas genéticas. Em algumas modalidades dos métodos da presente inven- ção, introdução de uma sequência de ácido nucleico e/ou um construto de edição genômica em um HSC ou célula descendente de HSC ex vivo, in vivo, in vitro ou in situ por transfecção mediada por nanopartí- culas compreende liberação lipossomal, liberação por micelas, e libe- ração por polimerossomos.
[00448] Em algumas modalidades dos métodos da presente inven- ção, a introdução de uma sequência de ácido nucleico e/ou um cons- truto de edição genômica em um HSC ou célula descendente de HSC ex vivo, in vivo, in vitro ou in situ compreende um vetor não viral. Em algumas modalidades, o vetor não viral compreende um ácido nuclei- co. Em algumas modalidades, o vetor não viral compreende DNA de plasmídeo, DNA de fita dupla linear (dsDNA), DNA de fita simples line- ar (ssDNA), DNA DoggyBone™, nanoplasmídeos, DNA de minicírculo, oligodeoxinucleotídeos de fita simples (ssODN), oligonucleotídeos de DDNA, mRNA de fita simples (ssRNA), e mRNA de fita dupla (dsRNA). Em algumas modalidades, o vetor não viral compreende um transpo- son da presente invenção.
[00449] Em algumas modalidades dos métodos da presente inven- ção, a introdução de uma sequência de ácido nucleico e/ou um cons- truto de edição genômica em um HSC ou célula descendente de HSC ex vivo, in vivo, in vitro ou in situ compreende um vetor viral. Em algu- mas modalidades, o vetor viral é um vetor não cromossômico não in- tegrante. Os exemplos de vetores não cromossômicos não integrantes incluem, porém não estão limitados a, vírus adeno-associado (AAV), adenovírus e vírus herpes. Em algumas modalidades, o vetor viral é um vetor cromossômico integrante. Os vetores cromossômicos inte- grantes incluem, porém não estão limitados a, vetores adeno- associados (AAV), lentivírus, retrovírus gama.
[00450] Em algumas modalidades dos métodos da presente inven- ção, a introdução de uma sequência de ácido nucleico e/ou um cons- truto de edição genômica em um HSC ou célula descendente de HSC ex vivo, in vivo, in vitro ou in situ compreende uma combinação de ve-
tores. Combinações de vetores não limitantes exemplares incluem: vetores virais e não virais, uma pluralidade de vetores não virais ou uma pluralidade de vetores virais. Combinações de vetores exempla- res, mas não limitantes, incluem: uma combinação de um vetor deriva- do de DNA e um derivado de RNA, uma combinação de um RNA e uma transcriptase reversa, uma combinação de um transposon e uma transposase, uma combinação de um vetor não viral e uma endonu- clease, e uma combinação de um vetor viral e uma endonuclease.
[00451] Em algumas modalidades dos métodos de invenção, modi- ficação de genoma compreendendo introdução de sequência de ácido nucleico e/ou um construto de edição genômica em um HSC ou célula descendente de HSC ex vivo, in vivo, in vitro ou in situ estavelmente integra uma sequência de ácido nucleico, integra transcientemente uma sequência de ácido nucleico, produz uma integração específica ao sítio de uma sequência de ácido nucleico, ou produz uma integra- ção tendenciosa de uma sequência de ácido nucleico. Em algumas modalidades, a sequência de ácido nucleico é um transgene.
[00452] Em algumas modalidades dos métodos da presente inven- ção, modificação de genoma compreendendo introduzir uma sequên- cia de ácido nucleico e/ou um construto de edição genômica em um HSC ou célula descendente de HSC ex vivo, in vivo, in vitro ou in situ estavelmente integra uma sequência de ácido nucleico. Em algumas modalidades, a integração cromossômica estável pode ser uma inte- gração aleatória, uma integração específica de sítio, ou uma integra- ção tendenciosa. Em algumas modalidades, a integração específica de sítio pode ser não assistida ou assistida. Em algumas modalidades, a integração específica do sítio assistida é coliberada com uma nuclease direcionada ao sítio. Em algumas modalidades, a nuclease direcionada ao sítio compreende um transgene com extensões de sequência de nucleotídeo 5’ e 3’ que contêm uma homologia percentual com as re-
giões a montante e a jusante do sítio de integração genômica. Em al- gumas modalidades, a transgene com extensões de nucleotídeo ho- mólogas permite integração genômica por recombinação homóloga, junção de extremidade mediada por micro-homologia ou junção de ex- tremidade não homóloga. Em algumas modalidades a integração es- pecífica de sítio ocorre em um sítio de porto seguro. Sítios de porto seguro genômicos são capazes de acomodar a integração de novo material genético de uma maneira que garanta que os elementos ge- néticos recentemente inseridos funcionem de forma confiável (por exemplo, são expressos em um nível terapeuticamente eficaz de ex- pressão) e não causem alterações deletérias ao genoma do hospedei- ro que causa um risco ao organismo do hospedeiro. Portos seguros genômicos potenciais incluem, mas não estão limitados a, sequências intrônicas do gene de albumina humano, o sítio de vírus associado ao adeno 1 (AAVS1), um sítio de ocorrência natural de integração de ví- rus AAV em cromossomo 19, o gene de receptor 5 (CCR5) de sítio da quimiocina (c-C motivo) e o sítio do ortólogo humano do locus do ca- mundongo Rosa26.
[00453] Em algumas modalidades, a integração do transgene espe- cífico ao sítio ocorre em um sítio que interrompe a expressão de um gene alvo. Em algumas modalidades, a interrupção da expressão do gene alvo ocorre por integração específica ao sítio em íntrons, exons, promotores, elementos genéticos, realçadores, supressores, códons iniciais, códons de parada e elementos de resposta. Em algumas mo- dalidades, genes alvo exemplares alvejados por integração específica ao sítio incluem, porém, não estão limitados a, TRAC, TRAB, PDI, qualquer gene imunossupressor e genes envolvidos na alo-rejeição.
[00454] Em algumas modalidades, a integração do transgene espe- cífico ao sítio ocorre em um sítio que resulta em expressão realçada de um gene alvo. Em algumas modalidades, o realce da expressão do gene alvo ocorre por integração específica ao sítio em íntrons, exons, promotores, elementos genéticos, realçadores, supressores, códons iniciais, códons de parada e elementos de resposta.
[00455] Em algumas modalidades dos métodos da presente inven- ção, as enzimas podem ser usadas para criar quebras de fita no ge- noma do hospedeiro para facilitar a liberação ou integração do trans- gene. Em algumas modalidades, as enzimas criam quebras de fita única. Em algumas modalidades, as enzimas criam quebras de fita dupla. Em algumas modalidades, exemplos de enzimas indutoras de quebra incluem, porém, não estão limitados a: transposases, integra- ses, endonucleases, CRISPR-Cas9, nucleases efetoras semelhantes a ativador de transcrição (TALEN), nucleases de dedo de zinco (ZFN), Cas-CLOVER™, e CPF1. Em algumas modalidades, enzimas induto- ras de quebra podem ser liberadas a uma célula codificada em DNA, codificada em mRNA, como uma proteína, como um complexo de nú- cleoproteína com um RNA guia (gRNA).
[00456] Em algumas modalidades dos métodos da presente inven- ção, a integração do transgene específico ao sítio é controlada por uma predisposição do sítio de integração mediado por vetor. Em al- gumas modalidades, a predisposição do sítio de integração mediado por vetor é controlada pelo vetor lentiviral escolhido. Em algumas mo- dalidades, a predisposição do sítio de integração mediado por vetor é controlada pelo vetor gama-retroviral escolhido.
[00457] Em algumas modalidades dos métodos da presente inven- ção, o sítio de integração do transgene específico ao sítio é uma inser- ção cromossômica não estável. Em algumas modalidades, o transge- ne integrado pode ser silenciado, removido, extirpado ou mais modifi- cado.
[00458] Em algumas modalidades dos métodos da presente inven- ção, a modificação de genoma é uma integração não estável de um transgene. Em algumas modalidades, a integração não estável pode ser uma integração não cromossômica transitória, uma integração não cromossômica semiestável, uma inserção não cromossômica semiper- sistente ou uma inserção cromossômica não estável. Em algumas mo- dalidades, a inserção não cromossômica transitória pode ser epicro- mossômica ou citoplasmática.
[00459] Em algumas modalidades, a inserção não cromossômica transitória de um transgene não se integra a um cromossomo e o ma- terial genético modificado não é replicado durante a divisão celular.
[00460] Em algumas modalidades dos métodos da presente inven- ção, a modificação de genoma é uma integração não cromossômica semiestável ou persistente de um transgene. Em algumas modalida- des, um vetor de DNA codifica um módulo de região de fixação de ma- triz / estrutura (S-MAR) que se liga a proteínas de matriz nuclear para retenção epissomal de um vetor não viral, permitindo a replicação au- tônoma no núcleo de células em divisão.
[00461] Em algumas modalidades dos métodos da presente inven- ção, a modificação de genoma é uma integração cromossômica não estável de um transgene. Em algumas modalidades, o transgene inte- grado pode ser silenciado, removido, extirpado ou também modificado.
[00462] Em algumas modalidades dos métodos da presente inven- ção, a modificação do genoma pela inserção do transgene pode ocor- rer por meio de reparo de quebra de fita dupla direcionado por célula hospedeira (reparo direcionado por homologia) por recombinação ho- móloga (HR), junção de extremidade mediada por micro-homologia (MMEJ), junção de extremidades não homólogas (NHEJ), modificação mediada por enzima transposase, modificação mediada por enzima integrase, modificação mediada por enzima endonuclease ou modifi- cação mediada por enzima recombinante. Em algumas modalidades, a modificação do genoma por inserção do transgene pode ocorrer por meio de CRISPR-Cas9, TALEN, ZFNs, Cas-CLOVER, e cpf1.
[00463] Em sistemas de edição de genes que envolvem a inserção de novos ou existentes nucleotídeos/ácidos nucleicos, ferramentas de inserção (por exemplo, vetores de molde de DNA, elementos transpo- níveis (transposons ou retrotransposons) devem ser liberadas à célula além da enzima de corte (por exemplo, uma nuclease, recombinase, integrase ou transposase). Exemplos de tais ferramentas de inserção para uma recombinase podem incluir um vetor de DNA. Outros siste- mas de edição de genes requerem a liberação de uma integrase junto com uma inserção de vetor, uma transposase junto com um transpo- son/retrotransposon, etc. Em algumas modalidades, um exemplo de recombinase que pode ser usado como uma enzima de corte é a CRE recombinase. Em várias modalidades, exemplo de integrases que po- de ser usado em ferramentas de inserção incluem enzimas baseadas em vírus retiradas de qualquer um de vários vírus, incluindo, porém, não limitados a, AAV, gamma retrovírus e lentivírus. Exemplos de transposons/retrotransposons que podem ser usados em ferramentas de inserção incluem, porém, não estão limitados a, transposon piggyBac, o transposon Sleeping Beauty, e o retrotransposon L1.
[00464] Em certas modalidades dos métodos da presente invenção, o transgene é liberado in vivo. Em certas modalidades dos métodos da presente invenção, a liberação do transgene in vivo pode ocorrer por: liberação tópica, adsorção, absorção, eletroporação, spinfection, cocul- tura, transfecção, liberação mecânica, liberação sônica, liberação vi- bracional, magnetofecção ou por liberação mediada por nanopartícula. Em certas modalidades dos métodos da presente invenção, a libera- ção do transgene in vivo por transfecção pode ocorrer por transfecção lipossomal, transfecção de fosfato de cálcio, transfecção de fugene e transfecção mediada por dendrímero. Em certas modalidades dos mé- todos da presente invenção, a liberação do transgene mecânica in vivo pode ocorrer por compressão celular, bombardeamento e arma de ge- ne. Em certas modalidades dos métodos da presente invenção, a libe- ração de transgene mediada por nanopartículas in vivo pode ocorrer por liberação lipossomal, liberação por micelas e liberação por polime- rossomos. Em várias modalidades, nucleases que podem ser usadas como enzimas de corte incluem, porém, não estão limitadas a, Cas9, nucleases efetoras semelhantes a ativadores de transcrição (TALENs) e nucleases de dedo de zinco.
[00465] Em certas modalidades dos métodos da presente invenção, vetores não virais são usados para liberação de transgene. Em certas modalidades, o vetor não viral é um ácido nucleico. Em certas modali- dades, o vetor não viral de ácido nucleico é DNA plasmídico, DNA de fita dupla linear (dsDNA), DNA de fita simples linear (ssDNA), DNA DoggyBone™, nanoplasmídeos, DNA de minicírculo, oligodeoxinucleo- tídeos de fita simples (ssODN), oligonucleotídeos de DDNA, mRNA de fita simples (ssRNA), e mRNA de fita dupla (dsRNA). Em certas moda- lidades, o vetor não viral é um transposon. Em certas modalidades, o transposon é piggyBac™.
[00466] Em certas modalidades dos métodos da presente invenção, a liberação do transgene pode ocorrer por meio de vetor viral. Em cer- tas modalidades, o vetor viral é um vetor não cromossômico não inte- grante. Os vetores não cromossômicos não integrantes podem incluir vírus adeno-associados (AAV), adenovírus, vírus de herpes. Em certas modalidades, o vetor viral é um vetor cromossômico integrante. Os ve- tores cromossômicos integrantes podem incluir vetores adeno- associados (AAV), Lentivírus, retrovírus gama.
[00467] Em certas modalidades dos métodos da presente invenção, a liberação do transgene pode ocorrer por uma combinação de veto- res. Combinações de vetores exemplares, mas não limitantes, podem incluir: vetores virais mais não virais, mais de um vetor não viral ou mais de um vetor viral. Combinações de vetores exemplares, mas não limitantes, podem incluir: vetores derivados de DNA mais derivados de RNA, RNA mais transcriptase reversa, um transposon e uma transpo- sase, vetores não virais mais uma endonuclease e um vetor viral mais uma endonuclease.
[00468] Em certas modalidades dos métodos da presente invenção, a modificação de genoma pode ser uma integração estável de um transgene, uma integração transitória de um transgene, uma integra- ção específica de sítio de um transgene, ou uma integração tendenci- osa de um transgene.
[00469] Em certas modalidades dos métodos da presente invenção, a modificação de genoma pode ser uma integraqção cromossômica estável de um transgene. Em certas modalidades, a integração cro- mossômica estável pode ser uma integração aleatória, uma integração específica de sítio ou uma integração tendenciosa. Em certas modali- dades, a integração específica de sítio pode ser não assistida ou as- sistida. Em certas modalidades, a integração específica do sítio assis- tida é coliberada com uma nuclease direcionada ao sítio. Em certas modalidades, a nuclease direcionada ao sítio compreende um trans- gene com extensões de sequência de nucleotídeo 5’ e 3’ que contêm homologia com as regiões a jusante e a montante do sítio de integra- ção genômica. Em certas modalidades, o transgene com extensões de nucleotídeo homólogas permite integração genômica por recombina- ção homóloga, junção de extremidade mediada por micro-homologia, ou junção de extremidade não homóloga. Em certas modalidades, a integração específica de sítio ocorre em um sítio de porto seguro. Sí- tios de porto seguro genômicos são capazes de acomodar a integra- ção de novo material genético de uma maneira que garanta que os elementos genéticos recentemente inseridos funcionem de forma con- fiável (por exemplo, são expressos em um nível terapeuticamente efi-
caz de expressão) e não causem alterações deletérias ao genoma do hospedeiro que causa um risco ao organismo do hospedeiro. Portos seguros genômicos potenciais incluem, mas não estão limitados a, se- quências intrônicas do gene de albumina humano, o sítio de vírus as- sociado ao adeno 1 (AAVS1), um sítio de ocorrência natural de inte- gração de vírus AAV em cromossomo 19, o gene de receptor 5 (CCR5) de sítio da quimiocina (c-C motivo) e o sítio do ortólogo hu- mano do locus do camundongo Rosa26.
[00470] Em certas modalidades, a integração do transgene especí- fico ao sítio ocorre em um sítio que interrompe a expressão de um ge- ne alvo. Em certas modalidades, a interrupção da expressão do gene alvo ocorre por integração específica de sítio em íntrons, exons, pro- motores, elementos genéticos, realçadores, supressores, códons de início, códons de parada e elementos de resposta. Em certas modali- dades, os genes alvo exemplares alvejados pela integração específica de sítio incluem, porém, não estão limitados a, TRAC, TRAB, PDI, qualquer gene imunossupressor e genes envolvidos na alo-rejeição.
[00471] Em certas modalidades, a integração do transgene especí- fico ao sítio ocorre em um sítio que resulta em expressão realçada de um gene alvo. Em certas modalidades, o realce da expressão do gene alvo ocorre por integração específica de sítio em íntrons, exons, pro- motores, elementos genéticos, realçadores, supressores, códons de início, códons de parada e elementos de resposta.
[00472] Em certas modalidades dos métodos da presente invenção, as enzimas podem ser usadas para criar quebras de fita no genoma do hospedeiro para facilitar a liberação ou integração do transgene. Em certas modalidades, as enzimas criam quebras de fita simples. Em certas modalidades, as enzimas criam quebras de fita dupla. Em cer- tas modalidades, os exemplos de enzimas indutoras de quebra inclu- em, porém, não estão limitados a: transposases, integrases, endonu-
cleases, CRISPR-Cas9, nucleases efetoras semelhantes a ativador de transcrição (TALEN), nucleases de dedo de zinco (ZFN), Cas- CLOVER™ e cpf1. Em certas modalidades, as enzimas indutoras de quebra podem ser liberadas a uma célula codificada em DNA, codifi- cada em mRNA, como uma proteína, como um complexo de núcleo- proteína com um RNA guia (gRNA).
[00473] Em certas modalidades dos métodos da presente invenção, a integração do transgene específico ao sítio é controlada por uma predisposição do sítio de integração mediado por vetor. Em certas modalidades, a predisposição do sítio de integração mediado por vetor é controlado pelo vetor lentiviral escolhido. Em certas modalidades, a predisposição do sítio de integração mediada por vetor é controlada pelo vetor gama-retroviral escolhido.
[00474] Em certas modalidades dos métodos da presente invenção, o sítio de integração do transgene específico ao sítio é uma inserção cromossômica não estável. Em certas modalidades, o transgene inte- grado pode ser silenciado, removido, extirpado ou posteriormente mo- dificado. Em certas modalidades dos métodos da presente invenção, a modificação de genoma é uma integração não estável de um transge- ne. Em certas modalidades, a integração não estável pode ser uma integração não cromossômica transitória, uma integração não cromos- sômica semiestável, uma inserção não cromossômica semipersistente ou uma inserção cromossômica não estável. Em certas modalidades, a inserção não cromossômica transitória pode ser epicromossômica ou citoplasmática. Em certas modalidades, a inserção não cromossômica transitória de um transgene não se integra a um cromossomo e o ma- terial genético modificado não é replicado durante a divisão celular.
[00475] Em certas modalidades dos métodos da presente invenção, a modificação de genoma é uma integração não cromossômica semi- estável ou persistente de um transgene. Em certas modalidades, um vetor de DNA codifica um módulo de região de fixação de estrutu- ra/matriz (S-MAR) que se liga a proteínas de matriz nuclear para re- tenção epissomal de um vetor não viral permitindo a replicação autô- noma no núcleo de células em divisão.
[00476] Em certas modalidades dos métodos da presente invenção, a modificação de genoma é uma integração cromossômica não estável de um transgene. Em certas modalidades, o transgene integrado pode ser silenciado, removido, extirpado ou posteriormente modificado.
[00477] Em certas modalidades dos métodos da presente invenção, a modificação no genoma pela inserção do transgene pode ocorrer por meio de reparo de quebra de fita dupla direcionado por célula hospe- deira (reparo direcionado por homologia) por recombinação homóloga (HR), junção de extremidade mediada por micro-homologia (MMEJ), junção de extremidades não homólogas (NHEJ), modificação mediada por enzima transposase, modificação mediada por enzima integrase, modificação mediada por enzima endonuclease ou modificação medi- ada por enzima recombinante. Em certas modalidades, a modificação no genoma pela inserção do transgene pode ocorrer por meio de CRISPR-Cas9, TALEN, ZFNs, Cas-CLOVER e cpf1.
[00478] Em certas modalidades dos métodos da presente invenção, uma célula com uma modificação genômica in vivo ou ex vivo pode ser uma célula germinativa ou uma célula somática. Em certas modalida- des, a célula modificada pode ser uma célula humana, não humana, de mamífero, de rato, de camundongo ou de cachorro. Em certas mo- dalidades, a célula modificada pode ser diferenciada, indiferenciada, ou imortalizada. Em certas modalidades, a célula indiferenciada modi- ficada pode ser uma célula-tronco. Em certas modalidades, a célula modificada pode ser diferenciada, indiferenciada, ou imortalizada. Em certas modalidades, a célula indiferenciada modificada pode ser uma célula-tronco pluripotente induzida. Em certas modalidades, a célula modificada pode ser uma célula T, uma célula-tronco hematopoiética, uma célula exterminadora natural, um macrófago, uma célula dendríti- ca, um monócito, um megacariócito ou um osteoclasto. Em certas mo- dalidades, a célula modificada pode ser modificada enquanto uma cé- lula está quiescente, em um estado ativado, em repouso, em interfase, em prófase, em metáfase, em anáfase, ou em telófase. Em certas mo- dalidades, a célula modificada pode ser fresca, criopreservada, granel, classificada em subpopulações, de sangue total, de leucaferese, ou de uma linhagem celular imortalizada. Centirinas
[00479] Centirinas da presente invenção podem ser derivadas de uma proteína de repetição de fibronectina tipo III (FN3), ácidos nuclei- cos complementares ou de codificação, vetores, células hospedeiras, composições, combinações, formulações, dispositivos, e métodos de prepará-los e utilizá-los. Em uma modalidade preferida, a Centirina é composta por uma sequência de consenso de múltiplos domínios FN3 de Tenascina-C humana (doravante "Tenascina"). Em uma outra mo- dalidade preferida, a estrutura de proteína da presente invenção é uma sequência de consenso de 15 domínios FN3. As Centirinas da presen- te invenção podem ser designadas para ligarem várias moléculas, por exemplo, uma proteína celular alvo. Em uma modalidade preferida, as Centirinas da presente invenção podem ser designadas para ligarem um epítopo de uma forma variante e/ou de tipo selvagem de um antí- geno.
[00480] Centirinas da presente invenção podem incluir moléculas ou porções adicionais, por exemplo, a região Fc de um anticorpo, do- mínio de ligação de albumina ou outra porção que influencia a meia- vida. Em outras modalidades, as Centirinas da presente invenção po- dem ser ligadas a uma molécula de ácido nucleico que pode codificar a Centirina.
[00481] A presente invenção oferece pelo menos um método para expressar pelo menos uma Centirina com base em uma sequência de consenso de vários domínios FN3, em uma célula hospedeira, com- preendendo a cultura de uma célula hospedeira conforme descrito aqui sob as condições em que pelo menos uma estrutura de proteína é ex- pressa em quantidades detectáveis e/ou recuperáveis.
[00482] A presente invenção fornece pelo menos uma composição compreendendo (a) uma Centirina com base em uma sequência de consenso de múltiplos domínios FN3 e/ou ácido nucleico de codifica- ção conforme descrito aqui; e (b) um veículo ou diluente adequado e/ou farmaceuticamente aceitável.
[00483] A presente invenção fornece um método de gerar bibliote- cas de uma Centirina com base em uma proteína de repetição de fi- bronectina tipo III (FN3), preferivelmente, uma sequência de consenso de múltiplos domínios FN3 e, mais preferivelmente, uma sequência de consenso de múltiplos domínios FN3 de Tenascina humana. A biblio- teca é formada preparando gerações sucessivas de Centirinas alte- rando (por mutação) os aminoácidos ou o número de aminoácidos nas moléculas em posições particulares em porções da Centirina, por exemplo, regiões de alça. As bibliotecas podem ser geradas pela alte- ração da composição de aminoácidos de uma única alça ou pela alte- ração simultânea de várias alças ou posições adicionais da molécula de Centirina. As alças que são alteradas podem ser alongadas ou en- curtadas adequadamente. Essas bibliotecas podem ser geradas para incluir todos os aminoácidos possíveis em cada posição, ou um sub- conjunto designado de aminoácidos. Os membros da biblioteca podem ser usados para triagem por exibição, tais como, exibição in vitro ou CIS (DNA, RNA, exibição de ribossomo, etc.), levedura, bactéria e exi- bição de fago.
[00484] Centirinas da presente invenção fornecem propriedades biofísicas realçadas, tal como, estabilidade em condições redutoras e solubilidade em altas concentrações; elas podem ser expressas e do- bradas em sistemas procarióticos, tal como, E. coli, em sistemas euca- rióticos, tal como, levedura, e em sistemas de transcrição / tradução in vitro, tal como, o sistema lisado de reticulócito de coelho.
[00485] A presente invenção fornece um método de gerar uma mo- lécula de Centirina que se liga a um alvo específico deslocando uma biblioteca de Centirina da presente invenção com o alvo e detectando ligantes. Em outros aspectos relacionados, a presente invenção com- preende métodos de triagem que podem ser usados para gerar centi- rinas maduras por afinidade com a atividade desejada, por exemplo, capaz de se ligar a proteínas alvo com uma certa afinidade. A matura- ção da afinidade pode ser realizada por rodadas iterativas de mutagê- nese e seleção usando sistemas, tal como, exibição de fago ou exibi- ção in vitro. A mutagênese durante este processo pode ser o resultado de mutagênese direcionada ao sítio para especificar resíduos de Cen- tirina, mutagênese aleatória devido a PCR propensa a erros, DNA em- baralhado e/ou uma combinação dessas técnicas.
[00486] A presente invenção fornece uma Centirina isolada, recom- binante e/ou sintética baseada em uma sequência de consenso de proteína de repetição de fibronectina tipo III (FN3), incluindo, sem limi- tação, Centirinas derivadas de mamíferos, bem como, composições e moléculas de ácido nucleico de codificação compreendendo pelo me- nos um polinucleotídeo codificando uma Centirina com base na se- quência de consenso FN3. A presente invenção inclui ainda, porém, não está limitada a, métodos de fabricação e uso de tais ácidos nuclei- cos e Centirinas, incluindo composições diagnósticas e terapêuticas, métodos e dispositivos.
[00487] As Centirinas da presente invenção oferecem vantagens sobre a terapêutica convencional, tais como, a capacidade de adminis-
trar localmente, oralmente ou atravessar a barreira hematoencefálica, a capacidade de se expressar em E. Coli permitindo o aumento da ex- pressão de proteína como uma função de capacidade de recursos ver- sus expressão celular de mamíferos ser manipulada em moléculas bi- específicas ou em tandem que se ligam a vários alvos ou epítopos múltiplos do mesmo alvo, capacidade de serem conjugadas a fárma- cos, polímeros e sondas, capacidade de serem formuladas em altas concentrações, e a capacidade de tais moléculas penetrar efetivamen- te em tecidos e tumores doentes.
[00488] Além disso, as Centirinas possuem muitas das proprieda- des dos anticorpos em relação à sua dobra que imita a região variável de um anticorpo. Esta orientação permite que as alças de FN3 sejam expostas de forma semelhante às regiões determinantes de comple- mentaridade do anticorpo (CDRs). Devem ser capazes de se ligar a alvos celulares e as alças podem ser alteradas, por exemplo, afinidade amadurecida, para melhorar certas propriedades de ligação ou relaci- onadas.
[00489] Três das seis alças da Centirina da presente invenção cor- respondem topologicamente às regiões determinantes de complemen- taridade (CDRs 1-3), isto é, regiões de ligação ao antígeno, de um an- ticorpo, enquanto as três alças restantes são expostas na superfície de uma maneira similar aos CDRs de anticorpos. Essas alças se esten- dem em ou cerca de resíduos 13-16, 22-28, 38-43, 51-54, 60-64 e 75- 81 de SEQ ID NO: 18018. De preferência, as regiões de alça em ou cerca de resíduos 22 -28, 51-54 e 75-81 de SEQ ID NO: 18018 são alteradas para especificidade de ligação e afinidade. Uma ou mais dentre essas regiões de alça são randomizadas com outras regiões de alça e/ou outras fitas mantendo sua sequência como porções de ca- deia principal para preencher uma biblioteca e ligantes potentes po- dem ser selecionados da biblioteca tendo alta afinidade para um alvo de proteína particular. Uma ou mais dentre as regiões de alça podem interagir com uma proteína alvo similar à interação de um CDR de an- ticorpo com a proteína.
[00490] Em certas modalidades da presente invenção, Centirinas específicas de PSMA são projetadas, evoluídas e/ou selecionadas por sua capacidade de se ligar especificamente a uma sequência de PSMA. Em certas modalidades, as Centirinas específicas de PSMA são capazes de se ligar a uma sequência de PSMA com uma afinida- de comparável à de um anticorpo anti-PSMA que se liga a um epítopo de PSMA. Em certas modalidades, as Centirinas específicas de PSMA são capazes de se ligar a uma sequência de PSMA com uma afinida- de mais forte à de um anticorpo anti-PSMA que se liga a um epítopo de PSMA. Em certas modalidades, as Centirinas específicas de PSMA são capazes de se ligar a uma sequência de PSMA ao qual um anti- corpo não é capaz de se ligar. Por exemplo, a sequência de PSMA pode ser descontínua ou pode ter uma estrutura secundária. Produção e Geração de CARTirinas
[00491] Pelo menos uma CARTirina da presente invenção pode ser opcionalmente produzida por uma linhagem celular, uma linhagem ce- lular mista, uma célula imortalizada ou população clonal de células imortalizadas, como bem conhecido na técnica. Veja, por exemplo, Ausubel, et al., ed., Current Protocols in Molecular Biology, John Wiley & Sons, Inc., NY, N.Y. (1987-2001); Sambrook, et al., Molecular Clo- ning: A Laboratory Manual, 2a Ed., Cold Spring Harbor, N.Y. (1989); Harlow e Lane, Antibodies, a Laboratory Manual, Cold Spring Harbor, N.Y. (1989); Colligan, et al., eds., Current Protocols in Immunology, John Wiley & Sons, Inc., NY (1994-2001); Colligan et al., Current Pro- tocols in Protein Science, John Wiley & Sons, NY, N.Y., (1997-2001).
[00492] Aminoácidos de uma CARTirina podem ser alterados, adi- cionados e/ou deletados para reduzir a imunogenicidade ou reduzir,
realçar ou modificar a ligação, afinidade, taxa de ativação, taxa de de- sativação, avidez, especificidade, meia-vida, estabilidade, solubilidade ou qualquer outra característica adequada, como conhecido na técni- ca.
[00493] Opcionalmente, as CARTirinas podem ser projetadas com retenção de alta afinidade pelo antígeno e outras propriedades biológi- cas favoráveis. Para atingir esse objetivo, o CARTirinas pode ser opci- onalmente preparadas por um processo de análise das sequências parentais e vários produtos modificados conceituais utilizando modelos tridimensionais das sequências parentais e modificadas. Modelos tri- dimensionais estão comumente disponíveis e são famíliares para aqueles versados na técnica. Estão disponíveis programas de compu- tador que ilustram e exibem prováveis estruturas conformacionais tri- dimensionais de sequências candidatas selecionadas e podem medir possível imunogenicidade (por exemplo, programa Immunofilter da Xencor, Inc. de Monrovia, Califórnia). A inspeção dessas exibições permite a análise do provável papel dos resíduos no funcionamento da sequência candidata, isto é, a análise dos resíduos que influenciam a capacidade da Centirina ou CARTirina candidata de se ligar ao seu antígeno. Desse modo, os resíduos podem ser selecionados e combi- nados a partir das sequências parentais e de referência de modo que a característica desejada, tal como, afinidade pelo (s) antígeno (s) al- vo, seja alcançada. Alternativamente, ou além dos procedimentos aci- ma, podem ser usados outros métodos de modificação adequados. Triagem de Proteínas de CARTirina
[00494] Triagem de Centirinas ou CARTirinas para ligação específi- ca a proteínas ou fragmentos similares pode ser convenientemente obtida usando nucleotídeos (exibição de DNA ou RNA) ou bibliotecas de exibição de peptídeos, por exemplo, exibição in vitro. Este método envolve a triagem de grandes coleções de peptídeos para membros individuais com a função ou estrutura desejada. As sequências de nu- cleotídeos ou peptídeos apresentadas podem ser de 3 a 5000 ou mais nucleotídeos ou aminoácidos de comprimento, frequentemente de 5 a 100 aminoácidos de comprimento, e frequentemente de cerca de 8 a 25 aminoácidos de comprimento. Além de métodos de síntese química direta para gerar bibliotecas de peptídeos, vários métodos de DNA re- combinante foram descritos. Um tipo envolve a exibição de uma se- quência peptídica na superfície de um bacteriófago ou célula. Cada bacteriófago ou célula contém a sequência de nucleotídeos que codifi- ca a sequência específica do peptídeo exibido. As Centirinas e CARTi- rinas da presente invenção podem se ligar a proteínas humanas ou de outros mamíferos com uma ampla faixa de afinidades (KD). Em uma modalidade preferida, pelo menos uma Centirina da presente invenção pode ligar-se opcionalmente a uma proteína alvo com alta afinidade, por exemplo, com uma KD igual a ou menor que cerca de 10−7 M, tal como, porém, não limitada a, 0,1-9,9 (ou qualquer intervalo ou valor nele) X 10−8, 10−9, 10−10, 10−11, 10−12, 10−13, 10−14, 10−15 ou qualquer intervalo ou valor nele, como determinado pelo método de ressonância de plasmônio de superfície ou o Kinexa, praticado por aqueles versa- dos na técnica.
[00495] A afinidade ou avidez de uma Centirina ou CARTirina por um antígeno pode ser determinada experimentalmente usando qual- quer método adequado. (Veja, por exemplo, Berzofsky, et al., "Antibo- dy-Antigen Interactions," In Fundamental Immunology, Paul, WE, Ed., Raven Press: Nova Iorque, NY (1984); Kuby, Janis Immunology, WH Freeman e Company : Nova Iorque, NY (1992); e métodos aqui descri- tos). A afinidade medida de uma interação centirina-antígeno particular ou centirina-antígeno pode variar se medida em diferentes condições (por exemplo, concentração de sal, pH). Assim, medidas de afinidade e outros parâmetros de ligação ao antígeno (por exemplo, KD, Kon,
Koff) são preferivelmente feitos com soluções padronizadas de Centi- rinas ou CARTirinas e antígeno, e um tampão padronizado, tal como, o tampão aqui descrito.
[00496] Os ensaios competitivos podem ser realizados com a Centi- rina ou CARTirina da presente invenção, a fim de determinar quais proteínas, anticorpos e outros antagonistas competem pela ligação a uma proteína alvo com a Centirina ou CARTirina da presente invenção e/ou dividem a região do epítopo. Estes ensaios, como facilmente co- nhecidos por aqueles versados na técnica, avaliam a competição entre antagonistas ou ligantes para um número limitado de sítios de ligação em uma proteína. A proteína e/ou anticorpo é imobilizado ou insolubili- zado antes ou após a competição e a amostra ligada à proteína alvo é separada da amostra não ligada, por exemplo, por decantação (onde a proteína / anticorpo foi pré-insolubilizada) ou por centrifugação (onde a proteína / anticorpo foi precipitada após a reação competitiva). Além disso, a ligação competitiva pode ser determinada se a função é alte- rada pela ligação ou falta de ligação da Centirina ou CARTirina à pro- teína alvo, por exemplo, se a molécula de Centirina ou CARTirina inibe ou potencializa a atividade enzimática de, por exemplo, um rótulo. ELISA e outros ensaios funcionais podem ser usados, como bem co- nhecido na técnica. Moléculas de Ácido Nucleico
[00497] Moléculas de ácido nucleico da presente invenção codifi- cando Centirinas ou CARTirinas podem ser na forma de RNA, tais co- mo, mRNA, hnRNA, tRNA ou qualquer outra forma, ou na forma de DNA, incluindo, porém, não limitada a, cDNA e DNA genômico obtido por clonagem ou produzido sinteticamente, ou quaisquer combinações dos mesmos. O DNA pode ser fita tripla, fita dupla ou fita simples, ou qualquer combinação dos mesmos. Qualquer porção de pelo menos uma fita do DNA ou RNA pode ser a fita codificadora, também conhe-
cida como a fita sense, ou pode ser a fita não codificadora, também referida como a fita antissense.
[00498] Moléculas de ácido nucleico isoladas da presente invenção podem incluir moléculas de ácido nucleico compreendendo um quadro de leitura aberta (ORF), opcionalmente, com um ou mais introns, por exemplo, porém, não limitado a, pelo menos uma porção especificada de pelo menos uma CARTIRina; moléculas de ácido nucleico compre- endendo a sequência codificadora para uma CARTirina; e moléculas de ácido nucleico que compreendem a sequência núcleotídica subs- tancialmente diferente das descritas acima, mas que, devido à dege- nerescência do código genético, ainda codificam a CARTirina como aqui descrito e/ou como conhecido na técnica. Obviamente, o código genético é bem conhecido na técnica. Assim, seria rotina para alguém versado na técnica gerar tais variantes degeneradas de ácidos nuclei- cos que codificam para CARTirinas específicas da presente invenção. Veja, por exemplo, Ausubel, et al., Supra, e tais variantes de ácido nu- cleico estão incluídas na presente invenção.
[00499] Conforme indicado aqui, as moléculas de ácido nucleico da presente invenção que compreendem um ácido nucleico que codifica uma CARTirina podem incluir, mas não estão limitadas a, aquelas que codificam a sequência de aminoácido de um fragmento de Centirina, por si só; a sequência de codificação para toda a CARTirina ou uma porção da mesma; a sequência de codificação para uma Centirina, fragmento ou porção, bem como, sequências adicionais, tal como, a sequência de codificação de pelo menos uma leitora de sinal ou peptí- deo de fusão, com ou sem as sequências de codificação adicionais mencionadas, tal como, pelo menos um íntron, junto com sequências não codificantes adicionais, incluindo porém, não limitadas a, sequên- cias não codificantes 5 ′ e 3 ′, tais como, as sequências transcritas, não traduzidas que desempenham um papel na transcrição, processamen-
to de mRNA, incluindo emenda e sinais de poliadenilação (por exem- plo, ligação ao ribossomo e estabilidade do mRNA); uma sequência de codificação adicional que codifica para aminoácidos adicionais, tais como, aquelas que fornecem funcionalidades adicionais. Assim, a se- quência codificando uma CARTirina pode ser fundida a uma sequência marcadora, tal como, uma sequência codificando um peptídeo que fa- cilita a purificação da CARTirina fundida compreendendo uma porção ou fragmento de Centirina. Polinucleotídeos Seletivamente Hibridizando para um Polinucleo- tídeo como Descrito Aqui
[00500] A presente invenção fornece ácidos nucleicos isolados que hibridizam sob condições de hibridização seletiva com um polinucleo- tídeo aqui descrito. Assim, os polinucleotídeos desta modalidade po- dem ser usados para isolar, detectar e/ou quantificar ácidos nucleicos compreendendo tais polinucleotídeos. Por exemplo, os polinucleotí- deos da presente invenção podem ser usados para identificar, isolar ou amplificar clones parciais ou de comprimento total em uma bibliote- ca depositada. Em algumas modalidades, os polinucleotídeos são se- quências genômicas ou de cDNA isoladas, ou de outro modo comple- mentares a, um cDNA de uma biblioteca de ácido nucleico humano ou mamífero.
[00501] Preferivelmente, a biblioteca de cDNA compreende pelo menos 80% de sequências de comprimento total, preferivelmente, pelo menos 85% ou 90% de sequências de comprimento total, e, mais pre- ferivelmente, pelo menos 95% de sequências de comprimento total. As bibliotecas de cDNA podem ser normalizadas para aumentar a repre- sentação de sequências raras. As condições de hibridização de estrin- gência baixa ou moderada são tipicamente, mas não exclusivamente, empregadas com sequências tendo uma identidade de sequência re- duzida relativa às sequências complementares. Condições moderadas e altas de estringência podem ser opcionalmente empregadas para sequências de maior identidade. Condições de baixa restringência permitem hibridização seletiva de sequências com cerca de 70% de identidade de sequência e podem ser empregadas para identificar se- quências ortólogas ou parálogas.
[00502] Opcionalmente, os polinucleotídeos desta presente inven- ção irão codificar pelo menos uma porção de uma CARTirina codifica- da pelos polinucleotídeos aqui descritos. Os polinucleotídeos desta presente invenção abrangem as sequências de ácidos nucleicos que podem ser empregadas para hibridização seletiva para um polinucleo- tídeo codificando uma CARTirina da presente invenção. Veja, por exemplo, Ausubel, supra; Colligan, supra, cada incorporado totalmente aqui por referência. Construção de Ácidos Nucleicos
[00503] Os ácidos nucleicos isolados da presente invenção podem ser preparados usando (a) métodos recombinantes, (b) técnicas sinté- ticas, (c) técnicas de purificação, e/ou (d) combinações dos mesmos, como bem conhecido na técnica.
[00504] Os ácidos nucleicos podem compreender convenientemen- te sequências além de um polinucleotídeo da presente invenção. Por exemplo, um sítio de multi-clonagem compreendendo um ou mais sí- tios de restrição de endonuclease pode ser inserido no ácido nucleico para auxiliar no isolamento do polinucleotídeo. Além disso, as sequên- cias traduzíveis podem ser inseridas para auxiliar no isolamento do polinucleotídeo traduzido da presente invenção. Por exemplo, uma se- quência do marcador de hexa-histidina fornece um meio conveniente para purificar as proteínas da presente invenção. O ácido nucleico da presente invenção, excluindo a sequência codificadora, é opcional- mente um vetor, adaptador ou ligante para clonagem e/ou expressão de um polinucleotídeo da presente invenção.
[00505] Sequências adicionais podem ser adicionadas a tais se- quências de clonagem e/ou expressão para otimizar sua função na clonagem e/ou expressão, para auxiliar no isolamento do polinucleotí- deo, ou para melhorar a introdução do polinucleotídeo em uma célula. O uso de vetores de clonagem, vetores de expressão, adaptadores e ligantes é bem conhecido na técnica. (Veja, por exemplo, Ausubel, su- pra; ou Sambrook, supra). Métodos Recombinantes para Construção de Ácidos Nucleicos
[00506] As composições de ácido nucleico isoladas desta presente invenção, tais como, RNA, cDNA, DNA genômico, ou qualquer combi- nação dos mesmos, podem ser obtidas de fontes biológicas usando qualquer número de metodologias de clonagem conhecidas por aque- les versados na técnica. Em algumas modalidades, sondas oligonú- cleotídicas que hibridizam seletivamente, sob condições rigorosas, com os polinucleotídeos da presente invenção são usadas para identi- ficar a sequência desejada em uma biblioteca de cDNA ou DNA ge- nômico. O isolamento de RNA, e construção de cDNA e bibliotecas genômicas são bem conhecidos por aqueles versados na técnica. (Ve- ja, por exemplo, Ausubel, supra; ou Sambrook, supra). Métodos de Isolamento e Triagem de Ácido Nucleico
[00507] Um cDNA ou biblioteca genômica pode ser rastreado utili- zando uma sonda baseada na sequência de um polinucleotídeo da presente invenção. Sondas podem ser usadas para hibridizar com se- quências de DNA genômico ou cDNA para isolar genes homólogos no mesmo ou em diferentes organismos. Aqueles versados na técnica apreciarão que vários graus de restringência de hibridização podem ser empregados no ensaio; e a hibridização ou o meio de lavagem po- dem ser estringentes. À medida que as condições para hibridização se tornam mais restritas, deve haver um maior grau de complementarida- de entre a sonda e o alvo para que ocorra a formação do duplex. O grau de estringência pode ser controlado por um ou mais dentre a temperatura, força iônica, pH e a presença de um solvente parcialmen- te desnaturante, tal como, formamida. Por exemplo, a restrição da hi- bridação é convenientemente variada mudando a polaridade da solu- ção do reagente através, por exemplo, da manipulação da concentra- ção de formamida dentro da faixa de 0% a 50%. O grau de comple- mentaridade (identidade de sequência) necessário para a ligação de- tectável variará de acordo com a restrição do meio de hibridação e/ou meio de lavagem. O grau de complementaridade será idealmente de 100%, ou 70 a 100%, ou qualquer intervalo ou valor nele. No entanto, deve-se entender que variações menores de sequência nas sondas e iniciadores podem ser compensadas pela redução da estringência do meio de hibridização e/ou lavagem.
[00508] Métodos de amplificação de RNA ou DNA são bem conhe- cidos na técnica e podem ser usados de acordo com a presente inven- ção sem experimentação indevida, com base no ensino e nas orienta- ções aqui apresentadas.
[00509] Os métodos conhecidos de amplificação de DNA ou RNA incluem, porém, não estão limitados a, reação em cadeia da polimera- se (PCR) e processos de amplificação relacionados (veja, por exem- plo, patente dos Estados Unidos Nos. 4.683.195, 4.683.202,
4.800.159, 4.965.188, para Mullis, et al.; 4.795.699 e 4.921.794 para Tabor, et al; 5.142.033 para Innis; 5.122.464 para Wilson, et al.;
5.091.310 para Innis; 5.066.584 para Gillensten, et al; 4.889.818 para Gelfand, et al; 4.994.370 para Silver, et al. ; 4.766.067 para Biswas;
4.656.134 para Ringold) e amplificação mediada por RNA que usa RNA antissense para sequência alvo como modelo para síntese de DNA de fita dupla (Patente dos Estados Unidos 5.130.238 de Malek, et al, com o nome comercial NASBA), os conteúdos totais dos quais as referências são incorporadas aqui por referência. (Veja, por exemplo,
Ausubel, supra; ou Sambrook, supra.)
[00510] Por exemplo, a tecnologia da reação de cadeia da polime- rase (PCR) pode ser usada para amplificar as sequências de polinu- cleotídeos da presente invenção e genes relacionados diretamente de DNA genômico ou bibliotecas de cDNA. PCR e outros métodos de amplificação in vitro também podem ser úteis, por exemplo, para clo- nar sequências de ácido nucleico que codificam proteínas a serem ex- pressas, para fazer ácidos nucleicos a serem usados como sondas para detectar a presença do mRNA desejado em amostras, por se- quenciamento de ácido nucleico, ou para outros fins. Exemplos de técnicas suficientes para direcionar pessoas com habilidade através de métodos de amplificação in vitro são encontrados em Berger, supra, Sambrook, supra, e Ausubel, supra, bem como, Mullis, et al., Patente dos Estados Unidos No. 4.683.202 (1987); e Innis, et al., PCR Proto- cols A Guide to Methods and Applications, Eds., Academic Press Inc., San Diego, Calif. (1990). Os kits comercialmente disponíveis para am- plificação por PCR genômico são conhecidos na técnica. Veja, por exemplo, Advantage-GC Genomic PCR Kit (Clontech). Adicionalmen- te, por exemplo, a proteína 32 do gene T4 (Boehringer Mannheim) po- de ser usada para melhorar a produção de produtos de PCR longos. Métodos Sintéticos para Construção de Ácidos Nucleicos
[00511] Os ácidos nucleicos isolados da presente invenção também podem ser preparados por síntese química direta por métodos conhe- cidos (Veja, por exemplo, Ausubel, et al., Supra). A síntese química geralmente produz um oligonucleotídeo de fita simples, que pode ser convertido em DNA de fita dupla por hibridização com uma sequência complementar, ou por polimerização com uma DNA polimerase usan- do a fita simples como molde. Alguém versado na técnica reconhecerá que enquanto a síntese química de DNA pode ser limitada a sequên- cias de cerca de 100 ou mais bases, sequências mais longas podem ser obtidas pela ligação de sequências mais curtas. Cassetes de Expressão Recombinante
[00512] A presente invenção fornece ainda cassetes de expressão recombinante compreendendo um ácido nucleico da presente inven- ção. Uma sequência de ácido nucleico da presente invenção, por exemplo, um cDNA ou uma sequência genômica codificando uma CARTirina da presente invenção, pode ser usada para construir um cassete de expressão recombinante que pode ser introduzido em pelo menos uma célula hospedeira desejada. Um cassete de expressão recombinante compreenderá tipicamente um polinucleotídeo da pre- sente invenção operacionalmente ligado a sequências regulatórias de iniciação transcricional que irão direcionar a transcrição do polinucleo- tídeo na célula hospedeiro pretendida. Ambos os promotores heterólo- gos e não heterólogos (isto é, endógenos) podem ser empregados pa- ra direcionar a expressão dos ácidos nucleicos da presente invenção.
[00513] Em algumas modalidades, ácidos nucleicos isolados que servem como promotor, realçador ou outros elementos podem ser in- troduzidos na posição apropriada (a montante, a jusante ou no íntron) de uma forma não heteróloga de um polinucleotídeo da presente in- venção de modo a regular para cima ou para baixo a expressão de um polinucleotídeo da presente invenção. Por exemplo, promotores endó- genos podem ser alterados in vivo ou in vitro por mutação, deleção e/ou substituição. Nanotransposons
[00514] A presente invenção fornece um nanotransposon compre- endendo: (a) uma sequência codificando uma inserção de transposon, compreendendo uma sequência codificando uma primeira repetição terminal invertida (ITR), uma sequência codificando uma segunda re- petição terminal invertida (ITR), e uma sequência intra-ITR; (b) uma sequência codificando uma cadeia principal, em que a sequência codi-
ficando a cadeia principal compreende uma sequência codificando uma origem de replicação tendo entre 1 e 450 nucleotídeos, inclusive dos pontos de extremidade, e uma sequência codificando um marca- dor selecionável tendo entre 1 e 200 nucleotídeos, inclusive dos pon- tos de extremidade, e (c) uma sequência de inter-ITR. Em algumas modalidades, a sequência inter-ITR de (c) compreende a sequência de (b). Em algumas modalidades, a sequência intra-ITR de (a) compreen- de a sequência de (b).
[00515] Em algumas modalidades dos nanotransposons da presen- te invenção, a sequência codificando a cadeia principal compreende entre 1 e 600 nucleotídeos, inclusive dos pontos de extremidade. Em algumas modalidades, a sequência codificando a cadeia principal con- siste em entre 1 e 50 nucleotídeos, entre 50 e 100 nucleotídeos, entre 100 e 150 nucleotídeos, entre 150 e 200 nucleotídeos, entre 200 e 250 nucleotídeos, entre 250 e 300 nucleotídeos, entre 300 e 350 nucleotí- deos, entre 350 e 400 nucleotídeos, entre 400 e 450 nucleotídeos, en- tre 450 e 500 nucleotídeos, entre 500 e 550 nucleotídeos, entre 550 e 600 nucleotídeos, cada faixa inclusiva dos pontos de extremidade.
[00516] Em algumas modalidades dos nanotransposons da presen- te invenção, a sequência inter-ITR compreende entre 1 e 1000 nucleo- tídeos, inclusive dos pontos de extremidade. Em algumas modalida- des, a sequência inter-ITR consiste em entre 1 e 50 nucleotídeos, en- tre 50 e 100 nucleotídeos, entre 100 e 150 nucleotídeos, entre 150 e 200 nucleotídeos, entre 200 e 250 nucleotídeos, entre 250 e 300 nu- cleotídeos, entre 300 e 350 nucleotídeos, entre 350 e 400 nucleotí- deos, entre 400 e 450 nucleotídeos, entre 450 e 500 nucleotídeos, en- tre 500 e 550 nucleotídeos, entre 550 e 600 nucleotídeos, entre 600 e 650 nucleotídeos, entre 650 e 700 nucleotídeos, entre 700 e 750 nu- cleotídeos, entre 750 e 800 nucleotídeos, entre 800 e 850 nucleotí- deos, entre 850 e 900 nucleotídeos, entre 900 e 950 nucleotídeos, ou entre 950 e 1000 nucleotídeos, cada faixa inclusiva dos pontos de ex- tremidade.
[00517] Em algumas modalidades dos nanotransposons da presen- te invenção, incluindo os nanotransposons curtos (SNTs) da presente invenção, a sequência inter-ITR compreende entre 1 e 200 nucleotí- deos, inclusive dos pontos de extremidade. Em algumas modalidades, a sequência inter-ITR consiste em entre 1 e 10 nucleotídeos, entre 10 e 20 nucleotídeos, entre 20 e 30 nucleotídeos, entre 30 e 40 nucleotí- deos, entre 40 e 50 nucleotídeos, entre 50 e 60 nucleotídeos, entre 60 e 70 nucleotídeos, entre 70 e 80 nucleotídeos, entre 80 e 90 nucleotí- deos, ou entre 90 e 100 nucleotídeos, cada faixa inclusiva dos pontos de extremidade.
[00518] Em algumas modalidades dos nanotransposons da presen- te invenção, o marcador selecionável tendo entre 1 e 200 nucleotí- deos, inclusive dos pontos de extremidade, compreende uma sequên- cia codificando um marcador selecionável de sacarose. Em algumas modalidades, a sequência codificando um marcador selecionável de sacarose compreende uma sequência codificando uma sequência de RNA-OUT. Em algumas modalidades, a sequência codificando uma sequência de RNA-OUT compreende ou consiste em 137 pares de base (bp). Em algumas modalidades, o marcador selecionável tendo entre 1 e 200 nucleotídeos, inclusive dos pontos de extremidade, com- preende uma sequência codificando um marcador fluorescente. Em algumas modalidades, o marcador selecionável tendo entre 1 e 200 nucleotídeos, inclusive dos pontos de extremidade, compreende uma sequência codificando um marcador de superfície celular.
[00519] Em algumas modalidades dos nanotransposons da presen- te invenção, a sequência codificando uma origem de replicação tendo entre 1 e 450 nucleotídeos, inclusive dos pontos de extremidade, com- preende uma sequência codificando uma mini origem de replicação.
Em algumas modalidades, a sequência codificando uma origem de replicação tendo entre 1 e 450 nucleotídeos, inclusive dos pontos de extremidade, compreende uma sequência codificando uma origem R6K de replicação. Em algumas modalidades, a origem R6K de repli- cação compreende uma origem R6K gamma de replicação. Em algu- mas modalidades, a origem R6K de replicação compreende uma mini origem R6K de replicação. Em algumas modalidades, a origem R6K de replicação compreende uma mini origem R6K gamma de replica- ção. Em algumas modalidades, a mini origem R6K gamma de replica- ção compreende ou consiste em 281 pares de base (bp).
[00520] Em algumas modalidades dos nanotransposons da presen- te invenção, a sequência codificando a cadeia principal não compre- ende um sítio de recombinação, um sítio de excisão, um sítio de liga- ção ou uma combinação dos mesmos. Em algumas modalidades, nem o nanotransposon, nem a sequência que codifica a cadeia principal compreende um produto de um sítio de recombinação, um sítio de ex- cisão, um sítio de ligação ou uma combinação dos mesmos. Em algu- mas modalidades, nem o nanotransposon nem a sequência codifican- do a cadeia principal é derivado de um sítio de recombinação, um sítio de excisão, um sítio de ligação ou uma combinação dos mesmos.
[00521] Em algumas modalidades dos nanotransposons da presen- te invenção, um sítio de recombinação compreende uma sequência resultante de um evento de recombinação. Em algumas modalidades, um sítio de recombinação compreende uma sequência que é um pro- duto de um evento de recombinação. Em algumas modalidades, o evento de recombinação compreende uma atividade de uma recombi- nase (por exemplo, um sítio de recombinase).
[00522] Em algumas modalidades dos nanotransposons da presen- te invenção, a sequência codificando a cadeia principal não compre- ende mais uma sequência codificando DNA estranho.
[00523] Em algumas modalidades dos nanotransposons da presen- te invenção, a sequência inter-ITR não compreende um sítio de re- combinação, um sítio de excisão, um sítio de ligação ou uma combina- ção dos mesmos. Em algumas modalidades, a sequência inter-ITR não compreende um produto de um evento de recombinação, um evento de excisão, um evento de ligação ou uma combinação dos mesmos. Em algumas modalidades, a sequência inter-ITR não é deri- vada de um evento de recombinação, um evento de excisão, um even- to de ligação ou uma combinação dos mesmos.
[00524] Em algumas modalidades dos nanotransposons da presen- te invenção, a sequência inter-ITR compreende uma sequência codifi- cando DNA estranho.
[00525] Em algumas modalidades dos nanotransposons da presen- te invenção, a sequência intra-ITR compreende pelo menos uma se- quência codificando um isolante e uma sequência codificando um promotor capazes de expressar uma sequência exógena em uma célu- la de mamífero. Em algumas modalidades, a célula de mamífero é uma célula humana.
[00526] Em algumas modalidades dos nanotransposons da presen- te invenção, a sequência intra-ITR compreende uma primeira sequên- cia codificando um isolante, uma sequência codificando um promotor capazes de expressar uma sequência exógena em uma célula de mamífero e uma segunda sequência codificando um isolante.
[00527] Em algumas modalidades dos nanotransposons da presen- te invenção, a sequência intra-ITR compreende uma primeira sequên- cia codificando um isolante, uma sequência codificando um promotor capazes de expressar uma sequência exógena em uma célula de mamífero, uma sequência de poliadenosina (poliA) e uma segunda sequência codificando um isolante.
[00528] Em algumas modalidades dos nanotransposons da presen-
te invenção, a sequência intra-ITR compreende uma primeira sequên- cia codificando um isolante, uma sequência codificando um promotor capazes de expressar uma sequência exógena em uma célula de mamífero, pelo menos uma sequência exógena, uma sequência de poliadenosina (poliA) e uma segunda sequência codificando um isolan- te.
[00529] Em algumas modalidades dos nanotransposons da presen- te invenção, a sequência codificando um promotor capaz de expressar uma sequência exógena em uma célula de mamífero é capaz de ex- pressar uma sequência exógena em uma célula humana. Em algumas modalidades, a sequência codificando um promotor capaz de expres- sar uma sequência exógena em uma célula de mamífero compreende uma sequência codificando um promotor constitutivo. Em algumas modalidades, a sequência codificando um promotor capaz de expres- sar uma sequência exógena em uma célula de mamífero compreende uma sequência codificando um promotor induzível. Em algumas moda- lidades, a sequência intra-ITR compreende uma primeira sequência codificando um primeiro promotor capaz de expressar uma sequência exógena em uma célula de mamífero e uma segunda sequência codi- ficando uma segunda promotor capaz de expressar uma sequência exógena em célula de mamífero, em que o primeiro promotor é um promotor constitutivo, em que o segundo promotor é um promotor in- duzível, e em que a primeira sequência codificando o primeiro promo- tor e a segunda sequência codificando o segundo promotor são orien- tadas em direções opostas. Em algumas modalidades, a sequência codificando um promotor capaz de expressar uma sequência exógena em uma célula de mamífero compreende uma sequência codificando um promotor específico ao tipo de tecido ou tipo de célula. Em algu- mas modalidades, a sequência codificando um promotor capaz de ex- pressar uma sequência exógena em uma célula de mamífero compre-
ende uma sequência codificando um promotor EF1a, uma sequência codificando um promotor CMV, uma sequência codificando um promo- tor MND, uma sequência codificando um promotor SV40, uma se- quência codificando um promotor PGK1, uma sequência codificando um promotor Ubc, uma sequência codificando um promotor CAG, uma sequência codificando um promotor H1, ou uma sequência codificando um promotor U6.
[00530] Em algumas modalidades dos nanotransposons da presen- te invenção, a sequência de poliadenosina (poliA) é isolada ou deriva- da de uma sequência de poliA viral. Em algumas modalidades, a se- quência de poliadenosina (poliA) é isolada ou derivada de uma se- quência de (SV40) poliA.
[00531] Em algumas modalidades dos nanotransposons da presen- te invenção, a referida pelo menos uma sequência exógena compre- ende um polipeptídeo pró-apoptótico induzível. Em algumas modalida- des, o polipeptídeo caspase induzível compreende (a) uma região de ligação ao ligante, (b) um ligante, e (c) um polipeptídeo de caspase, em que o polipeptídeo proapoptótico induzível não compreende uma sequência não humana. Em algumas modalidades, o polipeptídeo caspase induzível compreende (a) uma região de ligação ao ligante, (b) um ligante, e (c) um polipeptídeo de caspase 9 truncado, em que o polipeptídeo proapoptótico induzível não compreende uma sequência não humana.
[00532] Em algumas modalidades dos nanotransposons da presen- te invenção, incluindo aqueles em que a referida pelo menos uma se- quência exógena compreende um polipeptídeo pró-apoptótico induzí- vel, a região de ligação ao ligante compreende um polipeptídeo de pro- teína 12 de ligação a FK506 (FKBP12). Em algumas modalidades, a sequência de aminoácido da região de ligação ao ligante compreende um polipeptídeo de proteína 12 de ligação a FK506 (FKBP12). Em al-
gumas modalidades, o polipeptídeo de proteína 12 de ligação a FK506 (FKBP12) compreende uma modificação na posição 36 da sequência. Em algumas modalidades, a modificação compreende uma substitui- ção de valina (V) por fenilalanina (F) na posição 36 (F36V). Em algu- mas modalidades, o polipeptídeo FKBP12 é codificado por uma se- quência de aminoácido compreendendo
GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPF
KFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPP HATLVFDVELLKLE (SEQ ID NO: 14635). Em algumas modalidades, o polipeptídeo FKBP12 é codificado por uma sequência de ácido nucleico compreendendo
GGGGTCCAGGTCGAGACTATTTCACCAGGGGATGGGCGAACATT TCCAAAAAGGGGCCAGACTTGCGTCGTGCATTACACCGGGATGCT GGAGGACGGGAAGAAAGTGGACAGCTCCAGGGATCGCAACAAGC CCTTCAAGTTCATGCTGGGAAAGCAGGAAGTGATCCGAGGATGG GAGGAAGGCGTGGCACAGATGTCAGTCGGCCAGCGGGCCAAACT GACCATTAGCCCTGACTACGCTTATGGAGCAACAGGCCACCCAG
GGATCATTCCCCCTCATGCCACCCTGGTCTTCGAT GTGGAACTGCTGAAGCTGGAG (SEQ ID NO: 14636).
[00533] Em algumas modalidades dos nanotransposons da presen- te invenção, incluindo aqueles em que a referida pelo menos uma se- quência exógena compreende um polipeptídeo pró-apoptótico induzí- vel, a região ligante é codificada por um aminoácido compreendendo GGGGS (SEQ ID NO: 14637) ou uma sequência de ácido nucleico compreendendo GGAGGAGGAGGATCC (SEQ ID NO: 14638). Em algumas modalidades, a sequência de ácido nucleico codificando o ligante não compreende um sítio de restrição.
[00534] Em algumas modalidades dos nanotransposons da presen- te invenção, incluindo aqueles em que a referida pelo menos uma se- quência exógena compreende um polipeptídeo pró-apoptótico induzí-
vel, o polipeptídeo de caspase 9 truncado é codificado por uma se- quência de aminoácido que não compreende uma arginina (R) na po- sição 87 da sequência. Em algumas modalidades, o polipeptídeo de caspase 9 truncado é codificado por uma sequência de aminoácido que não compreende uma alanina (A) na posição 282 da sequência. Em algumas modalidades, o polipeptídeo de caspase 9 truncado é co- dificado por um aminoácido compreendendo
GFGDVGALESLRGNADLAYILSMEPCGHCLIINNVNFCRESGLRTRT GSNIDCEKLRRRFSSLHFMVEVKGDLTAKKMVLALLELAQQDHGALD CCVVVILSHGCQASHLQFPGAVYGTDGCPVSVEKIVNIFNGTSCPSL GGKPKLFFIQACGGEQKDHGFEVASTSPEDESPGSNPEPDATPFQE GLRTFDQLDAISSLPTPSDIFVSYSTFPGFVSWRDPKSGSWYVETLD
DIFEQWAHSEDLQSLLLRVANAVSVKGIYKQMPGCFNFLRKKLFFKT S (SEQ ID NO: 14639). Em algumas modalidades, o polipeptídeo de caspase 9 truncado é co- dificado por uma sequência de ácido nucleico compreendendo
GGATTTGGGGACGTGGGGGCCCTGGAGTCTCTGCGAGGAAATGC CGATCTGGCTTACATCCTGAGCATGGAACCCTGCGGCCACTGTCT GATCATTAACAATGTGAACTTCTGCAGAGAAAGCGGACTGCGAAC ACGGACTGGCTCCAATATTGACTGTGAGAAGCTGCGGAGAAGGTT CTCTAGTCTGCACTTTATGGTCGAAGTGAAAGGGGATCTGACCGC CAAGAAAATGGTGCTGGCCCTGCTGGAGCTGGCTCAGCAGGACC ATGGAGCTCTGGATTGCTGCGTGGTCGTGATCCTGTCCCACGGG TGCCAGGCTTCTCATCTGCAGTTCCCCGGAGCAGTGTACGGAACA GACGGCTGTCCTGTCAGCGTGGAGAAGATCGTCAACATCTTCAAC GGCACTTCTTGCCCTAGTCTGGGGGGAAAGCCAAAACTGTTCTTT ATCCAGGCCTGTGGCGGGGAACAGAAAGATCACGGCTTCGAGGT GGCCAGCACCAGCCCTGAGGACGAATCACCAGGGAGCAACCCTG AACCAGATGCAACTCCATTCCAGGAGGGACTGAGGACCTTTGACC AGCTGGATGCTATCTCAAGCCTGCCCACTCCTAGTGACATTTTCG TGTCTTACAGTACCTTCCCAGGCTTTGTCTCATGGCGCGATCCCA AGTCAGGGAGCTGGTACGTGGAGACACTGGACGACATCTTTGAA CAGTGGGCCCATTCAGAGGACCTGCAGAGCCTGCTGCTGCGAGT GGCAAACGCTGTCTCTGTGAAGGGCATCTACAAACAGATGCCCG
GGTGCTTCAATTTTCTGAGAAAGAAACTGTTCTTTAAGACTTCC (SEQ ID NO: 14640).
[00535] Em algumas modalidades dos nanotransposons da presen- te invenção, incluindo aqueles em que a referida pelo menos uma se- quência exógena compreende um polipeptídeo pró-apoptótico induzí- vel, o polipeptídeo proapoptótico induzível é codificado por uma se- quência de aminoácido compreendendo
GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPF KFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPP HATLVFDVELLKLEGGGGSGFGDVGALESLRGNADLAYILSMEPCGH CLIINNVNFCRESGLRTRTGSNIDCEKLRRRFSSLHFMVEVKGDLTAK KMVLALLELAQQDHGALDCCVVVILSHGCQASHLQFPGAVYGTDGC PVSVEKIVNIFNGTSCPSLGGKPKLFFIQACGGEQKDHGFEVASTSPE DESPGSNPEPDATPFQEGLRTFDQLDAISSLPTPSDIFVSYSTFPGFV
SWRDPKSGSWYVETLDDIFEQWAHSEDLQSLLLRVANAVSVKGIYK QMPGCFNFLRKKLFFKTS (SEQ ID NO: 14641). Em algumas modalidades, o polipeptídeo proapoptótico induzível é codificado por uma sequência de ácido nucleico compreendendo ggggtccaggtcgagactatttcaccaggggatgggcgaacatttccaaaaaggggccagactt gcgtcgtgcattacaccgggatgctggaggacgggaagaaagtggacagctccagggatcgc aacaagcccttcaagttcatgctgggaaagcaggaagtgatccgaggatgggaggaaggcgt ggcacagatgtcagtcggccagcgggccaaactgaccattagccctgactacgcttatggagca acaggccacccagggatcattccccctcatgccaccctggtcttcgatgtggaactgctgaagctg gagggaggaggaggatccggatttggggacgtgggggccctggagtctctgcgaggaaatgc cgatctggcttacatcctgagcatggaaccctgcggccactgtctgatcattaacaatgtgaacttct gcagagaaagcggactgcgaacacggactggctccaatattgactgtgagaagctgcggaga aggttctctagtctgcactttatggtcgaagtgaaaggggatctgaccgccaagaaaatggtgctg gccctgctggagctggctcagcaggaccatggagctctggattgctgcgtggtcgtgatcctgtcc cacgggtgccaggcttctcatctgcagttccccggagcagtgtacggaacagacggctgtcctgt cagcgtggagaagatcgtcaacatcttcaacggcacttcttgccctagtctggggggaaagccaa aactgttctttatccaggcctgtggcggggaacagaaagatcacggcttcgaggtggccagcacc agccctgaggacgaatcaccagggagcaaccctgaaccagatgcaactccattccaggaggg actgaggacctttgaccagctggatgctatctcaagcctgcccactcctagtgacattttcgtgtctta cagtaccttcccaggctttgtctcatggcgcgatcccaagtcagggagctggtacgtggagacact ggacgacatctttgaacagtgggcccattcagaggacctgcagagcctgctgctgcgagtggca aacgctgtctctgtgaagggcatctacaaacagatgcccgggtgcttcaattttctgagaaagaaa ctgttctttaagacttcc (SEQ ID NO: 14642).
[00536] Em algumas modalidades dos nanotransposons da presen- te invenção, incluindo aqueles em que a referida pelo menos uma se- quência exógena compreende um polipeptídeo pró-apoptótico induzí- vel, a sequência exógena também compreende uma sequência codifi- cando um marcador selecionável. Em algumas modalidades, a se- quência codificando o marcador selecionável compreende uma se- quência codificando um marcador detectável. Em algumas modalida- des, o marcador detectável compreende um marcador fluorescente ou um marcador de superfície celular. Em algumas modalidades, a se- quência codificando o marcador selecionável compreende uma se- quência codificando uma proteína que é ativa em células em divisão e não ativas em células em não divisão. Em algumas modalidades, a sequência codificando o marcador selecionável compreende uma se- quência codificando um marcador metabólico. Em algumas modalida- des, a sequência codificando o marcador selecionável compreende uma sequência codificando uma enzima de muteína de di-hidrofolato redutase (DHFR). Em algumas modalidades, a enzima de muteína de DHFR compreende ou consiste em uma sequência de aminoácido de: 1 MVGSLNCIVA VSQNMGIGKN GDFPWPPLRN ESRYFQRMTT TSSVEGKQNL 61 VIMGKKTWFS IPEKNRPLKG RINLVLSREL KEPPQGAHFL SRSLDDALKL
121 TEQPELANKV DMVWIVGGSS VYKEAMNHPG HLKLFVTRIM QDFESDTFFP 181 EIDLEKYKLL PEYPGVLSDV QEEKGIKYKF EVYEKND (SEQ ID NO: 17012).
Em algumas modalidades, a enzima de muteína de DHFR é codificada pela sequência de ácido nucleico compreendendo ou consistindo em atggtcgggtctctgaattgtatcgtcgccgtgagtcagaacatgggcattgggaagaatggcgat ttcccatggccacctctgcgcaacgagtcccgatactttcagcggatgacaactacctcctctgtgg aagggaaacagaatctggtcatcatgggaaagaaaacttggttcagcattccagagaagaacc ggcccctgaaaggcagaatcaatctggtgctgtcccgagaactgaaggagccaccacaggga gctcactttctgagccggtccctggacgatgcactgaagctgacagaacagcctgagctggcca acaaagtcgatatggtgtggatcgtcgggggaagttcagtgtataaggaggccatgaatcacccc ggccatctgaaactgttcgtcacacggatcatgcaggactttgagagcgatactttctttcctgaaat tgacctggagaagtacaaactgctgcccgaatatcctggcgtgctgtccgatgtccaggaagag aaaggcatcaaatacaagttcgaggtctatgagaagaatgac (SEQ ID NO: 17095). Em algumas modalidades, a sequência de aminoácido de uma enzima de muteína de DHFR também compreende uma mutação em uma ou mais das posições 80, 113, ou 153. Em algumas modalidades, a se- quência de aminoácido de uma enzima de muteína de DHFR compre- ende uma ou mais dentre uma substituição de uma fenilalanina (F) ou uma leucina (L) na posição 80, uma substituição de uma leucina (L) ou uma valina (V) na posição 113, e uma substituição de uma valina (V) ou um ácido aspártico (D) na posição 153.
[00537] Em algumas modalidades dos nanotransposons da presen- te invenção, incluindo aqueles em que a referida pelo menos uma se- quência exógena compreende um polipeptídeo proapoptótico induzível e/ou a sequência exógena compreende uma sequência codificando um marcador selecionável, a sequência exógena também compreende uma sequência codificando um receptor de antígeno de ocorrência não natural, e/ou uma sequência codificando um polipeptídeo terapêutico. Em algumas modalidades, o receptor de antígeno de ocorrência não natural compreende um receptor de célula T (TCR). Em algumas mo- dalidades, uma sequência codificando o TCR compreende uma ou mais dentre uma inserção, uma deleção, uma substituição, uma inver- são, uma transposição ou uma estrutura comparada a uma correspon- dente sequência tipo selvagem. Em algumas modalidades, uma se- quência codificando o TCR compreende uma sequência recombinante ou quimérica. Em algumas modalidades, o receptor de antígeno de ocorrência não natural compreende um receptor de antígeno quimérico (CAR). Em algumas modalidades, o CAR compreende: (a) um ecto- domínio compreendendo uma região de reconhecimento do antígeno, (b) um domínio de transmembrana, e (c) um endodomínio compreen- dendo pelo menos um domínio coestimulatório. Em algumas modali- dades, o ectodomínio de (a) do CAR também compreende um peptí- deo sinal. Em algumas modalidades, o ectodomínio de (a) do CAR também compreende uma articulação entre a região de reconhecimen- to do antígeno e o domínio de transmembrana. Em algumas modalida- des, o endodomínio compreende um endodomínio de CD3ζ humano. Em algumas modalidades, pelo menos um domínio coestimulatório compreende um segmento intracelular de 4-1BB, CD28, CD40, ICOS, MyD88, OX-40 humano, ou qualquer combinação dos mesmos. Em algumas modalidades, pelo menos um domínio coestimulatório com- preende um domínio coestimulatório de CD28 e/ou 4-1BB humano. Em algumas modalidades, a região de reconhecimento do antígeno compreende um ou mais dentre uma scFv, uma VHH, uma VH, e uma Centirina.
[00538] Em algumas modalidades dos nanotransposons da presen- te invenção, incluindo aqueles em que a referida pelo menos uma se- quência exógena compreende um polipeptídeo proapoptótico induzível e/ou a sequência exógena compreende uma sequência codificando um marcador selecionável, a sequência exógena também compreende uma sequência codificando uma transposase.
[00539] Em algumas modalidades dos nanotransposons da presen-
te invenção, a sequência intra-ITR compreende uma sequência codifi- cando um marcador selecionável, uma sequência exógena, uma se- quência codificando um polipeptídeo caspase induzível, e pelo menos uma sequência codificando um peptídeo autoclivável. Em algumas modalidades, a referida pelo menos uma sequência codificando um peptídeo autoclivável é posicionada entre um ou mais de: (a) a se- quência codificando um marcador selecionável e a sequência exóge- na, (b) a sequência codificando um marcador selecionável e o poli- peptídeo caspase induzível, e (c) a sequência exógena e o polipeptí- deo caspase induzível. Em algumas modalidades, uma primeira se- quência codificando um peptídeo autoclivável é posicionada entre a sequência codificando um marcador selecionável e a sequência exó- gena e uma segunda sequência codificando um peptídeo autoclivável é posicionada entre a sequência exógena e o polipeptídeo caspase induzível.
[00540] Em algumas modalidades dos nanotransposons da presen- te invenção, incluindo aqueles em que a referida pelo menos uma se- quência exógena compreende um ou mais dentre um polipeptídeo pró- apoptótico induzível, uma sequência codificando um marcador seleci- onável, e uma sequência exógena, a sequência codificando uma pri- meira repetição terminal invertida (ITR) ou a sequência codificando uma segunda repetição terminal invertida (ITR) são reconhecidas por uma transposase piggyBac ou uma transposase semelhante à piggyBac. Em algumas modalidades, a sequência codificando uma primeira repetição terminal invertida (ITR) ou a sequência codificando uma segunda repetição terminal invertida (ITR) são reconhecidas por uma transposase piggyBac. Em algumas modalidades, a sequência codificando uma primeira repetição terminal invertida (ITR) ou a se- quência codificando uma segunda repetição terminal invertida (ITR) são reconhecidas por uma transposase semelhante à piggyBac. Em algumas modalidades, a sequência codificando uma primeira repetição terminal invertida (ITR) ou a sequência codificando uma segunda repe- tição terminal invertida (ITR) compreendem uma sequência de reco- nhecimento TTAA, TTAT ou TTAX. Em algumas modalidades, a se- quência codificando uma primeira repetição terminal invertida (ITR) ou a sequência codificando uma segunda repetição terminal invertida (ITR) compreendem uma sequência de reconhecimento TTAA, TTAT ou TTAX e uma sequência tendo pelo menos 50% de identidade para uma sequência isolada ou derivada de uma transposase piggyBac ou uma transposase semelhante à piggyBac. Em algumas modalidades, a sequência codificando uma primeira repetição terminal invertida (ITR) ou a sequência codificando uma segunda repetição terminal invertida (ITR) compreendem pelo menos 2 nucleotídeos (nts), 3 nts, 4 nts, 5 nts, 6 nts, 7 nts, 8 nts, 9 nts, 10 nts, 11 nts, 12 nts, 13 nts, 14 nts, 15 nts, 16 nts, 17 nts, 18 nts, 19 nts, ou 20 nts.
[00541] Em algumas modalidades dos nanotransposons da presente invenção, incluindo aqueles em que a referida pelo menos uma sequência exógena compreende um ou mais dentre um polipeptídeo pró-apoptótico induzível, uma sequência codificando um marcador selecionável, e uma sequência exógena, a sequência codificando uma primeira repetição terminal invertida (ITR) ou a sequência codificando uma segunda repetição terminal invertida (ITR) são reconhecidas por uma transposase piggyBac ou uma transposase semelhante à piggyBac. Em algumas modalidades, a sequência codificando uma primeira repetição terminal invertida (ITR) ou a sequência codificando uma segunda repetição terminal invertida (ITR) compreende a sequência de CCCTAGAAAGATAGTCTGCGTAAAATTGACGCATG (SEQ ID NO: 17096) ou uma sequência tendo pelo menos 70% de identidade para a sequência de CCCTAGAAAGATAGTCTGCGTAAAATTGACGCATG
(SEQ ID NO: 17096). Em algumas modalidades, a sequência codificando uma primeira repetição terminal invertida (ITR) ou a sequência codificando uma segunda repetição terminal invertida (ITR) compreende a sequência de
CCCTAGAAAGATAATCATATTGTGACGTACGTTAAAGATAATCATG CGTAAAATTGACGCATG (SEQ ID NO: 17097). Em algumas modalidades, a sequência codificando uma primeira repetição terminal invertida (ITR) ou a sequência codificando uma segunda repetição terminal invertida (ITR) compreende a sequência de CCCTAGAAAGATAGTCTGCGTAAAATTGACGCATG (SEQ ID NO: 17096) e compreende a sequência de
CCCTAGAAAGATAATCATATTGTGACGTACGTTAAAGATAATCATG CGTAAAATTGACGCATG (SEQ ID NO: 17097). Em algumas modalidades, a sequência codificando uma primeira repetição terminal invertida (ITR) ou a sequência codificando uma segunda repetição terminal invertida (ITR) compreende a sequência de CCCTAGAAAGATAGTCTGCGTAAAATTGACGCATG(SEQ ID NO: 17096) e compreende a sequência de
CCCTAGAAAGATAATCATATTGTGACGTACGTTAAAGATAATCATG TGTAAAATTGACGCATG (SEQ ID NO: 17098). Em algumas modalidades, a sequência codificando uma primeira repetição terminal invertida (ITR) ou a sequência codificando uma segunda repetição terminal invertida (ITR) compreende a sequência de CCCTAGAAAGATAGTCTGCGTAAAATTGACGCATG (SEQ ID NO: 17096) e compreende a sequência de
TTAACCCTAGAAAGATAATCATATTGTGACGTACGTTAAAGATAAT CATGTGTAAAATTGACGCATGTGTTTTATCGGTCTGTATATCGAGG TTTATTTATTAATTTGAATAGATATTAAGTTTTATTATATTTACACTTA CATACTAATAATAAATTCAACAAACAATTTATTTATGTTTATTTATTT ATTAAAAAAAACAAAAACTCAAAATTTCTTCTATAAAGTAACAAAAC
TTTTA (SEQ ID NO: 17099).
[00542] Em algumas modalidades dos nanotransposons da presen- te invenção, incluindo aqueles em que a referida pelo menos uma se- quência exógena compreende um ou mais dentre um polipeptídeo pró- apoptótico induzível, uma sequência codificando um marcador seleci- onável, e uma sequência exógena, a sequência codificando uma pri- meira repetição terminal invertida (ITR) ou a sequência codificando uma segunda repetição terminal invertida (ITR) são reconhecidas por uma transposase piggyBac ou uma transposase semelhante à piggyBac. Em algumas modalidades, a sequência codificando uma primeira repetição terminal invertida (ITR) ou a sequência codificando uma segunda repetição terminal invertida (ITR) é reconhecida por uma transposase piggyBac tendo uma sequência de aminoácido de pelo menos 20% de identidade para a sequência de aminoácido de 1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEI SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG 61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG 121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTGATFRD TNEDEIYAFF 181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV 241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RMYIPNKPSK YGIKILMMCD 301 SGTKYMINGM PILGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ 361 EPIKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVILLSSC 421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN 481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRILRD NISNILPNEV 541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF(SEQ ID NO: 14487).
Em algumas modalidades, a sequência codificando uma primeira repe- tição terminal invertida (ITR) ou a sequência codificando uma segunda repetição terminal invertida (ITR) é reconhecida por uma transposase piggyBac tendo a sequência de aminoácido de 1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEI SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG 61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG 121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTGATFRD TNEDEIYAFF 181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV 241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RMYIPNKPSK YGIKILMMCD 301 SGTKYMINGM PILGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ
361 EPIKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVILLSSC 421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN 481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRILRD NISNILPNEV 541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF(SEQ ID NO: 14487).
Em algumas modalidades, a sequência codificando uma primeira repe- tição terminal invertida (ITR) ou a sequência codificando uma segunda repetição terminal invertida (ITR) é reconhecida por uma transposase piggyBac tendo uma sequência de aminoácido de pelo menos 20% de identidade para a sequência de aminoácido de 1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEV SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG 61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG 121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTSATFRD TNEDEIYAFF 181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV 241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RVYIPNKPSK YGIKILMMCD 301 SGTKYMINGM PILGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ 361 EPIKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVILLSSC 421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN 481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRILRD NISNILPKEV 541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF (SEQ ID NO: 14484).
Em algumas modalidades, a sequência codificando uma primeira repe- tição terminal invertida (ITR) ou a sequência codificando uma segunda repetição terminal invertida (ITR) é reconhecida por uma transposase piggyBac tendo a sequência de aminoácido de 1 MGSSLDDEHI LSALLQSDDE LVGEDSDSEV SDHVSEDDVQ SDTEEAFIDE VHEVQPTSSG 61 SEILDEQNVI EQPGSSLASN RILTLPQRTI RGKNKHCWST SKSTRRSRVS ALNIVRSQRG 121 PTRMCRNIYD PLLCFKLFFT DEIISEIVKW TNAEISLKRR ESMTSATFRD TNEDEIYAFF 181 GILVMTAVRK DNHMSTDDLF DRSLSMVYVS VMSRDRFDFL IRCLRMDDKS IRPTLRENDV 241 FTPVRKIWDL FIHQCIQNYT PGAHLTIDEQ LLGFRGRCPF RVYIPNKPSK YGIKILMMCD 301 SGTKYMINGM PILGRGTQTN GVPLGEYYVK ELSKPVHGSC RNITCDNWFT SIPLAKNLLQ 361 EPIKLTIVGT VRSNKREIPE VLKNSRSRPV GTSMFCFDGP LTLVSYKPKP AKMVILLSSC 421 DEDASINEST GKPQMVMYYN QTKGGVDTLD QMCSVMTCSR KTNRWPMALL YGMINIACIN 481 SFIIYSHNVS SKGEKVQSRK KFMRNLYMSL TSSFMRKRLE APTLKRILRD NISNILPKEV 541 PGTSDDSTEE PVMKKRTYCT YCPSKIRRKA NASCKKCKKV ICREHNIDMC QSCF (SEQ ID NO: 14484).
[00543] Em algumas modalidades dos nanotransposons da presen- te invenção, incluindo aqueles em que a referida pelo menos uma se-
quência exógena compreende um ou mais dentre um polipeptídeo pró- apoptótico induzível, uma sequência codificando um marcador seleci- onável, e uma sequência exógena, a sequência codificando uma pri- meira repetição terminal invertida (ITR) ou a sequência codificando uma segunda repetição terminal invertida (ITR) são reconhecidas pela transposase Sleeping Beauty. Em algumas modalidades, a transposa- se Sleeping Beauty é uma transposase Sleeping Beauty hiperative (SB100X).
[00544] Em algumas modalidades dos nanotransposons da presen- te invenção, incluindo aqueles em que a referida pelo menos uma se- quência exógena compreende um ou mais dentre um polipeptídeo pró- apoptótico induzível, uma sequência codificando um marcador seleci- onável, e uma sequência exógena, a sequência codificando uma pri- meira repetição terminal invertida (ITR) ou a sequência codificando uma segunda repetição terminal invertida (ITR) são reconhecidas por uma transposase Helitron.
[00545] Em algumas modalidades dos nanotransposons da presen- te invenção, incluindo aqueles em que a referida pelo menos uma se- quência exógena compreende um ou mais dentre um polipeptídeo pró- apoptótico induzível, uma sequência codificando um marcador seleci- onável, e uma sequência exógena, a sequência codificando uma pri- meira repetição terminal invertida (ITR) ou a sequência codificando uma segunda repetição terminal invertida (ITR) são reconhecidas por uma transposase Tol2.
[00546] A presente invenção fornece uma célula compreendendo um nanotransposon da presente invenção. Em algumas modalidades, a célula também compreende uma composição de transposase. Em algumas modalidades, uma composição de transposase compreende a transposase ou uma sequência codificando o transposase que é ca- paz de reconhecer a primeira ITR ou a segunda ITR do nanotranspo-
son. Em algumas modalidades, uma composição de transposase compreende um nanotransposon compreendendo a sequência codifi- cando a transposase. Em algumas modalidades, a célula compreende uma primeira nanotransposon compreendendo uma sequência exóge- na e um segundo nanotransposon compreendendo uma sequência codificando um transposase. Em algumas modalidades, a célula é uma célula alogênica.
[00547] A presente invenção fornece uma composição compreen- dendo o nanotransposon da presente invenção.
[00548] A presente invenção fornece uma composição compreen- dendo a célula da presente invenção. Em algumas modalidades, a cé- lula compreende um nanotransposon da presente invenção. Em algu- mas modalidades, a célula não é mais modificada. Em algumas moda- lidades, a célula é alogênica.
[00549] A presente invenção fornece uma composição compreen- dendo uma célula da presente invenção. Em algumas modalidades, a célula compreende um nanotransposon da presente invenção. Em al- gumas modalidades, a célula não é mais modificada. Em algumas mo- dalidades, a célula é autóloga.
[00550] A presente invenção fornece uma composição compreen- dendo uma pluralidade de células da presente invenção. Em algumas modalidades, pelo menos uma célula de uma pluralidade de células compreende um nanotransposon da presente invenção. Em algumas modalidades, uma porção de uma pluralidade de células compreende um nanotransposon da presente invenção. Em algumas modalidades, a porção compreende pelo menos 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 99% ou qualquer porcentagem no meio da pluralida- de de células. Em algumas modalidades, cada célula de uma plurali- dade de células compreende um nanotransposon da presente inven-
ção. Em algumas modalidades, uma pluralidade de células não com- preende uma célula modificada da presente invenção. Em algumas modalidades, pelo menos uma célula de uma pluralidade de células não é mais modificada. Em algumas modalidades, nenhuma de uma pluralidade de células não é mais modificada. Em algumas modalida- des, pluralidade de células é alogênica. Em algumas modalidades, uma pluralidade de células alogênicas é produzida de acordo com os métodos da presente invenção. Em algumas modalidades, pluralidade de células é autóloga. Em algumas modalidades, uma pluralidade de células autólogas é produzida de acordo com os métodos da presente invenção.
[00551] A presente invenção fornece uma célula modificada com- preendendo: (a) um nanotransposon da presente invenção; (b) uma sequência codificando um polipeptídeo pró-apoptótico induzível; e em que uma célula é uma célula T, (c) uma modificação de uma sequên- cia endógena codificando um receptor de célula T (TCR), em que a modificação reduz ou elimina um nível de expressão ou atividade do TCR. Em algumas modalidades, a célula compreende ainda: (d) uma sequência de ocorrência não natural compreendendo um antígeno de histocompatibilidade HLA de classe I, cadeia alfa E (HLA-E), e (e) uma modificação de uma sequência endógena codificando Beta-2- Microglobulina (B2M), em que a modificação reduz ou elimina um nível de expressão ou atividade de um complexo principal de histocompati- bilidade (MHC) de classe I (MHC-I).
[00552] A presente invenção fornece uma célula modificada com- preendendo: (a) um nanotransposon da presente invenção; (b) uma sequência codificando um polipeptídeo pró-apoptótico induzível; (c) uma sequência de ocorrência não natural compreendendo um antíge- no de histocompatibilidade HLA de classe I, cadeia alfa E (HLA-E), e (e) uma modificação de uma sequência endógena codificando Beta-2-
Microglobulina (B2M), em que a modificação reduz ou elimina um nível de expressão ou atividade de um complexo de histocompatibilidade principal (MHC) de classe I (MHC-I).
[00553] Em algumas modalidades das células modificadas da pre- sente invenção, a sequência de ocorrência não natural compreenden- do um HLA-E também compreende uma sequência codificando um peptídeo de sinal B2M. Em algumas modalidades, a sequência de ocorrência não natural compreendendo um HLA-E também compreen- de um ligante, em que o ligante é posicionado entre a sequência codi- ficando a sequência codificando um polipeptídeo B2M e a sequência codificando o HLA-E. Em algumas modalidades, a sequência de ocor- rência não natural compreendendo um HLA-E também compreende uma sequência codificando um peptídeo e uma sequência codificando um polipeptídeo B2M. Em algumas modalidades, a sequência de ocor- rência não natural compreendendo um HLA-E também compreende um primeiro ligante posicionado entre a sequência codificando o peptí- deo de sinal B2M e a sequência codificando o peptídeo, e um segundo ligante posicionado entre a sequência codificando o polipeptídeo B2M e sequência codificando o HLA-E.
[00554] Em algumas modalidades das células, células não modifi- cadas e células modificadas da presente invenção, a célula é uma cé- lula de mamífero.
[00555] Em algumas modalidades das células, células não modifi- cadas e células modificadas da presente invenção, a célula é uma cé- lula humana.
[00556] Em algumas modalidades das células, células não modifi- cadas e células modificadas da presente invenção, a célula é uma cé- lula-tronco.
[00557] Em algumas modalidades das células, células não modifi- cadas e células modificadas da presente invenção, a célula é uma cé-
lula diferenciada.
[00558] Em algumas modalidades das células, células não modifi- cadas e células modificadas da presente invenção, a célula é uma cé- lula somática.
[00559] Em algumas modalidades das células, células não modifi- cadas e células modificadas da presente invenção, a célula é uma cé- lula imune ou um precursor de célula imune. Em algumas modalida- des, a célula imune é uma célula progenitora linfóide, uma célula ex- terminadora natural (NK), uma célula exterminadora induzida por cito- cina (CIK), um linfócito T (célula T), um linfócito B (célula B) ou uma célula apresentando antígeno (APC). Em algumas modalidades, a cé- lula imune é uma célula T, uma célula T de memória inicial, uma célula T tipo célula-tronco, uma célula T de memória tronco (Tscm), ou uma célula T de memória central (Tcm). Em algumas modalidades, o pre- cursor da célula imune é uma célula-tronco hematopoiética (HSC). Em algumas modalidades, a célula é uma célula apresentadora de antíge- no (APC).
[00560] Em algumas modalidades das células, células não modifi- cadas e células modificadas da presente invenção, a célula também compreende uma composição de edição de genes. Em algumas mo- dalidades, a composição de edição de genes compreende uma se- quência codificando um domínio de ligação de DNA e uma sequência codificando uma proteína de nuclease ou um domínio de nuclease das mesmas. Em algumas modalidades, a composição de edição de gene compreende uma sequência codificando uma proteína de nuclease ou uma sequência codificando um domínio de nuclease da mesma. Em algumas modalidades, a sequência codificando uma proteína de nu- clease ou a sequência codificando um domínio de nuclease da mesma compreende uma sequência de DNA, uma sequência de RNA, ou uma combinação das mesmas. Em algumas modalidades, a nuclease ou o domínio da nuclease da mesma compreende uma ou mais dentre uma proteína CRISPR / Cas, uma Nuclease Efetora Tipo Ativador de Transcrição (TALEN), uma Nuclease de Dedo de Zinco (ZFN) e uma endonuclease. Em algumas modalidades, a proteína CRISPR / Cas compreende uma proteína Cas (dCas) inativada por nuclease.
[00561] Em algumas modalidades das células, células não modifi- cadas e células modificadas da presente invenção, a célula também compreende uma composição de edição de genes. Em algumas mo- dalidades, a composição de edição de genes compreende uma se- quência codificando um domínio de ligação de DNA e uma sequência codificando uma proteína de nuclease ou um domínio de nuclease das mesmas. Em algumas modalidades, a nuclease ou o domínio de nu- clease da mesma compreende uma proteína Cas (dCas) inativada por nuclease e uma endonuclease. Em algumas modalidades, a endonu- clease compreende uma nuclease Clo051 ou um domínio de nuclease da mesma. Em algumas modalidades, a composição de edição de ge- nes compreende uma proteína de fusão. Em algumas modalidades, a proteína de fusão compreende uma proteína Cas9 (dCas9) inativada por nuclease e uma nuclease Clo051 ou um domínio de nuclease Clo051. Em algumas modalidades, a composição de edição de genes também compreende uma sequência guia. Em algumas modalidades, a sequência guia compreende uma sequência de RNA. Em algumas modalidades, a proteína de fusão compreende ou consiste na sequên- cia de aminoácidos:
MAPKKKRKVEGIKSNISLLKDELRGQISHISHEILSLIDLAFDSKQNRLF EMKVLELLVNEYGFKGRHLGGSRKPDGIVYSTTLEDNFGIIVDTKAYS EGYSLPISQADEMERYVRENSNRDEEVNPNKWWENFSEEVKKYYFV FISGSFKGKFEEQLRRLSMTTGVNGSAVNVVNLLLGAEKIRSGEMTIE ELERAMFNNSEFILKYGGGGSDKKYSIGLAIGTNSVGWAVITDEYKVP SKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRK NRICILQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDE VAYHEKYPTIYHLRKKLVDSTDKADLRLIILALAHMIKFRGHFLIEGDLN PDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLE NLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTY DDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGA SQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHL GELHAILRRQEDFYPFLKDNREKIEKILTFRIPIYVGPLARGNSRFAWM TRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHS LLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT VKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDN EENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYT GWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFK EDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGR HKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPV ENTQLQNEKLILYILQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKD DSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRK FDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYD ENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAILNAVV GTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNI MNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMP QVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSP TVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKG YKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVN FLILASHYEKLKGSPEDNEQKQLFVEQHKHILDEIIEQISEFSKRVILAD ANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDR
KRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDGSPKKKRKVSS (SEQ ID NO: 17013) ou um ácido nucleico compreendendo ou consistindo na sequência: 1 atggcaccaa agaagaaaag aaaagtggag ggcatcaagt caaacatcag cctgctgaaa 61 gacgaactgc ggggacagat tagtcacatc agtcacgagt acctgtcact gattgatctg
121 gccttcgaca gcaagcagaa tagactgttt gagatgaaag tgctggaact gctggtcaac 181 gagtatggct tcaagggcag acatctgggc gggtctagga aacctgacgg catcgtgtac 241 agtaccacac tggaagacaa cttcggaatc attgtcgata ccaaggctta ttccgagggc 301 tactctctgc caattagtca ggcagatgag atggaaaggt acgtgcgcga aaactcaaat 361 agggacgagg aagtcaaccc caataagtgg tgggagaatt tcagcgagga agtgaagaaa 421 tactacttcg tctttatctc aggcagcttc aaagggaagt ttgaggaaca gctgcggaga 481 ctgtccatga ctaccggggt gaacggatct gctgtcaacg tggtcaatct gctgctgggc 541 gcagaaaaga tcaggtccgg ggagatgaca attgaggaac tggaacgcgc catgttcaac 601 aattctgagt ttatcctgaa gtatggaggc gggggaagcg ataagaaata ctccatcgga 661 ctggccattg gcaccaattc cgtgggctgg gctgtcatca cagacgagta caaggtgcca 721 agcaagaagt tcaaggtcct ggggaacacc gatcgccaca gtatcaagaa aaatctgatt 781 ggagccctgc tgttcgactc aggcgagact gctgaagcaa cccgactgaa gcggactgct 841 aggcgccgat atacccggag aaaaaatcgg atctgctacc tgcaggaaat tttcagcaac 901 gagatggcca aggtggacga tagtttcttt caccgcctgg aggaatcatt cctggtggag 961 gaagataaga aacacgagcg gcatcccatc tttggcaaca ttgtggacga agtcgcttat 1021 cacgagaagt accctactat ctatcatctg aggaagaaac tggtggactc caccgataag 1081 gcagacctgc gcctgatcta tctggccctg gctcacatga tcaagttccg ggggcatttt 1141 ctgatcgagg gagatctgaa ccctgacaat tctgatgtgg acaagctgtt catccagctg 1201 gtccagacat acaatcagct gtttgaggaa aacccaatta atgcctcagg cgtggacgca 1261 aaggccatcc tgagcgccag actgtccaaa tctaggcgcc tggaaaacct gatcgctcag 1321 ctgccaggag agaagaaaaa cggcctgttt gggaatctga ttgcactgtc cctgggcctg 1381 acacccaact tcaagtctaa ttttgatctg gccgaggacg ctaagctgca gctgtccaaa 1441 gacacttatg acgatgacct ggataacctg ctggctcaga tcggcgatca gtacgcagac 1501 ctgttcctgg ccgctaagaa tctgagtgac gccatcctgc tgtcagatat tctgcgcgtg 1561 aacacagaga ttactaaggc cccactgagt gcttcaatga tcaaaagata tgacgagcac 1621 catcaggatc tgaccctgct gaaggctctg gtgaggcagc agctgcccga gaaatacaag 1681 gaaatcttct ttgatcagag caagaatgga tacgccggct atattgacgg cggggcttcc 1741 caggaggagt tctacaagtt catcaagccc attctggaaa agatggacgg caccgaggaa 1801 ctgctggtga agctgaatcg ggaggacctg ctgagaaaac agaggacatt tgataacgga 1861 agcatccctc accagattca tctgggcgaa ctgcacgcca tcctgcgacg gcaggaggac 1921 ttctacccat ttctgaagga taaccgcgag aaaatcgaaa agatcctgac cttcagaatc 1981 ccctactatg tggggcctct ggcacgggga aatagtagat ttgcctggat gacaagaaag 2041 tcagaggaaa ctatcacccc ctggaacttc gaggaagtgg tcgataaagg cgctagcgca 2101 cagtccttca ttgaaaggat gacaaatttt gacaagaacc tgccaaatga gaaggtgctg 2161 cccaaacaca gcctgctgta cgaatatttc acagtgtata acgagctgac taaagtgaag 2221 tacgtcaccg aagggatgcg caagcccgca ttcctgtccg gagagcagaa gaaagccatc 2281 gtggacctgc tgtttaagac aaatcggaaa gtgactgtca aacagctgaa ggaagactat 2341 ttcaagaaaa ttgagtgttt cgattcagtg gaaatcagcg gcgtcgagga caggtttaac 2401 gcctccctgg ggacctacca cgatctgctg aagatcatca aggataagga cttcctggac 2461 aacgaggaaa atgaggacat cctggaggac attgtgctga cactgactct gtttgaggat 2521 cgcgaaatga tcgaggaacg actgaagact tatgcccatc tgttcgatga caaagtgatg 2581 aagcagctga aaagaaggcg ctacaccgga tggggacgcc tgagccgaaa actgatcaat
2641 gggattagag acaagcagag cggaaaaact atcctggact ttctgaagtc cgatggcttc 2701 gccaacagga acttcatgca gctgattcac gatgactctc tgaccttcaa ggaggacatc 2761 cagaaagcac aggtgtctgg ccagggggac agtctgcacg agcatatcgc aaacctggcc 2821 ggcagccccg ccatcaagaa agggattctg cagaccgtga aggtggtgga cgaactggtc 2881 aaggtcatgg gacgacacaa acctgagaac atcgtgattg agatggcccg cgaaaatcag 2941 acaactcaga agggccagaa aaacagtcga gaacggatga agagaatcga ggaaggcatc 3001 aaggagctgg ggtcacagat cctgaaggag catcctgtgg aaaacactca gctgcagaat 3061 gagaaactgt atctgtacta tctgcagaat ggacgggata tgtacgtgga ccaggagctg 3121 gatattaaca gactgagtga ttatgacgtg gatgccatcg tccctcagag cttcctgaag 3181 gatgactcca ttgacaacaa ggtgctgacc aggtccgaca agaaccgcgg caaatcagat 3241 aatgtgccaa gcgaggaagt ggtcaagaaa atgaagaact actggaggca gctgctgaat 3301 gccaagctga tcacacagcg gaaatttgat aacctgacta aggcagaaag aggaggcctg 3361 tctgagctgg acaaggccgg cttcatcaag cggcagctgg tggagacaag acagatcact 3421 aagcacgtcg ctcagattct ggatagcaga atgaacacaa agtacgatga aaacgacaag 3481 ctgatcaggg aggtgaaagt cattactctg aaatccaagc tggtgtctga ctttagaaag 3541 gatttccagt tttataaagt cagggagatc aacaactacc accatgctca tgacgcatac 3601 ctgaacgcag tggtcgggac cgccctgatt aagaaatacc ccaagctgga gtccgagttc 3661 gtgtacggag actataaagt gtacgatgtc cggaagatga tcgccaaatc tgagcaggaa 3721 attggcaagg ccaccgctaa gtatttcttt tacagtaaca tcatgaattt ctttaagacc 3781 gaaatcacac tggcaaatgg ggagatcaga aaaaggcctc tgattgagac caacggggag 3841 acaggagaaa tcgtgtggga caagggaagg gattttgcta ccgtgcgcaa agtcctgtcc 3901 atgccccaag tgaatattgt caagaaaact gaagtgcaga ccgggggatt ctctaaggag 3961 agtattctgc ctaagcgaaa ctctgataaa ctgatcgccc ggaagaaaga ctgggacccc 4021 aagaagtatg gcgggttcga ctctccaaca gtggcttaca gtgtcctggt ggtcgcaaag 4081 gtggaaaagg ggaagtccaa gaaactgaag tctgtcaaag agctgctggg aatcactatt 4141 atggaacgca gctccttcga gaagaatcct atcgattttc tggaagccaa gggctataaa 4201 gaggtgaaga aagacctgat cattaagctg ccaaaatact cactgtttga gctggaaaac 4261 ggacgaaagc gaatgctggc aagcgccgga gaactgcaga agggcaatga gctggccctg 4321 ccctccaaat acgtgaactt cctgtatctg gctagccact acgagaaact gaaggggtcc 4381 cctgaggata acgaacagaa gcagctgttt gtggagcagc acaaacatta tctggacgag 4441 atcattgaac agatttcaga gttcagcaag agagtgatcc tggctgacgc aaatctggat 4501 aaagtcctga gcgcatacaa caagcaccga gacaaaccaa tccgggagca ggccgaaaat 4561 atcattcatc tgttcaccct gacaaacctg ggcgcccctg cagccttcaa gtattttgac 4621 accacaatcg atcggaagag atacacttct accaaagagg tgctggatgc taccctgatc 4681 caccagagta ttaccggcct gtatgagaca cgcatcgacc tgtcacagct gggaggcgat 4741 gggagcccca agaaaaagcg gaaggtgtct agttaa (SEQ ID NO: 17014).
Em algumas modalidades, a proteína de fusão compreende ou consis- te na sequência de aminoácido: 1 MPKKKRKVEG IKSNISLLKD ELRGQISHIS HEILSLIDLA FDSKQNRLFE MKVLELLVNE 61 YGFKGRHLGG SRKPDGIVYS TTLEDNFGII VDTKAYSEGY SLPISQADEM ERYVRENSNR 121 DEEVNPNKWW ENFSEEVKKY YFVFISGSFK GKFEEQLRRL SMTTGVNGSA VNVVNLLLGA 181 EKIRSGEMTI EELERAMFNN SEFILKYGGG GSDKKYSIGL AIGTNSVGWA VITDEYKVPS
241 KKFKVLGNTD RHSIKKNLIG ALLFDSGETA EATRLKRTAR RRYTRRKNRI CILQEIFSNE 301 MAKVDDSFFH RLEESFLVEE DKKHERHPIF GNIVDEVAYH EKYPTIYHLR KKLVDSTDKA 361 DLRLIILALA HMIKFRGHFL IEGDLNPDNS DVDKLFIQLV QTYNQLFEEN PINASGVDAK 421 AILSARLSKS RRLENLIAQL PGEKKNGLFG NLIALSLGLT PNFKSNFDLA EDAKLQLSKD 481 TYDDDLDNLL AQIGDQYADL FLAAKNLSDA ILLSDILRVN TEITKAPLSA SMIKRYDEHH 541 QDLTLLKALV RQQLPEKYKE IFFDQSKNGY AGYIDGGASQ EEFYKFIKPI LEKMDGTEEL 601 LVKLNREDLL RKQRTFDNGS IPHQIHLGEL HAILRRQEDF YPFLKDNREK IEKILTFRIP 661 YYVGPLARGN SRFAWMTRKS EETITPWNFE EVVDKGASAQ SFIERMTNFD KNLPNEKVLP 721 KHSLLYEYFT VYNELTKVKY VTEGMRKPAF LSGEQKKAIV DLLFKTNRKV TVKQLKEDYF 781 KKIECFDSVE ISGVEDRFNA SLGTYHDLLK IIKDKDFLDN EENEDILEDI VLTLTLFEDR 841 EMIEERLKTY AHLFDDKVMK QLKRRRYTGW GRLSRKLING IRDKQSGKTI LDFLKSDGFA 901 NRNFMQLIHD DSLTFKEDIQ KAQVSGQGDS LHEHIANLAG SPAIKKGILQ TVKVVDELVK 961 VMGRHKPENI VIEMARENQT TQKGQKNSRE RMKRIEEGIK ELGSQILKEH PVENTQLQNE 1021 KLILYILQNG RDMYVDQELD INRLSDYDVD AIVPQSFLKD DSIDNKVLTR SDKNRGKSDN 1081 VPSEEVVKKM KNYWRQLLNA KLITQRKFDN LTKAERGGLS ELDKAGFIKR QLVETRQITK 1141 HVAQILDSRM NTKYDENDKL IREVKVITLK SKLVSDFRKD FQFYKVREIN NYHHAHDAIL 1201 NAVVGTALIK KYPKLESEFV YGDYKVYDVR KMIAKSEQEI GKATAKYFFY SNIMNFFKTE 1261 ITLANGEIRK RPLIETNGET GEIVWDKGRD FATVRKVLSM PQVNIVKKTE VQTGGFSKES 1321 ILPKRNSDKL IARKKDWDPK KYGGFDSPTV AYSVLVVAKV EKGKSKKLKS VKELLGITIM 1381 ERSSFEKNPI DFLEAKGYKE VKKDLIIKLP KYSLFELENG RKRMLASAGE LQKGNELALP 1441 SKYVNFLILA SHYEKLKGSP EDNEQKQLFV EQHKHILDEI IEQISEFSKR VILADANLDK 1501 VLSAYNKHRD KPIREQAENI IHLFTLTNLG APAAFKYFDT TIDRKRYTST KEVLDATLIH 1561 QSITGLYETR IDLSQLGGDG SPKKKRKV ((SEQ ID NO: 17058)
ou um ácido nucleico compreendendo ou consistindo na sequência: 1 atgcctaaga agaagcggaa ggtggaaggc atcaaaagca acatctccct cctgaaagac 61 gaactccggg ggcagattag ccacattagt cacgaatacc tctccctcat cgacctggct 121 ttcgatagca agcagaacag gctctttgag atgaaagtgc tggaactgct cgtcaatgag 181 tacgggttca agggtcgaca cctcggcgga tctaggaaac cagacggcat cgtgtatagt 241 accacactgg aagacaactt tgggatcatt gtggatacca aggcatactc tgagggttat 301 agtctgccca tttcacaggc cgacgagatg gaacggtacg tgcgcgagaa ctcaaataga 361 gatgaggaag tcaaccctaa caagtggtgg gagaacttct ctgaggaagt gaagaaatac 421 tacttcgtct ttatcagcgg gtccttcaag ggtaaatttg aggaacagct caggagactg 481 agcatgacta ccggcgtgaa tggcagcgcc gtcaacgtgg tcaatctgct cctgggcgct 541 gaaaagattc ggagcggaga gatgaccatc gaagagctgg agagggcaat gtttaataat 601 agcgagttta tcctgaaata cggtggcggt ggatccgata aaaagtattc tattggttta 661 gccatcggca ctaattccgt tggatgggct gtcataaccg atgaatacaa agtaccttca 721 aagaaattta aggtgttggg gaacacagac cgtcattcga ttaaaaagaa tcttatcggt 781 gccctcctat tcgatagtgg cgaaacggca gaggcgactc gcctgaaacg aaccgctcgg 841 agaaggtata cacgtcgcaa gaaccgaata tgttacttac aagaaatttt tagcaatgag 901 atggccaaag ttgacgattc tttctttcac cgtttggaag agtccttcct tgtcgaagag 961 gacaagaaac atgaacggca ccccatcttt ggaaacatag tagatgaggt ggcatatcat 1021 gaaaagtacc caacgattta tcacctcaga aaaaagctag ttgactcaac tgataaagcg
1081 gacctgaggt taatctactt ggctcttgcc catatgataa agttccgtgg gcactttctc 1141 attgagggtg atctaaatcc ggacaactcg gatgtcgaca aactgttcat ccagttagta 1201 caaacctata atcagttgtt tgaagagaac cctataaatg caagtggcgt ggatgcgaag 1261 gctattctta gcgcccgcct ctctaaatcc cgacggctag aaaacctgat cgcacaatta 1321 cccggagaga agaaaaatgg gttgttcggt aaccttatag cgctctcact aggcctgaca 1381 ccaaatttta agtcgaactt cgacttagct gaagatgcca aattgcagct tagtaaggac 1441 acgtacgatg acgatctcga caatctactg gcacaaattg gagatcagta tgcggactta 1501 tttttggctg ccaaaaacct tagcgatgca atcctcctat ctgacatact gagagttaat 1561 actgagatta ccaaggcgcc gttatccgct tcaatgatca aaaggtacga tgaacatcac 1621 caagacttga cacttctcaa ggccctagtc cgtcagcaac tgcctgagaa atataaggaa 1681 atattctttg atcagtcgaa aaacgggtac gcaggttata ttgacggcgg agcgagtcaa 1741 gaggaattct acaagtttat caaacccata ttagagaaga tggatgggac ggaagagttg 1801 cttgtaaaac tcaatcgcga agatctactg cgaaagcagc ggactttcga caacggtagc 1861 attccacatc aaatccactt aggcgaattg catgctatac ttagaaggca ggaggatttt 1921 tatccgttcc tcaaagacaa tcgtgaaaag attgagaaaa tcctaacctt tcgcatacct 1981 tactatgtgg gacccctggc ccgagggaac tctcggttcg catggatgac aagaaagtcc 2041 gaagaaacga ttactccatg gaattttgag gaagttgtcg ataaaggtgc gtcagctcaa 2101 tcgttcatcg agaggatgac caactttgac aagaatttac cgaacgaaaa agtattgcct 2161 aagcacagtt tactttacga gtatttcaca gtgtacaatg aactcacgaa agttaagtat 2221 gtcactgagg gcatgcgtaa acccgccttt ctaagcggag aacagaagaa agcaatagta 2281 gatctgttat tcaagaccaa ccgcaaagtg acagttaagc aattgaaaga ggactacttt 2341 aagaaaattg aatgcttcga ttctgtcgag atctccgggg tagaagatcg atttaatgcg 2401 tcacttggta cgtatcatga cctcctaaag ataattaaag ataaggactt cctggataac 2461 gaagagaatg aagatatctt agaagatata gtgttgactc ttaccctctt tgaagatcgg 2521 gaaatgattg aggaaagact aaaaacatac gctcacctgt tcgacgataa ggttatgaaa 2581 cagttaaaga ggcgtcgcta tacgggctgg ggacgattgt cgcggaaact tatcaacggg 2641 ataagagaca agcaaagtgg taaaactatt ctcgattttc taaagagcga cggcttcgcc 2701 aataggaact ttatgcagct gatccatgat gactctttaa ccttcaaaga ggatatacaa 2761 aaggcacagg tttccggaca aggggactca ttgcacgaac atattgcgaa tcttgctggt 2821 tcgccagcca tcaaaaaggg catactccag acagtcaaag tagtggatga gctagttaag 2881 gtcatgggac gtcacaaacc ggaaaacatt gtaatcgaga tggcacgcga aaatcaaacg 2941 actcagaagg ggcaaaaaaa cagtcgagag cggatgaaga gaatagaaga gggtattaaa 3001 gaactgggca gccagatctt aaaggagcat cctgtggaaa atacccaatt gcagaacgag 3061 aaactttacc tctattacct acaaaatgga agggacatgt atgttgatca ggaactggac 3121 ataaaccgtt tatctgatta cgacgtcgat gccattgtac cccaatcctt tttgaaggac 3181 gattcaatcg acaataaagt gcttacacgc tcggataaga accgagggaa aagtgacaat 3241 gttccaagcg aggaagtcgt aaagaaaatg aagaactatt ggcggcagct cctaaatgcg 3301 aaactgataa cgcaaagaaa gttcgataac ttaactaaag ctgagagggg tggcttgtct 3361 gaacttgaca aggccggatt tattaaacgt cagctcgtgg aaacccgcca aatcacaaag 3421 catgttgcac agatactaga ttcccgaatg aatacgaaat acgacgagaa cgataagctg 3481 attcgggaag tcaaagtaat cactttaaag tcaaaattgg tgtcggactt cagaaaggat 3541 tttcaattct ataaagttag ggagataaat aactaccacc atgcgcacga cgcttatctt
3601 aatgccgtcg tagggaccgc actcattaag aaatacccga agctagaaag tgagtttgtg 3661 tatggtgatt acaaagttta tgacgtccgt aagatgatcg cgaaaagcga acaggagata 3721 ggcaaggcta cagccaaata cttcttttat tctaacatta tgaatttctt taagacggaa 3781 atcactctgg caaacggaga gatacgcaaa cgacctttaa ttgaaaccaa tggggagaca 3841 ggtgaaatcg tatgggataa gggccgggac ttcgcgacgg tgagaaaagt tttgtccatg 3901 ccccaagtca acatagtaaa gaaaactgag gtgcagaccg gagggttttc aaaggaatcg 3961 attcttccaa aaaggaatag tgataagctc atcgctcgta aaaaggactg ggacccgaaa 4021 aagtacggtg gcttcgatag ccctacagtt gcctattctg tcctagtagt ggcaaaagtt 4081 gagaagggaa aatccaagaa actgaagtca gtcaaagaat tattggggat aacgattatg 4141 gagcgctcgt cttttgaaaa gaaccccatc gacttccttg aggcgaaagg ttacaaggaa 4201 gtaaaaaagg atctcataat taaactacca aagtatagtc tgtttgagtt agaaaatggc 4261 cgaaaacgga tgttggctag cgccggagag cttcaaaagg ggaacgaact cgcactaccg 4321 tctaaatacg tgaatttcct gtatttagcg tcccattacg agaagttgaa aggttcacct 4381 gaagataacg aacagaagca actttttgtt gagcagcaca aacattatct cgacgaaatc 4441 atagagcaaa tttcggaatt cagtaagaga gtcatcctag ctgatgccaa tctggacaaa 4501 gtattaagcg catacaacaa gcacagggat aaacccatac gtgagcaggc ggaaaatatt 4561 atccatttgt ttactcttac caacctcggc gctccagccg cattcaagta ttttgacaca 4621 acgatagatc gcaaacgata cacttctacc aaggaggtgc tagacgcgac actgattcac 4681 caatccatca cgggattata tgaaactcgg atagatttgt cacagcttgg gggtgacgga 4741 tcccccaaga agaagaggaa agtctga (SEQ ID NO: 17059).
[00562] Em algumas modalidades das células, células não modifi- cadas e células modificadas da presente invenção, um nanotranspo- son compreende a composição de edição de genes compreendendo uma sequência guia e uma sequência codificando uma proteína de fusão compreendendo uma sequência codificando uma Cas9 (dCas9) inativada e uma sequência codificando uma nuclease Clo051 ou um domínio de nuclease da mesma.
[00563] Em algumas modalidades das células, células não modifi- cadas e células modificadas da presente invenção, a célula expressa a edição de composição de genes transitoriamente.
[00564] Em algumas modalidades das células, células não modifi- cadas e células modificadas da presente invenção, a célula é uma cé- lula T e o RNA guia compreende uma sequência complementar a uma sequência alvo codificando um TCR endógeno. Em algumas modali- dades, o RNA guia compreende uma sequência complementar a uma sequência alvo que codifica um polipeptídeo B2M.
[00565] Em algumas modalidades das células, células não modifi- cadas e células modificadas da presente invenção, o RNA guia com- preende uma sequência complementar a uma sequência alvo dentro de um sítio seguro de uma sequência de DNA genômico.
[00566] Em algumas modalidades das células, células não modifi- cadas e células modificadas da presente invenção, a nuclease Clo051 ou um domínio de nuclease da mesma induz uma quebra de fita sim- ples ou dupla em uma sequência alvo. Em algumas modalidades, uma sequência doadora, um plasmídeo doador, ou uma sequência intra- ITR de nanotransposon doadora integrada em uma posição de quebra de fita simples ou dupla e/ou em uma posição de reparo celular em uma sequência alvo.
[00567] A presente invenção fornece uma composição compreen- dendo uma célula modificada de acordo com a presente invenção. Em algumas modalidades, a composição também compreende um veículo farmaceuticamente aceitável.
[00568] A presente invenção fornece uma composição compreen- dendo uma pluralidade de células modificadas de acordo com a pre- sente invenção. Em algumas modalidades, a composição também compreende um veículo farmaceuticamente aceitável.
[00569] A presente invenção fornece uma composição da presente invenção para uso no tratamento de uma doença ou distúrbio.
[00570] A presente invenção fornece o uso de uma composição da presente invenção para o tratamento de uma doença ou distúrbio.
[00571] A presente invenção fornece um método de tratar uma do- ença ou distúrbio compreendendo administrar a um indivíduo em ne- cessidade do mesmo uma quantidade terapeuticamente eficaz de uma composição da presente invenção. Em algumas modalidades, o indiví- duo não desenvolve enxerto vs. hospedeiro (GvH) e/ou hospedeiro vs. enxerto (HvG) após administração da composição. Em algumas moda-
lidades, a administração é sistêmica. Em algumas modalidades, a composição é administrada por uma rotina intravenosa. Em algumas modalidades, a composição é administrada por uma injeção intraveno- sa ou uma infusão intravenosa.
[00572] A presente invenção fornece um método de tratar uma do- ença ou distúrbio compreendendo administrar a um indivíduo em ne- cessidade do mesmo uma quantidade terapeuticamente eficaz de uma composição da presente invenção. Em algumas modalidades, o indiví- duo não desenvolve enxerto vs. hospedeiro (GvH) e/ou hospedeiro vs. enxerto (HvG) após administração da composição. Em algumas moda- lidades, a administração é local. Em algumas modalidades, a compo- sição é administrada por uma rotina intratumoral, uma rotina intraespi- nal, uma rotina intracerebroventricular, uma rotina intraocular ou uma rotina intraóssea. Em algumas modalidades, a composição é adminis- trada por uma infusão ou injeção intratumoral, uma infusão ou injeção intraespinal, uma infusão ou injeção intracerebroventricular, uma infu- são ou injeção intraocular ou uma infusão ou injeção intraóssea.
[00573] Em algumas modalidades dos métodos de tratar uma do- ença ou distúrbio da presente invenção, a dose terapeuticamente efi- caz é uma dose única e em que as células alogeneicas de uma com- posição enxertam e/ou persistem durante um tempo suficiente para tratar a doença ou distúrbio. Em algumas modalidades, a dose única é uma de pelo menos 2, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 ou qualquer número de doses entre aquelas que são fabricadas simultaneamente.
[00574] Em algumas modalidades dos métodos de tratar uma do- ença ou distúrbio da presente invenção, a dose terapeuticamente efi- caz é uma dose única e em que as células autólogas da composição enxertam e/ou persistem durante um tempo suficiente para tratar a do- ença ou distúrbio. Em algumas modalidades, a dose única é uma de pelo menos 2, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 ou qualquer número de doses entre aquelas que são fabricadas simultaneamente. Vetores e Células Hospedeiras
[00575] A presente invenção também se refere aos vetores que in- cluem moléculas de ácido nucleico isoladas da presente invenção, cé- lulas hospedeiras que são geneticamente modificadas com os vetores recombinantes, e a produção de pelo menos uma Centirina ou CARTi- rina por técnicas recombinantes, como é bem conhecido na técnica. Veja, por exemplo, Sambrook, et al., supra; Ausubel, et al., supra, ca- da incorporado totalmente aqui por referência.
[00576] Por exemplo, o vetor PB-EF1a pode ser usado. O vetor compreende a seguinte sequência de nucleotídeo: tgtacatagattaaccctagaaagataatcatattgtgacgtacgttaaagataatcatgcgtaaaa ttgacgcatgtgttttatcggtctgtatatcgaggtttatttattaatttgaatagatattaagttttattatatt tacacttacatactaataataaattcaacaaacaatttatttatgtttatttatttattaaaaaaaaacaa aaactcaaaatttcttctataaagtaacaaaacttttatcgaatacctgcagcccgggggatgcag agggacagcccccccccaaagcccccagggatgtaattacgtccctcccccgctagggggca gcagcgagccgcccggggctccgctccggtccggcgctccccccgcatccccgagccggcag cgtgcggggacagcccgggcacggggaaggtggcacgggatcgctttcctctgaacgcttctcg ctgctctttgagcctgcagacacctggggggatacggggaaaagttgactgtgcctttcgatcgaa ccatggacagttagctttgcaaagatggataaagttttaaacagagaggaatctttgcagctaatg gaccttctaggtcttgaaaggagtgggaattggctccggtgcccgtcagtgggcagagcgcacat cgcccacagtccccgagaagttggggggaggggtcggcaattgaaccggtgcctagagaagg tggcgcggggtaaactgggaaagtgatgtcgtgtactggctccgcctttttcccgagggtggggga gaaccgtatataagtgcagtagtcgccgtgaacgttctttttcgcaacgggtttgccgccagaacac aggtaagtgccgtgtgtggttcccgcgggcctggcctctttacgggttatggcccttgcgtgccttga attacttccacctggctgcagtacgtgattcttgatcccgagcttcgggttggaagtgggtgggaga gttcgaggccttgcgcttaaggagccccttcgcctcgtgcttgagttgaggcctggcctgggcgctg gggccgccgcgtgcgaatctggtggcaccttcgcgcctgtctcgctgctttcgataagtctctagcc atttaaaatttttgatgacctgctgcgacgctttttttctggcaagatagtcttgtaaatgcgggccaag atctgcacactggtatttcggtttttggggccgcgggcggcgacggggcccgtgcgtcccagcgc acatgttcggcgaggcggggcctgcgagcgcggccaccgagaatcggacgggggtagtctca agctggccggcctgctctggtgcctggcctcgcgccgccgtgtatcgccccgccctgggcggcaa ggctggcccggtcggcaccagttgcgtgagcggaaagatggccgcttcccggccctgctgcag ggagctcaaaatggaggacgcggcgctcgggagagcgggcgggtgagtcacccacacaaa ggaaaagggcctttccgtcctcagccgtcgcttcatgtgactccacggagtaccgggcgccgtcc aggcacctcgattagttctcgagcttttggagtacgtcgtctttaggttggggggaggggttttatgcg atggagtttccccacactgagtgggtggagactgaagttaggccagcttggcacttgatgtaattct ccttggaatttgccctttttgagtttggatcttggttcattctcaagcctcagacagtggttcaaagttttttt cttccatttcaggtgtcgtgagaattctaatacgactcactatagggtgtgctgtctcatcattttggca aagattggccaccaagcttgtcctgcaggagggtcgacgcctctagacgggcggccgctccgg atccacgggtaccgatcacatatgcctttaattaaacactagttctatagtgtcacctaaattcccttta gtgagggttaatggccgtaggccgccagaattgggtccagacatgataagatacattgatgagttt ggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgcttt atttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggtt cagggggaggtgtgggaggttttttcggactctaggacctgcgcatgcgcttggcgtaatcatggtc atagctgtttcctgttttccccgtatccccccaggtgtctgcaggctcaaagagcagcgagaagcgt tcagaggaaagcgatcccgtgccaccttccccgtgcccgggctgtccccgcacgctgccggctc ggggatgcggggggagcgccggaccggagcggagccccgggcggctcgctgctgcccccta gcgggggagggacgtaattacatccctgggggctttgggggggggctgtccctctcaccgcggt ggagctccagcttttgttcgaattggggccccccctcgagggtatcgatgatatctataacaagaa aatatatatataataagttatcacgtaagtagaacatgaaataacaatataattatcgtatgagttaa atcttaaaagtcacgtaaaagataatcatgcgtcattttgactcacgcggtcgttatagttcaaaatc agtgacacttaccgcattgacaagcacgcctcacgggagctccaagcggcgactgagatgtcct aaatgcacagcgacggattcgcgctatttagaaagagagagcaatatttcaagaatgcatgcgtc aattttacgcagactatctttctagggttaatctagctagccttaagggcgcctattgcgttgcgctcac tgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcgggg agaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcgg ctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggata acgcaggaaagaacatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagacccc gtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaa aaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaa ctggcttcagcagagcgcagataccaaatactgttcttctagtgtagccgtagttaggccaccactt caagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagt ggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtc gggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactga gatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacag gtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaac gcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtca ggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctgg ccttttgctcacatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagtttta aatcaatctaaagtatatatgagtaaacttggtctgacagtcagaagaactcgtcaagaaggcga tagaaggcgatgcgctgcgaatcgggagcggcgataccgtaaagcacgaggaagcggtcag cccattcgccgccaagctcttcagcaatatcacgggtagccaacgctatgtcctgatagcggtccg ccacacccagccggccacagtcgatgaatccagaaaagcggccattttccaccatgatattcgg caagcaggcatcgccatgggtcacgacgagatcctcgccgtcgggcatgctcgccttgagcctg gcgaacagttcggctggcgcgagcccctgatgctcttcgtccagatcatcctgatcgacaagacc ggcttccatccgagtacgtgctcgctcgatgcgatgtttcgcttggtggtcgaatgggcaggtagcc ggatcaagcgtatgcagccgccgcattgcatcagccatgatggatactttctcggcaggagcaag gtgagatgacaggagatcctgccccggcacttcgcccaatagcagccagtcccttcccgcttcag tgacaacgtcgagcacagctgcgcaaggaacgcccgtcgtggccagccacgatagccgcgct gcctcgtcttgcagttcattcagggcaccggacaggtcggtcttgacaaaaagaaccgggcgcc cctgcgctgacagccggaacacggcggcatcagagcagccgattgtctgttgtgcccagtcata gccgaatagcctctccacccaagcggccggagaacctgcgtgcaatccatcttgttcaatcataat attattgaagcatttatcagggttcgtctcgtcccggtctcctcccaatgcatgtcaatattggccatta gccatattattcattggttatatagcataaatcaatattggctattggccattgcatacgttgtatctatat cataata (SEQ ID NO: 18051).
[00577] Os polinucleotídeos podem opcionalmente ser associados a um vetor contendo um marcador selecionável para propagação em um hospedeiro. Geralmente, um vetor de plasmídeo é introduzido em um precipitado, tal como, um precipitado de fosfato de cálcio, ou em um complexo com um lipídeo carregado. Se o vetor é um vírus, ele pode ser empacotado in vitro usando uma linhagem celular de empacota- mento apropriada e então transduzido em células hospedeiras.
[00578] A inserção de DNA deve ser operacionalmente ligada a um promotor apropriado. Os construtos de expressão conterão ainda sítios para iniciação, terminação da transcrição e, na região transcrita, um sítio de ligação ao ribossomo para tradução. A porção de codificação dos transcritos maduros expressos pelos construtos incluirá preferi- velmente uma tradução iniciando no início e término do códon (por exemplo, UAA, UGA ou UAG) apropriadamente posicionada no final do mRNA a ser traduzido, com UAA e UAG preferidos para expressão de células de mamíferos ou eucarióticas.
[00579] Os vetores de expressão preferivelmente, mas, opcional- mente incluirão pelo menos um marcador selecionável. Esses marca- dores incluem, por exemplo, porém, não estão limitados a, ampicilina, zeocina (gene Sh bla), puromicina (gene pac), higromicina B (gene higB), G418 / Geneticina (gene neo), ácido micofenólico, ou glutamina sintetase (GS, patente dos Estados Unidos Nos. 5.122.464; 5.770.359;
5.827.739), blasticidina (gene bsd), genes de resistência para cultura de células eucarióticas, bem como, ampicilina, zeocina (gene Sh bla), puromicina (gene pac), higromicina B (gene higB) , G418 / Geneticina (gene neo), canamicina, espectinomicina, estreptomicina, carbenicili- na, bleomicina, eritromicina, polimixina B, ou genes de resistência à tetraciclina para cultivo em E. coli e outras bactérias ou procarióticos (as patentes acima são inteiramente incorporadas aqui por referência). Os meios de cultura e condições apropriados para as células hospe- deiras acima descritas são conhecidos na técnica. Os vetores adequa- dos serão facilmente evidentes ao versado na técnica. A introdução de um construto de vetor em uma célula hospedeira pode ser efetuada por transfecção de fosfato de cálcio, transfecção mediada por DEAE- dextrano, transfecção mediada por lipídios catiônicos, eletroporação, transdução, infecção ou outros métodos conhecidos. Tais métodos são descritos na técnica, tal como, Sambrook, supra, Capítulos 1-4 e 16- 18; Ausubel, supra, Capítulos 1, 9, 13, 15, 16.
[00580] Os vetores de expressão preferivelmente, mas opcional- mente incluirão pelo menos um marcador de superfície celular selecio- nável para isolamento de células modificadas pelas composições e métodos da presente invenção. Marcadores de superfície celular sele- cionáveis da presente invenção compreendem proteínas de superfície, glicoproteínas ou grupo de proteínas que distinguem uma célula ou subconjunto de células de outro subconjunto definido de células. Pre- ferivelmente, o marcador de superfície celular selecionável distingue aquelas células modificadas por uma composição ou método da pre- sente invenção daquelas células que não são modificadas por uma composição ou método da presente invenção. Esses marcadores de superfície celular incluem, por exemplo, porém, não estão limitados a, proteínas de "agrupamento de designação" ou "determinante de classi- ficação" (muitas vezes abreviado como "CD"), tal como, uma forma truncada ou de comprimento total de CD19, CD271, CD34, CD22, CD20, CD33, CD52 ou qualquer combinação dos mesmos. Marcado- res de superfície celular incluem ainda o marcador de gene suicida RQR8 (Philip B et al. Blood. 21 de agosto de 2014; 124 (8): 1277-87).
[00581] Os vetores de expressão incluirão, preferivelmente, mas opcionalmente, pelo menos um marcador selecionável de resistência a fármacos para isolamento de células modificadas pelas composições e métodos da presente invenção. Marcadores de resistência a fármacos selecionáveis da presente invenção podem compreender o tipo selva- gem ou mutante de Neo, TYMS, FRANCF, RAD51C, GCS, MDR1,
ALDH1, NKX2.2 ou qualquer combinação dos mesmos.
[00582] Pelo menos uma Centirina ou CARTirina da presente in- venção pode ser expressa em uma forma modificada, tal como, uma proteína de fusão, e pode incluir não apenas sinais de secreção, mas também regiões funcionais heterólogas adicionais. Por exemplo, uma região de aminoácidos adicionais, particularmente aminoácidos carre- gados, pode ser adicionada ao terminal N de uma CARTirina para me- lhorar a estabilidade e persistência na célula hospedeira, durante a purificação, ou durante o manuseio e armazenamento subsequentes. Além disso, porções de peptídeo podem ser adicionadas a uma CAR- Tirina da presente invenção para facilitar a purificação. Essas regiões podem ser removidas antes da preparação final de uma CARTirina ou pelo menos um fragmento da mesma. Tais métodos são descritos em muitos manuais de laboratório padrão, tal como, Sambrook, supra, Capítulos 17,29-17,42 e 18,1-18,74; Ausubel, supra, Capítulos 16, 17 e 18.
[00583] Aqueles versados na técnica são conhecedores dos nume- rosos sistemas de expressão disponíveis para expressão de um ácido nucleico que codifica uma proteína da presente invenção. Alternativa- mente, os ácidos nucleicos da presente invenção podem ser expres- sos em uma célula hospedeira ao se ligarem (por manipulação) em uma célula hospedeira que contém DNA endógeno codificando uma Centirina ou CARTirina da presente invenção. Tais métodos são bem conhecidos na técnica, por exemplo, como descrito em patente dos Estados Unidos Nos. 5.580.734, 5.641.670, 5.733.746, e 5.733.761, incorporadas totalmente aqui por referência.
[00584] Ilustrativo de culturas celulares úteis para a produção das CARTirinas, porções especificadas ou variantes das mesmas, são cé- lulas bacterianas, de levedura e de mamíferos como conhecido na técnica. Os sistemas de células de mamíferos frequentemente estarão na forma de monocamadas de células, embora suspensões de células de mamíferos ou biorreatores também possam ser usados. Algumas linhagens celulares hospedeiras adequadas capazes de expressar proteínas glicosiladas intactas foram desenvolvidas na técnica, e in- cluem as linhagens celulares COS-1 (por exemplo, ATCC CRL 1650), COS-7 (por exemplo, ATCC CRL-1651), HEK293, BHK21 (por exem- plo, ATCC CRL-10), CHO (por exemplo, ATCC CRL 1610) e BSC-1 (por exemplo, ATCC CRL-26), células Cos-7, células CHO, células hep G2, P3X63Ag8.653, SP2/0-Ag14, células 293, células HeLa e simila- res, que estão prontamente disponíveis em, por exemplo, American Type Culture Collection, Manassas, Va. (Www.atcc.org). As células hospedeiras preferidas incluem células de origem linfóide, tais como, células de mieloma e linfoma. As células hospedeiras particularmente preferidas são células P3X63Ag8.653 (Número de Acesso ATCC CRL- 1580) e células SP2/0-Ag14 (Número de Acesso ATCC CRL-1851). Em uma modalidade particularmente preferida, a célula recombinante é uma célula P3X63Ab8.653 ou SP2/0-Ag14.
[00585] Os vetores de expressão para essas células podem incluir uma ou mais dentre as seguintes sequências de controle de expres- são, tais como, porém, não limitadas a, uma origem de replicação; um promotor (por exemplo, promotores tardios ou iniciais SV40, o promo- tor CMV (Patentes dos Estados Unidos 5.168.062; 5.385.839), um promotor HSV tk, um promotor pgk (fosfoglicerato cinase), um promo- tor EF-1 alfa (Patente dos Estados Unidos No 5.266.491), pelo menos um promotor humano; um realçador e/ou sítios de informações de pro- cessamento, tais como, sítios de ligação de ribossomo, sítios de emenda do RNA, sítios de poliadenilação (por exemplo, um sítio de adição de T Ag poli A grande SV40), e sequências terminadoras trans- cricionais. Veja, por exemplo, Ausubel et al., supra; Sambrook, et al., supra. Outras células úteis para a produção de ácidos nucleicos ou proteínas da presente invenção são conhecidas e/ou disponíveis, por exemplo, do American Type Culture Collection Catalogue of Cell Lines and Hybridomas (www.atcc.org) ou outras fontes conhecidas ou co- merciais.
[00586] Quando células hospedeiras eucarióticas são empregadas, sequências terminadoras de poliadenização ou de transcrição são tipi- camente incorporadas ao vetor. Um exemplo de sequência terminado- ra é a sequência de poliadenização do gene do hormônio de cresci- mento bovino. Sequências para a emenda precisa da transcrição tam- bém podem ser incluídas. Um exemplo de uma sequência de emenda é o intron VP1 de SV40 (Sprague, et al., J. Virol. 45: 773-781 (1983)). Adicionalmente, sequências de gene para controlar a replicação na célula hospedeira podem ser incorporadas ao vetor, como conhecido na técnica. Purificação de uma CARTirina
[00587] A Centirina ou CARTirina pode ser recuperada e purificada de culturas celulares recombinantes por métodos bem conhecidos in- cluindo, porém, não limitados a, purificação de proteína A, precipitação de sulfato de amônio ou etanol, extração ácida, cromatografia de per- muta aniônica ou catiônica, cromatografia de fosfocelulose, cromato- grafia de interação hidrofóbica, cromatografia de afinidade, cromato- grafia em hidroxilapatita e cromatografia de lectina. A cromatografia líquida de alto performance ("HPLC") também pode ser empregada para purificação. Veja, por exemplo, Colligan, Current Protocols in Immunology, ou Current Protocols in Protein Science, John Wiley & Sons, NY, NY, (1997-2001), por exemplo, Capítulos 1, 4, 6, 8, 9, 10, cada incorporado totalmente aqui por referência.
[00588] Centirinas ou CARTirinas da presente invenção incluem produtos purificados, produtos de procedimentos sintéticos químicos e produtos produzidos por técnicas recombinantes a partir de um hospe-
deiro procariótico ou eucariótico, incluindo, por exemplo, E. coli, leve- dura, planta superior, células de inseto e mamíferos. Dependendo do hospedeiro empregado em um procedimento de produção recombi- nante, a CARTirina da presente invenção pode ser glicosilada ou pode ser não glicosilada. Esses métodos são descritos em muitos manuais de laboratório padrão, tal como, Sambrook, supra, Seções 17,37- 17,42; Ausubel, supra, Capítulos 10, 12, 13, 16, 18 e 20, Colligan, Pro- tein Science, supra, Capítulos 12-14, todos incorporados totalmente aqui por referência. Códigos de Aminoácido
[00589] Os aminoácidos que compõem as CARtirinas da presente invenção são frequentemente abreviados. As designações de aminoá- cido podem ser indicadas por designar o aminoácido por seu código de uma única letra, seu código de três letras, nome ou códon(s) de três nucleotídeos como é bem compreendido na técnica (veja, Alberts, B., et al., Biologia Molecular of The Cell, Terceira Ed., Garland Publis- hing, Inc., Nova Iorque, 1994). Uma CARTirina da presente invenção pode incluir uma ou mais substituições de aminoácido, deleções ou adições, de mutações espontâneas e/ou manipulação humana, con- forme especificado aqui. Aminoácidos em uma CARTirina da presente invenção que são essenciais para a função podem ser identificados por métodos conhecidos na técnica, tal como, mutagênese direcionada ao sítio ou mutagênese por varredura de alanina (por exemplo, Ausu- bel, supra, Capítulos 8, 15; Cunningham e Wells, Science 244: 1081- 1085 (1989)). O último procedimento introduz mutações de alanina únicas em cada resíduo na molécula. As moléculas mutantes resultan- tes são então testadas quanto à atividade biológica, tal como, porém, não limitadas a, pelo menos uma atividade neutralizante. Os sítios que são críticos para a ligação de CARTirina também podem ser identifica- dos por análise estrutural, tais como, cristalização, ressonância mag-
nética nuclear ou marcação de fotoafinidade (Smith, et al., J. Mol. Biol. 224: 899-904 (1992) e de Vos, et al., Science 255: 306-312 (1992)).
[00590] Como aqueles versados irão apreciar, a presente invenção inclui pelo menos uma CARTirina biologicamente ativa da presente invenção. CARTirinas biologicamente ativas têm uma atividade especí- fica de pelo menos 20%, 30%, ou 40%, e, preferivelmente, pelo menos 50%, 60%, ou 70%, e, mais preferivelmente, pelo menos 80%, 90%, ou 95 % a 99% ou mais da atividade específica da CARTirina nativa (não sintética), endógena ou relacionada e conhecida. Os métodos de ensaio e medidas de quantificação da atividade enzimática e especifi- cidade do substrato são bem conhecidos por aqueles versados na téc- nica.
[00591] Em outro aspecto, a presente invenção se refere à centiri- nas e fragmentos, como aqui descrito, que são modificados pela liga- ção covalente de uma porção orgânica. Tal modificação pode produzir um fragmento de CARTirina com propriedades farmacocinéticas me- lhoradas (por exemplo, meia-vida sérica aumentada in vivo). A porção orgânica pode ser um grupo polimérico hidrofílico linear ou ramificado, grupo de ácido graxo, ou grupo de éster de ácido graxo. Em modalida- des particulares, o grupo polimérico hidrofílico pode ter um peso mole- cular de cerca de 800 a cerca de 120.000 Daltons e pode ser um poli- alcano glicol (por exemplo, polietileno glicol (PEG), polipropileno glicol (PPG)), polímero de carboidrato, polímero de aminoácido ou polivinil pirolidona, e o grupo de ácido graxo ou éster de ácido graxo pode compreender de cerca de oito a cerca de quarenta átomos de carbono.
[00592] A CARTirina modificada e fragmentos da presente invenção podem compreender uma ou mais porções orgânicas que estão liga- das covalentemente, direta ou indiretamente, ao anticorpo. Cada por- ção orgânica que é ligada a uma CARTirina ou fragmento da mesma da presente invenção pode ser independentemente um grupo polimé-
rico hidrofílico, um grupo de ácido graxo ou um grupo de éster de áci- do graxo. Como usado aqui, o termo "ácido graxo" abrange os ácidos monocarboxílicos e dicarboxílicos. Um "grupo polimérico hidrofílico", como o termo é usado aqui, refere-se a um polímero orgânico que é mais solúvel em água do que em octano. Por exemplo, a polilisina é mais solúvel em água do que em octano. Assim, uma Centirina ou CARTirina modificada pela ligação covalente de polilisina é abrangida pela presente invenção. Polímeros hidrofílicos adequados para modifi- car Centirinas ou CARTirinas da presente invenção podem ser linear ou ramificados e incluem, por exemplo, polialcano glicóis (por exem- plo, PEG, monometóxi-polietileno glicol (mPEG), PPG e similares), carboidratos (por exemplo, dextrano, celulose, oligossacarídeos, polis- sacarídeos e similares), polímeros de aminoácidos hidrofílicos (por exemplo, polilisina, poliarginina, poliaspartato e similares), óxidos de polialcano (por exemplo, óxido de polietileno, óxido de polipropileno e similares) e polivinil pirolidona. Preferivelmente, o polímero hidrofílico que modifica a CARTirina da presente invenção tem um peso molecu- lar de cerca de 800 a cerca de 150.000 Daltons como uma entidade molecular separada. Por exemplo, PEG5000 e PEG20.000, em que o subscrito é o peso molecular médio do polímero em Daltons, podem ser usados. O grupo polimérico hidrofílico pode ser substituído com um a cerca de seis grupos alquila, de ácido graxo ou éster de ácido graxo. Os polímeros hidrofílicos que são substituídos por um grupo de éster de ácido graxo ou ácido graxo podem ser preparados empregando métodos adequados. Por exemplo, um polímero compreendendo um grupo amina pode ser acoplado a um carboxilato do ácido graxo ou éster de ácido graxo, e um carboxilato ativado (por exemplo, ativado com N,N-carbonil di-imidazol) em um ácido graxo ou éster de ácido graxo pode ser acoplado a um grupo hidroxila em um polímero.
[00593] Ácidos graxos e ésteres de ácidos graxos adequados para modificar as CARTirinas da presente invenção podem ser saturados ou podem conter uma ou mais unidades de insaturação. Os ácidos graxos que são adequados para modificar CARtirinas da presente in- venção incluem, por exemplo, n-dodecanoato (C12, laurato), n- tetradecanoato (C14, miristato), n-octadecanoato (C18, estearato), n- eicosanoato (C20, araquidato) , n-docosanoato (C22, beenato), n- triacontanoato (C30), n-tetracontanoato (C40), cis-Δ9-octadecanoato (C18, oleato), todos cis-Δ5,8,11,14-eicosatetraenoato (C20, araquido- nato), ácido octanodioico, ácido tetradecanedioico, ácido octadecane- dioico, ácido docosanodioico e similares. Ésteres de ácidos graxos adequados incluem monoésteres de ácidos dicarboxílicos que com- preendem um grupo alquila inferior linear ou ramificado. O grupo alqui- la inferior pode compreender de um a cerca de doze, preferivelmente, um a cerca de seis, átomos de carbono.
[00594] As CARTirinas modificadas e fragmentos podem ser prepa- rados usando métodos adequados, tal como, por reação com um ou mais agentes modificadores. Um "agente modificador", conforme o termo é usado aqui, refere-se a um grupo orgânico adequado (por exemplo, polímero hidrofílico, um ácido graxo, um éster de ácido gra- xo) que compreende um grupo de ativação. Um "grupo de ativação" é uma porção química ou grupo funcional que pode, sob condições apropriadas, reagir com um segundo grupo químico, formando assim uma ligação covalente entre o agente modificador e o segundo grupo químico. Por exemplo, os grupos de ativação reativos com amina in- cluem grupos eletrofílicos, tais como, tosilato, mesilato, halo (cloro, bromo, fluoro, iodo), N-hidroxissuccinimidil ésteres (NHS) e similares. Grupos de ativação que podem reagir com tióis incluem, por exemplo, maleimida, iodoacetila, acrilolila, dissulfetos de piridila, tiol de ácido 5- tiol-2-nitrobenzoico (TNB-tiol) e similares. Um grupo funcional de alde- ído pode ser acoplado a moléculas contendo amina ou hidrazida, e um grupo azida pode reagir com um grupo fosforoso trivalente para formar ligações fosforamidato ou fosforimida. Métodos adequados para intro- duzir grupos de ativação em moléculas são conhecidos na técnica (ve- ja, por exemplo, Hermanson, G. T., Bioconjugate Techniques, Acade- mic Press: San Diego, Calif. (1996)). Um grupo de ativação pode ser ligado diretamente ao grupo orgânico (por exemplo, polímero hidrofí- lico, ácido graxo, éster de ácido graxo), ou por meio de uma porção de ligação, por exemplo, um grupo divalente C1-C12 em que um ou mais átomos de carbono podem ser substituídos por um heteroátomo, tais como, oxigênio, nitrogênio ou enxofre. As porções ligantes adequadas incluem, por exemplo, tetraetileno glicol, —(CH2)3—, —NH—(CH2)6— NH—, —(CH2)2—NH— e —CH2—O—CH2—CH2—O—CH2—CH2— O—CH—NH—. Agentes modificadores que compreendem uma por- ção ligante podem ser produzidos, por exemplo, pela reação de uma mono-Boc-alquildiamina (por exemplo, mono-Boc-etilenodiamina, mo- no-Boc-diamino-hexano) com um ácido graxo na presença de 1-etil-3- (3-dimetilaminopropil)carbodiimida (EDC) para formar uma ligação amida entre a amina livre e o carboxilato de ácido graxo. O grupo de proteção Boc pode ser removido do produto por tratamento com ácido trifluoroacético (TFA) para expor uma amina primária que pode ser acoplada a outro carboxilato, conforme descrito, ou pode ser reagida com anidrido maleico e o produto resultante ciclizado para produzir um derivado de maleimido ativado do ácido graxo. (Veja, por exemplo, Thompson, et al., WO 92/16221, cujos ensinamentos inteiros são in- corporados aqui por referência).
[00595] As CARTirinas modificadas e fragmentos da presente in- venção podem ser produzidos pela reação de proteínas de CARTirina ou fragmentos com um agente modificador. Por exemplo, as porções orgânicas podem ser ligadas à proteína de CARTirina de uma maneira não específica ao sítio empregando um agente modificador reativo com amina, por exemplo, um éster de NHS de PEG. Proteínas de CARTirina modificadas e fragmentos compreendendo uma porção or- gânica que é ligada a sítios específicos de uma CARTirina da presente invenção podem ser preparados usando métodos adequados, tal co- mo, proteólise reversa (Fisch et al., Bioconjugate Chem., 3: 147-153 (1992); Werlen et al., Bioconjugate Chem., 5: 411-417 (1994); Kuma- ran et al., Protein Sci. 6 (10): 2233-2241 (1997); Itoh et al., Bioorg. Chem., 24 ( 1): 59-68 (1996); Capellas et al., Biotechnol. Bioeng., 56 (4): 456-463 (1997)), e os métodos descritos em Hermanson, GT, Bio- conjugate Techniques, Academic Press: San Diego, Califórnia (1996). Composições de CARTirina Compreendendo também Ingredien- tes Terapeuticamente Ativos
[00596] Compostos de Centirina ou CARTirina, composições ou combinações da presente invenção podem compreenderem ainda pelo menos um de qualquer auxiliar adequado, tal como, porém, não limita- do a, diluente, aglutinante, estabilizador, tampões, sais, solventes lipo- fílicos, conservante, adjuvante ou similares. Auxiliares farmaceutica- mente aceitáveis são preferidos. Exemplos não limitantes de, e méto- dos de preparação de tais soluções estéreis são bem conhecidos na técnica, tais como, porém limitados a, Gennaro, Ed., Remington's Pharmaceutical Sciences, 18ª Edição, Mack Publishing Co. (Easton, Pa.) 1990. Os veículos farmaceuticamente aceitáveis podem ser roti- neiramente selecionados que são adequados para o modo de adminis- tração, solubilidade e/ou estabilidade da Centirina ou CARTirina, frag- mento ou composição variante como bem conhecido na técnica ou como aqui descrito.
[00597] Excipientes e aditivos farmacêuticos úteis na presente composição incluem, porém, não estão limitados a, proteínas, peptí- deos, aminoácidos, llipídeos e carboidratos (por exemplo, açúcares, incluindo monossacarídeos, di-, tri-, tetra-, e oligossacarídeos; açúca-
res derivatizados, tais como, alditóis, ácidos aldônicos, açúcares este- rificados e similares; e polissacarídeos ou polímeros de açúcar), que podem estar presentes isoladamente ou em combinação, compreen- dendo isoladamente ou em combinação 1-99,99% em peso ou volume. Excipientes proteicos exemplares incluem albumina sérica, tais como, albumina de soro humana (HSA), albumina humana recombinante (rHA), gelatina, caseína e similares. Os componentes representativos de aminoácido / proteína, que também podem funcionar na capacida- de de tamponamento, incluem alanina, glicina, arginina, betaína, histi- dina, ácido glutâmico, ácido aspártico, cisteína, lisina, leucina, isoleu- cina, valina, metionina, fenilalanina, aspartame e similares. Um amino- ácido preferido é a glicina.
[00598] Excipientes de carboidratos adequados para uso na pre- sente invenção incluem, por exemplo, monossacarídeos, tais como, frutose, maltose, galatose, glicose, D-manose, sorbose e similares; dissacarídeos, tais como, lactose, sacarose, trealose, celobiose e simi- lares; polissacarídeos, tais como, rafinose, melezitose, maltodextrinas, dextranos, amidos e similares; e alditóis, tais como, manitol, xilitol, maltitol, lactitol, xilitol sorbitol (glucitol), mioinositol e similares. Excipi- entes de carboidratos preferidos para uso na presente invenção são manitol, trealose e rafinose.
[00599] As composições de CARTirina também podem incluir um tampão ou um agente de ajuste de pH; tipicamente, o tampão é um sal preparado a partir de uma base ou ácido orgânico. Tampões represen- tativos incluem sais de ácidos orgânicos, tais como, sais de ácido cítri- co, ácido ascórbico, ácido glucônico, ácido carbônico, ácido tartárico, ácido succínico, ácido acético ou ácido ftálico; Tris, cloridrato de tro- metamina ou tampões fosfato. Os tampões preferidos para uso nas presentes composições são sais de ácidos orgânicos, tal como, citrato.
[00600] Adicionalmente, as composições de CARTirina da presente invenção podem incluir excipientes / aditivos poliméricos, tais como, polivinilpirrolidonas, ficolls (um açúcar polimérico), dextratos (por exemplo, ciclodextrinas, tal como, 2-hidroxipropil-β-ciclodextrina), poli- etileno glicóis, agentes aromatizantes, agentes antimicrobianos, ado- çantes, antioxidantes, agentes antiestáticos, tensoativos (por exemplo, polissorbatos, tais como, "TWEEN 20" e "TWEEN 80"), lipídeos (por exemplo, fosfolipídeos, ácidos graxos), esteróides (por exemplo, coles- terol) e agentes quelantes (por exemplo, EDTA).
[00601] Estes e excipientes farmacêuticos adicionais conhecidos e/ou aditivos adequados para uso na Centirina ou CARTirina, porção ou composições variantes de acordo com a presente invenção são co- nhecidos na técnica, por exemplo, conforme listado em "Remington: The Science & Practice of Pharmaci ", 19 ed., Williams & Williams, (1995), e em" Physician's Desk Reference ", 52ª ed., Medical Econo- mics, Montvale, NJ (1998), cuja presente invenção está incorporada totalmente aqui por referência. Os materiais de veículos ou excipientes preferidos são os carboidratos (por exemplo, sacarídeos e alditóis) e tampões (por exemplo, citrato) ou agentes poliméricos. Uma molécula de veículo exemplar é o mucopolissacarídeo, ácido hialurônico, que pode ser útil para liberação intra-articular. Isolamento de Células T a partir de um Produto de Leucaferese
[00602] Um produto de leucaferese ou sangue pode ser coletado de um indivíduo em um sítio clínico usando um sistema fechado e méto- dos padrão (por exemplo, um sistema de aférese COBE Spectra). Pre- ferivelmente, o produto é coletado de acordo com os procedimentos padrão hospitalar ou institucional de leucaférese em bolsas padrão pa- ra coleta de leucaférese. Por exemplo, em modalidades preferidas dos métodos da presente invenção, nenhum anticoagulante ou aditivo sanguíneo adicional (heparina, etc.) está incluído além daqueles nor- malmente usados durante a leucaferese.
[00603] Alternativamente, glóbulos brancos (WBC) / células mono- nucleares do sangue periférico (PBMC) (usando Biosafe Sepax 2 (fe- chado / automatizado)) ou células T (usando CliniMACS® Prodigy (fe- chado / automatizado)) podem ser isolados diretamente do todo san- gue. No entanto, em certos indivíduos (por exemplo, aqueles diagnos- ticados e/ou tratados para câncer), o rendimento de WBC / PBMC po- de ser significativamente menor quando isolado do sangue total do que quando isolado por leucaferese.
[00604] Tanto o procedimento de leucaferese e/ou o procedimento de isolamento direto de células podem ser usados para qualquer indi- víduo da presente invenção.
[00605] O produto de leucaferese, sangue, composição de WBC / PBMC e/ou composição de células T devem ser embalados em recipi- entes isolados e devem ser mantidos em temperatura ambiente con- trolada (+ 19 °C a + 25 °C) de acordo com hospital padrão de proce- dimentos institucionais de coleta de sangue aprovados para uso com o protocolo clínico. O produto de leucaferese, sangue, composição de WBC / PBMC e/ou composição de células T não devem ser refrigera- dos.
[00606] O produto de leucaferese de concentração de células, san- gue, composição de WBC / PBMC e/ou composição de células T não devem exceder 0,2x109 células por mL durante o transporte. A mistura intensa do produto de leucaferese, sangue, composição de WBC / PBMC e/ou composição de células T deve ser evitada.
[00607] Se o produto de leucaferese, sangue, composição de WBC / PBMC e/ou composição de células T tiverem que ser armazenados, por exemplo, durante a noite, deve ser mantido em temperatura ambi- ente controlada (o mesmo que acima). Durante o armazenamento, a concentração do produto de leucaferese, sangue, composição de WBC / PBMC e/ou composição de células T nunca deve exceder
0,2x109 células por mL.
[00608] Preferivelmente, células do produto de leucaferese, sangue, composição de WBC / PBMC e/ou composição de células T devem ser armazenadas em plasma autólogo. Em certas modalidades, se a con- centração celular do produto de leucaferese, sangue, composição de WBC / PBMC e/ou composição de células T for superior a 0,2x109 cé- lulas por mL, o produto deve ser diluído com plasma autólogo.
[00609] Preferivelmente, o produto de leucaferese, sangue, compo- sição de WBC / PBMC e/ou composição de células T não devem ter mais de 24 horas ao iniciar o procedimento de marcação e separação. O produto de leucaferese, sangue, composição de WBC / PBMC e/ou composição de células T podem ser processados e/ou preparados pa- ra marcação de células usando um sistema fechado e/ou automatiza- do (por exemplo, CliniMACS Prodigy).
[00610] Um sistema automatizado pode realizar o isolamento de crosta inflamatória adicional, possivelmente por ficolação, e/ou lava- gem do produto celular (por exemplo, o produto de leucaferese, san- gue, composição de WBC / PBMC e/ou composição de células T).
[00611] Um sistema fechado e/ou automatizado pode ser usado pa- ra preparar e marcar células para isolamento de células T (de, por exemplo, o produto de leucaferese, sangue, composição de WBC / PBMC e/ou composição de células T).
[00612] Embora WBC / PBMCs possam ser núcleofetados direta- mente (o que é mais fácil e salva etapas adicionais), os métodos da presente invenção podem incluir primeiro o isolamento de células T antes da nucleofecção. A estratégia mais fácil de núcleofetar direta- mente PBMC requer expansão seletiva de células de CARTirina+ que é mediada por sinalização de CARTirina, que por si só está provando ser um método de expansão inferior que reduz diretamente a eficiência in vivo do produto, tornando as células T funcionalmente exauridas. O produto pode ser uma composição heterogênea de células de CARTi- rina+ incluindo células T, células NK, células NKT, monócitos ou qual- quer combinação dos mesmos, o que aumenta a variabilidade no pro- duto de paciente para paciente e torna a dosagem e o manejo da CRS mais difícil. Uma vez que se pensa que as células T são os principais efetores na supressão e morte de tumor, o isolamento de células T pa- ra a fabricação de um produto autólogo pode resultar em benefícios significativos sobre a outra composição mais heterogênea.
[00613] As células T podem ser isoladas diretamente, por enrique- cimento de células marcadas ou depleção de células marcadas em um procedimento de marcação de uma via ou, indiretamente, em um pro- cedimento de marcação de duas etapas. De acordo com certas estra- tégias de enriquecimento da presente invenção, as células T podem ser coletadas em uma bolsa de coleta de célula e as células não mar- cadas (células não alvo) em uma bolsa de fração negativa. Em con- traste com uma estratégia de enriquecimento da presente invenção, as células não marcadas (células alvo) são coletadas em uma bolsa de coleta de células e as células marcadas (células não alvo) são coleta- das em uma bolsa de fração negativa ou na bolsa de células não alvo, respectivamente. Os reagentes de seleção podem incluir, porém, não estão limitados a, contas revestidas com anticorpo. Contas revestidas com anticorpo podem ser removidas antes de uma modificação e/ou uma etapa de expansão, ou retidas nas células antes de uma modifi- cação e/ou uma etapa de expansão. Um ou mais dentre os seguintes exemplos não limitantes de marcadores celulares podem ser usados para isolar células T: CD3, CD4, CD8, CD25, antibiotina, CD1c, CD3 / CD19, CD3 / CD56, CD14, CD19, CD34, CD45RA , CD56, CD62L, CD133, CD137, CD271, CD304, IFN-gama, TCR alfa / beta, e/ou qualquer combinação dos mesmos. Métodos para o isolamento de cé- lulas T podem incluir um ou mais reagentes que se ligam especifica-
mente e/ou marcam de forma detectável um ou mais dentre os seguin- tes exemplos não limitantes de marcadores celulares que podem ser usados para isolar células T: CD3, CD4, CD8, CD25 anti-biotina, CD1c, CD3 / CD19, CD3 / CD56, CD14, CD19, CD34, CD45RA, CD56, CD62L, CD133, CD137, CD271, CD304, IFN-gama, TCR alfa / beta, e/ou qualquer combinação dos mesmos. Esses reagentes podem ou não ser do tipo "Boas Práticas de Fabricação" ("GMP"). Os reagen- tes podem incluir, porém, não estão limitados a, produtos Thermo DynaBeads and Miltenyi CliniMACS. Métodos de isolamento de células T da presente invenção podem incluir múltiplas iterações de marcação e/ou etapas de isolamento. Em qualquer ponto dos métodos de isola- mento das células T da presente invenção, células indesejadas e/ou tipos de células indesejadas podem ser esgotados de uma composi- ção do produto de célula T da presente invenção pela seleção positiva ou negativa das células indesejadas e/ou tipos de células indesejadas. Uma composição de produto de célula T da presente invenção pode conter tipos de células adicionais que podem expressar CD4, CD8, e/ou outro (s) marcador (es) de célula T.
[00614] Os métodos da presente invenção para nucleofecção de células T podem eliminar a etapa de isolamento de células T por, por exemplo, um processo para nucleofecção de células T em uma popu- lação ou composição de WBC / PBMCs que, após a nucleofecção, in- clui uma etapa de isolamento ou etapa de expansão seletiva por meio de sinalização de TCR.
[00615] Certas populações de células podem ser esgotadas por se- leção positiva ou negativa antes ou após o enriquecimento de células T e/ou classificação. Exemplos de composições celulares que podem ser esgotadas de uma composição de produto celular podem incluir células mieloides, células T reguladoras CD25+ (T Regs), células den- dríticas, macrófagos, glóbulos vermelhos, mastócitos, células T gama-
delta, células exterminadoras naturais (NK), uma célula do tipo exter- minadora natural (NK) (por exemplo, uma célula exterminadora induzi- da por citocina (CIK)), células T exterminadoras naturais induzidas (iNK), células T NK, células B, ou qualquer combinação das mesmas.
[00616] As composições de produtos de células T da presente in- venção podem incluir células T CD4 + e CD8 +. Células T CD4 + e CD8 + podem ser isoladas em bolsas de coleta separadas durante um procedimento de isolamento ou seleção. Células T CD4 + e células T CD8 + podem ser também tratadas separadamente, ou tratadas após reconstituição (combinação na mesma composição) em uma propor- ção particular.
[00617] A proporção particular na qual as células T CD4 + e células T CD8 + podem ser reconstituídas pode depender do tipo e eficácia da tecnologia de expansão usada, meio celular, e/ou condições de cres- cimento utilizados para a expansão de composições de produtos de células T. Exemplos de possíveis relações CD4 + : CD8 + incluem, porém, não estão limitadas a, 50% : 50%, 60% : 40%, 40% : 60%, 75% : 25% e 25% : 75%.
[00618] As células T CD8 + exibem uma capacidade potente para matar células tumorais, enquanto as células T CD4 + fornecem muitas das citocinas necessárias para suportar a capacidade e função prolife- rativa das células T CD8 +. Como as células T isoladas de doadores normais são predominantemente CD4 +, as composições de produtos de células T são artificialmente ajustadas in vitro com respeito àrela- ção CD4 + : CD8 + para melhorar a relação de células T CD4 + para células T CD8 + que estariam presentes de outro modo in vivo. Uma relação otimizada também pode ser usada para a expansão ex vivo da composição do produto de células T autólogas. Tendo em vista a rela- ção CD4 + : CD8 + ajustada artificialmente da composição do produto de células T, é importante notar que as composições do produto da presente invenção podem ser significativamente diferentes e fornecem uma vantagem significativamente maior do que qualquer população de ocorrêncoa endógena de células T.
[00619] Os métodos preferidos para o isolamento de células T po- dem incluir uma estratégia de seleção negativa para produzir células T pan intocadas, o que significa que a composição de células T resultan- te inclui células T que não foram manipuladas e que contêm uma vari- edade / relação de ocorrência endógena de células T.
[00620] Reagentes que podem ser usados para seleção positiva ou negativa incluem, porém, não estão limitados a, contas de separação de células magnéticas. As contas de separação de células magnéticas podem ou não ser removidas ou esgotadas de populações seleciona- das de células T CD4 +, células T CD8 + ou uma população mista de células T CD4 + e CD8 + antes de realizar a próxima etapa em um mé- todo de isolamento de células T da presente invenção.
[00621] As composições de células T e as composições de produ- tos de células T podem ser preparadas para criopreservação, armaze- namento em meio de cultura de células T padrão, e/ou modificação genética.
[00622] Composições de células T, composições de produtos de células T, composições de células T não estimuladas, composições de células T em repouso ou qualquer porção das mesmas pode ser crio- preservadas usando um método de criopreservação padrão otimizado para armazenamento e recuperação de células humanas com alta re- cuperação, viabilidade, fenótipo, e/ou capacidade funcional. Os meios de criopreservação comercialmente disponíveis e/ou protocolos podem ser usados. Os métodos de criopreservação da presente invenção po- dem incluir um criopreservante livre de DMSO (por exemplo, meio de criopreservação livre de DMSO CryoSOfree™) que reduz a toxicidade relacionada ao congelamento.
[00623] Composições de células T, composições de produtos de células T, composições de células T não estimuladas, composições de células T em repouso ou qualquer porção das mesmas podem ser ar- mazenadas em um meio de cultura. O meio de cultura de células T da presente invenção pode ser otimizado para armazenamento celular, modificação genética celular, fenótipo celular e/ou expansão celular. Os meios de cultura de células T da presente invenção podem incluir um ou mais antibióticos. Como a inclusão de um antibiótico em um meio de cultura de células pode diminuir a eficiência de transfecção e/ou produção celular após modificação genética por meio de nucleo- fecção, os antibióticos específicos (ou combinações dos mesmos) e sua(s) respectiva(s) concentração(ões) podem ser alterados para efi- ciência de transfecção ideal e/ou produção celular após modificação genética por meio de nucleofecção.
[00624] Os meios de cultura de células T da presente invenção po- dem incluir soro e, além disso, a composição e concentração de soro podem ser alteradas para resultados celulares ideais. O soro AB hu- mano é preferido em vez de FBS / FCS para cultura de células T por- que, embora contemplado para uso em meios de cultura de células T da presente invenção, FBS / FCS pode introduzir xeno-proteínas. O soro pode ser isolado do sangue do indivíduo para quem a composi- ção de células T em cultura se destina à administração, assim, um meio de cultura de célula T da presente invenção pode compreender soro autólogo. Meios isentos de soro ou substitutos de soro também podem ser usados em meios de cultura de células T da presente in- venção. Em certas modalidades dos meios de cultura de células T e métodos da presente invenção, meios isentos de soro ou substitutos de soro podem fornecer vantagens sobre a suplementação do meio com xenossoro, incluindo, porém, não limitados a, células mais saudá- veis que têm maior viabilidade, núcleofecto com maior eficiência, exi-
bem maior viabilidade pós-nucleofecção, exibem um fenótipo de célula mais desejável e/ou expansão maior / mais rápida mediante adição de tecnologias de expansão.
[00625] Os meios de cultura de células T podem incluir um meio de crescimento de células comercialmente disponível. Meios de cresci- mento de células exemplares comercialmente disponíveis incluem, po- rém, não estão limitados a, PBS, HBSS, OptiMEM, DMEM, RPMI 1640, AIM-V, X-VIVO 15, CellGro DC Medium, CTS OpTimizer T Cell Expansion SFM, TexMACS Medium, PRIME -XV Cell Expansion Me- dium, ImmunoCult-XF Cell Expansion Medium, ou qualquer combina- ção dos mesmos.
[00626] Composições de células T, composições de produtos de células T, composições de células T não estimuladas, composições de células T em repouso ou qualquer porção das mesmas podem ser preparadas para modificação genética. A preparação de composições de células T, composições de produtos de células T, composições de células T não estimuladas, composições de células T em repouso ou qualquer porção das mesmas para modificação genética podem incluir lavagem de células e/ou ressuspensão em um tampão de nucleofec- ção desejado. As composições de células T criopreservadas podem ser descongeladas e preparadas para modificação genética por nucle- ofecção. As células criopreservadas podem ser descongeladas de acordo com os protocolos padrão ou conhecidos. O descongelamento e preparação de células criopreservadas podem ser otimizados para produzir células que têm maior viabilidade, núcleofecto com maior efi- ciência, exibem maior viabilidade pós-nucleofecção, exibem um fenóti- po celular mais desejável, e/ou maior / mais rápida expansão após adição de tecnologias de expansão. Por exemplo, Grifols Albutein (25% de albumina humana) pode ser usado no processo de desconge- lamento e/ou preparação.
Modificação Genética de uma Composição de Produto de Célula T Autóloga
[00627] Composições de células T, composições de produtos de células T, composições de células T não estimuladas, composições de células T em repouso ou qualquer porção das mesmas podem ser ge- neticamente modificadas usando, por exemplo, uma estratégia de nu- cleofecção, tal como, eletroporação. O número total de células a se- rem núcleofetadas, o volume total da reação de nucleofecção e o tem- po preciso de preparação da amostra podem ser otimizados para pro- duzir células que tenham maior viabilidade, nucleofecção com maior eficácia, exibam maior viabilidade pós-nucleofecção, exibam um fenó- tipo de célula mais desejável e/ou expansão maior / mais rápida medi- ante adição de tecnologias de expansão.
[00628] Nucleofecção e/ou eletroporação podem ser realizadas usando, por exemplo, Lonza Amaxa, MaxCite PulseAgile, Harvard Ap- paratus BTX, e/ou Invitrogen Neon. Sistemas de eletrodos não metáli- cos, incluindo, porém, não limitados a, eletrodos de polímero de plásti- co, podem ser preferidos para nucleofecção.
[00629] Antes da modificação genética por nucleofecção, composi- ções de células T, composições de produtos de células T, composi- ções de células T não estimuladas, composições de células T em re- pouso ou qualquer porção das mesmas podem ser novamente sus- pensas em um tampão de nucleofecção. Os tampões de nucleofecção da presente invenção incluem tampões de nucleofecção disponíveis comercialmente. Os tampões de nucleofecção da presente invenção podem ser otimizados para produzir células que têm maior viabilidade, nucleofecção com maior eficiência, exibem maior viabilidade pós- nucleofecção, exibem um fenótipo celular mais desejável e/ou expan- são maior / mais rápida após adição de tecnologias de expansão. Tampões de nucleofecção da presente invenção podem incluir, porém,
não estão limitados a, PBS, HBSS, OptiMEM, BTXpress, Núcleofector Amaxa, tampão de nucleofecção de células T humanas e qualquer combinação dos mesmos.
Os tampões de nucleofecção da presente invenção podem compreender um ou mais fatores suplementares para produzir células que têm maior viabilidade, nucleofecção com maior eficiência, exibem maior viabilidade pós-nucleofecção, exibem um fe- nótipo celular mais desejável e/ou expansão maior / mais rápida após adição de tecnologias de expansão.
Fatores suplementares exempla- res incluem, porém, não estão limitados a, citocinas humanas recom- binantes, quimiocinas, interleucinas e qualquer combinação das mes- mas.
Citocinas, quimiocinas e interleucinas exemplares incluem, po- rém, não estão limitadas a, IL2, IL7, IL12, IL15, IL21, IL1, IL3, IL4, IL5, IL6, IL8, CXCL8, IL9, IL10, IL11, IL13, IL14, IL16, IL17, IL18, IL19, IL20, IL22, IL23, IL25, IL26, IL27, IL28, IL29, IL30, IL31, IL32, IL33, IL35, IL36, GM-CSF, IFN-gama, IL-1 alfa / IL- 1F1, IL-1 beta / IL-1F2, IL-12 p70, IL-12 / IL-35 p35, IL-13, IL-17 / IL-17A, IL-17A / F Heterodí- mero, IL-17F, IL- 18 / IL-1F4, IL-23, IL-24, IL-32, IL-32 beta, IL-32 ga- ma, IL-33, LAP (TGF-beta 1), Linfotoxina-alfa / TNF-beta, TGF- beta, TNF-alfa, TRANCE / TNFSF11 / RANK L e qualquer combinação dos mesmos.
Fatores suplementares exemplares incluem, porém, não es- tão limitados a, sais, minerais, metabólitos ou qualquer combinação dos mesmos.
Sais, minerais e metabólitos exemplares incluem, porém, não estão limitados a, HEPES, Nicotinamida, Heparina, piruvato de sódio, L-Glutamina, Solução de Aminoácido MEM não essencial, Ácido ascórbico, Nucleosídeos, FBS / FCS, Soro humano, substituto do soro, antibióticos, ajustadores de pH, sais de Earle, 2-mercaptoetanol, Transferrina humana, Insulina humana recombinante, Albumina de so- ro humana, suplemento Núcleofector PLUS, KCL, MgCl2, Na2HPO4, NAH2PO4, lactobionato de sódio, Manitol, succinato de sódio, cloreto de sódio, CINa, Glicose, Ca(NO3)2, Tris / HCl, K2HPO4, KH2PO4, Po-
lietilenimina, Polietileno glicol, Poloxâmero 188, Poloxâmero 181, Po- loxâmero 407, Polivinilpirrolidona, Pop313, Coroa-5, e qualquer com- binação dos mesmos. Fatores suplementares exemplares incluem, po- rém, não estão limitados a, meios, tais como, PBS, HBSS, OptiMEM, DMEM, RPMI 1640, AIM-V, X-VIVO 15, CellGro DC Medium, CTS Op- Timizer T Cell Expansion SFM, TexMACS Medium, Meio de expansão de células T PRIME-XV, meio de expansão de células T ImmunoCult- XF e qualquer combinação dos mesmos. Fatores suplementares exemplares incluem, porém, não estão limitados a, inibidores de de- tecção de DNA celular, metabolismo, diferenciação, transdução de si- nal, via apoptótica e combinações dos mesmos. Inibidores exemplares incluem, porém, não estão limitados a, inibidores de TLR9, MyD88, IRAK, TRAF6, TRAF3, IRF-7, NF-KB, Interferons Tipo 1, citocinas pró- inflamatórias, cGAS, STING, Sec5, TBK1, IRF-3 , RNA pol III, RIG-1, IPS-1, FADD, RIP1, TRAF3, AIM2, ASC, Caspase1, Pro-IL1B, PI3K, Akt, Wnt3A, inibidores de glicogênio sintase cinase-3β (GSK-3 β) (por exemplo, TWS119), Bafilomicina, Cloroquina, Quinacrina, AC-YVAD- CMK, Z-VAD-FMK, Z-IETD-FMK e qualquer combinação dos mesmos. Fatores suplementares exemplares incluem, porém, não estão limita- dos a, reagentes que modificam ou estabilizam um ou mais ácidos nu- cleicos de forma a realçar a liberação celular, aumentar a liberação ou transporte nuclear, realçar o transporte facilitado de ácido nucleico pa- ra o núcleo, realçar a degradação de ácido nucleico epi- cromossômi- co, e/ou diminuir a toxicidade mediada por DNA. Reagentes exempla- res que modificam ou estabilizam um ou mais ácidos nucleicos inclu- em, porém, não estão limitados a, modificadores de pH, proteínas de ligação a DNA, lipídeos, fosfolipídeos, CaPO4, peptídeos de ligação a DNA de carga neutra líquida com ou sem sequências NLS, enzima TREX1, e qualquer combinação dos mesmos.
[00630] Reagentes de transposição, incluindo um transposon e uma transposase, podem ser adicionados a uma reação de nucleofecção da presente invenção antes, simultaneamente com, ou após uma adi- ção de células a um tampão de nucleofecção (opcionalmente, contido em um frasco de reação de nucleofecção ou cuveta). Os transposons da presente invenção podem compreender DNA de plasmídeo, DNA de plasmídeo linearizado, um produto de PCR, DNA DOGGYBONE™, um modelo de mRNA, um DNA de fita simples ou dupla, uma combi- nação de proteína-ácido nucleico ou qualquer combinação dos mes- mos. Os transposons da presente invenção podem compreender uma ou mais sequências que codificam um ou mais sítio(s) de TTAA, um ou mais repetições terminais invertidas (ITRs), um ou mais repetições terminais longas (LTRs), um ou mais isolante(s), um ou mais promo- tor(es), um ou mais gene(s) de comprimento total ou truncado(s), um ou mais sinal (is) polyA, um ou mais sítios de clivagem do peptídeo 2A de auto-clivagem, um ou mais sítios de entrada do ribossomo interno (IRES), um ou mais realçador(es), um ou mais regulador(es), uma ou mais origem (s) de replicação e qualquer combinação dos mesmos.
[00631] Os transposons da presente invenção podem compreender uma ou mais sequências que codificam um ou mais genes de compri- mento total ou truncados. Gene (s) de comprimento total e/ou truncado (s) introduzido(s) pelos transposons da presente invenção pode(m) codificar um ou mais dentre um peptídeo sinal, uma CARTirina, uma CARTirina anti-PSMA, uma Centirina, uma Centirina específica de PSMA, uma articulação, um domínio de transmembrana, um domínio coestimulatório, um receptor de antígeno quimérico (CAR), um recep- tor quimérico de célula T (CAR-T, uma CARTirina ou uma CARTirina anti-PSMA), um receptor, um ligante, uma citocina, um gene de resis- tência a fármacos, um antígeno tumoral, um alo ou auto antígeno, uma enzima, uma proteína, um peptídeo, um polipeptídeo, uma proteína fluorescente, uma muteína ou qualquer combinação dos mesmos.
[00632] Os transposons da presente invenção podem ser prepara- dos em água, TAE, TBE, PBS, HBSS, meio, um fator suplementar da presente invenção ou qualquer combinação dos mesmos.
[00633] Transposons da presente invenção podem ser designados para otimizar a segurança clínica e/ou melhorar a capacidade de fabri- cação. Como um exemplo não limitante, os transposons da presente invenção podem ser designados para otimizar a segurança clínica e/ou melhorar a capacidade de fabricação, eliminando sequências ou regi- ões desnecessárias e/ou incluindo um marcador de seleção não anti- biótico. Os transposons da presente invenção podem ou não ser de grau GMP.
[00634] Enzimas transposase da presente invenção podem ser co- dificadas por uma ou mais sequências de DNA de plasmídeo, mRNA, proteína, combinação de proteína-ácido nucleico ou qualquer combi- nação dos mesmos.
[00635] Enzimas transposase da presente invenção podem ser pre- paradas em água, TAE, TBE, PBS, HBSS, meio, um fator suplementar da presente invenção ou qualquer combinação dos mesmos. As enzi- mas transposases da presente invenção ou a sequências/construtos codificando ou liberando-as podem não ser de grau GMP.
[00636] As enzimas transposons e transposase da presente inven- ção podem ser liberadas a uma célula por qualquer meio.
[00637] Embora as composições e métodos da presente invenção incluam a liberação de um transposon e/ou transposase da presente invenção a uma célula por DNA de plasmídeo (pDNA), o uso de um plasmídeo para liberação pode permitir que o transposon e/ou trans- posase seja integrado no DNA cromossômico da célula, que pode le- var à expressão contínua da transposase. Assim, as enzimas transpo- son e/ou transposase da presente invenção podem ser liberadas a uma célula como mRNA ou proteína para remover qualquer possibili-
dade de integração cromossômica.
[00638] Transposons e transposases da presente invenção podem ser pré-incubados sozinhos ou em combinação com um outro antes da introdução do transposon e/ou transposase em uma reação de nucleo- fecção. As quantidades absolutas de cada transposon e transposase, bem como, as quantidades relativas, por exemplo, uma relação de transposon para transposase podem ser otimizadas.
[00639] Após a preparação da reação de nucleofecção, opcional- mente, em um frasco ou cuveta, a reação pode ser carregada em um aparato núcleofetor e ativada para liberação de um pulso elétrico de acordo com o protocolo do fabricante. Condições de pulso elétrico usadas para liberação de um transposon e/ou uma transposase da presente invenção (ou uma sequência codificando um transposon e/ou uma transposase da presente invenção) para uma célula podem ser otimizadas para produzir células com viabilidade realçada, maior efici- ência de nucleofecção, maior viabilidade pós-nucleofecção, fenótipo celular desejável, e/ou expansão maior / mais rápida mediante adição de tecnologias de expansão. Ao usar a tecnologia de núcleofetor Ama- xa, cada um dos vários programas de nucleofecção para o núcleofetor Amaxa 2B ou 4D são contemplados.
[00640] Após uma reação de nucleofecção da presente invenção, as células podem ser suavemente adicionadas a um meio celular. Por exemplo, quando as células T sofrem a reação de nucleofecção, as células T podem ser adicionadas ao meio de uma célula T. Os meios de células pós nucleofecção dainvenção da presente invenção podem compreender qualquer um ou mais meios disponíveis comercialmente. Os meios celulares pós-nucleofecção da presente invenção (incluindo meios de célula T pós-nucleofecção da presente invenção) podem ser otimizados para produzir células com maior viabilidade, maior eficiên- cia de nucleofecção, exibem maior viabilidade pós-nucleofecção, exi-
bem um fenótipo celular mais desejável e/ou maior / mais rápida ex- pansão mediante adição de tecnologias de expansão.
Os meios celu- lares pós-nucleofecção da presente invenção (incluindo meios de célu- la T pós-nucleofecção da presente invenção) podem compreender PBS, HBSS, OptiMEM, DMEM, RPMI 1640, AIM-V, X-VIVO 15, Cell- Gro DC Medium, CTS OpTimizer T Cell Expansion SFM, TexMACS Medium, meio de expansão de células T PRIME-XV, meio de expan- são de células T ImmunoCult-XF e qualquer combinação dos mesmos.
Os meios celulares pós-nucleofecção da presente invenção (incluindo os meios de célula T pós-nucleofecção da presente invenção) podem compreender um ou mais fatores suplementares da presente invenção para realçar a viabilidade, eficiência da nucleofecção, viabilidade pós- nucleofecção, fenótipo celular e/ou expansão maior / mais rápida após adição de tecnologias de expansão.
Fatores suplementares exempla- res incluem, porém, não estão limitados a, citocinas humanas recom- binantes, quimiocinas, interleucinas e qualquer combinação dos mes- mos.
Citocinas, quimiocinas e interleucinas exemplares incluem, po- rém, não estão limitados a, IL2, IL7, IL12, IL15, IL21, IL1, IL3, IL4, IL5, IL6, IL8, CXCL8, IL9, IL10, IL11, IL13, IL14, IL16, IL17, IL18, IL19, IL20, IL22, IL23, IL25, IL26, IL27, IL28, IL29, IL30, IL31, IL32, IL33, IL35, IL36, GM-CSF, IFN-gama, IL-1 alfa / IL- 1F1, IL-1 beta / IL-1F2, IL-12 p70, IL-12 / IL-35 p35, IL-13, IL-17 / IL-17A, IL-17A / F Heterodí- mero, IL-17F, IL- 18 / IL-1F4, IL-23, IL-24, IL-32, IL-32 beta, IL-32 ga- ma, IL-33, LAP (TGF-beta 1), Linfotoxina-alfa / TNF-beta, TGF- beta, TNF-alfa, TRANCE / TNFSF11 / RANK L e qualquer combinação dos mesmos.
Fatores suplementares exemplares incluem, porém, não es- tão limitados a, sais, minerais, metabólitos ou qualquer combinação dos mesmos.
Sais, minerais e metabólitos exemplares incluem, porém, não estão limitados a, HEPES, Nicotinamida, Heparina, piruvato de sódio, L-Glutamina, Solução de Aminoácido MEM não essencial, Ácido ascórbico, Nucleosídeos, FBS / FCS, Soro humano, substituto do soro, antibióticos, ajustadores de pH, sais de Earle, 2-mercaptoetanol, Transferrina humana, Insulina humana recombinante, Albumina de so- ro humana, suplemento Núcleofector PLUS, KCL, MgCl2, Na2HPO4, NAH2PO4, lactobionato de sódio, Manitol, succinato de sódio, cloreto de sódio, CINa, Glicose, Ca(NO3)2, Tris / HCl, K2HPO4, KH2PO4, Po- lietilenimina, Polietileno glicol, Poloxâmero 188, Poloxâmero 181, Po- loxâmero 407, Polivinilpirrolidona, Pop313, Coroa-5, e qualquer com- binação dos mesmos.
Fatores suplementares exemplares incluem, po- rém, não estão limitados a, meios, tais como, PBS, HBSS, OptiMEM, DMEM, RPMI 1640, AIM-V, X-VIVO 15, CellGro DC Medium, CTS Op- Timizer T Cell Expansion SFM, TexMACS Medium, Meio de expansão de células T PRIME-XV, meio de expansão de células T ImmunoCult- XF e qualquer combinação dos mesmos.
Fatores suplementares exemplares incluem, porém, não estão limitados a, inibidores de de- tecção de DNA celular, metabolismo, diferenciação, transdução de si- nal, via apoptótica e combinações dos mesmos.
Inibidores exemplares incluem, porém, não estão limitados a, inibidores de TLR9, MyD88, IRAK, TRAF6, TRAF3, IRF-7, NF-KB, Interferons Tipo 1, citocinas pró- inflamatórias, cGAS, STING, Sec5, TBK1, IRF-3 , RNA pol III, RIG-1, IPS-1, FADD, RIP1, TRAF3, AIM2, ASC, Caspase1, Pro-IL1B, PI3K, Akt, Wnt3A, inibidores de glicogênio sintase cinase-3β (GSK-3β) (por exemplo, TWS119), Bafilomicina, Cloroquina, Quinacrina, AC-YVAD- CMK, Z-VAD-FMK, Z-IETD-FMK e qualquer combinação dos mesmos.
Fatores suplementares exemplares incluem, porém, não estão limita- dos a, reagentes que modificam ou estabilizam um ou mais ácidos nu- cleicos de forma a realçar a liberação celular, realçar a liberação ou transporte nuclear, realçar o transporte facilitado de ácido nucleico pa- ra o núcleo, realçar a degradação de ácido nucleico epi-cromossômico e/ou diminuir a toxicidade mediada por DNA.
Reagentes exemplares que modificam ou estabilizam um ou mais ácidos nucleicos incluem, porém, não estão limitados a, modificadores de pH, proteínas de liga- ção a DNA, lipídeos, fosfolipídeos, CaPO4, peptídeos de ligação a DNA de carga neutra líquida com ou sem sequências de NLS, enzima TREX1 e qualquer combinação dos mesmos.
[00641] Os meios celulares pós-nucleofecção da presente invenção (incluindo meios de célula T pós-nucleofecção da presente invenção) podem ser usados em temperatura ambiente ou pré-aquecidos para, por exemplo, entre 32 °C a 37 °C, inclusive dos pontos de extremida- de. Os meios celulares pós-nucleofecção da presente invenção (inclu- indo meios de célula T pós-nucleofecção da presente invenção) po- dem ser pré-aquecidos a qualquer temperatura que mantenha ou real- ce viabilidade celular e/ou expressão de um transposon ou porção dos mesmos da presente invenção.
[00642] Os meios de células pós-nucleofecção da presente inven- ção (incluindo meios de células T pós-nucleofecção da presente in- venção) podem ser contidos em frascos ou pratos de cultura de teci- dos, frascos G-Rex, Biorreator ou bolsas de cultura de células, ou qualquer outro receptáculo padrão. As culturas celulares pós- nucleofecção da presente invenção (incluindo culturas de célula T pós- nucleofecção da presente invenção) podem ser mantidas ainda ou, alternativamente, podem ser perturbadas (por exemplo, balançadas, rodadas ou agitadas).
[00643] As culturas celulares pós-nucleofecção podem compreen- der células geneticamente modificadas. Culturas de células T pós- nucleofecção podem compreender células T geneticamente modifica- das. As células geneticamente modificadas da presente invenção po- dem ser repousadas por um período de tempo definido ou estimuladas para expansão por, por exemplo, a adição de uma tecnologia expanso- ra de célula T. Em certas modalidades, as células geneticamente mo-
dificadas da presente invenção podem ser repousadas por um período de tempo definido ou imediatamente estimuladas para expansão por, por exemplo, a adição de uma tecnologia expansora de célula T. Célu- las geneticamente modificadas da presente invenção podem ser des- cansadas para permitir tempo suficiente para aclimatação, tempo para ocorrer a transposição e/ou tempo para seleção positiva ou negativa, resultando em células com viabilidade realçada, maior eficiência de nucleofecção, maior viabilidade pós-nucleofecção, fenótipo celular de- sejável e/ou expansão maior / mais rápida mediante adição de tecno- logias de expansão. As células geneticamente modificadas da presen- te invenção podem ser descansadas, por exemplo, por 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou mais horas. Em certas modalidades, células geneticamente modificadas da presente invenção podem ser descansadas, por exemplo, durante uma noite. Em certos aspectos, um pernoite é cerca de 12 horas. As células geneticamente modificadas da presente invenção podem ser descan- sadas, por exemplo, durante 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 ou mais dias.
[00644] Células geneticamente modificadas da presente invenção podem ser selecionadas após uma reação de nucleofecção e antes da adição de uma tecnologia expansora. Para uma seleção ideal de célu- las geneticamente modificadas, as células podem ser deixadas em re- pouso em um meio de células pós-nucleofecção durante pelo menos 2 a 14 dias para facilitar a identificação das células modificadas (por exemplo, diferenciação de células modificadas de não modificadas).
[00645] 24 horas após a nucleofecção, a expressão de uma Centiri- na ou CARTirina e marcador de seleção da presente invenção pode ser detectável em células T modificadas após a nucleofecção bem- sucedida de um transposon da presente invenção. Devido à expressão epi-cromossômica do transposon, a expressão de um marcador de se-
leção por si só pode não diferenciar células T modificadas (aquelas células nas quais o transposon foi integrado com sucesso) de células T não modificadas (aquelas células nas quais o transposon não foi in- tegrado com sucesso). Quando a expressão epi-cromossômica de transposon obscurece a detecção de células modificadas pelo marca- dor de seleção, as células núcleofectadas (ambas células modificadas e não modificadas) podem ser repousadas por um período de tempo (por exemplo, 2-14 dias) para permitir que as células cessem a ex- pressão ou percam toda a expressão do transposon epicromossômico. Após este longo período de descanso, apenas as células T modifica- das devem permanecer positivas para a expressão de marcador de seleção. A duração deste período de repouso estendido pode ser oti- mizado para cada reação de nucleofecção e processo de seleção. Quando a expressão epi-cromossômica de transposon obscurece a detecção de células modificadas pelo marcador de seleção, a seleção pode ser realizada sem esse período de repouso prolongado, no en- tanto, uma etapa de seleção adicional pode ser incluída em um mo- mento posterior (por exemplo, durante ou após o estágio de expan- são).
[00646] A seleção de células geneticamente modificadas da presen- te invenção pode ser realizada por qualquer meio. Em certas modali- dades dos métodos da presente invenção, a seleção de células modi- ficadas geneticamente da presente invenção pode ser realizada pelo isolamento de células que expressam um marcador de seleção especí- fico. Marcadores de seleção da presente invenção podem ser codifica- dos por uma ou mais sequências no transposon. Marcadores de sele- ção da presente invenção podem ser expressos pela célula modificada como resultado de transposição bem-sucedida (isto é, não codificada por uma ou mais sequências no transposon). Em certas modalidades, células geneticamente modificadas da presente invenção contêm um marcador de seleção que confere resistência a um composto deletério do meio celular pós-nucleofecção. O composto deletério pode com- preender, por exemplo, um antibiótico ou fármaco que, na ausência da resistência conferida pelo marcador de seleção às células modificadas, resultaria em morte celular. Marcadores de seleção exemplares inclu- em, porém, não estão limitados a, formas de tipo selvagem (WT) ou mutantes de um ou mais dentre os seguintes genes: neo, DHFR, TYMS, ALDH, MDR1, MGMT, FANCF, RAD51C, GCS, e NKX2,2. Os marcadores de seleção exemplares incluem, porém, não estão limita- dos a, um marcador de seleção expresso na superfície ou marcador expresso na superfície pode ser alvejado por tecnologia de conta magnética revestida com Ab ou seleção de coluna, respectivamente. Um marcador clivável, tais como, aqueles usados na purificação de proteínas podem ser adicionados a um marcador de seleção da pre- sente invenção para seleção, lavagem e eluição de coluna eficiente. Em certas modalidades, os marcadores de seleção da presente inven- ção não são expressos pelas células modificadas (incluindo células T modificadas) endogenamente e, portanto, podem ser úteis no isola- mento físico de células modificadas (por, por exemplo, técnicas de classificação de células). Marcadores de seleção exemplares da pre- sente invenção que não são expressos pelas células modificadas (in- cluindo células T modificadas) endogenamente incluem, porém, não estão limitados a, formas de comprimento total, mutadas ou truncadas de CD271, CD19 CD52, CD34, RQR8, CD22, CD20, CD33 e qualquer combinação dos mesmos.
[00647] Células geneticamente modificadas da presente invenção podem ser seletivas expandidas após uma reação de nucleofecção. Em certas modalidades, células T modificadas compreendendo uma CARTirina podem ser expandidas seletivamente por estimulação de CARTirina. As células T modificadas compreendendo uma CARTirina podem ser estimuladas por contato com um reagente coberto por um alvo (por exemplo, uma linha de tumor ou uma linhagem celular normal expressando um alvo ou contas expansoras cobertas em um alvo). Alternativamente, células T modificadas compreendendo uma CARTi- rina podem ser estimuladas por contato com uma célula tumoral irradi- ada, uma célula normal alogênica irradiada, uma PBMC autóloga irra- diada. Para minimizar a contaminação de composições de produto ce- lular da presente invenção com uma célula de expressão de alvo usa- da para estimulação, por exemplo, quando a composição de produto de célula pode ser administrada diretamente a um indivíduo, a estimu- lação pode ser realizada usando contas expansoras revestidas com proteína alvo de CARTirina. A expansão seletiva de células T modifi- cadas compreendendo uma CARTirina pela estimulação de CARTirina pode ser otimizada para evitar o esgotamento funcional das células T modificadas.
[00648] Células geneticamente modificadas selecionadas da pre- sente invenção podem ser criopreservadas, repousadas por um perío- do de tempo definido, ou estimuladas para expansão pela adição de uma tecnologia expansora celular. Células geneticamente modificadas selecionadas da presente invenção podem ser criopreservadas, re- pousadas por um período de tempo definido, ou imediatamente esti- muladas para expansão pela adição de uma tecnologia expansora ce- lular. Quando as células geneticamente modificadas selecionadas são células T, as células T podem ser estimuladas para expansão pela adição de uma tecnologia de expansão de células T. As células gene- ticamente modificadas selecionadas da presente invenção podem ser descansadas, por exemplo, por 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou mais horas. Em certas modalidades, células geneticamente modificadas selecionadas da pre- sente invenção podem ser descansadas, por exemplo, durante uma noite. Em certos aspectos, uma pernoite é cerca de 12 horas. As célu- las geneticamente modificadas selecionadas da presente invenção podem ser descansadas, por exemplo, por 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 ou mais dias. As células geneticamente modificadas se- lecionadas da presente invenção podem ser descansadas por qual- quer período de tempo resultando em células com viabilidade realça- da, maior eficiência de nucleofecção, maior viabilidade pós- nucleofecção, fenótipo celular desejável e/ou expansão maior / mais rápida mediante adição de tecnologias de expansão.
[00649] Células geneticamente modificadas selecionadas (incluindo células T geneticamente modificadas da presente invenção) podem ser criopreservadas usando qualquer método de criopreservação pa- drão, que pode ser otimizado para armazenar e/ou recuperar células humanas com alta recuperação, viabilidade, fenótipo e/ou capacidade funcional. Os métodos de criopreservação da presente invenção po- dem incluir meios de criopreservação e/ou protocolos comercialmente disponíveis.
[00650] A eficiência de transposição de células geneticamente mo- dificadas selecionadas (incluindo células T geneticamente modificadas selecionadas da presente invenção) pode ser avaliada por qualquer meio. Por exemplo, antes da aplicação de uma tecnologia expansora, a expressão do transposon por células geneticamente modificadas se- lecionadas (incluindo células T geneticamente modificadas seleciona- das da presente invenção) pode ser medida por classificação de célu- las ativadas por fluorescência (FACS). A determinação da eficiência de transposição de células geneticamente modificadas selecionadas (in- cluindo células T geneticamente modificadas selecionadas da presente invenção) pode incluir a determinação de uma porcentagem de células selecionadas que expressam o transposon (por exemplo, uma CARTi- rina). Alternativamente, ou em adição, uma pureza de células T, uma
Intensidade Média de Fluorescência (MFI) da expressão do transpo- son (por exemplo, expressão de CARTirina), uma capacidade de uma aCARTirina (liberada no transposon) para mediar a desgranulação e/ou morte de uma célula alvo que expressa o ligante de CARTirina e/ou um fenótipo de células modificadas geneticamente selecionadas (incluindo células T geneticamente modificadas selecionadas da pre- sente invenção) podem ser avaliadas por qualquer meio.
[00651] Composições de produtos celulares da presente invenção podem ser liberadas para administração a um indivíduo ao atender a certos critérios de liberação. Critérios de liberação exemplares podem incluir, porém, não estão limitados a, uma porcentagem particular de células T modificadas, selecionadas e/ou expandidas que expressam níveis detectáveis de uma CARTirina na superfície celular. Modificação Genética de uma Composição de Produto de Célula T Autóloga
[00652] Células geneticamente modificadas (incluindo células T ge- neticamente modificadas) da presente invenção podem ser expandi- das usando uma tecnologia expansora. As tecnologias expansoras exemplares da presente invenção podem compreender uma tecnologia expansora comercialmente disponível. As tecnologias expansoras exemplares da presente invenção incluem a estimulação de uma célu- la T geneticamente modificada da presente invenção por meio de TCR. Embora todos os meios para a estimulação de uma célula T ge- neticamente modificada da presente invenção sejam contemplados, a estimulação de uma célula T geneticamente modificada da presente invenção por meio de TCR é um método preferido, produzindo um produto com um nível superior de capacidade exterminadora.
[00653] Para estimular uma célula T geneticamente modificada da presente invenção por meio de TCR, Thermo Expander DynaBeads pode ser usado em uma relação de 3 : 1 de conta para células T. Se as contas expansoras não forem biodegradáveis, as contas podem ser removidas da composição expansora. Por exemplo, as contas podem ser removidas da composição expansora após cerca de 5 dias. Para estimular uma célula T geneticamente modificada da presente inven- ção por meio de TCR, pode ser usado um Reagente de Ativação / Ex- pansão de Células T Miltenyi. Para estimular uma célula T genetica- mente modificada da presente invenção por meio de TCR, pode ser usado o Reagente Ativador de Células T CD3 / CD28 ou CD3 / CD28 / CD2 da Humanas StemCell Technologies' ImmunoCult. Esta tecnolo- gia pode ser preferida, uma vez que os complexos de anticorpos te- traméricos solúveis se degradariam após um período e não exigiriam a remoção do processo.
[00654] As células apresentadoras de antígenos artificiais (APCs) podem ser modificadas para coexpressar o antígeno alvo e podem ser usadas para estimular uma célula ou célula T da presente invenção por meio de um TCR e/ou CARTirina da presente invenção. APCs arti- ficiais podem compreender ou podem ser derivadas de uma linhagem celular tumoral (incluindo, por exemplo, a linhagem de leucemia mie- lóide imortalizada K562) e podem ser modificadas para coexpressar múltiplas moléculas ou tecnologias co-estimulatórias (tais como, CD28, 4-1BBL, CD64, mbIL-21, mbIL-15, molécula alvo CAR, etc.). Quando APCs artificiais da presente invenção são combinadas com moléculas coestimulatórias, as condições podem ser otimizadas para prevenir o desenvolvimento ou surgimento de um fenótipo e capacidade funcional indesejáveis, nomeadamente células T efetoras terminalmente dife- renciadas.
[00655] PBMCs irradiadas (auto ou allo) podem expressar alguns antígenos alvo, tal como, CD19, e podem ser usadas para estimular uma célula ou célula T da presente invenção através de um TCR e/ou CARTirina da presente invenção. Alternativamente, ou em adição, cé-
lulas tumorais irradiadas podem expressar alguns antígenos alvo e podem ser usadas para estimular uma célula ou célula T da presente invenção por meio de um TCR e/ou CARTirina da presente invenção.
[00656] Podem ser usados para estimular uma célula ou célula T da presente invenção por meio de um TCR e/ou CARTirina da presente invenção anti-CD3, anti-CD2 e/ou anti-CD28 solúvel e/ou ligado a pla- ca.
[00657] Contas revestidas com antígeno podem exibir proteína alvo e podem ser usadas para estimular uma célula ou célula T da presente invenção por meio de um TCR e/ou CARTirina da presente invenção. Alternativamente, ou em adição, contas expansoras revestidas com uma proteína alvo de CARTirina podem ser usadas para estimular uma célula ou célula T da presente invenção por meio de um TCR e/ou CARTirina da presente invenção.
[00658] Métodos de expansão desenhados para estimulação de uma célula ou célula T da presente invenção por meio de TCR ou CARTirina e por meio de CD2, CD3, CD28, 4-1BB expressos na su- perfície e/ou outros marcadores em células T geneticamente modifica- das.
[00659] Uma tecnologia de expansão pode ser aplicada a uma célu- la da presente invenção imediatamente após a nucleofecção até apro- ximadamente 24 horas após a nucleofecção. Embora vários meios ce- lulares possam ser usados durante um procedimento de expansão, um meio de expansão de células T desejável da presente invenção pode produzir células com, por exemplo, maior viabilidade, fenótipo celular, expansão total ou maior capacidade de persistência in vivo, enxerto, e/ou exterminação mediada por CAR. O meio celular da presente in- venção pode ser otimizado para melhorar / realçar a expansão, o fenó- tipo e a função de células geneticamente modificadas da presente in- venção. Um fenótipo preferido de células T expandidas pode incluir uma mistura de células T de memória de células-tronco, células T cen- trais e células T efetoras de memória. Expander Dynabeads pode pro- duzir principalmente células T de memória central que podem levar a um desempenho superior na clínica.
[00660] Os meios de expansão de células T exemplares da presen- te invenção podem incluir, em parte ou no total, PBS, HBSS, Opti- MEM, DMEM, RPMI 1640, AIM-V, X-VIVO 15, CellGro DC Medium, CTS OpTimizer T Cell Expansion Medium SFM, Meio TexMACS, meio de expansão de células T PRIME-XV, meio de expansão de células T ImmunoCult-XF, ou qualquer combinação dos mesmos. Os meios de expansão de células T da presente invenção podem ainda incluir um ou mais fatores suplementares. Fatores suplementares que podem ser incluídos no meio de expansão de célula T da presente invenção real- çam a viabilidade, o fenótipo celular, a expansão total, ou aumentam a capacidade de persistência in vivo, enxerto, e/ou exterminação media- da por CARTirina. Fatores suplementares que podem ser incluídos em um meio de expansão de célula T da presente invenção incluem, po- rém, não estão limitados a, citocinas humanas recombinantes, quimio- cinas e/ou interleucinas, tais como, IL2, IL7, IL12, IL15, IL21, IL1, IL3, IL4, IL5, IL6, IL8, CXCL8, IL9, IL10, IL11, IL13, IL14, IL16, IL17, IL18, IL19, IL20, IL22, IL23, IL25, IL26, IL27, IL28, IL29, IL30, IL31, IL32, IL33, IL35, IL36, GM-CSF, IFN-gama, IL-1 alfa / IL-1F1, IL-1 beta / IL- 1F2, IL-12 p70, IL-12 / IL-35 p35, IL-13, IL- 17 / IL-17A, IL-17A / F He- terodímero, IL-17F, IL-18 / IL-1F4, IL-23, IL-24, IL-32, IL-32 beta, IL-32 gama, IL-33 , LAP (TGF-beta 1), Linfotoxina-alfa / TNF-beta, TGF- beta, TNF-alfa, TRANCE / TNFSF11 / RANK L, ou qualquer combina- ção dos mesmos. Fatores suplementares que podem ser incluídos em um meio de expansão de célula T da presente invenção incluem, po- rém, não estão limitados a, sais, minerais, e/ou metabólitos, tais como, HEPES, Nicotinamida, heparina, piruvato de sódio, L-Glutamina, Solu-
ção de Aminoácido não essencial MEM, ácido ascórbico, nucleosí- deos, FBS / FCS, soro humano, substituto do soro, antibióticos, ajus- tadores de pH, sais de Earle, 2-mercaptoetanol, Transferrina humana, Insulina humana recombinante, Albumina de soro humana, suplemen- to Núcleofector PLUS, KCL, MgCl2, Na2HPO4, NAH2PO4, lactobiona- to de sódio, Manitol, succinato de sódio, cloreto de sódio, CINa, Glico- se, Ca(NO3)2, Tris / HCl, K2HPO4, KH2PO4, Polietilenimina, Polietile- no glicol, Poloxâmero 188, Poloxâmero 181, Poloxâmero 407, Polivi- nilpirrolidona, Pop313, Coroa-5 ou qualquer combinação dos mesmos. Fatores suplementares que podem ser incluídos em um meio de ex- pansão de célula T da presente invenção incluem, porém, não estão limitados a, inibidores da detecção de DNA celular, metabolismo, dife- renciação, transdução de sinal, e/ou a via apoptótica, tai como, inibido- res de TLR9, MyD88, IRAK, TRAF6, TRAF3, IRF-7, NF-KB, Interferons Tipo 1, citocinas pró-inflamatórias, cGAS, STING, Sec5, TBK1, IRF-3, RNA pol III, RIG-1, IPS-1, FADD, RIP1, TRAF3, AIM2, ASC, Cas- pase1, Pro-IL1B, PI3K, Akt, Wnt3A, inibidores da glicogênio sintase cinase-3β (GSK-3 β) (por exemplo, TWS119), Bafilomicina, Cloroqui- na, Quinacrina, AC-YVAD-CMK, Z-VAD-FMK, Z-IETD-FMK, ou qual- quer combinação dos mesmos.
[00661] Fatores suplementares que podem ser incluídos em um meio de expansão de célula T da presente invenção incluem, porém, não estão limitados a, reagentes que modificam ou estabilizam ácidos nucleicos de forma a realçar a liberação celular, realçar a liberação ou transporte nuclear, realçar o transporte facilitado de ácido nucleico no núcleo, realçar a degradação de ácidos nucleicos epicromossômicos, e/ou diminuir a toxicidade mediada por DNA, tais como, modificadores de pH, proteínas de ligação a DNA, lipídeos, fosfolipídeos, CaPO4, peptídeos de ligação a DNA de carga neutra líquida com ou sem se- quências de NLS, enzima TREX1, ou qualquer combinação dos mes-
mos.
[00662] Células geneticamente modificadas da presente invenção podem ser selecionadas durante o processo de expansão pelo uso de fármacos ou compostos selecionáveis. Por exemplo, em certas moda- lidades, quando um transposon da presente invenção pode codificar um marcador de seleção que confere resistência a células genetica- mente modificadas a um fármaco adicionado ao meio de cultura, a se- leção pode ocorrer durante o processo de expansão e pode exigir aproximadamente 1 a 14 dias de cultura para a seleção ocorrer. Exemplos de genes de resistência a fármacos que podem ser usados como marcadores de seleção codificados por um transposon da pre- sente invenção incluem, porém, não estão limitados a, formas de tipo selvagens (WT) ou mutantes dos genes neo, DHFR, TYMS, ALDH, MDR1, MGMT, FANCF, RAD51C, GCS, NKX2.2, ou qualquer combi- nação dos mesmos. Exemplos de fármacos ou compostos correspon- dentes que podem ser adicionados ao meio de cultura ao qual um marcador de seleção pode conferir resistência incluem, porém, não estão limitados a, G418, Puromicina, Ampicilina, Canamicina, Metotre- xato, Mefalano, Temozolomida, Vincristina, Etoposídeo, Doxorrubicina, Bendamustina, Fludarabina, Aredia (Pamidronato dissódico), Beceno (Carmustina), BiCNU (Carmustina), Bortezomibe, Carfilzomibe, Car- mubris (Carmustina), Carmustina, Clafen (Ciclofosfamida), Ciclofosfos- famida, Citoxano (Ciclofosfosfamida), Daratumumabe, Darzalex (Dara- tumumabe), Doxil (lipossoma de cloridrato de doxorrubicina), liposso- ma de cloridrato de doxorrubicina, Dox-SL (lipossoma de cloridrato de doxorrubicina), elotuzumabe, empliciti (elotuzumabe), evacet (liposso- ma de cloridrato de doxorubolisina), Farydak (Panobinostato), Citrato de Ixazomibe, Kyprolis (carfilzomibe), Lenalidomida, Lipodox (liposso- ma de cloridrato de doxorubolisina), Mozobil (plerixafor), Neosar (Ci- clofosfamida), Ninlaro (Citrato de ixazomibe), Pamidronato dissódico,
Panobinoste, Plerixafor, Pomalidomida, Pomalyst (Pomalidomida), Re- vlimid (Lenalidomida), Sinovir (Talidomida), Talidomida, Talomida (Ta- lidomida), Velcade (Bortezomibe), ácido zoledrônico, Zometa (ácido zoledrônico) ou qualquer combinação dos mesmos.
[00663] Um processo de expansão de células T da presente inven- ção pode ocorrer em uma bolsa de cultura de células em um biorreator WAVE, um frasco G-Rex, ou em qualquer outro recipiente e/ou reator adequado.
[00664] Uma cultura de células ou células T da presente invenção pode ser mantida estável, balançada, girada ou agitada.
[00665] Um processo de expansão de células ou células T da pre- sente invenção pode otimizar certas condições, incluindo, porém, não limitadas a, duração da cultura, concentração de células, cronograma para adição / remoção de meio de células T, tamanho da célula, núme- ro total de células, fenótipo celular, pureza da população celular, por- centagem de células geneticamente modificadas na população celular em crescimento, uso e composição de suplementos, adição / remoção de tecnologias expansoras, ou qualquer combinação dos mesmos.
[00666] Um processo de expansão de células ou células T da pre- sente invenção pode continuar até um ponto final predefinido antes da formulação da população de células expandida resultante. Por exem- plo, um processo de expansão de células ou células T da presente in- venção pode continuar por um período de tempo predeterminado: pelo menos, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24 horas; pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 dias; pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 semanas; pelo menos 1, 2, 3, 4, 5, 6 meses, ou pelo menos 1 ano. Um processo de expansão de células ou células T da presente invenção pode continuar até que a cultura resultante alcance uma densidade celular global predeterminada: 1, 10, 100, 1000, 104, 105,
106, 107, 108, 109, 1010 células por volume (μl, ml, L) ou qualquer densidade intermediária. Um processo de expansão de células ou cé- lulas T da presente invenção pode continuar até que as células geneti- camente modificadas de uma cultura resultante demonstrem um nível predeterminado de expressão de um transposon da presente inven- ção: 1%, 10%, 20%, 30%, 40%, 50 %, 60%, 70%, 80%, 90%, ou 100% ou qualquer porcentagem em um nível limite de expressão (um nível mínimo, máximo ou médio de expressão indicando que as células ge- neticamente modificadas resultantes são clinicamente eficazes). Um processo de expansão de células ou células T da presente invenção pode continuar até que a proporção de células geneticamente modifi- cadas de uma cultura resultante para a proporção de células não mo- dificadas atinja um limite predeterminado: pelo menos 1:10, 1: 9, 1: 8, 1: 7, 1: 6, 1: 5, 1: 4, 1: 3, 1: 2, 1: 1, 2: 1, 2: 1, 4: 1, 5: 1, 6: 1, 7: 1, 8: 1, 9: 1 10: 1 ou qualquer proporção intermediária. Análise de células T autólogas geneticamente modificadas para liberação
[00667] Uma porcentagem de células geneticamente modificadas pode ser avaliada durante ou após um processo de expansão da pre- sente invenção. A expressão celular de um transposon por uma célula geneticamente modificada da presente invenção pode ser medida por classificação de células ativadas por fluorescência (FACS). Por exem- plo, FACS pode ser usada para determinar uma porcentagem de célu- las ou células T que expressam uma CARTirina da presente invenção. Alternativamente, ou em adição, uma pureza de células geneticamente modificadas ou células T, a Intensidade Média de Fluorescência (MFI) de uma CARTirina expressa por uma célula geneticamente modificada ou célula T da presente invenção, uma capacidade da CARTirina de mediar a desgranulação e/ou exterminação de uma célula alvo que expressa o ligante CARTirina, e/ou um fenótipo de CARTirina + células
T podem ser avaliadas.
[00668] As composições da presente invenção destinadas à admi- nistração a um indivíduo podem ser necessárias para atender a um ou mais "critérios de liberação" que indicam que a composição é segura e eficaz para formulação como um produto farmacêutico e/ou adminis- tração a um indivíduo. Os critérios de liberação podem incluir um re- quisito de que uma composição da presente invenção (por exemplo, um produto de células T da presente invenção) compreende uma por- centagem particular de células T que expressam níveis detectáveis de uma CARTirina da presente invenção em sua superfície celular.
[00669] O processo de expansão deve ser continuado até que um determinado critério tenha sido atendido (por exemplo, atingir um de- terminado número total de células, atingir uma determinada população de células de memória, atingir uma população de um determinado ta- manho).
[00670] Certos critérios sinalizam um ponto em que o processo de expansão deve terminar. Por exemplo, as células devem ser formula- das, reativadas ou criopreservadas quando atingem um tamanho celu- lar de 300fL (de outro modo, células que atingem um tamanho acima desse limite podem começar a morrer). A criopreservação imediata- mente uma vez que uma população de células atinge um tamanho médio de célula de menos de 300 fL pode render uma melhor recupe- ração celular após o descongelamento e cultura, porque as células ainda não atingiram um estado totalmente quiescente antes da crio- preservação (um tamanho totalmente quiescente é de aproximada- mente 180 fL). Antes da expansão, as células T da presente invenção podem ter um tamanho de célula de cerca de 180 fL, mas podem mais do que quadruplicar seu tamanho de célula para aproximadamente 900 fL em 3 dias após a expansão. Ao longo dos próximos 6 a 12 dias, a população de células T diminuirá lentamente o tamanho das células até a quiescência total em 180 fL.
[00671] Um processo de preparação de uma população de células para formulação pode incluir, porém, não está limitado a, etapas de, concentração das células de uma população de células, lavagem das células e/ou seleção adicional das células por meio de resistência a fármacos ou classificação de conta magnética contra um determinado marcador expresso na superfície. Um processo de preparação de uma população de células para formulação pode incluir ainda uma etapa de classificação para garantir a segurança e pureza do produto final. Por exemplo, se uma célula tumoral de um paciente foi usada para estimu- lar uma célula T geneticamente modificada da presente invenção ou que foi geneticamente modificada a fim de estimular uma célula T ge- neticamente modificada da presente invenção que está sendo prepa- rada para formulação, é fundamental que nenhuma célula tumoral do paciente seja incluída no produto final. Infusão de produto celular e/ou criopreservação para infusão
[00672] Uma formulação farmacêutica da presente invenção pode ser distribuída em bolsas para infusão, criopreservação e/ou armaze- namento.
[00673] Uma formulação farmacêutica da presente invenção pode ser criopreservada utilizando um protocolo padrão e, opcionalmente, um meio infusível de criopreservação. Por exemplo, um criopreservan- te livre de DMSO (por exemplo, meio de criopreservação livre de DMSO CryoSOfree™) pode ser usado para reduzir a toxicidade relaci- onada ao congelamento. Uma formulação farmacêutica criopreservada da presente invenção pode ser armazenada para infusão em um paci- ente em uma data posterior. Um tratamento eficaz pode exigir adminis- trações múltiplas de uma formulação farmacêutica da presente inven- ção e, portanto, as formulações farmacêuticas podem ser embaladas em "doses" pré-aliquotadas que podem ser armazenadas congeladas,
mas separadas para descongelamento de doses individuais.
[00674] Uma formulação farmacêutica da presente invenção pode ser armazenada em temperatura ambiente. Um tratamento eficaz pode exigir múltiplas administrações de uma formulação farmacêutica da presente invenção e, portanto, as formulações farmacêuticas podem ser embaladas em "doses" pré-aliquotadas que podem ser armazena- das juntas, mas separadas para administração de doses individuais.
[00675] Uma formulação farmacêutica da presente invenção pode ser arquivada para subsequente re-expansão e/ou seleção para gera- ção de doses adicionais para o mesmo paciente no caso de uma tera- pia alogênica que pode precisar de uma administração em uma data futura após, por exemplo, uma remissão e recaída de uma condição. Formulações
[00676] Como notado acima, a presente invenção formulações es- táveis, que preferivelmente compreendem um tampão de fosfato com solução salina ou um sal escolhido, bem como, soluções e formula- ções conservadas contendo um conservante, bem como, formulações preservadas multiuso adequadas para uso farmacêutico ou veterinário, compreendendo pelo menos uma CARTirina em formulação farmaceu- ticamente aceitável. As formulações conservadas contêm pelo menos um conservante conhecido ou opcionalmente selecionado do grupo consistindo em pelo menos um fenol, m-cresol, p-cresol, o-cresol, clo- rocresol, álcool benzílico, nitrito fenilmercúrico, fenoxietanol, formalde- ído, clorobutanol, cloreto de magnésio (por exemplo, hexa-hidrato), alquilparabeno (metila, etila, propila, butila e similares), cloreto de ben- zalcônio, cloreto de benzetônio, desidroacetato de sódio e timerosal, polímeros ou misturas dos mesmos em um diluente aquoso. Qualquer concentração ou mistura adequada pode ser usada como conhecido na técnica, tal como, cerca de 0,0015%, ou qualquer faixa, valor ou fração nele contida. Exemplos não limitantes incluem, sem conservan-
te, cerca de 0,1-2% de m-cresol (por exemplo, 0,2, 0,3, 0,4, 0,5, 0,9, 1,0%), cerca de 0,1-3% de álcool benzílico (por exemplo, 0,5, 0,9, 1,1, 1,5, 1,9, 2,0, 2,5%), cerca de 0,001-0,5% de timerosal (por exemplo, 0,005, 0,01), cerca de 0,001-2,0% de fenol (por exemplo, 0,05, 0,25, 0,28, 0,5, 0,9, 1,0 %), 0,0005-1,0% de alquilparabeno (s) (por exemplo, 0,00075, 0,0009, 0,001, 0,002, 0,005, 0,0075, 0,009, 0,01, 0,02, 0,05 , 0,075, 0,09, 0,1, 0,2, 0,3, 0,5, 0,75, 0,9, 1,0%), e similares.
[00677] Como notado acima, a presente invenção fornece um artigo de fabricação, compreendendo material de embalagem e pelo menos um frasco compreendendo uma solução de pelo menos uma CARTiri- na com os tampões e/ou conservantes prescritos, opcionalmente em um diluente aquoso, em que o referido material de embalagem com- preende um rótulo que indica que tal solução pode ser mantida duran- te um período de 1, 2, 3, 4, 5, 6, 9, 12, 18, 20, 24, 30, 36, 40, 48, 54, 60, 66, 72 horas ou mais. A presente invenção também compreende um artigo de fabricação, compreendendo material de embalagem, um primeiro frasco compreendendo liofilizar pelo menos uma CARTirina, e um segundo frasco compreendendo um diluente aquoso de tampão ou conservante prescrito, em que o referido material de embalagem com- preende um rótulo que instrui um paciente a reconstituir pelo menos uma CARTirina no diluente aquoso para formar uma solução que pode ser retida por um período de vinte e quatro horas ou mais.
[00678] A pelo menos uma CARTirina usada de acordo com a pre- sente invenção pode ser produzida por meios recombinantes, incluindo de células de mamíferos ou preparações transgênicas, ou pode ser purificada de outras fontes biológicas, conforme descrito aqui ou como conhecido na técnica.
[00679] A faixa de pelo menos uma CARTirina no produto da pre- sente invenção inclui quantidades que rendem após a reconstituição, se em um sistema úmido / seco, concentrações de cerca de 1,0 μg / ml a cerca de 1000 mg / ml, embora concentrações mais baixas e mais altas são operáveis e dependem do veículo de liberação pretendido, por exemplo, as formulações da solução serão diferentes dos métodos de adesivo transdérmico, pulmonar, transmucoso, ou osmótico ou de micro-bomba.
[00680] De preferência, o diluente aquoso opcionalmente também compreende um conservante farmaceuticamente aceitável. Os conser- vantes preferidos incluem aqueles selecionados do grupo consistindo em fenol, m-cresol, p-cresol, o-cresol, clorocresol, álcool benzílico, al- quilparabeno (metila, etila, propila, butila e similares), cloreto de ben- zalcônio, cloreto de benzetônio, desidroacetato e timerosal, ou mistu- ras dos mesmos. A concentração de conservante usado na formulação é uma concentração suficiente para produzir um efeito antimicrobiano. Tais concentrações dependem do conservante selecionado e são prontamente determinadas pelo versado na técnica.
[00681] Outros excipientes, por exemplo, agentes de isotonicidade, tampões, antioxidantes e realçadores de conservantes, podem ser op- cionalmente e preferivelmente adicionados ao diluente. Um agente de isotonicidade, tal como, glicerina, é comumente usado em concentra- ções conhecidas. Um tampão fisiologicamente tolerado é preferivel- mente adicionado para fornecer melhor controle do pH. As formula- ções podem cobrir uma ampla faixa de pHs, tal como de cerca de pH 4 a cerca de pH 10, e faixas preferidas de cerca de pH 5 a cerca de pH 9, e a faixa mais preferida de cerca de 6,0 a cerca de 8,0. De prefe- rência, as formulações da presente invenção possuem um pH entre cerca de 6,8 e cerca de 7,8. Os tampões preferidos incluem os tam- pões de fosfato, mais preferivelmente, fosfato de sódio, em particular, salina tamponada por fosfato (PBS).
[00682] Outros aditivos, tais como, solubilizantes farmaceuticamen- te aceitáveis como Tween 20 (monolaurato de sorbitano de polioxieti-
leno (20)), Tween 40 (monopalmitato de sorbitano de polioxietileno (20)), Tween 80 (mono-oleato de sorbitano de polioxietileno (20)), Plu- rônico F68 (copolímeros em bloco de polioxipropileno de polioxietile- no), e PEG (polietileno glicol) ou tensoativos não iônicos, tais como, polissorbato 20 ou 80 ou poloxâmero 184 ou 188, polils Pluronic®, ou- tros copolímeros de bloco, e quelantes, tais como, EDTA e EGTA, po- dem opcionalmente ser adicionados às formulações ou composições para reduzir a agregação. Esses aditivos são particularmente úteis se uma bomba ou recipiente de plástico for usado para administrar a for- mulação. A presença de tensoativo farmaceuticamente aceitável mitiga a propensão para a proteína se agregar.
[00683] As formulações da presente invenção podem ser prepara- das por um processo que compreende a mistura de pelo menos uma CARTirina e o conservante selecionado do grupo consistindo em fenol, m-cresol, p-cresol, o-cresol, clorocresol, álcool benzílico, alquilparabe- no, (metila, etila, propila, butila e similares), cloreto de benzalcônio, cloreto de benzetônio, desidroacetato de sódio e timerosal ou misturas dos mesmos em um diluente aquoso. A mistura de pelo menos uma CARTirina e do conservante em um diluente aquoso é realizada usan- do procedimentos de dissolução e mistura convencionais. Para prepa- rar uma formulação adequada, por exemplo, uma quantidade medida de pelo menos uma CARTirina em solução tamponada é combinada com o conservante desejado em uma solução tamponada em quanti- dades suficientes para fornecer a proteína e o conservante nas con- centrações desejadas. As variações deste processo seriam reconheci- das por alguém versado na técnica. Por exemplo, a ordem de adição dos componentes, se aditivos adicionais são usados, a temperatura e o pH em que a formulação é preparada, são todos fatores que podem ser otimizados para a concentração e meio de administração utiliza- dos.
[00684] As formulações reivindicadas podem ser fornecidas aos pa- cientes como soluções límpidas ou como frascos duplos compreen- dendo um frasco liofilizado de pelo menos uma CARTirina que é re- constituído com um segundo frasco contendo água, um conservante e/ou excipientes, preferivelmente, um tampão de fosfato e/ou solução salina e o sal escolhido, em diluente aquoso. Tanto um frasco de solu- ção única ou frasco duplo que requer reconstituição pode ser reutiliza- do várias vezes e pode ser suficiente para um único ou vários ciclos de tratamento de paciente e, portanto, pode fornecer um regime de trata- mento mais conveniente do que o disponível atualmente.
[00685] Os presentes artigos de fabricação reivindicados são úteis para administração durante um período que varia de imediato a vinte e quatro horas ou mais. Consequentemente, os artigos de fabricação presentemente reivindicados oferecem vantagens significativas para o paciente. As formulações da presente invenção podem ser opcional- mente armazenadas com segurança a temperaturas de cerca de 2 °C a cerca de 40 ° C e reter a atividade biológica da proteína por longos períodos de tempo, permitindo assim uma etiqueta de embalagem in- dicando que a solução pode ser mantida e/ou usada por um período de 6, 12, 18, 24, 36, 48, 72, ou 96 horas ou mais. Se for usado diluente preservado, esse rótulo pode incluir o uso por até 1 a 12 meses, 06 meses, e and a half e/ou dois anos.
[00686] As soluções de pelo menos uma CARTirina da presente invenção podem ser preparadas por um processo que compreende a mistura de pelo menos uma CARTirina em um diluente aquoso. A mis- tura é realizada usando procedimentos convencionais de dissolução e mistura. Para preparar um diluente adequado, por exemplo, uma quan- tidade medida de pelo menos uma CARTirina em água ou tampão é combinada em quantidades suficientes para fornecer a proteína e, op- cionalmente, um conservante ou tampão nas concentrações deseja-
das. As variações deste processo seriam reconhecidas por alguém versado na técnica. Por exemplo, a ordem de adição dos componen- tes, a utilização de aditivos adicionais, a temperatura e o pH em que a formulação é preparada, são todos fatores que podem ser otimizados para a concentração e meio de administração utilizados.
[00687] Os produtos reivindicados podem ser fornecidos aos paci- entes na forma de soluções límpidas ou como frascos duplos compre- endendo um frasco liofilizado de pelo menos uma CARTirina que é re- constituída com um segundo frasco contendo o diluente aquoso. Um frasco de solução única ou frasco duplo que requer reconstituição po- de ser reutilizado várias vezes e pode ser suficiente para um único ou vários ciclos de tratamento do paciente e, portanto, fornece um regime de tratamento mais conveniente do que o atualmente disponível.
[00688] Os produtos reivindicados podem ser fornecidos indireta- mente aos pacientes, fornecendo a farmácias, clínicas, ou outras insti- tuições e facilidades, soluções claras ou frascos duplos compreenden- do um frasco liofilizado de pelo menos uma CARTirina que é reconsti- tuída com um segundo frasco contendo o diluente aquoso. A solução límpida, neste caso, pode ser de até um litro ou ainda maior em tama- nho, proporcionando um grande reservatório de onde porções meno- res da pelo menos uma solução de CARTirina podem ser recuperadas uma ou várias vezes para transferência em frascos menores e forneci- das pela farmácia ou clínica aos seus clientes e/ou pacientes.
[00689] Dispositivos reconhecidos compreendendo sistemas de frasco único incluem dispositivos de caneta injetora para liberação de uma solução, tais como, canetas BD, BD Autojector®, Humaject®, No- voPen®, BD®Pen, AutoPen®, e OptiPen®, GenotropinPen®, Geno- tronorm Pen®, Humatro Pen®, Reco-Pen®, Roferon Pen®, Biojector®, Iject®, J-tip Needle-Free Injector®, Intraject®, Medi-Ject®, por exem- plo, como preparado ou desenvolvido por Becton Dickinson ( Franklin
Lakes, NJ, www.bectondickenson.com), Disetrônico (Burgdorf, Suíça, www.disetronic.com; Bioject, Portland, Oreg. (Www.bioject.com); Nati- onal Medical Products, Weston Medical (Peterborough, UK, www.weston-medical.com), Medi-Ject Corp (Minneapolis, Minn., www.mediject.com), e dispositivos similares adequados. Dispositivos reconhecidos compreendendo um sistema de frasco duplo incluem aqueles sistemas de caneta injetora para reconstituir um fármaco liofi- lizado em um cartucho para liberação da solução reconstituída, tal co- mo o HumatroPen®. Exemplos de outros dispositivos adequados in- cluem seringas pré-carregadas, autoinjetores, injetores sem agulha e conjuntos de infusão IV sem agulha.
[00690] Os produtos reivindicados atualmente incluem material de embalagem. O material de embalagem fornece, além das informações exigidas pelos órgãos reguladores, as condições em que o produto pode ser utilizado. O material de embalagem da presente invenção fornece instruções ao paciente para reconstituir pelo menos uma CARTirina no diluente aquoso para formar uma solução e usar a solu- ção por um período de 2 a 24 horas ou mais para os produtos de dois frascos, úmidos / secos. Para o produto em solução de frasco único, o rótulo indica que tal solução pode ser usada por um período de 2 a 24 horas ou mais. Os produtos atualmente reivindicados são úteis para uso em produtos farmacêuticos humanos.
[00691] As formulações da presente invenção podem ser prepara- das por um processo que compreende a mistura pelo menos uma CARTirina e um tampão selecionado, preferivelmente, um tampão de fosfato contendo solução salina ou um sal escolhido. A mistura pelo menos de um CARTirina e tampão em um diluente aquoso é feita utili- zando procedimentos convencionais de dissolução e mistura. Para preparar uma formulação adequada, por exemplo, uma quantidade medida de pelo menos uma CARTirina em água ou tampão é combi-
nada com o agente tamponante desejado em água em quantidades suficientes para fornecer a proteína e tampão nas concentrações de- sejadas. As variações deste processo seriam reconhecidas por alguém versado na técnica. Por exemplo, a ordem de adição dos componen- tes, a utilização de aditivos adicionais, a temperatura e o pH em que a formulação é preparada, são todos fatores que podem ser otimizados para a concentração e meio de administração utilizados.
[00692] As formulações estáveis ou preservadas reivindicadas po- dem ser fornecidas aos pacientes como soluções claras ou como fras- cos duplos compreendendo um frasco de CARTirina liofilizado que é reconstituído com um segundo frasco contendo um conservante ou tampão e excipientes em um diluente aquoso. Um frasco de solução única ou frasco duplo que requer reconstituição pode ser reutilizado várias vezes e pode ser suficiente para um único ou vários ciclos de tratamento do paciente e, portanto, fornece um regime de tratamento mais conveniente do que o atualmente disponível.
[00693] Outras formulações ou métodos de estabilização da CARTi- rina podem resultar em outra solução que não seja uma solução límpi- da de pó liofilizado compreendendo a CARTirina. Entre as soluções não claras estão as formulações compreendendo suspensões particu- ladas, sendo as referidas partículas uma composição contendo a CARTirina em uma estrutura de dimensão variável e conhecida varia- damente como microesfera, micropartícula, nanopartícula, nanosfera ou lipossoma. Tais formulações particuladas relativamente homogê- neas, essencialmente esféricas, contendo um agente ativo podem ser formadas pelo contato de uma fase aquosa contendo o agente ativo e um polímero e uma fase não aquosa seguida por evaporação da fase não aquosa para causar a coalescência de partículas da fase aquosa, conforme ensinado em Patente dos Estados Unidos No. 4.589.330. Micropartículas porosas podem ser preparadas usando uma primeira fase contendo agente ativo e um polímero disperso em um solvente contínuo e removendo o referido solvente da suspensão por liofilização ou diluição-extração-precipitação como ensinado na patente dos Esta- dos Unidos No. 4.818.542. Polímeros preferidos para tais preparações são copolímeros naturais ou sintéticos ou polímeros selecionados do grupo consistindo em gelatina ágar, amido, arabinogalactano, albumi- na, colágeno, ácido poliglicólico, ácido polilático, glicolídeo-L (-) lactí- deo poli (episilon- caprolactona, poli (épsilon-caprolactona-CO-ácido láctico), poli (épsilon-caprolactona-CO-ácido glicólico), poli (ácido β- hidroxibutírico), óxido de polietileno, polietileno, poli (alquil-2- cianoacrilato), poli (metacrilato de hidroxietila), poliamidas, poli (ami- noácidos), poli (2-hidroxietil DL-aspartamida), poli (éster ureia), poli (L- fenilalanina / etileno glicol / 1,6-diisocianato-hexano) e poli (metil meta- crilato). Polímeros particularmente preferidos são poliésteres, tais co- mo, ácido poliglicólico, ácido polilático, glicolídeo-L (-) lactídeo poli (episilon-caprolactona), poli (epsilon-caprolactona-CO-ácido lático), e poli (epsilon-caprolactona-CO-ácido glicólico). Solventes úteis para dissolver o polímero e/ou o ativo incluem: água, hexafluoroisopropanol, cloreto de metileno, tetra-hidrofurano, hexano, benzeno ou hexafluoro- acetona sesqui-hidratado. O processo de dispersão da fase contendo ativo com uma segunda fase pode incluir pressão para a referida pri- meira fase através um orifício em um bico para afetar a formação de gotículas.
[00694] As formulações de pó seco podem resultar de outros pro- cessos que não a liofilização, como por secagem por pulverização ou extração de solvente por evaporação ou por precipitação de uma com- posição cristalina seguida por uma ou mais etapas para remover sol- vente aquoso ou não aquoso. A preparação de uma preparação de CARTirina seca por pulverização é ensinada na patente dos Estados Unidos No. 6.019.968. As composições de pó seco à base de CARTi-
rina podem ser produzidas por soluções de secas por pulverização ou suspensões da CARTirina e, opcionalmente, excipientes, em um sol- vente sob condições para fornecer um pó seco inalável. Os solventes podem incluir compostos polares, tais como, água e etanol, que po- dem ser facilmente secos. A estabilidade da CARTirina pode ser real- çada realizando os procedimentos de secagem por pulverização na ausência de oxigênio, tal como, sob uma manta de nitrogênio ou usando nitrogênio como gás de secagem. Outra formulação relativa- mente seca é uma dispersão de uma pluralidade de microestruturas perfuradas dispersas em um meio de suspensão que tipicamente compreende um propulsor de hidrofluoroalcano como ensinado em WO 9916419. As dispersões estabilizadas podem ser administradas ao pulmão de um paciente usando um inalador de dose medida. Equi- pamentos úteis na fabricação comercial de medicamentos secos por pulverização são fabricados por Buchi Ltd. ou Niro Corp.
[00695] Pelo menos uma CARTirina nas formulações estáveis ou preservadas ou soluções aqui descritas, pode ser administrada a um paciente de acordo com a presente invenção por meio de uma varie- dade de métodos de liberação, incluindo injeção SC ou IM; transdér- mico, pulmonar, transmucoso, implante, bomba osmótica, cartucho, micro bomba, ou outros meios apreciados pelo técnico versado, como bem conhecidos na técnica. Aplicações Terapêuticas
[00696] A presente invenção também oferece um método para mo- dular ou tratar uma doença, em uma célula, tecido, órgão, animal ou paciente, como conhecido na técnica ou como aqui descrito, utilizando pelo menos uma CARTirina da presente invenção, por exemplo, admi- nistrando ou entrando em contato com a célula, tecido, órgão, animal ou paciente com uma quantidade terapêutica eficaz de CARTirina. A presente invenção também fornece um método para modular ou tratar uma doença, em uma célula, tecido, órgão, animal ou paciente, inclu- indo, porém, não limitada a, uma doença maligna.
[00697] A presente invenção também fornece um método para mo- dular ou tratar pelo menos uma doença maligna em uma célula, tecido, órgão, animal ou paciente, incluindo, porém, não limitada a, pelo me- nos um de: leucemia, leucemia aguda, leucemia linfoblástica aguda (ALL), leucemia linfocítica aguda, células B, células T ou ALL FAB, leucemia mielóide aguda (AML), leucemia mielóide aguda, leucemia mielocítica crônica (CML), leucemia linfocítica crônica (CLL), leucemia de células pilosas, síndrome mielodplásica (SMD), um linfoma, doença de Hodgkin, um linfoma maligno, linfoma de não-Hodgkin, linfoma de Burkitt, mieloma múltiplo, sarcoma de Kaposi, carcinoma colorretal, carcinoma pancreático, carcinoma nasofaríngeo, histocitose maligna, síndrome/hpercalcemia paraneoplásica maligna, tumores sólidos, cân- cer de bexiga, câncer de mama, câncer colorretal, câncer endometrial, câncer de cabeça, câncer de pescoço, câncer hereditário não polipo- se, linfoma de Hodgkin, câncer de fígado, câncer de pulmão, câncer de pulmão de células não pequenas, câncer de ovário, câncer de pân- creas, câncer de próstata, carcinoma de células renais, câncer testicu- lar, adenocarcinomas, sarcomas, melanoma maligno, hemangioma, doença metastática, reabsorção óssea relacionada ao câncer, dor ós- sea relacionada ao câncer e similares.
[00698] Qualquer método da presente invenção pode compreender a administração de uma quantidade eficaz de uma composição ou composição farmacêutica compreendendo pelo menos uma CARTirina a uma célula, tecido, órgão, animal ou paciente que necessite de tal modulação, tratamento ou terapia. Tal método pode opcionalmente compreender ainda a coadministração ou terapia combinada para o tratamento de tais doenças ou distúrbios, em que a administração de referida pelo menos uma CARTirina, porção especificada ou variante da mesma, também compreende administrar, antes simultaneamente e/ou após, pelo menos uma selecionada de pelo menos um de um agente alquilante, um inibidor mitótico, um radiofármaco. Dosagens adequadas são bem conhecidas na técnica. Veja, por exemplo, Wells et al., Eds., Pharmacotherapy Handbook, 2ª edição, Appleton e Lange, Stamford, Conn. (2000); PDR Pharmacopoeia, Tarascon Pocket Pharmacopoeia 2000, Deluxe Edition, Tarascon Publishing, Loma Lin- da, Califórnia (2000); Nursing 2001 Handbook of Drugs, 21ª edição, Springhouse Corp., Springhouse, Pa., 2001; Health Professional's Drug Guide 2001, ed., Shannon, Wilson, Stang, Prentice-Hall, Inc, Up- per Saddle River, N.J., cada uma das quais referências são incorpora- das totalmente aqui por referência.
[00699] Doses preferidas podem opcionalmente incluir cerca de 0,1- 99 e/ou 100-500 mg / kg / administração, ou qualquer faixa, valor ou fração dos mesmos, ou atingir uma concentração sérica de cerca de 0,1- 5000 μg / ml de concentração sérica por administração única ou múltipla, ou qualquer faixa, valor ou fração dos mesmos. Uma faixa de dosagem preferida para a CARTirina da presente invenção é de cerca de 1 mg / kg, até cerca de 3, cerca de 6 ou cerca de 12 mg / kg do pe- so corporal do paciente.
[00700] Alternativamente, a dosagem administrada pode variar de- pendendo de fatores conhecidos, tais como, as características farma- codinâmicas do agente particular, e seu modo e rotina de administra- ção; idade, saúde e peso do destinatário; natureza e extensão dos sin- tomas, tipo de tratamento simultâneo, frequência do tratamento e o efeito desejado. Usualmente, uma dosagem de ingrediente ativo pode ser cerca de 0,1 a 100 miligramas por quilograma de peso corporal. Normalmente de 0,1 a 50, e preferivelmente, de 0,1 a 10 miligramas por quilograma por administração ou na forma de liberação sustentada é eficaz para obter os resultados desejados.
[00701] A título de exemplo não limitante, o tratamento de humanos ou animais pode ser fornecido como dose única ou periódica de pelo menos uma CARTirina da presente invenção cerca de 0,1 a 100 mg / kg ou qualquer faixa, valor ou fração da mesma por dia, pelo menos um dos dias 1-40, ou, alternativamente ou adicionalmente, pelo menos uma das semanas 1-52, ou, alternativamente ou adicionalmente, pelo menos um dos 1-20 anos, ou qualquer combinação dos mesmos, usando uma única infusão ou doses repetidas.
[00702] As formas de dosagem (composição) adequadas para ad- ministração interna geralmente contêm de cerca de 0,001 miligramas a cerca de 500 miligramas de ingrediente ativo por unidade ou recipien- te. Nessas composições farmacêuticas, o ingrediente ativo estará normalmente presente em uma quantidade de cerca de 0,5 a 99,999% em peso com base no peso total da composição.
[00703] Para administração parenteral, a CARTirina pode ser for- mulada como solução, suspensão, emulsão, partícula, pó, ou pó liofili- zado em associação, ou separadamente, com um veículo parenteral farmaceuticamente aceitável. Exemplos de tais veículos são água, so- lução salina, solução de Ringer, solução de dextrose e cerca de 1-10% de albumina de soro humana. Lipossomas e veículos não aquosos, como óleos fixos, também podem ser usados. O veículo ou pó liofiliza- do pode conter aditivos que mantenham a isotonicidade (por exemplo, cloreto de sódio, manitol) e estabilidade química (por exemplo, tam- pões e conservantes). A formulação é esterilizada por técnicas conhe- cidas ou adequadas.
[00704] Os veículos farmacêuticos adequados são descritos na edi- ção mais recente de Remington's Pharmaceutical Sciences, A. Osol, um texto de referência padrão neste campo. Administração Alternativa
[00705] Muitos modos conhecidos e desenvolvidos podem ser usa-
dos de acordo com a presente invenção para a administração de quantidades farmaceuticamente eficazes de pelo menos uma CARTiri- na de acordo com a presente invenção. Embora a administração pul- monar seja usada na seguinte descrição, outros modos de administra- ção podem ser usados de acordo com a presente invenção com resul- tados adequados. As CARTirinas da presente invenção podem ser li- beradas em um veículo, como uma solução, emulsão, colóide, ou sus- pensão, ou como um pó seco, usando qualquer um de uma variedade de dispositivos e métodos adequados para administração por inalação ou outros modos descritos aqui ou conhecidos na técnica. Formulações Parenterais e Administração
[00706] As formulações para administração parenteral podem con- ter como excipientes comuns água estéril ou solução salina, polialqui- leno glicóis, tais como, polietileno glicol, óleos de origem vegetal, naf- talenos hidrogenados e similares. As suspensões aquosas ou oleosas injetáveis podem ser preparadas utilizando um emulsificante ou umidi- ficador apropriado e um agente de suspensão, de acordo com méto- dos conhecidos. Os agentes para injeção podem ser um agente dilu- ente não tóxico, de administração não oral, tal como uma solução aquosa, uma solução injetável estéril ou uma suspensão em um sol- vente. Como veículo ou solvente utilizável são permitidos água, solu- ção de Ringer, solução salina isotônica, etc.; como um solvente co- mum ou solvente de suspensão, o óleo involátil estéril pode ser usado. Para esses fins, pode ser utilizado qualquer tipo de óleo involátil e áci- do graxo, incluindo óleos graxos ou ácidos graxos naturais ou sintéti- cos ou semissintéticos; mono ou di ou triglicerídeos naturais ou sintéti- cos ou semissintéticos. A administração parental é conhecida na técni- ca e inclui, porém, não está limitada a, meios convencionais de inje- ções, um dispositivo de injeção sem agulha sob pressão de gás como descrito em patente dos Estados Unidos nº. 5.851.198, e um dispositi-
vo perfurador a laser como descrito em patente dos Estados Unidos nº
5.839.446 incorporada totalmente aqui por referência. Liberação Alternativa
[00707] A presente invenção também se refere à administração de pelo menos uma CARTirina por via parenteral, subcutânea, intramus- cular, intravenosa, intrarticular, intrabrônquica, intra-abdominal, intra- capsular, intracartilaginosa, intracavitária, intracelial, intracerebelar, intracerebroventricular, intracólica, intracervical, intragástrica, intra- hepática, intramiocárdica, intraosteal, intrapélvica, intrapericárdica, in- traperitoneal, intrapleural, intraprostática, intrapulmonar, intraretal, in- trarenal, intrarretiniana, intraespinal, intrasinovial, intratorácica, intrau- terina, intravesical, intralesional, bolus, via oral, retal, bucal, sublingual, intranasal ou transdérmica. Pelo menos uma composição de CARTiri- na pode ser preparada para uso parenteral (subcutâneo, intramuscular ou intravenoso) ou qualquer outra administração particularmente na forma de soluções líquidas ou suspensões; para uso em administração vaginal ou retal, particularmente em formas semissólidas, tais como, porém, não limitadas a, cremes e supositórios; para administração bu- cal ou sublingual, tais como, porém, não limitadas a, na forma de com- primidos ou cápsulas; ou intranasalmente, tal como, porém, não limita- do a, a forma de pós, gotas nasais ou aerossóis ou determinados agentes; ou transdermicamente, tal como não limitado a, um gel, un- guento, loção, suspensão ou sistema de liberação de emplastro com realçadores químicos, tal como, sulfóxido de dimetila para modificar a estrutura da pele ou aumentar a concentração do fármaco no emplas- tro transdérmico (Junginger, et al. em "Drug Permeation Enhance- ment;" Hsieh, DS, Eds., Pp. 59-90 (Marcel Dekker, Inc. Nova Iorque 1994, incorporado totalmente aqui por referência), ou com agentes oxidantes que permitem a aplicação de formulações contendo proteí- nas e peptídeos na pele (WO 98/53847), ou aplicações de campos elé-
tricos para criar vias de transporte transientes, tal como, eletroporação, ou para aumentar a mobilidade de fármacos carregados através da pele, tal como, iontoforese, ou aplicação de ultrassom, tal como, sono- forese (Patentes dos Estados Unidos Nos. 4.309.989 e 4.767.402) (as publicações e patentes acima sendo incorporadas totalmente aqui por referência). Infusão de Células Modificadas como Terapia de Célula Adotiva
[00708] A presente invenção fornece células modificadas que ex- pressam uma ou mais CARs e/ou CARTirinas da presente invenção que foram selecionados e/ou expandidos para administração a um in- divíduo em necessidade das mesmas. As células modificadas da pre- sente invenção podem ser formuladas para armazenamento em qual- quer temperatura incluindo temperatura ambiente e temperatura corpo- ral. As células modificadas da presente invenção podem ser formula- das para criopreservação e posterior descongelamento. As células modificadas da presente invenção podem ser formuladas em um veí- culo farmaceuticamente aceitável para administração direta a um indi- víduo a partir de embalagem estéril. As células modificadas da presen- te invenção podem ser formuladas em um veículo farmaceuticamente aceitável com um indicador de viabilidade celular e/ou nível de expres- são de CAR / CARTirina para garantir um nível mínimo de função celu- lar e expressão de CAR / CARTirina. As células modificadas da pre- sente invenção podem ser formuladas em um veículo farmaceutica- mente aceitável em uma densidade prescrita com um ou mais reagen- tes para inibir a expansão posterior e/ou prevenir a morte celular. Polipeptídeos proapoptóticos induzíveis
[00709] Polipeptídeos proapoptóticos induzíveis da presente inven- ção são superiores aos polipeptídeos induzíveis existentes porque os polipeptídeos proapoptóticos induzívels da presente invenção são mui- to menos imunogênicos. Enquanto os polipeptídeos proapoptóticos induzíveis da presente invenção são polipeptídeos recombinantes, e, portanto, de ocorrência não natural, as sequências que são recombi- nadas para produzir os polipeptídeos proapoptóticos induzíveis da presente invenção não compreendem sequências não humanas que o sistema imune de humano hospedeiro pode reconhecer como "não próprias" e, consequentemente, induzem uma resposta imune no indi- víduo recebendo um polipeptídeo proapoptótico induzível da presente invenção, uma célula compreendendo o polipeptídeo proapoptótico induzível ou uma composição compreendendo o polipeptídeo proapop- tótico induzível ou uma célula compreendendo o polipeptídeo proapop- tótico induzível.
[00710] A presente invenção fornece polipeptídeos proapoptóticos induzíveis compreendendo uma região de ligação ao ligante, um ligan- te, e um peptídeo proapoptótico, em que o polipeptídeo proapoptótico induzível não compreende uma sequência não humana. Em certas modalidades, a sequência não humana compreende um sítio de restri- ção. Em certas modalidades, o peptídeo proapoptótico é um polipep- tídeo de caspase. Em certas modalidades, o polipeptídeo de caspase é um polipeptídeo de caspase 9. Em certas modalidades, o polipeptí- deo de caspase 9 é um polipeptídeo de caspase 9 truncado. Polipeptí- deos proapoptóticos induzíveis da presente invenção podem ser de ocorrência não natural.
[00711] Polipeptídeos de caspase da presente invenção incluem, mas não estão limitados a, caspase 1, caspase 2, caspase 3, caspase 4, caspase 5, caspase 6, caspase 7, caspase 8, caspase 9, caspase 10, caspase 11, caspase 12, e caspase 14. Polipeptídeos de caspase da presente invenção incluem, mas não estão limitados a, aqueles po- lipeptídeos de caspase associados com apoptóse incluindo caspase 2, caspase 3, caspase 6, caspase 7, caspase 8, caspase 9, e caspase
10. Polipeptídeos de caspase da presente invenção incluem, mas não estão limitados a, aqueles polipeptídeos de caspase que iniciam apop- tóse, incluindo caspase 2, caspase 8, caspase 9, e caspase 10. Poli- peptídeos de caspase da presente invenção incluem, mas não estão limitados a, aqueles polipeptídeos de caspase que executam a apop- tóse, incluindo caspase 3, caspase 6 e caspase 7.
[00712] Polipeptídeos de caspase da presente invenção podem ser codificados por um aminoácido ou uma sequência de ácido nucleico tendo uma ou mais modificações comparadas a um aminoácido de tipo selvagem ou uma sequência de ácido nucleico. A sequência de ácido nucleico codificando um polipeptídeo de caspase da presente inven- ção pode ser códon otimizado. Uma ou mais modificações em um aminoácido e/ou sequência de ácido nucleico de um polipeptídeo de caspase da presente invenção podem aumentar uma interação, uma reticulação, uma ativação cruzada ou uma ativação do polipeptídeo de caspase da presente invenção comparada ao aminoácido de tipo sel- vagem ou uma sequência de ácido nucleico. Alternativamente, ou em adição, uma ou mais modificações a um aminoácido e/ou sequência de ácido nucleico de um polipeptídeo de caspase da presente inven- ção pode diminuir a imunogenicidade do polipeptídeo de caspase da presente invenção comparada ao aminoácido de tipo selvagem ou uma sequência de ácido nucleico.
[00713] Polipeptídeos de caspase da presente invenção podem ser truncados comparados a um polipeptídeo de caspase de tipo selva- gem. Por exemplo, um polipeptídeo de caspase pode ser truncado pa- ra eliminar uma sequência codificando um Domínio de Ativação e Re- crutamento de Caspase (CARD) para eliminar ou minimizar a possibi- lidade de ativação de uma resposta inflamatória local além de iniciar apoptóse na célula compreendendo um polipeptídeo de caspase indu- zível da presente invenção. A sequência de ácido nucleico codificando um polipeptídeo de caspase da presente invenção pode ser unida para formar uma sequência de aminoácido variante do polipeptídeo de cas- pase da presente invenção comparada a um polipeptídeo de caspase de tipo selvagem. Polipeptídeos de caspase da presente invenção po- dem ser codificados por sequências quiméricas e/ou recombinantes. Os polipeptídeos de caspase da presente invenção recombinantes e/ou quiméricos podem incluir sequências de um ou mais diferentes polipeptídeos de caspase. Alternativamente, ou em adição, polipeptí- deos de caspase recombinantes e/ou quiméricos da presente invenção podem incluir sequências de uma ou mais espécies (por exemplo, uma sequência humana e uma sequência não humana). Polipeptídeos de caspase da presente invenção podem ser ocorrência não natural.
[00714] A região de ligação ao ligante de um polipeptídeo proapop- tótico induzível da presente invenção pode incluir qualquer sequência polipeptídica que facilite ou promova a dimerização de um primeiro po- lipeptídeo proapoptótico induzível da presente invenção com um se- gundo polipeptídeo proapoptótico induzível da presente invenção, cuja dimerização ativa ou induz a reticulação dos polipeptídeos proapoptó- ticos e início da apoptóse na célula.
[00715] A região de ligação ao ligante ("dimerização") pode com- preender qualquer polipeptídeo ou domínio funcional do mesmo que permitirá indução usando um ligante endógeno ou de ocorrência não natural (isto é, agente de indução), por exemplo, um ligante sintético de ocorrência não natural. A região de ligação ao ligante pode ser in- terna ou externa à membrana celular, dependendo da natureza do po- lipeptídeo proapoptótico induzível e da escolha do ligante (isto é, agen- te de indução). Uma grande variedade de polipeptídeos de ligação a ligantes e domínios funcionais dos mesmos, incluindo receptores, são conhecidos. As regiões de ligação ao ligante da presente invenção po- dem incluir um ou mais sequências de um receptor. De particular inte- resse são as regiões de ligação ao ligante para as quais os ligantes
(por exemplo, pequenos ligantes orgânicos) são conhecidos ou podem ser facilmente produzidos. Essas regiões de ligação a ligante ou re- ceptores podem incluir, porém, não estão limitados a, os receptores de FKBPs e ciclofilina, os receptores de esteroides, o receptor de tetraci- clina e similares, bem como, receptores de "ocorrência não natural", que podem ser obtidos a partir de anticorpos, particularmente a subu- nidade de cadeia pesada ou leve, sequências mutadas da mesma, se- quências de aminoácido aleatórias obtidas por procedimentos estocás- ticos, sínteses combinatórias e similares. Em certas modalidades, a região de ligação do ligante é selecionada do grupo consistindo em uma região de ligação do ligante FKBP, uma região de ligação do li- gante do receptor de ciclofilina, uma região de ligação do ligante do receptor de esteróide, uma região de ligação do ligante dos receptores da ciclofilina, e uma região de ligação ao ligante do receptor de tetraci- clina.
[00716] As regiões de ligação ao ligante compreendendo um ou mais domínio (s) receptor (es) podem ser pelo menos cerca de 50 aminoácidos, e menos de cerca de 350 aminoácidos, geralmente me- nos de 200 aminoácidos, seja como domínio endógeno ou porção ati- va truncada do mesmo. A região de ligação pode, por exemplo, ser pequena (<25 kDa, para permitir a transfecção eficiente em vetores virais), monomérica, não imunogênica, ter ligantes sinteticamente acessíveis, permeáveis às células e não tóxicos que podem ser confi- gurados para dimerização.
[00717] As regiões de ligação ao ligante compreendendo um ou mais domínio (s) receptor (es) podem ser intracelulares ou extracelula- res dependendo do design do polipeptídeo proapoptótico induzível e da disponibilidade de um ligante apropriado (isto é, agente de indu- ção). Para ligantes hidrofóbicos, a região de ligação pode ser em am- bos os lados da membrana, mas para ligantes hidrofílicos, particular-
mente ligantes de proteína, a região de ligação será geralmente exter- na a uma membrana celular, a menos que haja um sistema de trans- porte para internalizar o ligante em uma forma no qual está disponível para ligação. Para um receptor intracelular, o polipeptídeo proapoptóti- co induzível ou um transposon ou vetor compreendendo o polipeptídeo proapoptótico induzível pode codificar um peptídeo de sinal e domínio de transmembrana 5′ ou 3′ da sequência do domínio de receptor ou pode ter uma sequência de sinal de ligação a lipídeo 5′ da sequência de domínio de receptor. Onde o domínio do receptor está entre o pep- tídeo de sinal e o domínio da transmembrana, o domínio do receptor será extracelular.
[00718] Anticorpos e subunidades de anticorpos, por exemplo, ca- deia pesada ou leve, particularmente fragmentos, mais particularmente toda ou parte da região variável, ou fusões de cadeia pesada e leve para criar ligação de alta afinidade, podem ser usados como uma regi- ão de ligação ao ligante da presente invenção. Os anticorpos que são contemplados incluem aqueles que são um produto humano expresso ectopicamente, tal como, um domínio extracelular que não desenca- deia uma resposta imune e geralmente não é expresso na periferia (isto é, fora da área do CNS / cérebro). Tais exemplos incluem, porém, não estão limitados a, receptor do fator de crescimento nervoso de baixa afinidade (LNGFR) e proteínas de superfície embrionária (isto é, antígeno carcinoembrionário). Além disso, os anticorpos podem ser preparados contra moléculas haptênicas, que são fisiologicamente aceitáveis, e as subunidades de anticorpos individuais rastreadas quanto à afinidade de ligação. O cDNA codificando as subunidades pode ser isolado e modificado por deleção da região constante, por- ções da região variável, mutagênese da região variável, ou similares, para obter um domínio de proteína de ligação que tenha a afinidade adequada para o ligante. Deste modo, quase qualquer composto hap-
ténico fisiologicamente aceitável pode ser empregado como ligando ou para fornecer um epítopo para o ligante. Em vez de unidades de anti- corpo, os receptores endógenos podem ser empregados, onde a regi- ão ou domínio de ligação é conhecido e há um ligante útil ou conheci- do para a ligação.
[00719] Para multimerizar o receptor, o ligante para a região de li- gação do ligante / domínios do receptor dos polipeptídeos proapoptóti- cos induzíveis pode ser multimérico no sentido de que o ligante pode ter pelo menos dois sítios de ligação, com cada um dos sítios de liga- ção capazes de se ligar a uma região de receptor de ligante (isto é, um ligante tendo um primeiro sítio de ligação capaz de se ligar à região de ligação ao ligante de um primeiro polipeptídeo proapoptótico induzível e um segundo sítio de ligação capaz de se ligar à região de ligação ao ligante de um segundo polipeptídeo proapoptótico induzível, em que as regiões de ligação ao ligante do primeiro e o segundo polipeptídeos proapoptóticos induzíveis são idênticas ou distintas). Assim, como usado aqui, o termo "região de ligação ao ligante multimérico" refere- se a uma região de ligação ao ligante de um polipeptídeo proapoptóti- co induzível da presente invenção que se liga a um ligante multiméri- co. Os ligandos multiméricos da presente invenção incluem ligantes diméricos. Um ligante dimérico da presente invenção pode ter dois sí- tios de ligação capazes de se ligar ao domínio do receptor do ligante. Em certas modalidades, os ligantes multiméricos da presente invenção são um dímero ou oligômero de ordem superior, geralmente não maior que cerca de tetramérico, de pequenas moléculas orgânicas sintéticas, as moléculas individuais sendo tipicamente pelo menos cerca de 150 Da e menos que cerca de 5 kDa, geralmente menos de cerca de 3 kDa. Uma variedade de pares de ligantes e receptores sintéticos pode ser empregada. Por exemplo, em modalidades envolvendo receptores endógenos, FK506 dimérico pode ser usado com um receptor
FKBP12, ciclosporina A dimerizada pode ser usada com o receptor de ciclofilina, estrogênio dimerizado com um receptor de estrogênio, gli- cocorticóides dimerizados com um receptor de glicocorticóide, tetraci- clina dimerizada com o receptor de tetraciclina, vitamina D dimerizada com o receptor de vitamina D, e similares. Ordens alternativamente superiores dos ligantes, por exemplo, triméricas podem ser usadas. Para modalidades envolvendo receptores de ocorrência não natural, por exemplo, subunidades de anticorpos, subunidades de anticorpos modificados, anticorpos de cadeia única compostos por regiões variá- veis de cadeia pesada e leve em tandem, separados por um ligante flexível, ou receptores modificados, e sequências mutadas dos mes- mos e similares, qualquer um de uma grande variedade de compostos pode ser usado. Uma característica significativa das unidades com- preendendo um ligante multimérico da presente invenção é que cada sítio de ligação é capaz de se ligar ao receptor com alta afinidade, e preferivelmente, que são capazes de ser dimerizados quimicamente. Além disso, os métodos estão disponíveis para equilibrar a hidrofobici- dade / hidrofilicidade dos ligantes de modo que eles sejam capazes de se dissolver no soro em níveis funcionais, ainda que se difundam atra- vés das membranas plasmáticas para a maioria das aplicações.
[00720] A ativação de polipeptídeos proapoptóticos induzíveis da presente invenção pode ser realizada através, por exemplo, de dimeri- zação induzida quimicamente (CID) mediada por um agente de indu- ção para produzir uma proteína ou polipeptídeo condicionalmente con- trolado. Os polipeptídeos proapoptóticos da presente invenção não são apenas indutíveis, mas a indução desses polipeptídeos também é reversível, devido à degradação do agente dimerizante lábil ou admi- nistração de um inibidor competitivo monomérico.
[00721] Em certas modalidades, a região de ligação ao ligante compreende um polipeptídeo de proteína 12 de ligação a FK506
(FKBP12). Em certas modalidades, a região de ligação ao ligante compreende um polipeptídeo FKBP12 tendo uma substituição de vali- na (V) por fenilalanina (F) na posição 36 (F36V). Em certas modalida- des, em que uma região de ligação ao ligante compreende um polipep- tídeo FKBP12 tendo uma substituição de valina (V) por fenilalanina (F) na posição 36 (F36V), o agente de indução pode compreender AP1903, um fármaco sintético (nome de índice CAS: ácido 2- piperidinacarboxílico, 1-[(2S)-1-oxo-2-(3,4,5-trimetóxifenil)butil]-, 1,2- etanodiilbis[imino(2-oxo-2,1-etanodiil)óxi-3,1-fenileno[(1R)-3-(3,4- dimetoxifenil)propilideno]]éster, [2S-[1(R*),2R*[S*[S*[1(R*),2R*]]]]]- (9Cl) Número de Registro CAS: 195514-63-7; Fórmula Molecular: C78H98N4O20; Peso Molecular: 1411,65)). Em certas modalidades, em que a região de ligação ao ligante compreende um polipeptídeo FKBP12 tendo uma substituição de valina (V) por fenilalanina (F) na posição 36 (F36V), o agente de indução pode compreender AP20187 (Número de registro CAS: 195514-80- 8 e Fórmula Molecular: C82H107N5O20). Em certas modalidades, o agente de indução é um análogo AP20187, tal como, por exemplo, AP1510. Como usado aqui, os agentes de indução AP20187, AP1903 e AP1510 podem ser usa- dos alternadamente.
[00722] AP1903 API é fabricado pela Alphora Research Inc. e pro- duto de fármaco para injeção AP1903 é fabricado pela Formatech Inc. É formulado como uma solução de 5 mg / mL de AP1903 em uma so- lução a 25% do solubilizante não iônico Solutol HS 15 (250 mg / mL, BASF). Em temperatura ambiente, esta formulação é uma solução límpida ligeiramente amarela. Após a refrigeração, essa formulação sofre uma transição de fase reversível, resultando em uma solução leitosa. Esta transição de fase é revertida com o reaquecimento para a temperatura ambiente. O enchimento é de 2,33 mL em um frasco de vidro de 3 mL (aproximadamente 10 mg de AP1903 para injeção total por frasco). Ao determinar a necessidade de administrar AP1903, os pacientes podem ser, por exemplo, administrados com uma única do- se fixa de AP1903 para injeção (0,4 mg / kg) via infusão IV durante 2 horas, usando um conjunto de infusão não esterilizado com óxido de etileno, não-DEHP. A dose de AP1903 é calculada individualmente para todos os pacientes, e não deve ser recalculada, a menos que o peso corporal flutue em ≥ 10%. A dose calculada é diluída em 100 mL em solução salina normal a 0,9% antes da infusão. Em um estudo de Fase I anterior de AP1903, 24 voluntários saudáveis foram tratados com doses únicas de AP1903 para injeção em níveis de dose de 0,01, 0,05, 0,1, 0,5 e 1,0 mg / kg infundidos IV durante 2 horas. Os níveis plasmáticos de AP1903 foram diretamente proporcionais à dose, com valores médios de Cmax variando de aproximadamente 10-1275 ng / mL sobre a faixa de dose de 0,01-1,0 mg / kg. Após o período inicial de infusão, as concentrações sanguíneas demonstraram uma fase de distribuição rápida, com níveis plasmáticos reduzidos para aproxima- damente 18, 7, e 1% da concentração máxima em 0,5, 2 e 10 horas após a dose, respectivamente. AP1903 para injeção mostrou-se segu- ro e bem tolerado em todos os níveis de dose e demonstrou um perfil farmacocinético favorável. Iuliucci J D, et al., J Clin Pharmacol. 41: 870-9, 2001.
[00723] A dose fixa de AP1903 para injeção usada, por exemplo, pode ser 0,4 mg / kg infundida por via intravenosa durante 2 horas. A quantidade de AP1903 necessária in vitro para a sinalização eficaz de células é de 10-100 nM (1600 Da MW). Isso equivale a 16-160 μg / L ou ˜0,016-1,6 μg / kg (1,6-160 μg / kg). Doses de até 1 mg / kg foram bem toleradas no estudo de Fase I de AP1903 descrito acima. Portan- to, 0,4 mg / kg pode ser uma dose segura e eficaz de AP1903 para este estudo de Fase I em combinação com as células terapêuticas.
[00724] O aminoácido e/ou sequência de ácido nucleico que codifi-
ca a ligação do ligante da presente invenção pode conter a sequência uma ou mais modificações comparada a um aminoácido de tipo selva- gem ou sequência de ácido nucleico. Por exemplo, o aminoácido e/ou sequência de ácido nucleico codificando a região de ligação do ligante da presente invenção pode ser uma sequência otimizada por códons. Uma ou mais modificações podem aumentar a afinidade de ligação de um ligante (por exemplo, um agente de indução) para uma região de ligação ao ligante da presente invenção comparada a um polipeptídeo de tipo selvagem. Alternativamente, ou em adição, uma ou mais modi- ficações podem diminuir a imunogenicidade da região de ligação ao ligante da presente invenção comparada a um polipeptídeo de tipo selvagem. Regiões de ligação de ligante da presente invenção e/ou agentes de indução da presente invenção podem ser ocorrência não natural.
[00725] Polipeptídeos proapoptóticos induzíveis da presente inven- ção compreendem uma região de ligação ao ligante, um ligante e um peptídeo proapoptótico, em que o polipeptídeo proapoptótico induzível não compreende uma sequência não humana. Em certas modalida- des, a sequência não humana compreende um sítio de restrição. O ligante pode compreender qualquer material orgânico ou inorgânico que permite, mediante dimerização da região de ligação do ligante, interação, reticulação, ativação cruzada ou ativação dos polipeptídeos proapoptóticos, de modo que a interação ou ativação dos polipeptí- deos proapoptóticos inicie a apoptose na célula. Em certas modalida- des, o ligante é um polipeptídeo. Em certas modalidades, o ligante é um polipeptídeo compreendendo uma sequência de aminoácido rica em G/S (um ligante "GS"). Em certas modalidades, o ligante é um poli- peptídeo compreendendo a sequência de aminoácido GGGGS (SEQ ID NO: 18028). Em modalidades preferidas, o ligante é um polipeptí- deo e o ácido nucleico codificando o polipeptídeo não contém um sítio de restrição para uma endonuclease de restrição. Os ligantes da pre- sente invenção podem ser de ocorrência não natural.
[00726] Polipeptídeos proapoptóticos induzíveis da presente inven- ção podem ser expressos em uma célula sob a regulação transcricio- nal de qualquer promotor capaz de iniciar e/ou regular a expressão de um polipeptídeo proapoptótico induzível da presente invenção naquela célula. O termo "promotor" como usado aqui se refere a um promotor que atua como o sítio de ligação inicial para a RNA polimerase trans- crever um gene. Por exemplo, polipeptídeos proapoptóticos induzíveis da presente invenção podem ser expressos em uma célula de mamífe- ro sob a regulação transcricional de qualquer promotor capaz de iniciar e/ou regular a expressão de um polipeptídeo proapoptótico induzível da presente invenção em uma célula de mamífero, incluindo, porém, não limitados a, promotores nativos, endógenos, exógenos e heterólo- gos. As células de mamíferos preferidas incluem células humanas. As- sim, polipeptídeos proapoptóticos induzíveis da presente invenção po- dem ser expressos em uma célula humana sob a regulação transcrici- onal de qualquer promotor capaz de iniciar e/ou regular a expressão de um polipeptídeo proapoptótico induzível da presente invenção em uma célula humana, incluindo, não limitados a, um promotor humano ou um promotor viral. Promotores exemplares para expressão em cé- lulas humanas incluem, porém, não estão limitados a, um promotor de gene precoce imediato de citomegalovírus humano (CMV), um promo- tor precoce de SV40, um promotor de β-actina de repetição terminal longa do vírus do sarcoma de Rous, um promotor de insulina de rato e um promotor de gliceraldeído-3-fosfato desidrogenase, cada um dos quais pode ser usado para obter expressão de nível elevado de um polipeptídeo proapoptótico induzível da presente invenção. O uso de outros promotores de fagos virais ou celulares de mamíferos ou bacte- rianos que são bem conhecidos na técnica para alcançar a expressão de um polipeptídeo proapoptótico induzível da presente invenção tam- bém está contemplado, desde que os níveis de expressão sejam sufi- cientes para iniciar a apoptóse em uma célula. Ao empregar um pro- motor com propriedades bem conhecidas, o nível e padrão de expres- são da proteína de interesse após transfecção ou transformação pode ser otimizado.
[00727] A seleção de um promotor que é regulado em resposta a sinais fisiológicos ou sintéticos específicos pode permitir a expressão indutível do polipeptídeo proapoptótico induzível da presente invenção. O sistema ecdisona (Invitrogen, Carlsbad, Califórnia) é um desses sis- temas. Este sistema é projetado para permitir a expressão regulada de um gene de interesse em células de mamíferos. Ele consiste em um mecanismo de expressão rigidamente regulado que não permite virtu- almente nenhuma expressão de um transgene em nível basal, mas indutibilidade acima de 200 vezes. O sistema é baseado no receptor heterodimérico da ecdisona de Drosophila, e quando a ecdisona ou um análogo, tal como, a muristerona A se liga ao receptor, o receptor ativa um promotor para ativar altos níveis de expressão de transgene a jusante, transcritos de mRNA são atingidos. Neste sistema, ambos os monômeros do receptor heterodimérico são expressos constitutiva- mente a partir de um vetor, enquanto o promotor responsivo à ecdiso- na, que dirige a expressão do gene de interesse, está em outro plas- mídeo. A modificação desse tipo de sistema em um vetor de interesse pode, portanto, ser útil. Outro sistema induzível que pode ser útil é o sistema Tet-Off™ ou Tet-On™ (Clontech, Palo Alto, Califórnia) origi- nalmente desenvolvido por Gossen e Bujard (Gossen e Bujard, Proc. Natl. Acad. Sci. USA, 89 : 5547-5551, 1992; Gossen et al., Science, 268: 1766-1769, 1995). Este sistema também permite que altos níveis de expressão gênica sejam regulados em resposta aos derivados de tetraciclina ou tetraciclina, tal como, doxiciclina. No sistema Tet-On™,
a expressão do gene é ativada na presença de doxiciclina, enquanto no sistema Tet-Off™, a expressão do gene é ativada na ausência de doxiciclina. Esses sistemas são baseados em dois elementos regulató- rios derivados do operon de resistência à tetraciclina de E. coli: a se- quência do operador da tetraciclina (à qual se liga o repressor da te- traciclina) e a proteína repressora da tetraciclina. O gene de interesse é clonado em um plasmídeo atrás de um promotor que contém ele- mentos responsivos à tetraciclina presente nele. Um segundo plasmí- deo contém um elemento regulador denominado transativador contro- lado por tetraciclina, que é composto, no sistema Tet-Off™, pelo do- mínio VP16 do vírus herpes simples e do repressor da tetraciclina de tipo selvagem. Assim, na ausência de doxiciclina, a transcrição é cons- titutivamente ativada. No sistema Tet-On™, o repressor de tetraciclina não é tipo selvagem e na presença de doxiciclina ativa a transcrição. Para a produção de vetores de terapia gênica, o sistema Tet-Off™ po- de ser usado para que as células produtoras possam ser desenvolvi- das na presença de tetraciclina ou doxiciclina e prevenir a expressão de um transgene potencialmente tóxico, mas quando o vetor é introdu- zido ao paciente, a expressão do gene seria constitutivamente ativada.
[00728] Em algumas circunstâncias, é desejável regular a expres- são de um transgene em um vetor de terapia gênica. Por exemplo, di- ferentes promotores virais com diferentes intensidades de atividade são utilizados dependendo do nível de expressão desejado. Em célula de mamíferos, o promotor inicial imediato do CMV é frequentemente usado para fornecer forte ativação transcricional. O promotor CMV é revisto em Donnelly, J. J., et al., 1997, Annu. Rev. Immunol. 15: 617-
48. Versões modificadas do promotor CMV que são menos potentes também foram usadas quando níveis reduzidos de expressão do transgene são desejados. Quando a expressão de um transgene em células hematopoiéticas é desejada, promotores retrovirais, como os
LTRs de MLV ou MMTV, são frequentemente usados. Outros promoto- res virais usados dependendo do efeito desejado incluem SV40, RSV LTR, HIV-1 e HIV-2 LTR, promotores de adenovírus tal como da região E1A, E2A, ou MLP, AAV LTR, HSV-TK e vírus sarcoma aviário.
[00729] Em outros exemplos, os promotores podem ser seleciona- dos que são regulados pelo desenvolvimento e são ativos em células diferenciadas particulares. Assim, por exemplo, um promotor pode não estar ativo em uma célula-tronco pluripotente, mas, por exemplo, onde a célula-tronco pluripotente se diferencia em uma célula mais madura, o promotor pode então ser ativado.
[00730] Da mesma forma, os promotores específicos de tecido são usados para efetuar a transcrição em tecidos ou células específicas, de modo a reduzir a toxicidade potencial ou efeitos indesejáveis em tecidos não alvejados. Estes promotores podem resultar em expressão reduzida comparada a um promotor mais forte tal como o promotor CMV, mas também podem resultar em expressão mais limitada e imu- nogenicidade (Bojak, A., et al., 2002, Vaccine. 20: 1975-79; Cazeaux, N., et al., 2002, Vaccine 20: 3322-31). Por exemplo, promotores espe- cíficos de tecido, como o promotor associado a PSA ou calicreína glandular específica da próstata, ou o gene da creatina cinase muscu- lar, podem ser usados quando apropriado.
[00731] Exemplos de promotores específicos de tecido ou específi- cos de diferenciação incluem, porém, não estão limitados a, os seguin- tes: B29 (células B); CD14 (células monocíticas); CD43 (leucócitos e plaquetas); CD45 (células hematopoiéticas); CD68 (macrófagos); desmina (músculo); elastase-1 (células acinares pancreáticas); endo- glina (células endoteliais); fibronectina (células em diferenciação, teci- dos em cura); e Flt-1 (células endoteliais); GFAP (astrócitos).
[00732] Em certas indicações, é desejável ativar a transcrição em momentos específicos após a administração do vetor de terapia de gene. Isso é feito com promotores como aqueles que são reguláveis por hormônio ou citocina. Os promotores responsivos à proteína infla- matória e citocina que podem ser usados incluem o cininogênio K e T (Kageyama et al., (1987) J. Biol. Chem., 262, 2345-2351), c-fos, TNF- alfa, proteína C reativa (Arcone, et al., (1988) Nucl. Acids Res., 16 (8), 3195-3207), haptoglobina (Oliviero et al., (1987) EMBO J., 6, 1905- 1912), amilóide sérico A2, C/EBP alfa, IL-1, IL-6 (Poli e Cortese, (1989) Proc. Nat'l Acad. Sei. USA, 86, 8202-8206), Complemento C3 (Wilson et al., (1990) Mol. Cell. Biol., 6181-6191), IL-8, alfa-1 glicopro- teína ácida (Prowse e Baumann, (1988) Mol Cell Biol, 8, 42-51), alfa-1 antitripsina, lipoproteína lipase (Zechner et al., Mol. Cell. Biol., 2394- 2401, 1988), angiotensinogênio (Ron, et al., (1991) Mol. Cell. Biol., 2887-2895), fibrinogênio, c-jun (indutível por forbol ésteres, TNF-alfa, radiação UV, ácido retinoico e peróxido de hidrogênio), colagenase (induzida por forbol ésteres e ácido retinoico), metalotioneína (metal pesado e glicocorticóide induzível), Estromelisina (induzida por forbol éster, interleucina-1 e EGF), alfa-2 macroglobulina e alfa-1 antiquimio- tripsina. Outros promotores incluem, por exemplo, SV40, MMTV, vírus da imunodeficiência humana (MV), vírus Moloney, ALV, vírus Epstein Barr, vírus Rous Sarcoma, actina humana, miosina, hemoglobina e creatina.
[00733] Prevê-se que qualquer um dos promotores acima, isolada- mente ou em combinação com outro pode ser útil dependendo da ação desejada. Promotores e outros elementos reguladores são sele- cionados de forma que sejam funcionais nas células ou tecidos dese- jados. Além disso, esta lista de promotores não deve ser considerada exaustiva ou limitante; outros promotores são usados em conjunto com os promotores e métodos aqui descritos. Estratégia "knock-down" de Células T Blindadas
[00734] As células T da presente invenção podem ser geneticamen-
te modificadas para realçar seu potencial terapêutico. Alternativamen- te, ou em adição, células T da presente invenção podem ser modifica- das para torná-las menos sensíveis a pontos de verificação imunológi- cos e/ou metabólicos. Modificações desse tipo "blindam" as células T da presente invenção, que, após uma modificação, podem ser referi- das aqui como células T "blindadas". Células T blindadas da presente invenção podem ser produzidas por, por exemplo, bloqueio e/ou dilui- ção de sinais específicos de ponto de verificação endógeno liberados às células T (isto é, inibição de ponto de verificação) dentro do micro- ambiente imunossupressor tumoral, por exemplo.
[00735] Em algumas modalidades, uma célula T blindada da pre- sente invenção é derivada de uma célula T, uma célula NK, uma célula progenitora hematopoiética, uma célula T derivada de sangue periféri- co (PB) (incluindo uma célula T isolada ou derivada de sangue perifé- rico mobilizado por G-CSF), ou uma célula T derivada do sangue do cordão umbilical (UCB). Em algumas modalidades, uma célula T blin- dada da presente invenção compreende um ou mais dentre um recep- tor de ligante quimérico (CLR compreendendo uma estrutura de prote- ína, um anticorpo, um ScFv ou um mimético de anticorpo) / receptor de antígeno quimérico (CAR compreendendo uma estrutura de proteína, um anticorpo, um ScFv, ou um mimético de anticorpo), uma CARTirina (um CAR compreendendo uma Centirina), e/ou um VCAR (um CAR compreendendo um VHH camelídeo ou um único domínio VH) da pre- sente invenção. Em algumas modalidades, uma célula T blindada da presente invenção compreende um polipeptídeo proapoptótico induzí- vel compreendendo (a) uma região de ligação ao ligante, (b) um ligan- te, e (c) um polipeptídeo de caspase 9 truncado, em que o polipeptí- deo proapoptótico induzível não compreende uma sequência não hu- mana. Em algumas modalidades, a sequência não humana é um sítio de restrição. Em algumas modalidades, o polipeptídeo caspase induzí-
vel de região de ligação ao ligante compreende um polipeptídeo de proteína 12 de ligação a FK506 (FKBP12). Em algumas modalidades, a sequência de aminoácido de polipeptídeo de proteína 12 de ligação a FK506 (FKBP12) compreende uma modificação na posição 36 da sequência. Em algumas modalidades, a modificação é uma substitui- ção de valina (V) por fenilalanina (F) na posição 36 (F36V). Em algu- mas modalidades, uma célula T blindada da presente invenção com- preende uma sequência exógena. Em algumas modalidades, a se- quência exógena compreende uma sequência codificando uma proteí- na terapêutica. Proteínas terapêuticas exemplares podem ser proteí- nas nucleares, citoplasmáticas, intracelulares, transmembrana, ligadas à superfície celular ou secretadas. Proteínas terapêuticas exemplares expressas pela célula T blindada podem modificar uma atividade da célula T blindada ou podem modificar uma atividade de uma segunda célula. Em algumas modalidades, uma célula T blindada da presente invenção compreende um gene ou um marcador de seleção. Em al- gumas modalidades, uma célula T blindada da presente invenção compreende um cassete de expressão de gene sintético (também aqui como um construto de transgene induzível).
[00736] Em algumas modalidades, uma célula T da presente inven- ção é modificada para silenciar ou reduzir a expressão de um ou mais gene (s) que codifica os receptor (es) de sinais de ponto de verificação inibidores para produzir uma célula T blindada da presente invenção. Exemplos de sinais de ponto de verificação inibitório incluem, porém, não estão limitados a, um ligante PD-L1 que se liga a um receptor PD- 1 em uma célula CAR-T da presente invenção ou uma citocina TGFβ que se liga a um receptor TGFβRII em uma célula CAR-T. Receptores de sinais de ponto de verificação inibitório são expressos na superfície de uma célula ou dentro do citoplasma de uma célula T. Silenciar ou reduzir a expressão do gene que codifica o receptor do sinal de ponto de verifiação inibidor resulta em uma perda de expressão de proteínas dos receptores de ponto de verificação inibitório na superfície ou den- tro do citoplasma de uma célula T blindada da presente invenção.
As- sim, as células T blindadas da presente invenção que têm expressão silenciada ou reduzida de um ou mais genes que codificam um recep- tor de ponto de verificação inibitório são resistentes, não receptivas ou insensíveis aos sinais de ponto de verificação.
A resistência da célula T blindada ou sensibilidade diminuída aos sinais de ponto de verifica- ção inibitório realça o potencial terapêutico da célula T blindada na presença desses sinais de ponto de verificação inibitório.
Os sinais de ponto de verificação inibitório incluem, porém, não estão limitados a, os exemplos listados na Tabela 1. Sinais de ponto de verificação inibi- tório exemplares que podem ser silenciados em uma célula T blindada da presente invenção incluem, porém, não estão limitados a, PD-1 e TGFβRII.
Tabela 1. Sinais do Ponto de Verificação Inibitório Exemplar (e proteí- nas que induzem a imunossupressão). O CSR da presente invenção pode compreender um endodomínio de qualquer uma das proteínas desta tabela.
Nome Completo Abreviação SEQ ID NO: Proteína de morte celular programada 1 PD1 14643-14644 receptor 1 do Fator β de crescimento TGFβR1 14645 transformante receptor 2 do Fator β de crescimento TGFβR2 14646 transformante Imunoglobulina de célula T e domínio TIM3 14647 de mucina contendo 3 Imunoglobulina de célula T e domínio LAG3 14648 de mucina contendo gene 3 de ativação de linfócito 3 Proteína 4 e linfócito T citotóxico CTLA4 14649 Atenuador de linfócito B e T BTLA 14650
Nome Completo Abreviação SEQ ID NO: Receptor semelhante à imunoglobulina KIR 14651 de célula exterminadora Receptor adrenérgico alfa-2A A2aR 14652 Domínio de imunoglobulina tipo V con- VISTA 14653 tendo supressor de ativação de célula T Imunoreceptor de célula T com domí- 14654 nios Ig e ITIM TIGIT Ligante 1 de morte celular programada B7H1 14655 1 ouPD-L1 Ligante 2 de morte celular programada B7DC ou 14656 1 PD-L2 Antígeno CD80 de ativação de linfócito B7-1 ou 14657 T CD80 antígeno CD86 de ativação de linfócito B7-2 ou 14658 T CD86 antígeno CD160 CD160 14659 receptor 1 semelhante à imunoglobulina 14660 associada a leucócito LAIR1 Imunoglobulina de célula T e domínio TIM4 or 14661 de mucina contendo proteína 4 TIMD4 Receptor 2B4 de célula exterminadora 2B4 or 14662 natural CD244 Complexo tipo I de Maior Histocompati- 14663 bilidade MHC I Complexo tipo II de maior Histocompa- tibilidade MHC II Receptor de desidratase de 2- metilcitrato putativo PDH1R Receptor de domínio 1 de Imunoglobu- lina de célula T e mucina TIM1R Receptor de domínio 4 de imunoglobu- lina de célula T e mucina TIM4R
Nome Completo Abreviação SEQ ID NO: Receptor B7-H3 Receptor B7H3R ou CD176 Receptor B7-H4 B7H4R Receptor de transcrição (ILT)3 tipo imu- noglobulina ILT3R fosfoinositídeo 3-cinase, subunidade al- 14664 fa PI3K alfa fosfoinositídeo 3-cinase, subunidade 14665 gama PI3K gama Não receptor de Tirosina-proteína fosfa- SHP2 ou 14666 tase tipo 11 PTPN11 Proteína fosfatase 2, subunidade gama PP2A gama 14667 Proteína fosfatase 2, subunidade beta PP2A beta 14668 Proteína fosfatase 2, subunidade delta PP2A delta 14669 Proteína fosfatase 2, subunidade épsi- PP2A épsi- 14670 lon lon Proteína fosfatase 2, subunidade alfa PP2A alfa 14671 Receptor de célula T, subunidade alfa TCR alfa 14672 Receptor de célula T, subunidade beta TCR beta 14673 Receptor de célula T, subunidade zeta TCR zeta 14674 Receptor de célula T, subunidade CD3 TCR CD3 14675 épsilon épsilon Receptor de célula T, subunidade CD3 TCR CD3 14676 gama gama Receptor de célula T, subunidade CD3 TCR CD3 14677 delta delta Cluster de Diferenciação 28 CD28 14678 Galectinas Galectinas Galectina 9 Galectina 9 14679 Caixa 1 do Grupo de Alta Mobilidade HMGB1 14680 Arginase 1 ARG1 14681 Prostaglandina-Endoperóxido Sintase 1 PTGS1 14682
Nome Completo Abreviação SEQ ID NO: Prostaglandina-Endoperóxido Sintase 2 PTGS2 14683 Mucina 1, associada com a Superfície 14684 Celular MUC1 Mucina 2, formação de Gel/Muco Oli- 14685 gomérico MUC2 Mucina 3A, associada com a Superfície 14686 Celular MUC3A Mucina 3B, associada com a Superfície 14687 Celular MUC3B Mucina 4, associada com a Superfície 14688 Celular MUC4 Mucina 5AC, formação de Gel/Muco 14689 Oligomérico MUC5AC Mucina 5B, formação de Gel/Muco Oli- 14690 gomérico MUC5B Mucina 6, formação de Gel/Muco Oli- 14691 gomérico MUC6 Mucina 7, Secretada MUC7 14692 Mucina 8 MUC8 Mucina 12, associada com a Superfície 14693 Celular MUC12 Mucina 13, associada com a Superfície 14694 Celular MUC13 Mucina 15, associada com a Superfície 14695 Celular MUC15 Mucina 16, associada com a Superfície 14696 Celular MUC16 Mucina 17, associada com a Superfície 14697 Celular MUC17 Mucina 19, Oligomérica MUC19 14698 Mucina 20, associada com a Superfície 14699 Celular MUC20 Mucina 21, associada com a Superfície 14700 Celular MUC21
Nome Completo Abreviação SEQ ID NO: Mucina 22 MUC22 14701 Indoleamina 2,3-Dioxigenase 1 IDO1 14702 Indoleamina 2,3-Dioxigenase 2 IDO2 14703 Ligante Coestimulador de Célula T In- 14704 duzível ICOSLG ROS Proto-Oncogene 1, Receptor de 14705 Tirosina Cinase ROS1 Fator de necrose de tumor de Receptor 4-1BB, 14706 de Superfamília membro 9 CD137, ILA ou TNFRSF9 Ligante 4-1BB 4-1BB-L 14707 Gene relacionado com a família TNFR 14708 Induzido por glicocorticoide GITR Ligante de gene relacionado com a fa- 14709 mília TNFR Induzido por glicocorticoide GITRL
[00737] Em algumas modalidades, uma célula T da presente inven- ção é modificada para silenciar ou reduzir a expressão de um ou mais genes codificando proteínas intracelulares envolvidas em sinalização do ponto de verificação para produzir uma célula T blindada da pre- sente invenção. A atividade de uma célula T da presente invenção po- de ser realçada direcionando qualquer proteína de sinalização intrace- lular envolvida emu ma via de sinalização do ponto de verificação, desse modo obtendo a inibição do ponto de verificação ou inerferência com uma ou mais vias do ponto de verificação. Proteínas de sinaliza- ção intracelular envolvidas em sinalização do ponto de verificação in- cluem, mas não estão limitadas a, proteínas de sinalização intracelular exemplar listadas na Tabela 2.
Tabela 2. Proteínas de Sinalização Intracelular Exemplar. Nome Completo Abreviação SEQ ID NO: fosfoinositídeo 3-cinase, subunidade al- PI3K alfa 14710 fa fosfoinositídeo 3-cinase, subunidade PI3K gama 14711 gama não receptor tipo 11 de Tirosina- SHP2 or 14712 proteína fosfatase PTPN11 Proteína fosfatase 2, subunidade gama PP2A gama 14713 Proteína fosfatase 2, subunidade beta PP2A beta 14714 Proteína fosfatase 2, subunidade delta PP2A delta 14715 Proteína fosfatase 2, subunidade épsi- PP2A épsi- 14716 lon lon Proteína fosfatase 2, subunidade alfa PP2A alfa 14717 RAC-alfa serina/treonina-proteína ci- AKT ou 14718 nase PKB Tirosina-proteína cinase ZAP-70 ZAP70 14719 Proteína de domínio contendo sequên- proteínas cia de aminoácido (KIEELE) contendo domínio KIEELE- atanogene 6 associado a BCL2 Bat3, Bag6 14720 ou Scythe linfoma de célula B extra large Bcl-xL 14721 Proteína A1 relacionada a Bcl-2 Bfl-1 ou 14722 BCL2A1
[00738] Em algumas modalidades, uma célula T da presente inven- ção é modificada para silenciar ou reduzir a expressão de um ou mais genes codificando um fator de transcrição que impede a eficácia de uma terapia para produzir uma célula T blindada da presente inven- ção. A atividade de células T blindadas pode ser realçada ou modula- da silenciando ou reduzindo a expressão (ou reprimindo uma função) de um fator de transcrição que impede a eficácia de uma terapia. Fato- res de transcrição exemplares que podem ser modificados para silen-
ciar ou reduzir a expressão ou reprimir uma função dos mesmos inclu- em, mas não estão limitados a, os fatores de transcrição exemplares listados na Tabela 3. Por exemplo, expressão de um gene FOXP3 po- de ser silenciada ou reduzida em uma célula T blindada da presente invenção para prevenir ou reduzir a formação de células T CAR regu- latórias T (células CAR-Treg), a expressão ou atividade das quais po- de reduzir a eficácia de uma terapia. Tabela 3. Fatores de transcrição exemplares. Nome Completo Abreviação SEQ ID NO: homeocaixa neuroprotetor dependente ADNP 14723 da atividade homeocaixa ADNP 2 ADNP2 14724 Proteína 1 de ligação a AE AEBP1 14725 Proteína 2 de ligação a AE AEBP2 14726 membro 1 da família AF4/FMR2 AFF1 14727 Membro 2 da família AF4/FMR2 AFF2 14728 Membro 3 da família AF4/FMR2 AFF3 14729 Membro 4 da família AF4/FMR2 AFF4 14730 fator de transcrição 1 contendo gancho AHCTF1 14731
AT receptor de hidrocarboneto de arila AHR 14732 repressor do receptor de aril- AHRR 14733 hidrocarboneto regulador autoimune AIRE 14734 Fator de transcrição de gancho AT AKNA 14735 Homeocaixa 1 ALX ALX1 14736 Homeocaixa 3 ALX ALX3 14737 Homeocaixa 4 ALX ALX4 14738 repetição de ancirina e domínio dedo ANKZF1 14739 de zinco contendo 1 subunidade zeta 1 do complexo 5 da AP5Z1 14740 proteína relacionada com o adaptador receptor de androgênio AR 14741
Nome Completo Abreviação SEQ ID NO: homeocaixa arginina cinquenta ARGFX 14742 Proteína 35 de ativação da Rho ARHGAP35 14743 GTPase Domínio 1A de interação rico em AT ARID1A 14744 Domínio 1B de interação rico em AT ARID1B 14745 Domínio 2 de interação rico em AT ARID2 14746 Domínio 3A de interação rico em AT ARID3A 14747 Domínio 3B de interação rico em AT ARID3B 14748 Domínio 3C de interação rico em AT ARID3C 14749 Domínio 4A de interação rico em AT ARID4A 14750 Domínio 4B de interação rico em AT ARID4B 14751 Domínio 5A de interação rico em AT ARID5A 14752 Domínio 5B de interação rico em AT ARID5B 14753 translocador nuclear de receptor de hi- ARNT 14754 drocarboneto de arila translocador 2 nuclear de receptor de ARNT2 14755 hidrocarboneto de arila tipo de translocador nuclear de receptor ARNTL 14756 de hidrocarboneto de arila tipo 2 de translocador nuclear de recep- ARNTL2 14757 tor de hidrocarboneto de arila homeocaixa relacionado com sem aris- ARX 14758 tal fator 1 de transcrição bHLH da família ASCL1 14759 achaete-scute fator 2 de transcrição bHLH da família ASCL2 14760 achaete-scute fator 3 de transcrição bHLH da família ASCL3 14761 achaete-scute fator 4 de transcrição bHLH da família ASCL4 14762 achaete-scute fator 5 de transcrição bHLH da família ASCL5 14763 achaete-scute
Nome Completo Abreviação SEQ ID NO: ash 1 tipo (ausente, pequeno, ou ho- ASH1L 14764 meótico) (Drosophila) ash 2 tipo (ausente, pequeno, ou ho- ASH2L 14765 meótico) (Drosophila) fator 1 de transcrição de ativação ATF1 14766 fator 2 de transcrição de ativação ATF2 14767 fator 3 de transcrição de ativação ATF3 14768 fator 4 de transcrição de ativação ATF4 14769 fator 5 de transcrição de ativação ATF5 14770 fator 6 e transcrição de ativação 6 ATF6 14771 fator 6 beta de transcrição de ativação 6 ATF6B 14772 fator 7 de transcrição de ativação ATF7 14773 fator 1 de transcrição de bHLH atonal ATOH1 14774 fator 7 de transcrição de bHLH atonal ATOH7 14775 fator 8 de transcrição de bHLH atonal ATOH8 14776 ligado à síndrome de X de talassemia ATRX 14777 alfa/retardo mental ataxina 7 ATXN7 14778 homologia 1 de BTB e CNC, fator 1 de BACH1 14779-14780 transcrição do zíper de leucina básica BACH2 14781 Domínio BTB e homólogo 2 de CNC homeocaixa 1 tipo BarH BARHL1 14782 homeocaixa 2 tipo BarH BARHL2 14783 Homeocaixa 1 de BARX BARX1 14784 Homeocaixa 2 de BARX BARX2 14785 Fator de Transcrição Tipo ATF de Zíper Batf 14786 de Leucina Básica, fator de transcrição de zíper de leucina BATF 14786 básica, tipo ATF fator de transcrição de zíper de leucina BATF2 14787 básica, ATF-tipo 2
Nome Completo Abreviação SEQ ID NO: fator de transcrição de zíper de leucina BATF3 14788 básica, ATF-tipo 3 Homólogo bobby sox (Drosophila) BBX 14789 CLL de célula B /linfoma 11A BCL11A 14790 CLL de célula B /linfoma 11B BCL11B 14791 CLL de célula B /linfoma 3 BCL3 14792 CLL de célula B /linfoma 6 BCL6 14793 CLL de célula B /linfoma 6, membro B BCL6B 14794 Fator 1 de transcrição associado a BCLAF1 14795 BCL2 membro da família hélice-alça-hélice BHLHA15 14796 básica a15 membro da família hélice-alça-hélice BHLHA9 14797 básica a9 Domínio de hélice-alça-hélice básica BHLHB9 14798 contendo, classe B, 9 membro da família hélice-alça-hélice BHLHE22 14799 básica e22 membro da família hélice-alça-hélice BHLHE23 14800 básica e23 membro da família hélice-alça-hélice BHLHE40 14801 básica e40 membro da família hélice-alça-hélice BHLHE41 14802 básica e41 Fator de Ligação ao Domínio I Regula- Blimp-1 14803 tório Positivo do Gene Beta-Interferon proteína 2 morfogenética óssea BMP2 14804 basonuclina 1 BNC1 14805 basonuclina 2 BNC2 14806 membro 1 da família bolA BOLA1 14807 membro 2 da família bolA BOLA2 14808 membro 3 da família bolA BOLA3 14809
Nome Completo Abreviação SEQ ID NO: fator de transcrição de dedo PHD de BPTF 14810 bromodomínio câncer de mama 1 BRCA1 14811 homeocaixa específico do cérebro BSX 14812 estrutura de leitura aberta 194 do cro- C20orf194 14813 mossoma 20 ativador 1 de transcrição de ligação à CAMTA1 14814 calmodulina ativador 2 de transcrição de ligação à CAMTA2 14815 calmodulina proteína 1 estável ao calor regulada por CARHSP1 14816 cálcio dedo de zinco 1 de rícino CASZ1 14817 fator de ligação ao núcleo, subunidade CBFB 14818 beta domínio tipo bobina contendo 79 CCDC79 14819 ciclo tipo 5 de divisão celular CDC5L 14820 homeocaixa 1 tipo caudal CDX1 14821 homeocaixa 2 tipo caudal CDX2 14822 homeocaixa 4 tipo caudal CDX4 14823 CCAAT/proteína alfa de ligação aumen- CEBPA 14824 tada CCAAT/proteína beta de ligação au- CEBPB 14825 mentada CCAAT/proteína delta de ligação au- CEBPD 14826 mentada CCAAT/proteína épsilon de ligação au- CEBPE 14827 mentada CCAAT/proteína gama de ligação au- CEBPG 14828 mentada CCAAT/proteína zeta de ligação au- CEBPZ 14829 mentada proteína T do centrômero CENPT 14830 síntese da ceramida 3 CERS3 14831
Nome Completo Abreviação SEQ ID NO: síntese da ceramida 6 CERS6 14832 fosfoproteína 1 de manutenção do ali- CHAMP1 14833 nhamento do cromossoma repressor transcricional capícua CIC 14834 proteína dedo de zinco 1 de interação CIZ1 14835 com CDKN1A regulador do ciclo circadiano CLOCK 14836 subunidade 4 do complexo de transcri- CNOT4 14837 ção CCR4-NOT Região do cromossoma CPX, candidato CPXCR1 14838 1 homólogo 1 regulador de cromatina CRAMP1 14839 grampeada proteína 1 de ligação ao elemento res- CREB1 14840 ponsivo a cAMP proteína 3 de ligação ao elemento res- CREB3 14841 ponsivo a cAMP tipo 2 de proteína 3 de ligação ao ele- CREB3L1 14842 mento responsivo a cAMP tipo 2 de proteína 3 de ligação ao ele- CREB3L2 14843 mento responsivo a cAMP tipo 3 de proteína 3 de ligação ao ele- CREB3L3 14844 mento responsivo a cAMP tipo 4 de proteína 3 de ligação ao ele- CREB3L4 14845 mento responsivo a cAMP proteína de ligação ao elemento res- CREB5 14846 ponsivo a cAMP 5 proteína de ligação a CREB CREBBP 14847 tipo 2 de proteína de ligação ao elemen- CREBL2 14848 to responsivo a cAMP fator regulatório de CREB3 CREBRF 14849 fator de transcrição CREB/ATF bZIP CREBZF 14850 modulador de elemento responsivo a CREM 14851 cAMP
Nome Completo Abreviação SEQ ID NO: homeocaixa cone-bastonete CRX 14852 proteína 1 nuclear rica em cisteína- CSRNP1 14853 serina proteína 2 nuclear rica em cisteína- CSRNP2 14854 serina proteína 3 nuclear rica em cisteína- CSRNP3 14855 serina fator de ligação a CCCTC (proteína de- CTCF 14856 do de zinco) tipo fator de ligação a CCCTC CTCFL 14857 homeocaixa 1 semelhante a corte CUX1 14858-14859 homeocaixa 2 semelhante a corte CUX2 14860 proteína 1 dedo de CXXC CXXC1 14861 fator 1 de transcrição da família dachs- DACH1 14862 hund fator de transcrição da família dachs- DACH2 14863 hund Sítio D de promotor de proteína de liga- DBP 14864 ção ao promotor de albumina (caixa D de albumina) homeocaixa 1 de cébro em desenvolvi- DBX1 14865 mento homeocaixa 2 de cérebro em desenvol- DBX2 14866 vimento proteína 2 de ligação ao DNA específico DDB2 14867 do dano Transcrição 3 induzível de dano ao DDIT3 14868
DNA DEAF1, fator de transcriçãor DEAF1 14869 homeocaixa 1 não distal DLX1 14870 homeocaixa 2 não distal DLX2 14871 homeocaixa 3 não distal DLX3 14872 homeocaixa 4 não distal DLX4 14873 homeocaixa 5 não distal DLX5 14874
Nome Completo Abreviação SEQ ID NO: homeocaixa 6 não distal DLX6 14875 proteína 1 associada à DNA metiltrans- DMAP1 14876 ferase 1 homeocaixa 1 de diencéfa- DMBX1 14877 lo/mesencéfalo fator 1 de transcrição relacionado com DMRT1 14878 doublesex e mab-3 fator 2 de transcrição relacionada com DMRT2 14879 doublesex e mab-3 fator 3 de transcrição relacionado com DMRT3 14880 doublesex e mab-3 Família A1 tipo DMRT DMRTA1 14881 Família A2 tipo DMRT DMRTA2 14882 Família B tipo DMRT com terminal 1-C DMRTB1 14883 rico em prolina Família C1 tipo DMRT DMRTC1 14884 Família C1B tipo DMRT like família C1B DMRTC1B 14884 Família C2 tipo DMRT DMRTC2 14885 Fator 1 de ranscrição tipo myb de liga- DMTF1 14886 ção à ciclina D membro C1 da família de proteína de DNAJC1 14887 choque térmico (Hsp40) DnaJ membro C2 da família de proteína de DNAJC2 14888 choque térmico (Hsp40) DnaJ membro C21 da família de proteína de DNAJC21 14889 choque térmico (Hsp40) DnaJ DNA (citosina-5-)-metiltransferase 1 DNMT1 14890 DNA (citosina-5-)-metiltransferase 3 alfa DNMT3A 14891 DNA (citosina-5-)-metiltransferase 3 be- DNMT3B 14892 ta DNA (citosina-5-)-semelhante à metil- DNMT3L 14893 transferase 3 dedos 1 de PHD duplos DPF1 14894 dedos 2 de PHD duplos double PHD DPF2 14895
Nome Completo Abreviação SEQ ID NO: dedos 3 de PHD duplos DPF3 14896 homeocaixa relacionado com pares di- DPRX 14897 vergentes sub-regulador de transcrição 1 DR1 14898 Proteína 1 associada a DR1 DRAP1 14899 homeocaixa dos gânglios da raiz dorsal DRGX 14900 homeocaixa 4 duplo DUX4 14901 homeocaixa 4 duplo tipo 9 DUX4L9 14902 homeocaixa A duplo DUXA 14903 Fator de transcrição E2F 1 E2F1 14904 Fator de transcrição E2F 2 E2F2 14905 Fator de transcrição E2F 3 E2F3 14906 Fator de transcrição E2F 4 E2F4 14907 Fator de transcrição E2F 5 E2F5 14908 Fator de transcrição E2F 6 E2F6 14909 Fator de transcrição E2F 7 E2F7 14910 Fator de transcrição E2F 8 E2F8 14911 Fator de transcrição E4F 1 E4F1 14912 fator de célula B precoce 1 EBF1 14913 fator de célula B precoce 2 EBF2 14914 fator de célula B precoce 3 EBF3 14915 fator de célula B precoce 4 EBF4 14916 resposta de crescimento precoce 1 EGR1 14917 resposta de crescimento precoce 2 EGR2 14918 resposta de crescimento precoce 3 EGR3 14919 resposta de crescimento precoce 4 EGR4 14920 fator homólogo ets EHF 14921 Fator 1 tipo E74 (fator de transcrição de ELF1 14922 domínio ets) fator 2 E74-tipo (fator de transcrição de ELF2 14923 domínio ets) fator 3 E74-tipo (fator de transcrição de ELF3 14924 domínio ets, específico do epitélio)
Nome Completo Abreviação SEQ ID NO: Fator 4 tipo E74 (fator de transcrição de ELF4 14925 domínio ets) Fator 5 tipo E74 (fator de transcrição de ELF5 14926 domínio ets) ELK1, membro da família oncogene ELK1 14927
ETS ELK3, Proteína do domínio ETS (Prote- ELK3 14928 ína acessória SRF 2) ELK4, Proteína do domínio ETS (Prote- ELK4 14929 ína acessória SRF 1) 1 contendo domínio tipo ELM2 e ELMSAN1 14930 Myb/SANT homeocaixa de espiráculos vazios 1 EMX1 14931 homeocaixa de espiráculos vazios 2 EMX2 14932 homeocaixa gravado 1 EN1 14933 homeocaixa gravado 2 EN2 14934 enolase 1, (alfa) ENO1 14935 eomesodermina EOMES 14936 proteína 1 de domínio PAS endotelial EPAS1 14937 Fator repressor Ets2 ERF 14938 homólogo de oncogene E26 do vírus de ERG 14939-14940 eritrobastose aviária v-ets receptor de estrogênio 1 ESR1 14941 receptor de estrogênio 2 (ER beta) ESR2 14942 receptor alfa relacionado ao estrogênio ESRRA 14943 receptor beta relacionado ao estrogênio ESRRB 14944 receptor gama relacionado ao estrogê- ESRRG 14945 nio ESX homeocaixa 1 ESX1 14946 homólogo 1 de oncogene do vírus E26 ETS1 14947 de eritrobastose aviária v-ets homólogo 2 de oncogene do vírus E26 ETS2 14948 de eritrobastose aviária v-ets
Nome Completo Abreviação SEQ ID NO: variante ets 1 ETV1 14949 variante ets 2 ETV2 14950 variante ets 3 ETV3 14951 semelhante à variante ets 3 ETV3L 14952 variante ets 4 ETV4 14953 variante ets 5 ETV5 14954 variante ets 6 ETV6 14955 variante ets 7 ETV7 14956 homeocaixa 1 mesmo ignorado EVX1 14957 homeocaixa 2 mesmo ignorado 2 EVX2 14958 realçador de subunidade de complexo 2 EZH1 14959 repressiva de policomb zeste 1 realçador de subunidade de complexo 2 EZH2 14960 repressiva de policomb zeste 2 família com similaridade de sequência FAM170A 14961 170 membro A Fator de transcrição bHLH tipo Fer3 FERD3L 14962 FEV (família oncogene ETS) FEV 14963 dedo de zinco 1 família FEZ FEZF1 14964 dedo de zinco 2 família FEZ FEZF2 14965 fator de transcrição bHLH específico de FIGLA 14966 foliculogênese dedo de zinco 1 de interação de FLT3 FIZ1 14967 Fli-1 proto-oncogene, fator de transcri- FLI1 14968 ção ETS homólogo de oncogene viral de osteos- FOS 14969 sarcoma de murino FBJ homólogo B de oncogene viral de os- FOSB 14970 teossarcoma de murino hFBJ Antígeno 1 semelhante a FOS FOSL1 14971 Antígeno 2 semelhante a FOS FOSL2 14972 caixa cabeça de forquilha A1 FOXA1 14973 caixa cabeça de forquilha A2 FOXA2 14974
Nome Completo Abreviação SEQ ID NO: caixa cabeça de forquilha A3 FOXA3 14975 caixa cabeça de forquilha B1 FOXB1 14976 caixa cabeça de forquilha B2 FOXB2 14977 caixa cabeça de forquilha C1 FOXC1 14978 caixa cabeça de forquilha C2 FOXC2 14979 caixa cabeça de forquilha D1 FOXD1 14980 caixa cabeça de forquilha D2 FOXD2 14981 caixa cabeça de forquilha D3 FOXD3 14982 caixa cabeça de forquilha D4 FOXD4 14983 caixa cabeça de forquilha D4 - tipo 1 FOXD4L1 14984 caixa cabeça de forquilha D4-tipo 3 FOXD4L3 14985 caixa cabeça de forquilha D4-tipo 4 FOXD4L4 14986 caixa cabeça de forquilha D4-tipo 5 FOXD4L5 14987 caixa cabeça de forquilha D4-tipo 6 FOXD4L6 14988 caixa cabeça de forquilha E1 FOXE1 14989 caixa cabeça de forquilha E3 FOXE3 14990 caixa cabeça de forquilha F1 FOXF1 14991 caixa cabeça de forquilha F2 FOXF2 14992 caixa cabeça de forquilha G1 FOXG1 14993 caixa cabeça de forquilha H1 FOXH1 14994 caixa cabeça de forquilha I1 FOXI1 14995 caixa cabeça de forquilha I2 FOXI2 14996 caixa cabeça de forquilha I3 FOXI3 14997 caixa cabeça de forquilha J1 FOXJ1 14998 caixa cabeça de forquilha J2 FOXJ2 14999 caixa cabeça de forquilha J3 FOXJ3 15000 caixa cabeça de forquilha K1 FOXK1 15001 caixa cabeça de forquilha K2 FOXK2 15002 caixa cabeça de forquilha L1 FOXL1 15003 caixa cabeça de forquilha L2 FOXL2 15004 caixa cabeça de forquilha M1 FOXM1 15005 caixa cabeça de forquilha N1 FOXN1 15006
Nome Completo Abreviação SEQ ID NO: caixa cabeça de forquilha N2 FOXN2 15007 caixa cabeça de forquilha N3 FOXN3 15008 caixa cabeça de forquilha N4 FOXN4 15009 caixa cabeça de forquilha O1 FOXO1 15010 caixa cabeça de forquilha O3 FOXO3 15011 caixa cabeça de forquilha O4 FOXO4 15012 caixa cabeça de forquilha O6 FOXO6 15013 caixa cabeça de forquilha P1 FOXP1 15014 caixa cabeça de forquilha P2 FOXP3 15015 caixa cabeça de forquilha P3 FOXP4 15016 caixa cabeça de forquilha P4 FOXQ1 15017 caixa cabeça de forquilha Q1 FOXR1 15018 caixa cabeça de forquilha R1 FOXR2 15019 caixa cabeça de forquilha R2 FOXS1 15020 caixa cabeça de forquilha S1 FOXP3 15021 proteína 1 de ligação a elemento muito FUBP1 15022 a montante proteína 3 de ligação a elemento muito FUBP3 15023 a montante (FUSE) Subunidade alfa de fator de transcrição GABPA 15024 de proteína de ligação a GA subunidade 1 beta, de fator de transcri- GABPB1 15025 ção de proteína de ligação a GA subunidade 2 beta, de fator de transcri- GABPB2 15026 ção de proteína de ligação a GA Proteína 1 de ligação a GATA (fator 1 GATA1 15027 de transcrição de globina) Proteína 2 de ligação a GATA GATA2 15028 Proteína 3 de ligação a GATA GATA3 15029 Proteína 4 de ligação a GATA GATA4 15030 Proteína 5 de ligação a GATA GATA5 15031 Proteína 6 de ligação a GATA GATA6 15032
Nome Completo Abreviação SEQ ID NO: Domínio dedo de zinco GATA contendo GATAD1 15033 1 Domínio dedo de zinco GATA contendo GATAD2A 15034 2A Domínio dedo de zinco GATA contendo GATAD2B 15035 2B homeocaixa 1 do cérebro de gastrula- GBX1 15036 ção homeocaixa 2 do cérebro de gastrula- GBX2 15037 ção Fator 2 de ligação ao DNA de sequên- GCFC2 15038 cia rica em GC homólogo 1 ausente de células gliais GCM1 15039 homólogo 2 ausente de células gliais GCM2 15040 repressor de transcrição 1 independen- GFI1 15041 te de fator de crescimento repressor de transcrição 1B indepen- GFI1B 15042 dente de fator de crescimento Dedo de zinco 1 da família GLI GLI1 15043 Dedo de zinco 2 da família GLI GLI2 15044 Dedo de zinco 3 da família GLI GLI3 15045 Dedo de zinco 4 da família GLI GLI4 15046 Dedo de zinco 1 da família GLIS GLIS1 15047 Dedo de zinco 2 da família GLIS GLIS2 15048 Dedo de zinco 3 da família GLIS GLIS3 15049 proteína 1 de ligação a elemento modu- GMEB1 15050 latório glicocorticoide proteína 2 de ligação a elemento modu- GMEB2 15051 latório glicocorticoide gon-4-tipo (C. elegans) GON4L 15052 Fator 1 de transcrição tipo grainyhead GRHL1 15053 Fator 2 de transcrição tipo grainyhead GRHL2 15054 Fator 3 de transcrição tipo grainyhead GRHL3 15055
Nome Completo Abreviação SEQ ID NO: Homeocaixa goosecoide GSC 15056 Homeocaixa goosecoide 2 GSC2 15057 Homeocaixa GS 1 GSX1 15058 Homeocaixa 2 GS GSX2 15059 Fator de transcrição geral IIi GTF2I 15060 Fator de transcrição geral IIIA GTF3A 15061 Proteína dedo de zinco 1 induzível por GZF1 15062
GDNF derivados do coração e da crista neural HAND1 15063 expressos 1 derivados do coração e da crista neural HAND2 15064 expressos 2 Fator 1 de transcrição da caixa HMG HBP1 15065-15066 homeocaixa altamente divergente HDX 15067 fator de transcrição de bHLH helt HELT 15068 fator 1 de transcrição bHLH da família HES1 15069-15070 hes fator 2 de transcrição bHLH da família HES2 15071 hes fator 3 de transcrição bHLH da família HES3 15072 hes fator 4 de transcrição bHLH da família HES4 15073 hes fator 5 de transcrição bHLH da família HES5 15074 hes fator 6 de transcrição bHLH da família HES6 15075 hes fator 7 de transcrição bHLH da família HES7 15076 hes HESX homeocaixa 1 HESX1 15077 fator de transcrição bHLH da família re- HEY1 15078 lacionada com hes com motivo 1
YRPW
Nome Completo Abreviação SEQ ID NO: fator de transcrição bHLH da família re- HEY2 15079 lacionada com hes com motivo 2 YRPW fator de transcrição bHLH da família re- HEYL 15080 lacionada com hes com motivo similar a
YRPW homeocaixa hematopoieticamente ex- HHEX 15081 pressa hipermetilada em câncer 1 HIC1 15082 hipermetilada em câncer 2 HIC2 15083 fator 1 induzível por hipoxia, subunida- HIF1A 15084 de alfa (fator de transcrição básica héli- ce-alça-hélice) fator 3 induzível por hipoxia, subunida- HIF3A 15085 de alfa fator de transcrição histona H4 HINFP 15086 proteína 1 de ligação aumentada tipo 1 HIVEP1 15087 do vírus da imunodeficiência humana Proteína 2 de ligação aumentada tipo 1 HIVEP2 15088 do vírus da imunodeficiência humana Proteína 3 de ligação aumentada tipo 1 HIVEP3 15089 do vírus da imunodeficiência humana HKR1, membro da família dedo de zin- HKR1 15090 co GLI-Kruppel Fator de leucemia hepática HLF 15091 Fator de transcrição tipo helicase HLTF 15092 Homeocaixa do tipo H2.0 HLX 15093 Homeocaixa contendo 1 HMBOX1 15094 grupo 20A de alta mobilidade HMG20A 15095 Grupo 20B de alta mobilidade HMG20B 15096 Gancho 1 AT do grupo de alta mobili- HMGA1 15097 dade Gancho 2 AT do grupo de alta mobili- HMGA2 15098 dade Caixa HMG contendo 3 HMGXB3 15099
Nome Completo Abreviação SEQ ID NO: Caixa HMG contendo 4 HMGXB4 15100 Homeocaixa 1 da família H6 HMX1 15101 Homeocaixa 2 da família H6 HMX2 15102 Homeocaixa 3 da família H6 HMX3 15103-15104 Homeocaixa A de HNF1 HNF1A 15105 Homeocaixa B de HNF1 HNF1B 15106 fator nuclear de hepatócito 4 alfa HNF4A 15107 fator nuclear de hepatócito 4 gama HNF4G 15108 ribonúcleoproteína nuclear heterogênea HNRNPK 15109
K codificação de zíper de hemeocaixa e HOMEZ 15110 leucina Homeocaixa HOP HOPX 15111 homeocaixa A1 HOXA1 15112 homeocaixa A10 HOXA10 15113 homeocaixa A11 HOXA11 15114 homeocaixa A13 HOXA13 15115 homeocaixa A2 HOXA2 15116 homeocaixa A3 HOXA3 15117 homeocaixa A4 HOXA4 15118 homeocaixa A5 HOXA5 15119 homeocaixa A6 HOXA6 15120 homeocaixa A7 HOXA7 15121 homeocaixa A9 HOXA9 15122 homeocaixa B1 HOXB1 15123 homeocaixa B13 HOXB13 15124 homeocaixa B2 HOXB2 15125 homeocaixa B3 HOXB3 15126 homeocaixa B4 HOXB4 15127 homeocaixa B5 HOXB5 15128 homeocaixa B6 HOXB6 15129 homeocaixa B7 HOXB7 15130
Nome Completo Abreviação SEQ ID NO: homeocaixa B8 HOXB8 15131 homeocaixa B9 HOXB9 15132 homeocaixa C10 HOXC10 15133 homeocaixa C11 HOXC11 15134 homeocaixa C12 HOXC12 15135 homeocaixa C13 HOXC13 15136 homeocaixa C4 HOXC4 15137 homeocaixa C5 HOXC5 15138 homeocaixa C6 HOXC6 15139 homeocaixa C8 HOXC8 15140 homeocaixa C9 HOXC9 15141 homeocaixa D1 HOXD1 15142 homeocaixa D10 HOXD10 15143 homeocaixa D11 HOXD11 15144 homeocaixa D12 HOXD12 15145 homeocaixa D13 HOXD13 15146 homeocaixa D3 HOXD3 15147 homeocaixa D4 HOXD4 15148 homeocaixa D8 HOXD8 15149 homeocaixa D9 HOXD9 15150 fator de transcrição de choque térmico 1 HSF1 15151 fator de transcrição de choque térmico 2 HSF2 15152 fator de transcrição de choque térmico 4 HSF4 15153 membro 5 da família de fator de trans- HSF5 15154 crição de choque térmico família de fator de transcrição de cho- HSFX1 15155 que térmico, 1 ligado a X fator de transcrição de choque térmico, HSFY1 15156 1 ligado a Y fator de transcrição de choque térmico, HSFY2 15156 2 ligado a Y inibidor de 1 ligando DNA, proteína de ID1 15157 hélice-alça-hélice negativa dominante
Nome Completo Abreviação SEQ ID NO: inibidor de 2 ligando DNA, proteína de ID2 15158 hélice-alça-hélice negativa dominante inibidor de 3 ligando DNA, proteína de ID3 15159 hélice-alça-hélice negativa dominante inibidor de 4 ligando DNA, proteína de ID4 15160 hélice-alça-hélice negativa dominante interferon, proteína 16 gama-induzível IFI16 15161 dedo de zinco 1 da família IKAROS IKZF1 15162 dedo de zinco 2 da família IKAROS IKZF2 15163 dedo de zinco 3 da família IKAROS IKZF3 15164 dedo de zinco 4 da família IKAROS IKZF4 15165 dedo de zinco 5 da família IKAROS IKZF5 15166 1 associado à insulinoma INSM1 15167 2 associado à insulinoma INSM2 15168 fator regulatório de interferon 1 IRF1 15169 fator regulatório de interferon 2 IRF2 15170 fator regulatório de interferon 3 IRF3 15171 fator regulatório de interferon 4 IRF4 15172 fator regulatório de interferon 5 IRF5 15173 fator regulatório de interferon 6 IRF6 15174 fator regulatório de interferon 7 IRF7 15175 fator regulatório de interferon 8 IRF8 15176 fator regulatório de interferon 9 IRF9 15177 homeocaixa iroquois 1 IRX1 15178 homeocaixa iroquois 2 IRX2 15179 homeocaixa iroquois 3 IRX3 15180 homeocaixa iroquois 4 IRX4 15181 homeocaixa iroquois 5 IRX5 15182 homeocaixa iroquois 6 IRX6 15183 Homeocaixa 1 ISL LIM ISL1 15184 Homeocaixa 2 ISL LIM ISL2 15185 homeocaixa específica do intestino ISX 15186
Nome Completo Abreviação SEQ ID NO: 2 contendo domínio de interação rico JARID2 15187 em jumonji e AT dedo de zinco 1 JAZF JAZF1 15188 Proteína 2 de dimerização de Jun JDP2 15189 proto-oncogene jun JUN 15190 proto-oncogene jun B JUNB 15191 proto-oncogene jun D JUND 15192 K(lisina) acetiltransferase 5 KAT5 15193 lisina acetiltransferase 6A KAT6A 15194 lisina acetiltransferase 6B KAT6B 15195 lisina acetiltransferase 7 KAT7 15196 lisina acetiltransferase 8 KAT8 15197 fator 1 modulador de canal de potássio KCMF1 15198 proteína 3 de interação de canal fecha- KCNIP3 15199 do por voltagem de potássio lisina desmetilase 2A KDM2A 15200 lisina desmetilase 5A KDM5A 15201 lisina desmetilase 5B KDM5B 15202 lisina desmetilase 5C KDM5C 15203 lisina desmetilase 5D KDM5D 15204 Proteína reguladora de união tipo KH KHSRP 15205 KIAA1549 KIAA1549 15206 Fator 1 tipo Kruppel (eritroide) KLF1 15207 Fator 10 tipo Kruppel KLF10 15208 Fator 11 tipo Kruppel KLF11 15209 Fator 12 tipo Kruppel KLF12 15210 Fator 13 tipo Kruppel KLF13 15211 Fator 14 tipo Kruppel KLF14 15212 Fator 15 tipo Kruppel KLF15 15213 Fator 16 tipo Kruppel KLF16 15214 Fator 17 tipo Kruppel KLF17 15215 Fator 2 tipo Kruppel KLF2 15216
Nome Completo Abreviação SEQ ID NO: Fator 3 tipo Kruppel (básico) KLF3 15217 Fator 4 tipo Kruppel (intestino) KLF4 15218 Fator 5 tipo Kruppel (intestinal) KLF5 15219 Fator 6 tipo Kruppel KLF6 15220 Fator 7 tipo Kruppel (ubiquitous) KLF7 15221 Fator 8 tipo Kruppel KLF8 15222 Fator 9 tipo Kruppel KLF9 15223 lisina metiltransferase 2A KMT2A 15224 lisina metiltransferase 2B KMT2B 15225 lisina metiltransferase 2C KMT2C 15226 lisina metiltransferase 2E KMT2E 15227 l(3)mbt - tipo 1 (Drosophila) L3MBTL1 15228 l(3)mbt-tipo 2 (Drosophila) L3MBTL2 15229 l(3)mbt-tipo 3 (Drosophila) L3MBTL3 15230 l(3)mbt-tipo 4 (Drosophila) L3MBTL4 15231 homeocaixa 1 joaninha LBX1 15232 homeocaixa 2 joaninha LBX2 15233 receptor nuclear dependente ligante LCOR 15234 semelhante ao receptor nuclear depen- LCORL 15235 dente ligante fator 1 de ligação aumentada linfoide LEF1 15236 hmeocaixa vinte de leucina LEUTX 15237 Homeocaixa 1 LIM LHX1 15238 Homeocaixa 2 LIM LHX2 15239 Homeocaixa 3 LIM LHX3 15240 Homeocaixa 4 LIM LHX4 15241 Homeocaixa 5 LIM LHX5 15242 Homeocaixa 6 LIM LHX6 15243 Homeocaixa 8 LIM LHX8 15244 Homeocaixa 9 LIM LHX9 15245 Fator 1 de transcrição de homeocaixa LMX1A 15246 LIM, alfa
Nome Completo Abreviação SEQ ID NO: Fator 1 de transcrição de Homeocaixa LMX1B 15247 LIM, beta LOC730110 LOC73011 0 proteína 1 de interação de repetição ri- LRRFIP1 15248 ca em leucina (em FLII) proteína 2 de interação de repetição ri- LRRFIP2 15249 ca em leucina (em FLII) reativo ao anticorpo Ly1 LYAR 15250 regulador 1 de hematopoiese associado LYL1 15251 à leukemia linfoblástica silenciador de transposon espermato- MAEL 15252 gênico de redemoinho homólogo de oncogene de fibrossarco- MAF 15253 ma musculoaponeurótico aviário v-maf homólogo MAF1, regulador negativo de MAF1 15254 RNA polimerase III homólogo A de oncogene de fibrossar- MAFA 15255-15256 coma musculoaponeurótico aviário v- maf homólogo B de oncogene de fibrossar- MAFB 15257 coma musculoaponeurótico aviário v- maf homólogo F de oncogene de fibrossar- MAFF 15258 coma musculoaponeurótico aviário v- maf homólogo G de oncogene de fibrossar- MAFG 15259 coma musculoaponeurótico aviário v- maf homólogo K de oncogene de fibrossar- MAFK 15260 coma musculoaponeurótico aviário v- maf matrina 3 MATR3 15261 fator X associado a MYC MAX 15262
Nome Completo Abreviação SEQ ID NO: proteína dedo de zinco associada a MAZ 15263
MYC proteína 1 de domínio de ligação a me- MBD1 15264 til-CpG proteína 2 de domínio de ligação a me- MBD2 15265 til-CpG proteína 3 de domínio de ligação a me- MBD3 15266 til-CpG proteína 3 de domínio de ligação a me- MBD3L1 15267 til-CpG - tipo 1 proteína 3 de domínio de ligação a me- MBD3L2 15268 til-CpG -tipo 2 DNA glicosilase de domínio 4 de ligação MBD4 15269 a metil-CpG proteína 5 de domínio de ligação a me- MBD5 15270 til-CpG proteína 6 de domínio de ligação a me- MBD6 15271 til-CpG regulador 3 de emenda tipo cegamento MBNL3 15272 muscular locus complexo MDS1 e EVI1 MECOM 15273 proteína 2 de ligação a metil-CpG MECP2 15274 fator 2A realçador de miócito MEF2A 15275 fator 2B realçador de miócito MEF2B 15276 fator 2C realçador de miócito MEF2C 15277 fator 2D realçador de miócito MEF2D 15278 homeocaixa 1 Meis MEIS1 15279 homeocaixa 2 Meis MEIS2 15280 homeocaixa 3 Meis MEIS3 15281 pseudogene 1 de homeocaixa 3 Meis MEIS3P1 15282 pseudogene 2 de homeocaixa 3 Meis MEIS3P2 15283 homeocaixa 1 da mesênquima MEOX1 15284 homeocaixa 2 da mesênquima MEOX2 15285
Nome Completo Abreviação SEQ ID NO: fator 1 de transcrição bHLH posterior ao MESP1 15286 mesoderma fator 2 de transcrição bHLH posterior ao MESP2 15287 mesoderma Proteína de dimerização MAX, MGA MGA 15288-15289 Regulador transcricional MIER1 MIER1 15290 Membro 2 da família MIER MIER2 15291 Membro 3 da família MIER MIER3 15292 Proteína 1 de ligação a MIS18 MIS18BP1 15293 fator de transcrição associado à microf- MITF 15294 talmia homeocaixa tipo pareada de mistura MIXL1 15295 homeocaixa moicano MKX 15296 leucemia de linhagem mista ou mieloi- MLLT1 15297 de/linfoide; translocada para, 1 leucemia de linhagem mista ou mieloi- MLLT10 15298 de/linfoide; translocada para, 10 leucemia de linhagem mista ou mieloi- MLLT11 15299 de/linfoide; translocada para, 11 leucemia de linhagem mista ou mieloi- MLLT3 15300 de/linfoide; translocada para, 3 leucemia de linhagem mista ou mieloi- MLLT4 15301 de/linfoide; translocada para, 4 leucemia de linhagem mista ou mieloi- MLLT6 15302 de/linfoide; translocada para, 6 Proteína de dimerização MAX, MLX MLX 15303 Proteína de interação MLX MLXIP 15304 Semelhante à proteína de interação MLXIPL 15305
MLX Repressor transcricional de rede MAX MNT 15306 homeocaixa 1 de neurônio motor e pân- MNX1 15307 creas musculina MSC 15308
Nome Completo Abreviação SEQ ID NO: mesogenina 1 MSGN1 15309 homeocaixa 1 msh MSX1 15310 homeocaixa 2 msh MSX2 15311 1 associado à metástase MTA1 15312 família 1 associada à metástase mem- MTA2 15313 bro 2 família 1 associada à metástase mem- MTA3 15314 bro 3 fator 1 de transcrição regulatória de me- MTF1 15315 tal fator 2 de transcrição de ligação a ele- MTF2 15316 mento de resposta de metal proteína 1 de dimerização MAX MXD1 15317 proteína 3 de dimerização MAX MXD3 15318 proteína 4 de dimerização MAX MXD4 15319 integrator 1 MAX, proteína de dimeriza- MXI1 15320 ção homólogo de oncogene viral de mielo- MYB 15321 blastose aviária v - myb homólogo de oncogene viral de mielo- MYBL1 15322 blastose aviária v - myb - tipo 1 homólogo de oncogene viral de mielo- MYBL2 15323 blastose aviária v-myb - tipo 2 homólogo de oncogene viral de mielo- MYC 15324 blastose aviária v-myc homólogo derivado de carcinoma de MYCL 15325 pulmão de oncogene viral de mielocito- matose aviária v-myc pseudogene 1 MYCL MYCLP1 15326 homólogo derivado de neuroblastoma MYCN 15327 de oncogene viral de mielocitomatose aviária v-myc fator 5 miogênico MYF5 15328 fator 6 miogênico MYF6 15329
Nome Completo Abreviação SEQ ID NO: mioneurina MYNN 15330 diferenciação 1 miogênica MIOD1 15331 miogenina (fator 4 miogênico) MIOG 15332 fator regulatório de mielina MYRF 15333 domínio 1 SWIRM e MPN, semelhante MYSM1 15334 a Myb fator 1 de transcrição de mielina MYT1 15335-15336 semelhante ao fator 1 de transcrição de MYT1L 15337 mielina dedo de zinco 1 mieloide MZF1 15338 homeocaixa Nanog NANOG 15339 Homeocaixa vizinha NANOG NANOGNB 15340 pseudogene 1 homeocaixa Nanog NANOGP1 15341 pseudogene 8 homeocaixa Nanog NANOGP8 15342 coativador 1 de receptor nuclear NCOA1 15343 coativador 2 de receptor nuclear NCOA2 15344 coativador 3 de receptor nuclear NCOA3 15345 coativador 4 de receptor nuclear NCOA4 15346 coativador 5 de receptor nuclear NCOA5 15347 coativador 6 de receptor nuclear NCOA6 15348 coativador 7 de receptor nuclear NCOA7 15349 correpressor 1 de receptor nuclear NCOR1 15350 correpressor 2 de receptor nuclear NCOR2 15351 diferenciação neuronal 1 NEUROD1 15352 diferenciação neuronal 2 NEUROD2 15353 diferenciação neuronal 4 NEUROD4 15354 diferenciação neuronal 6 NEUROD6 15355 neurogenina 1 NEUROG1 15356 neurogenina 2 NEUROG2 15357 neurogenina 3 NEUROG3 15358 fator nuclear de células T 5 ativadas, NFAT5 15359 responsivo à tonicidade
Nome Completo Abreviação SEQ ID NO: fator nuclear de células T ativadas,1 NFATC1 15360 dependente de calcineurina, citoplásmi- ca fator nuclear de células T ativadas, 2 NFATC2 15361 dependente de calcineurina, citoplásmi- ca fator nuclear de células T ativadas, 3 NFATC3 15362 dependente de calcineurina, citoplásmi- ca fator nuclear de células T ativadas, 4 NFATC4 15363 dependente de calcineurina, citoplásmi- ca fator nuclear, eritroide 2 NFE2 15364 fator nuclear, eritroide 2 tipo 1 NFE2L1 15365 fator nuclear, eritroide 2 tipo 2 NFE2L2 15366 fator nuclear, eritroide 2 tipo 3 NFE2L3 15367 fator nuclear I/A NFIA 15368 fator nuclear I/B NFIB 15369 fator nuclear I/C (Fator de transcrição NFIC 15370 de ligação a CCAAT) fator nuclear, regulado por interleucina NFIL3 15371 3 fator nuclear I/X (Fator de transcrição de NFIX 15372 ligação a CCAAT) fator nuclear de realçador de gene de NFKB1 15373 polipeptídeo leve Kappa em células B 1 fator nuclear de realçador de gene de NFKB2 15374 polipeptídeo leve Kappa em células B 2 (p49/p100) fator nuclear de realçador de gene de NFKBIA 15375 polipeptídeo leve Kappa em inibidor de células B, alfa
Nome Completo Abreviação SEQ ID NO: fator nuclear de realçador de gene de NFKBIB 15376 polipeptídeo leve Kappa em inibidor de células B, beta fator nuclear de realçador de gene de NFKBID 15377 polipeptídeo leve Kappa em inibidor de células B, delta fator nuclear de realçador de gene de NFKBIE 15378 polipeptídeo leve Kappa em inibidor de células B, épsilon fator nuclear de realçador de gene de NFKBIL1 15379 polipeptídeo leve Kappa’ em inibidor de células B - tipo 1 fator nuclear de realçador de gene de NFKBIZ 15380 polipeptídeo leve Kappa em inibidor de células B, zeta fator nuclear relacionado à proteína de NFRKB 15381 ligação kappa B fator de transcrição nuclear, Ligação 1 NFX1 15382 de caixa X fator de transcrição nuclear, Ligação de NFXL1 15383 caixa X - tipo 1 fator de transcrição nuclear Y subuni- NFYA 15384 dade alfa fator de transcrição nuclear Y subuni- NFYB 15385 dade beta fator de transcrição nuclear Y subuni- NFYC 15386 dade gama hélice-alça-hélice 1 agnóstica NHLH1 15387 hélice-alça-hélice 2 agnóstica NHLH2 15388 Fator de repressão NFKB NKRF 15389 Homeocaixa 1 NK1 NKX1-1 15390 Homeocaixa 2 NK1 NKX1-2 15391 Homeocaixa 1 NK2 NKX2-1 15392 Homeocaixa 2 NK2 NKX2-2 15393
Nome Completo Abreviação SEQ ID NO: Homeocaixa 3 NK2 NKX2-3 15394 Homeocaixa 4 NK2 NKX2-4 15395 Homeocaixa 5 NK2 NKX2-5 15396 Homeocaixa 6 NK2 NKX2-6 15397 Homeocaixa 8 NK2 NKX2-8 15398 Homeocaixa 1 NK3 NKX3-1 15399 Homeocaixa 2 NK3 NKX3-2 15400 Homeocaixa 1 NK6 NKX6-1 15401 Homeocaixa 2 NK6 NKX6-2 15402 Homeocaixa 3 NK6 NKX6-3 15403 homeocaixa de oogênese NOBOX NOBOX 15404 regulador de replicação de DNA seme- NOC3L 15405 lhante a NOC3 homólogo 4 associado ao complexo nú- NOC4L 15406 cleolar ligação de octâmero, contend domínio NONO 15407 não-POU homeocaixa notocorda NOTO 15408 proteína 1 de domínio PAS neuronal NPAS1 15409 proteína 2 de domínio PAS neuronal NPAS2 15410 proteína 3 de domínio PAS neuronal NPAS3 15411 proteína 4 de domínio PAS neuronal NPAS4 15412 subfamília de receptor nuclear 0 grupo NR0B1 15413 B membro 1 subfamília de receptor nuclear 0 grupo NR0B2 15414 B membro 2 subfamília de receptor nuclear 1 grupo NR1D1 15415 D membro 1 subfamília de receptor nuclear 1 grupo NR1D2 15416 D membro 2 subfamília de receptor nuclear 1 grupo NR1H2 15417 H membro 2
Nome Completo Abreviação SEQ ID NO: subfamília de receptor nuclear 1 grupo NR1H3 15418 H membro 3 subfamília de receptor nuclear 1 grupo NR1H4 15419 H membro 4 subfamília de receptor nuclear 1 grupo I NR1I2 15420 membro 2 subfamília de receptor nuclear 1 grupo I NR1I3 15421 membro 3 subfamília de receptor nuclear 2 grupo NR2C1 15422 C membro 1 subfamília de receptor nuclear 2 grupo NR2C2 15423 C membro 2 subfamília de receptor nuclear 2 grupo NR2E1 15424 E membro 1 subfamília de receptor nuclear 2 grupo NR2E3 15425 E membro 3 subfamília de receptor nuclear 2 grupo NR2F1 15426 F membro 1 subfamília de receptor nuclear 2 grupo NR2F2 15427 F membro 2 subfamília de receptor nuclear 2 grupo NR2F6 15428 F membro 6 subfamília de receptor nuclear 3 grupo NR3C1 15429 C membro 1 subfamília de receptor nuclear 3 grupo NR3C2 15430 C membro 2 subfamília de receptor nuclear 4 grupo NR4A1 15431 A membro 1 subfamília de receptor nuclear 4 grupo NR4A2 15432 A membro 2 subfamília de receptor nuclear 4 grupo NR4A3 15433 A membro 3 subfamília de receptor nuclear 5 grupo NR5A1 15434 A membro 1
Nome Completo Abreviação SEQ ID NO: subfamília de receptor nuclear 5 grupo NR5A2 15435 A membro 2 subfamília de receptor nuclear 6 grupo NR6A1 15436 A membro 1 fator respiratório nuclear 1 NRF1 15437-15438 ziper de leucina de retina neural NRL 15439 fator 1 de transcrição de oligodendrócito OLIG1 15440 fator 2 de transcrição de linhagem de OLIG2 15441 oligodendrócito fator 3 de transcrição de oligodendrócito OLIG3 15442 homeocaixa 1 de um corte ONECUT1 15443 homeocaixa 2 de um corte ONECUT2 15444 homeocaixa 3 de um corte ONECUT3 15445 fator 1 de transcrição relacionado com OSR1 15446 salto ímpar fator 2 de transcrição relacionado com OSR2 15447 salto ímpar homeocaixa ortopedia OTP 15448 homeocaixa 1 de ortodentículo OTX1 15449 homeocaixa 2 de ortodentículo OTX2 15450 dedo de zinco 1 semelhante a ovo OVOL1 15451 dedo de zinco 2 semelhante a ovo OVOL2 15452 dedo de zinco 3 semelhante a ovo OVOL3 15453 poli(ADP-ribose) polimerase 1 PARP1 15454 membro 12 da família poli(ADP-ribose) PARP12 15455 polimerase dedo de zinco 1 contendo gancho PATZ1 15456 POZ/BTB e AT PRKC, apoptose, WT1, regulator PAWR 15457 caixa pareada 1 PAX1 15458 caixa pareada 2 PAX2 15459 caixa pareada 3 PAX3 15460 caixa pareada 4 PAX4 15461
Nome Completo Abreviação SEQ ID NO: caixa pareada 5 PAX5 15462 caixa pareada 6 PAX6 15463 caixa pareada 7 PAX7 15464 caixa pareada 8 PAX8 15465 caixa pareada 9 PAX9 15466 proteína 1 de ligação a PAX3 e PAX7 PAXBP1 15467 polibromo 1 PBRM1 15468 homeocaixa 1 de leukemia pré-célula B PBX1 15469 homeocaixa 2 de leukemia pré-célula B PBX2 15470 homeocaixa 3 de leukemia pré-célula B PBX3 15471 homeocaixa 4 de leukemia pré-célula B PBX4 15472 proteína 1 de ligação poli(rC) PCBP1 15473 proteína 2 de ligação poli(rC) PCBP2 15474 proteína 3 de ligação poli(rC) PCBP3 15475 proteína 4 de ligação poli(rC) PCBP4 15476 dedo 6 de anel do grupo policomb PCGF6 15477 homeocaixa 1 pancreática e duodenal PDX1 15478-15479 3 expresso paternalmente PEG3 15480 receptor de progesterona PGR 15481 proibitina PHB 15482 proibitina 2 PHB2 15483 proteína 20 dedo de PHD PHF20 15484 proteína 5A de dedo de PHD PHF5A 15485 homeocaixa 2a tipo pareada PHOX2A 15486 homeocaixa 2b tipo pareada PHOX2B 15487 fator 1 de transcrição de homeodomínio PHTF1 15488 putativo fator 2 de transcrição de homeodomínio PHTF2 15489 putativo homeodomínio 1 tipo paareado PITX1 15490 homeodomínio 2 tipo pareado PITX2 15491 homeodomínio 3 tipo pareado PITX3 15492
Nome Completo Abreviação SEQ ID NO: homeocaixa 1 PBX/em nó 1 PKNOX1 15493 homeocaixa 2 PBX/em nó 1 PKNOX2 15494 dedo de zinco PLAG1 PLAG1 15495 dedo de zinco 1 tipo PLAG1 PLAGL1 15496 dedo de zinco 2 tipo PLAG1 PLAGL2 15497 pleckstrina PLEK 15498 dedo de zinco de leucemia promielocíti- PLZF 15499 ca elemento transponível pogo com domí- POGZ 15500 nio ZNF homeocaixa 1 classe 1 POU POU1F1 15501 fator 1 de associação de classe 2 POU POU2AF1 15502 homeocaixa 1 classe 2 POU POU2F1 15503 homeocaixa 2 classe 2 POU POU2F2 15504 homeocaixa 3 classe 2 POU POU2F3 15505 homeocaixa 1 classe 3 POU POU3F1 15506 homeocaixa 2 classe 3 POU POU3F2 15507 homeocaixa 3 classe 3 POU POU3F3 15508 homeocaixa 4 classe 3 POU POU3F4 15509 homeocaixa 1 classe 4 POU POU4F1 15510 homeocaixa 2 classe 4 POU POU4F2 15511 homeocaixa 3 classe 4 POU POU4F3 15512 Homeocaixa 1 classe 5 POU POU5F1 15513 Homeocaixa 1B classe 5 POU POU5F1B 15514 Fator 2 de transcrição de classe 5 de POU5F2 15515 domínio POU Homeocaixa 1 classe 6 POU POU6F1 15516 Homeocaixa 2 classe 6 POU POU6F2 15517 receptor alfa ativado de proliferador de PPARA 15518 peroxissoma receptor delta ativado de proliferador de PPARD 15519 peroxissoma
Nome Completo Abreviação SEQ ID NO: receptor gama ativado de proliferador PPARG 15520 de peroxissoma semelhante à subunidade 13 regulatória PPP1R13L 15521 de proteína fosfatase 1 Domínio PR 1 PRDM1 15522 Domínio PR 10 PRDM10 15523 Domínio PR 11 PRDM11 15524 Domínio PR 12 PRDM12 15525 Domínio PR 13 PRDM13 15526 Domínio PR 14 PRDM14 15527 Domínio PR 15 PRDM15 15528 Domínio PR 16 PRDM16 15529 Domínio PR 2 PRDM2 15530 Domínio PR 4 PRDM4 15531 Domínio PR 5 PRDM5 15532 Domínio PR 6 PRDM6 15533 Domínio PR 7 PRDM7 15534 Domínio PR 8 PRDM8 15535 Domínio PR 9 PRDM9 15536 Ligação de elemento regulatório de pro- PREB 15537 lactina Homeocaixa 1 tipo pareado PROP PROP1 15538 homeocaixa 1 prospero PROX1 15539 homeocaixa 2 prospero PROX2 15540 homeocaixa 1 relacionada com pareada PRRX1 15541 homeocaixa 2 relacionada com pareada PRRX2 15542 componente 1 paraspeckle PSPC1 15543 fator 1a de transcrição específica do PTF1A 15544 pâncreas proteína A de ligação a elemento rico PURA 15545 em purina proteína B de ligação a elemento rico PURB 15546 em purina
Nome Completo Abreviação SEQ ID NO: proteína G de ligação a elemento rico PURG 15547 em purina receptor alfa de ácido retinoico RARA 15548 receptor beta de ácido retinoico RARB 15549 receptor gama de ácido retinoico RARG 15550 homeocaixa de dobra neural anterior e RAX 15551-15552 de retina homeocaixa 2 de dobra neural anterior RAX2 15553 e de retina dedo de zinco KRAB associado a RB RBAK 15554 Proteína 22 de motivo de ligação a RNA RBM22 15555 proteína de ligação de sinal de recom- RBPJ 15556 binação para região J kappa de imuno- globulina proteína de ligação a sinal de recombi- RBPJL 15557 nação para semelhante à região J kap- pa de imunoglobulina domínio 1 tipo dedo de anel e CCCH RC3H1 15558 domínios 2 tipo dedo de anel e CCCH RC3H2 15559 correpressor 1 REST RCOR1 15560 correpressor 2 REST RCOR2 15561 correpressor 3 REST RCOR3 15562 Homólogo de oncogene viral de reticu- REL 15563 loendoteliose aviária v-rel Homólogo A de oncogene viral de reti- RELA 15564 culoendoteliose aviária v-rel Homólogo B de oncogene viral de reti- RELB 15565 culoendoteliose aviária v-rel repetições de dipeptídeo de ácido argi- RERE 15566 nina-glutâmico (RE) Fator de transcrição de silenciamento REST 15567 RE1 fator regulatório X1 RFX1 15568 fator regulatório X2 RFX2 15569
Nome Completo Abreviação SEQ ID NO: fator regulatório X3 RFX3 15570 fator regulatório X4 RFX4 15571 fator regulatório X5 RFX5 15572 fator regulatório X6 RFX6 15573 fator regulatório X7 RFX7 15574 membro 8 da família RFX, sem domínio RFX8 15575 de ligação ao RFX DNA proteína contend ancirina associada ao RFXANK 15576 fator X regulatório proteína associada ao fator X regulató- RFXAP 15577 rio membro 1 da família de homeocaixa RHOXF1 15578 Rhox membro 2 da família homeocaixa Rhox RHOXF2 15579 membro 2B da família homeocaixa RHOXF2B 15580 Rhox fusão L-myc reorganizada RLF 15581-15582 Receptor A órfão relacionado a RAR RORA 15583 Receptor B órfão relacionado a RAR RORB 15584 Receptor C órfão relacionado a RAR RORC 15585 receptor nuclear órfão gama relaciona- RORgT 15586 do ao receptor de ácido retinoico proteína 1 do elemento responsivo a ras RREB1 15587 fator de transcrição 1 relacionado ao RUNX1 15588 runt fator de transcrição 1 relacionado ao RUNX1T1 15589 runt; translocada para, 1 (relacionado com a ciclina D) fator de transcrição 2 relacionado ao RUNX2 15590 runt fator de transcrição 3 relacionado ao RUNX3 15591 runt receptor alfa retinoide X RXRA 15592
Nome Completo Abreviação SEQ ID NO: receptor beta de retinoide X RXRB 15593 receptor gama de retinóide X RXRG 15594 fator 1 de transcrição tipo spalt SALL1 15595 fator 2 de transcrição tipo spalt SALL2 15596 fator 3 de transcrição tipo spalt SALL3 15597 fator 4 de transcrição tipo spalt SALL4 15598 homeocaixa 1 SATB SATB1 15599 homeocaixa 2 SATB SATB2 15600 proteína associada à ciclina A fase S na SCAPER 15601
ER dedo de zinco 1 família scratch SCRT1 15602 dedo de zinco 2 família scratch SCRT2 15603 fator de transcrição bHLH de escleraxia SCX 15604 homeocaixa SEBOX SEBOX 15605 proteína 1 de ligação a SET SETBP1 15606 prolina de fator de emenda/rica em glu- SFPQ 15607 tamina homeocaixa de baixa estatura SHOX 15608 homeocaixa 2 de baixa estatura SHOX2 15609 fator 1 de transcrição bHLH da família SIM1 15610 de único objetivo fator 2 de transcrição bHLH da família SIM2 15611 de único objetivo homeocaixa 1 SIX SIX1 15612 homeocaixa 2 SIX SIX2 15613 homeocaixa 3 SIX SIX3 15614 homeocaixa 4 SIX SIX4 15615 homeocaixa 5 SIX SIX5 15616 homeocaixa 6 SIX SIX6 15617 proto-oncogene SKI SKI 15618 proto-oncogene tipo SKI SKIL 15619 Correpressor 1 transcricional da família SKOR1 15620
SKI
Nome Completo Abreviação SEQ ID NO: Correpressor 2 transcricional da família SKOR2 15621
SKI família 30 transportadora de soluto SLC30A9 15622 (transportadora de zinco), membro 9 Membro 1 da família SMAD SMAD1 15623 Membro 2 da família SMAD SMAD2 15624 Membro 3 da família SMAD SMAD3 15625 Membro 4 da família SMAD SMAD4 15626 Membro 5 da família SMAD SMAD5 15627 Membro 6 da família SMAD SMAD6 15628 Membro 7 da família SMAD SMAD7 15629 Membro 9 da família SMAD SMAD9 15630 SWI / SNF relacionado, associado à SMARCA1 15631 matriz, regulador da cromatina depen- dente de actina, subfamília a, membro 1 SWI / SNF relacionado, associado à SMARCA2 15632 matriz, regulador da cromatina depen- dente de actina, subfamília a, membro 2 SWI / SNF relacionado, associado à SMARCA4 15633 matriz, regulador da cromatina depen- dente de actina, subfamília a, membro 4 SWI / SNF relacionado, associado à SMARCA5 15634 matriz, regulador da cromatina depen- dente de actina, subfamília a, membro 5 SWI / SNF relacionado, regulador de SMAR- 15635 cromatina dependente de actina asso- CAD1 ciado à matriz, subfamília a, contendo DEAD / H caixa 1 SWI / SNF relacionado, associado à SMARCAL1 15636 matriz, regulador da cromatina depen- dente de actina, subfamília a - tipo 1 SWI / SNF relacionado, associado à SMARCB1 15637 matriz, regulador da cromatina depen- dente de actina, subfamília b, membro 1
Nome Completo Abreviação SEQ ID NO: SWI / SNF relacionado, associado à SMARCC1 15638 matriz, regulador da cromatina depen- dente de actina, subfamília c, membro 1 SWI / SNF relacionado, associado à SMARCC2 15639 matriz, regulador da cromatina depen- dente de actina, subfamília c, membro 2 SWI / SNF relacionado, associado à SMARCD1 15640 matriz, regulador da cromatina depen- dente de actina, subfamília d, membro 1 SWI / SNF relacionado, associado à SMARCD2 15641 matriz, regulador da cromatina depen- dente de actina, subfamília d, membro 2 SWI / SNF relacionado, associado à SMARCD3 15642 matriz, regulador da cromatina depen- dente de actina, subfamília d, membro 3 SWI / SNF relacionado, associado à SMARCE1 15643 matriz, regulador da cromatina depen- dente de actina, subfamília e, membro 1 dedo de zinco 1 família caracol SNAI1 15644 dedo de zinco 2 família caracol SNAI2 15645 dedo de zinco 3 família caracol SNAI3 15646 polipeptídeo 4 de complexo de ativação SNAPC4 15647 de RNA nuclear pequeno hélice-alça-hélice 1 básica específica de SOHLH1 15648 espermatogênese e oogênese hélice-alça-hélice 2 básica específica de SOHLH2 15649 espermatogênese e oogênese SRY - caixa 1 SOX1 15650 SRY - caixa 10 SOX10 15651 SRY - caixa 11 SOX11 15652 SRY - caixa 12 SOX12 15653 SRY - caixa 13 SOX13 15654 SRY - caixa 14 SOX14 15655 SRY - caixa 15 SOX15 15656
Nome Completo Abreviação SEQ ID NO: SRY - caixa 17 SOX17 15657 SRY - caixa 18 SOX18 15658 SRY - caixa 2 SOX2 15659 SRY - caixa 21 SOX21 15660 SRY - caixa 3 SOX3 15661 SRY - caixa 30 SOX30 15662 SRY - caixa 4 SOX4 15663 SRY - caixa 5 SOX5 15664 SRY - caixa 6 SOX6 15665 SRY - caixa 7 SOX7 15666 SRY - caixa 8 SOX8 15667 SRY - caixa 9 SOX9 15668 Fator de transcrição Sp1 SP1 15669-15670 Antígeno nuclear SP100 SP100 15671 Proteína do corpo nuclear SP110 SP110 15672 Proteína do corpo nuclear SP140 SP140 15673 Semelhante à proteína de corpo nuclear SP140L 15674 SP140 Fator de transcrição Sp2 SP2 15675 Fator de transcrição Sp3 SP3 15676 Fator de transcrição Sp4 SP4 15677 Fator de transcrição Sp5 SP5 15678 Fator de transcrição Sp6 SP6 15679 Fator de transcrição Sp7 SP7 15680 Fator de transcrição Sp8 SP8 15681 Fator de transcrição Sp9 SP9 15682 Fator de transcrição ETS contendo do- SPDEF 15683 mínio direcionado de SAM proto-oncogene Spi-1 SPI1 15684 fator de transcrição Spi-B (Spi-1/PU.1 SPIB 15685 relacionado) Fator de transcrição Spi-C (Spi-1/PU.1 SPIC 15686 relacionado)
Nome Completo Abreviação SEQ ID NO: Zíper 1 de leucina espermatogênica SPZ1 15687 fator 1 de transcrição de ligação de SREBF1 15688 elemento regulador de esterol fator 2 de transcrição de ligação de SREBF2 15689 elemento regulador de esterol fator de resposta do soro SRF 15690 região Y determinante de sexo SRY 15691 proteína 1 de reconhecimento específi- SSRP1 15692 co de estrutura supressão de tumorigenicidade 18, de- ST18 15693 do de zinco transdutor de sinal e ativador de trans- STAT1 15694 crição 1 transdutor de sinal e ativador da trans- STAT2 15695 crição 2 transdutor de sinal e ativador da trans- STAT3 15696 crição 3 (fator de resposta de fase agu- da) transdutor de sinal e ativador da trans- STAT4 15697 crição 4 transdutor de sinal e ativador da trans- STAT5 15698 crição 5 transdutor de sinal e ativador da trans- STAT5A 15699 crição 5A transdutor de sinal e ativador da trans- STAT5B 15700 crição 5B transdutor de sinal e ativador da trans- STAT6 15701 crição 6, induzido por interleucina 4 adaptador transcricional 2A TADA2A 15702 adaptador transcricional 2B TADA2B 15703 fator 1 associado à proteína de ligação TAF1 15704 à caixa TATA Leucemia 1 linfocítica aguda de células TAL1 15705
T
Nome Completo Abreviação SEQ ID NO: Leucemia 2 linfocítica aguda de células TAL2 15706
T Proteína 1 de ligação a Tax1 (vírus de TAX1BP1 15707 leucemia de célula T humana tipo I) Proteína 3 de ligação a Tax1 (vírus de TAX1BP3 15708 leucemia de célula T humana tipo I) Fator T-bet de transcrição de caixa T Tbet 15709 proteína de ligação à caixa TATA TBP 15710 Proteína de ligação à caixa TATA tipo 1 TBPL1 15711 Proteína de ligação à caixa TATA tipo 2 TBPL2 15712 Caixa T, cérebro 1 TBR1 15713 Caixa T 1 TBX1 15714 Caixa T 10 TBX10 15715 Caixa T 15 TBX15 15716 Caixa T 18 TBX18 15717 Caixa T 19 TBX19 15718 Caixa T 2 TBX2 15719 Caixa T 20 TBX20 15720 Caixa T 21 TBX21 15721 Caixa T 22 TBX22 15722 Caixa T 3 TBX3 15723 Caixa T 4 TBX4 15724 Caixa T 5 TBX5 15725 Caixa T 6 TBX6 15726 fator de transcrição 12 TCF12 15727 fator de transcrição 15 (hélice-alça- TCF15 15728 hélice básica) fator de transcrição 19 TCF19 15729 fator de transcrição 20 (AR1) TCF20 15730 fator de transcrição 21 TCF21 15731 fator de transcrição 23 TCF23 15732 fator de transcrição 24 TCF24 15733
Nome Completo Abreviação SEQ ID NO: fator de transcrição 25 (hélice-alça- TCF25 15734 hélice básica) fator de transcrição 3 TCF3 15735 fator de transcrição 4 TCF4 15736 fator de transcrição 7 (T-célula específi- TCF7 15737 ca, HMG-box, TCF1) fator de transcrição 7 tipo 1 TCF7L1 15738 fator de transcrição 7 tipo 2 TCF7L2 15739 fator de transcrição-tipo 5 (hélice-alça- TCFL5 15740 hélice básica) Fator de transcrição 1 de domínio TEA TEAD1 15741 Fator de transcrição 2 de domínio TEA TEAD2 15742 Fator de transcrição 3 de domínio TEA TEAD3 15743 Fator de transcrição 4 de domínio TEA TEAD4 15744 fator embriônico tirotrófico TEF 15745 Fator 1 de ligação à repetição teloméri- TERF1 15746 ca (interação NIMA) Fator de ligação à repetição telomérica TERF2 15747 2 tet metilcitosina dioxigenase 1 TET1 15748 tet metilcitosina dioxigenase 2 TET2 15749 tet metilcitosina dioxigenase 3 TET3 15750 fator de transcrição A, mitocondrial TFAM 15751 fator de transcrição AP-2 alfa (proteína TFAP2A 15752 2 alfa de ligação aumentada de ativa- ção) fator de transcrição AP-2 beta (proteína TFAP2B 15753 2 beta de ligação aumentada de ativa- ção) fator de transcrição AP-2 gama (proteí- TFAP2C 15754 na 2 gama de ligação aumentada de ativação)
Nome Completo Abreviação SEQ ID NO: fator de transcrição AP-2 delta (proteína TFAP2D 15755 2 delta de ligação aumentada de ativa- ção) fator de transcrição AP-2 épsilon (prote- TFAP2E 15756 ína 2 épsilon de ligação aumentada de ativação) fator de transcrição AP-4 (proteína de TFAP4 15757 ligação aumentada de ativação 4) fator de transcrição B1, mitocondrial TFB1M 15758 fator de transcrição B2, mitocondrial TFB2M 15759 fator de transcrição CP2 TFCP2 15760 fator de transcrição CP2 - tipo 1 TFCP2L1 15761 fator de transcrição Dp-1 TFDP1 15762 fator de transcrição Dp-2 (parceiro 2 de TFDP2 15763 dimerização E2F) família do fator de transcrição Dp mem- TFDP3 15764 bro 3 ligação do fator de transcrição ao real- TFE3 15765 çador 3 de IGHM fator de transcrição EB TFEB 15766 fator de transcrição EC TFEC 15767 homeocaixa 1 de fator induzido por TGIF1 15768
TGFB Homeocaixa 2 de fator induzido por TGIF2 15769
TGFB Semelhante à homeocaixa 2 de fator TGIF2LX 15770 induzido por TGFB, ligado a X Semelhante à homeocaixa 2 de fator TGIF2LY 15771 induzido por TGFB, ligado a Y proteína 1 associada à apoptose, con- THAP1 15772 tendo domínio THAP 10 contendo domínio THAP THAP10 15773 11 contendo domínio THAP THAP11 15774 12 contendo domínio THAP THAP12 15775
Nome Completo Abreviação SEQ ID NO: proteína 2 associada à apoptose, con- THAP2 15776 tendo domínio THAP proteína 3 associada com apoptose, THAP3 15777 contendo domínio THAP 4 contendo domínio THAP THAP4 15778 5 contendo domínio THAP THAP5 15779 6 contendo domínio THAP THAP6 15780 7 contendo domínio THAP THAP7 15781 8 contendo domínio THAP THAP8 15782 9 contendo domínio THAP THAP9 15783 Fator POZ-Kruppel de indução de Th ThPOK 15784 receptor de hormônio da tireoide, alfa THRA 15785 receptor de hormônio da tireoide, beta THRB 15786 homeocaixa 1 de leukemia de célula T TLX1 15787 homeocaixa 2 de leucemia de célula T TLX2 15788 homeocaixa 3 de leucemia de célula T TLX3 15789 alvo de EGR1, membro 1 (nuclear) TOE1 15790 semelhante a onsoku, proteína de repa- TONSL 15791 ro de DNA ligação a topoisomerase I, rica em argi- TOPORS 15792 nina/serina, E3 ubiquitina proteína liga- se caixa de grupo de alta mobilidade asso- TOX 15793 ciado à seleção de timócito membro 2 da família caixa do grupo de TOX2 15794 alta mobilidade TOX membro 3 da família box do grupo de TOX3 15795 alta mobilidade TOX membro 4 da família box do grupo de TOX4 15796 alta mobilidade TOX proteína p53 de tumor TP53 15797 proteína p63 de tumor TP63 15798 proteína p73 de tumor TP73 15799
Nome Completo Abreviação SEQ ID NO: homeocaixa 1 de repetição de tetra- TPRX1 15800 peptídeo semelhante à homeocaixa de repetição TPRXL 15801 de tetra-peptídeo fator 1 de regulação transcricional TRERF1 15802 síndrome 1 tricorinofalangeal TRPS1 15803 membro 1 da família de domínio TSC22 TSC22D1 15804 membro 2 da família de domínio TSC22 TSC22D2 15805 membro 3 da família de domínio TSC22 TSC22D3 15806 membro 4 da família de domínio TSC22 TSC22D4 15807 homeocaixa 1 de dedo de zinco teashirt TSHZ1 15808 homeocaixa 2 dedo de zinco teashirt TSHZ2 15809 homeocaixa 3 dedo de zinco teashirt TSHZ3 15810 fator de terminação de transcrição, RNA TTF1 15811-15812 polimerase I fator de terminação de transcrição, RNA TTF2 15813-15814 polimerase II fator de transcrição bipartido atarracado TUB 15815 fator de transcrição 1 bHLH da família TWIST1 15816 twist fator de transcrição 2 bHLH da família TWIST2 15817 twist proteína 1 de ligação a montante (LBP- UBP1 15818 1a) fator de transcrição de ligação a mon- UBTF 15819 tante, RNA polimerase I fator de transcrição de ligação a mon- UBTFL1 15820 tante, RNA polimerase I - tipo 1 fator de transcrição de ligação a mon- UBTFL6 15821 tante, RNA polimerase I-tipo 6 (pseudo- gene) Homeocaixa UNC UNCX 15822 dedo de zinco da família despenteada UNK 15823
Nome Completo Abreviação SEQ ID NO: família like dedo de zinco semelhante à UNKL 15824 famíliadespenteada fator de transcrição 1 a montante USF1 15825 fator de transcrição 2 a montante, inte- USF2 15826 ração de c-fos membro 3 da família de fator de trans- USF3 15827 crição a montante fator de transcrição 1 de célula embriô- UTF1 15828 nica não diferenciada homeocaixa 1 anterior ventral VAX1 15829 homeocaixa 2 anterior ventral VAX2 15830 receptor de vitamina D (1,25- di-hidróxi VDR 15831 vitamina D3) homeocaixa VENT homeobox VENTX 15832 dedo de zinco 1 endotelial vascular VEZF1 15833 homeocaixa 1 do sistema visual VSX1 15834 homeocaixa 2 do sistema visual VSX2 15835 proteína 1 de ligação ao DNA de cauxa WDHD1 15836 HMG e repetição WD candidato 1 da síndrome de Wolf- WHSC1 15837 Hirschhorn motivos dedo de zindo amplamente in- WIZ 15838 ter-espaçados tumor 1 Wilms WT1 15839 Proteína 1 de ligação de caixa X XBP1 15840 Proteína 1 de ligação de caixa Y YBX1 15841 proteína 2 de ligação à caixa Y YBX2 15842 proteína 3 de ligação à caixa Y YBX3 15843 Domínio YEATS contendo 2 YEATS2 15844 Domínio YEATS contendo 4 YEATS4 15845 YY1 fator de transcrição YY1 15846 YY2 fator de transcrição YY2 15847 1 contendo tipo B dedo de zinco ZBED1 15848
Nome Completo Abreviação SEQ ID NO: 2 contendo tipo B dedo de zinco ZBED2 15849 3 contendo tipo B dedo de zinco ZBED3 15850 4 contendo tipo B dedo de zinco ZBED4 15851 5 contendo tipo B dedo de zinco ZBED5 15852 6 contendo tipo B dedo de zinco ZBED6 15853 proteína 1 de ligação a Z-DNA ZBP1 15854-15855 1 contendo dedo de zinco e domínio ZBTB1 15856
BTB 10 contendo dedo de zinco e domínio ZBTB10 15857
BTB 11 contendo dedo de zinco e domínio ZBTB11 15858
BTB 12 contendo dedo de zinco e domínio ZBTB12 15859
BTB 14 contendo dedo de zinco e domínio ZBTB14 15860
BTB 16 contendo dedo de zinco e domínio ZBTB16 15861
BTB 17 contendo dedo de zinco e domínio ZBTB17 15862
BTB 18 contendo dedo de zinco e domínio ZBTB18 15863
BTB 2 contendo dedo de zinco e domínio ZBTB2 15864
BTB 20 contendo dedo de zinco e domínio ZBTB20 15865
BTB 21 contendo dedo de zinco e domínio ZBTB21 15866
BTB 22 contendo dedo de zinco e domínio ZBTB22 15867
BTB 24 contendo dedo de zinco e domínio ZBTB24 15868
BTB 25 contendo dedo de zinco e domínio ZBTB25 15869
BTB
Nome Completo Abreviação SEQ ID NO: 26 contendo dedo de zinco e domínio ZBTB26 15870
BTB 3 contendo dedo de zinco e domínio ZBTB3 15871
BTB 32 contendo dedo de zinco e domínio ZBTB32 15872
BTB 33 contendo dedo de zinco e domínio ZBTB33 15873
BTB 34 contendo dedo de zinco e domínio ZBTB34 15874
BTB 37 contendo dedo de zinco e domínio ZBTB37 15875
BTB 38 contendo dedo de zinco e domínio ZBTB38 15876
BTB 39 contendo dedo de zinco e domínio ZBTB39 15877
BTB 4 contendo dedo de zinco e domínio ZBTB4 15878
BTB 40 contendo dedo de zinco e domínio ZBTB40 15879
BTB 41 contendo dedo de zinco e domínio ZBTB41 15880
BTB 42 contendo dedo de zinco e domínio ZBTB42 15881
BTB 43 contendo dedo de zinco e domínio ZBTB43 15882
BTB 44 contendo dedo de zinco e domínio ZBTB44 15883
BTB 45 contendo dedo de zinco e domínio ZBTB45 15884
BTB 46 contendo dedo de zinco e domínio ZBTB46 15885
BTB 47 contendo dedo de zinco e domínio ZBTB47 15886
BTB
Nome Completo Abreviação SEQ ID NO: 48 contendo dedo de zinco e domínio ZBTB48 15887
BTB 49 contendo dedo de zinco e domínio ZBTB49 15888
BTB 5 contendo dedo de zinco e domínio ZBTB5 15889
BTB 6 contendo dedo de zinco e domínio ZBTB6 15890
BTB 7A contendo dedo de zinco e domínio ZBTB7A 15891
BTB 7B contendo dedo de zinco e domínio ZBTB7B 15892
BTB 7C contendo dedo de zinco e domínio ZBTB7C 15893
BTB 8A contendo dedo de zinco e domínio ZBTB8A 15894
BTB 9 contendo dedo de zinco e domínio ZBTB9 15895
BTB 10 contendo tipo CCCH dedo de zinco ZC3H10 15896 11A contendo tipo CCCH dedo de zinco ZC3H11A 15897 12A contendo tipo CCCH dedo de zinco ZC3H12A 15898 12B contendo tipo CCCH dedo de zinco ZC3H12B 15899 13 contendo tipo CCCH dedo de zinco ZC3H13 15900 14 contendo tipo CCCH dedo de zinco ZC3H14 15901 15 contendo tipo CCCH dedo de zinco ZC3H15 15902 18 contendo tipo CCCH dedo de zinco ZC3H18 15903 3 contendo tipo CCCH dedo de zinco ZC3H3 15904 4 contendo tipo CCCH dedo de zinco ZC3H4 15905 6 contendo tipo CCCH dedo de zinco ZC3H6 15906 7A contendo tipo CCCH dedo de zinco ZC3H7A 15907 7B contendo tipo CCCH dedo de zinco ZC3H7B 15908 8 contendo tipo CCCH dedo de zinco ZC3H8 15909 11 contendo tipo CCHC dedo de zinco ZCCHC11 15910
Nome Completo Abreviação SEQ ID NO: 6 contendo tipo CCHC dedo de zinco ZCCHC6 15911 homeocaixa 1 de ligação à caixa-E de- ZEB1 15912 do de zinco homeocaixa 2 de ligação à caixa-E de- ZEB2 15913 do de zinco contendo domínio gancho AT e dedo de ZFAT 15914 zinco homeocaixa 2 dedo de zinco ZFHX2 15915 homeocaixa 3 dedo de zinco ZFHX3 15916 homeocaixa 4 dedo de zinco ZFHX4 15917 proteína dedo de zinco ZFP1 ZFP1 15918 proteína dedo de zinco ZFP14 ZFP14 15919 proteína dedo de zinco ZFP2 ZFP2 15920 proteína dedo de zinco ZFP28 ZFP28 15921 proteína dedo de zinco ZFP3 ZFP3 15922 proteína dedo de zinco ZFP30 ZFP30 15923 1 semelhante à proteína dedo de anel ZFP36L1 15924 ZFP36 2 semelhante à proteína dedo de anel ZFP36L2 15925 ZFP36 proteína dedo de zinco ZFP37 ZFP37 15926 proteína dedo de zinco ZFP41 ZFP41 15927 proteína dedo de zinco ZFP42 ZFP42 15928 proteína dedo de zinco ZFP57 ZFP57 15929 proteína dedo de zinco ZFP62 ZFP62 15930 proteína dedo de zinco ZFP64 ZFP64 15931 proteína dedo de zinco ZFP69 ZFP69 15932-15933 proteína B dedo de zinco ZFP69 ZFP69B 15934 proteína dedo de zinco ZFP82 ZFP82 15935 proteína dedo de zinco ZFP90 ZFP90 15936 proteína dedo de zinco ZFP91 ZFP91 15937 proteína dedo de zinco ZFP92 ZFP92 15938
Nome Completo Abreviação SEQ ID NO: proteína dedo de zinco, membro 1 da ZFPM1 15939 família FOG proteína dedo de zinco, membro 2 da ZFPM2 15940 família FOG proteína dedo de zinco, ligada a X ZFX 15941 proteína dedo de zinco, ligada a Y ZFY 15942 dedo de zinco, 26 contendo domínio ZFYVE26 15943
FYVE dedo de zinco, proteína 1 semelhante a ZGLP1 15944
GATA tipo CCCH dedo de zinco e contend ZGPAT 15945 domíniode fragmento G dedo de zincos e homeocaixas 1 ZHX1 15946 dedo de zincos e homeocaixas 2 ZHX2 15947 dedo de zincos e homeocaixas 3 ZHX3 15948 membro 1 da família Zic ZIC1 15949 membro 2 da família Zic ZIC2 15950 membro 3 da família Zic ZIC3 15951 membro 4 da família Zic ZIC4 15952 membro 5 da família Zic ZIC5 15953 proteína dedo de zinco interagindo com ZIK1 15954 a proteína 1 K dedo de zinco, impresso 2 ZIM2 15955 dedo de zinco, impresso 3 ZIM3 15956 dedo de zinco com os domínios 1 KRAB ZKSCAN1 15957 e SCAN dedo de zinco com os domínios 2 KRAB ZKSCAN2 15958 e SCAN dedo de zinco com os domínios 3 KRAB ZKSCAN3 15959 e SCAN dedo de zinco com os domínios 4 KRAB ZKSCAN4 15960 e SCAN
Nome Completo Abreviação SEQ ID NO: dedo de zinco com os domínios 5 KRAB ZKSCAN5 15961 e SCAN dedo de zinco com os domínios 7 KRAB ZKSCAN7 15962 e SCAN dedo de zinco com os domínios 8 KRAB ZKSCAN8 15963 e SCAN matrina dedo de zinco – tipo 1 ZMAT1 15964 matrina dedo de zinco – tipo 2 ZMAT2 15965 matrina dedo de zinco - tipo 3 ZMAT3 15966 matrina dedo de zinco - tipo 4 ZMAT4 15967 matrina dedo de zinco - tipo 5 ZMAT5 15968 proteína dedo de zinco 10 ZNF10 15969 proteína dedo de zinco 100 ZNF100 15970 proteína dedo de zinco 101 ZNF101 15971 proteína dedo de zinco 106 ZNF106 15972 proteína dedo de zinco 107 ZNF107 15973 proteína dedo de zinco 112 ZNF112 15974 proteína dedo de zinco 114 ZNF114 15975 proteína dedo de zinco 117 ZNF117 15976 proteína dedo de zinco 12 ZNF12 15977 proteína dedo de zinco 121 ZNF121 15978 proteína dedo de zinco 124 ZNF124 15979 proteína dedo de zinco 131 ZNF131 15980 proteína dedo de zinco 132 ZNF132 15981 proteína dedo de zinco 133 ZNF133 15982 proteína dedo de zinco 134 ZNF134 15983 proteína dedo de zinco 135 ZNF135 15984 proteína dedo de zinco 136 ZNF136 15985 proteína dedo de zinco 137, pseudoge- ZNF137P 15986 ne proteína dedo de zinco 138 ZNF138 15987 proteína dedo de zinco 14 ZNF14 15988 proteína dedo de zinco 140 ZNF140 15989
Nome Completo Abreviação SEQ ID NO: proteína dedo de zinco 141 ZNF141 15990 proteína dedo de zinco 142 ZNF142 15991 proteína dedo de zinco 143 ZNF143 15992 proteína dedo de zinco 146 ZNF146 15993 proteína dedo de zinco 148 ZNF148 15994 proteína dedo de zinco 154 ZNF154 15995 proteína dedo de zinco 155 ZNF155 15996 proteína dedo de zinco 157 ZNF157 15997 proteína dedo de zinco 16 ZNF16 15998 proteína dedo de zinco 160 ZNF160 15999 proteína dedo de zinco 165 ZNF165 16000 proteína dedo de zinco 169 ZNF169 16001 proteína dedo de zinco 17 ZNF17 16002 proteína dedo de zinco 174 ZNF174 16003 proteína dedo de zinco 175 ZNF175 16004 proteína dedo de zinco 18 ZNF18 16005 proteína dedo de zinco 180 ZNF180 16006 proteína dedo de zinco 181 ZNF181 16007 proteína dedo de zinco 182 ZNF182 16008 proteína dedo de zinco 184 ZNF184 16009 proteína dedo de zinco 189 ZNF189 16010 proteína dedo de zinco 19 ZNF19 16011 proteína dedo de zinco 195 ZNF195 16012 proteína dedo de zinco 197 ZNF197 16013 proteína dedo de zinco 2 ZNF2 16014 proteína dedo de zinco 20 ZNF20 16015-16016 proteína dedo de zinco 200 ZNF200 16017 proteína dedo de zinco 202 ZNF202 16018 proteína dedo de zinco 205 ZNF205 16019 proteína dedo de zinco 207 ZNF207 16020 proteína dedo de zinco 208 ZNF208 16021 proteína dedo de zinco 211 ZNF211 16022
Nome Completo Abreviação SEQ ID NO: proteína dedo de zinco 212 ZNF212 16023 proteína dedo de zinco 213 ZNF213 16024 proteína dedo de zinco 214 ZNF214 16025 proteína dedo de zinco 215 ZNF215 16026 proteína dedo de zinco 217 ZNF217 16027 proteína dedo de zinco 219 ZNF219 16028 proteína dedo de zinco 22 ZNF22 16029 proteína dedo de zinco 221 ZNF221 16030 proteína dedo de zinco 223 ZNF223 16031 proteína dedo de zinco 224 ZNF224 16032 proteína dedo de zinco 225 ZNF225 16033-16034 proteína dedo de zinco 226 ZNF226 16035 proteína dedo de zinco 227 ZNF227 16036 proteína dedo de zinco 229 ZNF229 16037 proteína dedo de zinco 23 ZNF23 16038 proteína dedo de zinco 230 ZNF230 16039-16040 proteína dedo de zinco 232 ZNF232 16041 proteína dedo de zinco 233 ZNF233 16042-16043 proteína dedo de zinco 234 ZNF234 16044 proteína dedo de zinco 235 ZNF235 16045 proteína dedo de zinco 236 ZNF236 16046 proteína dedo de zinco 239 ZNF239 16047 proteína dedo de zinco 24 ZNF24 16048 proteína dedo de zinco 248 ZNF248 16049 proteína dedo de zinco 25 ZNF25 16050 proteína dedo de zinco 250 ZNF250 16051 proteína dedo de zinco 251 ZNF251 16052 proteína dedo de zinco 252, pseudoge- ZNF252P 16053 ne proteína dedo de zinco 253 ZNF253 16054 proteína dedo de zinco 254 ZNF254 16055 proteína dedo de zinco 256 ZNF256 16056
Nome Completo Abreviação SEQ ID NO: proteína dedo de zinco 257 ZNF257 16057 proteína dedo de zinco 26 ZNF26 16058 proteína dedo de zinco 260 ZNF260 16059 proteína dedo de zinco 263 ZNF263 16060 proteína dedo de zinco 264 ZNF264 16061 proteína dedo de zinco 266 ZNF266 16062 proteína dedo de zinco 267 ZNF267 16063 proteína dedo de zinco 268 ZNF268 16064 proteína dedo de zinco 273 ZNF273 16065 proteína dedo de zinco 274 ZNF274 16066 proteína dedo de zinco 275 ZNF275 16067 proteína dedo de zinco 276 ZNF276 16068 proteína dedo de zinco 277 ZNF277 16069 proteína dedo de zinco 28 ZNF28 16070 proteína dedo de zinco 280A ZNF280A 16071 proteína dedo de zinco 280B ZNF280B 16072 proteína dedo de zinco 280C ZNF280C 16073 proteína dedo de zinco 280D ZNF280D 16074 proteína dedo de zinco 281 ZNF281 16075 proteína dedo de zinco 282 ZNF282 16076 proteína dedo de zinco 283 ZNF283 16077 proteína dedo de zinco 284 ZNF284 16078 proteína dedo de zinco 285 ZNF285 16079 proteína dedo de zinco 286A ZNF286A 16080 proteína dedo de zinco 286B ZNF286B 16081 proteína dedo de zinco 287 ZNF287 16082 proteína dedo de zinco 292 ZNF292 16083 proteína dedo de zinco 296 ZNF296 16084 proteína dedo de zinco 3 ZNF3 16085 proteína dedo de zinco 30 ZNF30 16086 proteína dedo de zinco 300 ZNF300 16087 proteína dedo de zinco 302 ZNF302 16088
Nome Completo Abreviação SEQ ID NO: proteína dedo de zinco 304 ZNF304 16089 proteína dedo de zinco 311 ZNF311 16090 proteína dedo de zinco 316 ZNF316 16091 proteína dedo de zinco 317 ZNF317 16092 proteína dedo de zinco 318 ZNF318 16093 proteína dedo de zinco 319 ZNF319 16094 proteína dedo de zinco 32 ZNF32 16095 proteína dedo de zinco 320 ZNF320 16096 proteína dedo de zinco 322 ZNF322 16097 proteína dedo de zinco 324 ZNF324 16098 proteína dedo de zinco 324B ZNF324B 16099 proteína dedo de zinco 326 ZNF326 16100 proteína dedo de zinco 329 ZNF329 16101 proteína dedo de zinco 331 ZNF331 16102 proteína dedo de zinco 333 ZNF333 16103 proteína dedo de zinco 334 ZNF334 16104 proteína dedo de zinco 335 ZNF335 16105 proteína dedo de zinco 337 ZNF337 16106 proteína dedo de zinco 33A ZNF33A 16107 proteína dedo de zinco 33B ZNF33B 16108 proteína dedo de zinco 34 ZNF34 16109 proteína dedo de zinco 341 ZNF341 16110 proteína dedo de zinco 343 ZNF343 16111 proteína dedo de zinco 345 ZNF345 16112 proteína dedo de zinco 346 ZNF346 16113 proteína dedo de zinco 347 ZNF347 16114 proteína dedo de zinco 35 ZNF35 16115 proteína dedo de zinco 350 ZNF350 16116 proteína dedo de zinco 354A ZNF354A 16117 proteína dedo de zinco 354B ZNF354B 16118 proteína dedo de zinco 354C ZNF354C 16119
Nome Completo Abreviação SEQ ID NO: proteína dedo de zinco 355, pseudoge- ZNF355P 16120 ne proteína dedo de zinco 358 ZNF358 16121 proteína dedo de zinco 362 ZNF362 16122 proteína dedo de zinco 365 ZNF365 16123-16124 proteína dedo de zinco 366 ZNF366 16125 proteína dedo de zinco 367 ZNF367 16126 proteína dedo de zinco 37A ZNF37A 16127 proteína dedo de zinco 382 ZNF382 16128 proteína dedo de zinco 383 ZNF383 16129 proteína dedo de zinco 384 ZNF384 16130 proteína dedo de zinco 385A ZNF385A 16131 proteína dedo de zinco 385B ZNF385B 16132 proteína dedo de zinco 385C ZNF385C 16133 proteína dedo de zinco 385D ZNF385D 16134 proteína dedo de zinco 391 ZNF391 16135 proteína dedo de zinco 394 ZNF394 16136 proteína dedo de zinco 395 ZNF395 16137 proteína dedo de zinco 396 ZNF396 16138 proteína dedo de zinco 397 ZNF397 16139 proteína dedo de zinco 398 ZNF398 16140 proteína dedo de zinco 404 ZNF404 16141 proteína dedo de zinco 407 ZNF407 16142 proteína dedo de zinco 408 ZNF408 16143 proteína dedo de zinco 41 ZNF41 16144 proteína dedo de zinco 410 ZNF410 16145 proteína dedo de zinco 414 ZNF414 16146 proteína dedo de zinco 415 ZNF415 16147 proteína dedo de zinco 416 ZNF416 16148 proteína dedo de zinco 417 ZNF417 16149 proteína dedo de zinco 418 ZNF418 16150 proteína dedo de zinco 419 ZNF419 16151
Nome Completo Abreviação SEQ ID NO: proteína dedo de zinco 420 ZNF420 16152 proteína dedo de zinco 423 ZNF423 16153 proteína dedo de zinco 425 ZNF425 16154 proteína dedo de zinco 426 ZNF426 16155 proteína dedo de zinco 428 ZNF428 16156 proteína dedo de zinco 429 ZNF429 16157 proteína dedo de zinco 43 ZNF43 16158 proteína dedo de zinco 430 ZNF430 16159 proteína dedo de zinco 431 ZNF431 16160 proteína dedo de zinco 432 ZNF432 16161 proteína 433 dedo de zinco ZNF433 16162 proteína dedo de zinco 436 ZNF436 16163 proteína dedo de zinco 438 ZNF438 16164 proteína dedo de zinco 439 ZNF439 16165 proteína dedo de zinco 44 ZNF44 16166 proteína dedo de zinco 440 ZNF440 16167 proteína dedo de zinco 441 ZNF441 16168 proteína dedo de zinco 442 ZNF442 16169 proteína dedo de zinco 443 ZNF443 16170 proteína dedo de zinco 444 ZNF444 16171 proteína dedo de zinco 445 ZNF445 16172 proteína dedo de zinco 446 ZNF446 16173 proteína dedo de zinco 449 ZNF449 16174 proteína dedo de zinco 45 ZNF45 16175 proteína dedo de zinco 451 ZNF451 16176 proteína dedo de zinco 454 ZNF454 16177 proteína dedo de zinco 460 ZNF460 16178 proteína dedo de zinco 461 ZNF461 16179 proteína dedo de zinco 462 ZNF462 16180 proteína dedo de zinco 467 ZNF467 16181 proteína dedo de zinco 468 ZNF468 16182 proteína dedo de zinco 469 ZNF469 16183
Nome Completo Abreviação SEQ ID NO: proteína dedo de zinco 470 ZNF470 16184 proteína dedo de zinco 471 ZNF471 16185 proteína dedo de zinco 473 ZNF473 16186 proteína dedo de zinco 474 ZNF474 16187-16188 proteína dedo de zinco 479 ZNF479 16189 proteína dedo de zinco 48 ZNF48 16190 proteína dedo de zinco 480 ZNF480 16191 proteína dedo de zinco 483 ZNF483 16192 proteína dedo de zinco 484 ZNF484 16193 proteína dedo de zinco 485 ZNF485 16194 proteína dedo de zinco 486 ZNF486 16195 proteína dedo de zinco 487 ZNF487 16196 proteína dedo de zinco 488 ZNF488 16197 proteína dedo de zinco 490 ZNF490 16198 proteína dedo de zinco 491 ZNF491 16199 proteína dedo de zinco 492 ZNF492 16200 proteína dedo de zinco 493 ZNF493 16201 proteína dedo de zinco 496 ZNF496 16202 proteína dedo de zinco 497 ZNF497 16203 proteína dedo de zinco 500 ZNF500 16204 proteína dedo de zinco 501 ZNF501 16205 proteína dedo de zinco 502 ZNF502 16206 proteína dedo de zinco 503 ZNF503 16207 proteína dedo de zinco 506 ZNF506 16208 proteína dedo de zinco 507 ZNF507 16209 proteína dedo de zinco 510 ZNF510 16210 proteína dedo de zinco 511 ZNF511 16211 proteína dedo de zinco 512 ZNF512 16212 proteína dedo de zinco 512B ZNF512B 16213 proteína dedo de zinco 513 ZNF513 16214 proteína dedo de zinco 514 ZNF514 16215 proteína dedo de zinco 516 ZNF516 16216
Nome Completo Abreviação SEQ ID NO: proteína dedo de zinco 517 ZNF517 16217 proteína dedo de zinco 518A ZNF518A 16218 proteína dedo de zinco 518B ZNF518B 16219 proteína dedo de zinco 519 ZNF519 16220 proteína dedo de zinco 521 ZNF521 16221 proteína dedo de zinco 524 ZNF524 16222 proteína dedo de zinco 526 ZNF526 16223 proteína dedo de zinco 527 ZNF527 16224 proteína dedo de zinco 528 ZNF528 16225 proteína dedo de zinco 529 ZNF529 16226 proteína dedo de zinco 530 ZNF530 16227 proteína dedo de zinco 532 ZNF532 16228 proteína dedo de zinco 534 ZNF534 16229 proteína dedo de zinco 536 ZNF536 16230 proteína dedo de zinco 540 ZNF540 16231 proteína dedo de zinco 541 ZNF541 16232 proteína dedo de zinco 542, pseudoge- ZNF542P 16233 ne proteína dedo de zinco 543 ZNF543 16234 proteína dedo de zinco 544 ZNF544 16235 proteína dedo de zinco 546 ZNF546 16236 proteína dedo de zinco 547 ZNF547 16237 proteína dedo de zinco 548 ZNF548 16238 proteína dedo de zinco 549 ZNF549 16239 proteína dedo de zinco 550 ZNF550 16240 proteína dedo de zinco 552 ZNF552 16241 proteína dedo de zinco 554 ZNF554 16242 proteína dedo de zinco 555 ZNF555 16243 proteína dedo de zinco 556 ZNF556 16244 proteína dedo de zinco 557 ZNF557 16245 proteína dedo de zinco 558 ZNF558 16246 proteína dedo de zinco 559 ZNF559 16247
Nome Completo Abreviação SEQ ID NO: proteína dedo de zinco 56 ZNF56 16248 proteína dedo de zinco 560 ZNF560 16249 proteína dedo de zinco 561 ZNF561 16250 proteína dedo de zinco 562 ZNF562 16251 proteína dedo de zinco 563 ZNF563 16252 proteína dedo de zinco 564 ZNF564 16253 proteína dedo de zinco 565 ZNF565 16254 proteína dedo de zinco 566 ZNF566 16255 proteína dedo de zinco 567 ZNF567 16256 proteína dedo de zinco 568 ZNF568 16257 proteína dedo de zinco 569 ZNF569 16258 proteína dedo de zinco 57 ZNF57 16259 proteína dedo de zinco 570 ZNF570 16260 proteína dedo de zinco 571 ZNF571 16261 proteína dedo de zinco 572 ZNF572 16262 proteína dedo de zinco 573 ZNF573 16263 proteína dedo de zinco 574 ZNF574 16264 proteína dedo de zinco 575 ZNF575 16265 proteína dedo de zinco 576 ZNF576 16266-16267 proteína dedo de zinco 577 ZNF577 16268 proteína dedo de zinco 578 ZNF578 16269 proteína dedo de zinco 579 ZNF579 16270 proteína dedo de zinco 580 ZNF580 16271 proteína dedo de zinco 581 ZNF581 16272 proteína dedo de zinco 582 ZNF582 16273 proteína dedo de zinco 583 ZNF583 16274 proteína dedo de zinco 584 ZNF584 16275 proteína dedo de zinco 585A ZNF585A 16276 proteína dedo de zinco 585B ZNF585B 16277 proteína dedo de zinco 586 ZNF586 16278 proteína dedo de zinco 587 ZNF587 16279 proteína dedo de zinco 589 ZNF589 16280
Nome Completo Abreviação SEQ ID NO: proteína dedo de zinco 592 ZNF592 16281 proteína dedo de zinco 593 ZNF593 16282 proteína dedo de zinco 594 ZNF594 16283 proteína dedo de zinco 595 ZNF595 16284 proteína dedo de zinco 596 ZNF596 16285 proteína dedo de zinco 597 ZNF597 16286 proteína dedo de zinco 598 ZNF598 16287 proteína dedo de zinco 599 ZNF599 16288 proteína dedo de zinco 600 ZNF600 16289 proteína dedo de zinco 605 ZNF605 16290 proteína dedo de zinco 606 ZNF606 16291 proteína dedo de zinco 607 ZNF607 16292 proteína dedo de zinco 608 ZNF608 16293 proteína dedo de zinco 609 ZNF609 16294 proteína dedo de zinco 610 ZNF610 16295 proteína dedo de zinco 611 ZNF611 16296 proteína dedo de zinco 613 ZNF613 16297 proteína dedo de zinco 614 ZNF614 16298 proteína dedo de zinco 615 ZNF615 16299 proteína dedo de zinco 616 ZNF616 16300 proteína dedo de zinco 618 ZNF618 16301 proteína dedo de zinco 619 ZNF619 16302 proteína dedo de zinco 620 ZNF620 16303 proteína dedo de zinco 621 ZNF621 16304 proteína dedo de zinco 622 ZNF622 16305 proteína dedo de zinco 623 ZNF623 16306 proteína dedo de zinco 624 ZNF624 16307 proteína dedo de zinco 625 ZNF625 16308 proteína dedo de zinco 626 ZNF626 16309 proteína dedo de zinco 627 ZNF627 16310 proteína dedo de zinco 628 ZNF628 16311 proteína dedo de zinco 629 ZNF629 16312
Nome Completo Abreviação SEQ ID NO: proteína dedo de zinco 639 ZNF639 16313 proteína dedo de zinco 641 ZNF641 16314 proteína dedo de zinco 644 ZNF644 16315 proteína dedo de zinco 645 ZNF645 16316 proteína dedo de zinco 646 ZNF646 16317 proteína dedo de zinco 648 ZNF648 16318 proteína dedo de zinco 649 ZNF649 16319 proteína dedo de zinco 652 ZNF652 16320 proteína dedo de zinco 653 ZNF653 16321 proteína dedo de zinco 654 ZNF654 16322 proteína dedo de zinco 655 ZNF655 16323 proteína dedo de zinco 658 ZNF658 16324 proteína dedo de zinco 658B (pseudo- ZNF658B 16325 gene) proteína dedo de zinco 66 ZNF66 16326 proteína dedo de zinco 660 ZNF660 16327 proteína dedo de zinco 662 ZNF662 16328 proteína dedo de zinco 664 ZNF664 16329 proteína dedo de zinco 665 ZNF665 16330 proteína dedo de zinco 667 ZNF667 16331 proteína dedo de zinco 668 ZNF668 16332 proteína dedo de zinco 669 ZNF669 16333 proteína dedo de zinco 670 ZNF670 16334 proteína dedo de zinco 671 ZNF671 16335 proteína dedo de zinco 672 ZNF672 16336 proteína dedo de zinco 674 ZNF674 16337 proteína dedo de zinco 675 ZNF675 16338 proteína dedo de zinco 676 ZNF676 16339 proteína dedo de zinco 677 ZNF677 16340 proteína dedo de zinco 678 ZNF678 16341 proteína dedo de zinco 679 ZNF679 16342 proteína dedo de zinco 680 ZNF680 16343
Nome Completo Abreviação SEQ ID NO: proteína dedo de zinco 681 ZNF681 16344 proteína dedo de zinco 682 ZNF682 16345 proteína dedo de zinco 683 ZNF683 16346 proteína dedo de zinco 684 ZNF684 16347 proteína dedo de zinco 687 ZNF687 16348 proteína dedo de zinco 688 ZNF688 16349 proteína dedo de zinco 689 ZNF689 16350 proteína dedo de zinco 69 ZNF69 16351 proteína dedo de zinco 691 ZNF691 16352 proteína dedo de zinco 692 ZNF692 16353 proteína dedo de zinco 695 ZNF695 16354 proteína dedo de zinco 696 ZNF696 16355 proteína dedo de zinco 697 ZNF697 16356 proteína dedo de zinco 699 ZNF699 16357 proteína dedo de zinco 7 ZNF7 16358 proteína dedo de zinco 70 ZNF70 16359 proteína dedo de zinco 701 ZNF701 16360 proteína dedo de zinco 702, pseudoge- ZNF702P 16361 ne proteína dedo de zinco 703 ZNF703 16362 proteína dedo de zinco 704 ZNF704 16363 proteína dedo de zinco 705A ZNF705A 16364 proteína dedo de zinco 705D ZNF705D 16365 proteína dedo de zinco 705E ZNF705E 16366 proteína dedo de zinco 705G ZNF705G 16367 proteína dedo de zinco 706 ZNF706 16368 proteína dedo de zinco 707 ZNF707 16369 proteína dedo de zinco 708 ZNF708 16370 proteína dedo de zinco 709 ZNF709 16371 proteína dedo de zinco 71 ZNF71 16372 proteína dedo de zinco 710 ZNF710 16373 proteína dedo de zinco 711 ZNF711 16374
Nome Completo Abreviação SEQ ID NO: proteína dedo de zinco 713 ZNF713 16375 proteína dedo de zinco 714 ZNF714 16376 proteína dedo de zinco 716 ZNF716 16377 proteína dedo de zinco 717 ZNF717 16378 proteína dedo de zinco 718 ZNF718 16379 proteína dedo de zinco 720 ZNF720 16380 proteína dedo de zinco 721 ZNF721 16381 proteína dedo de zinco 724, pseudoge- ZNF724P 16382 ne proteína dedo de zinco 726 ZNF726 16383 proteína dedo de zinco 727 ZNF727 16384 proteína dedo de zinco 729 ZNF729 16385 proteína dedo de zinco 730 ZNF730 16386 proteína dedo de zinco 732 ZNF732 16387 proteína dedo de zinco 735 ZNF735 16388 proteína dedo de zinco 737 ZNF737 16389 proteína dedo de zinco 74 ZNF74 16390 proteína dedo de zinco 740 ZNF740 16391 proteína dedo de zinco 746 ZNF746 16392 proteína dedo de zinco 747 ZNF747 16393 proteína dedo de zinco 749 ZNF749 16394 proteína dedo de zinco 750 ZNF750 16395 proteína dedo de zinco 75a ZNF75A 16396 proteína dedo de zinco 75D ZNF75D 16397 proteína dedo de zinco 76 ZNF76 16398 proteína dedo de zinco 761 ZNF761 16399 proteína dedo de zinco 763 ZNF763 16400 proteína dedo de zinco 764 ZNF764 16401 proteína dedo de zinco 765 ZNF765 16402 proteína dedo de zinco 766 ZNF766 16403 proteína dedo de zinco 768 ZNF768 16404 proteína dedo de zinco 77 ZNF77 16405
Nome Completo Abreviação SEQ ID NO: proteína dedo de zinco 770 ZNF770 16406 proteína dedo de zinco 771 ZNF771 16407 proteína dedo de zinco 772 ZNF772 16408 proteína dedo de zinco 773 ZNF773 16409 proteína dedo de zinco 774 ZNF774 16410 proteína dedo de zinco 775 ZNF775 16411 proteína dedo de zinco 776 ZNF776 16412 proteína dedo de zinco 777 ZNF777 16413 proteína dedo de zinco 778 ZNF778 16414 proteína dedo de zinco 780A ZNF780A 16415 proteína dedo de zinco 780B ZNF780B 16416 proteína dedo de zinco 781 ZNF781 16417 proteína dedo de zinco 782 ZNF782 16418 dedo de zinco família membro 783 ZNF783 16419 proteína dedo de zinco 784 ZNF784 16420 proteína dedo de zinco 785 ZNF785 16421 proteína dedo de zinco 786 ZNF786 16422 proteína dedo de zinco 787 ZNF787 16423 membro 788 da família dedo de zinco ZNF788 16424 proteína dedo de zinco 789 ZNF789 16425 proteína dedo de zinco 79 ZNF79 16426 proteína dedo de zinco 790 ZNF790 16427 proteína dedo de zinco 791 ZNF791 16428 proteína dedo de zinco 792 ZNF792 16429 proteína dedo de zinco 793 ZNF793 16430 proteína dedo de zinco 799 ZNF799 16431 proteína dedo de zinco 8 ZNF8 16432 proteína dedo de zinco 80 ZNF80 16433 proteína dedo de zinco 800 ZNF800 16434 proteína dedo de zinco 804A ZNF804A 16435 proteína dedo de zinco 804B ZNF804B 16436 proteína dedo de zinco 805 ZNF805 16437
Nome Completo Abreviação SEQ ID NO: proteína dedo de zinco 806 ZNF806 16438 proteína dedo de zinco 808 ZNF808 16439 proteína dedo de zinco 81 ZNF81 16440 proteína dedo de zinco 813 ZNF813 16441 proteína dedo de zinco 814 ZNF814 16442 proteína dedo de zinco 816 ZNF816 16443 proteína dedo de zinco 821 ZNF821 16444 proteína dedo de zinco 823 ZNF823 16445 proteína dedo de zinco 827 ZNF827 16446 proteína dedo de zinco 829 ZNF829 16447 proteína dedo de zinco 83 ZNF83 16448 proteína dedo de zinco 830 ZNF830 16449 proteína dedo de zinco 831 ZNF831 16450 proteína dedo de zinco 833, pseudoge- ZNF833P 16451 ne proteína dedo de zinco 835 ZNF835 16452 proteína dedo de zinco 836 ZNF836 16453 proteína dedo de zinco 837 ZNF837 16454 proteína dedo de zinco 839 ZNF839 16455 proteína dedo de zinco 84 ZNF84 16456 proteína dedo de zinco 840, pseudoge- ZNF840P 16457 ne proteína dedo de zinco 841 ZNF841 16458 proteína dedo de zinco 843 ZNF843 16459 proteína dedo de zinco 844 ZNF844 16460 proteína dedo de zinco 845 ZNF845 16461 proteína dedo de zinco 846 ZNF846 16462 proteína dedo de zinco 85 ZNF85 16463 proteína dedo de zinco 853 ZNF853 16464 proteína dedo de zinco 860 ZNF860 16465 proteína dedo de zinco 876, pseudoge- ZNF876P 16466 ne
Nome Completo Abreviação SEQ ID NO: proteína dedo de zinco 878 ZNF878 16467 proteína dedo de zinco 879 ZNF879 16468 proteína dedo de zinco 880 ZNF880 16469 proteína dedo de zinco 891 ZNF891 16470 proteína dedo de zinco 90 ZNF90 16471 proteína dedo de zinco 91 ZNF91 16472 proteína dedo de zinco 92 ZNF92 16473 proteína dedo de zinco 93 ZNF93 16474 proteína dedo de zinco 98 ZNF98 16475 proteína dedo de zinco 99 ZNF99 16476 dedo de zinco, tipo NFX1 contendo 1 ZNFX1 16477 dedo de zinco e domínio SCAN conten- ZSCAN1 16478 do 1 dedo de zinco e domínio SCAN conten- ZSCAN10 16479 do 10 dedo de zinco e domínio SCAN conten- ZSCAN12 16480 do 12 dedo de zinco e domínio SCAN conten- ZSCAN16 16481 do 16 dedo de zinco e domínio SCAN conten- ZSCAN18 16482 do 18 dedo de zinco e domínio SCAN conten- ZSCAN2 16483 do 2 dedo de zinco e domínio SCAN conten- ZSCAN20 16484 do 20 dedo de zinco e domínio SCAN conten- ZSCAN21 16485 do 21 dedo de zinco e domínio SCAN conten- ZSCAN22 16486 do 22 dedo de zinco e domínio SCAN conten- ZSCAN23 16487 do 23 dedo de zinco e domínio SCAN conten- ZSCAN25 16488 do 25
Nome Completo Abreviação SEQ ID NO: dedo de zinco e domínio SCAN conten- ZSCAN26 16489 do 26 dedo de zinco e domínio SCAN conten- ZSCAN29 16490 do 29 dedo de zinco e domínio SCAN conten- ZSCAN30 16491 do 30 dedo de zinco e domínio SCAN conten- ZSCAN31 16492 do 31 dedo de zinco e domínio SCAN conten- ZSCAN32 16493 do 32 dedo de zinco e domínio SCAN conten- ZSCAN4 16494 do 4 dedo de zinco e domínio SCAN conten- ZSCAN5A 16495 do 5A dedo de zinco e domínio SCAN conten- ZSCAN5B 16496 do 5B dedo de zinco e domínio SCAN conten- ZSCAN5CP 16497 do 5C, pseudogene dedo de zinco e domínio SCAN conten- ZSCAN9 16498 do 9 dedo de zinco com domínio peptidase ZUFSP 16499 específico de UFM1 dedo de zinco, ligado a X, duplicado A ZXDA 16500 dedo de zinco, ligado a X, duplicado B ZXDB 16501 dedo de zinco C família ZXD ZXDC 16502 dedo de zinco tipo ZZ contendo 3 ZZZ3 16503
[00739] Em algumas modalidades, um célula T da presente inven- ção é modificada para silenciar ou reduzir a expressão de um ou mais genes codificando um receptor de morte celular ou apoptose celular para produzir uma célula T blindada da presente invenção. A interação de um receptor de morte e seu ligante endógeno resulta no início da apoptose. A interrupção de uma expressão, uma atividade, ou uma interação de uma morte celular e / ou receptor de apoptose celular e /
ou ligante tornam uma célula T blindada da presente invenção menos receptiva a sinais de morte, consequentemente, tornando a célula T blindada da presente invenção mais eficaz em um ambiente de tumor.
Um exemplo de receptor de morte celular que pode ser modificado em uma célula T blindada da presente invenção é Fas (CD95). Exemplos de receptores e ligantes de morte celular e / ou apoptose celular da presente invenção incluem, mas não estão limitadas aos receptores e ligantes exemplificativos fornecidos na Tabela 4. Tabela 4. Exemplos de receptores e ligantes de morte celular e / ou apoptose celular.
Nome Completo Abreviação SEQ ID NO: Cluster de Diferenciação 120 CD120a 16504-16505 Receptor de Morte 3 DR3 16506 Receptor de Morte 6 DR6 16507 Primeiro receptor de sinal de apoptose Fas (CD95/ 16508-16509 (Fas) APO-1) Ligante Fas FasL 16510 Antígeno de tumor celular p53 p53 16511 Receptor 1 de fator de necrose de tu- TNF-R1 16512 mor Receptor 2 de fator de necrose de tu- TNF-R2 16513 mor Receptor 1 de ligante indutor de apop- TRAIL-R1 16514 tose relacionada com o fator de necrose (DR4) de tumor-relacionada a apoptose- inducing ligante receptor 1 Receptor 2 de ligante indutor de apop- TRAIL-R2 16515 tose relacionada ao fator de necrose de (DR5) tumor Proteína associada a Fas com domínio FADD 16516 de morte
Nome Completo Abreviação SEQ ID NO: proteína de domínio de MORTE associ- TRADD 16517 ada com o tipo 1 do receptor de fator de necrose de tumor proteína X associada com Bcl-2 Bax 16518 Exterminador homólogo de Bcl-2 BAK 16519 Proteína 14-3-3 14-3-3 16520 linfoma 2 de célula B Bcl-2 16521 Citocromo C Cyt C 16522 Segundo ativador de caspase derivado Smac/Diabl 16523 de mitocôndrias o Proteína A2 com requisito de alta tem- HTRA2/Omi 16524 peratura Fator de indução de apoptose AIF 16525 Endonuclease G EXOG 16526 Caspase 9 Cas9 16527 Caspase 2 Cas2 16528 Caspase 8 Cas8 16529 Caspase 10 Cas10 16530 Caspase 3 Cas3 16531 Caspase 6 Cas6 16532 Caspase 7 Cas7 16533 Fator de necrose de tumor alfa TNF-alfa 16534 Indutor fraco relacionado a TNF de TWEAK 16535 apoptose Indutor fraco relacionado a TNF de re- TWEAK -R 16536 ceptor de apoptose Ligante indutor de apoptose relacionada TRAIL 16537 com fator de necrose de tumor molécula 1 relacionada a ligante de TNF TL1A 16538 serina/treonina-proteína cinase 1 de in- RIP1 16539 teração com o receptor Inibidor celular de apoptose 1 cIAP-1 16540 fator 2 associado ao receptor de TNF TRAF-2 16541
[00740] Em algumas concretizações, uma célula T da presente in- venção é modificada para silenciar ou reduzir a expressão de um ou mais genes codificando uma proteína de detecção metabólica para produzir uma célula T blindada da da presente invenção.
Perturbação da detecção metabólica do microambiente tumoral imunossupressor (caracterizado por baixos níveis de oxigênio, pH, glicose e outras mo- léculas) por uma célula T blindada da presente invenção leva a uma retenção estendida da função das células T e, consequentemente, mais células tumorais mortas por célula T blindada.
Por exemplo, HIF1a e VHL desempenham um papel na função das células T, en- quanto em um ambiente hipóxico.
Uma célula T blindada da presente invenção pode ter silenciado ou reduzido a expressão de um ou mais genes que codificam HIF1a ou VHL.
Os genes e proteínas envolvidos na detecção metabólica incluem, mas não estão limitadas a, genes e proteínas exemplares fornecidos na Tabela 5. Tabela 5. Exemplos de genes de detecção metabólica (e proteínas codificadas). Nome Completo Metabólito Abreviação SEQ ID NO: fator 1α induzível por hi- Baixo teor de HIF-1α 16542 poxia oxigênio supressor de tumor von Baixo teor de VHL 16543 Hippel–Lindau oxigênio Proteínas de domínio de Alto teor de oxi- proteínas prolil-hidroxilase gênio PHD Transportador de glicose 1 glicose GLUT1 16544 Ligante de células T ativa- Aminoácido LAT 16545 das (leucina) glicoproteína CD98 Aminoácido CD98 16546 (leucina)
Nome Completo Metabólito Abreviação SEQ ID NO: transportador 2 preferen- Aminoácido Ca- ASCT2/Slc 16547 cial de Alanina, serina, cis- tiônico (Glutami- 1a5 teína na) membro 1 da família 7 de Aminoácidos Slc7a1 16548 transportador soluto Catiônicos membro 2 da família 7 de Aminoácidos Slc7a2 16549 transportador soluto Catiônicos membro 3 da família 7 de Aminoácidos Slc7a3 16550 transportador soluto Catiônicos membro 4 da família 7 de Aminoácidos Slc7a4 16551 transportador soluto Catiônicos membro 5 da família 7 de Aminoácidos as- Slc7a5 16552 transportador soluto sociados à gli- coproteína membro 6 da família 7 de Aminoácidos as- Slc7a6 16553 transportador soluto sociados à gli- coproteína membro 7 da família 7 de Aminoácidos as- Slc7a7 16554 transportador soluto sociados à gli- coproteína membro 8 da família 7 de Aminoácidos as- Slc7a8 16555 transportador soluto sociados à gli- coproteína membro 9 da família 7 de Aminoácidos as- Slc7a9 16556 transportador soluto sociados à gli- coproteína membro 10 da família 7 de Aminoácidos as- Slc7a10 16557 transportador soluto sociados à gli- coproteína membro 11 da família 7 de Aminoácidos as- Slc7a11 16558 transportador soluto sociados à gli- coproteína
Nome Completo Metabólito Abreviação SEQ ID NO: membro 13 da família 7 de Aminoácidos as- Slc7a13 16559 transportador soluto sociados à gli- coproteína membro 14 da família 7 de Aminoácidos Slc7a14 16560 transportador soluto Catiônicos Membro 2 da família 3 de Aminoácido Slc3a2 16561 transportador soluto Proteína 2 transportadora Aminoácido Ca- CAT2 16562 de cálcio tiônico (arginina) Proteína 3 transportadora Aminoácido Ca- CAT3 16563 de cálcio tiônico (arginina) Proteína 4 transportadora Aminoácido Ca- CAT4 16564 de cálcio tiônico (arginina) Bromodomínio adjacente à Aminoácido (ar- BAZ1B 16565 proteína 1B do domínio ginina) dedo de zinco Proteína de interação de Aminoácido (ar- PSIP1 16566 PC4 e SFRS1 ginina) Translina Aminoácido (ar- TSN 16567 ginina) Receptores acoplados à Ácido graxo e GPCRs proteína G Colesterol Receptor de célula T, su- Ácido Graxo e TCR alfa 16568 bunidade alfa Colesterol Receptor de célula T, su- Ácido Graxo e TCR beta 16569 bunidade beta Colesterol Receptor de célula T, su- Ácido Graxo e TCR zeta 16570 bunidade zeta Colesterol Receptor de célula T, su- Ácido Graxo e TCR CD3 16571 bunidade CD3 épsilon Colesterol épsilon Receptor de célula T, su- Ácido Graxo e TCR CD3 16572 bunidade CD3 gama Colesterol gama
Nome Completo Metabólito Abreviação SEQ ID NO: Receptor de célula T, su- Ácido Graxo e TCR CD3 16573 bunidade CD3 delta Colesterol delta receptores ativados por Ácido Graxo e PPARs proliferador de peroxisso- Colesterol ma Proteína cinase ativada Homeostase de AMPK 16574- por AMP energia (relação 16575 de AMP para ATP intracelular) Purinoceptor 7 P2X Homeostase P2X7 16576 Redox
[00741] Em algumas modalidades, uma célula T da presente inven- ção é modificada para silenciar ou reduzir a expressão de um ou mais genes codificando proteínas que conferem sensibilidade a uma terapia de câncer, incluindo um anticorpo monoclonal, para produzir uma célu- la T blindada da presente invenção. Desse modo, uma célula T blinda- da da presente invenção pode funcionar e pode demonstrar função ou eficácia superior, embora na presença de uma terapia de câncer (por exemplo, uma quimioterapia, uma terapia de anticorpo monoclonal ou outro tratamento antitumoral). As proteínas envolvidas em conferir sensibilidade a uma terapia contra o câncer incluem, mas não estão limitadas a, as proteínas exemplares fornecidas na Tabela 6. Tabela 6. Proteínas exemplares que conferem sensibilidade a um terapêutico contra o câncer.
Nome Completo Abreviação SEQ ID NO: ATPase 2 transportadora de cobre ATP7B 16577 Proteína da região de cluster de ponto BCR 16578 de interrupção Abelson tirosina-proteína cinase 1 ABL 16579 Proteína de resistência ao câncer de BCRP 16580 mama
Nome Completo Abreviação SEQ ID NO: Proteína de suscetibilidade tipo 1 do BRCA1 16581 câncer de mama Proteína de suscetibilidade tipo 2 do BRCA2 16582 câncer de mama Antígeno CAMPATH-1 CD52 16583 Citocromo P450 2D6 CYP2D6 16584 Deoxicitidina cinase dCK 16585 Di-hidrofolato DHFR 16586 Di-hidropirimidina desidrogenase DPYD 16587 [NADP(+)] Receptor de fator de crescimento epi- EGFR 16588 dérmico Proteína ERCC-1 de reparo de excisão ERCC1 16589 de DNA Receptor de estrogênio ESR 16590 Receptor III-A de região Fc de imuno- FCGR3A 16591 globulina gama de baixa afinidade Tirosina-proteína cinase erbB-2 recepto- HER2 ou 16592 ra ERBB2 Receptor de fator 1 de crescimento tipo IGF1R 16593 insulina GTPase KRas KRAS 16594 Proteína 1 de resistência a múltiplos MDR1 ou 16595 fármacos ABCB1 DNA metilado -- proteína-cisteína metil- MGMT 16596 transferase Proteína 1 associada à resistência a MRP1 ou 16597 múltiplos fármacos ABCC1 Receptor de Progesterona PGR 16598 Regulador de 10 de sinalização da pro- RGS10 16599 teína G Supressor de 3 de sinalização da citoci- SOCS-3 16600 na
Nome Completo Abreviação SEQ ID NO: Timidilato sintase TYMS 16601 UDP-glucuronosiltransferase 1-1 UGT1A1 16602
[00742] Em algumas modalidades, uma célula T da presente inven- ção é modificada para silenciar ou reduzir uma expressão de um ou mais genes que codificam um fator de vantagem de crescimento para produzir uma célula T blindada. Silenciar ou reduzir a expressão de um oncogene pode conferir uma vantagem de crescimento para uma célu- la T blindada da presente invenção. Por exemplo, silenciar ou reduzir a expressão (por exemplo, interromper a expressão) de um gene TET2 durante um processo de fabricação de CAR-T resulta na geração de um CAR-T blindado com uma capacidade significativa de expansão e subsequente erradicação de um tumor quando comparado a um CAR- T não blindado sem essa capacidade de expansão. Esta estratégia pode ser acoplada a um interruptor de segurança (por exemplo, um interruptor de segurança iC9 da presente invenção), que permite o rompimento direccionado de uma célula CAR-T blindada em caso de reação adversa de um indivíduo ou crescimento descontrolado do CAR-T blindado. Fatores de vantagem de crescimento exemplares in- cluem, mas não estão limitadas a, os fatores fornecidos na Tabela 7. Tabela 7. Fatores de vantagem de crescimento exemplares. Nome Completo Abreviação SEQ ID NO: Translocação 2 Dez Onze TET2 16603 DNA (citosina-5)-metiltransferase 3A DNMT3A 16604 proteína RhoA transformante RHOA 16605 Proto-oncogene vav VAV1 16606 Rombotina-2 LMO2 16607 proteína 1 de leukemia linfocítica aguda TAL1 16608 de célula T Supressor de sinalização 1 de citocina SOCS1 16609 mediador de entrada do herpes vírus HVEM 16610
Nome Completo Abreviação SEQ ID NO: gene 8 associado à morte de célula T TDAG8 16611 Correpressor BCL6 BCOR 16612 Atenuador de célula B e T BTLA 16613 Proteína 1 tipo SPARC SPARCL1 16614 Proteína semelhante à homeocaixa 1 MSX1 16615 Msh Estratégia de "receptor nulo ou comutador" de células T blinda- das
[00743] Em algumas modalidades, uma célula T da presente inven- ção é modificado para expressar um receptor de ponto de verificação modificado / quimérico para produzir uma célula T blindada da presen- te invenção.
[00744] Em algumas modalidades, o receptor de ponto de verifica- ção modificado / quimérico compreende um receptor nulo, receptor isca ou receptor negativo dominante. Um receptor nulo, receptor isca ou receptor dominante negativo da presente invenção pode ser um receptor / proteína modificada / quimérica. Um receptor nulo, receptor isca ou receptor dominante negativo da presente invenção pode ser truncado para a expressão do domínio de sinalização intracelular. Al- ternativamente, ou em adição, um receptor nulo, receptor isca ou re- ceptor dominante negativo da presente invenção pode ser mutado dentro de um domínio de sinalização intracelular em uma ou mais po- sições de aminoácido que são determinantes ou requeridas para uma sinalização eficaz. O truncamento ou mutação do receptor nulo, recep- tor isca ou receptor dominante negativo da presente invenção pode resultar na perda da capacidade do receptor de transmitir ou transduzir um sinal de checkpoint para uma célula ou dentro da célula.
[00745] Por exemplo, uma diluição ou um bloqueio de um sinal de ponto de verificação imunossupressor de um receptor PD-L1 expresso na superfície de uma célula tumoral pode ser alcançada pela expres-
são de um receptor PD-1 nulo modificado / quimérico na superfície de uma célula T blindada da presente invenção, que eficazmente compe- te com os receptores endógenos (não modificados) PD-1 também ex- pressos na superfície da célula T blindada para reduzir ou inibir a transdução do sinal de ponto de verificação imunossupressor através de receptores endógenos PD-1 da célula T blindada. Nesta modalida- de exemplar, a competição entre os dois receptores diferentes para a ligação a PD-L1 expresso na célula tumoral reduz ou diminui um nível de sinalização de ponto de verificação eficaz, aumentando assim um potencial terapêutico da célula T blindada que expressa o receptor nu- lo de PD-1.
[00746] Em algumas modalidades, o receptor de ponto de verifica- ção modificado / quimérico compreende um receptor nulo, receptor isca ou receptor negativo dominante que é um receptor transmembra- na.
[00747] Em algumas modalidades, o receptor de ponto de verifica- ção modificado / quimérico compreende um receptor nulo, receptor isca ou receptor negativo dominante que é um receptor / proteína as- sociado à membrana ou ligado à membrana.
[00748] Em algumas modalidades, o receptor de ponto de verifica- ção modificado / quimérico compreende um receptor nulo, receptor isca ou receptor negativo dominante que é um receptor / proteína in- tracelular.
[00749] Em algumas modalidades, o receptor de ponto de verifica- ção modificado / quimérico compreende um receptor nulo, receptor isca ou receptor negativo dominante que é um receptor / proteína in- tracelular. Os receptores / proteínas da presente invenção intracelula- res nulos, isca ou negativos dominantes incluem, mas não estão limi- tadas a, componentes de sinalização a jusante de um sinal de ponto de verificação inibitório (como fornecido, por exemplo, nas Tabelas 1 e
2), um fator de transcrição ( como fornecido, por exemplo, na Tabela 3), uma citocina ou um receptor de citocina, uma quimiocina ou um receptor de quimiocina, um receptor / ligante de morte celular ou apop- tose (como fornecido, por exemplo, na Tabela 4), uma detecção meta- bólica molécula (como fornecida, por exemplo, na Tabela 5), uma pro- teína conferindo sensibilidade a uma terapia do câncer (como forneci- da, por exemplo, na Tabela 6), e um oncogene ou um gene supressor de tumor (como fornecido, por exemplo, na Tabela 7). Citocinas exem- plares, receptores de citocinas, quimiocinas e receptores de quimioci- nas da presente invenção incluem, mas não estão limitadas a, as cito- cinas e receptores de citocinas, bem como quimiocinas e receptores de quimiocinas fornecidos na Tabela 8. Tabela 8. Exemplos de citocinas, receptores de citocinas, quimio- cinas e receptores de quimiocinas.
Nome Completo Abreviação SEQ ID NO: Ligante 4-1BB 4-1BBL 16616 Superfamília de receptor de fator de ne- Apo3 ou 16617 crose de tumor membro 25 TNFRSF25 Superfamília de receptor de fator de ne- APRIL ou 16618 crose de tumor membro 13 TNFRSF13 Agonista de morte celular associado a Bcl-xL ou 16619 Bcl2 BAD Membro 17 da superfamília de receptor BCMA ou 16620 de fator de necrose de tumor TNFRSF17 Quimiocina de motivo C-C 1 CCL1 16621 Quimiocina de motivo C-C 11 CCL11 16622 Quimiocina de motivo C-C 13 CCL13 16623 Quimiocina de motivo C-C 14 CCL14 16624 Quimiocina de motivo C-C 15 CCL15 16625 Quimiocina de motivo C-C 16 CCL16 16626 Quimiocina de motivo C-C 17 CCL17 16627 Quimiocina de motivo C-C 18 CCL18 16628
Nome Completo Abreviação SEQ ID NO: Quimiocina de motivo C-C 19 CCL19 16629 Quimiocina de motivo C-C 2 CCL2 16630 Quimiocina de motivo C-C 20 CCL20 16631 Quimiocina de motivo C-C 21 CCL21 16632 Quimiocina de motivo C-C 22 CCL22 16633 Quimiocina de motivo C-C 23 CCL23 16634 Quimiocina de motivo C-C 24 CCL24 16635 Quimiocina de motivo C-C 25 CCL25 16636 Quimiocina de motivo C-C 26 CCL26 16637 Quimiocina de motivo C-C 27 CCL27 16638 Quimiocina de motivo C-C 28 CCL28 16639 Quimiocina de motivo C-C 3 CCL3 16640 Quimiocina de motivo C-C 4 CCL4 16641 Quimiocina de motivo C-C 5 CCL5 16642 Quimiocina de motivo C-C 7 CCL7 16643 Quimiocina de motivo C-C 8 CCL8 16644 Receptor de quimiocina C-C tipo 1 CCR1 16645 Receptor de quimiocina C-C tipo 10 CCR10 16646 Receptor de quimiocina C-C tipo 11 CCR11 16647 Receptor de quimiocina C-C tipo 2 CCR2 16648 Receptor de quimiocina C-C tipo 3 CCR3 16649 Receptor de quimiocina C-C tipo 4 CCR4 16650 Receptor de quimiocina C-C tipo 5 CCR5 16651 Receptor de quimiocina C-C tipo 6 CCR6 16652 Receptor de quimiocina C-C tipo 7 CCR7 16653 Receptor de quimiocina C-C tipo 8 CCR8 16654 Receptor de quimiocina C-C tipo 9 CCR9 16655 Receptor de fator estimulador de colô- CD114 ou 16656 nia de granulócito CSF3R Receptor 1 estimulador de colônia de CD115 ou 16657 macrófago CSF1R
Nome Completo Abreviação SEQ ID NO: Subunidade alfa de receptor de fator es- CD116 ou 16658 timulador de colônia de granulócito- CSF2RA macrófago Kit de receptor de fator de crescimento CD117 ou 16659 de mastócito/célula-tronco KIT Receptor de fator inibitório de leucemia CD118 ou 16660
LIFR Membro 1A da superfamíla de receptor CD120a ou 16661 de fator de necrose de tumor TNFRSF1A Membro 1B da superfamíla de receptor CD120b ou 16662 de fator de necrose de tumor TNFRSF1B Tipo 1 de receptor de interleucina-1 CD121a ou 16663 IL1R1 Subunidade beta de receptor de inter- CD122 ou 16664 leucina 2 IL2RB Subunidade alfa de receptor de inter- CD123 ou 16665 leucina-3 IL3RA Subunidade alfa de receptor de inter- CD124 ou 16666 leucina 4 IL4R Subunidade alfa de receptor de inter- CD126 ou 16667 leucina 6 IL6R Subunidade alfa de receptor de inter- CD127 ou 16668 leucina 7 IL7R Subunidade beta de receptor de inter- CD130 ou 16669 leucina 6 IL6ST Subunidade gama comum de receptor CD132 ou 16670 de citocina IL2RG Membro 8 da superfamília de ligante de CD153 ou 16671 fator de necrose de tumor TNFSF8 Ligante CD40 CD154 ou 16672 CD40L Membro 6 da superfamília de ligante do CD178 ou 16673 fator de necrose de tumor FASLG
Nome Completo Abreviação SEQ ID NO: Subunidade beta-1 de receptor de inter- CD212 ou 16674 leucina 12 IL12RB1 Subunidade alfa-1 de receptor de inter- CD213a1 ou 16675 leucina 13 IL13RA1 Subunidade alfa-2 de receptor de inter- CD213a2 ou 16676 leucina 13 IL13RA2 Subunidade alfa de receptor de inter- CD25 ou 16677 leucina 2 IL2RA Antígeno CD27 CD27 16678 Membro 8 da superfamília de receptor CD30 ou 16679 de fator de necrose de tumor TNFRSF8 CD4 de glicoproteína de superfície de CD4 16680 célula T Membro 5 da superfamília de receptor CD40 ou 16681 de fator de necrose de tumor TNFRSF5 Antígeno CD70 CD70 16682 Membro 6 da superfamília de receptor CD95 ou 16683 de fator de necrose de tumor FAS ou FNFRSF6 Subunidade alfa de receptor de fator es- CDw116 ou 16684 timulador de colônia de granulócito- CSF2RA macrófago Receptor 1 de Interferon gama CDw119 ou 16685 IFNGR1 tipo 2 de receptor de interleucina-1 CDw121b ou 16686 IL1R2 subunidade alfa de receptor de interleu- CDw125 ou 16687 cina -5 IL5RA subunidade beta comum de receptor de CDw131 ou 16688 citocina CSF2RB Membro 9 da superfamília de receptor CDw137 ou 16689 de fator de necrose de tumor TNFRSF9 Receptor de interleucina 10 CDw210 ou 16690 IL10R
Nome Completo Abreviação SEQ ID NO: Receptor A de interleucina 17 CDw217 ou 16691 IL17RA Quimiocina 1 de motivo C-X3-C CX3CL1 16692 Receptor 1 de quimiocina CX3C CX3CR1 16693 Quimiocina de motivo C-X-C 1 CXCL1 16694 Quimiocina de motivo C-X-C 10 CXCL10 16695 Quimiocina de motivo C-X-C 11 CXCL11 16696 Quimiocina de motivo C-X-C 12 CXCL12 16697 Quimiocina de motivo C-X-C 13 CXCL13 16698 Quimiocina de motivo C-X-C 14 CXCL14 16699 Quimiocina de motivo C-X-C 16 CXCL16 16700 Quimiocina de motivo C-X-C 2 CXCL2 16701 Quimiocina de motivo C-X-C 3 CXCL3 16702 Quimiocina de motivo C-X-C 4 CXCL4 16703 Quimiocina de motivo C-X-C 5 CXCL5 16704 Quimiocina de motivo C-X-C 6 CXCL6 16705 Quimiocina de motivo C-X-C 7 CXCL7 16706 Quimiocina de motivo C-X-C 8 CXCL8 16707 Quimiocina de motivo C-X-C 9 CXCL9 16708 Receptor de quimiocina C-X-C tipo 1 CXCR1 16709 Receptor de quimiocina C-X-C tipo 2 CXCR2 16710 Receptor de quimiocina C-X-C tipo 3 CXCR3 16711 Receptor de quimiocina C-X-C tipo 4 CXCR4 16712 Receptor de quimiocina C-X-C tipo 5 CXCR5 16713 Receptor de quimiocina C-X-C tipo 6 CXCR6 16714 Receptor de quimiocina C-X-C tipo 7 CXCR7 16715 Receptor 1 de quimiocina atípica DARC ou 16716 ACKR1 Eritropoietina Epo 16717 Receptor de Eritropoietina EpoR 16718 Tirosina-proteína cinase tipo Receptor Flt-3 16719 FLT3
Nome Completo Abreviação SEQ ID NO: Ligante FLT3 Flt-3L 16720 Receptor de fator estimulador de colô- G-CSF ou 16721 nia de granulócito GSF3R Membro 18 da superfamília de receptor GITR ou 16722 de fator de necrose de tumor TNFRSF18 Ligante GITR GITRL 16723 Subunidade beta comum de receptor de GM-CSF ou 16724 citocina CSF2RB Subunidade beta de receptor de inter- gp130 ou 16725 leucina 6 IL6ST Membro 14 da superfamília de receptor HVEM ou 16726 de fator de necrose de tumor TNFRSF14 Interferon gama IFNγ 16727 Receptor 2 de Interferon gama IFNGR2 16728 Interferon-alfa IFN-α 16729 Interferon-beta IFN-β 16730 Interleucina-1 alfa IL1 16731 Interleucina-10 IL10 16732 Receptor de Interleucina 10 IL10R 16733 Interleucina-11 IL-11 16734 Receptor alfa de Interleucina 11 IL-11Ra 16735 Interleucina 12 IL12 16736 Interleucina 13 IL13 16737 Receptor de Interleucina 13 IL13R 16738 Interleucina 14 IL-14 16739 Interleucina 15 IL15 16740 Receptor alfa de Interleucina 15 IL-15Ra 16741 Interleucina 16 IL-16 16742 Interleucina 17 IL17 16743 Receptor de Interleucina 17 IL17R 16744 Interleucina 18 IL18 16745 receptor alfa de Interleucina 1 IL-1RA 16746 Interleucina 1 alfa IL-1α 16747
Nome Completo Abreviação SEQ ID NO: Interleucina 1beta IL-1β 16748 Interleucina 2 IL2 16749 Interleucina 20 IL-20 16750 receptor alfa de Interleucina 20 IL-20Rα 16751 receptor beta de Interleucina 20 IL-20Rβ 16752 Interleucina 21 IL21 16753 Interleucina 3 IL-3 16754 Interleucina 35 IL35 16755 Interleucina 4 IL4 16756 Receptor Interleucina 4 IL4R 16757 Interleucina 5 IL5 16758 Receptor Interleucina 5 IL5R 16759 Interleucina 6 IL6 16760 Receptor Interleucina 6 IL6R 16761 Interleucina 7 IL7 16762 Receptor Interleucina 9 IL-9R 16763 Fator inibitório de leucemia LIF 16764 Receptor de fator inibitório de leucemia LIFR 16765 Membro 14 da superfamília de fator de LIGHT ou 16766 necrose de tumor TNFSF14 Membro 3 da superfamília de receptor LTβR ou 16767 de fator de necrose de tumor TNFRSF3 Linfotoxina-beta LT-β 16768 Fator 1 estimulador de colônia de ma- M-CSF 16769 crófago Membro 11B da superfamíla de receptor OPG ou 16770 de fator de necrose de tumor TNFRSF11B Oncoestatinaa-M OSM 16771 Receptor de Oncoestatinaa-M OSMR 16772 Membro 4 da superfamília de receptor OX40 ou 16773 de fator de necrose de tumor TNFRSF4 Superfamília de ligante de fator de ne- OX40L ou 16774 crose de tumor membro 4 TNFSF4
Nome Completo Abreviação SEQ ID NO: Superfamília de receptor de fator de ne- RANK ou 16775 crose de tumor membro 11A TNFRSF11A Ligante de Kit SCF ou 16776
KITLG Membro 13B de superfamília de recep- TACI ou 16777 tor de fator de necrose de tumor TNFRSF13B Membro 13B de superfamília de ligante TALL-1 ou 16778 de fator de necrose de tumor TNFSF13B Receptor TGF-beta tipo-1 TGF-βR1 16779 Receptor TGF-beta tipo-2 TGF-βR2 16780 Receptor TGF-beta tipo-3 TGF-βR3 16781 Fator de crescimento transformante be- TGF-β1 16782 ta-1 Fator de crescimento transformante be- TGF-β2 16783 ta-2 Fator de crescimento transformante be- TGF-β3 16784 ta-3 Fator de necrose de tumor alfa TNF ou TNF- 16785 α Fator de necrose de tumor beta TNF-β 16786 Tireoide peroxidase Tpo 16787 Receptor de tireoide peroxidase TpoR 16788 Membro 10 de superfamília de ligante TRAIL ou 16789 de fator de necrose de tumor TNFSF10 Membro 10A de superfamília de recep- TRAILR1 ou 16790 tor de fator de necrose de tumor TNFRSF10A Membro 10B de superfamília de recep- TRAILR2 ou 16791 tor de fator de necrose de tumor TNFRSF10B Membro 11 de superfamília de ligante TRANCE ou 16792 de fator de necrose de tumor TNFSF11 Membro 12 de superfamília de ligante TWEAK ou 16793 de fator de necrose de tumor TNFSF11 Linfotactina XCL1 16794 Citocina SCM-1 beta XCL2 16795
[00750] Em algumas modalidades, o receptor do ponto de verifica- ção modifiado/quimérico compreende um receptor comutador. Exem- plos de receptores comutadores podem compreender uma proteína / receptor modificado/quimérico da presente invenção em que um domí- nio de sinalização intracelular nativo ou tipo selvagem é comutado ou substituído com um domínio de sinalização intracelular diferente que é não nativo para a proteína e/ou não é um domínio tipo selvagem. Por exemplo, substituição de um domínio de sinalização inibitória por um domínio de sinalização estimulatória mudaria um sinal imunossupres- sivo em um sinal imunoestimulatório. Alternativamente, substituição de um domínio de sinalização inibitória por um domínio inibitório diferente pode reduzir ou realçar o nível de sinalização inibitória. Expressão ou superexpressão, de um receptor comutador pode resultar na diluição e/ou bloqueio de um sinal do ponto de verificação cognato por meio de competição com um receptor do ponto de verificação tipo selvagem endógeno (não um receptor comutador) para ligação ao receptor de ponto de verificação cognato expresso no microambiente de tumor imunossupressivo. Células T blindadas da presente invenção podem compreender uma sequência codificando receptores comutadores da presente invenção, levando à expressão de um ou mais receptores comutadores da presente invenção, e consequentemente, alterando uma atividade de uma célula T blindada da presente invenção. Células T blindadas da presente invenção podem expressar um receptor co- mutador da presente invenção que se direciona a uma proteína intra- celularmente expressa a jusante de um receptor de ponto de verifica- ção, um fator de transcrição, um receptor de citocina, um receptor de morte, uma molécula de detecção metabólica, uma terapia de câncer, um oncogene, e/ou uma proteína supressora de tumor ou gene da presente invenção.
[00751] Exemplos de receptores comutadores da presente invenção podem compreender ou podem ser derivados de uma proteína incluin- do, mas não limitados a, os componentes de sinalização a jusante de um sinal de ponto de verificação inibitório (como fornecido, por exem- plo, nas Tabelas 1 e 2), um fator de transcrição (como fornecido, por exemplo, na Tabela 3), uma citocina ou um receptor de citocina, uma quimiocina ou um receptor de quimiocina, um ligante/receptor de morte celular ou apoptose (como fornecido, por exemplo, na Tabela 4), uma molécula de detecção metabólica (como fornecido, por exemplo, na Tabela 5), uma proteína que confere sensibilidade a uma terapia de câncer (como fornecido, por exemplo, na Tabela 6), e um oncogene ou um gene supressor de tumor (como fornecido, por exemplo, na Tabela 7). Exemplos de citocinas, receptores de citocina, quimiocinas e recep- tores de quimiocina da presente invenção incluem, mas não estão limi- tadas a, as citocinas e receptores de citocina bem como quimiocinas e receptores de quimiocina fornecidos na Tabela 8. Estratégia de "Expressão de Gene Sintética" de Células T Blinda- das
[00752] Em algumas modalidades, uma célula T da presente inven- ção é modificada para expressar receptor de ligante quimérico (CLR) ou um receptor de antígeno quimérico (CAR) que medeia expressão de gene condicional para produzir uma célula T blindada da presente invenção. A combinação do CLR/CAR e a condição do sistema de ex- pressão de gene no núcleo da célula T blindada constitui um sistema de expressão de gene sintética que é condicionalmente ativada após ligação de ligantes cognatos com CLR ou antígenos cognatos com CAR. Este sistema pode ajudar a ‘blindar’ ou realçar o potencial tera- pêutico de células T modificadas reduzindo ou limitando a expressão de gene sintética no sítio de ligação de ligante ou antígeno, em ou dentro do ambiente do tumor, por exemplo. Receptores Exógenos
[00753] Em algumas modalidades, a célula T blindada compreende uma composição compreendendo (a) uma construção de transgene induzível, compreendendo uma sequência codificando um promotor induzível e uma sequência codificando um transgene, e (b) uma cons- trução receptora, compreendendo uma sequência codificando um promotor constitutivo e uma sequência codificando um receptor exó- geno, tal como um CLR ou CAR, em que, após integração da constru- ção de (a) e a construção de (b) em uma sequência genômica de uma célula, o receptor exógeno é expresso, e em que o receptor exógeno, após ligação a um ligante ou antígeno, transduz um sinal intracelular que se direciona direta ou indiretamente ao promotor induzível regu- lando a expressão do transgene induzível (a) para modificar a expres- são de gene.
[00754] Em algumas modalidades de um sistema de expressão de gene sintética da presente invenção, a composição modifica a expres- são de gene reduzindo a gene expressão. Em algumas modalidades, a composição modifica a expressão de gene transitoriamente modifican- do a expressão de gene (por exemplo, ao longo da duração da ligação do ligante ao receptor exógeno). Em algumas modalidades, a compo- sição modifica a expressão de gene precisamente (por exemplo, o li- gante reversivelmente se liga ao receptor exógeno). Em algumas mo- dalidades, a composição modifica a expressão de gene cronicamente (por exemplo, o ligante irreversivelmente se liga ao receptor exógeno).
[00755] Em algumas modalidades das composições da presente invenção, o receptor exógeno de (b) compreende um receptor endó- geno com respeito à sequência genômica da célula. Exemplos de re- ceptores incluem, mas não estão limitados a, receptores intracelulares, receptores de superfície celular, receptores de transmembrana, canais de íon fechados por ligante, e receptores acoplados à proteína G.
[00756] Em algumas modalidades das composições da presente invenção, o receptor exógeno de (b) compreende a receptor de ocor- rência não natural. Em algumas modalidades, o receptor de ocorrência não natural é um receptor sintético, modificado, recombinante, mutante ou quimérico. Em algumas modalidades, o receptor de ocorrência não natural compreende uma ou mais sequências isoladas ou derivadas de um receptor de célula T (TCR). Em algumas modalidades, o receptor de ocorrência não natural compreende uma ou mais sequências isola- das ou derivadas de uma proteína estrutura. Em algumas modalida- des, incluindo aquelas em que o receptor de ocorrência não natural não compreende um domínio de transmembrana, o receptor de ocor- rência não natural interage com uma segunda transmembrana, recep- tor ligado à membrana e/ou um receptor intracelular que após contato com o receptor de ocorrência não natural, transduz um sinal intracelu- lar.
[00757] Em algumas modalidades das composições da presente invenção, o receptor exógeno de (b) compreende a receptor de ocor- rência não natural. Em algumas modalidades, o receptor de ocorrência não natural é um receptor sintético, modificado, recombinante, mutante ou quimérico. Em algumas modalidades, o receptor de ocorrência não natural compreende uma ou mais sequências isoladas ou derivadas de um receptor de célula T (TCR). Em algumas modalidades, o receptor de ocorrência não natural compreende uma ou mais sequências isola- das ou derivadas de uma proteína estrutura. Em algumas modalida- des, o receptor de ocorrência não natural compreende a domínio de transmembrana. Em algumas modalidades, o receptor de ocorrência não natural interage com um receptor intracelular que transduz um si- nal intracelular. Em algumas modalidades, o receptor de ocorrência não natural compreende um domínio de sinalização intracelular. Em algumas modalidades, o receptor de ocorrência não natural é um re- ceptor de ligante quimérico (CLR). Em algumas modalidades, o CLR é um receptor de antígeno quimérico (CAR).
[00758] Em algumas modalidades das composições da presente invenção, o receptor exógeno de (b) compreende a receptor de ocor- rência não natural. Em algumas modalidades, o CLR é um receptor de antígeno quimérico (CAR). Em algumas modalidades, o receptor de ligante quimérico compreende (a) um ectodomínio compreendendo uma região de reconhecimento do ligante, em que a região de reco- nhecimento do ligante compreende pelo menos proteína estrutura; (b) um domínio de transmembrana, e (c) um endodomínio compreenden- do pelo menos um domínio coestimulatório. Em algumas modalidades, o ectodomínio de (a) também compreende um peptídeo sinal. Em al- gumas modalidades, o ectodomínio de (a) também compreende uma articulação entre a região de reconhecimento do ligante e o domínio de transmembrana.
[00759] Em algumas modalidades dos CLR/CARs da presente in- venção, o peptídeo sinal compreende uma sequência codificando um peptídeo sinal CD2, CD3δ, CD3ε, CD3γ, CD3ζ, CD4, CD8α, CD19, CD28, 4-1BB or GM-CSFR humano. Em algumas modalidades, o pep- tídeo sinal compreende uma sequência codificando um peptídeo sinal CD8α humano. Em algumas modalidades, o peptídeo sinal compreen- de uma sequência de aminoácido compreendendo MALPVTALLL- PLALLLHAARP(SEQ ID NO: 18004). Em algumas modalidades, o peptídeo sinal é codificado por uma sequência de ácido nucleico com- preendendo atggcactgccagtcaccgccctgctgctgcctctggctctgctgctgcacg- cagctagacca.
[00760] Em algumas modalidades dos CLR/CARs da presente in- venção, o domínio de transmembrana compreende uma sequência codificando um domínio de transmembrana CD2, CD3δ, CD3ε, CD3γ, CD3ζ, CD4, CD8α, CD19, CD28, 4-1BB ou domínio GM-CSFR huma- no. Em algumas modalidades, o domínio de transmembrana compre-
ende uma sequência codificando um domínio de transmembrana CD8α humano. Em algumas modalidades, o domínio de transmembra- na compreende uma sequência de aminoácido compreendendo IYI- WAPLAGTCGVLLLSLVITLYC(SEQ ID NO: 18006). Em algumas mo- dalidades, o domínio de transmembrana é codificado por uma sequên- cia de ácido nucleico compreendendo atctacatttgggcaccactggccgggacctgtggagtgctgctgctgagcctggtcatcacactgt actgc (SEQ ID NO: 18007).
[00761] Em algumas modalidades dos CLR/CARs da presente in- venção, o endodomínio compreende um endodomínio CD3ζ humano. Em algumas modalidades, o referido pelo menos um domínio coesti- mulatório compreende um segmento intracelular 4-1BB, CD28, CD40, ICOS, MyD88, OX-40 humano, ou qualquer combinação dos mesmos. Em algumas modalidades, o referido pelo menos um domínio coesti- mulatório compreende um domínio coestimulatório CD28 e/ou um 4- 1BB humano. Em algumas modalidades, o domínio coestimulatório CD3ζ compreende uma sequência de aminoácido compreendendo
RVKFSRSADAPAYKQGQNQLYNELNLGRREEYDVLDKRRGRDPEM
GGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLY QGLSTATKDTYDALHMQALPPR(SEQ ID NO: 18008). Em algumas modalidades, o domínio coestimulatório CD3ζé codificado por uma sequência de ácido nucleico compreendendo cgcgtgaagtttagtcgatcagcagatgccccagcttacaaacagggacagaaccagctgtata acgagctgaatctgggccgccgagaggaatatgacgtgctggataagcggagaggacgcgac cccgaaatgggaggcaagcccaggcgcaaaaaccctcaggaaggcctgtataacgagctgc agaaggacaaaatggcagaagcctattctgagatcggcatgaagggggagcgacggagagg caaagggcacgatgggctgtaccagggactgagcaccgccacaaaggacacctatgatgctct gcatatgcaggcactgcctccaagg (SEQ ID NO: 18010). Em algumas modalidades, o domínio coestimulatório 4-1BB compre- ende uma sequência de aminoácido compreendendo KRGRKKLLYIF-
KQPFMRPVQTTQEEDGCSCRFPEEEEGGCEL (SEQ ID NO: 18011). Em algumas modalidades, o domínio coestimulatório 4-1BB é codifica- do por uma sequência de ácido nucleico compreendendo aagagaggcaggaagaaactgctgtatattttcaaacagcccttcatgcgccccgtgcagactac ccaggaggaagacgggtgctcctgtcgattccctgaggaagaggaaggcgggtgtgagctg(S EQ ID NO: 18013). Em algumas modalidades, o domínio coestimulatório 4-1BB é localiza- do entre o domínio de transmembrana e o domínio coestimulatório CD28.
[00762] Em algumas modalidades dos CLR/CARs da presente in- venção, a articulação compreende uma sequência derivada de uma sequência CD8α, IgG4, e/ou CD4 humana. Em algumas modalidades, a articulação compreende uma sequência derivada de uma sequência CD8α humana. Em algumas modalidades, a articulação compreende uma sequência de aminoácido compreendendo
TTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACD (SEQ ID NO: 18014). Em algumas modalidades, a articulação é codifi- cado por uma sequência de ácido nucleico compreendendo
ACCACAACCCCTGCCCCCAGACCTCCCACACCCGCCCCTACCAT CGCGAGTCAGCCCCTGAGTCTGAGACCTGAGGCCTGCAGGCCAG
CTGCAGGAGGAGCTGTGCACACCAGGGGCCTGGACTTCGCCTGC GAC(SEQ ID NO: 18016) ou
ACCACAACCCCTGCCCCCAGACCTCCCACACCCGCCCCTACCAT CGCGAGTCAGCCCCTGAGTCTGAGACCTGAGGCCTGCAGGCCAG
CTGCAGGAGGAGCTGTGCACACCAGGGGCCTGGACTTCGCCTGC GAC (SEQ ID NO: 18017). Em algumas modalidades, a referida pelo menos uma estrutura de proteína especificamente se liga ao ligante.
[00763] Em algumas modalidades das composições da presente invenção, o receptor exógeno de (b) compreende a receptor de ocor-
rência não natural. Em algumas modalidades, o CLR é um receptor de antígeno quimérico (CAR). Em algumas modalidades, o receptor de ligante quimérico compreende (a) um ectodomínio compreendendo uma região de reconhecimento do ligante, em que a região de reco- nhecimento do ligante compreende pelo menos proteína estrutura; (b) um domínio de transmembrana, e (c) um endodomínio compreenden- do pelo menos um domínio coestimulatório. Em algumas modalidades, a pelo menos uma estrutura de proteína compreende um anticorpo, um fragmento de anticorpo, um anticorpo de domínio único, um anti- corpo de cadeia única, um mimético de anticorpo, ou uma Centirina (referida aqui como uma CARTirina). Em algumas modalidades, a re- gião de reconhecimento do ligante compreende um ou mais dentre um anticorpo, um fragmento de anticorpo, um anticorpo de domínio único, um anticorpo de cadeia única, um mimético de anticorpo, e uma Centi- rina. Em algumas modalidades, o anticorpo de domínio único compre- ende ou consiste em um VHH ou um VH (referido aqui como um VCAR). Em algumas modalidades, o anticorpo de domínio único com- preende ou consiste em uma VHH ou uma VH compreendendo regi- ões de determinação de complementaridade humana (CDRs). Em al- gumas modalidades, a VH é uma proteína recombinante ou quimérica. Em algumas modalidades, a VH é uma proteína humana recombinante ou quimérica. Em algumas modalidades, o mimético de anticorpo compreende ou consiste em um aficorpo, uma afilina, um afímero, uma afitina, um alfacorpo, uma anticalina, um avímero, uma DARPina, um finômero, um peptídeo de domínio Kunitz ou um monocorpo. Em al- gumas modalidades, uma Centirina compreende ou consiste em uma sequência de consenso de pelo menos um domínio de fibronectina tipo III (FN3).
[00764] Em algumas modalidades das composições da presente invenção, o receptor exógeno de (b) compreende a receptor de ocor-
rência não natural.
Em algumas modalidades, o CLR é um receptor de antígeno quimérico (CAR). Em algumas modalidades, o receptor de ligante quimérico compreende (a) um ectodomínio compreendendo uma região de reconhecimento do ligante, em que a região de reco- nhecimento do ligante compreende pelo menos proteína estrutura; (b) um domínio de transmembrana, e (c) um endodomínio compreenden- do pelo menos um domínio coestimulatório.
Em algumas modalidades, uma Centirina compreende ou consiste em uma sequência de consen- so de pelo menos um domínio de fibronectina tipo III (FN3). Em algu- mas modalidades, o referido pelo menos um domínio de fibronectina tipo III (FN3) é derivado de uma proteína humana.
Em algumas moda- lidades, a proteína humana é Tenascin-C.
Em algumas modalidades, a sequência de consenso compreende LPAPKNLVVSEVTEDSLRLSW- TAPDAAFDSFLIQYQESEKVGEAINLTVPGSERSYDLTGLKPG- TEYTVSIYGVKGGHRSNPLSAEFTT (SEQ ID NO: 18018). Em algu- mas modalidades, a sequência de consenso compreende MLPAPKN- LVVSEVTEDSLRLSWTAPDAAFDSFLIQYQESEKVGEAINLTV- PGSERSYDLTGLKPGTEYTVSIYGVKGGHRSNPLSAEFTT (SEQ ID NO: 18019). Em algumas modalidades, a sequência de consenso é modificada em uma ou mais posições dentro de (a) uma alça A-B compreendendo ou consistindo nos resíduos de aminoácido TEDS (SEQ ID NO:18020) nas posições 13 a 16 da sequência de consenso; (b) uma alça B-C compreendendo ou consistindo nos resíduos de ami- noácido TAPDAAF (SEQ ID NO:18021) nas posições 22-28 da se- quência de consenso; (c) uma alça C-D compreendendo ou consistin- do nos resíduos de aminoácido SEKVGE (SEQ ID NO:18022) nas po- sições 38 a 43 da sequência de consenso; (d) uma alça D-E compre- endendo ou consistindo nos resíduos de aminoácido GSER (SEQ ID NO:18023) nas posições 51 a 54 da sequência de consenso; (e) uma alça E-F compreendendo ou consistindo nos resíduos de aminoácido
GLKPG (SEQ ID NO:18024) nas posições 60 a 64 da sequência de consenso; (f) uma alça F-G compreendendo ou consistindo nos resí- duos de aminoácido KGGHRSN (SEQ ID NO:18025) nas posições 75 a 81 da sequência de consenso; ou (g) qualquer combinação de (a)-(f). Em algumas modalidades, uma Centirina compreende uma sequência de consenso de pelo menos 5 domínios de fibronectina tipo III (FN3). Em algumas modalidades, uma Centirina compreende uma sequência de consenso de pelo menos 10 domínios de fibronectina tipo III (FN3). Em algumas modalidades, uma Centirina compreende uma sequência de consenso de pelo menos 15 domínios de fibronectina tipo III (FN3). Em algumas modalidades, a estrutura liga-se a um antígeno com pelo menos uma afinidade selecionada de um KD menor que ou igual a 10−9M, menor que ou igual a 10−10M, menor que ou igual a 10−11M, menor que ou igual a 10−12M, menor que ou igual a 10−13M, menor que ou igual a 10−14M, e menor que ou igual a 10−15M. Em algumas moda- lidades, o KD é determinado por ressonância de plasmônio de superfí- cie. Promotores Induzíveis
[00765] Em algumas modalidades das composições da presente invenção, a sequência codificando o promotor induzível de (a) com- preende uma sequência codificando um NFĸB promoter. Em algumas modalidades das composições da presente invenção, a sequência co- dificando o promotor induzível de (a) compreende uma sequência codi- ficando um promotor de interferon (IFN) ou uma sequência codificando um promotor de Interleucina 2. Em algumas modalidades, o promotor de interferon (IFN) é um promotor de IFNy. Em algumas modalidades das composições da presente invenção, o promotor induzível é isolado ou derivado do promotor de uma citocina ou quimiocina. Em algumas modalidades, a citocina ou quimiocina compreende IL2, IL3, IL4, IL5, IL6, IL10, IL12, IL13, IL17A/F, IL21, IL22, IL23, fator de crescimento transformante beta (TGFβ), fator 2 de estimulação de colônia (GM- CSF), interferon gama (IFNγ), Fator de necrose de tumor (TNFα), LTα, perforina, Granzima C (Gzmc), Granzima B (Gzmb), ligante 5 de qui- miocina de motivo C-C (CCL5), Ligante 4 de quimiocina de motivo C-C (Ccl4), Quimiocina ligante 3 de motivo C-C (Ccl3), ligante 1 de quimio- cina de motivo X-C (Xcl1) e citocina da família da interleucina 6 LIF (Lif).
[00766] Em algumas modalidades das composições da presente invenção, o promotor induzível é isolado ou derivado do promotor de um gene compreendendo uma proteína de superfície envolvida em diferenciação, ativação, exaustão e função celular. Em algumas moda- lidades, o gene compreende CD69, CD71, CTLA4, PD-1, TIGIT, LAG3, TIM-3, GITR, MHCII, COX-2, FASL e 4-1BB. Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO A1BG Glicoproteína Alfa-1-B SEQ ID NOS: 1 - 2 A2M Macroglobulina Alfa-2 SEQ ID NOS: 3 - 6 A2ML1 Maroglobulina Alfa-2 tipo 1 SEQ ID NOS: 7 - 12 A4GNT Alfa-1,4-N- SEQ ID NO: 13 acetilglucosaminiltransferase AADACL2 Arilacetamida desacetilase tipo SEQ ID NOS: 14 - 2 15 AANAT Aralquilamina N- SEQ ID NOS: 16 - acetiltransferase 19 ABCG1 Cassete de ligação a ATP, sub- SEQ ID NOS: 20 - família G (WHITE), membro 1 26 ABHD1 Domínio de Abhidrolase con- SEQ ID NOS: 27 - tendo 1 31 ABHD10 Domínio de Abhidrolase con- SEQ ID NOS: 32 - tendo 10 35 ABHD14A Domínio de Abhidrolase con- SEQ ID NOS: 36 - tendo 14A 40
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO ABHD15 Domínio de Abhidrolase con- SEQ ID NO: 41 tendo 15 ABI3BP Proteína de ligação à família SEQ ID NOS: 42 - ABI, membro 3 (NESH) 63 AC008641.1 SEQ ID NO: 73 AC009133.22 SEQ ID NO: 76 AC009491.2 SEQ ID NO: 77 AC011513.3 SEQ ID NOS: 92 - 93 AC136352.5 SEQ ID NO: 88 AC145212.4 Proteína de interação de MaFF SEQ ID NO: 90 AC233755.1 SEQ ID NO: 91 ACACB Acetil-CoA carboxilase beta SEQ ID NOS: 94 - 100 ACAN Agrecano SEQ ID NOS: 101 - 108 ACE Enzima conversora de angio- SEQ ID NOS: 109 - tensina 1 121 ACHE Acetilcolinesterase (grupo san- SEQ ID NOS: 122 - guine Yt) 134 ACP2 Fosfatase ácida 2, lisossômica SEQ ID NOS: 135 - 142 ACP5 Fosfatase ácida 5, resistente SEQ ID NOS: 143 - ao tartarato 151 ACP6 Fosfatase ácida 6, lisofosfatídi- SEQ ID NOS: 152 - ca 158 ACPP Fosfatase ácida, próstata SEQ ID NOS: 163 - 167 ACR Acrosina SEQ ID NOS: 168 - 169 ACRBP Proteína de ligação à acrosina SEQ ID NOS: 170 - 174
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO ACRV1 Proteína 1 de vesícula acros- SEQ ID NOS: 175 - sômica 178 ACSF2 Membro 2 da família Acil-CoA SEQ ID NOS: 179 - Sintetase 187 ACTL10 Actina tipo 10 SEQ ID NO: 188 ACVR1 Receptor de Activina A, tipo I SEQ ID NOS: 189 - 197 ACVR1C Receptor de Activina A, tipo IC SEQ ID NOS: 198 - 201 ACVRL1 Receptor de Activina A tipo II - SEQ ID NOS: 202 - tipo 1 207 ACYP1 Acilfosfatase 1, tipo eritrócito SEQ ID NOS: 208 - (comum) 213 ACYP2 Acilfosfatase 2, tipo músculo SEQ ID NOS: 214 - 221 ADAM10 Domínio de ADAM metalopep- SEQ ID NOS: 230 - tidase 10 237 ADAM12 Domínio de ADAM metalopep- SEQ ID NOS: 238 - tidase 12 240 ADAM15 Domínio de ADAM metalopep- SEQ ID NOS: 241 - tidase 15 252 ADAM17 Domínio de ADAM metalopep- SEQ ID NOS: 253 - tidase 17 255 ADAM18 Domínio de ADAM metalopep- SEQ ID NOS: 256 - tidase 18 260 ADAM22 Domínio de ADAM metalopep- SEQ ID NOS: 261 - tidase 22 269 ADAM28 Domínio de ADAM metalopep- SEQ ID NOS: 270 - tidase 28 275 ADAM29 Domínio de ADAM metalopep- SEQ ID NOS: 276 - tidase 29 284 ADAM32 Domínio de ADAM metalopep- SEQ ID NOS: 285 - tidase 32 291
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO ADAM33 Domínio de ADAM metalopep- SEQ ID NOS: 292 - tidase 33 296 ADAM7 Domínio de ADAM metalopep- SEQ ID NOS: 297 - tidase 7 300 ADAM8 Domínio de ADAM metalopep- SEQ ID NOS: 301 - tidase 8 305 ADAM9 Domínio de ADAM metalopep- SEQ ID NOS: 306 - tidase 9 311 ADAMDEC1 ADAM-like, decysin 1 SEQ ID NOS: 312 - 314 ADAMTS1 ADAM metalopeptidase com SEQ ID NOS: 315 - motivo trombospondina tipo 1, 318 1 ADAMTS10 ADAM metalopeptidase com SEQ ID NOS: 319 - motivo trombospondina tipo 1, 324 10 ADAMTS12 ADAM metalopeptidase com SEQ ID NOS: 325 - motivo trombospondina tipo 1, 327 12 ADAMTS13 ADAM metalopeptidase com SEQ ID NOS: 328 - motivo trombospondina tipo 1, 335 13 ADAMTS14 ADAM metalopeptidase com SEQ ID NOS: 336 - motivo trombospondina tipo 1, 337 14 ADAMTS15 ADAM metalopeptidase com SEQ ID NO: 338 motivo trombospondina tipo 1, 15 ADAMTS16 ADAM metalopeptidase com SEQ ID NOS: 339 - motivo trombospondina tipo 1, 340 16 ADAMTS17 ADAM metalopeptidase com SEQ ID NOS: 341 - motivo trombospondina tipo 1, 344 17
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO ADAMTS18 ADAM metalopeptidase com SEQ ID NOS: 345 - motivo trombospondina tipo 1, 348 18 ADAMTS19 ADAM metalopeptidase com SEQ ID NOS: 349 - motivo trombospondina tipo 1, 352 19 ADAMTS2 ADAM metalopeptidase com SEQ ID NOS: 353 - motivo trombospondina tipo 1, 355 2 ADAMTS20 ADAM metalopeptidase com SEQ ID NOS: 356 - motivo trombospondina tipo 1, 359 20 ADAMTS3 ADAM metalopeptidase com SEQ ID NOS: 360 - motivo trombospondina tipo 1, 361 3 ADAMTS5 ADAM metalopeptidase com SEQ ID NO: 362 motivo trombospondina tipo 1, 5 ADAMTS6 ADAM metalopeptidase com SEQ ID NOS: 363 - motivo trombospondina tipo 1, 364 6 ADAMTS7 ADAM metalopeptidase com SEQ ID NO: 365 motivo trombospondina tipo 1, 7 ADAMTS8 ADAM metalopeptidase com SEQ ID NO: 366 motivo trombospondina tipo 1, 8 ADAMTS9 ADAM metalopeptidase com SEQ ID NOS: 367 - motivo trombospondina tipo 1, 371 9 ADAMTSL1 ADAMTS - tipo 1 SEQ ID NOS: 372 - 382 ADAMTSL2 ADAMTS-tipo 2 SEQ ID NOS: 383 - 385
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO ADAMTSL3 ADAMTS-tipo 3 SEQ ID NOS: 386 - 387 ADAMTSL4 ADAMTS-tipo 4 SEQ ID NOS: 388 - 391 ADAMTSL5 ADAMTS-tipo 5 SEQ ID NOS: 392 - 397 ADCK1 Cinase 1 contendo domínio SEQ ID NOS: 398 - AarF 402 ADCYAP1 Polipeptídeo 1 de ativação de SEQ ID NOS: 403 - adenilato ciclase (pituitária) 404 ADCYAP1R1 Polipeptídeo 1 de ativação de SEQ ID NOS: 405 - adenilato ciclase (pituitária) re- 411 ceptor tipo I ADGRA3 Receptor acoplado à proteína SEQ ID NOS: 412 - G de adesão A3 416 ADGRB2 Receptor acoplado à proteína SEQ ID NOS: 417 - G de adesão B2 425 ADGRD1 Receptor acoplado à proteína SEQ ID NOS: 426 - G de adesão D1 431 ADGRE3 Receptor acoplado à proteína SEQ ID NOS: 432 - G de adesão E3 436 ADGRE5 Receptor acoplado à proteína SEQ ID NOS: 437 - G de adesão E5 442 ADGRF1 Receptor acoplado à proteína SEQ ID NOS: 443 - G de adesão F1 447 ADGRG1 Receptor acoplado à proteína SEQ ID NOS: 448 - G de adesão G1 512 ADGRG5 Receptor acoplado à proteína SEQ ID NOS: 513 - G de adesão G5 515 ADGRG6 Receptor acoplado à proteína SEQ ID NOS: 516 - G de adesão G6 523 ADGRV1 Receptor acoplado à proteína SEQ ID NOS: 524 - G de adesão V1 540
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO ADI1 Acireductona dioxigenase 1 SEQ ID NOS: 541 - 543 ADIG Adipogenina SEQ ID NOS: 544 - 547 ADIPOQ Adiponectina, contendo domí- SEQ ID NOS: 548 - nio de C1Q e colágeno 549 ADM Adrenomedulina SEQ ID NOS: 550 - 557 ADM2 Adrenomedulina 2 SEQ ID NOS: 558 - 559 ADM5 Adrenomedulina 5 (putativa) SEQ ID NO: 560 ADPGK Glucocinase dependente de SEQ ID NOS: 561 - ADP 570 ADPRHL2 ADP-ribosilhidrolase tipo 2 SEQ ID NO: 571 AEBP1 Proteína 1 de ligação a AE SEQ ID NOS: 572 - 579 AFM Afamina SEQ ID NO: 584 AFP Alfa-fetoproteína SEQ ID NOS: 585 - 586 AGA Aspartilglucosaminidase SEQ ID NOS: 587 - 589 AGER Receptor específico de produto SEQ ID NOS: 590 - final de glicosilação avançada 600 AGK Acilglicerol cinase SEQ ID NOS: 601 - 606 AGPS Alquilglicerona fosfato sintase SEQ ID NOS: 607 - 610 AGR2 Gradiente 2 anterior, membro SEQ ID NOS: 611 - da família proteína dissulfeto 614 isomerase AGR3 Gradiente 3 anterior, membro SEQ ID NOS: 615 - da família proteína dissulfeto 617 isomerase
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO AGRN Agrina SEQ ID NOS: 618 - 621 AGRP Neuropeptídeo relacionado SEQ ID NO: 622 com Agouti AGT Angiotensinogênio (inibidor de SEQ ID NO: 623 serpina peptidase, clade A, membro 8) AGTPBP1 Proteína 1 de ligação a SEQ ID NOS: 624 - ATP/GTP 627 AGTRAP Proteína associada ao receptor SEQ ID NOS: 628 - de angiotensina II 635 AHCYL2 Adenosilhomocisteinase tipo 2 SEQ ID NOS: 636 - 642 AHSG Alfa-2-HS-glicoproteína SEQ ID NOS: 643 - 644 AIG1 1 induzido por androgênio SEQ ID NOS: 645 - 653 AK4 Adenilato cinase 4 SEQ ID NOS: 654 - 657 AKAP10 Uma proteína 10 âncora de ci- SEQ ID NOS: 658 - nase (PRKA) 666 AKR1C1 Família 1 de Aldo-ceto redu- SEQ ID NOS: 667 - tase, membro C1 669 AL356289.1 SEQ ID NO: 677 AL589743.1 SEQ ID NO: 678 ALAS2 5'-aminolevulinato sintase 2 SEQ ID NOS: 684 - 691 ALB Albumina SEQ ID NOS: 692 - 701 ALDH9A1 família de aldeído desidroge- SEQ ID NO: 702 nase 9, membro A1 ALDOA Aldolase A, frutose-bisfosfato SEQ ID NOS: 703 - 717
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO ALG1 ALG1, quiitobiosildifosfodolicol SEQ ID NOS: 718 - beta-manosiltransferase 723 ALG5 ALG5, doliquil-fosfato beta- SEQ ID NOS: 724 - glicosiltransferase 725 ALG9 ALG9, alfa-1,2- SEQ ID NOS: 726 - manosiltransferase 736 ALKBH1 Homólogo 1 AlkB, histona H2A SEQ ID NOS: 746 - dioxigenase 748 ALKBH5 Homólogo 5 AlkB, RNA desme- SEQ ID NOS: 749 - tilase 750 ALPI Fosfatase alcalina, intestinal SEQ ID NOS: 751 - 752 ALPL Fosfatase alcalina, fíga- SEQ ID NOS: 753 - do/osso/rim 757 ALPP Fosfatase alcalina, placental SEQ ID NO: 758 ALPPL2 Fosfatase alcalina, placental- SEQ ID NO: 759 tipo 2 AMBN Ameloblastina (proteína matriz SEQ ID NOS: 760 - do esmalte) 762 AMBP precursor alfa-1-microglobulina SEQ ID NOS: 763 - / bicunina 765 AMELX Amelogenina, ligada a X SEQ ID NOS: 766 - 768 AMELY Amelogenina, ligada a Y SEQ ID NOS: 769 - 770 AMH Hormônio anti-muleriano SEQ ID NO: 771 AMICA1 Molécula de adesão, interage SEQ ID NOS: 7348 com o antígeno 1 de CXADR - 7356 AMPD1 Adenosina monofosfato desa- SEQ ID NOS: 772 - minase 1 774 AMTN Amelotina SEQ ID NOS: 775 - 776
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO AMY1A Amilase, alfa 1A (salivar) SEQ ID NOS: 777 - 779 AMY1B Amilase, alfa 1B (salivar) SEQ ID NOS: 780 - 783 AMY1C Amilase, alfa 1C (salivar) SEQ ID NO: 784 AMY2A Amilase, alfa 2A (pancreática) SEQ ID NOS: 785 - 787 AMY2B Amilase, alfa 2B (pancreática) SEQ ID NOS: 788 - 792 ANG Angiogenina, ribonuclease, fa- SEQ ID NOS: 793 - mília RNase A, 5 794 ANGEL1 Homólogo 1 Angel (Drosophila) SEQ ID NOS: 795 - 798 ANGPT1 Angiopoietina 1 SEQ ID NOS: 799 - 803 ANGPT2 Angiopoietina 2 SEQ ID NOS: 804 - 807 ANGPT4 Angiopoietina 4 SEQ ID NO: 808 ANGPTL1 Angiopoietina tipo 1 SEQ ID NOS: 809 - 811 ANGPTL2 Angiopoietina tipo 2 SEQ ID NOS: 812 - 813 ANGPTL3 Angiopoietina tipo 3 SEQ ID NO: 814 ANGPTL4 Angiopoietina tipo 4 SEQ ID NOS: 815 - 822 ANGPTL5 Angiopoietina tipo 5 SEQ ID NOS: 823 - 824 ANGPTL6 Angiopoietina tipo 6 SEQ ID NOS: 825 - 827 ANGPTL7 Angiopoietina tipo 7 SEQ ID NO: 828 ANK1 Anquirina 1, eritrocítica SEQ ID NOS: 833 - 843
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO ANKDD1A Repetição de ancirina e domí- SEQ ID NOS: 844 - nio de morte contendo 1A 850 ANKRD54 Domínio 54 de repetição de SEQ ID NOS: 851 - ancirina 859 ANKRD60 Domínio 60 de repetição de SEQ ID NO: 860 ancirina ANO7 Anoctamina 7 SEQ ID NOS: 861 - 864 ANO1 #N/A SEQ ID NO: 865 ANTXR1 Receptor 1 de toxina antraz SEQ ID NOS: 866 - 869 AOAH Aciloxiacil hidrolase (neutrófilo) SEQ ID NOS: 870 - 874 AOC1 Amina oxidase, 1 contendo co- SEQ ID NOS: 875 - bre 880 AOC2 Amina oxidase, 2 contendo co- SEQ ID NOS: 881 - bre (específica da retina) 882 AOC3 Amina oxidase, 3 contendo co- SEQ ID NOS: 883 - bre 889 AP000721.4 SEQ ID NO: 890 APBB1 ligação de proteína precursora SEQ ID NOS: 891 - de amiloide beta (A4), família 907 B, membro 1 (Fe65) APCDD1 1 sub-regulado de adenomato- SEQ ID NOS: 908 - sis poliposis coli 913 APCS Componente de amiloide P, so- SEQ ID NO: 914 ro APELA ligante endógeno precoce de SEQ ID NOS: 915 - receptor Apelina 917 APLN Apelina SEQ ID NO: 918 APLP2 proteína 2 tipo precursor de SEQ ID NOS: 919 - amiloide beta (A4) 928
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO APOA1 Apolipoproteína A-I SEQ ID NOS: 929 - 933 APOA1BP Proteína de ligação à apolipo- SEQ ID NOS: 9177 proteína A-I - 9179 APOA2 Apolipoproteína A-II SEQ ID NOS: 934 - 942 APOA4 Apolipoproteína A-IV SEQ ID NO: 943 APOA5 Apolipoproteína A-V SEQ ID NOS: 944 - 946 APOB Apolipoproteína B SEQ ID NOS: 947 - 948 APOC1 Apolipoproteína C-I SEQ ID NOS: 949 - 957 APOC2 Apolipoproteína C-II SEQ ID NOS: 958 - 962 APOC3 Apolipoproteína C-III SEQ ID NOS: 963 - 966 APOC4 Apolipoproteína C-IV SEQ ID NOS: 967 - 968 APOC4- Leitura APOC4-APOC2 (candi- SEQ ID NOS: 969 - APOC2 dato NMD) 970 APOD Apolipoproteína D SEQ ID NOS: 971 - 974 APOE Apolipoproteína E SEQ ID NOS: 975 - 978 APOF Apolipoproteína F SEQ ID NO: 979 APOH Apolipoproteína H (glicoproteí- SEQ ID NOS: 980 - na I beta-2) 983 APOL1 Apolipoproteína L, 1 SEQ ID NOS: 984 - 994 APOL3 Apolipoproteína L, 3 SEQ ID NOS: 995 - 1009
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO APOM Apolipoproteína M SEQ ID NOS: 1010 - 1012 APOOL Apolipoproteína tipo O SEQ ID NOS: 1013 - 1015 ARCN1 Archain 1 SEQ ID NOS: 1016 - 1020 ARFIP2 Proteína 2 de interação do fator SEQ ID NOS: 1021 ADP-ribosilação - 1027 ARHGAP36 Proteína 36 de ativação de Rho SEQ ID NOS: 1028 GTPase - 1033 ARHGAP6 Proteína 6 de ativação de Rho SEQ ID NOS: 1043 GTPase - 1048 ARHGEF4 Fator 4 de permute de nucleo- SEQ ID NOS: 1049 tídeo Rho guanina (GEF) - 1059 ARL16 Fator de ADP-ribosilação - tipo SEQ ID NOS: 1060 16 - 1068 ARMC5 5 contendo repetição de Arma- SEQ ID NOS: 1069 dillo - 1075 ARNTL Similar ao translocador nuclear SEQ ID NOS: 1076 de receptor de hidrocarboneto - 1090 de arila ARSA Arilsulfatase A SEQ ID NOS: 1091 - 1096 ARSB Arilsulfatase B SEQ ID NOS: 1097 - 1100 ARSE Arilsulfatase E (condrodisplasia SEQ ID NOS: 1101 punctata 1) - 1104 ARSG Arilsulfatase G SEQ ID NOS: 1105 - 1108 ARSI Família arilsulfatase, membro I SEQ ID NOS: 1109 - 1111 ARSK Família arilsulfatase, membro K SEQ ID NOS: 1112 - 1116
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO ART3 ADP-ribosiltransferase 3 SEQ ID NOS: 1117 - 1124 ART4 ADP-ribosiltransferase 4 (grupo SEQ ID NOS: 1125 sanguíneo Dombrock) - 1128 ART5 ADP-ribosiltransferase 5 SEQ ID NOS: 1129 - 1133 ARTN Artemina SEQ ID NOS: 1134 - 1144 ASAH1 N-acilesfingosina amido- SEQ ID NOS: 1145 hidrolase (ceramidase ácida) 1 - 1195 ASAH2 N-acilesfingosina amido- SEQ ID NOS: 1196 hidrolase (non-lisossômica ce- - 1201 ramidase) 2 ASCL1 Fator de transcrição 1 da famí- SEQ ID NO: 1202 lia bHLH Achaete-scute ASIP Proteína de sinalização Agouti SEQ ID NOS: 1203 - 1204 ASPN Asporina SEQ ID NOS: 1205 - 1206 ASTL Metaloendopeptidase tipo As- SEQ ID NO: 1207 tacina (família M12) ATAD5 família ATPase, 5 contendo SEQ ID NOS: 1208 domínio AAA - 1209 ATAT1 Alfa tubulina acetiltransferase 1 SEQ ID NOS: 1210 - 1215 ATG2A 2A relacionado com a autofagia SEQ ID NOS: 1216 - 1218 ATG5 5 relacionado com a autofagia SEQ ID NOS: 1219 - 1227 ATMIN Interator de ATM SEQ ID NOS: 1228 - 1231 ATP13A1 ATPase tipo 13A1 SEQ ID NOS: 1232 - 1234
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO ATP5F1 ATP sintase, transporte de H+, SEQ ID NOS: 1235 complexo mitocondrial Fo, su- - 1236 bunidade B1 ATP6AP1 ATPase, transporte de H+, pro- SEQ ID NOS: 1237 teína 1 acessória lisossômica - 1244 ATP6AP2 ATPase, transporte de H+, pro- SEQ ID NOS: 1245 teína 2 acessória lisossômica - 1267 ATPAF1 Fator 1 de montagem de com- SEQ ID NOS: 1268 plexo F1 mitocondrial de ATP - 1278 sintase AUH hidratase de proteína/enoil- SEQ ID NOS: 1279 CoA de ligação a AU RNA - 1280 AVP Vasopressina de arginina SEQ ID NO: 1281 AXIN2 Axina 2 SEQ ID NOS: 1282 - 1289 AZGP1 Alfa-2-glicoproteína 1, ligação a SEQ ID NOS: 1290 zinco - 1292 AZU1 Azurocidina 1 SEQ ID NOS: 1293 - 1294 B2M Beta-2-microglobulina SEQ ID NOS: 1295 - 1301 B3GALNT1 Beta-1,3-N- SEQ ID NOS: 1302 acetilgalactosaminiltransferase - 1314 1 (grupo sanguíneo globosí- deo) B3GALNT2 Beta-1,3-N- SEQ ID NOS: 1315 acetilgalactosaminiltransferase - 1317 2 B3GALT1 UDP-Gal:betaGlcNAc beta 1,3- SEQ ID NO: 1318 galactosiltransferase, polipeptí- deo 1 B3GALT4 UDP-Gal:betaGlcNAc beta 1,3- SEQ ID NO: 1319 galactosiltransferase, polipeptí- deo 4
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO B3GALT5 UDP-Gal:betaGlcNAc beta 1,3- SEQ ID NOS: 1320 galactosiltransferase, polipeptí- - 1324 deo 5 B3GALT6 UDP-Gal:betaGal beta 1,3- SEQ ID NO: 1325 galactosiltransferase, polipeptí- deo 6 B3GAT3 Beta-1,3-glucuroniltransferase SEQ ID NOS: 1326 3 - 1330 B3GLCT Beta 3-glicosiltransferase SEQ ID NO: 1331 B3GNT3 UDP-GlcNAc:betaGal beta-1,3- SEQ ID NOS: 1332 N-acetilglucosaminiltransferase - 1335 3 B3GNT4 UDP-GlcNAc:betaGal beta-1,3- SEQ ID NOS: 1336 N-acetilglucosaminiltransferase - 1339 4 B3GNT6 UDP-GlcNAc:betaGal beta-1,3- SEQ ID NOS: 1340 N-acetilglucosaminiltransferase - 1341 6 B3GNT7 UDP-GlcNAc:betaGal beta-1,3- SEQ ID NO: 1342 N-acetilglucosaminiltransferase 7 B3GNT8 UDP-GlcNAc:betaGal beta-1,3- SEQ ID NO: 1343 N-acetilglucosaminiltransferase 8 B3GNT9 UDP-GlcNAc:betaGal beta-1,3- SEQ ID NO: 1344 N-acetilglucosaminiltransferase 9 B4GALNT1 Beta-1,4-N-acetil- SEQ ID NOS: 1345 galactosaminil transferase 1 - 1356 B4GALNT3 Beta-1,4-N-acetil- SEQ ID NOS: 1357 galactosaminil transferase 3 - 1358 B4GALNT4 Beta-1,4-N-acetil- SEQ ID NOS: 1359 galactosaminil transferase 4 - 1361
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO B4GALT4 UDP-Gal:betaGlcNAc beta 1,4- SEQ ID NOS: 1362 galactosiltransferase, polipeptí- - 1374 deo 4 B4GALT5 UDP-Gal:betaGlcNAc beta 1,4- SEQ ID NO: 1375 galactosiltransferase, polipeptí- deo 5 B4GALT6 UDP-Gal:betaGlcNAc beta 1,4- SEQ ID NOS: 1376 galactosiltransferase, polipeptí- - 1379 deo 6 B4GAT1 Beta-1,4-glucuroniltransferase SEQ ID NO: 1380 1 B9D1 Domínio 1 de proteína B9 SEQ ID NOS: 1381 - 1397 BACE2 Enzima 2 de clivagem de APP SEQ ID NOS: 1398 de sítio Beta - 1400 BAGE5 membro 5, da família de antí- SEQ ID NO: 1401 geno de melanoma B BCAM Molécula de adesão celular ba- SEQ ID NOS: 1402 sal (Grupo sanguine luterano) - 1405 BCAN Brevicano SEQ ID NOS: 1406 - 1412 BCAP29 proteína 29 associado ao re- SEQ ID NOS: 1413 ceptor de célula B - 1425 BCAR1 1 de resistência antiestrogênio SEQ ID NOS: 1426 de câncer de mama - 1443 BCHE Butirilcolinesterase SEQ ID NOS: 1444 - 1448 BCKDHB desidrogenase E1 de cetoácido SEQ ID NOS: 1449 de cadeia ramificada, polipep- - 1451 tídeo beta BDNF fator neurotrófico derivado do SEQ ID NOS: 1452 cérebro - 1469
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO BGLAP proteína de gama- SEQ ID NO: 1470 carboxiglutamato ósseae (gla) BGN Biglicano SEQ ID NOS: 1471 - 1472 BLVRB Biliverdina redutase B SEQ ID NOS: 1473 - 1477 BMP1 Proteína morfogenética óssea SEQ ID NOS: 1478 1 - 1489 BMP10 Proteína morfogenética óssea SEQ ID NO: 1490 10 BMP15 Proteína morfogenética óssea SEQ ID NO: 1491 15 BMP2 Proteína morfogenética óssea SEQ ID NO: 1492 2 BMP3 Proteína morfogenética óssea SEQ ID NO: 1493 3 BMP4 Proteína morfogenética óssea SEQ ID NOS: 1494 4 - 1501 BMP6 Proteína morfogenética óssea SEQ ID NO: 1502 6 BMP7 Proteína morfogenética óssea SEQ ID NOS: 1503 7 - 1506 BMP8A Proteína morfogenética óssea SEQ ID NO: 1507 8a BMP8B Proteína morfogenética óssea SEQ ID NO: 1508 8b BMPER Regulador endotelial de ligação SEQ ID NOS: 1509 a BMP - 1512 BNC1 Basonuclina 1 SEQ ID NOS: 1513 - 1514 BOC regulado por oncogene, asso- SEQ ID NOS: 1515 ciado à adesão de célula BOC - 1525
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO BOD1 Biorientação de cromossomas SEQ ID NOS: 1526 em divisão celular 1 - 1530 BOLA1 Membro 1 da família BolA SEQ ID NOS: 1531 - 1533 BPI proteína de aumento da per- SEQ ID NOS: 1534 meabilidade/bactericida - 1537 BPIFA1 família A contendo dobra de SEQ ID NOS: 1538 BPI, membro 1 - 1541 BPIFA2 Família A contendo dobra de SEQ ID NOS: 1542 BPI, membro 2 - 1543 BPIFA3 Família A contendo dobra de SEQ ID NOS: 1544 BPI, membro 3 - 1545 BPIFB1 Família B contendo dobra de SEQ ID NOS: 1546 BPI, membro 1 - 1547 BPIFB2 Família B contendo dobra de SEQ ID NO: 1548 BPI, membro 2 BPIFB3 Família B contendo dobra de SEQ ID NO: 1549 BPI, membro 3 BPIFB4 Família B contendo dobra de SEQ ID NOS: 1550 BPI, membro 4 - 1551 BPIFB6 Família B contendo dobra de SEQ ID NOS: 1552 BPI, membro 6 - 1553 BPIFC Família C contendo dobra de SEQ ID NOS: 1554 BPI - 1557 BRF1 BRF1, subunidade 90 kDa de SEQ ID NOS: 1558 fator de início da transcrição de - 1573 RNA polimerase III BRINP1 1 neural-específico induzível SEQ ID NOS: 1574 por ácido retinoico/proteína - 1575 morfogenética óssea BRINP2 2 neural-específico induzível SEQ ID NO: 1576 por ácido retinoico/proteína morfogenética óssea
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO BRINP3 3 neural-específico induzível SEQ ID NOS: 1577 por ácido retinoico/proteína - 1579 morfogenética óssea BSG Basigina (grupo sanguíneo Ok) SEQ ID NOS: 1580 - 1590 BSPH1 Aglutinante de homólogo 1 de SEQ ID NO: 1591 proteína de esperma BST1 antígeno 1 de célula estromal SEQ ID NOS: 1592 da medula óssea - 1596 BTBD17 17 contendo domínio BTB SEQ ID NO: 1597 (POZ) BTD Biotinidase SEQ ID NOS: 1598 - 1607 BTN2A2 Butirofilina, subfamília 2, mem- SEQ ID NOS: 1608 bro A2 - 1621 BTN3A1 Butirofilina, subfamília 3, mem- SEQ ID NOS: 1622 bro A1 - 1628 BTN3A2 Butirofilina, subfamília 3, mem- SEQ ID NOS: 1629 bro A2 - 1639 BTN3A3 Butirofilina, subfamília 3, mem- SEQ ID NOS: 1640 bro A3 - 1648 C10orf10 Cromossoma 10 estrutura de SEQ ID NOS: 4169 leitura aberta 10 - 4170 C10orf99 Cromossoma 10 estrutura de SEQ ID NO: 1650 leitura aberta 99 C11orf1 Cromossoma 11 estrutura de SEQ ID NOS: 1651 leitura aberta 1 - 1655 C11orf24 Cromossoma 11 estrutura de SEQ ID NOS: 1656 leitura aberta 24 - 1658 C11orf45 Cromossoma 11 estrutura de SEQ ID NOS: 1659 leitura aberta 45 - 1660 C11orf94 Cromossoma 11 estrutura de SEQ ID NO: 1661 leitura aberta 94
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO C12orf10 Cromossoma 12 estrutura de SEQ ID NOS: 1662 leitura aberta 10 - 1665 C12orf49 Cromossoma 12 estrutura de SEQ ID NOS: 1666 leitura aberta 49 - 1669 C12orf73 Cromossoma 12 estrutura de SEQ ID NOS: 1670 leitura aberta 73 - 1679 C12orf76 Cromossoma 12 estrutura de SEQ ID NOS: 1680 leitura aberta 76 - 1687 C14orf80 Cromossoma 14 estrutura de SEQ ID NOS: 13083 leitura aberta 80 - 13096 C14orf93 Cromossoma 14 estrutura de SEQ ID NOS: 1688 leitura aberta 93 - 1703 C16orf89 Cromossoma 16 estrutura de SEQ ID NOS: 1704 leitura aberta 89 - 1706 C16orf90 Cromossoma 16 estrutura de SEQ ID NOS: 1707 leitura aberta 90 - 1708 C17orf67 Cromossoma 17 estrutura de SEQ ID NO: 1709 leitura aberta 67 C17orf75 Cromossoma 17 estrutura de SEQ ID NOS: 1710 leitura aberta 75 - 1718 C17orf99 Cromossoma 17 estrutura de SEQ ID NOS: 1719 leitura aberta 99 - 1721 C18orf54 Cromossoma 18 estrutura de SEQ ID NOS: 1722 leitura aberta 54 - 1726 C19orf47 Cromossoma 19 estrutura de SEQ ID NOS: 1727 leitura aberta 47 - 1734 C19orf70 Cromossoma 19 estrutura de SEQ ID NOS: 1735 leitura aberta 70 - 1738 C19orf80 Cromossoma 19 estrutura de SEQ ID NOS: 829 - leitura aberta 80 832 C1GALT1 Core 1 sintase, glicoprotein-N- SEQ ID NOS: 1739 acetilgalactosamina 3-beta- - 1743 galactosiltransferase 1
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO C1orf127 Cromossoma 1 estrutura de lei- SEQ ID NOS: 1744 tura aberta 127 - 1747 C1orf159 Cromossoma 1 estrutura de lei- SEQ ID NOS: 1748 tura aberta 159 - 1760 C1orf198 Cromossoma 1 estrutura de lei- SEQ ID NOS: 1761 tura aberta 198 - 1765 C1orf234 Cromossoma 1 estrutura de lei- SEQ ID NOS: 13118 tura aberta 234 - 13120 C1orf54 Cromossoma 1 estrutura de lei- SEQ ID NOS: 1766 tura aberta 54 - 1768 C1orf56 Cromossoma 1 estrutura de lei- SEQ ID NO: 1769 tura aberta 56 C1QA Componente complemento 1, SEQ ID NOS: 1770 subcomponente q, cadeia A - 1772 C1QB Componente complemento 1, SEQ ID NOS: 1773 subcomponente q, cadeia B - 1776 C1QC Componente complemento 1, SEQ ID NOS: 1777 subcomponente q, cadeia C - 1779 C1QL1 Componente complemento 1, SEQ ID NO: 1780 subcomponente q - tipo 1 C1QL2 Componente complemento 1, SEQ ID NO: 1781 subcomponente q - tipo 2 C1QL3 Componente complemento 1, SEQ ID NOS: 1782 subcomponente q - tipo 3 - 1783 C1QL4 Componente complemento 1, SEQ ID NO: 1784 subcomponente q - tipo 4 C1QTNF1 C1q e proteína 1 relacionada SEQ ID NOS: 1785 com o fator de necrose de tu- - 1794 mor C1QTNF2 C1q e proteína 2 relacionada SEQ ID NO: 1796 com o fator de necrose de tu- mor
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO C1QTNF3 C1q e proteína 3 relacionada SEQ ID NOS: 1797 com o fator de necrose de tu- - 1798 mor C1QTNF4 C1q e proteína 4 relacionada SEQ ID NOS: 1799 com o fator de necrose de tu- - 1800 mor C1QTNF5 C1q e proteína 5 relacionada SEQ ID NOS: 1801 com o fator de necrose de tu- - 1803 mor C1QTNF7 C1q e proteína 7 relacionada SEQ ID NOS: 1804 com o fator de necrose de tu- - 1808 mor C1QTNF8 C1q e proteína 8 relacionada SEQ ID NOS: 1809 com o fator de necrose de tu- - 1810 mor C1QTNF9 C1q e proteína 9 relacionada SEQ ID NOS: 1811 com o fator de necrose de tu- - 1812 mor C1QTNF9B C1q e proteína 9B relacionada SEQ ID NOS: 1813 com o fator de necrose de tu- - 1815 mor C1R Componente complemento 1, SEQ ID NOS: 1816 subcomponente r - 1824 C1RL Componente complemento 1, SEQ ID NOS: 1825 tipo subcomponente r - 1833 C1S Componente complemento 1, SEQ ID NOS: 1834 subcomponente s - 1843 C2 Componente complemento 2 SEQ ID NOS: 1844 - 1858 C21orf33 Cromossoma 21 estrutura de SEQ ID NOS: 1859 leitura aberta 33 - 1867 C21orf62 Cromossoma 21 estrutura de SEQ ID NOS: 1868 leitura aberta 62 - 1871
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO C22orf15 Cromossoma 22 estrutura de SEQ ID NOS: 1872 leitura aberta 15 - 1874 C22orf46 Cromossoma 22 estrutura de SEQ ID NO: 1875 leitura aberta 46 C2CD2 2 contendo domínio dependen- SEQ ID NOS: 1876 te de cálcio C2 - 1878 C2orf40 Cromossoma 2 estrutura de lei- SEQ ID NOS: 1879 tura aberta 40 - 1881 C2orf66 Cromossoma 2 estrutura de lei- SEQ ID NO: 1882 tura aberta 66 C2orf69 Cromossoma 2 estrutura de lei- SEQ ID NO: 1883 tura aberta 69 C2orf78 Cromossoma 2 estrutura de lei- SEQ ID NO: 1884 tura aberta 78 C3 Componente complemento 3 SEQ ID NOS: 1885 - 1889 C3orf33 Cromossoma 3 estrutura de lei- SEQ ID NOS: 1890 tura aberta 33 - 1894 C3orf58 Cromossoma 3 estrutura de lei- SEQ ID NOS: 1895 tura aberta 58 - 1898 C4A Componente complemento 4A SEQ ID NOS: 1899 (grupo sanguíneo Rodgers) - 1900 C4B Componente complemento 4B SEQ ID NOS: 1901 (Grupo sanguíneo Chido) - 1902 C4BPA Proteína de ligação ao compo- SEQ ID NOS: 1903 nente complemento 4, alfa - 1905 C4BPB Proteína de ligação ao compo- SEQ ID NOS: 1906 nente complemento 4, beta - 1910 C4orf26 Cromossoma 4 estrutura de lei- SEQ ID NOS: 9751 tura aberta 26 - 9754 C4orf48 Cromossoma 4 estrutura de lei- SEQ ID NOS: 1911 tura aberta 48 - 1912 C5 Componente complemento 5 SEQ ID NO: 1913
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO C5orf46 Cromossoma 5 estrutura de lei- SEQ ID NOS: 1914 tura aberta 46 - 1915 C6 Componente complemento 6 SEQ ID NOS: 1916 - 1919 C6orf120 Cromossoma 6 estrutura de lei- SEQ ID NO: 1920 tura aberta 120 C6orf15 Cromossoma 6 estrutura de lei- SEQ ID NO: 1921 tura aberta 15 C6orf25 Cromossoma 6 estrutura de lei- SEQ ID NOS: 8832 tura aberta 25 - 8839 C6orf58 Cromossoma 6 estrutura de lei- SEQ ID NO: 1922 tura aberta 58 C7 Componente complemento 7 SEQ ID NO: 1923 C7orf57 Cromossoma 7 estrutura de lei- SEQ ID NOS: 1924 tura aberta 57 - 1928 C7orf73 Cromossoma 7 estrutura de lei- SEQ ID NOS: 12924 tura aberta 73 - 12925 C8A Componente complemento 8, SEQ ID NO: 1929 alfa polipeptídeo C8B Componente complemento 8, SEQ ID NOS: 1930 beta polipeptídeo - 1932 C8G Componente complemento 8, SEQ ID NOS: 1933 gama polipeptídeo - 1934 C9 Componente complemento 9 SEQ ID NO: 1935 C9orf47 Cromossoma 9 estrutura de lei- SEQ ID NOS: 1936 tura aberta 47 - 1938 CA10 Anidrase carbônica X SEQ ID NOS: 1939 - 1945 CA11 Anidrase carbônica XI SEQ ID NOS: 1946 - 1947 CA6 Anidrase carbônica VI SEQ ID NOS: 1948 - 1952
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CA9 Anidrase carbônica IX SEQ ID NOS: 1953 - 1954 CABLES1 Substrato 1 de enzima Cdk5 e SEQ ID NOS: 1955 Abl - 1960 CABP1 Proteína 1 de ligação ao cálcio SEQ ID NOS: 1961 - 1964 CACNA2D1 Canal de cálcio, dependente da SEQ ID NOS: 1965 voltagem, subunidade 1 del- - 1968 ta/alfa2 CACNA2D4 Canal de cálcio, dependente da SEQ ID NOS: 1969 voltagem, subunidade 4 del- - 1982 ta/alfa 2 CADM3 Molécula 3 de adesão celular SEQ ID NOS: 1983 - 1985 CALCA Polipeptídeo alta relacionado SEQ ID NOS: 1986 com a calcitonina - 1990 CALCB Polipeptídeo beta relacionado SEQ ID NOS: 1991 com a calcitonina - 1993 CALCR Receptor de calcitonina SEQ ID NOS: 1994 - 2000 CALCRL receptor tipo calcitonina SEQ ID NOS: 2001 - 2005 CALR Calreticulina SEQ ID NOS: 2011 - 2014 CALR3 Calreticulina 3 SEQ ID NOS: 2015 - 2016 CALU Calumenina SEQ ID NOS: 2017 - 2022 CAMK2D Proteína cinase II delta depen- SEQ ID NOS: 2023 dente de calmodulina/cálcio - 2034 CAMP Peptídeo antimicrobiano de ca- SEQ ID NO: 2035 telicidina
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CANX Calnexina SEQ ID NOS: 2036 - 2050 CARKD Contendo domínio de carboi- SEQ ID NOS: 9175 drato de cinase - 9176 CARM1 Arginina metiltransferase 1 as- SEQ ID NOS: 2051 sociada ao coativador - 2058 CARNS1 Carnosina sintase 1 SEQ ID NOS: 2059 - 2061 CARTPT prepropeptídeo CART SEQ ID NO: 2062 CASQ1 Calsequestrina 1 (rápida con- SEQ ID NOS: 2063 tração, músculo esqueletal) - 2064 CASQ2 Calsequestrina 2 (músculo car- SEQ ID NO: 2065 díaco) CATSPERG subunidade gama auxiliar de SEQ ID NOS: 2066 canal Catsper - 2073 CBLN1 precursor Cerebelina 1 SEQ ID NOS: 2074 - 2076 CBLN2 precursor Cerebelina 2 SEQ ID NOS: 2077 - 2080 CBLN3 precursor Cerebelina 3 SEQ ID NOS: 2081 - 2082 CBLN4 precursor Cerebelina 4 SEQ ID NO: 2083 CCBE1 domínios 1 de EGF de ligação SEQ ID NOS: 2084 ao colágeno e cálcio - 2086 CCDC108 108 contendo domínio tipo bo- SEQ ID NOS: 2659 bina - 2668 CCDC112 112 contendo domínio tipo bo- SEQ ID NOS: 2087 bina - 2090 CCDC129 129 contendo domínio tipo bo- SEQ ID NOS: 2091 bina - 2098 CCDC134 134 contendo domínio tipo bo- SEQ ID NOS: 2099 bina - 2100
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CCDC149 149 contendo domínio tipo bo- SEQ ID NOS: 2101 bina - 2104 CCDC3 3 contendo domínio tipo bobina SEQ ID NOS: 2105 - 2106 CCDC80 80 contendo domínio tipo bobi- SEQ ID NOS: 2107 na - 2110 CCDC85A 85A contendo domínio tipo bo- SEQ ID NO: 2111 bina CCDC88B 88B contendo domínio tipo bo- SEQ ID NOS: 2112 bina - 2114 CCER2 proteína 2 rica em glutamate ti- SEQ ID NOS: 2115 po bobina - 2116 CCK Colecistocinina SEQ ID NOS: 2117 - 2119 CCL1 Quimiocina (Motivo C-C) ligan- SEQ ID NO: 2120 te 1 CCL11 Quimiocina (Motivo C-C) ligan- SEQ ID NO: 2121 te 11 CCL13 Quimiocina (Motivo C-C) ligan- SEQ ID NOS: 2122 te 13 - 2123 CCL14 Quimiocina (Motivo C-C) ligan- SEQ ID NOS: 2124 te 14 - 2127 CCL15 Quimiocina (Motivo C-C) ligan- SEQ ID NOS: 2128 te 15 - 2129 CCL16 Quimiocina (Motivo C-C) ligan- SEQ ID NOS: 2130 te 16 - 2132 CCL17 Quimiocina (Motivo C-C) ligan- SEQ ID NOS: 2133 te 17 - 2134 CCL18 Quimiocina (Motivo C-C) ligan- SEQ ID NO: 2135 te 18 (pulmonar e regulado por ativação) CCL19 Quimiocina (Motivo C-C) ligan- SEQ ID NOS: 2136 te 19 - 2137
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CCL2 Quimiocina (Motivo C-C) ligan- SEQ ID NOS: 2138 te 2 - 2139 CCL20 Quimiocina (Motivo C-C) ligan- SEQ ID NOS: 2140 te 20 - 2142 CCL21 Quimiocina (Motivo C-C) ligan- SEQ ID NOS: 2143 te 21 - 2144 CCL22 Quimiocina (Motivo C-C) ligan- SEQ ID NO: 2145 te 22 CCL23 Quimiocina (Motivo C-C) ligan- SEQ ID NOS: 2146 te 23 - 2148 CCL24 Quimiocina (Motivo C-C) ligan- SEQ ID NOS: 2149 te 24 - 2150 CCL25 Quimiocina (Motivo C-C) ligan- SEQ ID NOS: 2151 te 25 - 2154 CCL26 Quimiocina (Motivo C-C) ligan- SEQ ID NOS: 2155 te 26 - 2156 CCL27 Quimiocina (Motivo C-C) ligan- SEQ ID NO: 2157 te 27 CCL28 Quimiocina (Motivo C-C) ligan- SEQ ID NOS: 2158 te 28 - 2160 CCL3 Quimiocina (Motivo C-C) ligan- SEQ ID NO: 2161 te 3 CCL3L3 Quimiocina (Motivo C-C) ligan- SEQ ID NO: 2162 te 3-tipo 3 CCL4 Quimiocina (Motivo C-C) ligan- SEQ ID NOS: 2163 te 4 - 2164 CCL4L2 Quimiocina (Motivo C-C) ligan- SEQ ID NOS: 2165 te 4-tipo 2 - 2174 CCL5 Quimiocina (Motivo C-C) ligan- SEQ ID NOS: 2175 te 5 - 2177 CCL7 Quimiocina (Motivo C-C) ligan- SEQ ID NOS: 2178 te 7 - 2180
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CCL8 Quimiocina (Motivo C-C) ligan- SEQ ID NO: 2181 te 8 CCNB1IP1 Proteína 1 de interação com a SEQ ID NOS: 2182 Ciclina B1, E3 ubiquitina prote- - 2193 ína ligase CCNL1 Ciclina L1 SEQ ID NOS: 2194 - 2202 CCNL2 Ciclina L2 SEQ ID NOS: 2203 - 2210 CD14 Molécula CD14 SEQ ID NOS: 2211 - 2215 CD160 Molécula CD160 SEQ ID NOS: 2216 - 2220 CD164 Molécula CD164, sialomucina SEQ ID NOS: 2221 - 2226 CD177 Molécula CD177 SEQ ID NOS: 2227 - 2229 CD1E Molécula CD1e SEQ ID NOS: 2230 - 2243 CD2 Molécula CD2 SEQ ID NOS: 2244 - 2245 CD200 Molécula CD200 SEQ ID NOS: 2246 - 2252 CD200R1 Receptor 1 CD200 SEQ ID NOS: 2253 - 2257 CD22 Molécula CD22 SEQ ID NOS: 2258 - 2275 CD226 Molécula CD226 SEQ ID NOS: 2276 - 2283 CD24 Molécula CD24 SEQ ID NOS: 2284 - 2290 CD276 Molécula CD276 SEQ ID NOS: 2291 - 2306
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CD300A Molécula CD300a SEQ ID NOS: 2307 - 2311 CD300LB Membro b da família tipo molé- SEQ ID NOS: 2312 cula CD300 - 2313 CD300LF Membro f da família tipo molé- SEQ ID NOS: 2314 cula CD300 - 2322 CD300LG Membro g da família tipo molé- SEQ ID NOS: 2323 cula CD300 - 2328 CD3D Molécula CD3d, delta (comple- SEQ ID NOS: 2329 xo CD3-TCR) - 2332 CD4 Molécula CD4 SEQ ID NOS: 2333 - 2335 CD40 Molécula CD40, membro 5 da SEQ ID NOS: 2336 superfamília de receptor TNF - 2339 CD44 Molécula CD44 (grupo sanguí- SEQ ID NOS: 2340 neo indiano) - 2366 CD48 Molécula CD48 SEQ ID NOS: 2367 - 2369 CD5 Molécula CD5 SEQ ID NOS: 2370 - 2371 CD55 Molécula CD55, fator de acele- SEQ ID NOS: 2372 ração da decadência para - 2382 complemento (Grupo sanguí- neo Cromer) CD59 Molécula CD59, proteína regu- SEQ ID NOS: 2383 latória do complemento - 2393 CD5L molécula tipo CD5 SEQ ID NO: 2394 CD6 Molécula CD6 SEQ ID NOS: 2395 - 2402 CD68 Molécula CD68 SEQ ID NOS: 2403 - 2406 CD7 Molécula CD7 SEQ ID NOS: 2407 - 2412
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CD79A Molécula CD79a, alfa associa- SEQ ID NOS: 2413 da à imunoglobulina - 2415 CD80 Molécula CD80 SEQ ID NOS: 2416 - 2418 CD86 Molécula CD86 SEQ ID NOS: 2419 - 2425 CD8A Molécula CD8a SEQ ID NOS: 2426 - 2429 CD8B Molécula CD8b SEQ ID NOS: 2430 - 2435 CD99 Molécula CD99 SEQ ID NOS: 2436 - 2444 CDC23 Ciclo 23 de divisão celular SEQ ID NOS: 2445 - 2449 CDC40 Ciclo 40 de divisão celular SEQ ID NOS: 2450 - 2452 CDC45 Ciclo 45 de divisão celular SEQ ID NOS: 2453 - 2459 CDCP1 proteína 1 contendo domínio SEQ ID NOS: 2460 CUB - 2461 CDCP2 proteína 2 contendo domínio SEQ ID NOS: 2462 CUB - 2463 CDH1 Caderina 1, tipo 1 SEQ ID NOS: 2464 - 2471 CDH11 Caderina 11, tipo 2, OB- SEQ ID NOS: 2472 Caderina (osteoblasto) - 2481 CDH13 Caderina 13 SEQ ID NOS: 2482 - 2491 CDH17 Caderina 17, LI Caderina (fíga- SEQ ID NOS: 2492 do-intestino) - 2496 CDH18 Caderina 18, tipo 2 SEQ ID NOS: 2497 - 2503
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CDH19 Caderina 19, tipo 2 SEQ ID NOS: 2504 - 2508 CDH23 23 relacionado à Caderina SEQ ID NOS: 2509 - 2524 CDH5 Caderina 5, tipo 2 (endotélio SEQ ID NOS: 2525 vascular) - 2532 CDHR1 Membro 1 da família relaciona- SEQ ID NOS: 2533 da com a Caderina - 2538 CDHR4 Membro 4 da família relaciona- SEQ ID NOS: 2539 da com a Caderina - 2543 CDHR5 Membro 5 da família relaciona- SEQ ID NOS: 2544 da com a Caderina - 2550 CDKN2A Inibidor 2A de cinase depen- SEQ ID NOS: 2551 dente de ciclina - 2561 CDNF Fator neurotrófico de dopamine SEQ ID NOS: 2562 cerebral - 2563 CDON regulado por oncogene, asso- SEQ ID NOS: 2564 ciado com a adesão celular - 2571 CDSN Corneodesmosina SEQ ID NO: 2572 CEACAM16 Molécula 16 de adesão celular SEQ ID NOS: 2573 relacionada com o antígeno - 2574 carcinoembriônico CEACAM18 Molécula 18 de adesão celular SEQ ID NO: 2575 relacionada com o antígeno carcinoembriônico CEACAM19 Molécula 19 de adesão celular SEQ ID NOS: 2576 relacionada com o antígeno - 2582 carcinoembriônico CEACAM5 Molécula 5 de adesão celular SEQ ID NOS: 2583 relacionada com o antígeno - 2590 carcinoembriônico
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CEACAM7 Molécula 7 de adesão celular SEQ ID NOS: 2591 relacionada com o antígeno - 2593 carcinoembriônico 7 CEACAM8 Molécula 8 de adesão celular SEQ ID NOS: 2594 relacionada com o antígeno - 2595 carcinoembriônico CECR1 região de cromossoma da sín- SEQ ID NOS: 222 - drome do olho de gato, candi- 229 dato 1 CECR5 região de cromossoma da sín- SEQ ID NOS: 6411 drome do olho de gato, candi- - 6413 dato 5 CEL Carboxil éster lipase SEQ ID NO: 2596 CELA2A Família de elastase tipo quimo- SEQ ID NO: 2597 tripsina, membro 2A CELA2B Família de elastase tipo quimo- SEQ ID NOS: 2598 tripsina, membro 2B - 2599 CELA3A Família de elastase tipo quimo- SEQ ID NOS: 2600 tripsina, membro 3A - 2602 CELA3B Família de elastase tipo quimo- SEQ ID NOS: 2603 tripsina, membro 3B - 2605 CEMIP Proteína indutora de migração SEQ ID NOS: 2606 celular, ligação à hialuronana - 2610 CEP89 Proteína centrossômica 89 kDa SEQ ID NOS: 2611 - 2616 CER1 Cerberus 1, antagonista BMP SEQ ID NO: 2617 da família DAN CERCAM Molécula de adesão celular SEQ ID NOS: 2618 endotelial cerebral - 2625 CERS1 Síntese da ceramida 1 SEQ ID NOS: 2626 - 2630 CES1 Carboxilesterase 1 SEQ ID NOS: 2631 - 2636
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CES3 Carboxilesterase 3 SEQ ID NOS: 2637 - 2641 CES4A Carboxilesterase 4A SEQ ID NOS: 2642 - 2647 CES5A Carboxilesterase 5A SEQ ID NOS: 2648 - 2655 CETP Proteína de transferência de SEQ ID NOS: 2656 colesteril éster, plasma - 2658 CFB Fator B de complemento SEQ ID NOS: 2669 - 2673 CFC1 Cripto, FRL-1, família críptica 1 SEQ ID NOS: 2674 - 2676 CFC1B Cripto, FRL-1, família críptica SEQ ID NOS: 2677 1B - 2679 CFD Fator D de complemento (adip- SEQ ID NOS: 2680 sina) - 2681 CFDP1 proteína 1 de desenvolvimento SEQ ID NOS: 2682 craniofacial - 2685 CFH Fator H de Complemento SEQ ID NOS: 2686 - 2688 CFHR1 1 relacionado ao fator H de SEQ ID NOS: 2689 complemento - 2690 CFHR2 2 relacionado ao fator H de SEQ ID NOS: 2691 complemento - 2692 CFHR3 3 relacionado ao fator H de SEQ ID NOS: 2693 complemento - 2697 CFHR4 4 relacionado ao fator H de SEQ ID NOS: 2698 complemento - 2701 CFHR5 5 relacionado ao fator H de SEQ ID NO: 2702 complemento CFI Fator I de complemento SEQ ID NOS: 2703 - 2707
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CFP Properdina de fator de com- SEQ ID NOS: 2708 plemento - 2711 CGA Hormônios de glicoproteína, al- SEQ ID NOS: 2712 fa polipeptídeo - 2716 CGB Gonadotropina coriônica, beta SEQ ID NO: 2721 polipeptídeo CGB1 Gonadotropina coriônica, beta SEQ ID NOS: 2717 polipeptídeo 1 - 2718 CGB2 Gonadotropina coriônica, beta SEQ ID NOS: 2719 polipeptídeo 2 - 2720 CGB5 Gonadotropina coriônica, beta SEQ ID NO: 2722 polipeptídeo 5 CGB7 Gonadotropina coriônica, beta SEQ ID NOS: 2723 polipeptídeo 7 - 2725 CGB8 Gonadotropina coriônica, beta SEQ ID NO: 2726 polipeptídeo 8 CGREF1 Regulador de crescimento ce- SEQ ID NOS: 2727 lular com domínio 1 de mão EF - 2734 CH507-9B2.3 SEQ ID NOS: 5532 - 5538 CHAD Condroaderina SEQ ID NOS: 2735 - 2737 CHADL Tipo condroaderina SEQ ID NOS: 2738 - 2740 CHEK2 cinase 2 do ponto de verifica- SEQ ID NOS: 2741 ção - 2762 CHGA Cromogranina A SEQ ID NOS: 2763 - 2765 CHGB Cromogranina B SEQ ID NOS: 2766 - 2767 CHI3L1 Quitinase 3 - tipo 1 (glicoprote- SEQ ID NOS: 2768 ína de cartilagem 39) - 2769
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CHI3L2 Quitinase 3 - tipo 2 SEQ ID NOS: 2770 - 2783 CHIA Quitinase, acídica SEQ ID NOS: 2784 - 2792 CHID1 1 contendo domínio de quiti- SEQ ID NOS: 2793 nase - 2811 CHIT1 Quitinase 1 (quiitotriosidase) SEQ ID NOS: 2812 - 2815 CHL1 molécula tipo L1 de adesão ce- SEQ ID NOS: 2816 lular - 2824 CHN1 Quimerina 1 SEQ ID NOS: 2825 - 2835 CHPF fator de polimerização de con- SEQ ID NOS: 2836 droitina - 2838 CHPF2 Fator 2 de polimerização de SEQ ID NOS: 2839 condroitina - 2842 CHRD Cordina SEQ ID NOS: 2843 - 2848 CHRDL1 Cordina - tipo 1 SEQ ID NOS: 2849 - 2853 CHRDL2 Cordina - tipo 2 SEQ ID NOS: 2854 - 2862 CHRNA2 Receptor colinérgico, nicotíni- SEQ ID NOS: 2863 co, alfa 2 (neuronal) - 2871 CHRNA5 Receptor colinérgico, nicotíni- SEQ ID NOS: 2872 co, alfa 5 (neuronal) - 2875 CHRNB1 Receptor colinérgico, nicotíni- SEQ ID NOS: 2876 co, beta 1 (músculo) - 2881 CHRND Receptor colinérgico, nicotíni- SEQ ID NOS: 2882 co, delta (músculo) - 2887 CHST1 Carboidrato (sulfato de cerata- SEQ ID NO: 2888 no Gal-6) sulfotransferase 1
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CHST10 Carboidrato sulfotransferase 10 SEQ ID NOS: 2889 - 2896 CHST11 Carboidrato (condroitina 4) sul- SEQ ID NOS: 2897 fotransferase 11 - 2901 CHST13 Carboidrato (condroitina 4) sul- SEQ ID NOS: 2902 fotransferase 13 - 2903 CHST4 Carboidrato (N- SEQ ID NOS: 2904 acetilglucosamina 6-O) sulfo- - 2905 transferase 4 CHST5 Carboidrato (N- SEQ ID NOS: 2906 acetilglucosamina 6-O) sulfo- - 2907 transferase 5 CHST6 Carboidrato (N- SEQ ID NOS: 2908 acetilglucosamina 6-O) sulfo- - 2909 transferase 6 CHST7 Carboidrato (N- SEQ ID NO: 2910 acetilglucosamina 6-O) sulfo- transferase 7 CHST8 Carboidrato (N- SEQ ID NOS: 2911 acetilgalactosamina 4-0) sulfo- - 2914 transferase 8 CHSY1 Condroitina sulfato sintase 1 SEQ ID NOS: 2915 - 2916 CHSY3 Condroitina sulfato sintase 3 SEQ ID NO: 2917 CHTF8 Fator 8 de fidelidade de trans- SEQ ID NOS: 2918 missão de cromossoma - 2928 CILP Proteína de camada inermediá- SEQ ID NO: 2929 ria de cartilagem, pirofosfo- hidrolase CILP2 Proteína 2 de camada interme- SEQ ID NOS: 2930 diária da cartilage intermediate - 2931 layer proteína 2 CIRH1A Cirroses, 1A recessivo autos- SEQ ID NOS: 13974 sômico (cirina) - 13983
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CKLF Fator tipo quimiocina SEQ ID NOS: 2932 - 2937 CKMT1A Creatina cinase, mitocondrial SEQ ID NOS: 2938 1A - 2943 CKMT1B Creatina cinase, mitocondrial SEQ ID NOS: 2944 1B - 2953 CLCA1 Acessório 1 de canal de cloreto SEQ ID NOS: 2954 - 2955 CLCF1 Fator 1 de citocina tipo cardio- SEQ ID NOS: 2956 trofina - 2957 CLDN15 Claudin 15 SEQ ID NOS: 2958 - 2963 CLDN7 Claudina 7 SEQ ID NOS: 2964 - 2970 CLDND1 1 contendo domínio de claudi- SEQ ID NOS: 2971 na - 2996 CLEC11A família 11 de domínio de lecti- SEQ ID NOS: 2997 na tipo C, membro A - 2999 CLEC16A família 16 de domínio de lecti- SEQ ID NOS: 3000 na tipo C, membro A, membro - 3005
A CLEC18A família 18 de domínio de lecti- SEQ ID NOS: 3006 na tipo C, membro A, membro - 3011
A CLEC18B família 18 de domínio de lecti- SEQ ID NOS: 3012 na tipo C, membro A, membro - 3015
B CLEC18C Família 18 de domínio de lecti- SEQ ID NOS: 3016 na tipo C, membro C - 3022 CLEC19A Família 19 de domínio de lecti- SEQ ID NOS: 3023 na tipo C, membro A - 3026 CLEC2B Família 2 de domínio de lectina SEQ ID NOS: 3027 tipo C, membro B - 3028
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CLEC3A Família 3 de domínio de lectina SEQ ID NOS: 3029 tipo C 3, membro A - 3030 CLEC3B Família 3 de domínio de lectina SEQ ID NOS: 3031 tipo C, membro B - 3032 CLGN Calmegina SEQ ID NOS: 3033 - 3035 CLN5 Ceroide-lipofuscinose, neuronal SEQ ID NOS: 3036 5 - 3047 CLPS Colipase, pancreática SEQ ID NOS: 3048 - 3050 CLPSL1 Colipase - tipo 1 SEQ ID NOS: 3051 - 3052 CLPSL2 Colipase - tipo 2 SEQ ID NOS: 3053 - 3054 CLPX subunidade de chaperone de SEQ ID NOS: 3055 peptidase matriz mitocondrial - 3057 caseinolítica CLSTN3 Calsintenina 3 SEQ ID NOS: 3058 - 3064 CLU Clusterina SEQ ID NOS: 3065 - 3078 CLUL1 Clusterina - tipo 1 (retinal) SEQ ID NOS: 3079 - 3086 CMA1 Quimase 1, mastócito SEQ ID NOS: 3087 - 3088 CMPK1 Citidina monofosfato (UMP- SEQ ID NOS: 3089 CMP) cinase 1, citosólica - 3092 CNBD1 1 contendo domínio de ligação SEQ ID NOS: 3093 a nucleotídeo cíclico - 3096 CNDP1 Carnosina dipeptidase 1 (famí- SEQ ID NOS: 3097 lia metalopeptidase M20) - 3099 CNPY2 Regulador 2 de sinalização de SEQ ID NOS: 3107 FGF de dossel - 3111
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CNPY3 Regulador 3 de sinalização de SEQ ID NOS: 3112 FGF de dossel - 3113 CNPY4 Regulador 4 de sinalização de SEQ ID NOS: 3114 FGF de dossel - 3116 CNTFR Receptor de fator neurotrófico SEQ ID NOS: 3117 ciliar - 3120 CNTN1 Contactina 1 SEQ ID NOS: 3121 - 3130 CNTN2 Contactina 2 (axonal) SEQ ID NOS: 3131 - 3142 CNTN3 Contactina 3 (associada ao SEQ ID NO: 3143 plasmacitoma) CNTN4 Contactina 4 SEQ ID NOS: 3144 - 3152 CNTN5 Contactina 5 SEQ ID NOS: 3153 - 3158 CNTNAP2 Proteína associada à contacti- SEQ ID NOS: 3159 na - tipo 2 - 3162 CNTNAP3 Proteína associada à contacti- SEQ ID NOS: 3163 na - tipo 3 - 3167 CNTNAP3B Proteína associada à contacti- SEQ ID NOS: 3168 na - tipo 3B - 3176 COASY CoA sintase SEQ ID NOS: 3177 - 3186 COCH Coclina SEQ ID NOS: 3187 - 3198 COG3 Componente de complexo 3 SEQ ID NOS: 3199 golgi oligomérico - 3202 COL10A1 Colágeno, tipo X, alfa 1 SEQ ID NOS: 3203 - 3206 COL11A1 Colágeno, tipo XI, alfa 1 SEQ ID NOS: 3207 - 3217
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO COL11A2 Colágeno, tipo XI, alfa 2 SEQ ID NOS: 3218 - 3222 COL12A1 Colágeno, tipo XII, alfa 1 SEQ ID NOS: 3223 - 3230 COL14A1 Colágeno, tipo XIV, alfa 1 SEQ ID NOS: 3231 - 3238 COL15A1 Colágeno, tipo XV, alfa 1 SEQ ID NOS: 3239 - 3240 COL16A1 Colágeno, tipo XVI, alfa 1 SEQ ID NOS: 3241 - 3245 COL18A1 Colágeno, tipo XVIII, alfa 1 SEQ ID NOS: 3246 - 3250 COL19A1 Colágeno, tipo XIX, alfa 1 SEQ ID NOS: 3251 - 3253 COL1A1 Colágeno, tipo I, alfa 1 SEQ ID NOS: 3254 - 3255 COL1A2 Colágeno, tipo I, alfa 2 SEQ ID NOS: 3256 - 3257 COL20A1 Colágeno, tipo XX, alfa 1 SEQ ID NOS: 3258 - 3261 COL21A1 Colágeno, tipo XXI, alfa 1 SEQ ID NOS: 3262 - 3267 COL22A1 Colágeno, tipo XXII, alfa 1 SEQ ID NOS: 3268 - 3270 COL24A1 Colágeno, tipo XXIV, alfa 1 SEQ ID NOS: 3271 - 3274 COL26A1 Colágeno, tipo XXVI, alfa 1 SEQ ID NOS: 3275 - 3276 COL27A1 Colágeno, tipo XXVII, alfa 1 SEQ ID NOS: 3277 - 3279 COL28A1 Colágeno, tipo XXVIII, alfa 1 SEQ ID NOS: 3280 - 3284
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO COL2A1 Colágeno, tipo II, alfa 1 SEQ ID NOS: 3285 - 3286 COL3A1 Colágeno, tipo III, alfa 1 SEQ ID NOS: 3287 - 3289 COL4A1 Colágeno, tipo IV, alfa 1 SEQ ID NOS: 3290 - 3292 COL4A2 Colágeno, tipo IV, alfa 2 SEQ ID NOS: 3293 - 3295 COL4A3 Colágeno, tipo IV, alfa 3 (Antí- SEQ ID NOS: 3296 geno Goodpasture) - 3299 COL4A4 Colágeno, tipo IV, alfa 4 SEQ ID NOS: 3300 - 3301 COL4A5 Colágeno, tipo IV, alfa 5 SEQ ID NOS: 3302 - 3308 COL4A6 Colágeno, tipo IV, alfa 6 SEQ ID NOS: 3309 - 3314 COL5A1 Colágeno, tipo V, alfa 1 SEQ ID NOS: 3315 - 3317 COL5A2 Colágeno, tipo V, alfa 2 SEQ ID NOS: 3318 - 3319 COL5A3 Colágeno, tipo V, alfa 3 SEQ ID NO: 3320 COL6A1 Colágeno, tipo VI, alfa 1 SEQ ID NOS: 3321 - 3322 COL6A2 Colágeno, tipo VI, alfa 2 SEQ ID NOS: 3323 - 3328 COL6A3 Colágeno, tipo VI, alfa 3 SEQ ID NOS: 3329 - 3337 COL6A5 Colágeno, tipo VI, alfa 5 SEQ ID NOS: 3338 - 3342 COL6A6 Colágeno, tipo VI, alfa 6 SEQ ID NOS: 3343 - 3345 COL7A1 Colágeno, tipo VII, alfa 1 SEQ ID NOS: 3346 - 3347
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO COL8A1 Colágeno, tipo VIII, alfa 1 SEQ ID NOS: 3348 - 3351 COL8A2 Colágeno, tipo VIII, alfa 2 SEQ ID NOS: 3352 - 3354 COL9A1 Colágeno, tipo IX, alfa 1 SEQ ID NOS: 3355 - 3358 COL9A2 Colágeno, tipo IX, alfa 2 SEQ ID NOS: 3359 - 3362 COL9A3 Colágeno, tipo IX, alfa 3 SEQ ID NOS: 3363 - 3364 COLEC10 Membro da subfamília de co- SEQ ID NO: 3365 lectina 10 (Lectina tipo C) COLEC11 Membro da subfamília de co- SEQ ID NOS: 3366 lectina 11 - 3375 COLGALT1 Colágeno beta (1-O) galactosil- SEQ ID NOS: 3376 transferase 1 - 3378 COLGALT2 Colágeno beta (1-O) galactosil- SEQ ID NOS: 3379 transferase 2 - 3381 COLQ Subunidade de cauda tipo co- SEQ ID NOS: 3382 lágeno (filamento único de ho- - 3386 motrímero) de acetilcolineste- rase assimétrica COMP proteína matriz de cartilagem SEQ ID NOS: 3387 oligomérica - 3389 COPS6 subunidade 6 de signalossoma SEQ ID NOS: 3390 COP9 - 3393 COQ6 Coenzima Q6 monooxigenase SEQ ID NOS: 3394 - 3401 CORT Cortistatina SEQ ID NO: 3402 CP Ceruloplasmina (ferroxidase) SEQ ID NOS: 3403 - 3407 CPA1 Carboxipeptidase A1 (pancreá- SEQ ID NOS: 3408 tica) - 3412
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CPA2 Carboxipeptidase A2 (pancreá- SEQ ID NOS: 3413 tica) - 3414 CPA3 Carboxipeptidase A3 (mastóci- SEQ ID NO: 3415 to) CPA4 Carboxipeptidase A4 SEQ ID NOS: 3416 - 3421 CPA6 Carboxipeptidase A6 SEQ ID NOS: 3422 - 3424 CPAMD8 8 contendo domínio de alfa-2- SEQ ID NOS: 3425 macroblobulina tipo PZP e C3 - 3430 CPB1 Carboxipeptidase B1 (tecido) SEQ ID NOS: 3431 - 3435 CPB2 Carboxipeptidase B2 (plasma) SEQ ID NOS: 3436 - 3438 CPE Carboxipeptidase E SEQ ID NOS: 3439 - 3443 CPM Carboxipeptidase M SEQ ID NOS: 3444 - 3453 CPN1 Carboxipeptidase N, polipeptí- SEQ ID NOS: 3454 deo 1 - 3455 CPN2 Carboxipeptidase N, polipeptí- SEQ ID NOS: 3456 deo 2 - 3457 CPO Carboxipeptidase O SEQ ID NO: 3458 CPQ Carboxipeptidase Q SEQ ID NOS: 3459 - 3464 CPVL Carboxipeptidase, tipo vitelo- SEQ ID NOS: 3465 gênico - 3475 CPXM1 Carboxipeptidase X (Família SEQ ID NO: 3476 M14), membro 1 CPXM2 Carboxipeptidase X (Família SEQ ID NOS: 3477 M14), membro 2 - 3478 CPZ Carboxipeptidase Z SEQ ID NOS: 3479 - 3482
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CR1L Componente complemento SEQ ID NOS: 3483 (3b/4b) tipo receptor 1 - 3484 CRB2 membro 2 família Crumbs SEQ ID NOS: 3485 - 3487 CREG1 Repressor celular de genes 1 SEQ ID NO: 3488 estimulados por E1A 1 CREG2 Repressor celular de genes SEQ ID NO: 3489 2estimulados por E1A CRELD1 Rico em cisteína com domínios SEQ ID NOS: 3490 1 tipo EGF - 3495 CRELD2 Rico em cisteína com domínios SEQ ID NOS: 3496 2 tipo EGF - 3500 CRH Hormônio liberador de cortico- SEQ ID NO: 3501 tropina CRHBP proteína de ligação ao hormô- SEQ ID NOS: 3502 nio liberador de corticotropina - 3503 CRHR1 Receptor 1 de hormônio libera- SEQ ID NOS: 3504 dor de corticotropina - 3515 CRHR2 Receptor 2 de hormônio libera- SEQ ID NOS: 3516 dor de corticotropina - 3522 CRISP1 Proteína 1 secretória rica em SEQ ID NOS: 3523 cisteína - 3526 CRISP2 Proteína 2 secretória rica em SEQ ID NOS: 3527 cisteína - 3529 CRISP3 Proteína 3 secretória rica em SEQ ID NOS: 3530 cisteína - 3533 CRISPLD2 2 contendo domínio LCCL de SEQ ID NOS: 3534 proteína secretória rica em cis- - 3541 teína CRLF1 Fator 1 tipo receptor de citocina SEQ ID NOS: 3542 - 3543 CRP Proteína C-reativa, relacionada SEQ ID NOS: 3544 com a pentraxina - 3548
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CRTAC1 proteína 1 acídica de cartilage SEQ ID NOS: 3549 - 3553 CRTAP Proteína associada com a carti- SEQ ID NOS: 3554 lagem - 3555 CRY2 Relógio circadiano de cripto- SEQ ID NOS: 3556 cromo 2 - 3559 CSAD Descarboxilase de ácido sulfí- SEQ ID NOS: 3560 nico de cisteína - 3572 CSF1 Fator 1 estitimulador de colônia SEQ ID NOS: 3573 (macrófago) - 3580 CSF1R receptor de fator 1 estimulador SEQ ID NOS: 3581 de colônia - 3585 CSF2 fator 2 estimulador de colônia SEQ ID NO: 3586 (granulócito-macrófago) CSF2RA receptor de fator 2 estimulador SEQ ID NOS: 3587 de colônia, alfa, baixa afinidade - 3598 (granulócito-macrófago) CSF3 Fator 3 estimulador de colônia SEQ ID NOS: 3599 (granulócito) - 3605 CSGAL- Condroitina sulfato N- SEQ ID NOS: 3606 NACT1 acetilgalactosaminiltransferase - 3614 1 CSH1 hormônio 1 de somatomamo- SEQ ID NOS: 3615 tropina coriônica (lactogênio - 3618 placental) CSH2 hormônio 2 de somatomamo- SEQ ID NOS: 3619 tropina coriônica - 3623 CSHL1 hormônio somatomamotropina SEQ ID NOS: 3624 coriônica - tipo 1 - 3630 CSN1S1 Caseína alfa s1 SEQ ID NOS: 3631 - 3636 CSN2 Caseína beta SEQ ID NO: 3637 CSN3 Caseína kappa SEQ ID NO: 3638
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CST1 Cistatina SN SEQ ID NOS: 3639 - 3640 CST11 Cistatina 11 SEQ ID NOS: 3641 - 3642 CST2 Cistatina SA SEQ ID NO: 3643 CST3 Cistatina C SEQ ID NOS: 3644 - 3646 CST4 Cistatina S SEQ ID NO: 3647 CST5 Cistatina D SEQ ID NO: 3648 CST6 Cistatina E/M SEQ ID NO: 3649 CST7 Cistatina F (leucocistatina) SEQ ID NO: 3650 CST8 Cistatina 8 (específico do epi- SEQ ID NOS: 3651 dídimo relacionado com a cis- - 3652 tatina) CST9 Cistatina 9 (testatina) SEQ ID NO: 3653 CST9L tipo Cistatina 9 SEQ ID NO: 3654 CSTL1 Cistatina - tipo 1 SEQ ID NOS: 3655 - 3657 CT55 antígeno 55 dos testícu- SEQ ID NOS: 3658 los/câncer - 3659 CTB-60B18.6 SEQ ID NOS: 74 - 75 CTBS Quitobiase, di-N-acetil- SEQ ID NOS: 3660 - 3662 CTD- SEQ ID NO: 4160 2313N18.7 CTD- SEQ ID NOS: 81 - 2370N5.3 84 CTGF Fator de crescimento do tecido SEQ ID NO: 3663 conjuntivo CTHRC1 repetição da hélice tripla do co- SEQ ID NOS: 3664 lágeno contendo 1 - 3667
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CTLA4 Proteína 4 associada ao linfóci- SEQ ID NOS: 3668 to T citotóxico - 3671 CTNS Cistinosina, transportador de SEQ ID NOS: 3672 cistina lisossômica - 3679 CTRB1 Quimotripsinogênio B1 SEQ ID NOS: 3680 - 3682 CTRB2 Quimotripsinogênio B2 SEQ ID NOS: 3683 - 3686 CTRC Quimotripsina C (caldecrina) SEQ ID NOS: 3687 - 3688 CTRL tipo quimotripsina SEQ ID NOS: 3689 - 3691 CTSA Catepsina A SEQ ID NOS: 3692 - 3700 CTSB Catepsina B SEQ ID NOS: 3701 - 3725 CTSC Catepsina C SEQ ID NOS: 3726 - 3730 CTSD Catepsina D SEQ ID NOS: 3731 - 3741 CTSE Catepsina E SEQ ID NOS: 3742 - 3743 CTSF Catepsina F SEQ ID NOS: 3744 - 3747 CTSG Catepsina G SEQ ID NO: 3748 CTSH Catepsina H SEQ ID NOS: 3749 - 3754 CTSK Catepsina K SEQ ID NOS: 3755 - 3756 CTSL Catepsina L SEQ ID NOS: 3757 - 3759 CTSO Catepsina O SEQ ID NO: 3760
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CTSS Catepsina S SEQ ID NOS: 3761 - 3765 CTSV Catepsina V SEQ ID NOS: 3766 - 3767 CTSW Catepsina W SEQ ID NOS: 3768 - 3770 CTSZ Catepsina Z SEQ ID NO: 3771 CUBN Cubilina (receptor de cobala- SEQ ID NOS: 3772 mina-fator intrínsico) - 3775 CUTA Homólogo de tolerância ao cá- SEQ ID NOS: 3776 tion divalente CutA (E. coli) - 3785 CX3CL1 Ligante 1 de quimiocina (Moti- SEQ ID NOS: 3786 vo C-X3-C) - 3789 CXADR vírus Coxsackie e receptor de SEQ ID NOS: 3790 adenovírus - 3794 CXCL1 Ligante 1 de (Motivo C-X-C) SEQ ID NO: 3795 (atividade estimulador do cres- cimento de melanoma, alfa) CXCL10 Ligante 10 de quimiocina (Mo- SEQ ID NO: 3796 tivo C-X-C) CXCL11 Ligante 11 de quimiocina (Mo- SEQ ID NOS: 3797 tivo C-X-C) - 3798 CXCL12 Ligante 12 de quimiocina (Mo- SEQ ID NOS: 3799 tivo C-X-C) - 3804 CXCL13 Ligante 13 de quimiocina (Mo- SEQ ID NO: 3805 tivo C-X-C) CXCL14 Ligante 14 de quimiocina (Mo- SEQ ID NOS: 3806 tivo C-X-C) - 3807 CXCL17 Ligante 17 de quimiocina (Mo- SEQ ID NOS: 3808 tivo C-X-C) - 3809 CXCL2 Ligante 2 de quimiocina (Moti- SEQ ID NO: 3810 vo C-X-C)
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CXCL3 Ligante 3 quimiocina (Motivo C- SEQ ID NO: 3811 X-C) CXCL5 Ligante 5 de quimiocina (Moti- SEQ ID NO: 3812 vo C-X-C) CXCL6 Quimiocina (Motivo C-X-C) li- SEQ ID NOS: 3813 gante 6 - 3814 CXCL8 Quimiocina (Motivo C-X-C) li- SEQ ID NOS: 3815 gante 8 - 3816 CXCL9 Quimiocina (Motivo C-X-C) li- SEQ ID NO: 3817 gante 9 CXorf36 Cromossoma X estrutura de SEQ ID NOS: 3818 leitura aberta 36 - 3819 CYB5D2 domínio b5 citocromo conten- SEQ ID NOS: 3820 do 2 - 3823 CYHR1 1 rico em cisteína/histidina SEQ ID NOS: 3824 - 3831 CYP17A1 Citocromo P450, família 17, SEQ ID NOS: 3832 subfamília A, polipeptídeo 1 - 3836 CYP20A1 Citocromo P450, família 20, SEQ ID NOS: 3837 subfamília A, polipeptídeo 1 - 3843 CYP21A2 Citocromo P450, família 21, SEQ ID NOS: 3844 subfamília A, polipeptídeo 2 - 3851 CYP26B1 Citocromo P450, família 26, SEQ ID NOS: 3852 subfamília B, polipeptídeo 1 - 3856 CYP2A6 Citocromo P450, família 2, sub- SEQ ID NOS: 3857 família A, polipeptídeo 6 - 3858 CYP2A7 Citocromo P450, família 2, sub- SEQ ID NOS: 3859 família A, polipeptídeo 7 - 3861 CYP2B6 Citocromo P450, família 2, sub- SEQ ID NOS: 3862 família B, polipeptídeo 6 - 3865 CYP2C18 Citocromo P450, família 2, sub- SEQ ID NOS: 3866 família C, polipeptídeo 18 - 3867
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO CYP2C19 Citocromo P450, família 2, sub- SEQ ID NOS: 3868 família C, polipeptídeo 19 - 3869 CYP2C8 Citocromo P450, família 2, sub- SEQ ID NOS: 3870 família C, polipeptídeo 8 - 3877 CYP2C9 Citocromo P450, família 2, sub- SEQ ID NOS: 3878 família C, polipeptídeo 9 - 3880 CYP2E1 Citocromo P450, família 2, sub- SEQ ID NOS: 3881 família E, polipeptídeo 1 - 3886 CYP2F1 Citocromo P450, família 2, sub- SEQ ID NOS: 3887 família F, polipeptídeo 1 - 3890 CYP2J2 Citocromo P450, família 2, sub- SEQ ID NO: 3891 família J, polipeptídeo 2 CYP2R1 Citocromo P450, família 2, sub- SEQ ID NOS: 3892 família R, polipeptídeo 1 - 3897 CYP2S1 Citocromo P450, família 2, sub- SEQ ID NOS: 3898 família S, polipeptídeo 1 - 3903 CYP2W1 Citocromo P450, família 2, sub- SEQ ID NOS: 3904 família W, polipeptídeo 1 - 3906 CYP46A1 Citocromo P450, família 46, SEQ ID NOS: 3907 subfamília A, polipeptídeo 1 - 3911 CYP4F11 Citocromo P450, família 4, sub- SEQ ID NOS: 3912 família F, polipeptídeo 11 - 3916 CYP4F2 Citocromo P450, família 4, sub- SEQ ID NOS: 3917 família F, polipeptídeo 2 - 3921 CYR61 Indutor angiogênico, rico em SEQ ID NO: 3922 cisteína, 61 CYTL1 Citocina - tipo 1 SEQ ID NOS: 3923 - 3925 D2HGDH D-2-hidroxiglutarato de desi- SEQ ID NOS: 3926 drogenase - 3934 DAG1 Distroglicano 1 (glicoproteína 1 SEQ ID NOS: 3935 associada à distrofina) - 3949
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO DAND5 membro 5 da família de domí- SEQ ID NOS: 3950 nio DAN, antagonista BMP - 3951 DAO aminoácido D oxidase SEQ ID NOS: 3952 - 3957 DAZAP2 proteína 2 associada a DAZ SEQ ID NOS: 3958 - 3966 DBH Dopamina beta-hidroxilase SEQ ID NOS: 3967 (dopamina beta- - 3968 monooxigenase) DBNL tipo drebrina SEQ ID NOS: 3969 - 3986 DCD Dermcidina SEQ ID NOS: 3987 - 3989 DCN Decorina SEQ ID NOS: 3990 - 4008 DDIAS supressor de apoptose induzi- SEQ ID NOS: 4009 da por dano ao DNA - 4018 DDOST subunidade de doliquil- SEQ ID NOS: 4019 difosfooligossacarídeo-proteína - 4022 glicosiltransferase subunidade (não catalítico) DDR1 tirosina cinase 1 receptora de SEQ ID NOS: 4023 domínio de discoidina - 4068 DDR2 tirosina cinase 2 receptora de SEQ ID NOS: 4069 domínio de discoidina - 4074 DDT D-dopacrome tautomerase SEQ ID NOS: 4075 - 4080 DDX17 helicase 17 de caixa DEAD SEQ ID NOS: 4081 (Asp-Glu-Ala-Asp) - 4085 DDX20 polipeptídeo 20 de caixa DEAD SEQ ID NOS: 4086 (Asp-Glu-Ala-Asp) - 4088 DDX25 helicase 25 de caixa DEAD SEQ ID NOS: 4089 (Asp-Glu-Ala-Asp) - 4095
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO DDX28 polipeptídeo 28 de caixa DEAD SEQ ID NO: 4096 (Asp-Glu-Ala-Asp) DEAF1 fator de transcrição DEAF1 SEQ ID NOS: 4097 - 4099 DEF8 Diferencialmente expresso em SEQ ID NOS: 4100 homólogo de FDCP 8 (camun- - 4119 dongo) DEFA1 Defensina, alfa 1 SEQ ID NOS: 4120 - 4121 DEFA1B Defensina, alfa 1B SEQ ID NO: 4122 DEFA3 Defensina, alfa 3, específica de SEQ ID NO: 4123 neutrófilo DEFA4 Defensina, alfa 4, corticoestati- SEQ ID NO: 4124 na DEFA5 Defensina, alfa 5, específica de SEQ ID NO: 4125 célula Paneth DEFA6 Defensina, alfa 6, específica da SEQ ID NO: 4126 célula Paneth DEFB1 Defensina, beta 1 SEQ ID NO: 4127 DEFB103A Defensina, beta 103A SEQ ID NO: 4128 DEFB103B Defensina, beta 103B SEQ ID NO: 4129 DEFB104A Defensina, beta 104A SEQ ID NO: 4130 DEFB104B Defensina, beta 104B SEQ ID NO: 4131 DEFB105A Defensina, beta 105A SEQ ID NO: 4132 DEFB105B Defensina, beta 105B SEQ ID NO: 4133 DEFB106A Defensina, beta 106A SEQ ID NO: 4134 DEFB106B Defensina, beta 106B SEQ ID NO: 4135 DEFB107A Defensina, beta 107A SEQ ID NO: 4136 DEFB107B Defensina, beta 107B SEQ ID NO: 4137 DEFB108B Defensina, beta 108B SEQ ID NO: 4138 DEFB110 Defensina, beta 110 SEQ ID NOS: 4139 - 4140
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO DEFB113 Defensina, beta 113 SEQ ID NO: 4141 DEFB114 Defensina, beta 114 SEQ ID NO: 4142 DEFB115 Defensina, beta 115 SEQ ID NO: 4143 DEFB116 Defensina, beta 116 SEQ ID NO: 4144 DEFB118 Defensina, beta 118 SEQ ID NO: 4145 DEFB119 Defensina, beta 119 SEQ ID NOS: 4146 - 4148 DEFB121 Defensina, beta 121 SEQ ID NO: 4149 DEFB123 Defensina, beta 123 SEQ ID NO: 4150 DEFB124 Defensina, beta 124 SEQ ID NO: 4151 DEFB125 Defensina, beta 125 SEQ ID NO: 4152 DEFB126 Defensina, beta 126 SEQ ID NO: 4153 DEFB127 Defensina, beta 127 SEQ ID NO: 4154 DEFB128 Defensina, beta 128 SEQ ID NO: 4155 DEFB129 Defensina, beta 129 SEQ ID NO: 4156 DEFB130 Defensina, beta 130 SEQ ID NO: 4157 DEFB131 Defensina, beta 131 SEQ ID NO: 4159 DEFB132 Defensina, beta 132 SEQ ID NO: 4161 DEFB133 Defensina, beta 133 SEQ ID NO: 4162 DEFB134 Defensina, beta 134 SEQ ID NOS: 4163 - 4164 DEFB135 Defensina, beta 135 SEQ ID NO: 4165 DEFB136 Defensina, beta 136 SEQ ID NO: 4166 DEFB4A Defensina, beta 4A SEQ ID NO: 4167 DEFB4B Defensina, beta 4B SEQ ID NO: 4168 DFNA5 Surdez, dominante autossômi- SEQ ID NOS: 6271 co 5 - 6279 DFNB31 Surdez, 31 recessivo autossô- SEQ ID NOS: 14251 mico - 14254 DGCR2 gene 2 de região crítica da sín- SEQ ID NOS: 4171 drome DiGeorge - 4174 DHH Ouriço do deserto SEQ ID NO: 4175
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO DHRS4 Desidrogenase/redutase (Fa- SEQ ID NOS: 4176 mília SDR) membro 4 - 4183 DHRS4L2 Desidrogenase/redutase (Fa- SEQ ID NOS: 4184 mília SDR) membro 4 tipo 2 - 4193 DHRS7 Desidrogenase/redutase (Fa- SEQ ID NOS: 4194 mília SDR) membro 7 - 4201 DHRS7C Desidrogenase/redutase (Fa- SEQ ID NOS: 4202 mília SDR) membro 7C - 4204 DHRS9 Desidrogenase/redutase (Fa- SEQ ID NOS: 4205 mília SDR) membro 9 - 4212 DHRSX Ligado a X desidroge- SEQ ID NOS: 4213 nase/redutase (Família SDR) - 4217 DHX29 polipeptídeo 29 da caixa DEAH SEQ ID NOS: 4218 (Asp-Glu-Ala-His) - 4220 DHX30 Helicase 30 da caixa DEAH SEQ ID NOS: 4221 (Asp-Glu-Ala-His) - 4228 DHX8 Polipeptídeo 8 da caixa DEAH SEQ ID NOS: 4229 (Asp-Glu-Ala-His) - 4233 DIO2 Deiodinase, iodotironina, tipo II SEQ ID NOS: 4234 - 4243 DIXDC1 1 contendo domínio DIX SEQ ID NOS: 4244 - 4247 DKK1 inibidor 1 da via de sinalização SEQ ID NO: 4248 Dickkopf WNT DKK2 inibidor 2 da via de sinalização SEQ ID NOS: 4249 Dickkopf WNT - 4251 DKK3 inibidor 3 da via de sinalização SEQ ID NOS: 4252 Dickkopf WNT - 4257 DKK4 inibidor 4 da via de sinalização SEQ ID NO: 4258 Dickkopf WNT DKKL1 Dickkopf - tipo 1 SEQ ID NOS: 4259 - 4264
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO DLG4 Discos, homólogo 4 grande SEQ ID NOS: 4265 (Drosophila) - 4273 DLK1 homólogo delta - tipo 1 (Droso- SEQ ID NOS: 4274 phila) - 4277 DLL1 Delta - tipo 1 (Drosophila) SEQ ID NOS: 4278 - 4279 DLL3 Delta-tipo 3 (Drosophila) SEQ ID NOS: 4280 - 4282 DMBT1 Deletado em tumores 1 cere- SEQ ID NOS: 4283 brais malignos - 4289 DMKN Dermocine SEQ ID NOS: 4290 - 4336 DMP1 fosfoproteína 1 acídica de ma- SEQ ID NOS: 4337 triz de dentina - 4338 DMRTA2 família A2 tipo DMRT SEQ ID NOS: 4339 - 4340 DNAAF5 Dineína, axonemal, fator 5 de SEQ ID NOS: 4341 montagem - 4344 DNAH14 Dineína, axonemal, cadeia 14 SEQ ID NOS: 4345 pesada - 4359 DNAJB11 Homólogo DnaJ (Hsp40), sub- SEQ ID NOS: 4360 família B, membro 11 - 4361 DNAJB9 Homólogo DnaJ (Hsp40), sub- SEQ ID NO: 4362 família B, membro 9 DNAJC25- leitura de DNAJC25-GNG10 SEQ ID NO: 4363 GNG10 DNAJC3 DnaJ (Hsp40) homolog, sub- SEQ ID NOS: 4364 família C, membro 3 - 4365 DNASE1 Deoxiribonuclease I SEQ ID NOS: 4366 - 4376 DNASE1L1 Deoxiribonuclease I - tipo 1 SEQ ID NOS: 4377 - 4387
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO DNASE1L2 Deoxiribonuclease I-tipo 2 SEQ ID NOS: 4388 - 4393 DNASE1L3 Deoxiribonuclease I-tipo 3 SEQ ID NOS: 4394 - 4399 DNASE2 Deoxiribonuclease II, lisossô- SEQ ID NOS: 4400 mica - 4401 DNASE2B Deoxiribonuclease II beta SEQ ID NOS: 4402 - 4403 DPEP1 Dipeptidase 1 (renal) SEQ ID NOS: 4404 - 4408 DPEP2 Dipeptidase 2 SEQ ID NOS: 4409 - 4415 DPEP3 Dipeptidase 3 SEQ ID NO: 4416 DPF3 D4, dedos PHD de zinco e du- SEQ ID NOS: 4417 plo, família 3 - 4423 DPP4 Dipeptidil-peptidase 4 SEQ ID NOS: 4424 - 4428 DPP7 Dipeptidil-peptidase 7 SEQ ID NOS: 4429 - 4434 DPT Dermatopontina SEQ ID NO: 4435 DRAXIN Proteína de orientação de axô- SEQ ID NO: 4436 nio inibitória dorsal DSE Dermatano sulfato epimerase SEQ ID NOS: 4437 - 4445 DSG2 Desmogleína 2 SEQ ID NOS: 4446 - 4447 DSPP sialofosfoproteína de dentina SEQ ID NOS: 4448 - 4449 DST Distonina SEQ ID NOS: 4450 - 4468 DUOX1 Oxidase 1 dual SEQ ID NOS: 4469 - 4473
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO DYNLT3 Dineína, cadeia leve, Tctex-tipo SEQ ID NOS: 4474 3 - 4476 E2F5 Fator de transcrição E2F 5, li- SEQ ID NOS: 4477 gação p130 - 4483 EBAG9 associado ao sítio de ligação SEQ ID NOS: 4484 ao receptor de estrogênio, an- - 4492 tíneno, 9 EBI3 3 induzido pelo vírus Epstein- SEQ ID NO: 4493 Barr ECHDC1 Etilmalonil-CoA descarboxilase SEQ ID NOS: 4494 1 - 4512 ECM1 Proteína 1 de matriz extracelu- SEQ ID NOS: 4513 lar - 4515 ECM2 proteína 2 de matriz extracelu- SEQ ID NOS: 4516 lar, órgão feminino e específico - 4519 de adipócito ECSIT Integrante de sinalização de SEQ ID NOS: 4520 ECSIT - 4531 EDDM3A Proteína 3A epidídima SEQ ID NO: 4532 EDDM3B Proteína 3B epidídima SEQ ID NO: 4533 EDEM2 Realçador de degradação de SEQ ID NOS: 4534 ER, manosidase alfa-tipo 2 - 4535 EDEM3 Realçador de degradação ER, SEQ ID NOS: 4536 manosidase alfa-tipo 3 - 4538 EDIL3 Repetições do tipo EGF e do- SEQ ID NOS: 4539 mínios 3 tipo discoidina I - 4540 EDN1 Endotelina 1 SEQ ID NO: 4541 EDN2 Endotelina 2 SEQ ID NO: 4542 EDN3 Endotelina 3 SEQ ID NOS: 4543 - 4548 EDNRB Endotelina receptor tipo B SEQ ID NOS: 4549 - 4557
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO EFEMP1 Proteína 1 de matriz extracelu- SEQ ID NOS: 4558 lar tipo fibulina contendo EGF - 4568 EFEMP2 Proteína 2 de matriz extracelu- SEQ ID NOS: 4569 lar tipo fibulina contendo EGF - 4580 EFNA1 Efrina A1 SEQ ID NOS: 4581 - 4582 EFNA2 Efrina A2 SEQ ID NO: 4583 EFNA4 Efrina A4 SEQ ID NOS: 4584 - 4586 EGFL6 domínio tipo EGF, múltiplo 6 SEQ ID NOS: 4587 - 4588 EGFL7 domínio tipo EGF, múltiplo 7 SEQ ID NOS: 4589 - 4593 EGFL8 domínio tipo EGF, múltiplo 8 SEQ ID NOS: 4594 - 4596 EGFLAM domínios G de fibronectina tipo SEQ ID NOS: 4597 III e laminina, tipo EGF - 4605 EGFR receptor de fator de crescimen- SEQ ID NOS: 4606 to epidérmico - 4613 EHBP1 proteína 1 de ligação ao domí- SEQ ID NOS: 4614 nio EH - 4625 EHF fator homólogo de Ets SEQ ID NOS: 4626 - 4635 EHMT1 histona-lisina N- SEQ ID NOS: 4636 metiltransferase 1 eucromática - 4661 EHMT2 histona-lisina N- SEQ ID NOS: 4662 metiltransferase 2 eucromática - 4666 EIF2AK1 Fator 2-alfa cinase 1 de início SEQ ID NOS: 4667 de translação eucariótica - 4670 ELANE Elastase, expressa por neutró- SEQ ID NOS: 4671 filo - 4672 ELN Elastina SEQ ID NOS: 4673 - 4695
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO ELP2 subunidade 2 de complexo SEQ ID NOS: 4696 alongador de acetiltransferase - 4708 ELSPBP1 Proteína 1 de ligação ao es- SEQ ID NOS: 4709 perma epidídimo - 4714 EMC1 Subunidade 1 de complexo de SEQ ID NOS: 4715 proteína de membrana ER - 4721 EMC10 Subunidade 10 de complexo de SEQ ID NOS: 4722 proteína de membrana ER - 4728 EMC9 subunidade 9 de complexo de SEQ ID NOS: 4729 proteína de membrana ER - 4732 EMCN Endomucina SEQ ID NOS: 4733 - 4737 EMID1 1 contendo domínio EMI SEQ ID NOS: 4738 - 4744 EMILIN1 Interfacer 1 de microfibrila de SEQ ID NOS: 4745 elastina - 4746 EMILIN2 Interfacer 2 de microfibrila de SEQ ID NO: 4747 elastina EMILIN3 Interfacer 3 de microfibrila de SEQ ID NO: 4748 elastina ENAM Enamelina SEQ ID NO: 4749 ENDOG Endonuclease G SEQ ID NO: 4750 ENDOU específico de poliU de endonu- SEQ ID NOS: 4751 clease - 4753 ENHO Homeostase de energia asso- SEQ ID NO: 4754 ciada ENO4 Membro 4 da família Enolase SEQ ID NOS: 4755 - 4759 ENPP6 Ectonucleotídeo pirofosfa- SEQ ID NOS: 4760 tase/fosfodiesterase 6 - 4761 ENPP7 Ectonucleotídeo pirofosfa- SEQ ID NOS: 4762 tase/fosfodiesterase 7 - 4763
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO ENTPD5 Ectonucleosídeo trifosfato di- SEQ ID NOS: 4764 fosfo-hidrolase 5 - 4768 ENTPD8 Ectonucleosídeo trifosfato di- SEQ ID NOS: 4769 fosfo-hidrolase 8 - 4772 EOGT N-acetilglucosamina (GlcNac) SEQ ID NOS: 4773 transferase O-ligada específica - 4780 do domínio EGF EPCAM Molécula de adesão celular SEQ ID NOS: 4781 epitelial - 4784 EPDR1 1 relacionado à Ependimina SEQ ID NOS: 4785 - 4788 EPGN mitógeno epitelial SEQ ID NOS: 4789 - 4797 EPHA10 Receptor EPH A10 SEQ ID NOS: 4798 - 4805 EPHA3 Receptor EPH A3 SEQ ID NOS: 4806 - 4808 EPHA4 Receptor EPH A4 SEQ ID NOS: 4809 - 4818 EPHA7 Receptor EPH A7 SEQ ID NOS: 4819 - 4820 EPHA8 Receptor EPH A8 SEQ ID NOS: 4821 - 4822 EPHB2 Receptor EPH B2 SEQ ID NOS: 4823 - 4827 EPHB4 Receptor EPH B4 SEQ ID NOS: 4828 - 4830 EPHX3 Epóxido hidrolase 3 SEQ ID NOS: 4831 - 4834 EPO Eritropoietina SEQ ID NO: 4835 EPPIN Inibidor de peptidase epidídima SEQ ID NOS: 4836 - 4838
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO EPPIN- leitura de EPPIN-WFDC6 SEQ ID NO: 4839 WFDC6 EPS15 substrato 15 da via de receptor SEQ ID NOS: 4840 do fator de crescimento epi- - 4842 dérmico EPS8L1 EPS8 - tipo 1 SEQ ID NOS: 4843 - 4848 EPX Eosinófilo peroxidase SEQ ID NO: 4849 EPYC Epificano SEQ ID NOS: 4850 - 4851 EQTN Equatorina, acrossoma de es- SEQ ID NOS: 4852 perma associado - 4854 ERAP1 Retículo endoplásmico amino- SEQ ID NOS: 4855 peptidase 1 - 4859 ERAP2 Retículo endoplásmico amino- SEQ ID NOS: 4860 peptidase 2 - 4867 ERBB3 tirosina cinase 3 de receptor SEQ ID NOS: 4868 Erb-b2 - 4881 ERLIN1 1 associado à grande quanti- SEQ ID NOS: 4885 dade de lipídeo ER - 4887 ERLIN2 2 associado à grande quanti- SEQ ID NOS: 4888 dade de lipídeo ER - 4896 ERN1 Retículo endoplásmico para si- SEQ ID NOS: 4897 nalização 1 do núcleo - 4898 ERN2 Retículo endoplásmico para si- SEQ ID NOS: 4899 nalização 2 do núcleo - 4903 ERO1A Oxidoredutase alfa do retículo SEQ ID NOS: 4904 endoplásmico - 4910 ERO1B Oxidoredutase beta do retículo SEQ ID NOS: 4911 endoplásmico - 4913 ERP27 Proteína 27 do retículo endo- SEQ ID NOS: 4914 plásmico - 4915
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO ERP29 Proteína 29 do retículo endo- SEQ ID NOS: 4916 plásmico - 4919 ERP44 Proteína 44 do retículo endo- SEQ ID NO: 4920 plásmico ERV3-1 Grupo 3 de retrovirus endóge- SEQ ID NO: 4921 no, membro 1 ESM1 Molécula 1 específica de célula SEQ ID NOS: 4922 endotelial - 4924 ESRP1 proteína 1 regulatória de SEQ ID NOS: 4925 emenda epitelial - 4933 EXOG Endo/exonuclease (5'-3'), tipo SEQ ID NOS: 4934 endonuclease G - 4947 EXTL1 Glicosiltransferase 1 tipo exos- SEQ ID NO: 4948 tosina EXTL2 Glicosiltransferase 2 tipo exos- SEQ ID NOS: 4949 tosina - 4953 F10 Fator X de coagulação SEQ ID NOS: 4954 - 4957 F11 Fator XI de coagulação SEQ ID NOS: 4958 - 4962 F12 Fator XII de coagulação (fator SEQ ID NO: 4963 Hageman) F13B Fator XIII de coagulação, poli- SEQ ID NO: 4964 peptídeo B F2 Fator II de coagulação (trombi- SEQ ID NOS: 4965 na) - 4967 F2R Receptor de fator II de coagu- SEQ ID NOS: 4968 lação (trombina) - 4969 F2RL3 Receptor de fator II de coagu- SEQ ID NOS: 4970 lação (trombina) - tipo 3 - 4971 F5 Fator V de coagulação (proace- SEQ ID NOS: 4972 lerina, fator lábil) - 4973
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO F7 Fator VII de coagulação (acele- SEQ ID NOS: 4974 rador de conversão de pro- - 4977 trombina de soro) F8 Fator VIII de coagulação, com- SEQ ID NOS: 4978 ponente procoagulante - 4983 F9 Fator IX de coagulação SEQ ID NOS: 4984 - 4985 FABP6 Proteína 6 de ligação de ácido SEQ ID NOS: 4986 graxo, ileal - 4988 FAM107B Família com similaridade de SEQ ID NOS: 4989 sequência 107, membro B - 5010 FAM131A Família com similaridade de SEQ ID NOS: 5011 sequência 131, membro A - 5019 FAM132A Família com similaridade de SEQ ID NO: 1795 sequência 132, membro A FAM132B Família com similaridade de SEQ ID NOS: 4882 sequência 132, membro B - 4884 FAM150A Família com similaridade de SEQ ID NOS: 737 - sequência 150, membro A 738 FAM150B Família com similaridade de SEQ ID NOS: 739 - sequência 150, membro B 745 FAM171A1 Família com similaridade de SEQ ID NOS: 5020 sequência 171, membro A1 - 5021 FAM171B Família com similaridade de SEQ ID NOS: 5022 sequência 171, membro B - 5023 FAM172A Família com similaridade de SEQ ID NOS: 5024 sequência 172, membro A - 5028 FAM175A Família com similaridade de SEQ ID NOS: 64 - sequência 175, membro A 71 FAM177A1 Família com similaridade de SEQ ID NOS: 5029 sequência 177, membro A1 - 5038 FAM179B Família com similaridade de SEQ ID NOS: 13628 sequência 179, membro B - 13633
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO FAM180A Família com similaridade de SEQ ID NOS: 5039 sequência 180, membro A - 5041 FAM189A1 Família com similaridade de SEQ ID NOS: 5042 sequência 189, membro A1 - 5043 FAM198A Família com similaridade de SEQ ID NOS: 5044 sequência 198, membro A - 5046 FAM19A1 Família com similaridade de SEQ ID NOS: 5047 sequência 19 (Quimiocina (tipo - 5049 (Motivo C-C)), membro A1 FAM19A2 Família com similaridade de SEQ ID NOS: 5050 sequência 19 (Quimiocina (tipo - 5057 (Motivo C-C)), membro A2 FAM19A3 Família com similaridade de SEQ ID NOS: 5058 sequência 19 (Quimiocina (tipo - 5059 (Motivo C-C)), membro A3 FAM19A4 Família com similaridade de SEQ ID NOS: 5060 sequência 19 (Quimiocina (tipo - 5062 (Motivo C-C)), membro A4 FAM19A5 Família com similaridade de SEQ ID NOS: 5063 sequência 19 (Quimiocina (tipo - 5066 (Motivo C-C)), membro A5 FAM20A Família com similaridade de SEQ ID NOS: 5067 sequência 20, membro A - 5070 FAM20C Família com similaridade de SEQ ID NO: 5071 sequência 20, membro C FAM213A Família com similaridade de SEQ ID NOS: 5072 sequência 213, membro A - 5077 FAM26D Família com similaridade de SEQ ID NOS: 2006 sequência 26, membro D - 2010 FAM46B Família com similaridade de SEQ ID NO: 5078 sequência 46, membro B FAM57A Família com similaridade de SEQ ID NOS: 5079 sequência 57, membro A - 5084
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO FAM78A Família com similaridade de SEQ ID NOS: 5085 sequência 78, membro A - 5087 FAM96A Família com similaridade de SEQ ID NOS: 5088 sequência 96, membro A - 5092 FAM9B Família com similaridade de SEQ ID NOS: 5093 sequência 9, membro B - 5096 FAP Proteína de ativação de fi- SEQ ID NOS: 5097 broblasto, alfa - 5103 FAS Receptor de morte de superfí- SEQ ID NOS: 5104 cie celular Fas - 5113 FAT1 Caderina 1 atípica FAT SEQ ID NOS: 5114 - 5120 FBLN1 Fibulina 1 SEQ ID NOS: 5121 - 5133 FBLN2 Fibulina 2 SEQ ID NOS: 5134 - 5139 FBLN5 Fibulina 5 SEQ ID NOS: 5140 - 5145 FBLN7 Fibulina 7 SEQ ID NOS: 5146 - 5151 FBN1 Fibrillina 1 SEQ ID NOS: 5152 - 5155 FBN2 Fibrillina 2 SEQ ID NOS: 5156 - 5161 FBN3 Fibrillina 3 SEQ ID NOS: 5162 - 5166 FBXW7 7 contendo domínio de repeti- SEQ ID NOS: 5167 ção WD e caixa F, E3 ubiquiti- - 5177 na proteína ligase FCAR Fragmento Fc de receptor IgA SEQ ID NOS: 5178 - 5187 FCGBP Fragmento Fc de proteína de SEQ ID NOS: 5188 ligação a IgG - 5190
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO FCGR1B Fragmento Fc de IgG, Ib de al- SEQ ID NOS: 5191 ta afinidade, receptor (CD64) - 5196 FCGR3A Fragmento Fc de IgG, IIIa de SEQ ID NOS: 5197 baixa afinidade, receptor - 5203 (CD16a) FCGRT Fragmento Fc de IgG, receptor, SEQ ID NOS: 5204 transportador, alfa - 5214 FCMR Fragmento Fc de receptor IgM SEQ ID NOS: 5215 - 5221 FCN1 Ficolina 1 (contendo colágeno / SEQ ID NOS: 5222 fibrinogênio) - 5223 FCN2 Ficolina 2 (lectina contend do- SEQ ID NOS: 5224 mínio de colágeno/fibrinogênio) - 5225 FCN3 Ficolina 3 (contendo domínio SEQ ID NOS: 5226 de colágeno/fibrinogênio) - 5227 FCRL1 Fc receptor - tipo 1 SEQ ID NOS: 5228 - 5230 FCRL3 Fc receptor - tipo 3 SEQ ID NOS: 5231 - 5236 FCRL5 Fc receptor - tipo 5 SEQ ID NOS: 5237 - 5239 FCRLA Fc receptor - tipo A SEQ ID NOS: 5240 - 5251 FCRLB Fc receptor - tipo B SEQ ID NOS: 5252 - 5256 FDCSP Proteína secretada de célula SEQ ID NO: 5257 dendrítica follicular FETUB Fetuína B SEQ ID NOS: 5258 - 5264 FGA Cadeia alfa de fibrinogênio SEQ ID NOS: 5265 - 5267 FGB Cadeia beta fibrinogênio SEQ ID NOS: 5268 - 5270
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO FGF10 Fator de crescimento de fi- SEQ ID NOS: 5271 broblasto 10 - 5272 FGF17 Fator de crescimento de fi- SEQ ID NOS: 5273 broblasto 17 - 5274 FGF18 Fator de crescimento de fi- SEQ ID NO: 5275 broblasto 18 FGF19 Fator de crescimento de fi- SEQ ID NO: 5276 broblasto 19 FGF21 Fator de crescimento de fi- SEQ ID NOS: 5277 broblasto 21 - 5278 FGF22 Fator de crescimento de fi- SEQ ID NOS: 5279 broblasto 22 - 5280 FGF23 Fator de crescimento de fi- SEQ ID NO: 5281 broblasto 23 FGF3 Fator de crescimento de fi- SEQ ID NO: 5282 broblasto 3 FGF4 Fator de crescimento de fi- SEQ ID NO: 5283 broblasto 4 FGF5 Fator de crescimento de fi- SEQ ID NOS: 5284 broblasto 5 - 5286 FGF7 Fator de crescimento de fi- SEQ ID NOS: 5287 broblasto 7 - 5291 FGF8 Fator de crescimento de fi- SEQ ID NOS: 5292 broblasto 8 (induzido por an- - 5297 drogênio) FGFBP1 Proteína 1 de ligação a fator de SEQ ID NO: 5298 crescimento de fibroblasto FGFBP2 Proteína 2 de ligação ao fator SEQ ID NO: 5299 de crescimento de fibroblasto FGFBP3 Proteína 3 de ligação ao fator SEQ ID NO: 5300 de crescimento de fibroblasto FGFR1 Fator de crescimento de fi- SEQ ID NOS: 5301 broblasto receptor 1 - 5322
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO FGFR2 Fator de crescimento de fi- SEQ ID NOS: 5323 broblasto receptor 2 - 5344 FGFR3 Fator de crescimento de fi- SEQ ID NOS: 5345 broblasto receptor 3 - 5352 FGFR4 Fator de crescimento de fi- SEQ ID NOS: 5353 broblasto receptor 4 - 5362 FGFRL1 Fator de crescimento de fi- SEQ ID NOS: 5363 broblasto receptor - tipo 1 - 5368 FGG Cadeia gama de fibrinogênio SEQ ID NOS: 5369 - 5374 FGL1 Fibrinogênio - tipo 1 SEQ ID NOS: 5375 - 5381 FGL2 Fibrinogênio - tipo 2 SEQ ID NOS: 5382 - 5383 FHL1 Quatro e meio domínios 1 de SEQ ID NOS: 5384 LIM - 5411 FHOD3 domínio de homologia 2 de SEQ ID NOS: 5412 formina contendo 3 - 5418 FIBIN Homólogo de fator de iniciação SEQ ID NO: 5419 de botão de barbatana (peixe- zebra) FICD domínio contendo FIC SEQ ID NOS: 5420 - 5423 FIGF Fator de crescimento induzido SEQ ID NO: 14054 por C-fos (fator de crescimento endotelial vascular D) FJX1 Caixa 1 ligada a quatro SEQ ID NO: 5424 FKBP10 Proteína 10 de ligação a SEQ ID NOS: 5425 FK506, 65 kDa - 5430 FKBP11 Proteína 11 de ligação a SEQ ID NOS: 5431 FK506, 19 kDa - 5437 FKBP14 Proteína 14 de ligação a FK506 SEQ ID NOS: 5438 14, 22 kDa - 5440
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO FKBP2 Proteína de ligação a FK506 2, SEQ ID NOS: 5441 13kDa - 5444 FKBP7 Proteína de ligação a FK506 7 SEQ ID NOS: 5445 - 5450 FKBP9 Proteína de ligação a FK506 9, SEQ ID NOS: 5451 63 kDa - 5454 FLT1 Tirosina cinase 1 relacionada SEQ ID NOS: 5455 com Fms - 5463 FLT4 Tirosina cinase 4 relacionada SEQ ID NOS: 5464 com Fms - 5468 FMO1 Monooxigenase 1 contendo SEQ ID NOS: 5469 flavina - 5473 FMO2 Monooxigenase 2 contendo SEQ ID NOS: 5474 flavina (não funcional) - 5476 FMO3 Monooxigenase 3 contendo SEQ ID NOS: 5477 flavina - 5479 FMO5 Flavin contendo monooxige- SEQ ID NOS: 5480 nase 5 - 5486 FMOD Fibromodulina SEQ ID NO: 5487 FN1 Fibronectina 1 SEQ ID NOS: 5488 - 5500 FNDC1 1 contendo domínio tipo III de SEQ ID NOS: 5501 fibronectina - 5502 FNDC7 7 contendo domínio tipo III de SEQ ID NOS: 5503 fibronectina - 5504 FOCAD Focadaesina SEQ ID NOS: 5505 - 5511 FOLR2 Receptor 2 de folato (fetal) SEQ ID NOS: 5512 - 5521 FOLR3 Receptor 3 de folato (gama) SEQ ID NOS: 5522 - 5526 FOXRED2 domínio de oxidoredutase de- SEQ ID NOS: 5527 pendente de FAD contendo 2 - 5530
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO FP325331.1 Proteína não caracterizada SEQ ID NO: 5531 UNQ6126/PRO20091 FPGS Folilpoliglutamato sintase SEQ ID NOS: 5539 - 5545 FRAS1 Subunidade 1 de complexo de SEQ ID NOS: 5546 matriz extracelular Fraser - 5551 FREM1 Matriz 1 extracelular relaciona- SEQ ID NOS: 5552 da com FRAS1 - 5556 FREM3 Matriz 3 extracelular relaciona- SEQ ID NO: 5557 da com FRAS1 FRMPD2 2 contendo comínio FERM e SEQ ID NOS: 5558 PDZ - 5561 FRZB Proteína relacionada com Friz- SEQ ID NO: 5562 zled FSHB Hormônio estimulador de folí- SEQ ID NOS: 5563 culo, beta polipeptídeo - 5565 FSHR Receptor de hormônio estimu- SEQ ID NOS: 5566 lador de folículo - 5569 FST Foliestatina SEQ ID NOS: 5570 - 5573 FSTL1 Foliestatina - tipo 1 SEQ ID NOS: 5574 - 5577 FSTL3 Foliestatina - tipo 3 (glicoprote- SEQ ID NOS: 5578 ína secretada) - 5583 FSTL4 Foliestatina - tipo 4 SEQ ID NOS: 5584 - 5586 FSTL5 Foliestatina - tipo 5 SEQ ID NOS: 5587 - 5589 FTCDNL1 semelhante N-terminal de for- SEQ ID NOS: 5590 miminotransferase ciclodesa- - 5593 minase FUCA1 Fucosidase, alfa-L-1, tecido SEQ ID NO: 5594
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO FUCA2 Fucosidase, alfa-L- 2, plasma SEQ ID NOS: 5595 - 5596 FURIN Furina (enzima de clivagem de SEQ ID NOS: 5597 aminoácido básico pareado) - 5603 FUT10 Fucosiltransferase 10 (alfa SEQ ID NOS: 5604 (1,3) fucosiltransferase) - 5606 FUT11 Fucosiltransferase 11 (alfa SEQ ID NOS: 5607 (1,3) fucosiltransferase) - 5608 FXN Frataxina SEQ ID NOS: 5609 - 5616 FXR1 Homólogo 1 autossômico, de SEQ ID NOS: 5617 retardo mental X frágil - 5629 FXYD3 Regulador 3 de transporte de SEQ ID NOS: 5630 íon contendo o domínio FXYD - 5642 GABBR1 Receptor B de ácido gama- SEQ ID NOS: 5643 aminobutírico (GABA) B, 1 - 5654 GABRA1 Receptor A de ácido gama- SEQ ID NOS: 5655 aminobutírico (GABA), alfa 1 - 5670 GABRA2 Receptor A de ácido gama- SEQ ID NOS: 5671 aminobutírico, alfa 2 - 5685 GABRA5 Receptor A de ácido gama- SEQ ID NOS: 5686 aminobutírico, alfa 5 - 5694 GABRG3 Receptor A de ácido gama- SEQ ID NOS: 5695 aminobutírico, gama 3 - 5700 GABRP Receptor A de ácido gama- SEQ ID NOS: 5701 aminobutírico, pi - 5709 GAL Galanina/prepropeptídeo SEQ ID NO: 5710
GMAP GAL3ST1 Galactose-3-O-sulfotransferase SEQ ID NOS: 5711 1 - 5732 GAL3ST2 Galactose-3-O-sulfotransferase SEQ ID NO: 5733 2
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO GAL3ST3 Galactose-3-O-sulfotransferase SEQ ID NOS: 5734 3 - 5735 GALC Galactosilceramidase SEQ ID NOS: 5736 - 5745 GALNS Galactosamina (N-acetil)-6- SEQ ID NOS: 5746 sulfatase - 5751 GALNT10 Polipeptídeo N- SEQ ID NOS: 5752 acetilgalactosaminiltransferase - 5755 10 GALNT12 Polipeptídeo N- SEQ ID NOS: 5756 acetilgalactosaminiltransferase - 5757 12 GALNT15 Polipeptídeo N- SEQ ID NOS: 5758 acetilgalactosaminiltransferase - 5761 15 GALNT2 Polipeptídeo N- SEQ ID NO: 5762 acetilgalactosaminiltransferase 2 GALNT6 Polipeptídeo N- SEQ ID NOS: 5763 acetilgalactosaminiltransferase - 5774 6 GALNT8 Polipeptídeo N- SEQ ID NOS: 5775 acetilgalactosaminiltransferase - 5778 8 GALNTL6 Polipeptídeo N- SEQ ID NOS: 5779 acetilgalactosaminiltransferase- - 5782 tipo 6 GALP peptídeo tipo galanina SEQ ID NOS: 5783 - 5785 GANAB Glucosidase, alfa; neutral AB SEQ ID NOS: 5786 - 5794 GARS Glicil-tRNA Sintetase SEQ ID NOS: 5795 - 5798
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO GAS1 1 específico de interrupção do SEQ ID NO: 5799 crescimento 1 GAS6 6 específico de interrupção do SEQ ID NO: 5800 crescimento 6 GAST Gastrina SEQ ID NO: 5801 GBA Glucosidase, beta, ácido SEQ ID NOS: 5811 - 5814 GBGT1 Globosídeo alfa-1,3-N- SEQ ID NOS: 5815 acetilgalactosaminiltransferase - 5823 1 GC componente específico do gru- SEQ ID NOS: 5824 po (proteína de ligação à vita- - 5828 mina D) GCG Glucagon SEQ ID NOS: 5829 - 5830 GCGR Receptor de Glucagon SEQ ID NOS: 5831 - 5833 GCNT7 Família da Glucosaminil (N- SEQ ID NOS: 5834 acetil) transferase membro 7 - 5835 GCSH proteína H do sistema de cliva- SEQ ID NOS: 5836 gem da glicina (transportador - 5844 aminometila) GDF1 Fator de diferenciação do cres- SEQ ID NO: 5845 cimento 1 GDF10 Fator de diferenciação do cres- SEQ ID NO: 5846 cimento 10 GDF11 Fator de diferenciação do cres- SEQ ID NOS: 5847 cimento 11 - 5848 GDF15 Fator de diferenciação do cres- SEQ ID NOS: 5849 cimento 15 - 5851 GDF2 Fator de diferenciação do cres- SEQ ID NO: 5852 cimento 2
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO GDF3 Fator de diferenciação do cres- SEQ ID NO: 5853 cimento 3 GDF5 Fator de diferenciação do cres- SEQ ID NOS: 5854 cimento 5 - 5855 GDF6 Fator de diferenciação do cres- SEQ ID NOS: 5856 cimento 6 - 5858 GDF7 Fator de diferenciação do cres- SEQ ID NO: 5859 cimento 7 GDF9 Fator de diferenciação do cres- SEQ ID NOS: 5860 cimento 9 - 5864 GDNF Fator neurotrófico derivado de SEQ ID NOS: 5865 célula glial - 5872 GFOD2 domínio de glicose-frutose oxi- SEQ ID NOS: 5873 doredutase contendo 2 - 5878 GFPT2 Glutamina-frutose-6-fosfato SEQ ID NOS: 5879 transaminase 2 - 5881 GFRA2 Receptor alfa de GDNF família SEQ ID NOS: 5882 receptor alfa 2 - 5888 GFRA4 receptor alfa 4 da família SEQ ID NOS: 5889 GDNF - 5891 GGA2 contendo orelha de adaptina SEQ ID NOS: 5892 gama, associada a Golgi, pro- - 5900 teína 2 de ligação a ARF GGH Gama-glutamil hidrolase (con- SEQ ID NO: 5901 jugase, folilpoligamaglutamil hidrolase) GGT1 Gama-glutamiltransferase 1 SEQ ID NOS: 5902 - 5924 GGT5 Gama-glutamiltransferase 5 SEQ ID NOS: 5925 - 5929 GH1 Hormônio de crescimento 1 SEQ ID NOS: 5930 - 5934
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO GH2 Hormônio de crescimento 2 SEQ ID NOS: 5935 - 5939 GHDC domínio contendo GH3 SEQ ID NOS: 5940 - 5947 GHRH Hormônio de liberação do hor- SEQ ID NOS: 5948 mônio de crescimento - 5950 GHRHR Receptor do hormônio de libe- SEQ ID NOS: 5951 ração do hormônio de cresci- - 5956 mento GHRL prepropeptídeo de obestati- SEQ ID NOS: 5957 na/grelina - 5967 GIF Fator intrinsic de gastrina (sín- SEQ ID NOS: 5968 tese de vitamina B) - 5969 GIP Polipeptídeo inibidor gastric SEQ ID NO: 5970 GKN1 Gastrocina 1 SEQ ID NO: 5971 GKN2 Gastrocina 2 SEQ ID NOS: 5972 - 5973 GLA Galactosidase, alfa SEQ ID NOS: 5974 - 5975 GLB1 Galactosidase, beta 1 SEQ ID NOS: 5976 - 5984 GLB1L Galactosidase, tipo beta 1 SEQ ID NOS: 5985 - 5992 GLB1L2 Galactosidase, beta 1 - tipo 2 SEQ ID NOS: 5993 - 5994 GLCE Epimerase de ácido glucurôni- SEQ ID NOS: 5995 co - 5996 GLG1 glicoproteína 1 Golgi SEQ ID NOS: 5997 - 6004 GLIPR1 patogênese de GLI-relacionado SEQ ID NOS: 6005 a1 - 6008 GLIPR1L1 patogênese GLI tipo 1 relacio- SEQ ID NOS: 6009 nado a 1 - 6012
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO GLIS3 dedo de zinco 3 da família SEQ ID NOS: 6013 GLIS - 6021 GLMP Proteína da membraqna lisos- SEQ ID NOS: 6022 sômica glicosilada - 6030 GLRB receptor de glicina, beta SEQ ID NOS: 6031 - 6036 GLS Glutaminase SEQ ID NOS: 6037 - 6044 GLT6D1 domínio de glicosiltransferase SEQ ID NOS: 6045 contendo 1 - 6046 GLTPD2 o domínio de proteína de trans- SEQ ID NO: 6047 ferência de glicolipídeo conten- do 2 GLUD1 Glutamato desidrogenase 1 SEQ ID NO: 6048 GM2A ativador de gangliosídeo GM2 SEQ ID NOS: 6049 - 6051 GML tipo molécula ancorada a glico- SEQ ID NOS: 6052 silfosfatidilinositol - 6053 GNAS locus de complexo GNAS SEQ ID NOS: 6054 - 6075 GNLY Granulisina SEQ ID NOS: 6076 - 6079 GNPTG N-acetilglucosamina-1-fosfato SEQ ID NOS: 6080 transferase, subunidade gama - 6084 GNRH1 hormônio 1 de liberação de go- SEQ ID NOS: 6085 nadotropina (hormônio libera- - 6086 dor luteinizante) GNRH2 hormônio 2 liberador de gona- SEQ ID NOS: 6087 dotropina - 6090 GNS Glucosamina (N-acetil)-6- SEQ ID NOS: 6091 sulfatase - 6096 GOLM1 proteína 1 de membrana Golgi SEQ ID NOS: 6097 - 6101
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO GORAB Golgin, interação com RAB6 SEQ ID NOS: 6102 - 6104 GOT2 transaminase 2 glutâmica- SEQ ID NOS: 6105 oxaloacética, mitocondrial - 6107 GP2 Glicoproteína 2 (membrana de SEQ ID NOS: 6108 grânulo de Zimogêneo) - 6116 GP6 Glicoproteína VI (plaqueta) SEQ ID NOS: 6117 - 6120 GPC2 Glipicana 2 SEQ ID NOS: 6121 - 6122 GPC5 Glipicana 5 SEQ ID NOS: 6123 - 6125 GPC6 Glipicana 6 SEQ ID NOS: 6126 - 6127 GPD2 Glicerol-3-fosfato desidroge- SEQ ID NOS: 6128 nase 2 (mitocondrial) - 6136 GPER1 Receptor de estrogênio 1 aco- SEQ ID NOS: 6137 plado à proteína G - 6143 GPHA2 Hormônio alfa 2 de glicoproteí- SEQ ID NOS: 6144 na - 6146 GPHB5 Hormônio de glicoproteína beta SEQ ID NOS: 6147 5 - 6148 GPIHBP1 glicosilfosfaticilinositol ancora- SEQ ID NO: 6149 do à proteína 1 de ligação à li- poproteína de alta densidade GPLD1 Fosfolipase D1 específica de SEQ ID NO: 6150 glicosilfosfatidilinositol GPNMB Glicoproteína (transmembrana) SEQ ID NOS: 6151 nmb - 6153 GPR162 Receptor 162 acoplado à prote- SEQ ID NOS: 6154 ína G - 6157 GPX3 Glutationa peroxidase 3 SEQ ID NOS: 6158 - 6165
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO GPX4 Glutationa peroxidase 4 SEQ ID NOS: 6166 - 6176 GPX5 Glutationa peroxidase 5 SEQ ID NOS: 6177 - 6178 GPX6 Glutationa peroxidase 6 SEQ ID NOS: 6179 - 6181 GPX7 Glutationa peroxidase 7 SEQ ID NO: 6182 GREM1 Gremlina 1, Antagonista BMP SEQ ID NOS: 6183 da família DAN - 6185 GREM2 GremlinA 2, Antagonista BMP SEQ ID NO: 6186 da família DAN GRHL3 Fator de transcrição 3 tipo ca- SEQ ID NOS: 6187 beça granulada - 6192 GRIA2 Receptor de glutamato, iono- SEQ ID NOS: 6193 trópico, AMPA 2 - 6204 GRIA3 Receptor de glutamato, iono- SEQ ID NOS: 6205 trópico, AMPA 3 - 6210 GRIA4 Receptor de glutamato, iono- SEQ ID NOS: 6211 trópico, AMPA 4 - 6222 GRIK2 Receptor de glutamato, iono- SEQ ID NOS: 6223 trópico, cinato 2 - 6231 GRIN2B Receptor de glutamato, iono- SEQ ID NOS: 6232 trópico, N-metil D-aspartato 2B - 6235 GRM2 Receptor de glutamato, meta- SEQ ID NOS: 6236 botrópico 2 - 6239 GRM3 Receptor de glutamato, meta- SEQ ID NOS: 6240 botrópico 3 - 6244 GRM5 Receptor de glutamato, meta- SEQ ID NOS: 6245 botrópico 5 - 6249 GRN Granulina SEQ ID NOS: 6250 - 6265 GRP peptídeo liberador de gastrina SEQ ID NOS: 6266 - 6270
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO GSG1 1 associado à célula germinati- SEQ ID NOS: 6280 va - 6288 GSN Gelsolina SEQ ID NOS: 6289 - 6297 GTDC1 1 contendo domínio de glicosil- SEQ ID NOS: 6298 transferase - 6311 GTPBP10 proteína 10 de ligação à GTP SEQ ID NOS: 6312 (putativa) - 6320 GUCA2A Ativador 2A de guanilato ci- SEQ ID NO: 6321 clase (guanilina) GUCA2B Ativador 2B de guanilato ci- SEQ ID NO: 6322 clase (uroguanilins) GUSB Glucuronidase, beta SEQ ID NOS: 6323 - 6327 GVQW1 1 contendo o motivo GVQW SEQ ID NO: 6328 GXYLT1 Glucosídeo xilosiltransferase 1 SEQ ID NOS: 6329 - 6330 GXYLT2 Glucosídeo xilosiltransferase 2 SEQ ID NOS: 6331 - 6333 GYLTL1B Glicosiltransferase - tipo 1B SEQ ID NOS: 7702 - 7707 GYPB Glicoforina B (Grupo sanguíneo SEQ ID NOS: 6334 MNS) - 6342 GZMA Granzima A (Granzima 1, seri- SEQ ID NO: 6343 na esterase 3 associada ao lin- fócito T citotóxico) GZMB Granzima B (Granzima 2, seri- SEQ ID NOS: 6344 na esterase 1 associada ao lin- - 6352 fócito T citotóxico) GZMH Granzima H (Catepsina G-tipo SEQ ID NOS: 6353 2, proteína h-CCPX) - 6355 GZMK Granzima K (Granzima 3; trip- SEQ ID NO: 6356 tase II)
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO GZMM Granzima M (linfócito met-ase SEQ ID NOS: 6357 1) - 6358 H6PD Hexose-6-fosfato desidroge- SEQ ID NOS: 6359 nase (glicose 1-desidrogenase) - 6360 HABP2 Proteína 2 de ligação ao hialu- SEQ ID NOS: 6361 ronano - 6362 HADHB Hidroxiacil-CoA desidroge- SEQ ID NOS: 6363 nase/3-cetoacil-CoA tio- - 6369 lase/enoil-CoA hidratase (pro- teína trifuncional), subunidade beta HAMP Peptídeo antimicrobiano de SEQ ID NOS: 6370 hepcidina - 6371 HAPLN1 Proteína 1 de ligação de hialu- SEQ ID NOS: 6372 ronan e proteoglicano - 6378 HAPLN2 Proteína 2 de ligação de hialu- SEQ ID NOS: 6379 ronan e proteoglicano - 6380 HAPLN3 Proteína 3 de ligação de hialu- SEQ ID NOS: 6381 ronan e proteoglicano - 6384 HAPLN4 Proteína 4 de ligação de hialu- SEQ ID NO: 6385 ronan e proteoglicano HARS2 Histidil-tRNA Sintetase 2, mito- SEQ ID NOS: 6386 condrial - 6401 HAVCR1 Receptor 1 celular do vírus da SEQ ID NOS: 6402 hepatite A - 6406 HCCS HoloCitocromo c sintase SEQ ID NOS: 6407 - 6409 HCRT Precursor de neuropeptídeo de SEQ ID NO: 6410 hipocretina (orexina) HEATR5A 5A contendo repetição de HE- SEQ ID NOS: 6414 AT - 6420 HEPH Hefaestina SEQ ID NOS: 6421 - 6428
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO HEXA Hexosaminidase A (alfa poli- SEQ ID NOS: 6429 peptídeo) - 6438 HEXB Hexosaminidase B (beta poli- SEQ ID NOS: 6439 peptídeo) - 6444 HFE2 Hemocromatose tipo 2 (juvenil) SEQ ID NOS: 6445 - 6451 HGF Fator de crescimento de hepa- SEQ ID NOS: 6452 tócito (hepapoietina A; fator de - 6462 dispersão) HGFAC Ativador de HGF SEQ ID NOS: 6463 - 6464 HHIP Fator de interação de ouriço SEQ ID NOS: 6465 - 6466 HHIPL1 HHIP - tipo 1 SEQ ID NOS: 6467 - 6468 HHIPL2 HHIP - tipo 2 SEQ ID NO: 6469 HHLA1 1 de associação a LTR de SEQ ID NOS: 6470 HERV-H - 6471 HHLA2 2 de associação de LTR de SEQ ID NOS: 6472 HERV-H - 6482 HIBADH 3-hidroxiisobutirato desidroge- SEQ ID NOS: 6483 nase - 6485 HINT2 Proteína 2 de ligação ao nucle- SEQ ID NO: 6486 otídeo de tríade de histidina HLA-A Complexo de histocompatibili- SEQ ID NOS: 6487 dade maior, classe I, A - 6491 HLA-C Complexo de histocompatibili- SEQ ID NOS: 6492 dade maior, classe I, C - 6496 HLA-DOA Complexo de histocompatibili- SEQ ID NOS: 6497 dade maior, classe II, DO alfa - 6498 HLA-DPA1 Complexo de histocompatibili- SEQ ID NOS: 6499 dade maior, classe II, DP alfa 1 - 6502
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO HLA-DQA1 Complexo de histocompatibili- SEQ ID NOS: 6503 dade maior, classe II, DQ alfa 1 - 6508 HLA-DQB1 Complexo de histocompatibili- SEQ ID NOS: 6509 dade maior, classe II, DQ beta - 6514 1 HLA-DQB2 Complexo de histocompatibili- SEQ ID NOS: 6515 dade maior, classe II, DQ beta - 6518 2 HMCN1 Hemicentina 1 SEQ ID NOS: 6519 - 6520 HMCN2 Hemicentina 2 SEQ ID NOS: 6521 - 6524 HMGCL 3-hidroximetil-3-metilglutaril- SEQ ID NOS: 6525 CoA liase - 6528 HMHA1 Histocompatibilidade (menor) SEQ ID NOS: 1034 HA-1 - 1042 HMSD contendo domínio de serpina SEQ ID NOS: 6529 de histocompatibilidade (me- - 6530 nor) HP Haptoglobina SEQ ID NOS: 6531 - 6544 HPR Proteína relacionada com a SEQ ID NOS: 6545 haptoglobina - 6547 HPSE Heparano ase SEQ ID NOS: 6548 - 6554 HPSE2 Heparano ase 2 (inativa) SEQ ID NOS: 6555 - 6560 HPX Hemopexin SEQ ID NOS: 6561 - 6562 HRC proteína de ligação ao cálcio ri- SEQ ID NOS: 6563 co em histidina - 6565 HRG Glicoproteína rica em histidina SEQ ID NO: 6566
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO HRSP12 Proteína 12 responsiva ao ca- SEQ ID NOS: 11389 lor - 11392 HS2ST1 Heparano o sulfato 2-O- SEQ ID NOS: 6567 sulfotransferase 1 - 6569 HS3ST1 Heparano sulfato (glucosami- SEQ ID NOS: 6570 na) 3-O-sulfotransferase 1 - 6572 HS6ST1 Heparano sulfato 6-O- SEQ ID NO: 6573 sulfotransferase 1 HS6ST3 Heparano sulfato 6-O- SEQ ID NOS: 6574 sulfotransferase 3 - 6575 HSD11B1L tipo hidroxisteroide (11-beta) SEQ ID NOS: 6576 desidrogenase 1 - 6594 HSD17B11 Hidroxisteroide (17-beta) desi- SEQ ID NOS: 6595 drogenase 11 - 6596 HSD17B7 Hidroxisteroide (17-beta) desi- SEQ ID NOS: 6597 drogenase 7 - 6601 HSP90B1 Proteína de choque térmico SEQ ID NOS: 6602 90kDa beta (Grp94), membro 1 - 6607 HSPA13 família 70 kDA de proteína de SEQ ID NO: 6608 choque térmico, membro 13 HSPA5 Proteína 5, 70kDa de choque SEQ ID NO: 6609 térmico (proteína regulada por glicose, 78kDa) HSPG2 proteoglicano 2 de sulfato de SEQ ID NOS: 6610 heparano - 6614 HTATIP2 proteína 2 interativo Tat de SEQ ID NOS: 6615 HIV-1 Tat, 30kDa - 6622 HTN1 Histatina 1 SEQ ID NOS: 6623 - 6625 HTN3 Histatina 3 SEQ ID NOS: 6626 - 6628 HTRA1 HtrA serina peptidase 1 SEQ ID NOS: 6629 - 6630
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO HTRA3 HtrA serina peptidase 3 SEQ ID NOS: 6631 - 6632 HTRA4 HtrA serina peptidase 4 SEQ ID NO: 6633 HYAL1 Hialuronoglucosaminidase 1 SEQ ID NOS: 6634 - 6642 HYAL2 Hialuronoglucosaminidase 2 SEQ ID NOS: 6643 - 6651 HYAL3 Hialuronoglucosaminidase 3 SEQ ID NOS: 6652 - 6658 HYOU1 1 super-regulado por hipoxia SEQ ID NOS: 6659 - 6673 IAPP Polipeptídeo amiloide das Ilho- SEQ ID NOS: 6674 tas - 6678 IBSP Sialoproteína de ligação à inte- SEQ ID NO: 6679 grina ICAM1 Molécula 1 de adesão inercelu- SEQ ID NOS: 6680 lar - 6682 ICAM2 Molécula 2 de adesão interce- SEQ ID NOS: 6683 lular - 6693 ICAM4 Molécula 4 de adesão interce- SEQ ID NOS: 6694 lular (grupo sanguíneo Lands- - 6696 teiner-Wiener) ID1 Inibidor de 1 de ligação ao SEQ ID NOS: 6697 DNA, proteína de hélice-alça- - 6698 hélice negativa dominante IDE Enzima de degradação da in- SEQ ID NOS: 6699 sulina - 6702 IDNK IdnK, Homólogo de gluconoci- SEQ ID NOS: 6703 nase (E. coli) - 6708 IDS Iduronateo 2-sulfatase SEQ ID NOS: 6709 - 6714 IDUA Iduronidase, alfa-L- SEQ ID NOS: 6715 - 6720
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO IFI27L2 Interferon, 2 tipo proteína 27 al- SEQ ID NOS: 6721 fa-induzível - 6722 IFI30 Interferon, proteína 30 gama- SEQ ID NOS: 6723 induzível - 6724 IFNA1 Interferon, alfa 1 SEQ ID NO: 6725 IFNA10 Interferon, alfa 10 SEQ ID NO: 6726 IFNA13 Interferon, alfa 13 SEQ ID NOS: 6727 - 6728 IFNA14 Interferon, alfa 14 SEQ ID NO: 6729 IFNA16 Interferon, alfa 16 SEQ ID NO: 6730 IFNA17 Interferon, alfa 17 SEQ ID NO: 6731 IFNA2 Interferon, alfa 2 SEQ ID NO: 6732 IFNA21 Interferon, alfa 21 SEQ ID NO: 6733 IFNA4 Interferon, alfa 4 SEQ ID NO: 6734 IFNA5 Interferon, alfa 5 SEQ ID NO: 6735 IFNA6 Interferon, alfa 6 SEQ ID NOS: 6736 - 6737 IFNA7 Interferon, alfa 7 SEQ ID NO: 6738 IFNA8 Interferon, alfa 8 SEQ ID NO: 6739 IFNAR1 Interferon (alfa, beta e ômega) SEQ ID NOS: 6740 receptor 1 - 6741 IFNB1 Interferon, beta 1, fibroblasto SEQ ID NO: 6742 IFNE Interferon, épsilon SEQ ID NO: 6743 IFNG Interferon, gama SEQ ID NO: 6744 IFNGR1 Interferon gama receptor 1 SEQ ID NOS: 6745 - 6755 IFNL1 Interferon, lambda 1 SEQ ID NO: 6756 IFNL2 Interferon, lambda 2 SEQ ID NO: 6757 IFNL3 Interferon, lambda 3 SEQ ID NOS: 6758 - 6759 IFNLR1 Interferon, lambda receptor 1 SEQ ID NOS: 6760 - 6764
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO IFNW1 Interferon, ômega 1 SEQ ID NO: 6765 IGF1 Fator 1 de crescimento tipo in- SEQ ID NOS: 6766 sulina (somatomedina C) - 6771 IGF2 Fator 2 de crescimento tipo in- SEQ ID NOS: 6772 sulina - 6779 IGFALS Proteína de ligação ao fator de SEQ ID NOS: 6780 crescimento tipo insulina, su- - 6782 bunidade lábil ao ácido.
IGFBP1 Proteína 1 de ligação ao fator SEQ ID NOS: 6783 de crescimento tipo insulina 1 - 6785 IGFBP2 Proteína 2 de ligação ao fator SEQ ID NOS: 6786 de crescimento tipo insulina, - 6789 36kDa IGFBP3 Proteína 3 de ligação ao fator SEQ ID NOS: 6790 de crescimento tipo insulina - 6797 IGFBP4 Proteína 4 de ligação ao fator SEQ ID NO: 6798 de crescimento tipo insulina IGFBP5 Proteína 5 de ligação ao fator SEQ ID NOS: 6799 de crescimento tipo insulina - 6800 IGFBP6 Proteína 6 de ligação ao fator SEQ ID NOS: 6801 de crescimento tipo insulina - 6803 IGFBP7 Proteína 7 de ligação ao fator SEQ ID NOS: 6804 de crescimento tipo insulina - 6805 IGFBPL1 Proteína de ligação ao fator de SEQ ID NO: 6806 crescimento tipo insulina - tipo 1 IGFL1 Membro 1 da família tipo IGF SEQ ID NO: 6807 IGFL2 Membro 2 da família tipo IGF SEQ ID NOS: 6808 - 6810 IGFL3 Membro 3 da família tipo IGF SEQ ID NO: 6811 IGFLR1 Receptor 1 da família tipo IGF SEQ ID NOS: 6812 - 6820 IGIP Proteína de indução de IgA SEQ ID NO: 6821
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO IGLON5 Membro 5 da família IgLON SEQ ID NO: 6822 IGSF1 Superfamília da imunoglobina, SEQ ID NOS: 6823 membro 1 - 6828 IGSF10 Superfamília de imunoglobuli- SEQ ID NOS: 6829 na, membro 10 - 6830 IGSF11 Superfamília de imunoglobuli- SEQ ID NOS: 6831 na, membro 11 - 6838 IGSF21 Superfamília de imunoglobina, SEQ ID NO: 6839 membro 21 IGSF8 Superfamília de imunoglobuli- SEQ ID NOS: 6840 na, membro 8 - 6843 IGSF9 Superfamília de imunoglobuli- SEQ ID NOS: 6844 na, membro 9 - 6846 IHH Ouriço indiano SEQ ID NO: 6847 IL10 Interleucina 10 SEQ ID NOS: 6848 - 6849 IL11 Interleucina 11 SEQ ID NOS: 6850 - 6853 IL11RA Interleucina 11 receptor, alfa SEQ ID NOS: 6854 - 6864 IL12B Interleucina 12B SEQ ID NO: 6865 IL12RB1 Receptor de interleucina 12, SEQ ID NOS: 6866 beta 1 - 6871 IL12RB2 Receptor de interleucina 12, SEQ ID NOS: 6872 beta 2 - 6876 IL13 Interleucina 13 SEQ ID NOS: 6877 - 6878 IL13RA1 Receptor de interleucina 13, al- SEQ ID NOS: 6879 fa 1 - 6880 IL15RA Receptor de Interleucina 15, al- SEQ ID NOS: 6881 fa - 6898 IL17A Interleucina 17A SEQ ID NO: 6899 IL17B Interleucina 17B SEQ ID NO: 6900
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO IL17C Interleucina 17C SEQ ID NO: 6901 IL17D Interleucina 17D SEQ ID NOS: 6902 - 6904 IL17F Interleucina 17F SEQ ID NO: 6905 IL17RA Interleucina 17 receptor A SEQ ID NOS: 6906 - 6907 IL17RC Interleucina 17 receptor C SEQ ID NOS: 6908 - 6923 IL17RE Interleucina 17 receptor E SEQ ID NOS: 6924 - 6930 IL18BP Proteína de ligação à interleu- SEQ ID NOS: 6931 cina 18 - 6941 IL18R1 Receptor 1 de interleucina 18 SEQ ID NOS: 6942 - 6945 IL18RAP Proteína acessória do receptor SEQ ID NOS: 6946 de interleucina 18 - 6948 IL19 Interleucina 19 SEQ ID NOS: 6949 - 6951 IL1R1 receptor de interleucina 1, tipo I SEQ ID NOS: 6952 - 6964 IL1R2 Interleucina 1 receptor, tipo II SEQ ID NOS: 6965 - 6968 IL1RAP Proteína acessória de receptor SEQ ID NOS: 6969 de interleucina 1 - 6982 IL1RL1 Receptor de interleucina 1 - ti- SEQ ID NOS: 6983 po 1 - 6988 IL1RL2 Receptor de interleucina 1 - ti- SEQ ID NOS: 6989 po 2 - 6991 IL1RN antagonista de receptor de in- SEQ ID NOS: 6992 terleucina 1 - 6996 IL2 Interleucina 2 SEQ ID NO: 6997 IL20 Interleucina 20 SEQ ID NOS: 6998 - 7000
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO IL20RA Receptor de interleucina 20, al- SEQ ID NOS: 7001 fa - 7007 IL21 Interleucina 21 SEQ ID NOS: 7008 - 7009 IL22 Interleucina 22 SEQ ID NOS: 7010 - 7011 IL22RA2 Receptor de interleucina 22, al- SEQ ID NOS: 7012 fa 2 – 7014 IL23A Interleucina 23, alfa subunida- SEQ ID NO: 7015 de p19 IL24 Interleucina 24 SEQ ID NOS: 7016 - 7021 IL25 Interleucina 25 SEQ ID NOS: 7022 - 7023 IL26 Interleucina 26 SEQ ID NO: 7024 IL27 Interleucina 27 SEQ ID NOS: 7025 - 7026 IL2RB Receptor de interleucina 2, be- SEQ ID NOS: 7027 ta - 7031 IL3 Interleucina 3 SEQ ID NO: 7032 IL31 Interleucina 31 SEQ ID NO: 7033 IL31RA Receptor A de interleucina 31 SEQ ID NOS: 7034 - 7041 IL32 Interleucina 32 SEQ ID NOS: 7042 - 7071 IL34 Interleucina 34 SEQ ID NOS: 7072 - 7075 IL3RA Receptor de interleucina 3, alfa SEQ ID NOS: 7076 (baixa afinidade) - 7078 IL4 Interleucina 4 SEQ ID NOS: 7079 - 7081 IL4I1 1 induzido por interleucina 4 SEQ ID NOS: 7082 - 7089
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO IL4R Receptor de interleucina 4 SEQ ID NOS: 7090 - 7103 IL5 Interleucina 5 SEQ ID NOS: 7104 - 7105 IL5RA receptor de interleucina 5, alfa SEQ ID NOS: 7106 - 7115 IL6 Interleucina 6 SEQ ID NOS: 7116 - 7122 IL6R Receptor de interleucina 6 SEQ ID NOS: 7123 - 7128 IL6ST transdutor de sinal de interleu- SEQ ID NOS: 7129 cina 6 - 7138 IL7 Interleucina 7 SEQ ID NOS: 7139 - 7146 IL7R Receptor de Interleucina 7 SEQ ID NOS: 7147 - 7153 IL9 Interleucina 9 SEQ ID NO: 7154 ILDR1 receptor 1 contendo domínio ti- SEQ ID NOS: 7155 po imunoglobulina - 7159 ILDR2 Receptor 2 contendo o domínio SEQ ID NOS: 7160 tipo imunoglobulina - 7166 IMP4 IMP4, ribonúcleoproteína nú- SEQ ID NOS: 7167 cleolar pequena U3 - 7172 IMPG1 proteoglicano 1 de matriz de in- SEQ ID NOS: 7173 terfotorreceptor - 7176 INHA Inibina, alfa SEQ ID NO: 7177 INHBA Inibina, beta A SEQ ID NOS: 7178 - 7180 INHBB Inibina, beta B SEQ ID NO: 7181 INHBC Inibina, beta C SEQ ID NO: 7182 INHBE Inibina, beta E SEQ ID NOS: 7183 - 7184
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO INPP5A Inositol polifosfato-5-fosfatase SEQ ID NOS: 7185 A - 7189 INS Insulina SEQ ID NOS: 7190 - 7194 INS-IGF2 Leitura de INS-IGF2 SEQ ID NOS: 7195 - 7196 INSL3 3 tipo insulina (célula Leydig) SEQ ID NOS: 7197 - 7199 INSL4 4 tipo insulina (placenta) SEQ ID NO: 7200 INSL5 5 tipo insulina SEQ ID NO: 7201 INSL6 6 tipo insulin SEQ ID NO: 7202 INTS3 subunidade 3 de complexo in- SEQ ID NOS: 7203 tegrador - 7208 IPO11 Importina 11 SEQ ID NOS: 7209 - 7217 IPO9 Importina 9 SEQ ID NOS: 7218 - 7219 IQCF6 F6 contendo o motivo IQ SEQ ID NOS: 7220 - 7221 IRAK3 Cinase 3 associada ao receptor SEQ ID NOS: 7222 de interleucina 1 - 7224 IRS4 Substrato 4 de receptor de in- SEQ ID NO: 7225 sulina ISLR Superfamília de imunoglobulina SEQ ID NOS: 7226 contendo repetição de leucina - 7229 ISLR2 Superfamília de imunoglobulina SEQ ID NOS: 7230 contendo repetição 2 rica em - 7239 leucina ISM1 Isthmin 1, inibidor de angiogê- SEQ ID NO: 7240 nese ISM2 Isthmin 2 SEQ ID NOS: 7241 - 7246
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO ITGA4 Integrina, alfa 4 (antígeno SEQ ID NOS: 7247 CD49D, subunidade alfa 4 de - 7249 receptor VLA-4) ITGA9 Integrina, alfa 9 SEQ ID NOS: 7250 - 7252 ITGAL Integrina, alfa L (antígeno SEQ ID NOS: 7253 CD11A (p180), antígeno 1 as- - 7262 sociado à função de linfócito; polipeptídeo alfa) ITGAX Integrina, alfa X (subunidade SEQ ID NOS: 7263 de receptor 4 de complement - 7265 de componente) ITGB1 Integrina, beta 1 (receptor de SEQ ID NOS: 7266 fibronectina, polipeptídeo beta, - 7281 antígeno CD29 inclui MDF2, MSK12) ITGB2 Integrina, beta 2 (subunidade SEQ ID NOS: 7282 de receptor 3 e 4 de compo- - 7298 nente complemento 3) ITGB3 Integrina, beta 3 (glicoproteína SEQ ID NOS: 7299 de plaqueta IIIa, antígeno - 7301 CD61) ITGB7 Integrina, beta 7 SEQ ID NOS: 7302 - 7309 ITGBL1 Integrina, beta - tipo 1 (com SEQ ID NOS: 7310 domínios de repetição tipo - 7315 EGF) ITIH1 1 de cadeia pesada de inibidor SEQ ID NOS: 7316 de inter-alfa-tripsina - 7321 ITIH2 2 de cadeia pesada de inibidor SEQ ID NOS: 7322 de inter-alfa-tripsina - 7324 ITIH3 3 de cadeia pesada de inibidor SEQ ID NOS: 7325 inter-alfa-tripsina - 7327
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO ITIH4 Família de cadeia pesada de SEQ ID NOS: 7328 inibidor de inter-alfa-tripsina, - 7331 membro 4 ITIH5 Família de cadeia pesada de SEQ ID NOS: 7332 inibidor de inter-alfa-tripsina, - 7335 membro 5 ITIH6 Família de cadeia pesada de SEQ ID NO: 7336 inibidor de inter-alfa-tripsina, membro 6 ITLN1 Intelectina 1 (ligação à galacto- SEQ ID NO: 7337 furanose) ITLN2 Intelectina 2 SEQ ID NO: 7338 IZUMO1R Receptor de IZUMO1, JUNO SEQ ID NOS: 7339 - 7340 IZUMO4 Membro 4 da família IZUMO SEQ ID NOS: 7341 - 7347 JCHAIN Cadeia de união de IgA e IgM SEQ ID NOS: 7357 multiméricas - 7362 JMJD8 domínio Jumonji contendo 8 SEQ ID NOS: 7363 - 7367 JSRP1 proteína 1 de retíulo sarco- SEQ ID NO: 7368 plásmico juncional KANSL2 subunidade 2 do complexo SEQ ID NOS: 7369 NSL regulador KAT8 - 7379 KAZALD1 domínio 1 do inibidor de serina SEQ ID NO: 7380 peptidase tipo Kazal KCNIP3 proteína 3 de interação de ca- SEQ ID NOS: 7381 nal Kv, calsenilina - 7383 KCNK7 Canal de potássio, subfamília SEQ ID NOS: 7384 K de domínio de dois poros, - 7389 membro 7
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO KCNN4 Canal de potássio, subfamília SEQ ID NOS: 7390 N alfa de intermediário ativado - 7395 por cálcio/pequena condutân- cia, membro 4 KCNU1 Canal de potássio, subfamília SEQ ID NOS: 7396 U, membro 1 - 7400 KCP Proteína do tipo Kielin/chordin SEQ ID NOS: 7401 - 7404 KDELC1 KDEL (Lys-Asp-Glu-Leu) con- SEQ ID NO: 7405 tendo 1 KDELC2 KDEL (Lys-Asp-Glu-Leu) con- SEQ ID NOS: 7406 tendo 2 - 7409 KDM1A Desmetilase 1A específica de SEQ ID NOS: 7410 lisina (K) - 7413 KDM3B desmetilase 3B específica de SEQ ID NOS: 7414 lisina (K) - 7417 KDM6A Desmetilase 6A específica de SEQ ID NOS: 7418 lisina (K) - 7427 KDM7A Desmetilase 7A específica de SEQ ID NOS: 7428 lisina (K) - 7429 KDSR 3-cetodi-hidroesfingosina redu- SEQ ID NOS: 7430 tase - 7436 KERA Ceratocan SEQ ID NO: 7437 KIAA0100 KIAA0100 SEQ ID NOS: 7438 - 7443 KIAA0319 KIAA0319 SEQ ID NOS: 7444 - 7449 KIAA1324 KIAA1324 SEQ ID NOS: 7450 - 7458 KIFC2 membro C2 da família de Cine- SEQ ID NOS: 7459 sina - 7461
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO KIR2DL4 Receptor tipo imunoglobulina SEQ ID NOS: 7462 de célula exterminadora, dois - 7468 domínios, cauda citoplásmica longa, 4 KIR3DX1 Receptor tipo imunoglobulina SEQ ID NOS: 7469 de célula exterminadora, três - 7473 domínios, X1 KIRREL2 Kin de IRRE tipo 2 (Drosophila) SEQ ID NOS: 7474 - 7478 KISS1 supressor de metástase KiSS-1 SEQ ID NOS: 7479 - 7480 KLHL11 membro 11 da família tipo SEQ ID NO: 7481 Kelch KLHL22 membro 22 da família tipo SEQ ID NOS: 7482 Kelch - 7488 KLK1 Calicreína 1 SEQ ID NOS: 7489 - 7490 KLK10 Peptidase relacionada com a SEQ ID NOS: 7491 Calicreína 10 - 7495 KLK11 Peptidase relacionada com a SEQ ID NOS: 7496 Calicreína 11 - 7504 KLK12 Peptidase relacionada com a SEQ ID NOS: 7505 Calicreína 12 - 7511 KLK13 Peptidase relacionada com a SEQ ID NOS: 7512 Calicreína 13 - 7520 KLK14 Peptidase relacionada com a SEQ ID NOS: 7521 Calicreína 14 - 7522 KLK15 Peptidase relacionada com a SEQ ID NOS: 7523 Calicreína 15 - 7527 KLK2 Peptidase relacionada com a SEQ ID NOS: 7528 Calicreína 2 - 7540 KLK3 Peptidase relacionada com a SEQ ID NOS: 7541 Calicreína 3 - 7552
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO KLK4 Peptidase relacionada com a SEQ ID NOS: 7553 Calicreína 4 - 7557 KLK5 Peptidase relacionada com a SEQ ID NOS: 7558 Calicreína 5 - 7561 KLK6 Peptidase relacionada com a SEQ ID NOS: 7562 Calicreína 6 - 7568 KLK7 Peptidase relacionada com a SEQ ID NOS: 7569 Calicreína 7 - 7573 KLK8 Peptidase relacionada com a SEQ ID NOS: 7574 Calicreína 8 - 7581 KLK9 Peptidase relacionada com a SEQ ID NOS: 7582 Calicreína 9 - 7583 KLKB1 Calicreína B, plasma (fator Fle- SEQ ID NOS: 7584 tcher fator) 1 - 7588 KNDC1 1 contendo domínio de lobo C SEQ ID NOS: 7593 não catalítico de cinase (KIND) - 7594 KNG1 Cininogênio 1 SEQ ID NOS: 7595 - 7599 KRBA2 2 contendo domínio KRAB-A SEQ ID NOS: 7600 - 7603 KREMEN2 Proteína de transmembrana 2 SEQ ID NOS: 7604 contendo Kringle - 7609 KRTDAP Proteína associada à diferenci- SEQ ID NOS: 7610 ação de ceratinócito - 7611 L1CAM Molécula de adesão celular L1 SEQ ID NOS: 7612 - 7621 L3MBTL2 L(3)mbt-tipo 2 (Drosophila) SEQ ID NOS: 7622 - 7626 LA16c- SEQ ID NO: 72 380H5.3 LACE1 1 elevado de lactação SEQ ID NOS: 580 - 583
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO LACRT Lacritina SEQ ID NOS: 7627 - 7629 LACTB Lactamase, beta SEQ ID NOS: 7630 - 7632 LAG3 Gene 3 de ativação de linfócito SEQ ID NOS: 7633 - 7634 LAIR2 Receptor 2 tipo imunoglobulina SEQ ID NOS: 7635 associado a leucócito - 7638 LALBA Lactalbumina, alfa- SEQ ID NOS: 7639 - 7640 LAMA1 Laminina, alfa 1 SEQ ID NOS: 7641 - 7642 LAMA2 Laminina, alfa 2 SEQ ID NOS: 7643 - 7646 LAMA3 Laminina, alfa 3 SEQ ID NOS: 7647 - 7656 LAMA4 Laminina, alfa 4 SEQ ID NOS: 7657 - 7671 LAMA5 Laminina, alfa 5 SEQ ID NOS: 7672 - 7674 LAMB1 Laminina, beta 1 SEQ ID NOS: 7675 - 7679 LAMB2 Laminina, beta 2 (laminina S) SEQ ID NOS: 7680 - 7682 LAMB3 Laminina, beta 3 SEQ ID NOS: 7683 - 7687 LAMB4 Laminina, beta 4 SEQ ID NOS: 7688 - 7691 LAMC1 Laminina, gama 1 (a princípio SEQ ID NOS: 7692 LAMB2) - 7693 LAMC2 Laminina, gama 2 SEQ ID NOS: 7694 - 7695
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO LAMC3 Laminina, gama 3 SEQ ID NOS: 7696 - 7697 LAMP3 Proteína 3 de membrana asso- SEQ ID NOS: 7698 ciada à lisossômica - 7701 LAT Ligante para ativação de célu- SEQ ID NOS: 7708 las T - 7717 LAT2 Família de Ligante para ativa- SEQ ID NOS: 7718 ção de células T, membro 2 - 7726 LBP Proteína de ligação a lipopolis- SEQ ID NO: 7727 sacarídeo LCAT Lecitina-colesterol aciltransfe- SEQ ID NOS: 7728 rase - 7734 LCN1 Lipocalina 1 SEQ ID NOS: 7735 - 7736 LCN10 Lipocalina 10 SEQ ID NOS: 7737 - 7742 LCN12 Lipocalina 12 SEQ ID NOS: 7743 - 7745 LCN15 Lipocalina 15 SEQ ID NO: 7746 LCN2 Lipocalina 2 SEQ ID NOS: 7747 - 7749 LCN6 Lipocalina 6 SEQ ID NOS: 7750 - 7751 LCN8 Lipocalina 8 SEQ ID NOS: 7752 - 7753 LCN9 Lipocalina 9 SEQ ID NOS: 7754 - 7755 LCORL receptor nuclear dependente SEQ ID NOS: 7756 liganteReceptor nuclear de- - 7761 pendente ligante tipo corre- pressor LDLR Receptor de lipoproteína de SEQ ID NOS: 7762 baixa densidade - 7770
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO LDLRAD2 domínio de classe A de recep- SEQ ID NOS: 7771 tor de lipoproteína de baixa - 7772 densidade contendo 2 LEAP2 Peptídeo 2 antimicrobiano ex- SEQ ID NO: 7773 presso no fígado LECT2 Quimiotaxina 2 derivada de cé- SEQ ID NOS: 7774 lula de leucócito – 7777 LEFTY1 Fator 1 de determinação es- SEQ ID NOS: 7778 querda-direita – 7779 LEFTY2 Fator 2 de determinação es- SEQ ID NOS: 7780 querda-direita – 7781 LEP Leptina SEQ ID NO: 7782 LFNG LFNG O-fucosilpeptídeo 3- SEQ ID NOS: 7783 beta-N- - 7788 acetilglucosaminiltransferase LGALS3BP Lectina, ligação à galactosídeo, SEQ ID NOS: 7789 solúvel, proteína de ligação a 3 - 7803 LGI1 1 inativado por glioma, rico em SEQ ID NOS: 7804 leucina - 7822 LGI2 Família LGI de repetição rica SEQ ID NOS: 7823 em leucina, membro 2 - 7824 LGI3 Família LGI de repetição rica SEQ ID NOS: 7825 em leucina, membro 3 - 7828 LGI4 Família LGI de repetição rica SEQ ID NOS: 7829 em leucina, membro 4 - 7832 LGMN Legumaína SEQ ID NOS: 7833 - 7846 LGR4 Receptor 4 acoplato à proteína SEQ ID NOS: 7847 G rico em leucina - 7849 LHB Hormônio luitenizante beta po- SEQ ID NO: 7850 lipeptídeo LHCGR Hormônio luitenizante/receptor SEQ ID NOS: 7851 de coriogonadotropina - 7855
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO LIF Fator inibitório de leucemia SEQ ID NOS: 7856 - 7857 LIFR Receptor de fator inibitório de SEQ ID NOS: 7858 leucemia alfa - 7862 LILRA1 Receptor tipo imunoglobulina SEQ ID NOS: 7863 de leucócito, subfamília A (com - 7864 domínio TM), membro 1 LILRA2 Receptor tipo imunoglobulina SEQ ID NOS: 7865 de leucócito, subfamília A (com - 7871 domínio TM), membro 2 LILRB3 Receptor tipo imunoglobulina SEQ ID NOS: 7872 de leucócito, subfamília B (com - 7876 domíniosTM e ITIM), membro 3 LIME1 adaptor 1 de transmembrana SEQ ID NOS: 7877 de interação com Lck - 7882 LINGO1 1 contendo repetição rica em SEQ ID NOS: 7883 leucina e domínio Ig - 7893 LIPA Lipase A, ácido lisossômico, SEQ ID NOS: 7894 colesterol esterase - 7898 LIPC Lipase, hepática SEQ ID NOS: 7899 - 7902 LIPF Lipase, gástrica SEQ ID NOS: 7903 - 7906 LIPG Lipase, endotelial SEQ ID NOS: 7907 - 7912 LIPH Lipase, membro H SEQ ID NOS: 7913 - 7917 LIPK Lipase, família membro K SEQ ID NO: 7918 LIPM Lipase, família membro M SEQ ID NOS: 7919 - 7920 LIPN Lipase, família membro N SEQ ID NO: 7921 LMAN2 Lectina, 2 de ligação à manose SEQ ID NOS: 7922 2 - 7926
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO LMNTD1 1 contendo domínio de caula SEQ ID NOS: 7927 de lamina - 7937 LNX1 Ligante de proteína-dormente SEQ ID NOS: 7938 X1, E3 ubiquitina proteína liga- - 7944 se LOX Lisil oxidase SEQ ID NOS: 7945 - 7947 LOXL1 Lisil oxidase - tipo 1 SEQ ID NOS: 7948 - 7949 LOXL2 Lisil oxidase-tipo 2 SEQ ID NOS: 7950 - 7958 LOXL3 Lisil oxidase-tipo 3 SEQ ID NOS: 7959 - 7965 LOXL4 Lisil oxidase-tipo 4 SEQ ID NO: 7966 LPA Lipoproteína, Lp(a) SEQ ID NOS: 7967 - 7969 LPL Lipoproteína lipase SEQ ID NOS: 7970 - 7974 LPO Lactoperoxidase SEQ ID NOS: 7975 - 7981 LRAT Lecithin retinol aciltransferase SEQ ID NOS: 7982 (fosfatidilcolina--retinol O- - 7984 aciltransferase) LRCH3 3 contendo repetições ricas em SEQ ID NOS: 7985 leucina e domínio de homolo- - 7993 gia de calponina (CH) LRCOL1 Colipase rica em leucina - tipo SEQ ID NOS: 7994 1 - 7997 LRFN4 domínio tipo III de repetição ri- SEQ ID NOS: 7998 ca em leucina e fibronectina ti- - 7999 po III contendo 4
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO LRFN5 o domínio tipo III de repetição SEQ ID NOS: 8000 rica em leucina e fibronectina - 8002 contendo 5 LRG1 Afa-2-glicoproteína 1 rica em SEQ ID NO: 8003 leucina LRP1 Proteína 1 relacionada ao re- SEQ ID NOS: 8004 ceptor de lipoproteína de baixa - 8009 densidade LRP11 Proteína 11 relacionada ao re- SEQ ID NOS: 8010 ceptor de lipoproteína de baixa - 8011 densidade LRP1B Proteína 1B relacionada ao re- SEQ ID NOS: 8012 ceptor de lipoproteína de baixa - 8015 densidade LRP2 Proteína 2 relacionada ao re- SEQ ID NOS: 8016 ceptor de lipoproteína de baixa - 8017 densidade LRP4 Proteína 4 relacionada ao re- SEQ ID NOS: 8018 ceptor de lipoproteína de baixa - 8019 densidade LRPAP1 Proteína relacionada ao recep- SEQ ID NOS: 8020 tor de lipoproteína de baixa - 8021 densidade associated proteína 1 LRRC17 repetição rica em leucina con- SEQ ID NOS: 8022 tendo 17 – 8024 LRRC32 repetição rica em leucina con- SEQ ID NOS: 8025 tendo 32 – 8028 LRRC3B repetição rica em leucina con- SEQ ID NOS: 8029 tendo 3B - 8033 LRRC4B repetição rica em leucina con- SEQ ID NOS: 8034 tendo 4B - 8036 LRRC70 repetição rica em leucina c SEQ ID NOS: 8037 contendo 70 - 8038
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO LRRN3 Repetição rica em leucina neu- SEQ ID NOS: 8039 ronal 3 - 8042 LRRTM1 Repetição rica em leucina SEQ ID NOS: 8043 transmembrana neuronal 1 - 8049 LRRTM2 Repetição rica em leucina SEQ ID NOS: 8050 transmembrana neuronal 2 - 8052 LRRTM4 Repetição rica em leucina SEQ ID NOS: 8053 transmembrana neuronal 4 - 8058 LRTM2 Repetições ricas em leucina e SEQ ID NOS: 8059 domínio de transmembranas 2 - 8063 LSR Receptor de lipoproteína esti- SEQ ID NOS: 8064 mulada por lipólise - 8074 LST1 Transcrição 1 específica de SEQ ID NOS: 8075 leucócito - 8092 LTA Linfotoxina alfa SEQ ID NOS: 8093 - 8094 LTBP1 Proteína 1 de ligação de fator SEQ ID NOS: 8095 de crescimento transformante - 8104 beta latente LTBP2 Proteína 2 de ligação de fator SEQ ID NOS: 8105 de crescimento transformante - 8108 beta latente LTBP3 Proteína 3 de ligação de fator SEQ ID NOS: 8109 de crescimento transformante - 8121 beta latente LTBP4 Proteína 4 de ligação de fator SEQ ID NOS: 8122 de crescimento transformante - 8137 beta latente LTBR Linfotoxina beta receptor SEQ ID NOS: 8138 (TNFR Superfamília, membro - 8143 3) LTF Lactotransferrina SEQ ID NOS: 8144 - 8148
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO LTK tirosina cinase receptora de SEQ ID NOS: 8149 leucócito - 8152 LUM Lumican SEQ ID NO: 8153 LUZP2 Proteína zipper de leucina SEQ ID NOS: 8154 - 8157 LVRN Laeverina SEQ ID NOS: 8158 - 8163 LY6E Complexo de antígeno de linfó- SEQ ID NOS: 8164 cito 6 , locus E - 8177 LY6G5B Complexo de antígeno de linfó- SEQ ID NOS: 8178 cito 6 , locus G5B - 8179 LY6G6D Complexo de antígeno de linfó- SEQ ID NOS: 8180 cito 6 , locus G6D - 8181 LY6G6E Complexo de antígeno de linfó- SEQ ID NOS: 8182 cito 6 , locus G6E (pseudoge- - 8185 ne) LY6H Complexo de antígeno de linfó- SEQ ID NOS: 8186 cito 6 , locus H - 8189 LY6K Complexo de antígeno de linfó- SEQ ID NOS: 8190 cito 6 , locus K - 8193 LY86 Antígeno de linfócito 86 SEQ ID NOS: 8195 - 8196 LY96 Antígeno de linfócito 96 SEQ ID NOS: 8197 - 8198 LYG1 Lisozima G - tipo 1 SEQ ID NOS: 8199 - 8200 LYG2 Lisozima G-tipo 2 SEQ ID NOS: 8201 - 8206 LYNX1 Ly6/neurotoxina 1 SEQ ID NOS: 8207 - 8211 LYPD1 domínio de LY6/PLAUR con- SEQ ID NOS: 8212 tendo 1 - 8214
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO LYPD2 domínio de LY6/PLAUR con- SEQ ID NO: 8215 tendo 2 LYPD4 domínio de LY6/PLAUR con- SEQ ID NOS: 8216 tendo 4 - 8218 LYPD6 domínio de LY6/PLAUR con- SEQ ID NOS: 8219 tendo 6 - 8223 LYPD6B domínio de LY6/PLAUR con- SEQ ID NOS: 8224 tendo 6B - 8230 LYPD8 contendodominio LY6/PLAUR SEQ ID NOS: 8231 8B - 8232 LYZ Lisozima SEQ ID NOS: 8233 - 8235 LYZL4 Lisozima-tipo 4 SEQ ID NOS: 8236 - 8237 LYZL6 Lisozima-tipo 6 SEQ ID NOS: 8238 - 8240 M6PR Receptor de Manose-6-fosfato SEQ ID NOS: 8241 (dependente de cátion) - 8251 MAD1L1 deficiente de interrupção mitó- SEQ ID NOS: 8252 tica de MAD1 tipo 1 (levedura) - 8264 MAG Glicoproteína associada à mie- SEQ ID NOS: 8265 lina - 8270 MAGT1 Transportador 1 de magnésio SEQ ID NOS: 8271 - 8274 MALSU1 Montagem mitocondrial de su- SEQ ID NO: 8275 bunidade 1 grande ribossômica MAMDC2 2 contendo domínio MAM SEQ ID NO: 8276 MAN2B1 Manosidase, alfa, classe 2B, SEQ ID NOS: 8277 membro 1 - 8282 MAN2B2 Manosidase, alfa, classe 2B, SEQ ID NOS: 8283 membro 2 - 8285 MANBA Manosidase, beta A, lisossômi- SEQ ID NOS: 8286 ca - 8299
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO MANEAL Manosidase, tipo endo-alfa SEQ ID NOS: 8300 - 8304 MANF Fator neurotrófico derivado de SEQ ID NOS: 8305 astrócito mesencefálico - 8306 MANSC1 domínio MANSC contendo 1 SEQ ID NOS: 8307 - 8310 MAP3K9 Proteína cinase 9 ativada por SEQ ID NOS: 8311 mitógeno - 8316 MASP1 lectina serina peptidase 1 de li- SEQ ID NOS: 8317 gação a Mannan (componente - 8324 de ativação de C4/C2 de fator reativo a Ra) MASP2 Lectina serina peptidase 2 de SEQ ID NOS: 8325 ligação a Mannan - 8326 MATN1 Matrilina 1, proteína matriz de SEQ ID NO: 8327 cartilage MATN2 Matrilina 2 SEQ ID NOS: 8328 - 8340 MATN3 Matrilina 3 SEQ ID NOS: 8341 - 8342 MATN4 Matrilina 4 SEQ ID NOS: 8343 - 8347 MATR3 Matrina 3 SEQ ID NOS: 8348 - 8375 MAU2 fator de coesão cromátida irmã SEQ ID NOS: 8376 de MAU2 - 8378 MAZ proteína dedo de zinco associ- SEQ ID NOS: 8379 ada a MYC (fator de transcri- - 8393 ção de ligação à purina) MBD6 Proteína 6 de domínio de liga- SEQ ID NOS: 8394 ção a Metil-CpG - 8405 MBL2 lectina de ligação à manose SEQ ID NO: 8406 (proteína C) 2, solúvel
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO MBNL1 Regulador de ligação tipo ce- SEQ ID NOS: 8407 gueira muscular - 8425 MCCC1 Metilcrotonoil-CoA Carboxilase SEQ ID NOS: 8426 1 (alfa) - 8437 MCCD1 Domínio 1 de bobina mitocon- SEQ ID NO: 8438 drial MCEE Metilmalonil CoA epimerase SEQ ID NOS: 8439 - 8442 MCF2L linhagem cellular MCF 2 deri- SEQ ID NOS: 8443 vada de sequência tipo trans- - 8464 formante MCFD2 fator de deficiência 2 de múlti- SEQ ID NOS: 8465 pla coagulação - 8476 MDFIC domínio contendo inibidor da SEQ ID NOS: 8477 família MyoD - 8484 MDGA1 domínio de MAM contendo ân- SEQ ID NOS: 8485 cora 1 de glicosilfostadidilinosi- - 8490 tol MDK Midkine (fator 2 de promoção SEQ ID NOS: 8491 do crescimento de neurito) - 8500 MED20 Subunidade 20 de complexo SEQ ID NOS: 8501 medidor - 8505 MEGF10 EGF-tipo-Domínio 10 múltiplos SEQ ID NOS: 8506 - 8509 MEGF6 EGF-tipo-Domínio 6 múltiplos SEQ ID NOS: 8510 - 8513 MEI1 Proteína 1 de formação de SEQ ID NOS: 8514 rompimento de filament duplo - 8517 meiótico MEI4 Proteína 4 de formação de SEQ ID NO: 8518 rompimento de filament duplo meiótico
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO MEIS1 homeocaixa 1 Meis SEQ ID NOS: 8519 - 8524 MEIS3 homeocaixa 3 Meis SEQ ID NOS: 8525 - 8534 MEPE Fosfoglicoproteína extracelular SEQ ID NOS: 8538 matriz - 8544 MESDC2 candidato 2 de desenvolvimen- SEQ ID NOS: 8545 to do mesoderma - 8549 MEST transcrição específica do me- SEQ ID NOS: 8550 soderma - 8563 MET MET proto-oncogene, tirosina SEQ ID NOS: 8564 cinase recepora - 8569 METRN Meteorina, regulador da dife- SEQ ID NOS: 8570 renciação de célula glial - 8574 METRNL Meteorina, tipo regulador de di- SEQ ID NOS: 8575 ferenciação de célula glial - 8578 METTL17 Metiltransferase tipo 17 SEQ ID NOS: 8579 - 8589 METTL24 Metiltransferase tipo 24 SEQ ID NO: 8590 METTL7B metil transferase tipo a 7B SEQ ID NOS: 8591 - 8592 METTL9 metiltransferase tipo 9 SEQ ID NOS: 8593 - 8601 MEX3C Membro C da família de liga- SEQ ID NOS: 8602 ção ao RNA Mex-3 - 8604 MFAP2 Proteína 2 associada a microfi- SEQ ID NOS: 8605 brilar - 8606 MFAP3 Proteína 3 associada a microfi- SEQ ID NOS: 8607 brilar - 8611 MFAP3L proteína tipo 3 associada a mi- SEQ ID NOS: 8612 crofibrilar - 8621 MFAP4 Proteína 4 associada a microfi- SEQ ID NOS: 8622 brilar proteína 4 - 8624
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO MFAP5 Proteína 5 associada a microfi- SEQ ID NOS: 8625 brilar - 8635 MFGE8 Proteína de fator 8 de EGF de SEQ ID NOS: 8636 globule de gordura do leite - 8642 MFI2 Antígeno p97 (associado ao SEQ ID NOS: 8535 melanoma) identificado por an- - 8537 ticorpos monoclonais 133,2 e 96,5 MFNG MFNG O-fucosilpeptídeo 3- SEQ ID NOS: 8643 beta-N- - 8650 acetilglucosaminiltransferase MGA Proteína de dimerização MAX, SEQ ID NOS: 8651 MGA - 8659 MGAT2 Manosil (alfa-1,6-)- SEQ ID NO: 8660 glicoproteína beta-1,2-N- acetilglucosaminiltransferase MGAT3 Manosil (beta-1,4-)- SEQ ID NOS: 8661 glicoproteína beta-1,4-N- - 8663 acetilglucosaminiltransferase MGAT4A Manosil (alfa-1,3-)- SEQ ID NOS: 8664 glicoproteína beta-1,4-N- - 8668 acetilglucosaminiltransferase, isozima A MGAT4B Manosil (alfa-1,3-)- SEQ ID NOS: 8669 glicoproteína beta-1,4-N- - 8679 acetilglucosaminiltransferase, isozima B MGAT4D Família MGAT4, membro D SEQ ID NOS: 8680 - 8685 MGLL Monoglicerídeo lipase SEQ ID NOS: 8686 - 8695 MGP Proteína Gla matriz SEQ ID NOS: 8696 - 8698
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO MGST2 Microsomal glutationa S- SEQ ID NOS: 8699 transferase 2 - 8702 MIA Atividade inibitória de melano- SEQ ID NOS: 8703 ma - 8708 MIA2 Atividade 2 inibitória de mela- SEQ ID NO: 8709 noma MIA3 Família de atividade inibitória SEQ ID NOS: 8710 de melanoma, membro 3 - 8714 MICU1 Captação 1 de cálcio mitocon- SEQ ID NOS: 8715 drial - 8724 MIER1 Resposta 1 precoce de indução SEQ ID NOS: 8725 do mesoderma, regulador - 8733 transcricional MINOS1- Leitura de MINOS1-NBL1 SEQ ID NOS: 8734 NBL1 - 8736 MINPP1 Inositol Múltiplo-polifosfato fos- SEQ ID NOS: 8737 fatase 1 - 8739 MLEC Malectina SEQ ID NOS: 8740 - 8743 MLN Motilina SEQ ID NOS: 8744 - 8746 MLXIP Proteína de interação com MLX SEQ ID NOS: 8747 - 8752 MLXIPL proteína de interação tipo MLX SEQ ID NOS: 8753 - 8760 MMP1 Metalopeptidase matriz 1 SEQ ID NO: 8761 MMP10 Metalopeptidase matriz 10 SEQ ID NOS: 8762 - 8763 MMP11 Metalopeptidase matriz 11 SEQ ID NOS: 8764 - 8767 MMP12 Metalopeptidase matriz 12 SEQ ID NO: 8768 MMP13 Metalopeptidase matriz 13 SEQ ID NOS: 8769 - 8771
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO MMP14 Metalopeptidase matriz 14 (in- SEQ ID NOS: 8772 serida na membrana) - 8774 MMP17 Metalopeptidase matriz 17 (in- SEQ ID NOS: 8775 serida na membrana) - 8782 MMP19 Metalopeptidase matriz 19 SEQ ID NOS: 8783 - 8788 MMP2 Metalopeptidase matriz 2 SEQ ID NOS: 8789 - 8796 MMP20 Metalopeptidase matriz 20 SEQ ID NO: 8797 MMP21 Metalopeptidase matriz 21 SEQ ID NO: 8798 MMP25 Metalopeptidase matriz 25 SEQ ID NOS: 8799 - 8800 MMP26 Metalopeptidase matriz 26 SEQ ID NOS: 8801 - 8802 MMP27 Metalopeptidase matriz 27 SEQ ID NO: 8803 MMP28 Metalopeptidase matriz 28 SEQ ID NOS: 8804 - 8809 MMP3 Metalopeptidase matriz 3 SEQ ID NOS: 8810 - 8812 MMP7 Metalopeptidase matriz 7 SEQ ID NO: 8813 MMP8 Metalopeptidase matriz 8 SEQ ID NOS: 8814 - 8819 MMP9 Metalopeptidase matriz 9 SEQ ID NO: 8820 MMRN1 Multimerina 1 SEQ ID NOS: 8821 - 8823 MMRN2 Multimerina 2 SEQ ID NOS: 8824 - 8828 MOXD1 Monooxigenase, DBH - tipo 1 SEQ ID NOS: 8829 - 8831 MPO Mieloperoxidase SEQ ID NOS: 8840 - 8841 MPPED1 domínio de metalofosfoestera- SEQ ID NOS: 8842 se contendo 1 - 8845
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO MPZL1 proteína zero de mielina - tipo 1 SEQ ID NOS: 8846 - 8850 MR1 Complexo de histocompatibili- SEQ ID NOS: 8851 dade maior, relacionado com a - 8856 classe I MRPL2 Proteína ribossômica mitocon- SEQ ID NOS: 8857 drial L2 - 8861 MRPL21 Proteína ribossômica mitocon- SEQ ID NOS: 8862 drial L21 - 8868 MRPL22 Proteína ribossômica mitocon- SEQ ID NOS: 8869 drial L22 - 8873 MRPL24 Proteína ribossômica mitocon- SEQ ID NOS: 8874 drial L24 - 8878 MRPL27 Proteína ribossômica mitocon- SEQ ID NOS: 8879 drial L27 - 8884 MRPL32 Proteína ribossômica mitocon- SEQ ID NOS: 8885 drial L32 - 8887 MRPL34 Proteína ribossômica mitocon- SEQ ID NOS: 8888 drial L34 - 8892 MRPL35 Proteína ribossômica mitocon- SEQ ID NOS: 8893 drial L35 - 8896 MRPL52 Proteína ribossômica mitocon- SEQ ID NOS: 8897 drial L52 - 8907 MRPL55 Proteína ribossômica mitocon- SEQ ID NOS: 8908 drial L55 - 8933 MRPS14 Proteína ribossômica mitocon- SEQ ID NOS: 8934 drial S14 - 8935 MRPS22 Proteína ribossômica mitocon- SEQ ID NOS: 8936 drial S22 - 8944 MRPS28 Proteína ribossômica mitocon- SEQ ID NOS: 8945 drial S28 - 8952
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO MS4A14 4 domínios que abrangem a SEQ ID NOS: 8953 membrana, subfamília A, - 8963 membro 14 MS4A3 4 domínios que abrangem a SEQ ID NOS: 8964 membrana, subfamília A, - 8968 membro 3 (específicos de célu- la hematopoiética) MSH3 Homólogo 3 de MutS SEQ ID NO: 8969 MSH5 Homólogo 5 de MutS SEQ ID NOS: 8970 - 8981 MSLN Mesotelina SEQ ID NOS: 8982 - 8989 MSMB Microseminoproteína, beta- SEQ ID NOS: 8990 - 8991 MSRA Metionina sulfóxido redutase A SEQ ID NOS: 8992 - 8999 MSRB2 Metionina sulfóxido redutase SEQ ID NOS: 9000 B2 - 9001 MSRB3 Metionina sulfóxido redutase SEQ ID NOS: 9002 B3 - 9015 MST1 Macrófago estimulação 1 SEQ ID NOS: 9016 - 9017 MSTN Mioestatina SEQ ID NO: 9018 MT1G Metalotioneína 1G SEQ ID NOS: 9019 - 9022 MTHFD2 Metilenetetra-hidrofolato desi- SEQ ID NOS: 9023 drogenase (dependente de - 9027 NADP+) 2, metenilltetra- hidrofolato ciclo-hidrolase MTMR14 Proteína 14 relacionada com SEQ ID NOS: 9028 miotubularina - 9038 MTRNR2L11 MT-RNR2 - tipo 11 (pseudoge- SEQ ID NO: 9039 ne)
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO MTRR 5-metiltetra-hidrofolato- SEQ ID NOS: 9040 homocisteína metiltransferase - 9052 redutase MTTP Proteína de transferência de SEQ ID NOS: 9053 triglicerídeo microssônica - 9063 MTX2 Metaxina 2 SEQ ID NOS: 9064 - 9068 MUC1 Mucina 1, associada com a SEQ ID NOS: 9069 Superfície Celular - 9094 MUC13 Mucina 13, associada com a SEQ ID NOS: 9095 Superfície Celular - 9096 MUC20 Mucina 20, associada com a SEQ ID NOS: 9097 Superfície Celular - 9101 MUC3A Mucina 3A, associada com a SEQ ID NOS: 9102 Superfície Celular - 9104 MUC5AC Mucina 5AC, formação de SEQ ID NO: 9105 Gel/Muco Oligomérico MUC5B Mucina 5B, formação de SEQ ID NOS: 9106 Gel/Muco Oligomérico - 9107 MUC6 Mucina 6, formação de SEQ ID NOS: 9108 Gel/Muco Oligomérico - 9111 MUC7 Mucina 7, Secretada SEQ ID NOS: 9112 - 9115 MUCL1 Mucina - tipo 1 SEQ ID NOS: 9116 - 9118 MXRA5 remodelagem da matriz asso- SEQ ID NO: 9119 ciada 5 MXRA7 a remodelagem da matriz as- SEQ ID NOS: 9120 sociada 7 - 9126 MYDGF Fator de crescimento derivado SEQ ID NOS: 9127 de mieloide - 9129 MYL1 Miosina, cadeia 1 leve, álcali; SEQ ID NOS: 9130 esqueletal, rápida - 9131
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO MIOC Miocilina, resposta de glicocor- SEQ ID NOS: 9132 ticoide induzível pela malha - 9133 trabecular MYRFL fator regulatório tipo mielina SEQ ID NOS: 9134 - 9138 MZB1 Proteína específica de célula SEQ ID NOS: 9139 B1 e zona marginal B - 9143 N4BP2L2 proteína 2 de ligação a NEDD4 SEQ ID NOS: 9144 tipo 2 - 9149 NAA38 N(alfa)-acetiltransferase 38, SEQ ID NOS: 9150 subunidade auxiliar NatC - 9155 NAAA ácido N-aciletanolamina ami- SEQ ID NOS: 9156 dase - 9161 NAGA N-acetilgalactosaminidase, al- SEQ ID NOS: 9162 fa- - 9164 NAGLU N-acetilglucosaminidase, alfa SEQ ID NOS: 9165 - 9169 NAGS sintase de N-acetilglutamato SEQ ID NOS: 9170 - 9171 NAPSA peptidase aspártica de napsina SEQ ID NOS: 9172 A - 9174 NBL1 Neuroblastoma 1, Antagonista SEQ ID NOS: 9180 BMP da família DAN - 9193 NCAM1 molécula 1 de adesão de célula SEQ ID NOS: 9194 neural - 9213 NCAN Neurocano SEQ ID NOS: 9214 - 9215 NCBP2-AS2 RNA 2 antissentido de NCBP2 SEQ ID NO: 9216 (cabeça à cabeça) NCSTN Nicastrina SEQ ID NOS: 9217 - 9226 NDNF Fator neurotrófico derivado de SEQ ID NOS: 9227 neurônio - 9229
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO NDP Doença Norrie (pseudoglioma) SEQ ID NOS: 9230 - 9232 NDUFA10 Subcomplexo de NADH desi- SEQ ID NOS: 9233 drogenase (ubiquinona) 1 alfa, - 9242 10, 42kDa NDUFB5 Subcomplexo de NADH desi- SEQ ID NOS: 9243 drogenase (ubiquinona) 1 beta, - 9251 5, 16kDa NDUFS8 Proteína 8 Fe-S de NADH de- SEQ ID NOS: 9252 sidrogenase (ubiquinona), - 9261 23kDa (NADH-coenzima Q re- dutase) NDUFV1 Flavoproteína 1 NADH desi- SEQ ID NOS: 9262 drogenase (ubiquinone), 51kDa - 9275 NECAB3 proteína 3 de ligação ao cálcio SEQ ID NOS: 9276 de mão EF N-terminal - 9285 NELL1 EGFL Neural tipo 1 SEQ ID NOS: 9289 - 9292 NELL2 EGFL Neural tipo 2 SEQ ID NOS: 9293 - 9307 NENF Fator neurotrófico de neudesi- SEQ ID NO: 9308 na NETO1 Neuropilina (NRP) e toloide SEQ ID NOS: 9309 (TLL) - tipo 1 - 9312 NFASC Neurofascina SEQ ID NOS: 9313 - 9327 NFE2L1 Fator nuclear, eritroide 2 - tipo SEQ ID NOS: 9328 1 - 9346 NFE2L3 Fator nuclear, eritroide 2 - tipo SEQ ID NOS: 9347 3 - 9348 NGEF Fator de troca de nucleotídeo SEQ ID NOS: 9349 guanina neuronal parei pag – 9354 386
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO NGF Fator de crescimento de nervo SEQ ID NO: 9355 (beta polipeptídeo) NGLY1 N-glicanase 1 SEQ ID NOS: 9356 - 9362 NGRN Neugrina, associada ao cres- SEQ ID NOS: 9363 cimento de neurite - 9364 NHLRC3 repetição de NHL contendo 3 SEQ ID NOS: 9365 - 9367 NID1 Nidogênio 1 SEQ ID NOS: 9368 - 9369 NID2 Nidogênio 2 (osteonidogênio) SEQ ID NOS: 9370 - 9372 NKG7 Proteína 7 de grânulo de célula SEQ ID NOS: 9373 exterminadora natural - 9377 NLGN3 Neuroligina 3 SEQ ID NOS: 9378 - 9382 NLGN4Y Neuroligina 4, ligado a Y SEQ ID NOS: 9383 - 9389 NLRP5 Família de NLR, 5 contendo SEQ ID NOS: 9390 domínio de pirina - 9392 NMB Neuromedina B SEQ ID NOS: 9393 - 9394 NME1 nucleosídeo difosfato cinase 1 SEQ ID NOS: 9395 NME/NM23 - 9401 NME1-NME2 Leitura de NME1-NME2 SEQ ID NOS: 9402 - 9404 NME3 nucleosídeo difosfato cinase 3 SEQ ID NOS: 9405 NME/NM23 - 9409 NMS Neuromedina S SEQ ID NO: 9410 NMU Neuromedina U SEQ ID NOS: 9411 - 9414 NOA1 ao óxido nítrico associado 1 SEQ ID NO: 9415
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO NODAL Fator de diferenciação do cres- SEQ ID NOS: 9416 cimento nodal - 9417 NOG Noggin SEQ ID NO: 9418 NOMO3 modulador 3 NODAL SEQ ID NOS: 9419 - 9425 NOS1AP proteína de adaptador de óxido SEQ ID NOS: 9426 nítrico sintase 1 (neuronal) - 9430 NOTCH3 Notch 3 SEQ ID NOS: 9431 - 9434 NOTUM Homólogo de Notum pectinace- SEQ ID NOS: 9435 tilesterase (Drosophila) - 9437 NOV Nefroblastoma superexpresso SEQ ID NO: 9438 NPB Neuropeptídeo B SEQ ID NOS: 9439 - 9440 NPC2 Doença de Niemann-Pick, tipo SEQ ID NOS: 9441 C2 - 9449 NPFF Precursor de peptídeo de neu- SEQ ID NO: 9450 ropeptídeo FF-amida NPFFR2 Receptor 2 de neuropeptídeo SEQ ID NOS: 9451 FF - 9454 NPHS1 Nefrose 1, congênita, tipo Fin- SEQ ID NOS: 9455 nish (nefrina) - 9456 NPNT Nefronectinano SEQ ID NOS: 9457 - 9467 NPPA Peptídeo A natriurético SEQ ID NOS: 9468 - 9470 NPPB Peptídeo B natriurético SEQ ID NO: 9471 NPPC Peptídeo C natriurético SEQ ID NOS: 9472 - 9473 NPS Neuropeptídeo S SEQ ID NO: 9474 NPTX1 Pentraxina I neuronal SEQ ID NO: 9475 NPTX2 Pentraxina II neuronal SEQ ID NO: 9476
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO NPTXR Receptor de pentraxina neuro- SEQ ID NOS: 9477 nal - 9478 NPVF Precursor de neuropeptídeo VF SEQ ID NO: 9479 NPW Neuropeptídeo W SEQ ID NOS: 9480 - 9482 NPY Neuropeptídeo Y SEQ ID NOS: 9483 - 9485 NQO2 NAD(P)H desidrogenase, qui- SEQ ID NOS: 9486 nona 2 - 9494 NRCAM Molécula de adesão de célula SEQ ID NOS: 9495 neuronal - 9507 NRG1 Neuregulina 1 SEQ ID NOS: 9508 - 9525 NRN1L tipo neuritina 1 SEQ ID NOS: 9526 - 9528 NRP1 Neuropilina 1 SEQ ID NOS: 9529 - 9542 NRP2 Neuropilina 2 SEQ ID NOS: 9543 - 9549 NRTN Neurturina SEQ ID NO: 9550 NRXN1 Neurexina 1 SEQ ID NOS: 9551 - 9581 NRXN2 Neurexina 2 SEQ ID NOS: 9582 - 9590 NT5C3A 5'-nucleotidase, IIIA citosólico SEQ ID NOS: 9591 - 9601 NT5DC3 3 contendo domínio de 5'- SEQ ID NOS: 9602 nucleotidase - 9604 NT5E 5'-nucleotidase, ecto (CD73) SEQ ID NOS: 9605 - 9609 NTF3 Neurotrofina 3 SEQ ID NOS: 9610 - 9611
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO NTF4 Neurotrofina 4 SEQ ID NOS: 9612 - 9613 NTM Neurotrimina SEQ ID NOS: 9614 - 9623 NTN1 Netrina 1 SEQ ID NOS: 9624 - 9625 NTN3 Netrina 3 SEQ ID NO: 9626 NTN4 Netrina 4 SEQ ID NOS: 9627 - 9631 NTN5 Netrina 5 SEQ ID NOS: 9632 - 9633 NTNG1 Netrina G1 SEQ ID NOS: 9634 - 9640 NTNG2 Netrina G2 SEQ ID NOS: 9641 - 9642 NTS Neurotensina SEQ ID NOS: 9643 - 9644 NUBPL ligação a nucleotídeo tipo pro- SEQ ID NOS: 9645 teína - 9651 NUCB1 Nucleobindina 1 SEQ ID NOS: 9652 - 9658 NUCB2 Nucleobindina 2 SEQ ID NOS: 9659 - 9674 NUDT19 Motivo 19 tipo Nudix (porção X SEQ ID NO: 9675 ligada ao difosfato de nucleosí- deo) NUDT9 Motivo 9 tipo Nudix (porção X SEQ ID NOS: 9676 ligada ao difosfato de nucleosí- - 9680 deo) NUP155 Nucleoporina 155kDa SEQ ID NOS: 9681 - 9684 NUP214 Nucleoporina 214kDa SEQ ID NOS: 9685 - 9696
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO NUP85 Nucleoporina 85kDa SEQ ID NOS: 9697 - 9711 NXPE3 Família de domínio da neure- SEQ ID NOS: 9712 xofilina e PC-esterase, membro - 9716 3 NXPE4 Família de domínio da neure- SEQ ID NOS: 9717 xofilina e PC-esterase, membro - 9718 4 NXPH1 Neurexofilina 1 SEQ ID NOS: 9719 - 9722 NXPH2 Neurexofilina 2 SEQ ID NO: 9723 NXPH3 Neurexofilina 3 SEQ ID NOS: 9724 - 9725 NXPH4 Neurexofilina 4 SEQ ID NOS: 9726 - 9727 NYX Nictalopina SEQ ID NOS: 9728 - 9729 OAF Fora no primeiro homólogo SEQ ID NOS: 9730 - 9731 OBP2A Proteína 2A de ligação ao Odo- SEQ ID NOS: 9732 rante - 9738 OBP2B Proteína 2B de ligação ao Odo- SEQ ID NOS: 9739 rante - 9742 OC90 Otoconina 90 SEQ ID NO: 9743 OCLN Ocludina SEQ ID NOS: 9744 - 9746 ODAM Associado ao ameloblasto SEQ ID NOS: 9747 odontogênico, associado ao - 9750 ameloblasto OGG1 8-oxoguanina DNA glicosilase SEQ ID NOS: 9755 - 9768 OGN Osteoglicina SEQ ID NOS: 9769 - 9771
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO OIT3 Transcrição 3 induzida por on- SEQ ID NOS: 9772 coproteína - 9773 OLFM1 Olfactomedina 1 SEQ ID NOS: 9774 - 9784 OLFM2 Olfactomedina 2 SEQ ID NOS: 9785 - 9788 OLFM3 Olfactomedina 3 SEQ ID NOS: 9789 - 9791 OLFM4 Olfactomedina 4 SEQ ID NO: 9792 OLFML1 Olfactomedina - tipo 1 SEQ ID NOS: 9793 - 9796 OLFML2A Olfactomedina - tipo 2A SEQ ID NOS: 9797 - 9799 OLFML2B Olfactomedina - tipo 2B SEQ ID NOS: 9800 - 9804 OLFML3 Olfactomedina - tipo 3 SEQ ID NOS: 9805 - 9807 OMD Osteomodulina SEQ ID NO: 9808 OMG Glicoproteína de mielina de oli- SEQ ID NO: 9809 godendrócito OOSP2 Proteína 2 secretada por oócito SEQ ID NOS: 9810 - 9811 OPCML Tipo molécula de adesão à pro- SEQ ID NOS: 9812 teína/célula de ligação a opioi- - 9816 de OPTC Opticina SEQ ID NOS: 9818 - 9819 ORAI1 modulador 1 de cálcio ativado SEQ ID NO: 9820 por liberação de cálcio ORAI ORM1 Orosomucoide 1 SEQ ID NO: 9821 ORM2 Orosomucoide 2 SEQ ID NO: 9822 ORMDL2 Regulador 2 da biossíntese de SEQ ID NOS: 9823 esfingolipídeo ORMDL - 9826
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO OS9 Osteossarcoma amplificado 9, SEQ ID NOS: 9827 lectina do retículo endoplásmi- - 9841 co OSCAR Receptor do tipo imunoglobuli- SEQ ID NOS: 9842 na, associado ao osteoclasto - 9852 OSM Oncoestatina M SEQ ID NOS: 9853 - 9855 OSMR Receptor de oncoestatina M SEQ ID NOS: 9856 receptor - 9860 OSTN Osteocrina SEQ ID NOS: 9861 - 9862 OTOA Otoancorina SEQ ID NOS: 9863 - 9868 OTOG Otogelina SEQ ID NOS: 9869 - 9871 OTOGL Tipo otogelina SEQ ID NOS: 9872 - 9878 OTOL1 Otolina 1 SEQ ID NO: 9879 OTOR Otoraplina SEQ ID NO: 9880 OTOS Otospiralina SEQ ID NOS: 9881 - 9882 OVCH1 Ovoquimase 1 SEQ ID NOS: 9883 - 9885 OVCH2 Ovoquimase 2 (ge- SEQ ID NOS: 9886 ne/pseudogene) - 9887 OVGP1 Glicoproteína 1 ovidutal, SEQ ID NO: 9888 120kDa OXCT1 3-oxoácido CoA transferase 1 SEQ ID NOS: 9889 - 9892 OXCT2 3-oxoácido oA transferase 2 SEQ ID NO: 9893 OXNAD1 domínio de ligação a oxidorre- SEQ ID NOS: 9894 dutase NAD contendo 1 - 9900
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO OXT Prepropeptídeo de Oxitocina / SEQ ID NO: 9901 neurofisina I P3H1 Prolil 3-hidroxilase 1 SEQ ID NOS: 9902 - 9906 P3H2 Prolil 3-hidroxilase 2 SEQ ID NOS: 9907 - 9910 P3H3 Prolil 3-hidroxilase 3 SEQ ID NO: 9911 P3H4 Membro 4 da família prolil 3- SEQ ID NOS: 9912 hidroxilase (não enzimático - 9916 P4HA1 Prolil 4-hidroxilase, alfa poli- SEQ ID NOS: 9917 peptídeo I - 9921 P4HA2 Prolil 4-hidroxilase, alfa poli- SEQ ID NOS: 9922 peptídeo II - 9936 P4HA3 Prolil 4-hidroxilase, alfa poli- SEQ ID NOS: 9937 peptídeo III - 9941 P4HB Prolil 4-hidroxilase, beta poli- SEQ ID NOS: 9942 peptídeo - 9953 PAEP Proteína endometrial associada SEQ ID NOS: 9954 com progestagênio - 9962 PAM Monooxigenase de alfa- SEQ ID NOS: 9963 amidação de peptidilglicine - 9976 PAMR1 domínio de peptidase contendo SEQ ID NOS: 9977 associado com regeneração - 9983 muscular 1 PAPL proteína tipo fosfatase de ácido SEQ ID NOS: 159 - púrpura de ferro/zinco 162 PAPLN Papilina, glicoproteína sulfata- SEQ ID NOS: 9984 da tipo proteoglicano - 9991 PAPPA Proteína A de plasma associa- SEQ ID NO: 9992 da à gravidez, papalisina 1 PAPPA2 Papalisina 2 SEQ ID NOS: 9993 - 9994
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO PARP15 Membro 15 da família Poli SEQ ID NOS: 9995 (ADP-ribose) polimerase - 9998 PARVB Parvina, beta SEQ ID NOS: 9999 - 10003 PATE1 próstata e testículos expressa- SEQ ID NOS: 10004 do 1 - 10005 PATE2 próstata e testículos expressa- SEQ ID NOS: 10006 do 2 - 10007 PATE3 próstata e testículos expressa- SEQ ID NO: 10008 do 3 PATE4 próstata e testículos expressa- SEQ ID NOS: 10009 do 4 - 10010 PATL2 Proteína associada com homó- SEQ ID NOS: 10011 logo 2 de topoisomerase II (le- - 10016 vedura) PAX2 Caixa pareada 2 SEQ ID NOS: 10017 - 10022 PAX4 Caixa pareada 4 SEQ ID NOS: 10023 - 10029 PCCB Propionil CoA Carboxilase, be- SEQ ID NOS: 10030 ta polipeptídeo - 10044 PCDH1 Protocaderina 1 SEQ ID NOS: 10045 - 10050 PCDH12 Protocaderina 12 SEQ ID NOS: 10051 - 10052 PCDH15 protocaderina relacionado a 15 SEQ ID NOS: 10053 - 10086 PCDHA1 Protocaderina alfa 1 SEQ ID NOS: 10087 - 10089 PCDHA10 Protocaderina alfa 10 SEQ ID NOS: 10090 - 10092 PCDHA11 Protocaderina alfa 11 SEQ ID NOS: 10093 - 10095
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO PCDHA6 Protocaderina alfa 6 SEQ ID NOS: 10096 - 10098 PCDHB12 Protocaderina beta 12 SEQ ID NOS: 10099 - 10101 PCDHGA11 Protocaderina gama subfamília SEQ ID NOS: 10102 A, 11 - 10104 PCF11 Subunidade de fator de polia- SEQ ID NOS: 10105 denilação e clivagem de - 10109 PCF11 PCOLCE Realçador de procolágeno C- SEQ ID NO: 10110 endopeptidase PCOLCE2 Realçador 2 de procolágeno C- SEQ ID NOS: 10111 endopeptidase - 10114 PCSK1 subtilisina/quexina de proprote- SEQ ID NOS: 10115 ína convertase tipo 1 - 10117 PCSK1N Inibidor de subtilisina/quexina SEQ ID NO: 10118 de proproteína convertase tipo 1 PCSK2 subtilisina/quexina de proprote- SEQ ID NOS: 10119 ína convertase tipo 2 - 10121 PCSK4 subtilisina/quexina de proprote- SEQ ID NOS: 10122 ína convertase tipo 4 - 10124 PCSK5 subtilisina/quexina de proprote- SEQ ID NOS: 10125 ína convertase tipo 5 - 10129 PCSK9 subtilisina/quexina de proprote- SEQ ID NO: 10130 ína convertase tipo 9 PCYOX1 Prenilcisteína oxidase 1 SEQ ID NOS: 10131 - 10135 PCYOX1L prenilcisteína oxidase tipo 1 SEQ ID NOS: 10136 - 10140 PDDC1 domínio 7 da doença de Par- SEQ ID NOS: 5802 kinson contendo 1 - 5810
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO PDE11A Fosfodiesterase 11A SEQ ID NOS: 10141 - 10146 PDE2A Fosfodiesterase 2A, estimulada SEQ ID NOS: 10147 por cGMP - 10168 PDE7A Fosfodiesterase 7A SEQ ID NOS: 10169 - 10172 PDF Peptídeo desformilase (mito- SEQ ID NO: 10173 condrial) PDGFA Polipeptídeo de fator alfa de SEQ ID NOS: 10174 crescimento derivado de pla- - 10177 queta PDGFB Polipeptídeo de fator beta deri- SEQ ID NOS: 10178 vado de plaqueta - 10181 PDGFC Fator C de crescimento deriva- SEQ ID NOS: 10182 do de plaqueta - 10185 PDGFD Fator D de crescimento deriva- SEQ ID NOS: 10186 do de plaqueta - 10188 PDGFRA Receptor de fator de cresci- SEQ ID NOS: 10189 mento derivado de plaqueta, al- - 10195 fa polipeptídeo PDGFRB Receptor de fator de cresci- SEQ ID NOS: 10196 mento de plaqueta, beta poli- - 10199 peptídeo PDGFRL receptor tipo de fator de cres- SEQ ID NOS: 10200 cimento de plaqueta - 10201 PDHA1 Piruvato desidrogenase (lipoa- SEQ ID NOS: 10202 mida) alfa 1 - 10210 PDIA2 Família A de proteína dissulfeto SEQ ID NOS: 10211 isomerase, membro 2 - 10214 PDIA3 Família A de proteína dissulfeto SEQ ID NOS: 10215 isomerase, membro 3 - 10218 PDIA4 Família A de proteína dissulfeto SEQ ID NOS: 10219 isomerase, membro 4 - 10220
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO PDIA5 Família A de proteína dissulfeto SEQ ID NOS: 10221 isomerase, membro 5 - 10224 PDIA6 Proteína dissulfeto isomerase SEQ ID NOS: 10225 família A, membro 6 - 10231 PDILT proteína tipo dissulfeto isome- SEQ ID NOS: 10232 rase, expressa nos testículos - 10233 PDYN Prodinorfina SEQ ID NOS: 10234 - 10236 PDZD8 8 contendo domínio PDZ SEQ ID NO: 10237 PDZRN4 Domínio PDZ contendo dedo SEQ ID NOS: 10238 de zinco 4 - 10240 PEAR1 Receptor 1 de agregação en- SEQ ID NOS: 10241 dotelial de plaquetas - 10244 PEBP4 Proteína 4 de ligação à fosfati- SEQ ID NOS: 10245 diletanolamina - 10246 PECAM1 Molécula 1 de adesão de pla- SEQ ID NOS: 10247 queta/célula endotelial - 10250 PENK Proencefalina SEQ ID NOS: 10251 - 10256 PET117 Homólogo PET117 SEQ ID NO: 10257 PF4 Fator 4 de plaquetas SEQ ID NO: 10258 PF4V1 Variante 1 de fator 4 de plaque- SEQ ID NO: 10259 tas PFKP Fosfofrutocinase, plaqueta SEQ ID NOS: 10260 - 10268 PFN1 Profilin 1 SEQ ID NOS: 10269 - 10271 PGA3 Pepsinogen 3, grupo I (pepsi- SEQ ID NOS: 10272 nogen A) - 10275 PGA4 Pepsinogen 4, grupo I (pepsi- SEQ ID NOS: 10276 nogen A) - 10278 PGA5 Pepsinogen 5, grupo I (pepsi- SEQ ID NOS: 10279 nogen A) - 10281
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO PGAM5 PGAM família membro 5, seri- SEQ ID NOS: 10282 na/treonina proteína fosfatase, - 10285 mitochondrial PGAP3 Ligação Pós-GPI a proteínas 3 SEQ ID NOS: 10286 - 10293 PGC Progastricsina (pepsinogênio SEQ ID NOS: 10294 C) - 10297 PGF Fator de crescimento placental SEQ ID NOS: 10298 - 10301 PGLYRP1 Proteína de reconhecimento de SEQ ID NO: 10302 peptidoglicano 1 PGLYRP2 Proteína de reconhecimento de SEQ ID NOS: 10303 peptidoglicano 2 - 10306 PGLYRP3 Proteína de reconhecimento de SEQ ID NO: 10307 peptidoglicano 3 PGLYRP4 Proteína de reconhecimento de SEQ ID NOS: 10308 peptidoglicano 4 - 10309 PHACTR1 Regulador 1 de fosfatase e ac- SEQ ID NOS: 10310 tina - 10316 PHB Proibitina SEQ ID NOS: 10317 - 10325 PI15 Inibidor 15 de peptidase SEQ ID NOS: 10326 - 10327 PI3 Inibidor 3 de peptidase, deriva- SEQ ID NO: 10328 do da pele PIANP proteína neural associada a SEQ ID NOS: 10329 PILR alfa - 10334 PIGK Biossíntese de âncora de gli- SEQ ID NOS: 10335 cano de fosfatidilinositol, classe - 10338
K PIGL Biossíntese de âncora de gli- SEQ ID NOS: 10339 cano de fosfatidilinositol, classe - 10346
L
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO PIGT Biossíntese de âncora de gli- SEQ ID NOS: 10347 cano de fosfatidilinositol, classe - 10400
T PIGZ Biossíntese de âncora de gli- SEQ ID NOS: 10401 cano de fosfatidilinositol, classe - 10403
Z PIK3AP1 Proteína 1 adaptadora de fos- SEQ ID NOS: 10404 foinositídeo-3-cinase - 10406 PIK3IP1 Proteína 1 de interação de Fos- SEQ ID NOS: 10407 foinositídeo-3-cinase - 10410 PILRA receptor alfa tipo 2 semelhante SEQ ID NOS: 10411 à imunoglobina pareada - 10415 PILRB Receptor beta tipo 2 semelhan- SEQ ID NOS: 10416 te à imuoglobina pareada - 10427 PINLYP Inibidor de Fosfolipase A2 e SEQ ID NOS: 10428 domínio contendo LY6/PLAUR - 10432 PIP Proteína induzida por prolacti- SEQ ID NO: 10433 na PIWIL4 4 de silenciamento de gene SEQ ID NOS: 10434 mediado por RNA tipo Piwi - 10438 PKDCC Contendo domínio de proteína SEQ ID NOS: 10439 cinase, citoplásmico - 10440 PKHD1 Rim policístico e doença 1 he- SEQ ID NOS: 10441 pática (recessiva autossômica) - 10442 PLA1A Fosfolipase A1 membro A SEQ ID NOS: 10443 - 10447 PLA2G10 Fosfolipase A2, grupo X SEQ ID NOS: 10448 - 10449 PLA2G12A Fosfolipase A2, grupo XIIA SEQ ID NOS: 10450 - 10452 PLA2G12B Fosfolipase A2, grupo XIIB SEQ ID NO: 10453 PLA2G15 Fosfolipase A2, grupo XV SEQ ID NOS: 10454 - 10461
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO PLA2G1B Fosfolipase A2, grupo IB (pân- SEQ ID NOS: 10462 creas) - 10464 PLA2G2A Fosfolipase A2, grupo IIA (pla- SEQ ID NOS: 10465 quetas, fluido sinovial) - 10466 PLA2G2C Fosfolipase A2, grupo IIC SEQ ID NOS: 10467 - 10468 PLA2G2D Fosfolipase A2, grupo IID SEQ ID NOS: 10469 - 10470 PLA2G2E Fosfolipase A2, grupo IIE SEQ ID NO: 10471 PLA2G3 Fosfolipase A2, grupo III SEQ ID NO: 10472 PLA2G5 Fosfolipase A2, grupo V SEQ ID NO: 10473 PLA2G7 Fosfolipase A2, grupo VII (fator SEQ ID NOS: 10474 de ativação de plaquetas aceti- - 10475 lhidrolase, plasma) PLA2R1 Receptor 1 de fosfolipase A2, SEQ ID NOS: 10476 180kDa - 10477 PLAC1 1 específico de placenta SEQ ID NO: 10478 PLAC9 9 específico de placenta SEQ ID NOS: 10479 - 10481 PLAT Ativador de plasminogênio, te- SEQ ID NOS: 10482 cido - 10490 PLAU Ativador de plasminogênio, SEQ ID NOS: 10491 urocinase - 10493 PLAUR Ativador de plasminogênio, re- SEQ ID NOS: 10494 ceptor de urocinase - 10505 PLBD1 domínio de fosfolipase B con- SEQ ID NOS: 10506 tendo 1 - 10508 PLBD2 domínio de fosfolipase B con- SEQ ID NOS: 10509 tendo 2 - 10511 PLG Plasminogênio SEQ ID NOS: 10512 - 10514 PLGLB1 B1 tipo plasminogênio SEQ ID NOS: 10515 - 10518
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO PLGLB2 B2 tipo plasminogênio SEQ ID NOS: 10519 - 10520 PLOD1 Procolágeno-lisina, 2- SEQ ID NOS: 10521 oxoglutarato 5-dioxigenase 1 - 10523 PLOD2 Procolágeno-lisina, 2- SEQ ID NOS: 10524 oxoglutarato 5-dioxigenase 2 - 10529 PLOD3 Procolágeno-lisina, 2- SEQ ID NOS: 10530 oxoglutarato 5-dioxigenase 3 - 10536 PLTP Proteína de transferência de SEQ ID NOS: 10537 fosfolipídeo - 10541 PLXNA4 Plexina A4 SEQ ID NOS: 10542 - 10545 PLXNB2 Plexina B2 SEQ ID NOS: 10546 - 10554 PM20D1 1 contendo domínio de Pepti- SEQ ID NO: 10555 dase M20 PMCH hormônio de concentração de SEQ ID NO: 10556 pró-melanina PMEL Premelanossoma proteína SEQ ID NOS: 10557 - 10568 PMEPA1 Proteína de transmembrana da SEQ ID NOS: 10569 próstata, 1 induzido por andro- - 10575 gênio PNLIP Lipase pancreática SEQ ID NO: 10576 PNLIPRP1 Proteína 1 relacionada com a SEQ ID NOS: 10577 lipase pancreática - 10585 PNLIPRP3 Pproteína 3 relacionada com a SEQ ID NO: 10586 lipase pancreática PNOC Prepronociceptina SEQ ID NOS: 10587 - 10589 PNP Purina nucleosídeo fosforilase SEQ ID NOS: 10590 - 10593
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO PNPLA4 domínio de fosfolipase tipo Pa- SEQ ID NOS: 10594 tatina contendo 4 - 10597 PODNL1 1 tipo Podocan SEQ ID NOS: 10598 - 10609 POFUT1 Proteína O-fucosiltransferase 1 SEQ ID NOS: 10610 - 10611 POFUT2 Proteína O-fucosiltransferase 2 SEQ ID NOS: 10612 - 10617 POGLUT1 Proteína O-glicosiltransferase 1 SEQ ID NOS: 10618 - 10622 POLL Polimerase (direcionada ao SEQ ID NOS: 10623 DNA), lambda - 10635 POMC Proopiomelanocortina SEQ ID NOS: 10636 - 10640 POMGNT2 Proteína O-ligada manose N- SEQ ID NOS: 10641 acetilglucosaminiltransferase 2 - 10642 (beta 1,4-) PON1 Paraoxonase 1 SEQ ID NOS: 10643 - 10644 PON2 Paraoxonase 2 SEQ ID NOS: 10645 - 10657 PON3 Paraoxonase 3 SEQ ID NOS: 10658 - 10663 POSTN Periostina, fator específico de SEQ ID NOS: 10664 osteoblasto - 10669 PPBP Proteína básica pró-plaquetas SEQ ID NO: 10670 (Quimiocina (Motivo C-X-C) li- gante 7) PPIB Peptidilprolil isomerase B (ci- SEQ ID NO: 10671 clofilina B) PPIC Peptidilprolil isomerase C (ci- SEQ ID NO: 10672 clofilina C)
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO PPOX Protoporfirinogênio oxidase SEQ ID NOS: 10673 - 10683 PPP1CA Proteína fosfatase 1, subuni- SEQ ID NOS: 10684 dade catalítica, alfa isozima - 10689 PPT1 Palmitoil-proteína tioesterase 1 SEQ ID NOS: 10690 - 10706 PPT2 Palmitoil-proteína tioesterase 2 SEQ ID NOS: 10707 - 10714 PPY Polipeptídeo pancreático SEQ ID NOS: 10715 - 10719 PRAC2 candidato 2 com suscetibilida- SEQ ID NOS: 10720 de ao câncer da próstata - 10721 PRADC1 1 contendo domínio associado SEQ ID NO: 10722 à protease PRAP1 Proteína 1 acídica rica em pro- SEQ ID NOS: 10723 lina - 10724 PRB1 Subfamília 1 BstNI de proteína SEQ ID NOS: 10725 rica em prolina - 10728 PRB2 Subfamília 2 BstNI de proteína SEQ ID NOS: 10729 rica em prolina - 10730 PRB3 Subfamília 3 BstNI de proteína SEQ ID NOS: 10731 rica em prolina - 10732 PRB4 Subfamília 4 BstNI de proteína SEQ ID NOS: 10733 rica em prolina - 10736 PRCD Degeneração progressiva do SEQ ID NOS: 10737 bastão-cone - 10738 PRCP Prolilcarboxipeptidase (angio- SEQ ID NOS: 10739 tensinase C) - 10750 PRDM12 domínio PR contendo 12 SEQ ID NO: 10751 PRDX4 Peroxiredoxina 4 SEQ ID NOS: 10752 - 10755
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO PRELP Proteína de repetição rica em SEQ ID NO: 10756 leucina de extremidade rica em prolina/arginina PRF1 Perforina 1 (proteína de forma- SEQ ID NOS: 10757 ção de poro) - 10759 PRG2 Proteoglicano 2, medula óssea SEQ ID NOS: 10760 (ativador de célula extermina- - 10762 dora natural, proteína básica maior de grânulo de eosinófilo) PRG3 Proteoglicano 3 SEQ ID NO: 10763 PRG4 Proteoglicano 4 SEQ ID NOS: 10764 - 10769 PRH1 Subfamília 1 HaeIII de proteína SEQ ID NOS: 10770 rica em prolina - 10772 PRH2 Subfamília 2 HaeIII de proteína SEQ ID NOS: 10773 rica em prolina - 10774 PRKAG1 Proteína cinase, ativada por SEQ ID NOS: 10775 AMP, subunidade não catalíti- - 10789 ca gama 1 PRKCSH Proteína cinase C substrato SEQ ID NOS: 10790 80K-H - 10799 PRKD1 Proteína cinase D1 SEQ ID NOS: 10800 - 10805 PRL Prolactina SEQ ID NOS: 10806 - 10808 PRLH Hormônio de liberação da pro- SEQ ID NO: 10809 lactina PRLR Receptor de prolactina SEQ ID NOS: 10810 - 10828 PRNP Proteína de priônio SEQ ID NOS: 10829 - 10832 PRNT Proteína de priônio (específica SEQ ID NO: 10833 dos testículos)
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO PROC Proteína C (inativadora de fato- SEQ ID NOS: 10834 res de coagulação Va e VIIIa) - 10841 PROK1 Procineticina 1 SEQ ID NO: 10842 PROK2 Procineticina 2 SEQ ID NOS: 10843 - 10844 PROL1 1 lacrimal, rico em prolina SEQ ID NO: 9817 PROM1 Prominina 1 SEQ ID NOS: 10845 - 10856 PROS1 Proteína S (alfa) SEQ ID NOS: 10857 - 10860 PROZ Proteína Z, glicoproteína de SEQ ID NOS: 10861 plasma dependente da vitami- - 10862 na K PRR27 rico em prolina 27 SEQ ID NOS: 10863 - 10866 PRR4 rico em prolina 4(lacrimal) SEQ ID NOS: 10867 - 10869 PRRG2 Gla rico em prolina 2 (ácido G- SEQ ID NOS: 10870 carboxiglutâmico) - 10872 PRRT3 Proteína de transmembrana ri- SEQ ID NOS: 10873 ca em prolina 3 - 10875 PRRT4 Proteína de transmembrana ri- SEQ ID NOS: 10876 ca em prolina 4 - 10882 PRSS1 Protease, serina, 1 (tripsina 1) SEQ ID NOS: 10883 - 10886 PRSS12 Protease, serina, 12 (neurotrip- SEQ ID NO: 10887 sina, motopsina) PRSS16 Protease, serina, 16 (timo) SEQ ID NOS: 10888 - 10895 PRSS2 Protease, serina, 2 (tripsina 2) SEQ ID NOS: 10896 - 10899 PRSS21 Protease, serina, 21 (testisina) SEQ ID NOS: 10900 - 10905
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO PRSS22 Protease, serina, 22 SEQ ID NOS: 10906 - 10908 PRSS23 Protease, serina, 23 SEQ ID NOS: 10909 - 10912 PRSS27 Protease, serina 27 SEQ ID NOS: 10913 - 10915 PRSS3 Protease, serina, 3 SEQ ID NOS: 10916 - 10920 PRSS33 Protease, serina, 33 SEQ ID NOS: 10921 - 10924 PRSS35 Protease, serina, 35 SEQ ID NO: 10925 PRSS36 Protease, serina, 36 SEQ ID NOS: 10926 - 10929 PRSS37 Protease, serina, 37 SEQ ID NOS: 10930 - 10933 PRSS38 Protease, serina, 38 SEQ ID NO: 10934 PRSS42 Protease, serina, 42 SEQ ID NOS: 10935 - 10936 PRSS48 Protease, serina, 48 SEQ ID NOS: 10937 - 10938 PRSS50 Protease, serina, 50 SEQ ID NO: 10939 PRSS53 Protease, serina, 53 SEQ ID NO: 10940 PRSS54 Protease, serina, 54 SEQ ID NOS: 10941 – 10945 PRSS55 Protease, serina, 55 SEQ ID NOS: 10946 – 10948 PRSS56 Protease, serina, 56 SEQ ID NOS: 10949 – 10950 PRSS57 Protease, serina, 57 SEQ ID NOS: 10951 – 10952 PRSS58 Protease, serina, 58 SEQ ID NOS: 10953 – 10954
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO PRSS8 Protease, serina, 8 SEQ ID NOS: 10955 – 10958 PRTG Protogenina SEQ ID NOS: 10959 – 10962 PRTN3 Proteinase 3 SEQ ID NOS: 10963 - 10964 PSAP Prosaposina SEQ ID NOS: 10965 - 10968 PSAPL1 prosaposina tipo 1(gene / SEQ ID NO: 10969 pseudogene) PSG1 beta-1-glicoproteína 1 específi- SEQ ID NOS: 10970 ca da gravidez - 10977 PSG11 beta-1-glicoproteína 11 especí- SEQ ID NOS: 10978 fica da gravidez - 10982 PSG2 beta-1-glicoproteína 2 específi- SEQ ID NOS: 10983 ca da gravidez - 10984 PSG3 beta-1-glicoproteína 3 específi- SEQ ID NOS: 10985 ca da gravidez - 10988 PSG4 beta-1-glicoproteína 4 específi- SEQ ID NOS: 10989 ca da gravidez - 11000 PSG5 beta-1-glicoproteína 5 específi- SEQ ID NOS: 11001 ca da gravidez - 11006 PSG6 beta-1-glicoproteína 6 específi- SEQ ID NOS: 11007 ca da gravidez - 11012 PSG7 beta-1-glicoproteína 7 específi- SEQ ID NOS: 11013 ca da gravidez (ge- - 11015 ne/pseudogene) PSG8 beta-1-glicoproteína 8 específi- SEQ ID NOS: 11016 ca da gravidez - 11020 PSG9 beta-1-glicoproteína 9 específi- SEQ ID NOS: 11021 ca da gravidez - 11028 PSMD1 Subunidade 26S de proteas- SEQ ID NOS: 11029 soma, não ATPase 1 - 11036
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO PSORS1C2 Candidato 2 de suscetibilida- SEQ ID NO: 11037 deà psoríase PSPN Persefina SEQ ID NOS: 11038 - 11039 PTGDS Prostaglandina D2 sintase SEQ ID NOS: 11040 21kDa (cérebro) - 11044 PTGIR Receptor (IP) de Prostaglandi- SEQ ID NOS: 11045 na I2 (prostaciclina) - 11049 PTGS1 Prostaglandina-Endoperóxido SEQ ID NOS: 11050 sintase 1 (prostaglandina G/H - 11058 sintase e ciclooxigenase) PTGS2 Prostaglandina-Endoperóxido SEQ ID NOS: 11059 sintase 2 (prostaglandin G/H - 11060 sintase e ciclooxigenase) PTH Hormônio paratireoide SEQ ID NOS: 11061 - 11062 PTH2 Hormônio 2 paratireoide SEQ ID NO: 11063 PTHLH Hormônio semelhate ao hor- SEQ ID NOS: 11064 mônio paratireoide - 11072 PTK7 Proteína tirosina cinase 7 (ina- SEQ ID NOS: 11073 tiva) - 11088 PTN Pleiotrofina SEQ ID NOS: 11089 - 11090 PTPRA Proteína tirosina fosfatase, tipo SEQ ID NOS: 11091 receptor, A - 11098 PTPRB Proteína tirosina fosfatase, tipo SEQ ID NOS: 11099 receptor B - 11106 PTPRC Proteína tirosina fosfatase, tipo SEQ ID NOS: 11107 receptor, C - 11117 PTPRCAP Proteína tirosina fosfatase, tipo SEQ ID NO: 11118 receptor, proteína associada a
C
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO PTPRD Proteína tirosina fosfatase, tipo SEQ ID NOS: 11119 receptor, D - 11130 PTPRF Proteína tirosina fosfatase, tipo SEQ ID NOS: 11131 receptor, F - 11138 PTPRJ Proteína tirosina fosfatase, tipo SEQ ID NOS: 11139 receptor, J - 11144 PTPRO Proteína tirosina fosfatase, tipo SEQ ID NOS: 11145 receptor, O - 11153 PTPRS Proteína tirosina fosfatase, tipo SEQ ID NOS: 11154 receptor, S - 11161 PTTG1IP proteína de interação transfor- SEQ ID NOS: 11162 mante 1 de tumor da pituitária - 11165 PTX3 Pentraxina 3, longa SEQ ID NO: 11166 PTX4 Pentraxina 4, longa SEQ ID NOS: 11167 - 11169 PVR receptor de poliovirus SEQ ID NOS: 11170 - 11175 PVRL1 1 relacionado com o receptor SEQ ID NOS: 9286 de poliovirus (mediador C de - 9288 entrada do perpesvírus) PXDN Peroxidasina SEQ ID NOS: 11176 - 11180 PXDNL Tipo peroxidasina SEQ ID NOS: 11181 - 11183 PXYLP1 2-fosfoxilose fosfatase 1 SEQ ID NOS: 11184 - 11196 PYY Peptídeo YY SEQ ID NOS: 11197 - 11198 PZP Proteína da zona de gravidez SEQ ID NOS: 11199 - 11200 QPCT Glutaminil-peptídeo ciclotrans- SEQ ID NOS: 11201 ferase - 11203
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO QPRT Quinolinate fosforibosiltransfe- SEQ ID NOS: 11204 rase - 11205 QRFP Peptídeo RFamida Piroglutami- SEQ ID NOS: 11206 lado - 11207 QSOX1 Quiescin Q6 sulfidril oxidase 1 SEQ ID NOS: 11208 - 11211 R3HDML o domínio contendo RH3 tipo SEQ ID NO: 11212 RAB26 RAB26, família oncogene de SEQ ID NOS: 11213 membro RAS - 11216 RAB36 RAB36, família oncogene de SEQ ID NOS: 11217 membro RAS - 11219 RAB9B RAB9B, família oncogene de SEQ ID NO: 11220 membro RAS RAET1E transcrição 1E precoce de áci- SEQ ID NOS: 11221 do retinoico - 11226 RAET1G transcrição 1G de ácido retinoi- SEQ ID NOS: 11227 co - 11229 RAMP2 Proteína 2 de modificação da SEQ ID NOS: 11230 aticidade de receptor (acoplada - 11234 à proteína G) RAPGEF5 Fator de permute de nucleotí- SEQ ID NOS: 11235 deo de guanina Rap (GEF) 5 - 11241 RARRES1 Respondedor 1 de receptor de SEQ ID NOS: 11242 ácido retinoico (induzido por - 11243 tazaroteno) RARRES2 Respondedor 2 de receptor de SEQ ID NOS: 11244 ácido retinoico (induzidu por - 11247 tazaroteno) RASA2 Ativador 2 de proteína RAS SEQ ID NOS: 11248 p21 - 11250 RBM3 Proteína 3 de Motivo de ligação SEQ ID NOS: 11251 ao RNA (RNP1, RRM) - 11253
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO RBP3 Proteína 3 de ligação ao reti- SEQ ID NO: 11254 nol, intersticial RBP4 Proteína 4 de ligação ao reti- SEQ ID NOS: 11255 nol, plasma - 11258 RCN1 Reticulocalbina 1, domínio de SEQ ID NOS: 11259 ligação ao cálcio mão EF - 11262 RCN2 Reticulocalbina 2, domínio de SEQ ID NOS: 11263 ligação ao cálcio mão EF - 11266 RCN3 Reticulocalbina 3, domínio de SEQ ID NOS: 11267 ligação ao cálcio mão EF - 11270 RCOR1 Corepressor de REST SEQ ID NOS: 11271 - 11272 RDH11 Retinol desidrogenase 11 (to- SEQ ID NOS: 11273 talmente-trans/9-cis/11-cis) - 11280 RDH12 Retinol desidrogenase 12 (to- SEQ ID NOS: 11281 talmente-trans/9-cis/11-cis) - 11282 RDH13 Retinol desidrogenase 13 (to- SEQ ID NOS: 11283 talmente-trans/9-cis) - 11291 RDH5 Retinol desidrogenase 5 (11- SEQ ID NOS: 11292 cis/9-cis) - 11296 RDH8 Retinol desidrogenase 8 (to- SEQ ID NOS: 11297 talmente-trans) - 11298 REG1A alfa 1 derivada das ilhotas de SEQ ID NO: 11299 regeneração REG1B beta 1 derivada das ilhotas de SEQ ID NOS: 11300 regeneração - 11301 REG3A alfa 3 das ilhotas de regenera- SEQ ID NOS: 11302 ção - 11304 REG3G gama 3 derivada das ilhotas de SEQ ID NOS: 11305 regeneração - 11307 REG4 família derivadas das ilhotas de SEQ ID NOS: 11308 regeneração, membro 4 - 11311
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO RELN Reelina SEQ ID NOS: 11312 - 11315 RELT Receptor de fator de necrose SEQ ID NOS: 11316 de tumor RELT - 11319 REN Renina SEQ ID NOS: 11320 - 11321 REPIN1 Iniciador 1 de replicação SEQ ID NOS: 11322 - 11335 REPS2 2 contendo domínio Eps asso- SEQ ID NOS: 11336 ciado a RALBP1 - 11337 RET proto-oncogene Ret SEQ ID NOS: 11338 - 11343 RETN Resistina SEQ ID NOS: 11344 - 11346 RETNLB beta tipo resistina SEQ ID NO: 11347 RETSAT Retinol saturase (totalmente- SEQ ID NOS: 11348 trans-retinol 13,14-redutase) - 11352 RFNG RFNG O-fucosilpeptídeo 3- SEQ ID NOS: 11353 beta-N- - 11355 acetilglucosaminiltransferase RGCC Regulator de ciclo cellular SEQ ID NO: 11356 RGL4 4 tipo estimulador de dissocia- SEQ ID NOS: 11357 ção de nucleotídeo de guanine - 11363 Ral RGMA membro a da família de molé- SEQ ID NOS: 11364 cula de orientação repulsive - 11373 RGMB Membro b da família de molé- SEQ ID NOS: 11374 cula repulsica - 11375 RHOQ Membro Q da família homóloga SEQ ID NOS: 11376 de Ras - 11380 RIC3 chaperona de receptor de ace- SEQ ID NOS: 11381 tilcolina RIC3 - 11388
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO RIMS1 exocitose 1 de membrana siná- SEQ ID NOS: 11393 tica de regulação - 11408 RIPPLY1 Repressor 1 transcricional SEQ ID NOS: 11409 Ripply - 11410 RLN1 Relaxina 1 SEQ ID NO: 11411 RLN2 Relaxina 2 SEQ ID NOS: 11412 - 11413 RLN3 Relaxina 3 SEQ ID NOS: 11414 - 11415 RMDN1 Regulator de 1 de dinâmicas SEQ ID NOS: 11416 de microtúbulo - 11429 RNASE1 Ribonuclease, família de SEQ ID NOS: 11430 RNase A, 1 (pancreática) - 11434 RNASE10 Ribonuclease, família RNase SEQ ID NOS: 11435 A, 10 (não ativa) - 11436 RNASE11 Ribonuclease, família RNase SEQ ID NOS: 11437 A, 11 (não ativa) - 11447 RNASE12 Ribonuclease, família RNase SEQ ID NO: 11448 A, 12 (não ativa) RNASE13 Ribonuclease, família RNase SEQ ID NO: 11449 A, 13 (não ativa) RNASE2 Ribonuclease, família RNase SEQ ID NO: 11450 A, 2 (fígado, neurotoxina deri- vada de eosinófilo) RNASE3 Ribonuclease, família RNase SEQ ID NO: 11451 A, 3 RNASE4 Ribonuclease, família RNase SEQ ID NOS: 11452 A, 4 - 11454 RNASE6 Ribonuclease, família RNase SEQ ID NO: 11455 A, k6 RNASE7 Ribonuclease, família RNase SEQ ID NOS: 11456 A, 7 - 11457
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO RNASE8 Ribonuclease, família RNase SEQ ID NO: 11458 A, 8 RNASE9 Ribonuclease, família RNase SEQ ID NOS: 11459 A, 9 (não ativa) - 11469 RNASEH1 Ribonuclease H1 SEQ ID NOS: 11470 - 11472 RNASET2 Ribonuclease T2 SEQ ID NOS: 11473 - 11480 RNF146 Proteína dedo de anel 146 SEQ ID NOS: 11481 - 11492 RNF148 Proteína dedo de anel 148 SEQ ID NOS: 11493 - 11494 RNF150 Proteína dedo de anel 150 SEQ ID NOS: 11495 - 11499 RNF167 Proteína dedo de anel 167 SEQ ID NOS: 11500 - 11510 RNF220 Proteína dedo de anel 220 SEQ ID NOS: 11511 - 11517 RNF34 Proteína dedo de anel 34, E3 SEQ ID NOS: 11518 ubiquitin proteína ligase - 11525 RNLS Renalase, amina oxidase de- SEQ ID NOS: 11526 pendente de FAD - 11528 RNPEP ArginIl aminopeptidase (amino- SEQ ID NOS: 11529 peptidase B) - 11534 ROR1 receptor 1 órgão tipo tirosina SEQ ID NOS: 11535 cinase receptorA - 11537 RP11- SEQ ID NO: 4158 1236K1.1 RP11-14J7.7 SEQ ID NOS: 674 – 675 RP11- SEQ ID NOS: 85 - 196G11.1 87
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO RP11- SEQ ID NO: 683 350O14.18 RP11- SEQ ID NO: 8194 520P18.5 RP11- SEQ ID NO: 89 812E19.9 RP11- SEQ ID NO: 676 903H12.5 RP11- SEQ ID NOS: 78 - 977G19.10 80 RP4- SEQ ID NOS: 670 – 576H24.4 672 RP4- Relacionado ao fator H de SEQ ID NO: 1649 608O15.3 complemento proteína 2 RPL3 Proteína L3 ribossômica SEQ ID NOS: 11538 - 11543 RPLP2 Proferína ribossômica, grande, SEQ ID NOS: 11544 P2 - 11546 RPN2 Riboforina II SEQ ID NOS: 11547 - 11553 RPS27L Tipo proteína S27 ribossômica SEQ ID NOS: 11554 - 11559 RQCD1 RCD1 requerico para homólo- SEQ ID NOS: 3100 go de diferenciação celular (S. – 3106 pombe) RS1 Retinosquisina 1 SEQ ID NO: 11560 RSF1 Fator 1 de remodelagem e es- SEQ ID NOS: 11561 paçamento - 11567 RSPO1 R-espondina 1 SEQ ID NOS: 11568 - 11571 RSPO2 R-espondina 2 SEQ ID NOS: 11572 - 11579
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO RSPO3 R-espondina 3 SEQ ID NOS: 11580 - 11581 RSPO4 R-espondina 4 SEQ ID NOS: 11582 - 11583 RSPRY1 1 contendo domínio dedo de SEQ ID NOS: 11584 ael e SPRY - 11590 RTBDN Retbindina SEQ ID NOS: 11591 - 11603 RTN4RL1 1 tipo receptor reticulon 4 SEQ ID NO: 11604 RTN4RL2 2 tipo receptor reticulon 4 SEQ ID NOS: 11605 - 11607 SAA1 Amiloide A2 de soro SEQ ID NOS: 11608 - 11610 SAA2 Amiloide A2 de soro SEQ ID NOS: 11611 - 11616 SAA4 Amiloide A4 de soro, constituti- SEQ ID NO: 11617 ve SAP30 Proteína associada a Sin3A, SEQ ID NO: 11618 30kDa SAR1A GTPase 1A relacionada a Ras, SEQ ID NOS: 11619 associada à secreção - 11625 SARAF fator regulador associado à en- SEQ ID NOS: 11626 trada de cálcio operada por - 11636 armazenamento SARM1 alfa estéril e Motivo TIR con- SEQ ID NOS: 11637 tendo 1 - 11640 SATB1 Homeocaixa 1 SATB SEQ ID NOS: 11641 - 11653 SAXO2 Estabilizador de microtubules 2 SEQ ID NOS: 11654 axonemais - 11658 SBSN Suprabasina SEQ ID NOS: 11659 - 11661
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO SBSPON Somatomedina B e trombos- SEQ ID NO: 11662 pondina, contend domínio tipo 1 SCARF1 Receptor recuperador classe F, SEQ ID NOS: 11663 membro 1 - 11667 SCG2 Secretogranina II SEQ ID NOS: 11668 - 11670 SCG3 Secretogranina III SEQ ID NOS: 11671 - 11673 SCG5 Secretogranina V SEQ ID NOS: 11674 - 11678 SCGB1A1 Secretoglobina, família 1A, SEQ ID NOS: 11679 membro 1 (uteroglobin) - 11680 SCGB1C1 Secretoglobina, família 1C, SEQ ID NO: 11681 membro 1 SCGB1C2 Secretoglobina, família 1C, SEQ ID NO: 11682 membro 2 SCGB1D1 Secretoglobina, família 1D, SEQ ID NO: 11683 membro 1 SCGB1D2 Secretoglobina, família 1D, SEQ ID NO: 11684 membro 2 SCGB1D4 Secretoglobina, família 1D, SEQ ID NO: 11685 membro 4 SCGB2A1 Secretoglobina, família 2A, SEQ ID NO: 11686 membro 1 SCGB2A2 Secretoglobina, família 2A, SEQ ID NOS: 11687 membro 2 - 11688 SCGB2B2 Secretoglobina, família 2B, SEQ ID NOS: 11689 membro 2 - 11690 SCGB3A1 Secretoglobina, família 3A, SEQ ID NO: 11691 membro 1 SCGB3A2 Secretoglobina, família 3A, SEQ ID NOS: 11692 membro 2 - 11693
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO SCN1B Canal de cálcio, fechado por SEQ ID NOS: 11694 voltagem, tipo I subunidade be- - 11699 ta SCN3B Canal de sódio, fechado por SEQ ID NOS: 11700 voltagem, tipo III subunidade - 11704 beta SCPEP1 Serina carboxipeptidase 1 SEQ ID NOS: 11705 - 11712 SCRG1 Estimulador de condrogênese SEQ ID NOS: 11713 1 - 11714 SCT Secretina SEQ ID NO: 11715 SCUBE1 Peptídeo sinal, domínio CUB, SEQ ID NOS: 11716 EGF - tipo 1 - 11719 SCUBE2 Peptídeo sinal, domínio CUB, SEQ ID NOS: 11720 EGF-tipo 2 - 11726 SCUBE3 Peptídeo sinal, domínio CUB, SEQ ID NO: 11727 EGF-tipo 3 SDC1 Sindecan 1 SEQ ID NOS: 11728 - 11732 SDF2 Fator 2 derivado de célula es- SEQ ID NOS: 11733 tromal - 11735 SDF2L1 Fator 2 derivado de célula es- SEQ ID NO: 11736 tromal - tipo 1 SDF4 Fator 4 derivado de célula es- SEQ ID NOS: 11737 tromal - 11740 SDHAF2 Fator 4 de montage de com- SEQ ID NOS: 11741 plexo de succinato desidroge- - 11748 nase SDHAF4 Fator 4 de montage de com- SEQ ID NO: 11749 plexo de succinato desidroge- nase
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO SDHB Complexo de succinato desi- SEQ ID NOS: 11750 drogenase, subunidade B, en- - 11752 xofre de ferro (Ip) SDHD Complexo de succinato desi- SEQ ID NOS: 11753 drogenase, subunidade D, pro- - 11762 teína de membrana integral SEC14L3 ligação 3 a lipídeo tipo SEC14 SEQ ID NOS: 11763 - 11769 SEC16A Homólogo A de SEC16, fator SEQ ID NOS: 11770 de exportação de retículo en- - 11776 doplásmico SEC16B Homólogo B de SEC16, fator SEQ ID NOS: 11777 de exportação de retículo en- - 11780 doplásmico SEC22C Homólogo C de SEC22, proteí- SEQ ID NOS: 11781 na de tráfico de vesícula - 11793 SEC31A Homólogo A de SEC31, com- SEQ ID NOS: 11794 ponente de complexo de reves- - 11823 timento COPII SECISBP2 Proteína 2 de ligação a SECIS SEQ ID NOS: 11824 - 11828 SECTM1 Secretada e transmembrana 1 SEQ ID NOS: 11829 - 11836 SEL1L Sel-1 supressor de lin-12-tipo SEQ ID NOS: 11837 (C. elegans) - 11839 SELM Selenoproteína M SEQ ID NOS: 11847 - 11849 SELO Selenoproteína O SEQ ID NOS: 11854 - 11855 SEMA3A Domínio Sema, domínio de SEQ ID NOS: 11862 imunoglobulina (Ig), domínio - 11866 básico curto, Secretada, (se- maforina) 3A
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO SEMA3B Domínio Sema, domínio de SEQ ID NOS: 11867 imunoglobulina (Ig), domínio - 11873 básico curto, Secretada, (se- maforina) 3B SEMA3C Domínio Sema, domínio de SEQ ID NOS: 11874 imunoglobulina (Ig), domínio - 11878 básico curto, Secretada, (se- maforina) 3C SEMA3E Domínio Sema, domínio de SEQ ID NOS: 11879 imunoglobulina (Ig), domínio - 11883 básico curto, Secretada, (se- maforina) 3E SEMA3F Domínio Sema, domínio de SEQ ID NOS: 11884 imunoglobulina (Ig), domínio - 11890 básico curto, Secretada, (se- maforina) 3F SEMA3G Domínio Sema, domínio de SEQ ID NOS: 11891 imunoglobulina (Ig), domínio - 11893 básico curto, Secretada, (se- maforina) 3G SEMA4A Domínio Sema, domínio de SEQ ID NOS: 11894 imunoglobulina (Ig), domínio de - 11902 transmembrana (TM) e domínio citoplásmico curto, (semafori- na) 4A SEMA4B Domínio Sema, domínio de SEQ ID NOS: 11903 imunoglobulina (Ig), domínio de - 11913 transmembrana (TM) e domínio citoplásmico curto, (semafori- na) 4B
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO SEMA4C Domínio Sema, domínio de SEQ ID NOS: 11914 imunoglobulina (Ig), domínio de - 11916 transmembrana (TM) e domínio citoplásmico curto, (semafori- na) 4C SEMA4D Domínio Sema, domínio de SEQ ID NOS: 11917 imunoglobulina (Ig), domínio de - 11930 transmembrana (TM) e domínio citoplásmico curto, (semafori- na) 4D SEMA4F Domínio Sema, domínio de SEQ ID NOS: 11931 imunoglobulina (Ig), domínio de - 11939 transmembrana (TM) e domínio citoplásmico curto, (semafori- na) 4F SEMA4G Domínio Sema, domínio de SEQ ID NOS: 11940 imunoglobulina (Ig), domínio de - 11947 transmembrana (TM) e domínio citoplásmico curto, (semafori- na) 4G SEMA5A Domínio Sema, sete repetições SEQ ID NOS: 11948 de trombospondina (tipo 1 e - 11949 similar a tipo 1), domínio de transmembrana (TM) e domínio citoplásmico curto, (semafori- na) 5A SEMA6A Domínio Sema, domínio de SEQ ID NOS: 11950 transmembrana (TM), e domí- - 11957 nio citoplásmico, (semaforina) 6A SEMA6C Domínio Sema, domínio de SEQ ID NOS: 11958 transmembrana (TM), e domí- - 11963 nio citoplásmico, (semaforina) 6C
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO SEMA6D Domínio Sema, domínio de SEQ ID NOS: 11964 transmembrana (TM), e domí- - 11977 nio citoplásmico, (semaforina) 6D SEMG1 Semenogelina I SEQ ID NO: 11978 SEMG2 Semenogelina II SEQ ID NO: 11979 SEPN1 Selenoproteína N, 1 SEQ ID NOS: 11850 - 11853 SEPP1 Selenoproteína P, plasma, 1 SEQ ID NOS: 11856 - 11861 SEPT15 Selenoproteía 15 kDa SEQ ID NOS: 11840 - 11846 SEPT9 Septina 9 SEQ ID NOS: 11980 - 12016 SERPINA1 Inibidor de serpina peptidase, SEQ ID NOS: 12017 clade A (alfa-1 antiproteinase, - 12033 antitripsina), membro 1 SERPINA10 Inibidor de serpina peptidase, SEQ ID NOS: 12034 clade A (alfa-1 antiproteinase, - 12037 antitripsina), membro 10 SERPINA11 Inibidor de serpina peptidase, SEQ ID NO: 12038 clade A (alfa-1 antiproteinase, antitripsina), membro 11 SERPINA12 Inibidor de serpina peptidase, SEQ ID NOS: 12039 clade A (alfa-1 antiproteinase, - 12040 antitripsina), membro 12 SERPINA3 Inibidor de serpina peptidase, SEQ ID NOS: 673 - clade A (alfa-1 antiproteinase, 12047 antitripsina), membro 3 SERPINA4 Inibidor de serpina peptidase, SEQ ID NOS: 12048 clade A (alfa-1 antiproteinase, - 12050 antitripsina), membro 4
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO SERPINA5 Inibidor de serpina peptidase, SEQ ID NOS: 12051 clade A (alfa-1 antiproteinase, - 12062 antitripsina), membro 5 SERPINA6 Inibidor de serpina peptidase, SEQ ID NOS: 12063 clade A (alfa-1 antiproteinase, - 12065 antitripsina), membro 6 SERPINA7 Inibidor de serpina peptidase, SEQ ID NOS: 12066 clade A (alfa-1 antiproteinase, - 12067 antitripsina), membro 7 SERPINA9 Inibidor de serpina peptidase, SEQ ID NOS: 12068 clade A (alfa-1 antiproteinase, - 12074 antitripsina), membro 9 SERPINB2 Inibidor de serpina peptidase, SEQ ID NOS: 12075 clade B (ovalbumina), membro - 12079 2 SERPINC1 Inibidor de serpina peptidase, SEQ ID NOS: 12080 clade C (antitrombina), membro - 12081 1 SERPIND1 Inibidor de serpina peptidase, SEQ ID NOS: 12082 clade D (cofator de heparina), - 12083 membro 1 SERPINE1 Inibidor de serpina peptidase, SEQ ID NO: 12084 clade E (nexina, inibidor de ati- vador de plasminogênio tipo 1), membro 1 SERPINE2 Inibidor de serpina peptidase, SEQ ID NOS: 12085 clade E (nexina, inibidor de ati- - 12091 vador de plasminogênio tipo 1), membro 2 SERPINE3 Inibidor de serpina peptidase, SEQ ID NOS: 12092 clade E (nexina, inibidor de ati- - 12095 vador de plasminogênio tipo 1), membro 3
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO SERPINF1 Inibidor de serpina peptidase, SEQ ID NOS: 12096 clade F (alfa-2 antiplasmina, fa- - 12104 tor derivado de epitélio de pig- mento), membro 1 SERPINF2 Inibidor de serpina peptidase, SEQ ID NOS: 12105 clade F (alfa-2 antiplasmina, fa- - 12109 tor derivado de epitélio de pig- mento), membro 2 SERPING1 Inibidor de serpina peptidase, SEQ ID NOS: 12110 clade G (inibidor C1), membro - 12120 1 SERPINH1 Inibidor de serpina peptidase, SEQ ID NOS: 12121 clade H (proteína de choque - 12135 térmico 47), membro 1, (proteí- na 1 de ligação ao colágeno) SERPINI1 Inibidor de serpina peptidase, SEQ ID NOS: 12136 clade I (neuroserpina), membro - 12140 1 SERPINI2 Inibidor de serpina peptidase, SEQ ID NOS: 12141 clade I (pancpin), membro 2 - 12147 SETD8 contendo domínio SET (lisina SEQ ID NOS: 7589 metiltransferase) 8 - 7592 SEZ6L2 homólogo 6 relacionado à con- SEQ ID NOS: 12148 vulsão (Camundongo) tipo 2 - 12154 SFRP1 Proteína 1 relacionada a frisa- SEQ ID NOS: 12155 mento secretada - 12156 SFRP2 Proteína 2 relacionada a frisa- SEQ ID NO: 12157 mento secretada SFRP4 Proteína 4 relacionada a frisa- SEQ ID NOS: 12158 mento secretada - 12159 SFRP5 Proteína 5 relacionada a frisa- SEQ ID NO: 12160 mento secretada SFTA2 2 associado a tensoativo SEQ ID NOS: 12161 - 12162
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO SFTPA1 Proteína tensoativa A1 SEQ ID NOS: 12163 - 12167 SFTPA2 Proteína tensoativa A2 SEQ ID NOS: 12168 - 12172 SFTPB Proteína tensoativa B SEQ ID NOS: 12173 - 12177 SFTPD Proteína tensoativa D SEQ ID NOS: 12178 - 12179 SFXN5 Sideroflexina 5 SEQ ID NOS: 12180 - 12184 SGCA Sarcoglicano, alfa (glicoproteí- SEQ ID NOS: 12185 na associada à distrofina - 12192 50kDa) SGSH N-sulfoglucosamina sulfo- SEQ ID NOS: 12193 hidrolase - 12201 SH3RF3 Dedo de anel 3 contendo do- SEQ ID NO: 12202 mínio SH3 SHBG Globulina de ligação ao hor- SEQ ID NOS: 12203 mônio de sexo - 12221 SHE domínio de homologia 2 Src SEQ ID NOS: 12222 contendo E - 12224 SHH Ouriço sônico SEQ ID NOS: 12225 - 12228 SHKBP1 Proteína 1 de ligação a SEQ ID NOS: 12229 SH3KBP1 - 12244 SIAE Acetilesterase de ácido siálico SEQ ID NOS: 12245 - 12247 SIDT2 Família de transmembrana SEQ ID NOS: 12248 SID1, membro 2 - 12257 SIGLEC10 Lectina 10 semelhate a Ig de SEQ ID NOS: 12258 ligação ao ácido siálico - 12266 SIGLEC6 Lectina 6 semelhate a Ig de li- SEQ ID NOS: 12267 gação ao ácido siálico - 12272
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO SIGLEC7 Lectina 7 semelhate a Ig de li- SEQ ID NOS: 12273 gação ao ácido siálico - 12277 SIGLECL1 Família SIGLEC tipo 1 SEQ ID NOS: 12278 - 12283 SIGMAR1 Receptor 1 intracelular Sigma SEQ ID NOS: 12284 não opioide - 12287 SIL1 Fator de permute de nucleotí- SEQ ID NOS: 12288 deo SIL1 - 12296 SIRPB1 Proteína beta 1 regulatória de SEQ ID NOS: 12297 sinal - 12309 SIRPD Proteína delta regulatória de SEQ ID NOS: 12310 sinal - 12312 SLAMF1 Membro 1 da família de molé- SEQ ID NOS: 12313 cula de ativação lifocítica de si- - 12315 nalização SLAMF7 SLAM família membro 7 SEQ ID NOS: 12316 - 12324 SLC10A3 Família 10 transportadora de SEQ ID NOS: 12325 soluto, membro 3 - 12329 SLC15A3 Família 15 transportadora de SEQ ID NOS: 12330 soluto (transportadora de oli- - 12335 gopeptídeo), membro 3 SLC25A14 Família 25 transportadora de SEQ ID NOS: 12336 soluto (transportadora mito- - 12342 condrial, cérebro), membro 14 SLC25A25 Família 25 transportadora de SEQ ID NOS: 12343 soluto (transportador mitocon- - 12349 drial; transportadora de fosfa- to), membro 25 SLC2A5 Família 2 transportadora de so- SEQ ID NOS: 12350 luto (Transportadora de glico- - 12358 se/fructose facilitada), membro 5
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO SLC35E3 Família 35 transportadora de SEQ ID NOS: 12359 soluto, membro E3 - 12360 SLC39A10 Família 39 transportadora de SEQ ID NOS: 12361 soluto (zinc transporter), mem- - 12367 bro 10 SLC39A14 Família 39 transportadora de SEQ ID NOS: 12368 soluto (transportadora de zin- - 12378 co), membro 14 SLC39A4 Família 39 transportadora de SEQ ID NOS: 12379 soluto (transportadora de zin- - 12381 co), membro 4 SLC39A5 Família 39 transportadora de SEQ ID NOS: 12382 soluto (transportadora de zin- - 12388 co), membro 5 SLC3A1 Família 39 transportadora de SEQ ID NOS: 12389 soluto (cadeia pesada transpor- - 12398 tadora de aminoácido), mem- bro 1 SLC51A Família 51 transportadora de SEQ ID NOS: 12399 soluto, subunidade alfa - 12403 SLC52A2 Família 52 transportadora de SEQ ID NOS: 12404 soluto (transportadora de ribo- - 12414 flavina), membro 2 SLC5A6 Família 5 transportadora de so- SEQ ID NOS: 12415 luto (cotransportadora de só- - 12425 dio/multivitamina e iodeto), membro 6 SLC6A9 Família 6 transportadora de so- SEQ ID NOS: 12426 luto (transportadora de neuro- - 12433 transmissor, glicina), membro 9 SLC8A1 Família 8 transportadora de so- SEQ ID NOS: 12434 luto (permutadora de só- - 12445 dio/cálcio), membro 1
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO SLC8B1 Família 8 transportadora de so- SEQ ID NOS: 12446 luto (permutadora de só- - 12456 dio/lítio/cálcio), membro B1 SLC9A6 Família transportadora de solu- SEQ ID NOS: 12457 to 9, subfamília A (NHE6, - 12468 transportador 6 de proton de cation), membro 6 SLCO1A2 Família transportadora de SEQ ID NOS: 12469 ânion orgânico transportador - 12481 soluto, membro 1A2 SLIT1 Ligante 1 de orientação de di- SEQ ID NOS: 12482 visão - 12485 SLIT2 Ligante 2 de orientação de di- SEQ ID NOS: 12486 visão - 12494 SLIT3 Ligante 3 de orientação de di- SEQ ID NOS: 12495 visão - 12497 SLITRK3 Família tipo SLIT e NTRK, SEQ ID NOS: 12498 membro 3 - 12500 SLPI Inibidor de peptidase de leucó- SEQ ID NO: 12501 cito secretória SLTM Modulador de transcrição, tipo SEQ ID NOS: 12502 SAFB - 12515 SLURP1 domínio LY6/PLAUR secretado SEQ ID NO: 12516 contendo 1 SMARCA2 Regulador dependente de acti- SEQ ID NOS: 12517 na, associado à matriz, relacio- - 12562 nado com SWI/SNF de croma- tina, subfamília a, membro 2 SMG6 Fator de decadêcia de mRNa SEQ ID NOS: 12563 mediado por não senso SMG6 - 12574 SMIM7 Proteína 7 de membrana inte- SEQ ID NOS: 12575 gral pequena - 12591 SMOC1 ligação 1 a cálcio modular rela- SEQ ID NOS: 12592 cionado com SPARC - 12593
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO SMOC2 ligação 2 a cálcio modular rela- SEQ ID NOS: 12594 cionado com SPARC - 12598 SMPDL3A Esfingomielina fosfodiesterase, SEQ ID NOS: 12599 3A tipo ácido - 12600 SMPDL3B Esfingomielina fosfodiesterase, SEQ ID NOS: 12601 2B tipo ácido - 12605 SMR3A Proteína 3A regulada por adro- SEQ ID NO: 12606 gênio da glândula submaxilar SMR3B Proteína 3B regulada por an- SEQ ID NOS: 12607 drogênio da glândula submaxi- - 12609 lar SNED1 1 de domínios semelhantes a SEQ ID NOS: 12610 Sushi, nidogênio e EGF - 12616 SNTB1 Sintrofina, beta 1 (protein A1 SEQ ID NOS: 12617 associada à distrofina, 59 kDa, - 12619 componente 1 básico) SNTB2 Sintrofina, beta 2 (proteína A1 SEQ ID NOS: 12620 associada à distrofina, 59 kDa, - 12624 componente 2 básico) SNX14 Nexina 14 de classificação SEQ ID NOS: 12625 - 12636 SOD3 Superóxido dismutase 3, extra- SEQ ID NOS: 12637 celular - 12638 SOST Esclerostina SEQ ID NO: 12639 SOSTDC1 domínio de esclerotina conten- SEQ ID NOS: 12640 do 1 - 12641 SOWAHA Membro A da família de domí- SEQ ID NO: 12642 nio de repetição de acirina So- sondowah SPACA3 acrossoma de esperma asso- SEQ ID NOS: 12643 ciado 3 - 12645 SPACA4 acrossoma de esperma asso- SEQ ID NO: 12646 ciado 4
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO SPACA5 acrossoma de esperma asso- SEQ ID NOS: 12647 ciado 5 - 12648 SPACA5B acrossoma de esperma asso- SEQ ID NO: 12649 ciado 5B SPACA7 acrossoma de esperma asso- SEQ ID NOS: 12650 ciado 7 - 12653 SPAG11A Antígeno esperma associado SEQ ID NOS: 12654 11A - 12662 SPAG11B Antígeno esperma associado SEQ ID NOS: 12663 11B - 12671 SPARC Proteína secretada, acídica, ri- SEQ ID NOS: 12672 ca em cisteína (osteonectina) - 12676 SPARCL1 1 tipo SPARC (hevina) SEQ ID NOS: 12677 - 12686 SPATA20 a espermatogênese 20 associ- SEQ ID NOS: 12687 ado - 12700 SPESP1 Proteína 1 de segmento equa- SEQ ID NO: 12701 torial de esperma SPINK1 Inibidor de serina peptidase, SEQ ID NOS: 12702 Kazal tipo 1 - 12703 SPINK13 Inibidor de serina peptidase, SEQ ID NOS: 12704 Kazal tipo 13 (putativo) - 12706 SPINK14 Inibidor de serina peptidase, SEQ ID NOS: 12707 Kazal tipo 14 (putativo) - 12708 SPINK2 Inibidor de serina peptidase, SEQ ID NOS: 12709 Kazal tipo 2 (inibidor de acrosi- - 12714 na-tripsina) SPINK4 Inibidor de serina peptidase, SEQ ID NOS: 12715 Kazal tipo 4 - 12716 SPINK5 Inibidor de serina peptidase, SEQ ID NOS: 12717 Kazal tipo 5 - 12722 SPINK6 Inibidor de serina peptidase, SEQ ID NOS: 12723 Kazal tipo 6 - 12725
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO SPINK7 Inibidor de serina peptidase, SEQ ID NOS: 12726 Kazal tipo 7 (putativo) - 12727 SPINK8 Inibidor de serina peptidase, SEQ ID NO: 12728 Kazal tipo 8 (putativo) SPINK9 Inibidor de serina peptidase, SEQ ID NOS: 12729 Kazal tipo 9 - 12730 SPINT1 Inibidor de serina peptidase, SEQ ID NOS: 12731 Kunitz tipo 1 - 12738 SPINT2 Inibidor de serina peptidase, SEQ ID NOS: 12739 Kunitz tipo, 2 - 12746 SPINT3 Inibidor de serina peptidase, SEQ ID NO: 12747 Kunitz tipo, 3 SPINT4 Inibidor de serina peptidase, SEQ ID NO: 12748 Kunitz tipo 4 SPOCK1 Sparc/osteonectina, proteogli- SEQ ID NOS: 12749 cano de domínios do tipo cwcv - 12752 e kazal (testican) 1 SPOCK2 Sparc/osteonectina, proteogli- SEQ ID NOS: 12753 cano de domínios do tipo cwcv - 12756 e kazal (testican) 2 SPOCK3 Sparc/osteonectina, proteogli- SEQ ID NOS: 12757 cano de domínios do tipo cwcv - 12782 e kazal (testican) 3 SPON1 Espodina 1, proteína matriz ex- SEQ ID NO: 12783 tracelular SPON2 Espodina 2, proteína matriz ex- SEQ ID NOS: 12784 tracelular - 12793 SPP1 Fosfoproteína 1 secretada SEQ ID NOS: 12794 - 12798 SPP2 Secretada fosfoproteína 2 se- SEQ ID NOS: 12799 cretada, 24kDa - 12801 SPRN Shadow de homólogo de prote- SEQ ID NO: 12802 ína de priônio (peixe-zebra)
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO SPRYD3 domínio SPRY contendo 3 SEQ ID NOS: 12803 - 12806 SPRYD4 domínio SPRY contendo 4 SEQ ID NO: 12807 SPTY2D1- RNA1 antissenso SPTY2D1 SEQ ID NOS: 12808 AS1 - 12813 SPX Hormônio Spexin SEQ ID NOS: 12814 - 12815 SRGN Serglicina SEQ ID NO: 12816 SRL Sarcalumenina SEQ ID NOS: 12817 - 12819 SRP14 Partícula de reconhecimento SEQ ID NOS: 12820 de signal 14kDa (proteína de - 12823 ligação a Alu RNA homóloga) SRPX Proteína contendo repetição SEQ ID NOS: 12824 Sushi, ligada a X - 12827 SRPX2 Proteína contendo repetição SEQ ID NOS: 12828 Sushi, 2 ligado a X - 12831 SSC4D Família rica em cisteína recep- SEQ ID NO: 12832 tora de recuperador, 4 domí- nios SSC5D Família rica em cisteína recep- SEQ ID NOS: 12833 tora de recuperador, 5 domí- - 12836 nios SSPO SCO-espondina SEQ ID NO: 12837 SSR2 Receptor de sequência sinal, SEQ ID NOS: 12838 beta (proteína beta associada a - 12847 translocon) SST Somatoestatina SEQ ID NO: 12848 ST3GAL1 ST3 beta-galactosídeo alfa-2,3- SEQ ID NOS: 12849 sialiltransferase 1 - 12856 ST3GAL4 ST3 beta-galactosídeo alfa-2,3- SEQ ID NOS: 12857 sialiltransferase 4 - 12872
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO ST6GAL1 ST6 beta-galactosamide alfa- SEQ ID NOS: 12873 2,6-sialiltranferase 1 - 12888 ST6GALNAC2 ST6 (alfa-N-acetil-neuraminil- SEQ ID NOS: 12889 2,3-beta-galactosil-1,3)-N- - 12893 acetilgalactosaminida alfa-2,6- sialiltransferase 2 ST6GALNAC5 ST6 (alfa-N-acetil-neuraminil- SEQ ID NOS: 12894 2,3-beta-galactosil-1,3)-N- - 12895 acetilgalactosaminida alfa-2,6- sialiltransferase 5 ST6GALNAC6 ST6 (alfa-N-acetil-neuraminil- SEQ ID NOS: 12896 2,3-beta-galactosil-1,3)-N- - 12903 acetilgalactosaminida alfa-2,6- sialiltransferase 6 ST8SIA2 ST8 alfa-N-acetil-neuraminida SEQ ID NOS: 12904 alfa-2,8-sialiltransferase 2 - 12906 ST8SIA4 ST8 alfa-N-acetil-neuraminida SEQ ID NOS: 12907 alfa-2,8-sialiltransferase 4 - 12909 ST8SIA6 ST8 alfa-N-acetil-neuraminida SEQ ID NOS: 12910 alfa-2,8-sialiltransferase 6 - 12911 STARD7 7 contendo o domínio de trans- SEQ ID NOS: 12912 ferência de lipídeo relacionada - 12913 com StAR (START) STATH Estaterina SEQ ID NOS: 12914 - 12916 STC1 Estaniocalcina 1 SEQ ID NOS: 12917 - 12918 STC2 Estaniocalcina 2 SEQ ID NOS: 12919 - 12921 STMND1 1 contendo o domínio de Sta- SEQ ID NOS: 12922 thmin - 12923 STOML2 2 similar à estomatina (EPB72) SEQ ID NOS: 12926 - 12929
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO STOX1 Caixa 1 Storkhead SEQ ID NOS: 12930 - 12934 STRC Estereocilina SEQ ID NOS: 12935 - 12940 SUCLG1 Succinato-CoA ligase, subuni- SEQ ID NOS: 12941 dade alfa - 12942 SUDS3 Homólogo SDS3, componete SEQ ID NO: 12943 complexo correpressor SIN3A SULF1 Sulfatase 1 SEQ ID NOS: 12944 - 12954 SULF2 Sulfatase 2 SEQ ID NOS: 12955 - 12959 SUMF1 Fator modificador de sulfatase SEQ ID NOS: 12960 1 - 12964 SUMF2 Fator modificador de sulfatase SEQ ID NOS: 12965 2 - 12978 SUSD1 1 contendo domínio Sushi SEQ ID NOS: 12979 - 12984 SUSD5 5 contendo domínio Sushi SEQ ID NOS: 12985 - 12986 SVEP1 Sushi, fator Willebrand tipo A, SEQ ID NOS: 12987 EGF e 1 contendo domínio - 12989 pentraxina SWSAP1 Proteína 1 associada com dedo SEQ ID NO: 12990 de zinco 7 tipo SWIM SYAP1 Proteína 1 associada à sinapse SEQ ID NO: 12991 1 SYCN Sincolina SEQ ID NO: 12992 TAC1 Taquicinina, precursor 1 SEQ ID NOS: 12993 - 12995 TAC3 Taquicinina 3 SEQ ID NOS: 12996 - 13005
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO TAC4 Taquicinina 4 (hemocinina) SEQ ID NOS: 13006 - 13011 TAGLN2 Transgelina 2 SEQ ID NOS: 13012 - 13015 TAPBP Proteína de ligação a TAP (ta- SEQ ID NOS: 13016 pasina) - 13021 TAPBPL Tipo proteína de ligação à TAP SEQ ID NOS: 13022 - 13023 TBL2 2 tipo Transducina (beta) SEQ ID NOS: 13024 - 13036 TBX10 Caixa T 10 SEQ ID NO: 13037 TCF12 Fator de transcrição 12 SEQ ID NOS: 13038 - 13051 TCN1 Transcobalamina I (proteína de SEQ ID NO: 13052 ligação à vitamina B12, família de aglutinanante R) TCN2 Transcobalamina II SEQ ID NOS: 13053 - 13056 TCTN1 Membro 1 da família tectônica SEQ ID NOS: 13057 - 13075 TCTN3 Membro 3 da família tectônica SEQ ID NOS: 13076 - 13080 TDP2 Tirosil-DNA fosfodiesterase 2 SEQ ID NOS: 13081 - 13082 TEK TEK tirosina cinase, endotelial SEQ ID NOS: 13097 - 13101 TEPP Expressa em testículos, prósta- SEQ ID NOS: 13102 ta e placenta - 13103 TEX101 101 expresso em testículos SEQ ID NOS: 13104 - 13105 TEX264 264 expresso em testículos SEQ ID NOS: 13106 - 13117
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO TF Transferrina SEQ ID NOS: 13121 - 13127 TFAM Fator de transcrição A, mito- SEQ ID NOS: 13128 condrial - 13130 TFF1 Fator 1 de trevo SEQ ID NO: 13131 TFF2 fator 2 de trevo SEQ ID NO: 13132 TFF3 Fator 3 de trevo (intestinal) SEQ ID NOS: 13133 - 13135 TFPI Inibidor da via de fator de teci- SEQ ID NOS: 13136 do (Inibidor de coagulação as- - 13145 sociado à lipoproteína) TFPI2 Inibidor 2 da via de fator de te- SEQ ID NOS: 13146 cido - 13147 TG Tiroglobulina SEQ ID NOS: 13148 - 13157 TGFB1 Fator de crescimento transfor- SEQ ID NOS: 13158 mante, beta 1 - 13159 TGFB2 Fator de crescimento transfor- SEQ ID NOS: 13160 mante, beta 2 - 13161 TGFB3 Fator de crescimento transfor- SEQ ID NOS: 13162 mante, beta 3 - 13163 TGFBI Fator de crescimento transfor- SEQ ID NOS: 13164 mante, beta-induzido, 68kDa - 13171 TGFBR1 Fator de crescimento transfor- SEQ ID NOS: 13172 mante, beta receptor 1 - 13181 TGFBR3 Fator de crescimento transfor- SEQ ID NOS: 13182 mante, beta receptor III - 13188 THBS1 Trombospondina 1 SEQ ID NOS: 13189 - 13190 THBS2 Trombospondina 2 SEQ ID NOS: 13191 - 13193 THBS3 Trombospondina 3 SEQ ID NOS: 13194 - 13198
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO THBS4 Trombospondina 4 SEQ ID NOS: 13199 - 13200 THOC3 THO complexo 3 SEQ ID NOS: 13201 - 13210 THPO Trombopoietina SEQ ID NOS: 13211 - 13216 THSD4 Tromboespondina, tipo I, 4 SEQ ID NOS: 13217 contendo domínio - 13220 THY1 Antígeno de superfície de célu- SEQ ID NOS: 13221 la Thy-1 - 13226 TIE1 Tirosina cinase com domínios 1 SEQ ID NOS: 13227 semelhantes à immunoglobuli- - 13228 na e semelhantes ao EGF TIMMDC1 Translocase de 1 contendo SEQ ID NOS: 13229 domínio de mitocondrial interna - 13236 TIMP1 Inibidor 1 de TIMP metalopep- SEQ ID NOS: 13237 tidase - 13241 TIMP2 Inibidor 2 de TIMP metalopep- SEQ ID NOS: 13242 tidase - 13246 TIMP3 Inibidor 3 de TIMP metalopep- SEQ ID NO: 13247 tidase TIMP4 Inibidor 4 de TIMP metalopep- SEQ ID NO: 13248 tidase TINAGL1 antígeno tipo 1 de nefrite tubu- SEQ ID NOS: 13249 lointersticial - 13251 TINF2 Fator nuclear 2 de interação SEQ ID NOS: 13252 com TERF1 (TRF1) - 13261 TLL2 2 tipo toloide SEQ ID NO: 13262 TLR1 receptor 1 tipo Toll SEQ ID NOS: 13263 - 13268 TLR3 receptor 3 tipo Toll SEQ ID NOS: 13269 - 13271
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO TM2D2 domínio TM2 contendo 2 SEQ ID NOS: 13272 - 13277 TM2D3 domínio TM2 contendo 3 SEQ ID NOS: 13278 - 13285 TM7SF3 Transmembrana 7 Superfamília SEQ ID NOS: 13286 membro 3 - 13300 TM9SF1 Transmembrana 9 Superfamília SEQ ID NOS: 13301 membro 1 - 13311 TMCO6 Transmembrana e domínios 6 SEQ ID NOS: 13312 de bobinas - 13319 TMED1 Proteína 1 de tráfico de trans- SEQ ID NOS: 13320 membrana p24 - 13326 TMED2 Proteína 2 de tráfico de trans- SEQ ID NOS: 13327 membrana p24 - 13329 TMED3 Proteína 3 de tráfico de trans- SEQ ID NOS: 13330 membrana p24 - 13333 TMED4 Proteína 4 de tráfico de trans- SEQ ID NOS: 13334 membrana p24 - 13336 TMED5 Proteína 5 de tráfico de trans- SEQ ID NOS: 13337 membrana p24 - 13340 TMED7 Proteína 7 de tráfico de trans- SEQ ID NOS: 13341 membrana p24 - 13342 TMED7- Leitura de TMED7-TICAM2 SEQ ID NOS: 13343 TICAM2 - 13344 TMEM108 Proteína de transmembrana SEQ ID NOS: 13345 108 - 13353 TMEM116 Proteína de transmembrana SEQ ID NOS: 13354 116 - 13365 TMEM119 Proteína de transmembrana SEQ ID NOS: 13366 119 - 13369 TMEM155 Proteína de transmembrana SEQ ID NOS: 13370 155 - 13373
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO TMEM168 Proteína de transmembrana SEQ ID NOS: 13374 168 - 13379 TMEM178A Proteína de transmembrana SEQ ID NOS: 13380 178A - 13381 TMEM179 Proteína de transmembrana SEQ ID NOS: 13382 179 - 13387 TMEM196 Proteína de transmembrana SEQ ID NOS: 13388 196 - 13392 TMEM199 Proteína de transmembrana SEQ ID NOS: 13393 199 - 13396 TMEM205 Proteína de transmembrana SEQ ID NOS: 13397 205 - 13410 TMEM213 Proteína de transmembrana SEQ ID NOS: 13411 213 - 13414 TMEM25 Proteína de transmembrana 25 SEQ ID NOS: 13415 - 13431 TMEM30C Proteína de transmembrana SEQ ID NO: 13432 30C TMEM38B Proteína de transmembrana SEQ ID NOS: 13433 38B - 13437 TMEM44 Proteína de transmembrana 44 SEQ ID NOS: 13438 - 13447 TMEM52 Proteína de transmembrana 52 SEQ ID NOS: 13448 - 13452 TMEM52B Proteína de transmembrana SEQ ID NOS: 13453 52B - 13455 TMEM59 Proteína de transmembrana 59 SEQ ID NOS: 13456 - 13463 TMEM67 Proteína de transmembrana 67 SEQ ID NOS: 13464 - 13475 TMEM70 Proteína de transmembrana 70 SEQ ID NOS: 13476 - 13478
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO TMEM87A Proteína de transmembrana SEQ ID NOS: 13479 87A - 13488 TMEM94 Proteína de transmembrana 94 SEQ ID NOS: 13489 - 13504 TMEM95 Proteína de transmembrana 95 SEQ ID NOS: 13505 - 13507 TMIGD1 1 contendo domínio de trans- SEQ ID NOS: 13508 membrana e imunoglobulina - 13509 TMPRSS12 Transmembrans (C-terminal) SEQ ID NOS: 13510 protease, serina 12 - 13511 TMPRSS5 Transmembrana protease, se- SEQ ID NOS: 13512 rina 5 - 13523 TMUB1 transmembrana e ubiquitina SEQ ID NOS: 13524 contendo domínio tipo 1 - 13530 TMX2 Proteína 2 de transmembrana SEQ ID NOS: 13531 relacionada com a tiorredoxina - 13538 TMX3 Proteína 3 de transmembrana SEQ ID NOS: 13539 relacionada com a tiorredoxina - 13546 TNC Tenascina C SEQ ID NOS: 13547 - 13555 TNFAIP6 Fator de necrose de tumor, SEQ ID NO: 13556 proteína 6 alfa-induzida TNFRSF11A Superfamília de receptor de fa- SEQ ID NOS: 13557 tor de necrose de tumor, mem- - 13561 bro 11a, Ativador de NFKB TNFRSF11B Superfamília de receptor de fa- SEQ ID NOS: 13562 tor de necrose de tumor, mem- - 13563 bro 11b TNFRSF12A Superfamília de receptor de fa- SEQ ID NOS: 13564 tor de necrose de tumor, mem- - 13569 bro 12A
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO TNFRSF14 Superfamília de receptor de fa- SEQ ID NOS: 13570 tor de necrose de tumor, mem- - 13576 bro 14 TNFRSF18 Superfamília de receptor de fa- SEQ ID NOS: 13577 tor de necrose de tumor, mem- - 13580 bro 18 TNFRSF1A Superfamília de receptor de fa- SEQ ID NOS: 13581 tor de necrose de tumor, mem- - 13589 bro 1A TNFRSF1B Superfamília de receptor de fa- SEQ ID NOS: 13590 tor de necrose de tumor, mem- - 13591 bro 1B TNFRSF25 Superfamília de receptor de fa- SEQ ID NOS: 13592 tor de necrose de tumor, mem- - 13603 bro 25 TNFRSF6B Superfamília de receptor de fa- SEQ ID NO: 13604 tor de necrose de tumor, mem- bro 6b, isca TNFSF11 Superfamília de Fator de ne- SEQ ID NOS: 13605 crose de tumor (ligante), mem- - 13609 bro 11 TNFSF12 Superfamília de fator de necro- SEQ ID NOS: 13610 se de tumor (ligante), membro - 13611 12 TNFSF12- Leitura TNFSF12-TNFSF13 SEQ ID NO: 13612 TNFSF13 TNFSF15 Superfamília de fator de necro- SEQ ID NOS: 13613 se de tumor (ligante), membro - 13614 15 TNN Tenascina N SEQ ID NOS: 13615 - 13617 TNR Tenascina R SEQ ID NOS: 13618 - 13620
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO TNXB Tenascina XB SEQ ID NOS: 13621 - 13627 TOMM7 Translocase de homólogo de SEQ ID NOS: 13634 membrana 7 mitocondrial ex- - 13637 terna (levedura) TOP1MT Topoisomerase (DNA) I, mito- SEQ ID NOS: 13638 condrial - 13652 TOR1A Família 1 Torsina, membro A SEQ ID NO: 13653 (torsina A) TOR1B Família 1 Torsina, membro B SEQ ID NOS: 13654 (torsina B) - 13655 TOR2A Família 2 Torsina, membro A SEQ ID NOS: 13656 - 13662 TOR3A Família 3 Torsina, membro A SEQ ID NOS: 13663 - 13667 TPD52 Tumor proteína D52 SEQ ID NOS: 13668 - 13680 TPO Tireoide peroxidase SEQ ID NOS: 13681 - 13691 TPP1 Tripeptidil peptidase I SEQ ID NOS: 13692 - 13709 TPSAB1 Triptase alfa/beta 1 SEQ ID NOS: 13710 - 13712 TPSB2 Triptase beta 2 (ge- SEQ ID NOS: 13713 ne/pseudogene) - 13715 TPSD1 Triptase delta 1 SEQ ID NOS: 13716 - 13717 TPST1 Tirosilproteína sulfotransferase SEQ ID NOS: 13718 1 - 13720 TPST2 Tirosilproteína sulfotransferase SEQ ID NOS: 13721 2 - 13729 TRABD2A 2A contendo domínio TraB SEQ ID NOS: 13730 - 13732
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO TRABD2B 2B contendo domínio TraB SEQ ID NO: 13733 TREH Trehalase (glicoproteína de SEQ ID NOS: 13734 membrana de borda de esco- - 13736 va) TREM1 Receptor de desencadeamento SEQ ID NOS: 13737 expresso em células mieloides - 13740 1 TREM2 Receptor de desencadeamento SEQ ID NOS: 13741 expresso em células mieloides - 13743 2 TRH Hormônio de liberação de tiiro- SEQ ID NOS: 13744 tropina - 13745 TRIM24 24 contendo Motivo de Triparti- SEQ ID NOS: 13746 ta - 13747 TRIM28 28 contendo Motivo de Triparti- SEQ ID NOS: 13748 ta - 13753 TRIO Fator de troca de nucleotídeo SEQ ID NOS: 13754 Trio Rho guanina - 13760 TRNP1 Proteína 1 nuclear regulada por SEQ ID NOS: 13761 TMF1 - 13762 TSC22D4 Família de domínio TSC22, SEQ ID NOS: 13763 membro 4 - 13766 TSHB Hormônio estimulador da tire- SEQ ID NOS: 13767 oide, beta - 13768 TSHR Receptor de hormônio estimu- SEQ ID NOS: 13769 lador da tireoide - 13776 TSKU Proteoglicano rico em leucina SEQ ID NOS: 13777 pequena, Tsukushi - 13781 TSLP linfopoietina estromal tímica SEQ ID NOS: 13782 - 13784 TSPAN3 Tetraspanin 3 SEQ ID NOS: 13785 - 13790
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO TSPAN31 Tetraspanina 31 SEQ ID NOS: 13791 - 13797 TSPEAR domínio G de lamina tipo trom- SEQ ID NOS: 13798 bospondina e repetições EAR - 13801 TTC13 Domínio 13 de repetição de te- SEQ ID NOS: 13802 tratricopeptídeo - 13808 TTC19 Domínio 19 de repetição de te- SEQ ID NOS: 13809 tratricopeptídeo - 13814 TTC9B Domínio 9B de repetição de te- SEQ ID NO: 13815 tratricopeptídeo TTLL11 Membro 11 da família tipo tu- SEQ ID NOS: 13816 bulina tirosina - 13820 TTR Transtiretina SEQ ID NOS: 13821 - 13823 TWSG1 Modulador 1 de sinalização de SEQ ID NOS: 13824 BMP de gastrulação torcida - 13826 TXNDC12 domínio de tiorredoxina (retícu- SEQ ID NOS: 13827 lo endoplásmico) contendo 12 - 13829 TXNDC15 domínio de tiorredoxina con- SEQ ID NOS: 13830 tendo 15 - 13836 TXNDC5 domínio de tiorredoxina con- SEQ ID NOS: 13837 tendo 5 (retículo endoplásmico) - 13838 TXNRD2 Tioredoxina redutase 2 SEQ ID NOS: 13839 - 13851 TYRP1 Proteína 1 relacionada com a SEQ ID NOS: 13852 tirosinase - 13854 UBAC2 domínio UBA contendo 2 SEQ ID NOS: 13855 - 13859 UBALD1 domínio tipo UBA contendo 1 SEQ ID NOS: 13860 - 13868 UBAP2 Proteína 2 associada à ubiquti- SEQ ID NOS: 13869 na - 13875
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO UBXN8 proteína 8 com domínio UBX SEQ ID NOS: 13876 - 13882 UCMA Zona superior de placa de SEQ ID NOS: 13883 crescimento e matriz de carti- - 13884 lage cartilage associadas UCN Urocortina SEQ ID NO: 13885 UCN2 Urocortina 2 SEQ ID NO: 13886 UCN3 Urocortina 3 SEQ ID NO: 13887 UGGT2 UDP-glicose glicoproteína gli- SEQ ID NOS: 13888 cosiltransferase 2 - 13893 UGT1A10 Família de UDP glucuronosil- SEQ ID NOS: 13894 transferase 1, polipeptídeo A10 - 13895 UGT2A1 Família da UDP glucuronosil- SEQ ID NOS: 13896 transferase 2, polipeptídeo A1, - 13900 locus complexo UGT2B11 Família da UDP glucuronosil- SEQ ID NO: 13901 transferase 2, polipeptídeo B11 UGT2B28 Família da UDP glucuronosil- SEQ ID NOS: 13902 transferase 2 , polipeptídeo - 13903 B28 UGT2B4 Família da UDP glucuronosil- SEQ ID NOS: 13904 transferase 2 , polipeptídeo B4 - 13907 UGT2B7 Família da UDP glucuronosil- SEQ ID NOS: 13908 transferase 2 , polipeptídeo B7 - 13911 UGT3A1 Família da UDP glicosiltransfe- SEQ ID NOS: 13912 rase 3, polipeptídeo A1 - 13917 UGT3A2 Família da UDP glicosiltransfe- SEQ ID NOS: 13918 rase 3, polipeptídeo A2 - 13921 UGT8 UDP glicosiltransferase 8 SEQ ID NOS: 13922 - 13924 ULBP3 proteína 3 de ligação UL16 SEQ ID NOS: 13925 - 13926
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO UMOD Uromodulin SEQ ID NOS: 13927 - 13938 UNC5C Unc-5 netrin receptor C SEQ ID NOS: 13939 - 13943 UPK3B Uroplakin 3B SEQ ID NOS: 13944 - 13946 USP11 Peptidase específica de ubiqui- SEQ ID NOS: 13947 tina 11 - 13950 USP14 Peptidase específica de ubiqui- SEQ ID NOS: 13951 tina 14 (tRNA-guanina transgli- - 13957 cosilase) USP3 Peptidase específica de ubiqui- SEQ ID NOS: 13958 tina 3 - 13973 UTS2 Urotensin 2 SEQ ID NOS: 13984 - 13986 UTS2B Urotensin 2B SEQ ID NOS: 13987 - 13992 UTY Repetição de tetratricopeptídeo SEQ ID NOS: 13993 ubiquituosamente transcrito - 14005 contendo, Y-ligado UXS1 UDP-glucuronato de Carboxila- SEQ ID NOS: 14006 se 1 - 14013 VASH1 Vasohibin 1 SEQ ID NOS: 14014 - 14016 VCAN Versican SEQ ID NOS: 14017 - 14023 VEGFA Fator de crescimento endotelial SEQ ID NOS: 14024 vascular A - 14049 VEGFB Fator de crescimento endotelial SEQ ID NOS: 14050 vascular B - 14052 VEGFC Fator de crescimento endotelial SEQ ID NO: 14053 vascular C
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO VGF Induzível por fator de cresci- SEQ ID NOS: 14055 mento de nervo VGF - 14057 VIP Peptídeo intestinal vasoativo SEQ ID NOS: 14058 - 14060 VIPR2 Receptor 2 de peptídeo intesti- SEQ ID NOS: 14061 nal vasoativo - 14064 VIT Vitrina SEQ ID NOS: 14065 - 14072 VKORC1 Complexo de Vitamina K Epó- SEQ ID NOS: 14073 xido redutase, subunidade 1 - 14080 VLDLR Receptor de lipoproteína de SEQ ID NOS: 14081 muito baixa densidade - 14083 VMO1 Homólogo de camada 1 exter- SEQ ID NOS: 14084 na de membrata vitelina (fran- - 14087 go) VNN1 Vanina 1 SEQ ID NO: 14088 VNN2 Vanina 2 SEQ ID NOS: 14089 - 14102 VNN3 Vanina 3 SEQ ID NOS: 14103 - 14114 VOPP1 Proteína 1 pró-sobrevivência SEQ ID NOS: 14115 vesicular, superexpressa em - 14127 câncer.
VPREB1 Pre-B linfócito 1 SEQ ID NOS: 14128 - 14129 VPREB3 Pre-B linfócito 3 SEQ ID NOS: 14130 - 14131 VPS37B Homólogo B de classificação SEQ ID NOS: 14132 37 de proteína vacuolar (S. ce- - 14134 revisiae) VPS51 Homólogo de classificação 51 SEQ ID NOS: 14135 de proteína vacuolar (S. cere- - 14146 visiae)
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO VSIG1 1 contendo V-set e domínio de SEQ ID NOS: 14147 imunoglobulina - 14149 VSIG10 10 contendo V-set e domínio SEQ ID NOS: 14150 de imunoglobulina - 14151 VSTM1 1 contendo V-set e domínio de SEQ ID NOS: 14152 transmembrana - 14158 VSTM2A 2A contendo V-set e domínio SEQ ID NOS: 14159 de transmembrana - 14162 VSTM2B 2B contendo V-set e domínio SEQ ID NO: 14163 de transmembrana VSTM2L Tipo 2 contendo V-set e domí- SEQ ID NOS: 14164 nio de transmembrana - 14166 VSTM4 4 contendo V-set e domínio de SEQ ID NOS: 14167 transmembrana - 14168 VTN Vitronectina SEQ ID NOS: 14169 - 14170 VWA1 1 contendo domínio de fator A SEQ ID NOS: 14171 Von Willebrand - 14174 VWA2 2 contendo domínio de fator A SEQ ID NOS: 14175 Von Willebrand - 14176 VWA5B2 5B2 contendo domínio de fator SEQ ID NOS: 14177 A Von Willebrand - 14178 VWA7 7 contendo domínio de fator A SEQ ID NO: 14179 Von Willebrand C VWC2 2 contendo domínio de fator C SEQ ID NO: 14180 Von Willebrand VWC2L Semelhante à proteína 2 con- SEQ ID NOS: 14181 tendo domínio C de fator Von - 14182 Willebrand VWCE domínios C e EGF de fator Von SEQ ID NOS: 14183 Willebrand - 14187 VWDE Domínios D e EGF de fator SEQ ID NOS: 14188 Von Willebrand - 14193
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO VWF Fator Von Willebrand SEQ ID NOS: 14194 - 14196 WDR25 Domínio 25 de remetição WD SEQ ID NOS: 14197 - 14203 WDR81 Domínio 81 de repetição WD SEQ ID NOS: 14204 - 14213 WDR90 Domínio 90 de repetição WD SEQ ID NOS: 14214 - 14221 WFDC1 domínio 1 de núcleo de quatro SEQ ID NOS: 14222 dissulfetos WAP - 14224 WFDC10A Domínio 10A de núcleo de qua- SEQ ID NO: 14225 tro dissulfetos WAP WFDC10B Domínio 10B de núcleo de qua- SEQ ID NOS: 14226 tro dissulfetos WAP - 14227 WFDC11 Domínio 11 de núcleo de qua- SEQ ID NOS: 14228 tro dissulfetos WAP - 14230 WFDC12 Domínio 12 de núcleo de qua- SEQ ID NO: 14231 tro dissulfetos WAP WFDC13 Domínio 13 de núcleo de qua- SEQ ID NO: 14232 tro dissulfetos WAP WFDC2 Domínio 2 de núcleo de quatro SEQ ID NOS: 14233 dissulfetos WAP - 14237 WFDC3 Domínio 3 de núcleo de quatro SEQ ID NOS: 14238 dissulfetos WAP - 14241 WFDC5 Domínio 5 de núcleo de quatro SEQ ID NOS: 14242 dissulfetos WAP - 14243 WFDC6 Domínio 6 de núcleo de quatro SEQ ID NOS: 14244 dissulfetos WAP - 14245 WFDC8 Domínio 8 de núcleo de quatro SEQ ID NOS: 14246 dissulfetos WAP - 14247 WFIKKN1 WAP, folliestatina/kazal, immu- SEQ ID NO: 14248 noglobulina, domínio kunitz e netrin contendo 1
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO WFIKKN2 2 contendo os domínios WAP, SEQ ID NOS: 14249 folliestatina/kazal, imunoglobu- - 14250 lina, kunitz e netrina WIF1 Fator 1 inibitório de WNT SEQ ID NOS: 14255 - 14257 WISP1 Proteína 1 da via de sinaliza- SEQ ID NOS: 14258 ção induzível por WNT1 - 14262 WISP2 Proteína 2 da via de sinaliza- SEQ ID NOS: 14263 ção induzível por WNT1 - 14265 WISP3 Proteína 3 da via de sinaliza- SEQ ID NOS: 14266 ção induzível por WNT1 - 14273 WNK1 Proteína cinase 1 deficiente de SEQ ID NOS: 14274 WNK lisina - 14287 WNT1 Família do sítio de integração SEQ ID NOS: 14288 MMTV tipo Wingless - 14289 WNT10B Família do sítio de integração SEQ ID NOS: 14290 MMTV tipo Wingless, membro - 14294 10B WNT11 Família do sítio de integração SEQ ID NOS: 14295 MMTV tipo Wingless, membro - 14297 11 WNT16 Família do sítio de integração SEQ ID NOS: 14298 MMTV tipo Wingless, membro - 14299 16 WNT2 Família do sítio de integração SEQ ID NOS: 14300 MMTV tipo Wingless, membro - 14302 2 WNT3 Família do sítio de integração SEQ ID NO: 14303 MMTV tipo Wingless, membro 3 WNT3A Família do sítio de integração SEQ ID NO: 14304 MMTV tipo Wingless, membro 3A
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO WNT5A Família do sítio de integração SEQ ID NOS: 14305 MMTV tipo Wingless, membro - 14308 5A WNT5B Família do sítio de integração SEQ ID NOS: 14309 MMTV tipo Wingless, membro - 14315 5B WNT6 Família do sítio de integração SEQ ID NO: 14316 MMTV tipo Wingless, membro 6 WNT7A Família do sítio de integração SEQ ID NO: 14317 MMTV tipo Wingless, membro 7A WNT7B Família do sítio de integração SEQ ID NOS: 14318 MMTV tipo Wingless, membro - 14322 7B WNT8A Família do sítio de integração SEQ ID NOS: 14323 MMTV tipo Wingless, membro - 14326 8A WNT8B Família do sítio de integração SEQ ID NO: 14327 MMTV tipo Wingless, membro 8B WNT9A Família do sítio de integração SEQ ID NO: 14328 MMTV tipo Wingless, membro 9A WNT9B Família do sítio de integração SEQ ID NOS: 14329 MMTV tipo Wingless, membro - 14331 9B WSB1 1 contendo repetição WD e SEQ ID NOS: 14332 caixa SOCS - 14341 WSCD1 1 contendo o domínio WSC SEQ ID NOS: 14342 - 14351 WSCD2 2 contendo domínio de WSC SEQ ID NOS: 14352 - 14355 XCL1 Quimiocina (C Motivo) ligante 1 SEQ ID NO: 14356
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO XCL2 Quimiocina (C Motivo) ligante 2 SEQ ID NO: 14357 XPNPEP2 X-prolil aminopeptidase (ami- SEQ ID NOS: 14358 nopeptidase P) 2, ligada à - 14359 membrana XXbac- SEQ ID NOS: 679 - BPG116M5.1 680 7 XXbac- SEQ ID NO: 681 BPG181M17. 5 XXbac- SEQ ID NO: 682 BPG32J3.20 XXYLT1 Xilosídeo xilosiltransferase 1 SEQ ID NOS: 14360 - 14365 XYLT1 Xilosiltransferase I SEQ ID NO: 14366 XYLT2 Xilosiltransferase II SEQ ID NOS: 14367 - 14372 ZFYVE21 Dedo de zinco, 21 contendo o SEQ ID NOS: 14373 domínio de FYVE - 14377 ZG16 Proteína 16 de grânulo de Zi- SEQ ID NO: 14378 mogênio ZG16B Proteína 16B de grânulo de SEQ ID NOS: 14379 Zimogênio - 14382 ZIC4 Membro 4 da família Zic SEQ ID NOS: 14383 - 14391 ZNF207 Proteína dedo de zinco 207 SEQ ID NOS: 14392 - 14402 ZNF26 Proteína dedo de zinco 26 SEQ ID NOS: 14403 - 14406 ZNF34 Proteína dedo de zinco 34 SEQ ID NOS: 14407 - 14410 ZNF419 Proteína dedo de zinco 419 SEQ ID NOS: 14411 - 14425
Nome do Ge- Descrição do Gene Proteína SEQ ID ne NO ZNF433 Proteína 433 dedo de zinco SEQ ID NOS: 14426 - 14435 ZNF449 Proteína dedo de zinco 449 SEQ ID NOS: 14436 - 14437 ZNF488 Proteína dedo de zinco 488 SEQ ID NOS: 14438 - 14439 ZNF511 Proteína dedo de zinco 511 SEQ ID NOS: 14440 - 14441 ZNF570 Proteína dedo de zinco 570 SEQ ID NOS: 14442 - 14447 ZNF691 Proteína dedo de zinco 691 SEQ ID NOS: 14448 - 14455 ZNF98 Proteína dedo de zinco 98 SEQ ID NOS: 14456 - 14459 ZPBP Proteína de ligação de zona SEQ ID NOS: 14460 pelúcida - 14463 ZPBP2 Proteína 2 de ligação à Zona SEQ ID NOS: 14464 pelúcida - 14467 ZSCAN29 29 contendo domínio dedo de SEQ ID NOS: 14468 zinco e SCAN - 14474
[00767] Em algumas modalidades das composições da presente invenção, o promotor induzível é isolado ou derivado do promotor de um gene envolvido em metabolismo e diferenciação de CD. Em algu- mas modalidades das composições da presente invenção, o promotor induzível é isolado ou derivado do promotor de Nr4a1, Nr4a3, Tnfrsf9 (4-1BB), Sema7a, Zfp36l2, Gadd45b, Dusp5, Dusp6 e Neto2. Transgene Induzível
[00768] Em algumas modalidades, a construção de transgene indu- zível compreende ou direciona a expressão de um componente de si- nalização a jusante de um sinal de ponto de verificação inibitório (co- mo fornecido, por exemplo, nas Tabelas 1 e 2), um fator de transcrição (como fornecido, por exemplo, na Tabela 3), uma citocina ou um re-
ceptor de citocina, uma quimiocina ou um receptor de quimiocina, um ligante/receptor de morte celular ou apoptose (como fornecido, por exemplo, na Tabela 4), uma molécula de detecção metabólica (como fornecido, por exemplo, na Tabela 5), uma proteína que confere sensi- bilidade a uma terapia de câncer (como fornecido, por exemplo, na Tabela 6and/or 9), e um oncogene ou um gene supressor de tumor (como fornecido, por exemplo, na Tabela 7). Exemplos de citocinas, receptores de citocina, quimiocinas e receptores de quimiocina da pre- sente invenção incluem, mas não estão limitadas a, as citocinas e re- ceptores de citocina, bem como quimiocinas e receptores de quimioci- na fornecidos na Tabela 8. Tabela 9. Exemplos de proteínas terapêuticas (e proteínas para realçar a eficácia de CAR-T). Cas-Trevo
[00769] A presente invenção fornece uma composição compreen- dendo um RNA guia e uma proteína de fusão ou uma sequência codi- ficando a proteína de fusão em que a proteína de fusão compreende as endonucleases dCas9 e Clo051 ou um domínio de nuclease das mesmas. Cas9 pequena (SaCas9)
[00770] A presente invenção fornece composições compreendendo uma Cas9 pequena (Cas9) operativamente ligada a uma efetora. Em certas modalidades, a presente invenção fornece uma proteína de fu- são compreendendo, consistindo essencialmente em ou consistindo em um componente de localização do DNA e uma molécula efetora, em que a efetora compreende uma pequena Cas9 (Cas9). Em certas modalidades, uma construção de Cas9 pequena da presente invenção pode compreender uma efetora compreendendo uma endonuclease tipo IIS.
[00771] Sequência de aminoácido de Staphylococcus aureus Cas9 com um sítio catalítico ativo. 1 mkrnyilgld igitsvgygi idyetrdvid agvrlfkean vennegrrsk rgarrlkrrr 61 rhriqrvkkl lfdynlltdh selsginpye arvkglsqkl seeefsaall hlakrrgvhn 121 vneveedtgn elstkeqisr nskaleekyv aelqlerlkk dgevrgsinr fktsdyvkea 181 kqllkvqkay hqldqsfidt yidlletrrt yyegpgegsp fgwkdikewy emlmghctyf 241 peelrsvkya ynadlynaln dlnnlvitrd enekleyyek fqiienvfkq kkkptlkqia 301 keilvneedi kgyrvtstgk peftnlkvyh dikditarke iienaelldq iakiltiyqs 361 sediqeeltn lnseltqeei eqisnlkgyt gthnlslkai nlildelwht ndnqiaifnr 421 lklvpkkvdl sqqkeipttl vddfilspvv krsfiqsikv inaiikkygl pndiiielar 481 eknskdaqkm inemqkrnrq tnerieeiir ttgkenakyl iekiklhdmq egkclyslea 541 ipledllnnp fnyevdhiip rsvsfdnsfn nkvlvkqeen skkgnrtpfq ylsssdskis 601 yetfkkhiln lakgkgrisk tkkeylleer dinrfsvqkd finrnlvdtr yatrglmnll 661 rsyfrvnnld vkvksinggf tsflrrkwkf kkernkgykh haedaliian adfifkewkk 721 ldkakkvmen qmfeekqaes mpeieteqey keifitphqi khikdfkdyk yshrvdkkpn 781 relindtlys trkddkgntl ivnnlnglyd kdndklkkli nkspekllmy hhdpqtyqkl 841 klimeqygde knplykyyee tgnyltkysk kdngpvikki kyygnklnah lditddypns 901 rnkvvklslk pyrfdvyldn gvykfvtvkn ldvikkenyy evnskcyeea kklkkisnqa 961 efiasfynnd likingelyr vigvnndlln rievnmidit yreylenmnd krppriikti 1021 asktqsikky stdilgnlye vkskkhpqii kkg (SEQ ID NO: 18052) Pequena Cas9, inativada (dSaCas9)
[00772] A presente invenção fornece composições compreendendo uma Cas9, pequena, inativada (dSaCas9) operativamente ligada a uma efetora. Em certas modalidades, a presente invenção fornece uma proteína de fusão compreendendo, consistindo essencialmente em, ou consistindo em um componente de localização do DNA e uma molécula efetora, em que a efetora compreende uma Cas pequena, inativada (dSaCas9). Em certas modalidades, uma construção de Cas pequena, inativada (dSaCas9) da presente invenção pode compreen- der uma efetora compreendendo uma endonuclease tipo IIS endonu- clease.
[00773] Sequência dSaCas9: mutações D10A e N580A (em negrito, letras maiúsculas, e sublinhadas) inativam o sítio catalítico. 1 mkrnyilglA igitsvgygi idyetrdvid agvrlfkean vennegrrsk rgarrlkrrr 61 rhriqrvkkl lfdynlltdh selsginpye arvkglsqkl seeefsaall hlakrrgvhn 121 vneveedtgn elstkeqisr nskaleekyv aelqlerlkk dgevrgsinr fktsdyvkea 181 kqllkvqkay hqldqsfidt yidlletrrt yyegpgegsp fgwkdikewy emlmghctyf 241 peelrsvkya ynadlynaln dlnnlvitrd enekleyyek fqiienvfkq kkkptlkqia
301 keilvneedi kgyrvtstgk peftnlkvyh dikditarke iienaelldq iakiltiyqs 361 sediqeeltn lnseltqeei eqisnlkgyt gthnlslkai nlildelwht ndnqiaifnr 421 lklvpkkvdl sqqkeipttl vddfilspvv krsfiqsikv inaiikkygl pndiiielar 481 eknskdaqkm inemqkrnrq tnerieeiir ttgkenakyl iekiklhdmq egkclyslea 541 ipledllnnp fnyevdhiip rsvsfdnsfn nkvlvkqeeA skkgnrtpfq ylsssdskis 601 yetfkkhiln lakgkgrisk tkkeylleer dinrfsvqkd finrnlvdtr yatrglmnll 661 rsyfrvnnld vkvksinggf tsflrrkwkf kkernkgykh haedaliian adfifkewkk 721 ldkakkvmen qmfeekqaes mpeieteqey keifitphqi khikdfkdyk yshrvdkkpn 781 relindtlys trkddkgntl ivnnlnglyd kdndklkkli nkspekllmy hhdpqtyqkl 841 klimeqygde knplykyyee tgnyltkysk kdngpvikki kyygnklnah lditddypns 901 rnkvvklslk pyrfdvyldn gvykfvtvkn ldvikkenyy evnskcyeea kklkkisnqa 961 efiasfynnd likingelyr vigvnndlln rievnmidit yreylenmnd krppriikti 1021 asktqsikky stdilgnlye vkskkhpqii kkg (SEQ ID NO: 18053) Cas9 Inativada (dCas9)
[00774] A presente invenção fornece composições compreendendo uma Cas9 inativada (dCas9) operativamente ligada a uma efetora. Em certas modalidades, a presente invenção fornece uma proteína de fu- são compreendendo, consistindo essencialmente em, ou consistindo em um componente de localização do DNA e uma molécula efetora, em que a efetora compreende uma Cas9 inativada (dCas9). Em certas modalidades, uma construção de Cas9 inativada (dCas9) da presente invenção pode compreender uma efetora compreendendo uma nu- clease tipo IIS.
[00775] Em certas modalidades, a dCas9 da presente invenção compreende uma dCas9 isolada ou derivadas de Staphyloccocus pyo- genes. Em certas modalidades, a dCas9 compreende uma dCas9 com substituições nas posições 10 e 840 da sequência de aminoácido da dCas9 que inativa o sítio catalítico. Em certas modalidades, estas substituições são D10A e H840A. Em certas modalidades, a sequência de aminoácido da dCas9 compreende a sequência de: 1 XDKKYSIGLA IGTNSVGWAV ITDEYKVPSK KFKVLGNTDR HSIKKNLIGA LLFDSGETAE 61 ATRLKRTARR RYTRRKNRIC YLQEIFSNEM AKVDDSFFHR LEESFLVEED KKHERHPIFG 121 NIVDEVAYHE KYPTIYHLRK KLVDSTDKAD LRLIYLALAH MIKFRGHFLI EGDLNPDNSD 181 VDKLFIQLVQ TYNQLFEENP INASGVDAKA ILSARLSKSR RLENLIAQLP GEKKNGLFGN 241 LIALSLGLTP NFKSNFDLAE DAKLQLSKDT YDDDLDNLLA QIGDQYADLF LAAKNLSDAI 301 LLSDILRVNT EITKAPLSAS MIKRYDEHHQ DLTLLKALVR QQLPEKYKEI FFDQSKNGYA
361 GYIDGGASQE EFYKFIKPIL EKMDGTEELL VKLNREDLLR KQRTFDNGSI PHQIHLGELH 421 AILRRQEDFY PFLKDNREKI EKILTFRIPY YVGPLARGNS RFAWMTRKSE ETITPWNFEE 481 VVDKGASAQS FIERMTNFDK NLPNEKVLPK HSLLYEYFTV YNELTKVKYV TEGMRKPAFL 541 SGEQKKAIVD LLFKTNRKVT VKQLKEDYFK KIECFDSVEI SGVEDRFNAS LGTYHDLLKI 601 IKDKDFLDNE ENEDILEDIV LTLTLFEDRE MIEERLKTYA HLFDDKVMKQ LKRRRYTGWG 661 RLSRKLINGI RDKQSGKTIL DFLKSDGFAN RNFMQLIHDD SLTFKEDIQK AQVSGQGDSL 721 HEHIANLAGS PAIKKGILQT VKVVDELVKV MGRHKPENIV IEMARENQTT QKGQKNSRER 781 MKRIEEGIKE LGSQILKEHP VENTQLQNEK LYLYYLQNGR DMYVDQELDI NRLSDYDVDA 841 IVPQSFLKDD SIDNKVLTRS DKNRGKSDNV PSEEVVKKMK NYWRQLLNAK LITQRKFDNL 901 TKAERGGLSE LDKAGFIKRQ LVETRQITKH VAQILDSRMN TKYDENDKLI REVKVITLKS 961 KLVSDFRKDF QFYKVREINN YHHAHDAYLN AVVGTALIKK YPKLESEFVY GDYKVYDVRK 1021 MIAKSEQEIG KATAKYFFYS NIMNFFKTEI TLANGEIRKR PLIETNGETG EIVWDKGRDF 1081 ATVRKVLSMP QVNIVKKTEV QTGGFSKESI LPKRNSDKLI ARKKDWDPKK YGGFDSPTVA 1141 YSVLVVAKVE KGKSKKLKSV KELLGITIME RSSFEKNPID FLEAKGYKEV KKDLIIKLPK 1201 YSLFELENGR KRMLASAGEL QKGNELALPS KYVNFLYLAS HYEKLKGSPE DNEQKQLFVE 1261 QHKHYLDEII EQISEFSKRV ILADANLDKV LSAYNKHRDK PIREQAENII HLFTLTNLGA 1321 PAAFKYFDTT IDRKRYTSTK EVLDATLIHQ SITGLYETRI DLSQLGGD (SEQ ID NO: 18054).
[00776] Em certas modalidades, a sequência de aminoácido da dCas9 compreende a sequência de: 1 MDKKYSIGLA IGTNSVGWAV ITDEYKVPSK KFKVLGNTDR HSIKKNLIGA LLFDSGETAE 61 ATRLKRTARR RYTRRKNRIC YLQEIFSNEM AKVDDSFFHR LEESFLVEED KKHERHPIFG 121 NIVDEVAYHE KYPTIYHLRK KLVDSTDKAD LRLIYLALAH MIKFRGHFLI EGDLNPDNSD 181 VDKLFIQLVQ TYNQLFEENP INASGVDAKA ILSARLSKSR RLENLIAQLP GEKKNGLFGN 241 LIALSLGLTP NFKSNFDLAE DAKLQLSKDT YDDDLDNLLA QIGDQYADLF LAAKNLSDAI 301 LLSDILRVNT EITKAPLSAS MIKRYDEHHQ DLTLLKALVR QQLPEKYKEI FFDQSKNGYA 361 GYIDGGASQE EFYKFIKPIL EKMDGTEELL VKLNREDLLR KQRTFDNGSI PHQIHLGELH 421 AILRRQEDFY PFLKDNREKI EKILTFRIPY YVGPLARGNS RFAWMTRKSE ETITPWNFEE 481 VVDKGASAQS FIERMTNFDK NLPNEKVLPK HSLLYEYFTV YNELTKVKYV TEGMRKPAFL 541 SGEQKKAIVD LLFKTNRKVT VKQLKEDYFK KIECFDSVEI SGVEDRFNAS LGTYHDLLKI 601 IKDKDFLDNE ENEDILEDIV LTLTLFEDRE MIEERLKTYA HLFDDKVMKQ LKRRRYTGWG 661 RLSRKLINGI RDKQSGKTIL DFLKSDGFAN RNFMQLIHDD SLTFKEDIQK AQVSGQGDSL 721 HEHIANLAGS PAIKKGILQT VKVVDELVKV MGRHKPENIV IEMARENQTT QKGQKNSRER 781 MKRIEEGIKE LGSQILKEHP VENTQLQNEK LYLYYLQNGR DMYVDQELDI NRLSDYDVDA 841 IVPQSFLKDD SIDNKVLTRS DKNRGKSDNV PSEEVVKKMK NYWRQLLNAK LITQRKFDNL 901 TKAERGGLSE LDKAGFIKRQ LVETRQITKH VAQILDSRMN TKYDENDKLI REVKVITLKS 961 KLVSDFRKDF QFYKVREINN YHHAHDAYLN AVVGTALIKK YPKLESEFVY GDYKVYDVRK 1021 MIAKSEQEIG KATAKYFFYS NIMNFFKTEI TLANGEIRKR PLIETNGETG EIVWDKGRDF 1081 ATVRKVLSMP QVNIVKKTEV QTGGFSKESI LPKRNSDKLI ARKKDWDPKK YGGFDSPTVA 1141 YSVLVVAKVE KGKSKKLKSV KELLGITIME RSSFEKNPID FLEAKGYKEV KKDLIIKLPK 1201 YSLFELENGR KRMLASAGEL QKGNELALPS KYVNFLYLAS HYEKLKGSPE DNEQKQLFVE 1261 QHKHYLDEII EQISEFSKRV ILADANLDKV LSAYNKHRDK PIREQAENII HLFTLTNLGA
1321 PAAFKYFDTT IDRKRYTSTK EVLDATLIHQ SITGLYETRI DLSQLGGD (SEQ ID NO: 18055).
Endonuclease Clo051
[00777] Um exemplo de domínio de nuclease Clo051 pode compre- ender, consistir essencialmente em, ou consistir na, a sequência de aminoácido de:
EGIKSNISLLKDELRGQISHISHEYLSLIDLAFDSKQNRLFEMKVLELLV NEYGFKGRHLGGSRKPDGIVYSTTLEDNFGIIVDTKAYSEGYSLPISQ ADEMERYVRENSNRDEEVNPNKWWENFSEEVKKYYFVFISGSFKGK
FEEQLRRLSMTTGVNGSAVNVVNLLLGAEKIRSGEMTIEELERAMFN NSEFILKY (SEQ ID NO: 18056). Proteína de Fusão Cas-Trevo
[00778] Em certas modalidades, um exemplo de proteína de fusão dCas9-Clo051 (modalidade 1) pode compreender, consistir essencial- mente em, ou consistir na, a sequência de aminoácido de (Sequêcia Clo051 sublihada, ligantes em itálicos negritos, sequência dCas9 (Streptoccocus pyogenes) em itálico):
MAPKKKRKVEGIKSNISLLKDELRGQISHISHEYLSLIDLAFDSKQNRL FEMKVLELLVNEYGFKGRHLGGSRKPDGIVYSTTLEDNFGIIVDTKAY SEGYSLPISQADEMERYVRENSNRDEEVNPNKWWENFSEEVKKYYF VFISGSFKGKFEEQLRRLSMTTGVNGSAVNVVNLLLGAEKIRSGEMTI EELERAMFNNSEFILKYGGGGSDKKYSIGLAIGTNSVGWAVITDEYKV PSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRR KNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIV DEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEG DLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSR RLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSK DTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLS ASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDG GASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQI HLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFA WMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPK HSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRK VTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFL DNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRR YTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLT FKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVM GRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEH PVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSF LKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLIT QRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNT KYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYL NAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYF FYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKV LSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGG FDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFL EAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPS KYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSK RVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYF
DTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDGSPKKKRK VSS(SEQ ID NO: 18057).
[00779] Em certas modalidades, um exemplo de proteína de fusão dCas9-Clo051 (modalidade 1) pode compreender, consistir essencial- mente em, ou consistir na sequência de ácido nucleico de (sequência dCas9 derivada de Streptoccocus pyogenes): 1 atggcaccaa agaagaaaag aaaagtggag ggcatcaagt caaacatcag cctgctgaaa 61 gacgaactgc ggggacagat tagtcacatc agtcacgagt acctgtcact gattgatctg 121 gccttcgaca gcaagcagaa tagactgttt gagatgaaag tgctggaact gctggtcaac 181 gagtatggct tcaagggcag acatctgggc gggtctagga aacctgacgg catcgtgtac 241 agtaccacac tggaagacaa cttcggaatc attgtcgata ccaaggctta ttccgagggc 301 tactctctgc caattagtca ggcagatgag atggaaaggt acgtgcgcga aaactcaaat 361 agggacgagg aagtcaaccc caataagtgg tgggagaatt tcagcgagga agtgaagaaa 421 tactacttcg tctttatctc aggcagcttc aaagggaagt ttgaggaaca gctgcggaga 481 ctgtccatga ctaccggggt gaacggatct gctgtcaacg tggtcaatct gctgctgggc
541 gcagaaaaga tcaggtccgg ggagatgaca attgaggaac tggaacgcgc catgttcaac 601 aattctgagt ttatcctgaa gtatggaggc gggggaagcg ataagaaata ctccatcgga 661 ctggccattg gcaccaattc cgtgggctgg gctgtcatca cagacgagta caaggtgcca 721 agcaagaagt tcaaggtcct ggggaacacc gatcgccaca gtatcaagaa aaatctgatt 781 ggagccctgc tgttcgactc aggcgagact gctgaagcaa cccgactgaa gcggactgct 841 aggcgccgat atacccggag aaaaaatcgg atctgctacc tgcaggaaat tttcagcaac 901 gagatggcca aggtggacga tagtttcttt caccgcctgg aggaatcatt cctggtggag 961 gaagataaga aacacgagcg gcatcccatc tttggcaaca ttgtggacga agtcgcttat 1021 cacgagaagt accctactat ctatcatctg aggaagaaac tggtggactc caccgataag 1081 gcagacctgc gcctgatcta tctggccctg gctcacatga tcaagttccg ggggcatttt 1141 ctgatcgagg gagatctgaa ccctgacaat tctgatgtgg acaagctgtt catccagctg 1201 gtccagacat acaatcagct gtttgaggaa aacccaatta atgcctcagg cgtggacgca 1261 aaggccatcc tgagcgccag actgtccaaa tctaggcgcc tggaaaacct gatcgctcag 1321 ctgccaggag agaagaaaaa cggcctgttt gggaatctga ttgcactgtc cctgggcctg 1381 acacccaact tcaagtctaa ttttgatctg gccgaggacg ctaagctgca gctgtccaaa 1441 gacacttatg acgatgacct ggataacctg ctggctcaga tcggcgatca gtacgcagac 1501 ctgttcctgg ccgctaagaa tctgagtgac gccatcctgc tgtcagatat tctgcgcgtg 1561 aacacagaga ttactaaggc cccactgagt gcttcaatga tcaaaagata tgacgagcac 1621 catcaggatc tgaccctgct gaaggctctg gtgaggcagc agctgcccga gaaatacaag 1681 gaaatcttct ttgatcagag caagaatgga tacgccggct atattgacgg cggggcttcc 1741 caggaggagt tctacaagtt catcaagccc attctggaaa agatggacgg caccgaggaa 1801 ctgctggtga agctgaatcg ggaggacctg ctgagaaaac agaggacatt tgataacgga 1861 agcatccctc accagattca tctgggcgaa ctgcacgcca tcctgcgacg gcaggaggac 1921 ttctacccat ttctgaagga taaccgcgag aaaatcgaaa agatcctgac cttcagaatc 1981 ccctactatg tggggcctct ggcacgggga aatagtagat ttgcctggat gacaagaaag 2041 tcagaggaaa ctatcacccc ctggaacttc gaggaagtgg tcgataaagg cgctagcgca 2101 cagtccttca ttgaaaggat gacaaatttt gacaagaacc tgccaaatga gaaggtgctg 2161 cccaaacaca gcctgctgta cgaatatttc acagtgtata acgagctgac taaagtgaag 2221 tacgtcaccg aagggatgcg caagcccgca ttcctgtccg gagagcagaa gaaagccatc 2281 gtggacctgc tgtttaagac aaatcggaaa gtgactgtca aacagctgaa ggaagactat 2341 ttcaagaaaa ttgagtgttt cgattcagtg gaaatcagcg gcgtcgagga caggtttaac 2401 gcctccctgg ggacctacca cgatctgctg aagatcatca aggataagga cttcctggac 2461 aacgaggaaa atgaggacat cctggaggac attgtgctga cactgactct gtttgaggat 2521 cgcgaaatga tcgaggaacg actgaagact tatgcccatc tgttcgatga caaagtgatg 2581 aagcagctga aaagaaggcg ctacaccgga tggggacgcc tgagccgaaa actgatcaat 2641 gggattagag acaagcagag cggaaaaact atcctggact ttctgaagtc cgatggcttc 2701 gccaacagga acttcatgca gctgattcac gatgactctc tgaccttcaa ggaggacatc 2761 cagaaagcac aggtgtctgg ccagggggac agtctgcacg agcatatcgc aaacctggcc 2821 ggcagccccg ccatcaagaa agggattctg cagaccgtga aggtggtgga cgaactggtc 2881 aaggtcatgg gacgacacaa acctgagaac atcgtgattg agatggcccg cgaaaatcag 2941 acaactcaga agggccagaa aaacagtcga gaacggatga agagaatcga ggaaggcatc 3001 aaggagctgg ggtcacagat cctgaaggag catcctgtgg aaaacactca gctgcagaat
3061 gagaaactgt atctgtacta tctgcagaat ggacgggata tgtacgtgga ccaggagctg 3121 gatattaaca gactgagtga ttatgacgtg gatgccatcg tccctcagag cttcctgaag 3181 gatgactcca ttgacaacaa ggtgctgacc aggtccgaca agaaccgcgg caaatcagat 3241 aatgtgccaa gcgaggaagt ggtcaagaaa atgaagaact actggaggca gctgctgaat 3301 gccaagctga tcacacagcg gaaatttgat aacctgacta aggcagaaag aggaggcctg 3361 tctgagctgg acaaggccgg cttcatcaag cggcagctgg tggagacaag acagatcact 3421 aagcacgtcg ctcagattct ggatagcaga atgaacacaa agtacgatga aaacgacaag 3481 ctgatcaggg aggtgaaagt cattactctg aaatccaagc tggtgtctga ctttagaaag 3541 gatttccagt tttataaagt cagggagatc aacaactacc accatgctca tgacgcatac 3601 ctgaacgcag tggtcgggac cgccctgatt aagaaatacc ccaagctgga gtccgagttc 3661 gtgtacggag actataaagt gtacgatgtc cggaagatga tcgccaaatc tgagcaggaa 3721 attggcaagg ccaccgctaa gtatttcttt tacagtaaca tcatgaattt ctttaagacc 3781 gaaatcacac tggcaaatgg ggagatcaga aaaaggcctc tgattgagac caacggggag 3841 acaggagaaa tcgtgtggga caagggaagg gattttgcta ccgtgcgcaa agtcctgtcc 3901 atgccccaag tgaatattgt caagaaaact gaagtgcaga ccgggggatt ctctaaggag 3961 agtattctgc ctaagcgaaa ctctgataaa ctgatcgccc ggaagaaaga ctgggacccc 4021 aagaagtatg gcgggttcga ctctccaaca gtggcttaca gtgtcctggt ggtcgcaaag 4081 gtggaaaagg ggaagtccaa gaaactgaag tctgtcaaag agctgctggg aatcactatt 4141 atggaacgca gctccttcga gaagaatcct atcgattttc tggaagccaa gggctataaa 4201 gaggtgaaga aagacctgat cattaagctg ccaaaatact cactgtttga gctggaaaac 4261 ggacgaaagc gaatgctggc aagcgccgga gaactgcaga agggcaatga gctggccctg 4321 ccctccaaat acgtgaactt cctgtatctg gctagccact acgagaaact gaaggggtcc 4381 cctgaggata acgaacagaa gcagctgttt gtggagcagc acaaacatta tctggacgag 4441 atcattgaac agatttcaga gttcagcaag agagtgatcc tggctgacgc aaatctggat 4501 aaagtcctga gcgcatacaa caagcaccga gacaaaccaa tccgggagca ggccgaaaat 4561 atcattcatc tgttcaccct gacaaacctg ggcgcccctg cagccttcaa gtattttgac 4621 accacaatcg atcggaagag atacacttct accaaagagg tgctggatgc taccctgatc 4681 caccagagta ttaccggcct gtatgagaca cgcatcgacc tgtcacagct gggaggcgat 4741 gggagcccca agaaaaagcg gaaggtgtct agttaa (SEQ ID NO: 18058).
[00780] Em certas modalidades, a sequência de ácido nucleico co- dificando uma proteína de fusão dCas9-Clo051 (modalidade 1) da pre- sente invenção pode compreender um DNA. Em certas modalidades, a sequência de ácido nucleico codificando uma proteína de fusão dCas9-Clo051 (modalidade 1) da presente invenção podem compre- ender um RNA.
[00781] Em certas modalidades, um exemplo de proteína de fusão dCas9-Clo051 (modalidade 2) pode compreender, consistir essencial- mente em, ou consistir na, a sequência de aminoácido de (Sequêcia Clo051 sublihada, ligante em itálicos negritos, dCas9 sequence (Strep-
toccocus pyogenes) em itálico):
1. MPKKKRKVEGIKSNISLLKD ELRGQISHIS HEYLSLIDLA FDSKQNRLFE MKVLELLVNE 61 YGFKGRHLGG SRKPDGIVYS TTLEDNFGII VDTKAYSEGY SLPISQADEM ERYVRENSNR 121 DEEVNPNKWW ENFSEEVKKY YFVFISGSFK GKFEEQLRRL SMTTGVNGSA VNVVNLLLGA 181 EKIRSGEMTI EELERAMFNN SEFILKYGGGGSDKKYSIGL AIGTNSVGWA VITDEYKVPS 241 KKFKVLGNTD RHSIKKNLIG ALLFDSGETA EATRLKRTAR RRYTRRKNRI CYLQEIFSNE 301 MAKVDDSFFH RLEESFLVEE DKKHERHPIF GNIVDEVAYH EKYPTIYHLR KKLVDSTDKA 361 DLRLIYLALA HMIKFRGHFL IEGDLNPDNS DVDKLFIQLV QTYNQLFEEN PINASGVDAK 421 AILSARLSKS RRLENLIAQL PGEKKNGLFG NLIALSLGLT PNFKSNFDLA EDAKLQLSKD 481 TYDDDLDNLL AQIGDQYADL FLAAKNLSDA ILLSDILRVN TEITKAPLSA SMIKRYDEHH 541 QDLTLLKALV RQQLPEKYKE IFFDQSKNGY AGYIDGGASQ EEFYKFIKPI LEKMDGTEEL 601 LVKLNREDLL RKQRTFDNGS IPHQIHLGEL HAILRRQEDF YPFLKDNREK IEKILTFRIP 661 YYVGPLARGN SRFAWMTRKS EETITPWNFE EVVDKGASAQ SFIERMTNFD KNLPNEKVLP 721 KHSLLYEYFT VYNELTKVKY VTEGMRKPAF LSGEQKKAIV DLLFKTNRKV TVKQLKEDYF 781 KKIECFDSVE ISGVEDRFNA SLGTYHDLLK IIKDKDFLDN EENEDILEDI VLTLTLFEDR 841 EMIEERLKTY AHLFDDKVMK QLKRRRYTGW GRLSRKLING IRDKQSGKTI LDFLKSDGFA 901 NRNFMQLIHD DSLTFKEDIQ KAQVSGQGDS LHEHIANLAG SPAIKKGILQ TVKVVDELVK 961 VMGRHKPENI VIEMARENQT TQKGQKNSRE RMKRIEEGIK ELGSQILKEH PVENTQLQNE 1021 KLYLYYLQNG RDMYVDQELD INRLSDYDVD AIVPQSFLKD DSIDNKVLTR SDKNRGKSDN 1081 VPSEEVVKKM KNYWRQLLNA KLITQRKFDN LTKAERGGLS ELDKAGFIKR QLVETRQITK 1141 HVAQILDSRM NTKYDENDKL IREVKVITLK SKLVSDFRKD FQFYKVREIN NYHHAHDAYL 1201 NAVVGTALIK KYPKLESEFV YGDYKVYDVR KMIAKSEQEI GKATAKYFFY SNIMNFFKTE 1261 ITLANGEIRK RPLIETNGET GEIVWDKGRD FATVRKVLSM PQVNIVKKTE VQTGGFSKES 1321 ILPKRNSDKL IARKKDWDPK KYGGFDSPTV AYSVLVVAKV EKGKSKKLKS VKELLGITIM 1381 ERSSFEKNPI DFLEAKGYKE VKKDLIIKLP KYSLFELENG RKRMLASAGE LQKGNELALP 1441 SKYVNFLYLA SHYEKLKGSP EDNEQKQLFV EQHKHYLDEI IEQISEFSKR VILADANLDK 1501 VLSAYNKHRD KPIREQAENI IHLFTLTNLG APAAFKYFDT TIDRKRYTST KEVLDATLIH 1561 QSITGLYETR IDLSQLGGDG SPKKKRKV(SEQ ID NO: 18059).
[00782] Em certas modalidades, um exemplo de proteína de fusão dCas9-Clo051 (modalidade 2) pode compreender, consistir essencial- mente em, ou consistir em, a sequência de ácido nucleico de (dCas9 sequence derivada de Streptoccocus pyogenes): 1 atgcctaaga agaagcggaa ggtggaaggc atcaaaagca acatctccct cctgaaagac 61 gaactccggg ggcagattag ccacattagt cacgaatacc tctccctcat cgacctggct 121 ttcgatagca agcagaacag gctctttgag atgaaagtgc tggaactgct cgtcaatgag 181 tacgggttca agggtcgaca cctcggcgga tctaggaaac cagacggcat cgtgtatagt 241 accacactgg aagacaactt tgggatcatt gtggatacca aggcatactc tgagggttat 301 agtctgccca tttcacaggc cgacgagatg gaacggtacg tgcgcgagaa ctcaaataga 361 gatgaggaag tcaaccctaa caagtggtgg gagaacttct ctgaggaagt gaagaaatac 421 tacttcgtct ttatcagcgg gtccttcaag ggtaaatttg aggaacagct caggagactg 481 agcatgacta ccggcgtgaa tggcagcgcc gtcaacgtgg tcaatctgct cctgggcgct 541 gaaaagattc ggagcggaga gatgaccatc gaagagctgg agagggcaat gtttaataat
601 agcgagttta tcctgaaata cggtggcggt ggatccgata aaaagtattc tattggttta 661 gccatcggca ctaattccgt tggatgggct gtcataaccg atgaatacaa agtaccttca 721 aagaaattta aggtgttggg gaacacagac cgtcattcga ttaaaaagaa tcttatcggt 781 gccctcctat tcgatagtgg cgaaacggca gaggcgactc gcctgaaacg aaccgctcgg 841 agaaggtata cacgtcgcaa gaaccgaata tgttacttac aagaaatttt tagcaatgag 901 atggccaaag ttgacgattc tttctttcac cgtttggaag agtccttcct tgtcgaagag 961 gacaagaaac atgaacggca ccccatcttt ggaaacatag tagatgaggt ggcatatcat 1021 gaaaagtacc caacgattta tcacctcaga aaaaagctag ttgactcaac tgataaagcg 1081 gacctgaggt taatctactt ggctcttgcc catatgataa agttccgtgg gcactttctc 1141 attgagggtg atctaaatcc ggacaactcg gatgtcgaca aactgttcat ccagttagta 1201 caaacctata atcagttgtt tgaagagaac cctataaatg caagtggcgt ggatgcgaag 1261 gctattctta gcgcccgcct ctctaaatcc cgacggctag aaaacctgat cgcacaatta 1321 cccggagaga agaaaaatgg gttgttcggt aaccttatag cgctctcact aggcctgaca 1381 ccaaatttta agtcgaactt cgacttagct gaagatgcca aattgcagct tagtaaggac 1441 acgtacgatg acgatctcga caatctactg gcacaaattg gagatcagta tgcggactta 1501 tttttggctg ccaaaaacct tagcgatgca atcctcctat ctgacatact gagagttaat 1561 actgagatta ccaaggcgcc gttatccgct tcaatgatca aaaggtacga tgaacatcac 1621 caagacttga cacttctcaa ggccctagtc cgtcagcaac tgcctgagaa atataaggaa 1681 atattctttg atcagtcgaa aaacgggtac gcaggttata ttgacggcgg agcgagtcaa 1741 gaggaattct acaagtttat caaacccata ttagagaaga tggatgggac ggaagagttg 1801 cttgtaaaac tcaatcgcga agatctactg cgaaagcagc ggactttcga caacggtagc 1861 attccacatc aaatccactt aggcgaattg catgctatac ttagaaggca ggaggatttt 1921 tatccgttcc tcaaagacaa tcgtgaaaag attgagaaaa tcctaacctt tcgcatacct 1981 tactatgtgg gacccctggc ccgagggaac tctcggttcg catggatgac aagaaagtcc 2041 gaagaaacga ttactccatg gaattttgag gaagttgtcg ataaaggtgc gtcagctcaa 2101 tcgttcatcg agaggatgac caactttgac aagaatttac cgaacgaaaa agtattgcct 2161 aagcacagtt tactttacga gtatttcaca gtgtacaatg aactcacgaa agttaagtat 2221 gtcactgagg gcatgcgtaa acccgccttt ctaagcggag aacagaagaa agcaatagta 2281 gatctgttat tcaagaccaa ccgcaaagtg acagttaagc aattgaaaga ggactacttt 2341 aagaaaattg aatgcttcga ttctgtcgag atctccgggg tagaagatcg atttaatgcg 2401 tcacttggta cgtatcatga cctcctaaag ataattaaag ataaggactt cctggataac 2461 gaagagaatg aagatatctt agaagatata gtgttgactc ttaccctctt tgaagatcgg 2521 gaaatgattg aggaaagact aaaaacatac gctcacctgt tcgacgataa ggttatgaaa 2581 cagttaaaga ggcgtcgcta tacgggctgg ggacgattgt cgcggaaact tatcaacggg 2641 ataagagaca agcaaagtgg taaaactatt ctcgattttc taaagagcga cggcttcgcc 2701 aataggaact ttatgcagct gatccatgat gactctttaa ccttcaaaga ggatatacaa 2761 aaggcacagg tttccggaca aggggactca ttgcacgaac atattgcgaa tcttgctggt 2821 tcgccagcca tcaaaaaggg catactccag acagtcaaag tagtggatga gctagttaag 2881 gtcatgggac gtcacaaacc ggaaaacatt gtaatcgaga tggcacgcga aaatcaaacg 2941 actcagaagg ggcaaaaaaa cagtcgagag cggatgaaga gaatagaaga gggtattaaa 3001 gaactgggca gccagatctt aaaggagcat cctgtggaaa atacccaatt gcagaacgag 3061 aaactttacc tctattacct acaaaatgga agggacatgt atgttgatca ggaactggac 3121 ataaaccgtt tatctgatta cgacgtcgat gccattgtac cccaatcctt tttgaaggac 3181 gattcaatcg acaataaagt gcttacacgc tcggataaga accgagggaa aagtgacaat 3241 gttccaagcg aggaagtcgt aaagaaaatg aagaactatt ggcggcagct cctaaatgcg
3301 aaactgataa cgcaaagaaa gttcgataac ttaactaaag ctgagagggg tggcttgtct 3361 gaacttgaca aggccggatt tattaaacgt cagctcgtgg aaacccgcca aatcacaaag 3421 catgttgcac agatactaga ttcccgaatg aatacgaaat acgacgagaa cgataagctg 3481 attcgggaag tcaaagtaat cactttaaag tcaaaattgg tgtcggactt cagaaaggat 3541 tttcaattct ataaagttag ggagataaat aactaccacc atgcgcacga cgcttatctt 3601 aatgccgtcg tagggaccgc actcattaag aaatacccga agctagaaag tgagtttgtg 3661 tatggtgatt acaaagttta tgacgtccgt aagatgatcg cgaaaagcga acaggagata 3721 ggcaaggcta cagccaaata cttcttttat tctaacatta tgaatttctt taagacggaa 3781 atcactctgg caaacggaga gatacgcaaa cgacctttaa ttgaaaccaa tggggagaca 3841 ggtgaaatcg tatgggataa gggccgggac ttcgcgacgg tgagaaaagt tttgtccatg 3901 ccccaagtca acatagtaaa gaaaactgag gtgcagaccg gagggttttc aaaggaatcg 3961 attcttccaa aaaggaatag tgataagctc atcgctcgta aaaaggactg ggacccgaaa 4021 aagtacggtg gcttcgatag ccctacagtt gcctattctg tcctagtagt ggcaaaagtt 4081 gagaagggaa aatccaagaa actgaagtca gtcaaagaat tattggggat aacgattatg 4141 gagcgctcgt cttttgaaaa gaaccccatc gacttccttg aggcgaaagg ttacaaggaa 4201 gtaaaaaagg atctcataat taaactacca aagtatagtc tgtttgagtt agaaaatggc 4261 cgaaaacgga tgttggctag cgccggagag cttcaaaagg ggaacgaact cgcactaccg 4321 tctaaatacg tgaatttcct gtatttagcg tcccattacg agaagttgaa aggttcacct 4381 gaagataacg aacagaagca actttttgtt gagcagcaca aacattatct cgacgaaatc 4441 atagagcaaa tttcggaatt cagtaagaga gtcatcctag ctgatgccaa tctggacaaa 4501 gtattaagcg catacaacaa gcacagggat aaacccatac gtgagcaggc ggaaaatatt 4561 atccatttgt ttactcttac caacctcggc gctccagccg cattcaagta ttttgacaca 4621 acgatagatc gcaaacgata cacttctacc aaggaggtgc tagacgcgac actgattcac 4681 caatccatca cgggattata tgaaactcgg atagatttgt cacagcttgg gggtgacgga 4741 tcccccaaga agaagaggaa agtctga(SEQ ID NO: 18060).
[00783] Em certas modalidades, a sequência de ácido nucleico co- dificando uma proteína de fusão dCas9-Clo051 (modalidade 2) da pre- sente invenção pode compreender um DNA. Em certas modalidades, a sequência de ácido nucleico codificando uma proteína de fusão dCas9-Clo051 (modalidade 2) da presente invenção pode compreen- der uma RNA.
EXEMPLOS Exemplo 1: Construção e Caracterização in vitro de CARTirinas de PSMA5 e PSMA8
[00784] As CARTirinas de PSMA5 e PSMA8 foram construídas co- mo mostrado nas Figuras 1, 2, 3A-3C e 4A-4C. A Figura 5 ilustra a es- trutura das CARTirinas de anti-PSMA.
[00785] A expressão de superfície de CARTirinas da presente in-
venção foi avaliada por citometria de fluxo 24 horas após a eletropora- ção de mRNA de uma sequência codificando uma CARTirina de PSMA5 ou PSMA8 em células T pan humanas (Figura 6A). Por cito- metria de fluxo, a expressão de proteína de PSMA de superfície foi detectada nas linhagens de células tumorais LNCaP e K562 transfec- tadas com PSMA (Figura 6B). A funcionalidade das células T expres- sando CARTirina foi medida por degranulação contra linhagens tumo- rais. Foi observada degranulação de células T de CARTirina de PSMA eletroporadas por RNA contra linhagens de células tumorais de PSMA+ (Figura 6C). A expressão de proteína de superfície de PSMA foi detectada por citometria de fluxo após transfecção de linhagens de células K562 usando quantidades crescentes de mRNA de PSMA (Fi- gura 6D). Foi observada degranulação de células T de CARTirina de PSMA eletroporadas por RNA contra K562 expressando várias quanti- dades de proteína de PSMA (Figura 6E). Juntos, esses dados mos- tram que as CARTirinas de PSMA5 e PSMA8 podem ser expressas sobre a superfície de células T e facilitam a função citotóxica contra alvos de célula de PSMA+.
[00786] Para apoiar a avaliação in vivo de CARTirinas de PSMA, P- PSMA5-101 e P-PSMA8-101 foram construídos utilizando o sistema de modificação de DNA piggyBac. CARTirina de PSMA foi detectada sobre a superfície de células T humanas primárias de um doador re- presentativo que foram transpostas com os plasmídeos de P-PSMA5- 101 ou P-PSMA8-101 (Figura 7A). A análise de citometria de fluxo usando marcadores de expressão de superfície mostrou que as célu- las T expressando CARTirina de PSMA tinham marcadores de fenóti- po de memória de célula-tronco T, mas não ativação e / ou função de fenótipo de exaustão de células T (Figura 7B-7C). A análise ELISA mostrou que células T expressando CARTirinas de PSMA causaram secreção de IFNγ em células expressando PSMA (células LNCaP e
K562.PSMA), demonstrando função efetora das células T (Figura 7D). As células T expressando CARTirinas de PSMA mostraram forte fun- ção citotóxica por um ensaio de exterminação padrão e um ensaio de proliferação de células (Figura 7E-7F). Juntos, esses dados mostram que a expressão de superfície de CARTirinas de PSMA P-PSMA5-101 e P-PSMA8-101 em células T demonstrou função citotóxica e capaci- dade proliferativa in vitro contra alvos de célula PSMA+. Seguindo este forte desempenho in vitro, a capacidade das CARTirinas de PSMA de funcionar in vivo foi avaliada. Exemplo 2: Caracterização In vivo de CARTirinas PSMA5 e PSMA8 usando um modelo de xenoenxerto de murino
[00787] A Figura 8A representa o cronograma de tratamento para um estudo in vivo em camundongos usando a CARTirina P-PSMA8-
101. A atividade antitumoral foi avaliada pela sobrevivência (Figura 8B), expansão e detecção da célula T CD8 + de PSMA8-101 no san- gue (Figura 8C), avaliação do volume do tumor por medição por com- passo de calibre (Figura 8D), e bioluminescência do tumor LNCaP (Fi- gura 8E -F). P-PSMA8-101 em doses de "estresse" e padrão demons- traram eficácia e sobrevivência antitumorais significantemente realça- das em comparação com camundongos de controle "sem células T" contra tumores sólidos SC LNCaP.luc estabelecidos em camundonn- gos NSG. Especificamente, não há nenhuma sobrevivência em ani- mais de controle, 50% de sobrevivência em animais tratados com uma dose 'ultra-baixa' de P-PSMA8-101, e 100% de sobrevivência em ani- mais tratados com a dose de 'estresse' ou padrão de P-PSMA8-101. P-PSMA8-101 na dose padrão eliminou o tumor estabelecido LNCaP em 100% dos animais durante o estudo (42 dias após o tratamento), enquanto 2/3 dos animais dosados com "estresse" permaneceram li- vres do tumor. No sangue periférico, P-PSMA8-101 expandiu e deu origem a células T de CARTirina+ de PSMA8 efetoras diferenciadas que foram concomitantes com um decréscimo em carga de tumor abaixo do detectável por compasso de calibre e limites de imageamen- to bioluminescente. P-PSMA8-101 então contraído, ainda persistiu no sangue periférico. Juntos, esses dados demonstram que animais ex- pressando CARTirina de PSMA8 demonstram uma carga tumoral re- duzida em comparação aos controles.
[00788] A Figura 9A descreve o esquema de tratamento para um estudo in vivo em camundongos usando as CARTirinas P-PSMA5-101 e P-PSMA8-101 em uma dose de "estresse" de (4x106) usando um modelo de xenoenxerto murino. A atividade antitumoral foi avaliada pela sobrevivência (Figura 9B), expansão e detecção de células T CD8+ no sangue (Figura 9C), avaliação do volume do tumor por medi- ção por compasso de calibre (Figura 9D), e bioluminescência do tumor LNCaP (Figura 9E- F). P-PSMA5-101 e P-PSMA8-101 em uma dose de 'estresse "demonstraram eficácia e sobrevivência antitumoral signi- ficantemente realçadas em comparação com camundongos de contro- le de células T (nenhum CAR) contra tumores sólidos SC LNCaP.luc em camundonngos NSG. Especificamente, não há nenhuma sobrevi- vência em animais de controle de células T (nenhum CAR), 25% de sobrevivência no grupo tratado com P-BCMA-101, 75% de sobrevi- vência no grupo tratado com P-PSMA5-101, e 100% de sobrevivência em animais tratados com uma dose de "estresse" de P-PSMA8-101. No sangue periférico, P-PSMA5-101 e P-PSMA8-101 expandiram e deram origem a células T de CARTirina + efetoras diferenciadas que foram concomitantes com um decréscimo em carga de tumor abaixo do detectável por compasso de calibre e limites de imageamento bio- luminescente. Estas células então contraídas, ainda persistiram no sangue periférico. Exemplo 3: Expressão e função de interruptor de segurança iC9 integrado à piggyBac em células T pan humanas
[00789] As células T pan humanas foram nucleofetadas usando um nucleofetor Amaxa 4D com um dos quatro transposons piggyBac. As células T modificadas que receberam a condição "mock" foram nucleo- fetadas com um transposon piggyBac vazio. As células T modificadas receberam um transposon piggyBac contendo um agente terapêutico sozinho (uma sequência que codifica uma CARTirina) ou um transpo- son piggyBac contendo uma sequência iC9 integrada e um agente te- rapêutico (uma sequência que codifica uma CARTirina).
[00790] A Figura 8 fornece um diagrama esquemático do interruptor de segurança iC9, que contém uma região de ligação ao ligante, um ligante, e um polipeptídeo de caspase 9 truncado. Especificamente, o polipeptídeo iC9 contém uma região de ligação ao ligante compreen- dendo um polipeptídeo de proteína 12 de ligação a FK506 (FKBP12) incluindo uma substituição de valina (V) por fenilalanina (F) na posição 36 (F36V). Em certas modalidades, o polipeptídeo FKBP12 é codifica- do por uma sequência de aminoácido compreendendo
GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPF
KFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPP HATLVFDVELLKLE (SEQ ID NO: 18026). Em certas modalidades, o polipeptídeo FKBP12 é codificado por uma sequência de ácido nucleico compreendendo
GGGGTCCAGGTCGAGACTATTTCACCAGGGGATGGGCGAACATT TCCAAAAAGGGGCCAGACTTGCGTCGTGCATTACACCGGGATGCT GGAGGACGGGAAGAAAGTGGACAGCTCCAGGGATCGCAACAAGC CCTTCAAGTTCATGCTGGGAAAGCAGGAAGTGATCCGAGGATGG GAGGAAGGCGTGGCACAGATGTCAGTCGGCCAGCGGGCCAAACT GACCATTAGCCCTGACTACGCTTATGGAGCAACAGGCCACCCAG
GGATCATTCCCCCTCATGCCACCCTGGTCTTCGAT GTGGAACTGCTGAAGCTGGAG (SEQ ID NO: 18027). Em certas modalidades, o agente de indução específico para a região de ligação ao ligante pode compreender um polipeptídeo de proteína 12 de ligação a FK506 (FKBP12) tendo uma substituição de valina (V) por fenilalanina (F) na posição 36 (F36V) que compreende AP20187 e/ou AP1903, ambos os fármacos sintéticos.
[00791] Em certas modalidades dos polipeptídeos proapoptóticos induzíveis, polipeptídeos de caspase induzíveis ou polipeptídeos de caspase 9 truncados da presente invenção, a região ligante é codifica- da por um aminoácido compreendendo GGGGS (SEQ ID NO: 18028) ou uma sequência de ácido nucleico compreendendo GGAGGAGGA- GGATCC (SEQ ID NO: 18029). Em certas modalidades, a sequência de ácido nucleico codificando o ligante não compreende um sítio de restrição.
[00792] Em certas modalidades do polipeptídeo de caspase 9 trun- cados da presente invenção, o polipeptídeo de caspase 9 truncado é codificado por uma sequência de aminoácido que não compreende uma arginina (R) na posição 87 da sequência. Alternativamente, ou em adição, em certas modalidades dos polipeptídeos proapoptóticos indu- zíveis, polipeptídeos de caspase induzíveis ou polipeptídeos de cas- pase 9 truncados da presente invenção, o polipeptídeo de caspase 9 truncado é codificado por uma sequência de aminoácido que não compreende uma alanina (A) na posição 282 da sequência. Em certas modalidades dos polipeptídeos proapoptóticos induzíveis, polipeptí- deos de caspase induzíveis ou polipeptídeos de caspase 9 truncados da presente invenção, o polipeptídeo de caspase 9 truncado é codifi- cado por um aminoácido compreendendo
GFGDVGALESLRGNADLAYILSMEPCGHCLIINNVNFCRESGLRTRT GSNIDCEKLRRRFSSLHFMVEVKGDLTAKKMVLALLELAQQDHGALD CCVVVILSHGCQASHLQFPGAVYGTDGCPVSVEKIVNIFNGTSCPSL GGKPKLFFIQACGGEQKDHGFEVASTSPEDESPGSNPEPDATPFQE GLRTFDQLDAISSLPTPSDIFVSYSTFPGFVSWRDPKSGSWYVETLD
DIFEQWAHSEDLQSLLLRVANAVSVKGIYKQMPGCFNFLRKKLFFKT S (SEQ ID NO: 18030) ou uma sequência de ácido nucleico compreendendo
GGATTTGGGGACGTGGGGGCCCTGGAGTCTCTGCGAGGAAATGC CGATCTGGCTTACATCCTGAGCATGGAACCCTGCGGCCACTGTCT GATCATTAACAATGTGAACTTCTGCAGAGAAAGCGGACTGCGAAC ACGGACTGGCTCCAATATTGACTGTGAGAAGCTGCGGAGAAGGTT CTCTAGTCTGCACTTTATGGTCGAAGTGAAAGGGGATCTGACCGC CAAGAAAATGGTGCTGGCCCTGCTGGAGCTGGCTCAGCAGGACC ATGGAGCTCTGGATTGCTGCGTGGTCGTGATCCTGTCCCACGGG TGCCAGGCTTCTCATCTGCAGTTCCCCGGAGCAGTGTACGGAACA GACGGCTGTCCTGTCAGCGTGGAGAAGATCGTCAACATCTTCAAC GGCACTTCTTGCCCTAGTCTGGGGGGAAAGCCAAAACTGTTCTTT ATCCAGGCCTGTGGCGGGGAACAGAAAGATCACGGCTTCGAGGT GGCCAGCACCAGCCCTGAGGACGAATCACCAGGGAGCAACCCTG AACCAGATGCAACTCCATTCCAGGAGGGACTGAGGACCTTTGACC AGCTGGATGCTATCTCAAGCCTGCCCACTCCTAGTGACATTTTCG TGTCTTACAGTACCTTCCCAGGCTTTGTCTCATGGCGCGATCCCA AGTCAGGGAGCTGGTACGTGGAGACACTGGACGACATCTTTGAA CAGTGGGCCCATTCAGAGGACCTGCAGAGCCTGCTGCTGCGAGT GGCAAACGCTGTCTCTGTGAAGGGCATCTACAAACAGATGCCCG
GGTGCTTCAATTTTCTGAGAAAGAAACTGTTCTTTAAGACTTCC (SEQ ID NO: 18031).
[00793] Em certas modalidades dos polipeptídeos proapoptóticos induzíveis, em que o polipeptídeo compreende um polipeptídeo de caspase 9 truncado, o polipeptídeo proapoptótico induzível é codifica- do por uma sequência de aminoácido compreendendo
GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPF KFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPP HATLVFDVELLKLEGGGGSGFGDVGALESLRGNADLAYILSMEPCGH CLIINNVNFCRESGLRTRTGSNIDCEKLRRRFSSLHFMVEVKGDLTAK KMVLALLELAQQDHGALDCCVVVILSHGCQASHLQFPGAVYGTDGC PVSVEKIVNIFNGTSCPSLGGKPKLFFIQACGGEQKDHGFEVASTSPE DESPGSNPEPDATPFQEGLRTFDQLDAISSLPTPSDIFVSYSTFPGFV
SWRDPKSGSWYVETLDDIFEQWAHSEDLQSLLLRVANAVSVKGIYK QMPGCFNFLRKKLFFKTS (SEQ ID NO: 18032) ou a sequência de ácido nucleico compreendendo ggggtccaggtcgagactatttcaccaggggatgggcgaacatttccaaaaaggggccagactt gcgtcgtgcattacaccgggatgctggaggacgggaagaaagtggacagctccagggatcgc aacaagcccttcaagttcatgctgggaaagcaggaagtgatccgaggatgggaggaaggcgt ggcacagatgtcagtcggccagcgggccaaactgaccattagccctgactacgcttatggagca acaggccacccagggatcattccccctcatgccaccctggtcttcgatgtggaactgctgaagctg gagggaggaggaggatccggatttggggacgtgggggccctggagtctctgcgaggaaatgc cgatctggcttacatcctgagcatggaaccctgcggccactgtctgatcattaacaatgtgaacttct gcagagaaagcggactgcgaacacggactggctccaatattgactgtgagaagctgcggaga aggttctctagtctgcactttatggtcgaagtgaaaggggatctgaccgccaagaaaatggtgctg gccctgctggagctggctcagcaggaccatggagctctggattgctgcgtggtcgtgatcctgtcc cacgggtgccaggcttctcatctgcagttccccggagcagtgtacggaacagacggctgtcctgt cagcgtggagaagatcgtcaacatcttcaacggcacttcttgccctagtctggggggaaagccaa aactgttctttatccaggcctgtggcggggaacagaaagatcacggcttcgaggtggccagcacc agccctgaggacgaatcaccagggagcaaccctgaaccagatgcaactccattccaggaggg actgaggacctttgaccagctggatgctatctcaagcctgcccactcctagtgacattttcgtgtctta cagtaccttcccaggctttgtctcatggcgcgatcccaagtcagggagctggtacgtggagacact ggacgacatctttgaacagtgggcccattcagaggacctgcagagcctgctgctgcgagtggca aacgctgtctctgtgaagggcatctacaaacagatgcccgggtgcttcaattttctgagaaagaaa ctgttctttaagacttcc(SEQ ID NO: 18033).
[00794] Para testar o interruptor de segurança iC9, cada uma das quatro células T modificadas foram incubadas durante 24 horas com AP1903 a 0, 0,1 nM, 1 nM, 10 nM, 100 nM ou 1000 nM (um agente de indução para AP1903). A viabilidade foi analisada por citometria de fluxo utilizando 7-aminoactinomicina D (7-AAD), um intercalador fluo- rescente, como marcador de células em apoptose.
[00795] A viabilidade celular foi analisada no dia 12 (veja Figura 9). Os dados demonstram um deslocamento das populações de células dos quadrantes do canto inferior direito para o esquerdo superior com aumento da concentração do agente de indução em células contendo o construto iC9; entretanto, este efeito não é observado em células sem o construto iC9 (aquelas que recebem apenas a CARTirina), nas quais as células estão uniformemente distribuídas entre essas duas áreas independente da concentração do agente de indução. Além dis- so, a viabilidade celular foi analisada no dia 19 (veja Figura 10). Os dados revelam a mesma tendência mostrada na Figura 9 (dia 12 pós- nucleofecção); entretanto, o deslocamento da população para o qua- drante esquerdo superior é mais pronunciado neste ponto de tempo posterior (dia 19 pós-nucleofecção).
[00796] A quantificação dos resultados agregados foi realizada e é fornecida na Figura 11, mostrando um impacto significativo do interrup- tor de segurança iC9 sobre a viabilidade celular percentual como uma função da concentração do agente de indução (AP1903) do interruptor iC9 para cada tipo de célula modificada no dia 12 (Figura 9 e gráfico à esquerda) ou dia 19 (Figura 10 e gráfico à direita). A presença do inter- ruptor de segurança iC9 induz apoptose em uma maioria significativa das células no dia 12 e o efeito é ainda mais dramático no dia 19.
[00797] Os resultados deste estudo mostram que o interruptor de segurança iC9 é extremamente eficaz na eliminação de células ativas após contacto com um agente de indução (por exemplo, AP1903) por- que AP1903 induz apoptose mesmo nas concentrações mais baixas do estudo (0,1 nM). Além disso, o interruptor de segurança iC9 pode ser expresso funcionalmente como parte de um vetor tricistrônico. Exemplo 4: Redução da eficiência de proteínas de sinalização de ponto de verificação sobre células T blindadas
[00798] Para criar células T blindadas que têm potencial terapêutico realçado, modificações genéticas podem ser feitas a fim de tornar as células T menos sensíveis a pontos de verificação imunológicos e/ou metabólicos. Um mecanismo para produzir células T blindadas é inibir a sinalização do ponto de verificação e eliminar vários receptores de ponto de verificação. A plataforma Cas-CLOVER™ foi usada para al- vejar e eliminar o receptor de ponto de verificação PD-1, TGFβR2, LAG- 3, Tim-3, e CTLA-4 em células T pan primárias em repouso (ou quiescentes). Como medido por citometria de fluxo, a edição do gene resultou em 30 a 70% de perda de expressão de proteína na superfície celular (Figura 13). Esses resultados mostram que o Cas-CLOVER™ é capaz de alvejar de forma eficiente o nocaute desses genes, resultan- do na perda da expressão de proteína alvo na superfície das células T. A eficiência de nocaute pode ser significativamente aumentada por otimização adicional de pares de RNA guia, ou pelo uso de pares de RNA guia adicionais alvejando o mesmo gene e/ou reguladores ou promotores do gene alvo. Exemplo 5: Estratégias para a expressão de proteínas de sinaliza- ção intracelular nulas ou comutadas sobre células T blindadas
[00799] Outra estratégia para produzir células T blindadas é reduzir ou inibir a sinalização de ponto de verificação endógeno, expressando vários receptores de ponto de verificação modificados / quiméricos que possuem um domínio de sinalização intracelular alterado ou ausente. Os sinais de ponto de verificação que podem ser alvejados usando esta estratégia incluem PD-1 ou TGFβRII de células T, que se ligam ao ligante PD-L1 e citocina TGFβ, respectivamente. Figura 14 mostra um diagrama esquemático de várias estratégias para a produção de receptor negativo engodo / nulo / dominante (receptores nulos) para dois receptores inibitórios diferentes (PD-1 (painel de topo) e TGFβRII
(painel de base)). Para projetar receptores nulos, o domínio intracelu- lar (ICD) de PD1 ou TGFβRII pode ser mutado (nulo mutado) ou dele- tado (nulo truncado). Como resultado, a ligação dos ligantes cognatos ao receptor nulo não resulta na liberação do sinal de ponto de verifica- ção às células T.
Além disso, uma vez que o receptor Nulo compete com os receptores de tipo selvagem pela ligação do (s) ligante (s) en- dógeno (s), qualquer ligação pelo receptor Nulo sequestra ligante (s) endógeno (s) da ligação ao receptor de tipo selvagem.
Isso resulta na diluição do nível geral de sinalização do ponto de verificação efetiva- mente liberado à célula T, desse modo, reduzindo ou bloqueando a inibição do ponto de verificação.
A Figura 15 também mostra estraté- gias de projeto de receptor interruptor para os receptores inibitórios PD-1 (painel de topo) e TGFβRII (painel de base). Nos receptores in- terruptores, o ICD de tipo selvagem é substituído pelo ICD de uma mo- lécula imunoestimuladora (interruptor coestimulador) ou de uma molé- cula inibitória diferente (interruptor inibitório). As moléculas imunoesti- mulatórias incluem, porém, não estão limitadas a, CD3z, CD28, 4-1BB e os exemplos listados na Tabela 1. As moléculas inibitórias incluem, porém, não estão limitadas a, CTLA4, PD1, Lag3 e os exemplos lista- dos nas Tabelas 1 e 9. No primeiro caso, a ligação do ligante endóge- no pelo receptor interruptor modificado resulta na liberação de um sinal positivo para as células T, ajudando assim a realçar a estimulação das células T, facilitando a continuação do alvejamento do tumor e elimi- nação.
No último caso, a ligação do ligante endógeno pelo receptor interruptor modificado resulta na liberação de um sinal negativo às cé- lulas T, ajudando assim a reduzir a estimulação e atividade das células T.
Exemplo 6: Realce de expressão de superfície de proteínas de si- nalização intracelular nulas ou comutadas de PD1 e TGFβRII so- bre células T blindadas
[00800] Para criar células T blindadas, vários receptores nulo trun- cados expressando peptídeos de sinal alternativo (SP) e domínios de transmembrana (TM) foram projetados e testados para expressão má- xima sobre a superfície de células T modificadas. A Figura 15A mostra diagramas esquemáticos de vários construtos de receptor nulo para PD-1 (parte superior) e TGFβRII (parte inferior). Os domínios extrace- lulares (ECD) dessas proteínas foram modificados de modo que o pep- tídeo sinal de tipo selvagem (SP) e / ou os domínios de transmembra- na (TM) foram substituídos pelo receptor CD8a de células T humanas (setas vermelhas). Cada um dos seis construtos nulos truncados mos- trados na Figura 15A foi sintetizado por DNA e em seguida subclonado em um vetor de DNA mRNA IVT (pRT). O mRNA de alta qualidade foi produzido por meio de IVT para cada um. A transfecção do mRNA que codifica cada uma das seis moléculas foi realizada usando a liberação de eletroporação (EP) em células T humanas primárias e análise FACS foi realizada 24 horas após a EP para avaliar o nível de expres- são de cada construto sobre a superfície celular (Figura 15B). Por ci- tometria de fluxo, a substituição do WT SP com o CD8a alternativo (02.8aSP-PD-1 e 02.8aSP-TGFβRII) resultou no maior nível de ex- pressão na superfície das células T. O receptor nulo 02.8aSP-PD-1 exibiu um MFI de 43.680, que é 177 vezes maior do que a expressão de PD-1 de células T endógenas e 2,8 vezes maior do que o receptor nulo WT PD-1. O receptor nulo 02.8aSP-TGFβRII exibiu um MFI de
13.809, que é 102 vezes maior do que a expressão de TGFβRII de célula T endógena e 1,8 vezes maior do que o receptor nulo WT TGFβRII. Estes resultados mostram que a substituição de SP de tipo selvagem com o CD8a SP alternativo para ambas as proteínas inibido- ras PD1 e TGFβRII leva à expressão de superfície realçada do recep- tor nulo ou interruptor. Isto, por sua vez, irá maximizar a inibição ou coestimulação do ponto de verificação, respectivamente, após a liga-
ção do (s) ligante (s) endógeno (s). Exemplo 7: Projeto de vetores indutíveis de NF-KB para expres- são em células T modificadas
[00801] Dois vetores indutíveis NF-KB de ativação de células T fo- ram desenvolvidos (Figuras 16A e 16B); um com o sistema de expres- são de gene (GES) na orientação direta (A) e o outro na direção com- plementar (B), ambos precedendo o promotor EF1a constitutivo. Esses vetores também direcionam a expressão de uma molécula CAR e um gene de seleção DHFR, separado por uma sequência T2A. Tanto o sistema indutível NF-KB condicional quanto os genes direcionados ao EF1a fazem parte de um transposon piggyBac que pode ser integrado permanentemente nas células T usando EP. Uma vez integradas ao genoma, as células T expressam constitutivamente o CAR na superfí- cie da membrana e o DHFR dentro da célula, enquanto a expressão do gene induzível por NF-KB, GFP, será expressa ao nível mais alto somente após a ativação das células T. Exemplo 8: Vetores indutíveis de NF-KB para expressão de GFP em células T modificadas
[00802] As células T foram nucleofetadas com um vetor piggyBac expressando um gene da muteína CAR anti-BCMA e DHFR sob con- trole de um promotor EF1a juntamente com a ausência (nenhum con- trole do sistema de expressão de gene (GES)) ou presença de um sis- tema de expressão indutível por NF-KB que conduz a expressão de GFP na orientação direta (pNFKB-GFP direto) ou reversa (pNFKB- GFP reverso). As células foram cultivadas na presença de seleção de metotrexato até que as células estivessem quase completamente em repouso (Dia 19) e expressão de GFP foi analisada no Dia 5 e Dia 19. No Dia 5, todas as células T estão proliferando e altamente estimula- das, com células portadoras do Cassete de expressão induzível de NF-KB produzindo altos níveis de GFP devido à forte atividade de
NFκB (veja Figura 17). As células de controle sem GES não expressa- ram níveis detectáveis de GFP. No Dia 19, as células T de GES esta- vam quase totalmente em repouso e a expressão de GFP era signifi- cativamente menor do que no Dia 5 (~ 1/8 MFI), uma vez que a ativi- dade de NFκB é menor. A expressão de GFP ainda é observada no Dia 19, o que pode ser devido à longa meia-vida da proteína de GFP (~ 30 horas), ou ao nível basal de atividade de NFκB através, por exemplo, de um TCR, um CAR, um receptor de citocina, ou um sinal do receptor do fator de crescimento. Exemplo 9: Vetores indutíveis de NF-KB para expressão de GFP mediada por CAR anti-BCMA em células T modificadas
[00803] As células T foram não modificadas (células T Mock) ou nucleofetadas com um vetor piggyBac expressando um gene de mute- ína CAR anti-BCMA e DHFR sob o controle de um promotor EF1a jun- tamente com a ausência (sem controle de GES) ou presença de um sistema de expressão induzível de NF-KB que conduz a expressão de GFP na orientação direta (pNFKB-GFP direto) ou reversa (pNFKB- GFP reverso). Todas as células foram cultivadas durante 22 dias, com ou sem seleção de metotrexato (células T Mock), até que as células estivessem quase completamente em repouso. As células foram então estimuladas durante 3 dias na ausência (sem estimulação) ou na pre- sença de BCMA-(K562), BMCA + (RPMI 8226), ou reagente de ativa- ção anti-CD3 anti-CD28 de controle positivo (estimulação CD3 / 28). A expressão de GFP era indetectável em todas as condições com as cé- lulas T de controle sem GES ou Mock. Entretanto, enquanto as células pNFKB-GFP com transposição direta e reversa exibiram pouca ex- pressão de GFP sobre o controle sem estimulação quando cultivadas com células BCMA-K562, ambas demonstraram regulação positiva dramática da expressão do gene na presença de células tumorais BCMA + ou sob condições de controle positivas (Figura 18). Pouca diferença na expressão de GFP foi observada entre as células pNFKB- GFP transpostas diretas e reversas que foram cocultivadas com célu- las tumorais BCMA+. Exemplo 10: Controle de expressão mediada por CAR anti-BCMA em células T modificadas
[00804] O nível de expressão do gene induzível pode ser regulado pelo número de elementos de resposta a montante ou precedendo o promotor induzível. As células T foram nucleofetadas com um vetor piggyBac que codifica uma CARTirina anti-BCMA seguido por um ge- ne de seleção, ambos sob controle de um promotor EF1a humano (Fi- gura 19). Além disso, os vetores codificaram adicionalmente o sistema de expressão de gene indutível de NF-KB condicional que conduz a expressão de uma proteína de CD19 truncada (dCD19) e incluíram uma série de elementos de resposta de NFKB (RE) variando de 0 a 5, sem GES (sem GES), ou receberam um pulso de eletroporação, mas nenhum ácido nucleico PigBac (Mock). Os dados são mostrados ape- nas para o GES na direção / orientação reversa (oposta). Todas as células foram cultivadas durante 18 dias e incluída a seleção para cé- lulas T modificadas por piggyBac utilizando a adição de metotrexato. As células foram então estimuladas durante 3 dias utilizando o rea- gente de ativação de conta anti-CD3 anti-CD28 e a expressão de su- perfície dCD19 foi analisada por FACS nos dias 0, 3 e 18, e os dados são apresentados como histogramas FACS e MFI de coloração de proteína alvo. A expressão de dCD19 de superfície foi detectada em níveis baixos no Dia 0 em todas as células T transpostas com vetores codificando o GES. Aos 3 dias pós-estimulação, foi observada uma regulação positiva dramática da expressão de dCD19 para todas as células T expressando o GES, com um aumento maior na expressão de superfície naquelas com números mais elevados de REs. Desse modo, a expressão de dCD19 de superfície foi diretamente proporcio-
nal ao número de REs codificados no GES. Nenhuma dCD19 foi de- tectada sobre a superfície de células T que não abrigava os controles GES: sem GES e Mock.
INCORPORAÇÃO POR REFERÊNCIA
[00805] Cada documento citado aqui, incluindo qualquer referência cruzada ou patente ou pedido relacionado, é, portanto, incorporado aqui por referência em sua totalidade, a menos que expressamente excluído ou de outra forma limitado. A citação de qualquer documento não é uma admissão de que é técnica anterior com respeito a qualquer invenção descrita ou reivindicada aqui ou que apenas, ou em qualquer combinação com qualquer outra referência ou referências, ensina, su- gere ou descreve qualquer invenção. Além disso, na medida em que qualquer significado ou definição de um termo neste documento confli- te com qualquer significado ou definição do mesmo termo em um do- cumento incorporado por referência, o significado ou definição atribuí- da a esse termo neste documento prevalecerá.
OUTRAS MODALIDADES
[00806] Embora modalidades particulares da presente invenção te- nham sido ilustradas e descritas, várias outras mudanças e modifica- ções podem ser feitas sem se afastar do espírito e escopo da presente invenção. O escopo das reivindicações anexas inclui todas essas mu- danças e modificações que se incluem no escopo desta presente in- venção.

Claims (44)

REIVINDICAÇÕES
1. Receptor de antígeno quimérico (CAR) caracterizado pe- lo fato de que compreende: (a) um ectodomínio compreendendo uma região de reco- nhecimento do antígeno, em que a região de reconhecimento do antí- geno compreende pelo menos uma Centirina específica do antígeno de membrana específica da próstata (PSMA); (b) um domínio de transmembrana, e (c) um endodomínio compreendendo pelo menos um domí- nio coestimulatório.
2. CAR de acordo com a reivindicação 1, caracterizado pelo fato de que o ectodomínio de (a) também compreende um peptídeo sinal.
3. CAR de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que o ectodomínio de (a) também compreende uma arti- culação entre a região de reconhecimento do antígeno e o domínio de transmembrana.
4. CAR de acordo com a reivindicação 2 ou 3, caracterizado pelo fato de que o peptídeo sinal compreende uma sequência codifi- cando um peptídeo sinal CD2, CD3δ, CD3ε, CD3γ, CD3ζ, CD4, CD8α, CD19, CD28, 4-1BB ou GM-CSFR humano.
5. CAR de acordo com a reivindicação 2 ou 3, caracterizado pelo fato de que o peptídeo sinal compreende uma sequência codifi- cando um peptídeo sinal CD8α humano.
6. CAR de acordo com a reivindicação 5, caracterizado pelo fato de que o peptídeo sinal compreende uma sequência de aminoáci- do compreendendo MALPVTALLLPLALLLHAARP (SEQ ID NO: 18004).
7. CAR de acordo com a reivindicação 5 ou 6, caracterizado pelo fato de que o peptídeo sinal é codificado por uma sequência de ácido nucleico compreendendo atggcactgccagtcaccgccctgctgctgcctctggctctgctgctgcacgcagctagacca (SEQ ID NO: 18005).
8. CAR de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o domínio de transmem- brana compreende uma sequência codificando um domínio de trans- membrana CD2, CD3δ, CD3ε, CD3γ, CD3ζ, CD4, CD8α, CD19, CD28, 4-1BB ou GM-CSFR humano.
9. CAR de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o domínio de transmem- brana compreende uma sequência codificando um domínio de trans- membrana CD8α humano.
10. CAR de acordo com a reivindicação 9, caracterizado pelo fato de que o domínio de transmembrana compreende uma se- quência de aminoácido compreendendo IYIWAPLAGTCGVLLLSLVITLYC (SEQ ID NO: 18006).
11. CAR de acordo com a reivindicação 9 ou 10, caracteri- zado pelo fato de que o domínio de transmembrana é codificado por uma sequência de ácido nucleico compreendendo atctacatttgggcaccactggccgggacctgtggagtgctgctgctgagcctggtcatcacactgt actgc (SEQ ID NO: 18007).
12. CAR de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o endodomínio compre- ende um endodomínio CD3ζ humano.
13. CAR de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o referido pelo menos um domínio coestimulatório compreende um segmento intracelular 4-1BB, CD28, CD40, ICOS, MyD88, OX-40 humano, ou qualquer combinação dos mesmos.
14. CAR de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o referido pelo menos um domínio coestimulatório compreende um domínio coestimulatório CD28 e/ou um 4-1BB humano.
15. CAR de acordo com a reivindicação 13 ou 14, caracteri- zado pelo fato de que o domínio coestimulatório CD3ζ compreende uma sequência de aminoácido compreendendo
RVKFSRSADAPAYKQGQNQLYNELNLGRREEYDVLDKRRGRDPEM
GGKPRRKNPQEGLYNELQKDKMAEAYSEIGMKGERRRGKGHDGLY QGLSTATKDTYDALHMQALPPR (SEQ ID NO: 18008).
16. CAR de acordo com a reivindicação 15, caracterizado pelo fato de que o domínio coestimulatório CD28 é codificado por uma sequência de ácido nucleico compreendendo cgcgtgaagtttagtcgatcagcagatgccccagcttacaaacagggacagaaccagctgtata acgagctgaatctgggccgccgagaggaatatgacgtgctggataagcggagaggacgcgac cccgaaatgggaggcaagcccaggcgcaaaaaccctcaggaaggcctgtataacgagctgc agaaggacaaaatggcagaagcctattctgagatcggcatgaagggggagcgacggagagg caaagggcacgatgggctgtaccagggactgagcaccgccacaaaggacacctatgatgctct gcatatgcaggcactgcctccaagg (SEQ ID NO: 18010).
17. CAR de acordo com a reivindicação 13 ou 14, caracteri- zado pelo fato de que o domínio coestimulatório 4-1BB compreende uma sequência de aminoácido compreendendo KRGRKKLLYIFKQPFMRPVQTTQEEDGCSCRFPEEEEGGCEL (SEQ ID NO: 18011).
18. CAR de acordo com a reivindicação 17, caracterizado pelo fato de que o domínio coestimulatório 4-1BB é codificado por uma sequência de ácido nucleico compreendendo aagagaggcaggaagaaactgctgtatattttcaaacagcccttcatgcgccccgtgcagactac ccaggaggaagacgggtgctcctgtcgattccctgaggaagaggaaggcgggtgtgagctg (SEQ ID NO: 18013).
19. CAR de acordo com qualquer uma das reivindicações
14 a 18, caracterizado pelo fato de que o domínio coestimulatório 4- 1BB é localizado entre o domínio de transmembrana e o domínio coes- timulatório CD28.
20. CAR de acordo com qualquer uma das reivindicações 2 a 19, caracterizado pelo fato de que a articulação compreende uma sequência derivada de uma sequência CD8α, IgG4, e/ou CD4 huma- na.
21. CAR de acordo com qualquer uma das reivindicações 2 a 19, caracterizado pelo fato de que a articulação compreende uma sequência derivada de uma sequência CD8α humana.
22. CAR de acordo com a reivindicação 20 ou 21, caracteri- zado pelo fato de que a articulação compreende uma sequência de aminoácido compreendendo
TTTPAPRPPTPAPTIASQPLSLRPEACRPAAGGAVHTRGLDFACD (SEQ ID NO: 18014).
23. CAR de acordo com a reivindicação 22, caracterizado pelo fato de que a articulação é codificada por uma sequência de ácido nucleico compreendendo
ACCACAACCCCTGCCCCCAGACCTCCCACACCCGCCCCTACCAT
CGCGAGTCAGCCCCTGAGTCTGAGACCTGAGGCCTGCAGGCCAG
CTGCAGGAGGAGCTGTGCACACCAGGGGCCTGGACTTCGCCTGC GAC (SEQ ID NO: 18016).
24. CAR de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que a referida pelo menos uma Centirina específica de PSMA compreende pelo menos um domí- nio de fibronectina tipo III (FN3).
25. CAR de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que a referida pelo menos uma Centirina específica de PSMA é capaz de especificamente ligar uma sequência de antígeno de membrana específico da próstata
(PSMA).
26. CAR de acordo com a reivindicação 25, caracterizado pelo fato de que a referida pelo menos uma Centirina específica de PSMA compreende ou consiste em uma sequência de aminoácido de
MLPAPKNLVVSRVTEDSARLSWDIDEQRDWFESFLIQYQESEKVGEA IVLTVPGSERSYDLTGLKPGTEYTVSIYGVYHVYRSNPLSAIFTT (SEQ ID NO: 18000).
27. CAR de acordo com a reivindicação 26, caracterizado pelo fato de que a referida pelo menos uma Centirina específica de PSMA compreende uma sequência de aminoácido tendo pelo menos 70% de identidade para a sequência de aminoácido de
MLPAPKNLVVSRVTEDSARLSWDIDEQRDWFESFLIQYQESEKVGEA IVLTVPGSERSYDLTGLKPGTEYTVSIYGVYHVYRSNPLSAIFTT (SEQ ID NO: 18000).
28. CAR de acordo com a reivindicação 25 ou 26, caracte- rizado pelo fato de que a referida pelo menos uma Centirina específica de PSMA compreende ou consiste na sequência de ácido nucleico de
ATGCTGCCTGCACCAAAGAACCTGGTGGTGTCTCGGGTGACCGA
GGACTCTGCCAGACTGAGCTGGGACATCGATGAGCAGAGGGATT
GGTTCGAGAGCTTTCTGATCCAGTATCAGGAGTCCGAGAAAGTGG
GCGAGGCCATCGTGCTGACAGTGCCTGGCAGCGAGCGGTCCTAT
GACCTGACCGGCCTGAAGCCAGGCACAGAGTACACCGTGTCCAT
CTACGGCGTGTATCACGTGTACAGGTCCAATCCTCTGTCTGCCAT CTTCACCACA (SEQ ID NO: 18001).
29. CAR de acordo com a reivindicação 25, caracterizado pelo fato de que a referida pelo menos uma Centirina específica de PSMA compreende ou consiste em uma sequência de aminoácido de
MLPAPKNLVVSRVTEDSARLSWAIDEQRDWFESFLIQYQESEKVGEAI VLTVPGSERSYDLTGLKPGTEYTVSIYGVYHVYRSNPLSAIFTT (SEQ ID NO: 18002).
30. CAR de acordo com a reivindicação 29, caracterizado pelo fato de que a referida pelo menos uma Centirina específica de PSMA compreende uma sequência de aminoácido tendo pelo menos 70% de identidade para a sequência de aminoácido de
MLPAPKNLVVSRVTEDSARLSWAIDEQRDWFESFLIQYQESEKVGEAI VLTVPGSERSYDLTGLKPGTEYTVSIYGVYHVYRSNPLSAIFTT (SEQ ID NO: 18002).
31. CAR de acordo com a reivindicação 25 ou 29, caracteri- zado pelo fato de que a referida pelo menos uma Centirina específica de PSMA compreende ou consiste na sequência de ácido nucleico de
ATGCTGCCTGCACCAAAGAACCTGGTGGTGTCTCGGGTGACCGA
GGACTCTGCCAGACTGAGCTGGGCCATCGACGAGCAGAGGGATT
GGTTCGAGAGCTTTCTGATCCAGTATCAGGAGTCCGAGAAAGTGG
GCGAGGCCATCGTGCTGACAGTGCCTGGCAGCGAGCGGTCCTAT
GATCTGACCGGCCTGAAGCCAGGCACAGAGTACACCGTGTCCAT
CTACGGCGTGTATCACGTGTACAGGTCCAATCCTCTGTCTGCCAT CTTCACCACA (SEQ ID NO: 18003).
32. CAR de acordo com a reivindicação 25, caracterizado pelo fato de que o referido pelo menos um domínio de fibronectina tipo III (FN3) é derivado de uma proteína humana.
33. CAR de acordo com a reivindicação 32, caracterizado pelo fato de que a proteína humana é Tenascina-C.
34. CAR de acordo com qualquer uma das reivindicações 25 ou 32 a 34, caracterizado pelo fato de que a sequência de consen- so compreende
LPAPKNLVVSEVTEDSLRLSWTAPDAAFDSFLIQYQESEKVGEAINLT VPGSERSYDLTGLKPGTEYTVSIYGVKGGHRSNPLSAEFTT (SEQ ID NO: 18018).
35. CAR de acordo com qualquer uma das reivindicações 25 ou 32-34, caracterizado pelo fato de que a sequência de consenso compreende
MLPAPKNLVVSEVTEDSLRLSWTAPDAAFDSFLIQYQESEKVGEAINL TVPGSERSYDLTGLKPGTEYTVSIYGVKGGHRSNPLSAEFTT (SEQ ID NO: 18019).
36. CAR de acordo com qualquer uma das reivindicações 25 ou 32 a 34, caracterizado pelo fato de que a sequência de consen- so compreende uma sequência tendo pelo menos 70% de identidade para a sequência de aminoácido de
LPAPKNLVVSEVTEDSLRLSWTAPDAAFDSFLIQYQESEKVGEAINLT VPGSERSYDLTGLKPGTEYTVSIYGVKGGHRSNPLSAEFTT (SEQ ID NO: 18018).
37. CAR de acordo com qualquer uma das reivindicações 25 ou 32 a 34, caracterizado pelo fato de que a sequência de consen- so é modificada em uma ou mais posições dentro de (a) uma alça A-B compreendendo ou consistindo nos resí- duos de aminoácido TEDS (SEQ ID NO: 18020) nas posições 13 a 16 da sequência de consenso; (b) uma alça B-C compreendendo ou consistindo nos resí- duos de aminoácido TAPDAAF (SEQ ID NO: 18021) nas posições 22- 28 da sequência de consenso; (c) uma alça C-D compreendendo ou consistindo nos resí- duos de aminoácido SEKVGE (SEQ ID NO: 18022) nas posições 38 a 43 da sequência de consenso; (d) uma alça D-E compreendendo ou consistindo nos resí- duos de aminoácido GSER (SEQ ID NO: 18023) nas posições 51 a 54 da sequência de consenso; (e) uma alça E-F compreendendo ou consistindo nos resí- duos de aminoácido GLKPG (SEQ ID NO: 18024) nas posições 60 a 64 da sequência de consenso; (f) uma alça F-G compreendendo ou consistindo nos resí-
duos de aminoácido KGGHRSN (SEQ ID NO: 18025) nas posições 75 a 81 da sequência de consenso; ou (g) qualquer combinação de (a)-(f).
38. CAR de acordo com qualquer uma das reivindicações 25 ou 32 a 37, caracterizado pelo fato de que compreende uma se- quência de consenso de pelo menos 5 domínios de fibronectina tipo III (FN3).
39. CAR de acordo com qualquer uma das reivindicações 25 ou 32 a 38, caracterizado pelo fato de que compreende uma se- quência de consenso de pelo menos 10 domínios de fibronectina tipo III (FN3).
40. CAR de acordo com qualquer uma das reivindicações 25 ou 32 a 39, caracterizado pelo fato de que compreende uma se- quência de consenso de pelo menos 15 domínios de fibronectina tipo III (FN3).
41. CAR de acordo com qualquer uma das reivindicações 1 a 40, caracterizado pelo fato de que a referida pelo menos uma Centi- rina liga um antígeno com pelo menos uma afinidade selecionada de um KD menor que ou igual a 10−9M, menor que ou igual a 10−10M, me- nor que ou igual a 10−11M, menor que ou igual a 10−12M, menor que ou igual a 10−13M, menor que ou igual a 10−14M, e menor que ou igual a 10−15M.
42. CAR de acordo com a reivindicação 41, caracterizado pelo fato de que o KD é determinado por ressonância de plasmônio de superfície.
43. Composição caracterizada pelo fato de que compreen- de o CAR como definido em qualquer uma das reivindicações prece- dentes e pelo menos um veículo farmaceuticamente aceitável.
44. Transposon caracterizado pelo fato de que compreende CAR como definido em qualquer uma das reivindicações 1 a 42.
BR112020018049-1A 2018-03-07 2019-03-07 Composições de cartirina e métodos para uso BR112020018049A2 (pt)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201862639978P 2018-03-07 2018-03-07
US62/639,978 2018-03-07
US201862745151P 2018-10-12 2018-10-12
US62/745,151 2018-10-12
US201862783140P 2018-12-20 2018-12-20
US62/783,140 2018-12-20
PCT/US2019/021224 WO2019173636A1 (en) 2018-03-07 2019-03-07 Cartyrin compositions and methods for use

Publications (1)

Publication Number Publication Date
BR112020018049A2 true BR112020018049A2 (pt) 2020-12-29

Family

ID=66182630

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020018049-1A BR112020018049A2 (pt) 2018-03-07 2019-03-07 Composições de cartirina e métodos para uso

Country Status (14)

Country Link
US (1) US20210107993A1 (pt)
EP (1) EP3762106A1 (pt)
JP (1) JP7399866B2 (pt)
KR (1) KR20200140270A (pt)
CN (1) CN112601583A (pt)
AU (1) AU2019230192A1 (pt)
BR (1) BR112020018049A2 (pt)
CA (1) CA3092947A1 (pt)
IL (1) IL277079A (pt)
MX (1) MX2020009309A (pt)
SG (1) SG11202008659TA (pt)
TW (1) TW202017592A (pt)
WO (1) WO2019173636A1 (pt)
ZA (1) ZA202005556B (pt)

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110520436A (zh) 2017-03-15 2019-11-29 潘迪恩治疗公司 靶向免疫耐受性
CN108728477B (zh) * 2017-04-24 2022-02-22 华东理工大学 一种高效的转座突变系统及构建方法
CN111010866A (zh) 2017-05-24 2020-04-14 潘迪恩治疗公司 靶向免疫耐受性
US10946068B2 (en) 2017-12-06 2021-03-16 Pandion Operations, Inc. IL-2 muteins and uses thereof
US10174091B1 (en) 2017-12-06 2019-01-08 Pandion Therapeutics, Inc. IL-2 muteins
WO2019191501A1 (en) * 2018-03-28 2019-10-03 Board Of Regents, The University Of Texas System Use of histone modifiers to reprogram effector t cells
US20220389077A1 (en) * 2018-09-05 2022-12-08 Poseida Therapeutics, Inc. Allogeneic cell compositions and methods of use
EP3891123A4 (en) 2018-12-03 2022-12-14 Board of Regents, The University of Texas System ANALOGS OF OLIGO-BENZAMIDE AND THEIR USE IN THE TREATMENT OF CANCER
JP2022513507A (ja) 2018-12-20 2022-02-08 ポセイダ セラピューティクス,インコーポレイティド ナノトランスポゾン組成物および使用方法
TW202110885A (zh) 2019-05-20 2021-03-16 美商潘迪恩治療公司 靶向MAdCAM之免疫耐受性
CA3149892A1 (en) 2019-09-05 2021-03-11 Eric M. Ostertag Allogeneic cell compositions and methods of use
EP4041759A4 (en) * 2019-10-07 2023-12-20 Fate Therapeutics, Inc. IMPROVED CHIMERIC ANTIGEN RECEPTOR FOR IMMUNE EFFECTOR CELL CULTURE AND USE THEREOF
GB201919019D0 (en) * 2019-12-20 2020-02-05 Autolus Ltd Antigen-binding domain
JP2023510121A (ja) 2019-12-20 2023-03-13 ポセイダ セラピューティクス,インコーポレイティド 抗Muc1組成物及び使用方法
EP4107187A4 (en) 2020-02-21 2024-07-03 Pandion Operations, Inc. TISSUE-TARGETED IMMUNOTOLERANCE WITH A CD39 EFFECTOR
WO2021173449A1 (en) * 2020-02-25 2021-09-02 The Board Of Trustees Of The Leland Stanford Junior University Orthogonal safety switches to eliminate genetically engineered cells
CN115515646A (zh) 2020-03-04 2022-12-23 波赛达治疗公司 用于治疗代谢性肝病的组合物和方法
EP4118107A1 (en) 2020-03-11 2023-01-18 Poseida Therapeutics, Inc. Chimeric stimulatory receptors and methods of use in t cell activation and differentiation
CN111458517B (zh) * 2020-03-13 2022-08-16 深圳大学 Selenof作为阿尔茨海默病药物靶点的应用
WO2021191870A1 (en) 2020-03-27 2021-09-30 Dcprime B.V. Ex vivo use of modified cells of leukemic origin for enhancing the efficacy of adoptive cell therapy
JP2023522857A (ja) 2020-04-10 2023-06-01 ジュノー セラピューティクス インコーポレイテッド B細胞成熟抗原を標的とするキメラ抗原受容体によって操作された細胞療法に関する方法および使用
KR20230011295A (ko) 2020-04-14 2023-01-20 포세이다 테라퓨틱스, 인크. 암 치료에 사용하기 위한 조성물 및 방법
JP2023541219A (ja) * 2020-07-17 2023-09-29 プロバイオジェン アーゲー 高活性トランスポゾン及びトランスポザーゼ
CN112194719A (zh) * 2020-09-01 2021-01-08 中日友好医院(中日友好临床医学研究所) Crt抗原和mage-a1抗原的制备及其应用
US20240000969A1 (en) 2020-10-21 2024-01-04 Poseida Therapeutics San Diego Compositions and methods for delivery of nucleic acids
CA3196677A1 (en) 2020-11-05 2022-05-12 Erik Hans MANTING Use of tumor-independent antigens in immunotherapies
IL303269A (en) 2020-12-03 2023-07-01 Century Therapeutics Inc Genetically engineered cells and uses thereof
CN112480242B (zh) * 2020-12-04 2023-06-06 中国人民解放军陆军军医大学 Spink7蛋白在制备预防和/或治疗溃疡性结肠炎的药物中的应用
CN112574291B (zh) * 2020-12-14 2022-10-21 上海交通大学 一种生物活性肽shrkfsaprhgslgflpr及其制备方法和应用
CN112625142B (zh) * 2021-02-03 2023-05-09 郑州大学第一附属医院 Cxcl9修饰的car-t结构及其应用
WO2022170184A1 (en) * 2021-02-05 2022-08-11 University Of Cincinnati Lipocalin 10 as a therapeutic agent for inflammation-induced organ dysfunction
WO2022182792A1 (en) 2021-02-23 2022-09-01 Poseida Therapeutics, Inc. Compositions and methods for delivery of nucleic acids
WO2022182797A1 (en) 2021-02-23 2022-09-01 Poseida Therapeutics, Inc. Genetically modified induced pluripotent stem cells and methods of use thereof
WO2022187671A1 (en) 2021-03-04 2022-09-09 Poseida Therapeutics, Inc. Compositions and methods for the treatment of hemophilia
JP2024513454A (ja) * 2021-04-07 2024-03-25 センチュリー セラピューティクス,インコーポレイテッド キメラ抗原受容体細胞のための人工細胞死/リポーター系ポリペプチドの組合せおよびその使用
CN117529333A (zh) 2021-04-16 2024-02-06 细胞基因公司 对先前进行过干细胞移植的患者的t细胞疗法
EP4082560B1 (en) * 2021-04-27 2025-02-26 Academia Sinica Prap1 polypeptide for use in treating hypertriglyceridemia
CN115477705B (zh) * 2021-06-16 2024-02-23 四川大学华西医院 一种基于颗粒酶b构建的嵌合抗原受体免疫细胞制备及其应用
EP4368719A4 (en) * 2021-07-09 2025-07-09 Neogentc Corp TRANSPOSON SYSTEM AND ASSOCIATED USES
JP2024536310A (ja) 2021-10-04 2024-10-04 ポセイダ セラピューティクス,インコーポレイティド トランスポゾン組成物及びその使用方法
AU2022358729A1 (en) 2021-10-04 2024-04-11 Poseida Therapeutics, Inc. Transposases and uses thereof
KR20240112994A (ko) 2021-11-03 2024-07-19 셀진 코포레이션 골수종을 치료하는 데 사용하기 위한 b-세포 성숙 항원에 특이적인 키메라 항원 수용체
CN114716564B (zh) * 2021-12-20 2023-02-28 四川大学华西医院 基于sectm1构建的嵌合抗原受体免疫细胞制备及其应用
CN113999873B (zh) * 2021-12-31 2022-05-20 北京市疾病预防控制中心 一种基因修饰的非人动物的构建方法及其应用
CN114470225B (zh) * 2022-01-20 2023-09-12 苏州市立医院 一种重组人cdc5l融合蛋白水凝胶、制备方法及应用
WO2023141576A1 (en) 2022-01-21 2023-07-27 Poseida Therapeutics, Inc. Compositions and methods for delivery of nucleic acids
CN119013393A (zh) 2022-01-28 2024-11-22 朱诺治疗学股份有限公司 制造细胞组合物的方法
CN114113639B (zh) * 2022-01-29 2022-04-19 北京大有天弘科技有限公司 一种血型抗体检测方法及其应用
EP4476351A1 (en) 2022-02-09 2024-12-18 Horizon Discovery Limited Polynucleotides with selection markers
EP4482967A1 (en) 2022-02-23 2025-01-01 Poseida Therapeutics, Inc. Genetically modified cells and methods of use thereof
CN114573678B (zh) * 2022-03-11 2022-12-27 中山大学 一种Rheb蛋白激活剂及其应用
CN114644685B (zh) * 2022-04-07 2023-07-04 华中科技大学同济医学院附属协和医院 一种可拮抗hnRNPK蛋白RNA结合活性的多肽HIP-15及其应用
WO2023220655A1 (en) 2022-05-11 2023-11-16 Celgene Corporation Methods to overcome drug resistance by re-sensitizing cancer cells to treatment with a prior therapy via treatment with a t cell therapy
KR20250008774A (ko) 2022-05-11 2025-01-15 셀진 코포레이션 T 세포 요법 및 그의 생산과 관련된 방법 및 용도
CN114748498A (zh) * 2022-05-13 2022-07-15 南京大学 针对CBFβ的shRNA在制备治疗结直肠癌药物中的应用
EP4532695A1 (en) 2022-05-25 2025-04-09 Celgene Corporation Methods of manufacturing t cell therapies
WO2023230548A1 (en) 2022-05-25 2023-11-30 Celgene Corporation Method for predicting response to a t cell therapy
WO2023235897A2 (en) * 2022-06-03 2023-12-07 Oyster Point Pharma. Inc. Aav vector encoding diamine oxidase and uses thereof
WO2024036273A1 (en) 2022-08-11 2024-02-15 Poseida Therapeutics, Inc. Chimeric cd8-alpha co-receptor compositions and methods of use
AU2023353199A1 (en) 2022-09-27 2025-03-20 Genentech, Inc. Inhibition of genotoxic stress to improve t cell engineering
WO2024097905A1 (en) 2022-11-02 2024-05-10 Celgene Corporation Methods of treatment with t cell therapy and immunomodulatory agent maintenance therapy
AU2023397989A1 (en) * 2022-12-12 2025-05-29 Genentech, Inc. Insulin treatment to improve t cell engineering
GB202219568D0 (en) * 2022-12-22 2023-02-08 Autolus Ltd Chimeric antigen receptor
WO2024145478A1 (en) * 2022-12-30 2024-07-04 Salk Institute For Biological Studies Transcription factors controlling t cell differentiation and disruption for tumor and virus control
WO2024155931A1 (en) 2023-01-20 2024-07-25 Poseida Therapeutics, Inc. Lipidoid compounds and related compositions and uses
WO2024155938A1 (en) 2023-01-20 2024-07-25 Poseida Therapeutics, Inc. Lipidoid compounds and related compositions and uses
WO2024168192A1 (en) 2023-02-10 2024-08-15 Celgene Corporation Assessment of bcma in biological samples
WO2024178069A1 (en) 2023-02-21 2024-08-29 Poseida Therapeutics, Inc. Compositions and methods for genome editing
WO2024178086A1 (en) 2023-02-21 2024-08-29 Poseida Therapeutics, Inc. Aav piggybac transposon polynucleotide compositions and methods of use therefor
WO2024178055A1 (en) 2023-02-21 2024-08-29 Poseida Therapeutics, Inc. Compositions and methods for genome editing
WO2024211505A1 (en) 2023-04-05 2024-10-10 Poseida Therapeutics, Inc. Chimeric transposases and uses thereof
WO2024211509A1 (en) 2023-04-05 2024-10-10 Poseida Therapeutics, Inc. Transposase polynucleotides and uses thereof
WO2024211512A2 (en) 2023-04-05 2024-10-10 Poseida Therapeutics, Inc. Transposases and uses thereof
CN116574193B (zh) * 2023-05-10 2025-02-11 浙江大学 一种可抑制肿瘤坏死因子的简化巨球蛋白及合成方法
WO2024233804A1 (en) 2023-05-10 2024-11-14 Poseida Therapeutics, Inc. Transposases and uses thereof
CN116948015B (zh) * 2023-07-18 2024-07-05 山西锦波生物医药股份有限公司 生物合成人体结构性材料xxii型胶原蛋白的方法
WO2025049925A2 (en) 2023-09-01 2025-03-06 Poseida Therapeutics, Inc. Lipidoid compounds and related compositions and uses
WO2025064507A1 (en) 2023-09-19 2025-03-27 Poseida Therapeutics, Inc. Compositions and methods for integration of viral vectors

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4309989A (en) 1976-02-09 1982-01-12 The Curators Of The University Of Missouri Topical application of medication by ultrasound with coupling agent
GB2097032B (en) 1981-04-22 1984-09-19 Teron International Urban Dev A combined ceiling air and services distribution system mechanical chasse and structural roof member
US4656134A (en) 1982-01-11 1987-04-07 Board Of Trustees Of Leland Stanford Jr. University Gene amplification in eukaryotic cells
US4818542A (en) 1983-11-14 1989-04-04 The University Of Kentucky Research Foundation Porous microspheres for drug delivery and methods for making same
US5168062A (en) 1985-01-30 1992-12-01 University Of Iowa Research Foundation Transfer vectors and microorganisms containing human cytomegalovirus immediate-early promoter-regulatory DNA sequence
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4766067A (en) 1985-05-31 1988-08-23 President And Fellows Of Harvard College Gene amplification
GB8601597D0 (en) 1986-01-23 1986-02-26 Wilson R H Nucleotide sequences
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US4767402A (en) 1986-07-08 1988-08-30 Massachusetts Institute Of Technology Ultrasound enhancement of transdermal drug delivery
US4889818A (en) 1986-08-22 1989-12-26 Cetus Corporation Purified thermostable enzyme
US4795699A (en) 1987-01-14 1989-01-03 President And Fellows Of Harvard College T7 DNA polymerase
US4921794A (en) 1987-01-14 1990-05-01 President And Fellows Of Harvard College T7 DNA polymerase
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
US5142033A (en) 1988-09-23 1992-08-25 Hoffmann-La Roche Inc. Structure-independent DNA amplification by the polymerase chain reaction
US5091310A (en) 1988-09-23 1992-02-25 Cetus Corporation Structure-independent dna amplification by the polymerase chain reaction
US5066584A (en) 1988-09-23 1991-11-19 Cetus Corporation Methods for generating single stranded dna by the polymerase chain reaction
US4994370A (en) 1989-01-03 1991-02-19 The United States Of America As Represented By The Department Of Health And Human Services DNA amplification technique
US5266491A (en) 1989-03-14 1993-11-30 Mochida Pharmaceutical Co., Ltd. DNA fragment and expression plasmid containing the DNA fragment
US5580734A (en) 1990-07-13 1996-12-03 Transkaryotic Therapies, Inc. Method of producing a physical map contigous DNA sequences
ATE240740T1 (de) 1991-03-15 2003-06-15 Amgen Inc Pegylation von polypeptiden
US5641670A (en) 1991-11-05 1997-06-24 Transkaryotic Therapies, Inc. Protein production and protein delivery
US5968502A (en) 1991-11-05 1999-10-19 Transkaryotic Therapies, Inc. Protein production and protein delivery
US5643252A (en) 1992-10-28 1997-07-01 Venisect, Inc. Laser perforator
US6019968A (en) 1995-04-14 2000-02-01 Inhale Therapeutic Systems, Inc. Dispersible antibody compositions and methods for their preparation and use
US5730723A (en) 1995-10-10 1998-03-24 Visionary Medical Products Corporation, Inc. Gas pressured needle-less injection device and method
IL120943A (en) 1997-05-29 2004-03-28 Univ Ben Gurion A system for administering drugs through the skin
EE04628B1 (et) 1997-09-29 2006-06-15 Inhale Therapeutic Systems, Inc. Perforeeritud mikrostruktuure sisaldav pulber ja meetod perforeeritud mikrostruktuure sisaldava mikroosakeste kompositsiooni ning pulbri valmistamiseks
US20130266551A1 (en) * 2003-11-05 2013-10-10 St. Jude Children's Research Hospital, Inc. Chimeric receptors with 4-1bb stimulatory signaling domain
EP2465538A3 (en) * 2004-10-21 2013-11-20 Ono Pharmaceutical Co., Ltd. Use of immunesuppressant receptor
US10233454B2 (en) 2014-04-09 2019-03-19 Dna2.0, Inc. DNA vectors, transposons and transposases for eukaryotic genome modification
GB201416960D0 (en) * 2014-09-25 2014-11-12 Antikor Biopharma Ltd Biological materials and uses thereof
MA42059A (fr) 2015-05-06 2018-03-14 Janssen Biotech Inc Agents de liaison bispécifique à l'antigène membranaire spécifique de la prostate (psma) et utilisations de ceux-ci
AU2016258174B2 (en) 2015-05-06 2022-01-20 Janssen Biotech, Inc. Prostate specific membrane antigen binding fibronectin type III domains
GB201602563D0 (en) * 2016-02-12 2016-03-30 Autolus Ltd Signalling system
BR112019000683A2 (pt) * 2016-07-15 2019-04-24 Poseida Therapeutics Inc receptores de antígeno quiméricos e métodos para uso
CN110352068A (zh) * 2016-12-02 2019-10-18 南加利福尼亚大学 合成的免疫受体及其使用方法

Also Published As

Publication number Publication date
ZA202005556B (en) 2024-03-27
JP2021516958A (ja) 2021-07-15
MX2020009309A (es) 2021-01-08
IL277079A (en) 2020-10-29
WO2019173636A9 (en) 2020-11-05
KR20200140270A (ko) 2020-12-15
TW202017592A (zh) 2020-05-16
WO2019173636A1 (en) 2019-09-12
US20210107993A1 (en) 2021-04-15
AU2019230192A1 (en) 2020-10-08
EP3762106A1 (en) 2021-01-13
JP7399866B2 (ja) 2023-12-18
SG11202008659TA (en) 2020-10-29
CN112601583A (zh) 2021-04-02
RU2020132750A (ru) 2022-04-07
CA3092947A1 (en) 2019-09-12
AU2019230192A2 (en) 2020-10-22

Similar Documents

Publication Publication Date Title
AU2018329741B2 (en) Compositions and methods for chimeric ligand receptor (CLR)-mediated conditional gene expression
US20210107993A1 (en) Cartyrin compositions and methods for use
US20220389077A1 (en) Allogeneic cell compositions and methods of use
US20210139557A1 (en) Vcar compositions and methods for use
AU2022235633B2 (en) Modified stem cell memory T cells, methods of making and methods of using same
US11802269B2 (en) Superpiggybac transposase compositions
US20210115453A1 (en) Transposon system and methods of use
US20190390204A1 (en) Inducible dna binding proteins and genome perturbation tools and applications thereof
US10329543B2 (en) Modified stem cell memory T cells, methods of making and methods of using same
US11078247B2 (en) RNA encoding a therapeutic protein
JP2023040138A (ja) saRNA組成物および使用方法
US20240285795A1 (en) Targets for rna therapeutics
US20120192298A1 (en) Method for genome editing
AU2010275432A1 (en) Method for genome editing
WO2015048577A2 (en) Crispr-related methods and compositions
CN102858985A (zh) 基因组编辑方法
US20210171943A1 (en) Compositions and methods for treating disorders of genomic imprinting
TW202246309A (zh) 用於靶向蛋白質降解的合成降解系統
US20240318136A1 (en) Modified stem cell memory t cells, methods of making and methods of using same
RU2820591C2 (ru) Композиции vcar и способы применения
CA3209126A1 (en) Small molecule-regulated cell signaling expression system

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]
B06W Patent application suspended after preliminary examination (for patents with searches from other patent authorities) chapter 6.23 patent gazette]