BR112019014841A2 - rna guia, uso do rna guia, rna antissentido, sirna ou shrna, uso do rna antissentido, do sirna ou do shrna, ácido nucleico isolado, vetor, composição, célula, e, métodos para modificar um gene hsd17b13 em uma célula, para diminuir a expressão de um gene hsd17b13 em uma célula, para modificar uma célula e para tratar um indivíduo que não é portador da variante de hsd17b13 - Google Patents

rna guia, uso do rna guia, rna antissentido, sirna ou shrna, uso do rna antissentido, do sirna ou do shrna, ácido nucleico isolado, vetor, composição, célula, e, métodos para modificar um gene hsd17b13 em uma célula, para diminuir a expressão de um gene hsd17b13 em uma célula, para modificar uma célula e para tratar um indivíduo que não é portador da variante de hsd17b13 Download PDF

Info

Publication number
BR112019014841A2
BR112019014841A2 BR112019014841A BR112019014841A BR112019014841A2 BR 112019014841 A2 BR112019014841 A2 BR 112019014841A2 BR 112019014841 A BR112019014841 A BR 112019014841A BR 112019014841 A BR112019014841 A BR 112019014841A BR 112019014841 A2 BR112019014841 A2 BR 112019014841A2
Authority
BR
Brazil
Prior art keywords
hsd17b13
seq
cell
guide rna
gene
Prior art date
Application number
BR112019014841A
Other languages
English (en)
Inventor
Shuldiner Alan
Li Alexander
Baras Aris
Pefanis Evangelos
E Dewey Frederick
Gromada Jesper
S Abul-Husn Noura
Gottesman Omri
Hartford Suzanne
Cheng Xiping
Xin Yurong
Original Assignee
Regeneron Pharma
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharma filed Critical Regeneron Pharma
Publication of BR112019014841A2 publication Critical patent/BR112019014841A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/713Double-stranded nucleic acids or oligonucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/44Oxidoreductases (1)
    • A61K38/443Oxidoreductases (1) acting on CH-OH groups as donors, e.g. glucose oxidase, lactate dehydrogenase (1.1)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/56Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic macromolecular compound, e.g. an oligomeric, polymeric or dendrimeric molecule
    • A61K47/61Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic macromolecular compound, e.g. an oligomeric, polymeric or dendrimeric molecule the organic macromolecular compound being a polysaccharide or a derivative thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/16Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1137Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/067Hepatocytes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/96Stabilising an enzyme by forming an adduct or a composition; Forming enzyme conjugates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/26Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving oxidoreductase
    • C12Q1/32Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving oxidoreductase involving dehydrogenase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/010513 (or 17)-Beta-hydroxysteroid dehydrogenase (1.1.1.51)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/0106217Beta-estradiol 17-dehydrogenase (1.1.1.62)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5044Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics involving specific cell types
    • G01N33/5067Liver cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/34Allele or polymorphism specific uses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/24Vectors characterised by the absence of particular element, e.g. selectable marker, viral origin of replication
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/46Assays involving biological materials from specific organisms or of a specific nature from animals; from humans from vertebrates
    • G01N2333/47Assays involving proteins of known structure or function as defined in the subgroups
    • G01N2333/4701Details
    • G01N2333/4703Regulators; Modulating activity
    • G01N2333/4704Inhibitors; Supressors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/08Hepato-biliairy disorders other than hepatitis
    • G01N2800/085Liver diseases, e.g. portal hypertension, fibrosis, cirrhosis, bilirubin

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Plant Pathology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Epidemiology (AREA)
  • Cell Biology (AREA)
  • Pathology (AREA)
  • Virology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Mycology (AREA)
  • Toxicology (AREA)
  • Tropical Medicine & Parasitology (AREA)

Abstract

são providas composições relacionadas com variantes de hsd17b13, incluindo ácidos nucleicos isolados e proteínas relacionadas com variantes de hsd17b13 e células compreendendo esses ácidos nucleicos e proteínas. também são providos métodos relacionados às variantes de hsd17b13. tais métodos incluem métodos para modificar uma célula através do uso de qualquer combinação de agentes de nuclease, sequências de doador exógeno, ativadores da transcrição, repressores da transcrição e vetores de expressão para expressarem um gene hsd17b13 recombinante ou um ácido nucleico que codifica uma proteína de hsd17b13. são também providos métodos terapêuticos e profiláticos para o tratamento de um indivíduo com ou em risco de desenvolver doença do fígado crônica.

Description

RNA GUIA, USO DO RNA GUIA, RNA ANTISSENTIDO, SIRNA OU SHRNA, USO DO RNA ANTISSENTIDO, DO SIRNA OU DO SHRNA, ÁCIDO NUCLEICO ISOLADO, VETOR, COMPOSIÇÃO, CÉLULA, E, MÉTODOS PARA MODIFICAR UM GENE HSD17B13 EM UMA CÉLULA, PARA DIMINUIR A EXPRESSÃO DE UM GENE HSD17B13 EM UMA CÉLULA, PARA MODIFICAR UMA CÉLULA E PARA TRATAR UM INDIVÍDUO QUE NÃO É PORTADOR DA VARIANTE DE HSD17B13
REFERÊNCIA CRUZADA AOS PEDIDOS RELACIONADOS [001] Este pedido reivindica o benefício do Pedido No. US 62/449.335, depositado em 23 de janeiro de 2017, Pedido de Patente No. US 62/472.972, depositado em 17 de março de 2017, e Pedido de Patente No. US 62/581.918, depositado em 6 de novembro de 2017, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos.
REFERÊNCIA A UMA LISTAGEM DE SEQUÊNCIAS ENVIADA COMO UM ARQUIVO DE TEXTO VIA EFS WEB [002] A Listagem de Sequências escrita no arquivo
507242SEQLIST.txt é de 507 quilobytes, foi criada em 19 de janeiro de 2018 e é aqui incorporada por referência.
FUNDAMENTOS [003] A doença do fígado crônica e a cirrose são as principais causas de morbilidade e mortalidade nos Estados Unidos da América, sendo responsáveis por 38.170 mortes (1,5% do total de mortes) em 2014 (Kochanek et al. (2016) Natl Vital Stat Rep 65: 1 a 122, aqui incorporado por referência na sua totalidade para todos os efeitos). As etiologias mais comuns de cirrose nos EUA são doença do fígado alcoólica, hepatite C crônica e doença do fígado gorduroso não alcoólica (DHGNA), responsáveis por aproximadamente 80% dos pacientes que aguardam transplante hepático entre 2004 e 2013 (Wong et al. (2015) Gastroenterology 148: 547 a 555, aqui
Petição 870190068171, de 18/07/2019, pág. 15/358
2/307 incorporado por referência na sua totalidade para todos os efeitos). A prevalência estimada de DHGNA nos EUA é entre 19 e 46% (Browning et al. (2004) Hepatology 40: 1387 a 1395; Lazo et al. (2013) Am J Epidemiol 178: 38 a 45 e Williams et al. (2011) Gastroenterology 140: 124 a 131, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos) e está aumentando ao longo do tempo (Younossi et al. (2011) Clin Gastroenterol Hepatol 9: 524 a 530 el; questionário e60 (2011), aqui incorporado por referência na sua totalidade para todos os efeitos), provavelmente em conjunto com o aumento das taxas de obesidade, seu fator de risco primário (Cohen et al. (2011) Science 332: 1519 a 1523, incorporado aqui por referência em seu totalidade para todos os efeitos). Embora avanços significativos tenham sido feitos no tratamento da hepatite C (Morgan et al. (2013) Ann Intern Med 158: 329 a 337 e van der Meer et al. (2012) JAMA 308: 2584 a 2593, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos), não há atualmente tratamentos baseados em evidências para doença do fígado alcoólica ou não alcoólica e cirrose.
[004] Estudos anteriores de associação ampla do genoma (GWAS) identificaram um número limitado de genes e variantes associados à doença do fígado crônica. A associação genética validada mais robusta até hoje é uma variante missense comum no domínio da fosfolipase tipo patatina contendo o gene 3 (PNPLA3 p.Ilel48Met, rs738409), inicialmente associada ao aumento do risco de doença do fígado gorduroso não alcoólica (DHGNA) (Romeo et al. (2008) Nat. Genet. 40: 1461 a 1465 e Speliotes et al. (2011) PLoS Genet. 7: M001324, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos) e subsequentemente encontrado como sendo associado com à gravidade da doença (Rotman et al. (2010) Hepatology 52: 894 a 903 e Sookoian et al. (2009) J. Lipid Res. 50: 2111 a 2116, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos) e progressão (Trepo et al. (2016) J. Hepatol, doi:
Petição 870190068171, de 18/07/2019, pág. 16/358
3/307
10.1016/j.jhep.2016.03.011, aqui incorporado por referência na sua totalidade para todos os efeitos). A variação no gene membro da superfamília transmembrana 6 (TM6SF2) também mostrou aumentar o risco de DHGNA (Kozlitina et al. (2014) Nat. Genet. 46: 352 a 356; Liu et al. (2014) Nat. Commun. 5: 4309 e Sookoian et al. (2015) Hepatology 61: 515 a 525, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos). As funções normais destas duas proteínas não são bem compreendidas, embora ambas tenham sido propostas para estarem envolvidas no metabolismo lipídico dos hepatócitos. Como variantes no PNPLA3 e TM6SF2 contribuem para o aumento do risco de doença do fígado ainda não foi elucidado. Os GWAS também identificaram vários fatores genéticos associados à alanina aminotransferase sérica (ALT) e à aspartato aminotransferase (AST) (Chambers et al. (2011) Nat. Genet. 43: 131 a 1138 e Yuan et al. (2008) Am. J. Hum. Genet. 83: 520 a 528, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos), marcadores quantitativos de lesão de hepatócitos e acumulação de gordura no fígado que são frequentemente medidos clinicamente. Até o momento, não há variantes genéticas protetoras descritas para doença do fígado crônica. A descoberta de variantes genéticas de proteção em outros ambientes, como as variantes de perda de função em PCSK9 que reduzem o risco de doença cardiovascular, tem sido o catalisador para o desenvolvimento de novas classes de terapias.
[005] O conhecimento de fatores genéticos subjacentes ao desenvolvimento e progressão da doença do fígado crônica poderia melhorar a estratificação do risco e fornecer a base para novas estratégias terapêuticas. Uma melhor compreensão dos fatores genéticos subjacentes é necessária para melhorar a estratificação de risco e gerar novas terapias para doença do fígado.
SUMÁRIO
Petição 870190068171, de 18/07/2019, pág. 17/358
4/307 [006] São providos métodos e composições relacionados com a variante do gene HSD17B13, rs72613567, transcrições de variantes de HSD17B13 e isoformas da proteína de variantes de HSD17B13.
[007] Em um aspecto, são providos ácidos nucleicos isolados compreendendo o resíduo mutante da variante do gene HSD17B13, rs72613567. Tais ácidos nucleicos isolados podem compreender pelo menos 15 nucleotídeoss contíguos de um gene HSD17B13 e ter uma timina inserida entre nucleotídeoss correspondendo às posições 12665 e 12666 da SEQ ID NO: 1 quando perfeitamente alinhados com a SEQ ID NO: 1. Opcionalmente, os nucleotídeoss contíguos são pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idênticos a uma sequência correspondente à SEQ ID NO: 2 incluindo a posição 12666 da SEQ ID NO: 2 quando perfeitamento alinhado com a SEQ ID NO: 2. Opcionalmente, o gene HSD17B13 é um gene HSD17B13 humano. Opcionalmente, o ácido nucleico isolado compreende pelo menos 15, pelo menos 20, pelo menos 25, pelo menos 30, pelo menos 35, pelo menos 40, pelo menos 50, pelo menos 60, pelo menos 70, pelo menos 80, pelo menos 90, pelo menos 100, pelo menos 200, pelo menos 300, pelo menos 400, pelo menos 500, pelo menos 600, pelo menos 700, pelo menos 800, pelo menos 900, pelo menos 1000, pelo menos 2000, pelo menos 3000, pelo menos 4000, pelo menos 5000, pelo menos 6000, pelo menos 7000, pelo menos 8000, pelo menos 9000, pelo menos 10000, pelo menos 11000, pelo menos 12000, pelo menos 13000, pelo menos 14000, pelo menos 15000, pelo menos 16000, pelo menos 17000, pelo menos 18000, ou pelo menos 19000 nucleotídeos contíguos de SEQ ID NO: 2.
[008] Alguns destes ácidos nucleicos isolados compreendem um minigene HSD17B13 em que um ou mais segmentos não essenciais do gene foram eliminados em relação a um gene HSD17B13 de tipo selvagem correspondente. Opcionalmente, os segmentos eliminados compreendem uma
Petição 870190068171, de 18/07/2019, pág. 18/358
5/307 ou mais sequências intrônicas. Opcionalmente, o ácido nucleico isolado compreende ainda um íntron correspondente ao intron 6 da SEQ ID NO: 2 quando perfeitamento alinhado com a SEQ ID NO: 2. Opcionalmente, o íntron é o íntron 6 da SEQ ID NO: 2.
[009] Em outro aspecto, são providos ácidos nucleicos isolados correspondentes a diferentes transcrições ou DNAc’s de RN Am de HSD17B13. Alguns desses ácidos nucleicos isolados compreendem pelo menos 15 nucleotídeos contíguos que codificam a totalidade ou parte de uma proteína de HSD17B13, em que os ácidos nucleicos contíguos compreendem um segmento que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% indêntico a um segmento presente na SEQ ID NO: 7 (transcrição D de HSD17B13), SEQ ID NO: 10 (transcrição G de HSD17B13) e SEQ ID NO: 11 (transcrição H de HSD17B13) que não está presente na SEQ ID NO: 4 (transcrição A de HSD17B13). Opcionalmente, os nucleotídeos contíguos compreendem adicionalmente um segmento que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico a um segmento presente em SEQ ID NO: 7 (transcrição D de HSD17B13) que não está presente na SEQ ID NO: 11 (transcrição H de HSD17B13) e em que os nucleidos contíguos compreendem adicionalmente um segmento que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% indêntico a um segmento presente na SEQ ID NO: 7 (transcrição D de HSD17B13) que não está presente na SEQ ID NO: 10 (transcrição G de HSD17B13). Opcionalmente, os nucleotídeos contíguos compreendem adicionalmente um segmento que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico a um segmento presente na SEQ ID NO: 11 (transcrição H de HSD17B13) que não está presente na SEQ ID NO: 7 (transcrito D de HSD17B13). Opcionalmente,
Petição 870190068171, de 18/07/2019, pág. 19/358
6/307 os nucleotídeos contíguos compreendem adicionalmente um segmento que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico a um segmento presente na SEQ ID NO: 10 (transcrição G de HSD17B13) que não está presente na SEQ ID NO: 7 (transcrição D de HSD17B13).
[0010] Alguns destes ácidos nucleicos isolados compreendem pelo menos 15 nucleotídeos contíguos que codificam a totalidade ou parte de uma proteína de HSD17B13, em que os nucleotídeos contíguos compreendem um segmento que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% indêntico a um segmento presente na SEQ ID NO: 8 (transcrição E de HSD17B13) que não está presente na SEQ ID NO: 4 (transcrição A de HSD17B13). Opcionalmente, os nucleotídeos contíguos compreendem adicionalmente um segmento que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico a um segmento presente na SEQ ID NO: 8 (transcrição E de HSD17B13) que não está presente na SEQ ID NO: 11 (transcrição H de HSD17B13).
[0011] Alguns destes ácidos nucleicos isolados compreendem pelo menos 15 nucleotídeos contíguos que codificam a totalidade ou parte de uma proteína de HSD17B13, em que os nucleotídeos contíguos compreendem um segmento que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% indêntico a um segmento presente na SEQ ID NO: 9 (transcrição F de HSD17B13) que não está presente na SEQ ID NO: 4 (transcrição A de HSD17B13).
[0012] Alguns destes ácidos nucleicos isolados compreendem pelo menos 15 nucleotídeos contíguos que codificam a totalidade ou parte de uma proteína de HSD17B13, em que os nucleotídeos contíguos compreendem um segmento que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% indêntico a um
Petição 870190068171, de 18/07/2019, pág. 20/358
7/307 segmento presente na SEQ ID NO: 6 (transcrição C de HSD17B13) que não está presente na SEQ ID NO: 4 (transcrição A de HSD17B13).
[0013] Opcionalmente, a proteína de HSD17B13 é uma proteína de HSD17B13 humana. Opcionalmente, o ácido nucleico isolado compreende pelo menos 20, pelo menos 25, pelo menos 30, pelo menos 35, pelo menos 40, pelo menos 45, pelo menos 50, pelo menos 60, pelo menos 70, pelo menos 80, pelo menos 90, pelo menos 100, pelo menos 200, pelo menos 300, pelo menos 400, pelo menos 500, pelo menos 600, pelo menos 700, pelo menos 800, pelo menos 900, pelo menos 1000 ou pelo menos 2000 nucleotídeos contíguos que codificam todos ou parte de uma proteína de HSD17B13.
[0014] Alguns desses ácidos nucleicos isolados compreendem uma sequência de pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à sequência apresentada nas SEQ ID NOs: 6, 7, 8, 9, 10 ou 11 (transcrições C, D, E, F, G ou H de HSD17B13) e que codifica uma proteína de HSD17B13 compreendendo a sequência apresentada nas SEQ ID NOs: 14, 15, 16, 17, 18 ou 19 (isoformas C, D, E, F, G ou H de HSD17B13), respectivamente.
[0015] Em qualquer um dos ácidos nucleicos acima, os nucleotídeos contíguos podem opcionalmente compreender sequências de pelo menos dois éxons diferentes de um gene HSD17B13 sem um íntron interveniente.
[0016] Em outro aspecto, são providas proteínas codificadas por qualquer um dos ácidos nucleicos isolados acima.
[0017] Em outro aspecto, são providos ácidos nucleicos isolados que hibridizam para ou perto do resíduo mutante da variante do gene HSD17B13, rs72613567. Tais ácidos nucleicos isolados podem compreender pelo menos 15 nucleotídeos contíguos que hibridizam com um gene HSD17B13 em um segmento que inclui ou está dentro de 1000, 500, 400, 300, 200, 100, 50, 45, 40, 35, 30, 25, 20, 15, 10 ou 5 nucleotídeos de uma posição correspondendo à
Petição 870190068171, de 18/07/2019, pág. 21/358
8/307 posição 12666 na SEQ ID NO: 2 quando perfeitamente alinhados com a SEQ ID NO: 2. Opcionalmente, o segmento é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% indêntico a uma sequência correspondente à SEQ ID NO: 2 quando perfeitamente alinhado com a SEQ ID NO: 2. Opcionalmente, o segmento compreende pelo menos 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, ou 2000 nucleotídeos contíguos da SEQ ID NO: 2. Opcionalmente, o segmento inclui posição 12666 na SEQ ID NO: 2 ou uma posição correspondente à posição 12666 na SEQ ID NO: 2 quando perfeitamente alinhada com a SEQ ID NO: 2. Opcionalmente, o gene HSD17B13 é um gene HSD17B13 humano. Opcionalmente, o ácido nucleico isolado tem até cerca de 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 ou 1000 nucleotídeos de comprimento. Opcionalmente, o ácido nucleico isolado está ligado a um ácido nucleico heterólogo ou compreende um marcador heterólogo. Opcionalmente, o marcador heterólogo é um marcador fluorescente.
[0018] Em outro aspecto, são providos ácidos nucleicos isolados que hibridizam com diferentes transcrições de DNAm de HSD17B13 ou DNAc’s. Alguns desses ácidos nucleicos isolados hibridizam com pelo menos 15 nucleotídeos contíguos de um ácido nucleico que codifica uma proteína de HSD17B13, em que os nucleotídeos contíguos compreendem um segmento que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% indêntico a um segmento presente na SEQ ID NO: 7 (transcrição D de HSD17B13), SEQ ID NO: 10 (transcrição G de HSD17B13) e SEQ ID NO: 11 (transcrição H de HSD17B13) que não está presente na SEQ ID NO: 4 (transcrição A de HSD17B13).
[0019] Alguns destes ácidos nucleicos isolados hibridizam com pelo menos 15 nucleotídeos contíguos de um ácido nucleico que codifica uma
Petição 870190068171, de 18/07/2019, pág. 22/358
9/307 proteína de HSD17B13, em que os nucleotídeos contíguos compreendem um segmento que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% indêntico a um segmento presente na SEQ ID NO: 8 (transcrição E de HSD17B13) e SEQ ID NO: 11 (transcrição H de HSD17B13) que não está presente na SEQ ID NO: 4 (transcrição A de HSD17B13).
[0020] Alguns desses ácidos nucleicos isolados hibridizam com pelo menos 15 nucleotídeos contíguos de um ácido nucleico que codifica uma proteína de HSD17B13, em que os nucleotídeos contíguos compreendem um segmento que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% indêntico a um segmento na SEQ ID NO: 9 (transcrição F de HSD17B13) que não está presente na SEQ ID NO: 4 (transcrição A de HSD17B13).
[0021] Alguns destes ácidos nucleicos isolados hibridizam com pelo menos 15 nucleotídeos contíguos de um ácido nucleico que codifica uma proteína de HSD17B13, em que os nucleotídeos contíguos compreendem um segmento que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% indêntico a um segmento presente na SEQ ID NO: 6 (transcrição C de HSD17B13) que não está presente na SEQ ID NO: 4 (transcrição A de HSD17B13).
[0022] Opcionalmente, a proteína de HSD17B13 é uma proteína de HSD17B13 humana. Opcionalmente, o ácido nucleico isolado tem até cerca de 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 ou 1000 nucleotídeos de comprimento. Opcionalmente, o ácido nucleico isolado está ligado a um ácido nucleico heterólogo ou compreende um marcador heterólogo. Opcionalmente, o marcador heterólogo é um marcador fluorescente.
[0023] Opcionalmente, qualquer um dos ácidos nucleicos isolados acima compreende DNA. Opcionalmente, qualquer um dos ácidos nucleicos
Petição 870190068171, de 18/07/2019, pág. 23/358
10/307 isolados acima compreende RNA. Opcionalmente, qualquer um dos ácidos nucleicos isolados acima é um RNA antissentido, um pequeno RNA em formato de grampo ou um pequeno RNA de interferência. Opcionalmente, qualquer um dos ácidos nucleicos isolados acima pode incluir um nucleotídeo não natural.
[0024] Em outro aspecto, são providos vetores e sequências de doador exógeno compreendendo qualquer um dos ácidos nucleicos isolados acima e uma sequência de ácido nucleico heteróloga.
[0025] Em outro aspecto, é provido o uso de qualquer um dos ácidos nucleicos isolados acima, vetores, ou sequências de doador exógeno em um método de detecção de uma variante de HSD17B13, rs72613567, em um indivíduo, um método de detecção da presença de transcrição C, D, E, F, G ou H de HSD17B13 em um indivíduo, um método para determinar a suscetibilidade de um indivíduo a desenvolver uma doença do fígado crônica, método de diagnóstico em um indivíduo com doença do fígado gorduroso ou um método de modificação de um gene HSD17B13 em uma célula e u, método para alterar a expressão de um gene HSD17B13 em uma célula.
[0026] Em outro aspecto, são providos RNAs guia que visam o gene HSD17B13. Tais RNAs guia podem ser eficazes para direcionar uma enzima Cas para ligar ou clivar um gene HSD17B13, em que o RNA guia compreende um segmento de direcionamento de DNA que hibridiza com uma sequência de reconhecimento de RNA guia dentro do gene HSD17B13. Ou seja, tais RNAs guia podem ser eficazes para direcionar uma enzima Cas para ligar ou clivar um gene HSD17B13, em que o RNA guia compreende um segmento de direcionamento de DNA que tem como alvo uma sequência alvo de RNA guia dentro do gene HSD17B13. Tais RNAs guia podem ser eficazes para direcionar uma enzima Cas para ligar ou clivar um gene HSD17B13, em que o RNA guia compreende um segmento de direcionamento de DNA que tem como alvo uma sequência alvo de RNA guia dentro do gene HSD17B13
Petição 870190068171, de 18/07/2019, pág. 24/358
11/307 que inclui ou está próximo a uma posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2. Opcionalmente, a sequência alvo de RN A guia compreende, consiste essencialmente em, ou consiste em qualquer uma das SEQ ID NOS: 226 a 239 e 264 a 268. Opcionalmente, o segmento de direcionamento de DNA compreende, consiste essencialmente em, ou consiste em qualquer uma das SEQ ID NOS: 1629 a 1642 e 1648 a 1652. Opcionalmente, o RNA guia compreende, consiste essencialmente em, ou consiste em qualquer uma das SEQ ID NOS: 706 a 719; 936 a 949; 1166 a 1179, 1396 a 1409, 725 a 729, 955 a 959, 1185 a 1189 e 1415 a 1419. Opcionalmente, a sequência alvo de RNA guia é selecionada a partir das SEQ ID NOS: 226 a 239 ou SEQ ID NOS: 230 e 231. Opcionalmente, a sequência alvo de RNA guia é selecionada das SEQ ID NOS: 226 a 230 e 264 a 268. Opcionalmente, a sequência alvo do RNA guia está dentro de uma região correspondente ao éxon 6 e/ou íntron 6 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2. Opcionalmente, a sequência alvo do RNA guia está dentro de uma região correspondente ao éxon 6 e/ou ao íntron 6 e/ou éxon 7 da SEQ ID NO: 2 quando o gene de HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2. Opcionalmente, a sequência alvo de RNA guia está dentro de cerca de 1000, 500, 400, 300, 200, 100, 50, 45, 40, 35, 30, 25, 20, 15, 10, ou 5 nucleotídeos da posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com SEQ ID NO: 2. Opcionalmente, a sequência alvo de RNA guia inclui a posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2.
[0027] Tais RNAs guia podem ser eficazes para direcionar uma enzima Cas para ligar ou clivar um gene HSD17B13, em que o RNA guia compreende um segmento de direcionamento de DNA que tem como alvo uma sequência de RNA guia alvo dentro do gene HSD17B13 que inclui ou
Petição 870190068171, de 18/07/2019, pág. 25/358
12/307 está próximo ao códon de iniciação do gene HSD17B13. Opcionalmente, a sequência alvo de RNA guia compreende, consiste essencialmente em, ou consiste em qualquer uma das SEQ ID NOS: 20 a 81 e 259 a 263. Opcionalmente, o segmento de direcionamento de DNA compreende, consiste essencialmente em, ou consiste em qualquer uma das SEQ ID NOS: 1423 a 1484 e 1643 a 1647. Opcionalmente, o RNA guia compreende, consiste essencialmente em, ou consiste de qualquer uma das SEQ ID NOS: 500 a 561, 730 a 791, 960 a 1021, 1190 a 1251, 720 a 724, 950 a 954, 1180 a 1184 e 1410 a 1414. Opcionalmente, a sequência alvo de RNA guia é selecionada a partir das SEQ ID NOS: 20 a 81 e 259 a 263. Opcionalmente, a sequência alvo de RNA guia é selecionada a partir das SEQ ID NOS: 21 a 23, 33 e 35. Opcionalmente, a sequência alvo de RNA guia é selecionada das SEQ ID NOS: 33 e 35. Opcionalmente, a sequência alvo de RNA guia está dentro de uma região correspondendo ao éxon 1 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2. Opcionalmente, a sequência alvo de RNA guia está dentro de cerca de 1000, 500, 400, 300, 200, 100, 50, 45, 40, 35, 30, 25, 20, 15, 10 ou 5 nucleotídeos do códon de iniciação.
[0028] Tais RNAs guia podem ser eficazes para direcionar uma enzima Cas para ligar ou clivar um gene HSD17B13, em que o RNA guia compreende um segmento de direcionamento de DNA que tem como alvo uma sequência guia de RNA alvo dentro do gene HSD17B13 que inclui ou está próximo ao códon de terminação do gene HSD17B13. Opcionalmente, a sequência alvo de RNA guia compreende, consiste essencialmente em, ou consiste em qualquer uma das SEQ ID NOS: 82 a 225. Opcionalmente, o segmento de direcionamento de DNA compreende, consiste essencialmente em, ou consiste em qualquer uma das SEQ ID NOS: 1485 a 1628. Opcionalmente, o RNA guia compreende, consiste essencialmente em, ou consiste em qualquer uma das SEQ ID NOS: 562 a 705, 792 a 935, 1022 a
Petição 870190068171, de 18/07/2019, pág. 26/358
13/307
1165 e 1252 a 1395. Opcionalmente, a sequência alvo de RNA guia é selecionada a partir da SEQ ID NOS: 82 a 225. Opcionalmente, a sequência alvo de RNA guia está dentro de uma região correspondendo ao éxon 7 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2. Opcionalmente, a sequência alvo de RNA guia está dentro de cerca de 1000, 500, 400, 300, 200, 100, 50, 45, 40, 35, 30, 25, 20, 15, 10 ou 5 nucleotídeos do códon de terminação.
[0029] Opcionalmente, o gene HSD17B13 é um gene HSD17B13 humano. Opcionalmente, o gene HSD17B13 compreende a SEQ ID NO: 2.
[0030] Alguns desses RNAs guia compreendem um RNA de Repetições Palindrômicas Curtas Agrupadas e Regularmente Interespaçadas (CRISPR) (crRNA) compreendendo o segmento de direcionamento de DNA e um RNA de CRISPR transativado (tracrRNA). Opcionalmente, o RNA guia é um RNA guia modular no qual o crRNA e o tracrRNA são moléculas separadas que se hibridizam entre si. Opcionalmente, o crRNA compreende, consiste essencialmente em, ou consiste na sequência apresentada na SEQ ID NO: 1421 e o tracrRNA compreende, consiste essencialmente em, ou consiste na sequência apresentada na SEQ ID NO: 1422. Opcionalmente, o RNA guia é um RNA guia único no qual o crRNA é fundido ao tracrRNA por meio de um ligador. Opcionalmente, o RNA guia único compreende, consiste essencialmente em, ou consiste na sequência apresentada em qualquer uma das SEQ ID NOS: 1420 e 256 a 258.
[0031] Em outro aspecto, desde RNAs antissentido, siRNAs, ou shRNAs que hibridizam com uma sequência dentro de uma transcrição de HSD17B13 divulgada no presente documento. Alguns desses RNAs antissentido, siRNAs ou shRNAs hibridizam para uma sequência dentro de SEQ ID NO: 4 (transcrição A de HSD17B13). Opcionalmente, o RNA antissentido, siRNA, ou shRNA pode diminuir a expressão da transcrição A de HSD17B13 em uma célula. Opcionalmente, o RNA antissentido, siRNA,
Petição 870190068171, de 18/07/2019, pág. 27/358 / 307 ou shRNA hibridiza com uma sequência presente na SEQ ID NO: 4 (transcrição A de HSD17B13) que não está presente na SEQ ID NO: 7 (transcrição D de HSD17B13). Opcionalmente, o RNA antissentido, siRNA ou shRNA hibridizam para uma sequência no éxon 7 ou uma sequência que abrange o limite éxon 6-éxon 7 da SEQ ID NO: 4 (transcrição A de HSD17B13). Alguns desses RNAs antissentido, siRNAs ou shRNAs hibridizam com uma sequência dentro da SEQ ID NO: 7 (transcrição D de HSD17B13). Opcionalmente, o RNA antissentido, siRNA, ou shRNA pode diminuir a expressão da transcrição D de HSD17B13 em uma célula. Opcionalmente, o RNA antissentido, siRNA ou shRNA hibridiza com uma sequência presente na SEQ ID NO: 7 (transcrição D de HSD17B13) que não está presente na SEQ ID NO: 4 (transcrição A de HSD17B13). Opcionalmente, o RNA antissentido, siRNA, ou shRNA hibridiza com uma sequência no éxon 7 ou uma sequência que abrange o limite do éxon 6-éxon 7 da SEQ ID NO: 7 (transcrição D de HSD17B13).
[0032] Em outro aspecto, são providos DNAs que codificam qualquer um dos RNAs guia acima, RNAs antissentido, siRNAs, ou shRNAs. Em outro aspecto, são providos vetores compreendendo um DNA que codifica qualquer um dos RNAs guia acima, RNAs antissentido, siRNAs, ou shRNAs e um ácido nucleico heterólogo. Em outro aspecto, é provido o uso de qualquer um dos RNAs guia, RNAs antissentido, siRNAs ou shRNAs que codificam RNAs guia, RNAs antissentido, siRNAs ou shRNAs ou vetores que compreendem DNAs codificadores de RNAs guia, RNAs antissentido, siRNAs ou shRNAs em um método de modificação de um gene HSD17B13 em uma célula ou em um método para alterar a expressão de um gene HSD17B13 em uma célula.
[0033] Em outro aspecto, são providas composições compreendendo qualquer um dos ácidos nucleicos isolados acima, qualquer um dos RNAs guia acima, qualquer um dos polipeptídeos isolados acima, qualquer um dos
Petição 870190068171, de 18/07/2019, pág. 28/358 / 307
RNAs antissentido, siRNAs, ou shRNAs acima, qualquer um dos vetores acima ou qualquer uma das sequências de doador exógeno acima. Opcionalmente, a composição compreende qualquer um dos RNAs guia acima e uma proteína Cas, tal como uma proteína Cas9. Opcionalmente, tais composições compreendem um veículo que aumenta a estabilidade do polipeptídeo isolado, o RNA guia, o RNA antissentido, o siRNA, o shRNA, o ácido nucleico isolado, o vetor ou a sequência de doador exógeno. Opcionalmente, o veículo compreende uma microesfera de poli(ácido láctico) (PLA), uma microesfera de ácido poli(D,L-láctico-coglicólico) (PLGA), um lipossoma, uma micela, uma micela inversa, um cocleado lipídico ou um microtúbulo lipídico.
[0034] Também são providas células compreendendo qualquer um dos ácidos nucleicos isolados acima, qualquer um dos RNAs guia acima, qualquer um dos RNAs antissentido, siRNAs, ou shRNAs acima, qualquer um dos polipeptídeos isolados acima, ou qualquer um dos vetores acima. Opcionalmente, a célula é uma célula humana, uma célula de roedor, uma célula de camundongo ou uma célula de rato. Opcionalmente, qualquer uma das células acima são células do fígado ou células pluripotentes.
[0035] Também são providos usos de qualquer um dos RNAs guia acima em um método de modificação de um gene HSD17B13 em uma célula ou um método para alterar a expressão de um gene HSD17B13 em uma célula. Também são providos usos de qualquer um dos RNAs antissentido, siRNAs ou shRNAs acima em um método para alterar a expressão de um gene HSD17B13 em uma célula.
[0036] Também são providos métodos de modificação de uma célula, modificação de um gene HSD17B13 ou alteração da expressão de um gene HSD17B13. Alguns desses métodos são para modificar um gene HSD17B13 em uma célula, compreendendo contatar o genoma da célula com: (a) uma proteína Cas; e (b) um RNA guia que forma um complexo com a proteína Cas
Petição 870190068171, de 18/07/2019, pág. 29/358
16/307 e tem como alvo uma sequência alvo de RNA guia dentro do gene HSD17B13, em que a sequência alvo de RNA guia inclui ou está próxima de uma posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2, em que a proteína Cas cliva o gene HSD17B13. Opcionalmente, a proteína Cas é uma proteína Cas9. Opcionalmente, a sequência alvo de RNA guia compreende, consiste essencialmente em, ou consiste em qualquer uma das SEQ ID NOS: 226 a 239 e 264 a 268. Opcionalmente, o segmento de direcionamento de DNA compreende, consiste essencialmente em, ou consiste em qualquer uma das SEQ ID NOS: 1629 a 1642 e 1648 a 1652. Opcionalmente, o RNA guia compreende, consiste essencialmente em, ou consiste em qualquer uma das SEQ ID NOS: 706 a 719; 936 a 949; 1166 a 1179, 1396 a 1409, 725 a 729, 955 a 959, 1185 a 1189 e 1415 a 1419. Opcionalmente, a sequência alvo de RNA guia é selecionada a partir das SEQ ID NOS: 226 a 239, ou em que a sequência alvo de RNA guia é selecionada a partir das SEQ ID NOS: 230 e 231. Opcionalmente, a sequência alvo de RNA guia é selecionada a partir das SEQ ID NOS: 226 a 239 e 264 a 268 ou é selecionado a partir das SEQ ID NOS: 264 a 268. Opcionalmente, a sequência alvo do RNA guia está dentro de uma região correspondente ao éxon 6 e/ou intron 6 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2. Opcionalmente, a sequência alvo do RNA guia está dentro de uma região correspondente ao éxon 6 e/ou ao íntron 6 e/ou éxon 7 da SEQ ID NO: 2 quando o gene de HSD17B13 está perfeitamente alinhado com a SEQ ID NO:
2. Opcionalmente, a sequência alvo de RNA guia está dentro de cerca de 1000, 500, 400, 300, 200, 100, 50, 45, 40, 35, 30, 25, 20, 15, 10, ou 5 nucleotídeos da posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2. Opcionalmente, a sequência alvo de RNA guia inclui a posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13
Petição 870190068171, de 18/07/2019, pág. 30/358 / 307 está perfeitamente alinhado com SEQ ID NO: 2.
[0037] Alguns destes métodos compreendem adicionalmente contactar o genoma com uma sequência de doador exógeno compreendendo um braço de homologia 5' que hibridiza com uma sequência alvo 5' da posição correspondente à posição 12666 da SEQ ID NO: 2 e um braço de homologia 3' que hibridiza com uma sequência alvo 3' da posição correspondente à posição 12666 da SEQ ID NO: 2, em que a sequência de doador exógeno se recombina com o gene HSD17B13. Opcionalmente, a sequência de doador exógeno compreende adicionalmente um inserto de ácido nucleico flanqueado pelo braço de homologia 5 ’ e o braço de homologia 3’. Opcionalmente, o inserto de ácido nucleico compreende uma timina, e em que por recombinação da sequência de doador exógeno com o gene HSD17B13, a timina é inserida entre os nucleotídeos correspondentes às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 se encontra perfeitamente alinhado com SEQ ID NO: 1. Opcionalmente, a sequência de doador exógeno tem entre cerca de 50 nucleotídeos a cerca de 1 kb de comprimento ou entre cerca de 80 nucleotídeos e cerca de 200 nucleotídeos de comprimento. Opcionalmente, a sequência de doador exógeno é um oligodesoxinucleotídeo de cadeia simples.
[0038] Alguns desses métodos são para modificar um gene HSD17B13 em uma célula, compreendendo contatar o genoma da célula com:
(a) uma proteína Cas; e (b) um primeiro RNA guia que forma um complexo com a proteína Cas e tem como alvo uma primeira sequência alvo de RNA guia dentro do gene HSD17B13, em que a primeira sequência alvo de RNA guia compreende o códon de iniciação para o gene HSD17B13 ou está dentro de 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, ou 1000 nucleotídeos do códon de iniciação ou é selecionado a partir das SEQ ID NOS: 20 a 81 ou é selecionado a partir das SEQ ID NOS: 20 a 81 e 259 a 263, em que a proteína Cas cliva ou altera a expressão do gene HSD17B13. Opcionalmente, a
Petição 870190068171, de 18/07/2019, pág. 31/358
18/307 primeira sequência alvo de RNA guia compreende, consiste essencialmente em, ou consiste em qualquer uma das SEQ ID NOS: 20 a 81 e 259 a 263. Opcionalmente, a primeira sequência alvo de RNA guia compreende, consiste essencialmente em, ou consiste em qualquer uma das SEQ ID NOS: 20 a 41, qualquer uma das SEQ ID NOS: 21 a 23, 33 e 35, ou qualquer uma das SEQ ID NOS: 33 e 35. Opcionalmente, o primeiro RNA guia compreende, consiste essencialmente em, ou consiste em um segmento de direcionamento de DNA que compreende qualquer uma das SEQ ID NOS: 1423 a 1484 e 1643 a 1647. Opcionalmente, o primeiro RNA guia compreende, consiste essencialmente em, ou consiste em um segmento de direcionamento de DNA que compreende qualquer uma das SEQ ID NOS: 1447 a 1468, qualquer uma das SEQ ID NOS: 1448 a 1450, 1460 e 1462; ou qualquer uma das SEQ ID NOS: 1460 e 1462. Opcionalmente, o primeiro RNA guia compreende, consiste essencialmente em, ou consiste em qualquer uma das SEQ ID NOS: 500 a 561, 730 a 791, 960 a 1021, 1190 a 1251, 720 a 724, 950 a 954, 1180 a 1184 e 1410 a 1414. Opcionalmente, o primeiro RNA guia compreende, consiste essencialmente em, ou consiste em qualquer uma das SEQ ID NOS: 524 a 545, 754 a 775, 984 a 1005 e 1214 a 1235, ou qualquer uma das SEQ ID NOS: 295 a 297, 525 a 527, 755 a 757, 985 a 987, 1215 a 1217, 307, 309, 537, 539, 767, 769, 997, 999, 1227 e 1229, ou qualquer uma das SEQ ID NOS: 307, 309, 537, 539, 767, 769, 997, 999, 1227 e 1229. Opcionalmente, a primeira sequência alvo de RNA guia é selecionada a partir das SEQ ID NOS: 20 a 41, é selecionada a partir das SEQ ID NOS: 21 a 23, 33 e 35, ou é selecionada a partir das SEQ ID NOS: 33 e 35. Opcionalmente, a proteína Cas é uma proteína Cas9. Opcionalmente, a proteína Cas é uma proteína Cas ativa de nuclease. Opcionalmente, a proteína Cas é uma proteína Cas inativa de nuclease fundida a um domínio ativador da transcrição ou uma proteína Cas inativa de nuclease fundida a um domínio repressor da transcrição.
[0039] Alguns destes métodos compreendem adicionalmente contatar
Petição 870190068171, de 18/07/2019, pág. 32/358
19/307 o genoma da célula com um segundo RNA guia que forma um complexo com a proteína Cas e tem como alvo uma segunda sequência alvo de RNA guia dentro do gene HSD17B13, em que a segunda sequência alvo de RNA guia compreende a sequência de códon para o gene HSD17B13 ou está dentro de cerca de 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos do códon de terminação ou é selecionado a partir das SEQ ID NOS: 82 a 225, em que a célula é modificada para compreender uma eliminação entre a primeira sequência alvo de RNA guia e a segunda sequência alvo de RNA guia. Opcionalmente, a segunda sequência alvo de RNA guia compreende, consiste essencialmente em, ou consiste em qualquer uma das SEQ ID NOS: 82 a 225. Opcionalmente, o segundo RNA guia compreende, consiste essencialmente em, ou consiste em um segmento de direcionamento de DNA que compreende qualquer uma das SEQ ID NOS: 1485 a 1628. Opcionalmente, o segundo RNA guia compreende, consiste essencialmente em, ou consiste em qualquer uma das SEQ ID NOS: 562 a 705, 792 a 935, 1022 a 1165 e 1252 a 1395.
[0040] Alguns desses métodos são para diminuir a expressão de um gene HSD17B13 em uma célula ou diminuir a expressão de uma transcrição específica de HSD17B13 (por exemplo, transcrição A ou transcrição D) em uma célula. Alguns desses métodos são para diminuir a expressão de um gene HSD17B13 em uma célula, compreendendo: contatar o genoma da célula com um RNA antissentido, um siRNA, ou um shRNA que hibridiza com uma sequência dentro do éxon 7 da SEQ ID NO: 4 (transcrição A de HSD17B13) e diminui expressão da transcrição A de HSD17B13. Alguns desses métodos são para diminuir a expressão de um gene HSD17B13 em uma célula, compreendendo: contatar o genoma da célula com um RNA antissentido, um siRNA, ou um shRNA que hibridiza com uma sequência dentro de uma transcrição de HSD17B13 divulgada aqui. Em alguns desses métodos, o RNA antissentido, siRNA, ou shRNA hibridiza com uma sequência dentro da SEQ ID NO: 4 (transcrição A de HSD17B13). Opcionalmente, o RNA
Petição 870190068171, de 18/07/2019, pág. 33/358
20/307 antissentido, siRNA, ou shRNA pode diminuir a expressão da transcrição A de HSD17B13 em uma célula. Opcionalmente, o RNA antissentido, siRNA, ou shRNA hibridiza com uma sequência presente na SEQ ID NO: 4 (transcrição A de HSD17B13) que não está presente na SEQ ID NO: 7 (transcrição D de HSD17B13). Opcionalmente, o RNA antissentido, siRNA ou shRNA hibridizam uma sequência no éxon 7 ou uma sequência que abrange o limite éxon 6-éxon 7 da SEQ ID NO: 4 (transcrição A de HSD17B13). Em alguns desses métodos, o RNA antissentido, siRNA, ou shRNA hibridiza com uma sequência dentro da SEQ ID NO: 7 (transcrição D de HSD17B13). Opcionalmente, o RNA antissentido, siRNA, ou shRNA pode diminuir a expressão da transcrição D de HSD17B13 em uma célula. Opcionalmente, o RNA antissentido, siRNA ou shRNA hibridiza com uma sequência presente na SEQ ID NO: 7 (transcrição D de HSD17B13) que não está presente na SEQ ID NO: 4 (transcrição A de HSD17B13). Opcionalmente, o RNA antissentido, siRNA, ou shRNA hibridiza com uma sequência no éxon 7 ou uma sequência que abrange o limite do éxon 6-éxon 7 da SEQ ID NO: 7 (transcrição D de HSD17B13).
[0041] Em qualquer um dos métodos acima para modificar um gene HSD17B13 ou alterar a expressão de um gene HSD17B13, o método pode adicionalmente compreender introduzir um vetor de expressão na célula, em que o vetor de expressão compreende um gene HSD17B13 recombinante compreendendo uma timina inserida entre nucleotídeos correspondentes às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 recombinante está perfeitamente alinhado com a SEQ ID NO: 1. Opcionalmente, o gene HSD17B13 recombinante é um gene humano. Opcionalmente, o gene HSD17B13 recombinante é um minigene de HSD17B13 em que um ou mais segmentos não essenciais do gene foram eliminados em relação a um gene HSD17B13 de tipo selvagem correspondente. Opcionalmente, os segmentos eliminados compreendem uma
Petição 870190068171, de 18/07/2019, pág. 34/358 / 307 ou mais sequências intrônicas. Opcionalmente, o minigene HSD17B13 compreende um íntron correspondente ao intron 6 da SEQ ID NO: 2 quando perfeitamente alinhado com a SEQ ID NO: 2.
[0042] Em qualquer um dos métodos acima para modificar um gene HSD17B13 ou alterar a expressão de um gene HSD17B13, o método pode compreender adicionalmente introduzir um vetor de expressão na célula, em que o vetor de expressão compreende um ácido nucleico que codifica uma proteína de HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico à SEQ ID NO: 15 (isoforma D de HSD17B13). Opcionalmente, o ácido nucleico que codifica a proteína de HSD17B13 é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico à SEQ ID NO: 7 (transcrição D de HSD17B13) quando perfeitamento alinhado com a SEQ ID NO: 7.
[0043] Em qualquer um dos métodos acima para modificar um gene HSD17B13 ou alterar a expressão de um gene HSD17B13, o método pode compreender adicionalmente introduzir uma proteína de HSD17B13 ou um seu fragmento na célula. Opcionalmente, a proteína de HSD17B13 ou seu fragmento é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 15 (isoforma D de HSD17B13).
[0044] Alguns desses métodos são para modificar uma célula, compreendendo introduzir um vetor de expressão na célula, em que o vetor de expressão compreende um gene HSD17B13 recombinante compreendendo uma timina inserida entre nucleotídeos correspondentes às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 recombinante está perfeitamente alinhado com a SEQ ID NO: 1. Opcionalmente, o gene HSD17B13 recombinante é um gene humano. Opcionalmente, o gene HSD17B13 recombinante é um minigene de HSD17B13 em que um ou mais
Petição 870190068171, de 18/07/2019, pág. 35/358 / 307 segmentos não essenciais do gene foram eliminados em relação a um gene HSD17B13 de tipo selvagem correspondente. Opcionalmente, os segmentos eliminados compreendem uma ou mais sequências intrônicas. Opcionalmente, o minigene HSD17B13 compreende um íntron correspondente ao íntron 6 da SEQ ID NO: 2 quando perfeitamente alinhado com a SEQ ID NO: 2.
[0045] Alguns destes métodos são para modificar uma célula, compreendendo introduzir um vetor de expressão na célula, em que o vetor de expressão compreende um ácido nucleico que codifica uma proteína de HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% indêntico a SEQ ID NO: 15 (isoforma D de HSD17B13). Opcionalmente, o ácido nucleico que codifica a proteína de HSD17B13 é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico à SEQ ID NO: 7 (transcrição D de HSD17B13) quando perfeitamento alinhado com a SEQ ID NO: 7.
[0046] Alguns desses métodos são para modificar uma célula, compreendendo introduzir uma proteína de HSD17B13 ou um seu fragmento na célula. Opcionalmente, a proteína de HSD17B13 ou seu fragmento é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 15 (isoforma D de HSD17B13).
[0047] Em qualquer dos métodos anteriores de modificação de uma célula, modificação de um gene HSD17B13, ou alteração da expressão de um gene HSD17B13, a célula pode ser uma célula humana, uma célula de roedor, uma célula de camundongo ou uma célula de rato. Qualquer uma das células pode ser células pluripotentes ou células diferenciadas. Qualquer uma das células pode ser células do fígado. Em qualquer um dos métodos anteriores de modificação de uma célula, modificação de um gene HSD17B13, ou alteração da expressão de um gene HSD17B13, o método ou a célula podem ser ex vivo
Petição 870190068171, de 18/07/2019, pág. 36/358 / 307 ou in vivo. Os RNAs guia usados em qualquer um dos métodos acima podem ser RNAs guia modulares compreendendo moléculas separadas de crRNA e tracrRNA que se hibridizam entre si ou um RNA guia único no qual a porção crRNA é fundida à porção tracrRNA (por exemplo, por um ligador).
[0048] Em outro aspecto, são providos métodos de tratamento de um indivíduo que tem ou é suscetível a desenvolver uma doença do fígado crônica. Em outro aspecto, são providos métodos de tratamento de um indivíduo que tem ou é suscetível a desenvolver uma doença do fígado alcoólica ou não alcoólica. Tais indivíduos podem ser, por exemplo, um indivíduo que não é um veículo da variante de HSD17B13, rs72613567, ou um indivíduo que não é um portador homozigótico da variante de HSD17B13, rs72613567. Alguns desses métodos compreendem um método de tratamento de um indivíduo que não é portador da variante de HSD17B13, rs72613567, e tem ou é suscetível a desenvolver uma doença do fígado crônica, compreendendo introduzir no indivíduo: (a) uma proteína Cas ou um ácido nucleico que codifica a proteína Cas; (b) um RNA guia ou um ácido nucleico que codifica o RNA guia, em que o RNA guia forma um complexo com a proteína Cas e tem como alvo uma sequência alvo de RNA guia dentro de um gene HSD17B13, em que a sequência alvo de RNA guia inclui ou está próxima a uma posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene de HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2; e (c) uma sequência de doador exógeno compreendendo um braço de homologia 5' que hibridiza com uma sequência alvo 5' da posição correspondente à posição 12666 da SEQ ID NO: 2, um braço de homologia 3' que hibridiza com uma sequência alvo 3' da posição correspondente à posição 12666 da SEQ ID NO: 2 e um inserto de ácido nucleico compreendendo uma timina flanqueada pelo braço de homologia 5' e o braço de homologia 3', em que a proteína Cas cliva o gene HSD17B13 em uma célula do fígado no indivíduo e a sequência de doador exógeno se recombina com o gene
Petição 870190068171, de 18/07/2019, pág. 37/358 / 307
HSD17B13 na célula do fígado, em que mediante recombinação da sequência de doador exógeno com o gene HSD17B13, a timina é inserida entre nucleotídeos correspondentes às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 1. [0049] Opcionalmente, a sequência alvo de RNA guia é selecionada a partir das SEQ ID NOS: 226 a 239, ou onde a sequência alvo de RNA guia é selecionada a partir das SEQ ID NOS: 230 e 231. Opcionalmente, a sequência alvo de RNA guia é selecionada a partir das SEQ ID NOS: 226 a 239 e 264 a 268. Opcionalmente, a sequência alvo do RNA guia está dentro de uma região correspondente ao éxon 6 e/ou intron 6 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2. Opcionalmente, a sequência alvo do RNA guia está dentro de uma região correspondente ao éxon 6 e/ou ao íntron 6 e/ou éxon 7 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2. Opcionalmente, a sequência alvo de RNA guia está dentro de cerca de 1000, 500, 400, 300, 200, 100, 50, 45, 40, 35, 30, 25, 20, 15, 10, ou 5 nucleotídeos da posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com SEQ ID NO: 2. Opcionalmente, a sequência alvo de RNA guia inclui a posição correspondente à posição 12666 de SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com SEQ ID NO: 2.
[0050] Opcionalmente, a sequência de doador exógeno tem entre cerca de 50 nucleotídeos e cerca de 1 kb de comprimento. Opcionalmente, a sequência de doador exógeno tem entre cerca de 80 nucleotídeos e cerca de 200 nucleotídeos de comprimento. Opcionalmente, a sequência de doador exógeno é um oligodesoxinucleotídeo de cadeia simples.
[0051] Alguns destes métodos compreendem um método para tratar um indivíduo que não é portador da variante de HSD17B13, rS72613567, e tem ou é suscetível a desenvolver uma doença do fígado crônica,
Petição 870190068171, de 18/07/2019, pág. 38/358 / 307 compreendendo introduzir no indivíduo: (a) uma proteína Cas ou um ácido nucleico que codifica a proteína Cas; (b) um primeiro RNA guia ou um ácido nucleico codificando o primeiro RNA guia, em que o primeiro RNA guia forma um complexo com a proteína Cas e tem como alvo uma primeira sequência alvo de RNA guia em um gene HSD17B13, em que a primeira sequência alvo de RNA guia compreende o códon de iniciação para o gene HSD17B13 ou está dentro de cerca de 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos do códon de iniciação ou é selecionado a partir das SEQ ID NOS: 20 a 81 ou é selecionado a partir das SEQ ID NOS: 20 a 81 e 259 a 263; e (c) um vetor de expressão compreendendo um gene HSD17B13 recombinante compreendendo uma timina inserida entre nucleotídeos correspondendo às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 recombinante está perfeitamente alinhado com a SEQ ID NO: 1, em que a proteína Cas cliva ou altera a expressão do gene HSD17B13 em uma célula do fígado no indivíduo e o vetor de expressão expressa o gene HSD17B13 recombinante na célula do fígado no indivíduo. Alguns desses métodos compreendem um método de tratamento de um indivíduo que não é portador da variante de HSD17B13, rs72613567, e tem ou é suscetível a desenvolver uma doença do fígado crônica, compreendendo introduzir no indivíduo: (a) uma proteína Cas ou um ácido nucleico que codifica a proteína Cas; (b) um primeiro RNA guia ou um ácido nucleico que codifica o primeiro RNA guia, em que o primeiro RNA guia forma um complexo com a proteína Cas e tem como alvo uma primeira sequência alvo de RNA guia em um gene HSD17B13, em que a primeira sequência alvo de RNA guia compreende o códon de iniciação para o gene HSD17B13 ou está dentro de cerca de 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos do códon de iniciação ou é selecionado a partir das SEQ ID NOS: 20 a 81 ou é selecionado a partir das SEQ ID NOS: 20 a 81 e 259 a 263; e opcionalmente (c) um vetor de expressão compreendendo um gene HSD17B13 recombinante
Petição 870190068171, de 18/07/2019, pág. 39/358 / 307 compreendendo uma timina inserida entre nucleotídeos correspondendo às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 recombinante está perfeitamente alinhado com a SEQ ID NO: 1, em que a proteína Cas cliva ou altera a expressão do gene HSD17B13 em uma célula do fígado no indivíduo e o vetor de expressão expressa o gene HSD17B13 recombinante na célula do fígado no indivíduo.
[0052] Opcionalmente, a primeira sequência alvo de RNA guia é selecionada a partir das SEQ ID NOS: 20 a 41, é selecionada a partir das SEQ ID NOS: 21 a 23, 33 e 35, ou é selecionada a partir das SEQ ID NOS: 33 e 35. Opcionalmente, a proteína Cas é uma proteína Cas ativa de nuclease. Opcionalmente, a proteína Cas é uma proteína Cas inativa de nuclease fundida a um domínio repressor transcricional.
[0053] Tais métodos podem compreender adicionalmente a introdução no indivíduo de um segundo RNA guia, em que o segundo RNA guia forma um complexo com a proteína Cas e tem como alvo uma segunda sequência alvo de RNA guia dentro do gene HSD17B13, em que a segunda sequência alvo de RNA guia compreende o códon de terminação para o gene HSD17B13 ou está entre cerca de 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos do códon de terminação ou é selecionado a partir das SEQ ID NOS: 82 a 225, em que a proteína Cas cliva o gene HSD17B13 na célula do fígado tanto na primeira sequência alvo do RNA guia como na segunda sequência alvo do RNA guia, em que a célula do fígado é modificada para compreender uma eliminação entre a primeira sequência alvo do RNA guia e a segunda sequência alvo do RNA guia.
[0054] Opcionalmente, o gene HSD17B13 recombinante é um minigene HSD17B13 no qual um ou mais segmentos não essenciais do gene foram eliminados em relação a um gene HSD17B13 do tipo selvagem correspondente. Opcionalmente, os segmentos eliminados compreendem uma ou mais sequências intrônicas. Opcionalmente, o minigene HSD17B13
Petição 870190068171, de 18/07/2019, pág. 40/358 / 307 compreende um íntron correspondente ao íntron 6 da SEQ ID NO: 2 quando perfeitamente alinhado com a SEQ ID NO: 2.
[0055] Em qualquer um dos métodos terapêuticos ou profiláticos acima, a proteína Cas pode ser uma proteína Cas9. Em qualquer um dos métodos terapêuticos ou profiláticos acima, o indivíduo pode ser um humano. Em qualquer um dos métodos terapêuticos ou profiláticos acima, a doença do fígado crônica pode ser uma doença do fígado gorduroso, uma doença do fígado gorduroso não alcoólica (DHGNA), uma doença do fígado gorduroso alcoólica, uma cirrose ou um carcinoma hepatocelular. Do mesmo modo, em qualquer um dos métodos acima, o método terapêutico ou profilático pode ser para uma doença do fígado que é uma doença do fígado alcoólica ou uma doença do fígado não alcoólica.
[0056] Alguns destes métodos compreendem um método de tratamento de um indivíduo que não é portador da variante de HSD17B13, rS72613567, e tem ou é suscetível a desenvolver uma doença do fígado crônica, compreendendo introduzir no indivíduo: um RNA antissentido, um siRNA, ou um shRNA que hibridiza com uma sequência no éxon 7 ou uma sequência que abrange o limite do éxon 6 -éxon 7 da SEQ ID NO: 4 (transcrição A de HSD17B13) e diminui a expressão da transcrição A de HSD17B13 em uma célula de fígado no indivíduo. Alguns desses métodos compreendem um método de tratamento de um indivíduo que não é portador da variante de HSD17B13, rs72613567, e tem ou é suscetível a desenvolver uma doença do fígado crônica, compreendendo introduzir no indivíduo: um RNAs antissentido, um siRNA ou um shRNA que hibridiza uma sequência dentro de um transcrição de HSD17B13 aqui divulgada. Opcionalmente, o RNA antissentido, siRNA ou shRNA hibridiza com uma sequência dentro de SEQ ID NO: 4 (transcrição A de HSD17B13). Opcionalmente, o RNA antissentido, siRNA, ou shRNA pode diminuir a expressão da transcriçãoA de HSD17B13 em uma célula. Opcionalmente, o RNA antissentido, siRNA, ou
Petição 870190068171, de 18/07/2019, pág. 41/358 / 307 shRNA hibridiza com uma sequência presente na SEQ ID NO: 4 (transcrição A de HSD17B13) que não está presente na SEQ ID NO: 7 (transcrição D de HSD17B13). Opcionalmente, o RNA antissentido, siRNA ou shRNA hibridizam uma sequência no éxon 7 ou uma sequência que abrange o limite de éxon 6-éxon 7 da SEQ ID NO: 4 (transcrição A de HSD17B13).
[0057] Opcionalmente, tais métodos compreendem adicionalmente introduzir um vetor de expressão no indivíduo, em que o vetor de expressão compreende um gene HSD17B13 recombinante compreendendo uma timina inserida entre nucleotídeos correspondentes às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 recombinante é perfeitamente alinhado com a SEQ ID NO: 1, em que o vetor de expressão expressa o gene HSD17B13 recombinante na célula do fígado no indivíduo.
[0058] Opcionalmente, tais métodos compreendem adicionalmente introduzir um vetor de expressão no indivíduo, em que o vetor de expressão compreende um ácido nucleico que codifica uma proteína de HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% indêntico a SEQ ID NO: 15 (isoforma D de HSD17B13), em que o vetor de expressão expressa o ácido nucleico que codifica a proteína de HSD17B13 na célula do fígado no indivíduo. Opcionalmente, o ácido nucleico que codifica a proteína de HSD17B13 é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico à SEQ ID NO: 7 (transcrição D de HSD17B13) quando perfeitamento alinhado com a SEQ ID NO: 7.
[0059] Opcionalmente, tais métodos compreendem adicionalmente introduzir um RNA mensageiro no indivíduo, em que o RNA mensageiro codifica uma proteína de HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% indêntico a SEQ ID NO: 15 (isoforma D de HSD17B13), em que o
Petição 870190068171, de 18/07/2019, pág. 42/358 / 307
RNAm expressa a proteína de HSD17B13 na célula do fígado no indivíduo. Opcionalmente, um DNA complementar transcrito reversamente a partir do RNA mensageiro é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico à SEQ ID NO : 7 (transcrição D de HSD17B13) quando está perfeitamente alinhado com a SEQ ID NO: 7.
[0060] Opcionalmente, tais métodos compreendem adicionalmente introduzir uma proteína de HSD17B13 ou seu fragmento no indivíduo. Opcionalmente, a proteína de HSD17B13 ou seu fragmento é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 15 (isoforma D de HSD17B13).
[0061] Alguns destes métodos compreendem um método para tratar um indivíduo que não é portador da variante de HSD17B13, rs72613567, e tem ou é suscetível a desenvolver uma doença do fígado crônica compreendendo introduzir um vetor de expressão no indivíduo, em que o vetor de expressão compreende um gene HSD17B13 recombinante compreendendo uma timina inserida entre os nucleotídeos correspondendo às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 recombinante está perfeitamente alinhado com a SEQ ID NO: 1, em que o vetor de expressão expressa o gene HSD17B13 recombinante em uma célula do fígado no indivíduo.
[0062] Em qualquer um dos métodos acima, o gene HSD17B13 recombinante pode ser um gene humano. Em qualquer um dos métodos acima, o gene HSD17B13 recombinante pode ser pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico à SEQ ID NO: 2 quando perfeitamento alinhado com a SEQ ID NO: 2. Em qualquer dos métodos acima, o gene HSD17B13 recombinante pode ser um minigene HSD17B13 em que um ou mais
Petição 870190068171, de 18/07/2019, pág. 43/358
30/307 segmentos não essenciais do gene foram eliminados em relação a um gene HSD17B13 de tipo selvagem correspondente. Opcionalmente, os segmentos eliminados compreendem uma ou mais sequências intrônicas. Opcionalmente, o minigene HSD17B13 compreende um íntron correspondente ao íntron 6 da SEQ ID NO: 2 quando perfeitamente alinhado com a SEQ ID NO: 2.
[0063] Alguns destes métodos compreendem um método para tratar um indivíduo que não é portador da variante de HSD17B13, rS72613567, e tem ou é suscetível a desenvolver uma doença do fígado crônica compreendendo introduzir um vetor de expressão no indivíduo, em que o vetor de expressão compreende um ácido nucleico que codifica uma proteína de HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 15 (isoforma D de HSD17B13), em que o vetor de expressão expressa o ácido nucleico que codifica a proteína de HSD17B13 em uma célula de fígado no indivíduo. Opcionalmente, o ácido nucleico que codifica a proteína de HSD17B13 é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico à SEQ ID NO: 7 (transcrição D de HSD17B13) quando perfeitamento alinhado com a SEQ ID NO: 7.
[0064] Alguns destes métodos compreendem um método de tratamento de um indivíduo que não é portador da variante de HSD17B13, rS72613567, e tem ou é suscetível de desenvolver uma doença do fígado crônica compreendendo a introdução de um RNA mensageiro no indivíduo, em que o RNA mensageiro codifica uma proteína de HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 15 (isoforma D de HSD17B13), em que o RNAm expressa a proteína de HSD17B13 na célula do fígado no indivíduo. Opcionalmente, um DNA complementar transcrito reversamente a partir do RNA mensageiro é pelo menos 90%, pelo menos
Petição 870190068171, de 18/07/2019, pág. 44/358
31/307
95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico à SEQ ID NO: 7 (transcrição D de HSD17B13) quando perfeitamento alinhado com a SEQ ID NO: 7.
[0065] Alguns destes métodos compreendem um método de tratamento de um indivíduo que não é um protador da variante de HSD17B13, rS72613567, e tem ou é suscetível de desenvolver uma doença do fígado crônica compreendendo introduzir uma proteína de HSD17B13 ou um seu fragmento no fígado do indivíduo. Opcionalmente, a proteína de HSD17B13 ou seu fragmento é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 15 (isoforma D de HSD17B13).
[0066] Em qualquer um dos métodos acima, o indivíduo pode ser humano. Em qualquer dos métodos anteriores, a doença do fígado crônica pode ser doença do fígado gorduroso não alcoólica (DHGNA), doença do fígado gorduroso alcoólica, cirrose ou carcinoma hepatocelular. Do mesmo modo, em qualquer um dos métodos acima, o método terapêutico ou profilático pode ser para uma doença do fígado que é uma doença do fígado alcoólica ou uma doença do fígado não alcoólica. Em qualquer um dos métodos acima, a introdução no indivíduo pode compreender entrega hidrodinâmica, entrega mediada por vírus, entrega mediada por nanopartículas de lipídios ou infusão intravenosa.
BREVE DESCRIÇÃO DAS FIGURAS [0067] As Figuras IA e 1B mostram gráficos de Manhattan (à esquerda) e quantil-quantil (direita) de associações de variantes de nucleotídeo único com os níveis medianos de alanina aminotransferase (ALT; Figura IA) e aspartato aminotransferase (AST; Figura IB) no coorte de descoberta do GHS. A Figura IA mostra que havia 31 variantes em 16 genes significativamente associados aos níveis de ALT (N = 41.414) em P < 1,0 x IO'7. A Figura 1B mostra que havia 12 variantes em 10 genes
Petição 870190068171, de 18/07/2019, pág. 45/358
32/307 significativamente associados aos níveis de AST (N = 40.753) em P < 1,0 x IO'7. Todas as associações significativas são mostradas na Tabela 2. Houve treze variantes em nove genes (indicados aqui pelo nome do gene), incluindo HSD17B13, que permaneceu significativamente associado à ALT ou AST em uma metanálise de replicação de três coortes distintas de ancestralidade europeia (Tabela 3). Os testes de associação foram bem calibrados, como mostrado pelos gráficos quantil-quantil e controle genômico (Figura IA e Figura 1B).
[0068] As Figuras 2A e 2B mostram que rs72613567 de HSD17B13:TA está associado à redução do risco de fenótipos de doença do fígado alcoólica e não alcoólica na coorte de descoberta (Figura 2A) e com risco reduzido de progressão de esteatose simples para esteatohepatite e fibrose na coorte de cirurgia bariátrica (Figura 2B). As razões de probabilidade foram calculadas usando regressão logística, com ajuste para idade, idade2, sexo, IMC e principais componentes de ancestralidade. Razões de probabilidade genotípicas para portadores heterozigotos (Het OR) e homozigotos (Hom OR) também são mostradas. Na coorte de descoberta do GHS na Figura 2A, a variante de HSD17B13 foi associada com um risco significativamente reduzido de doença do fígado não alcoólica e alcoólica, cirrose e carcinoma hepatocelular de uma maneira dependente de dosagem de alelo. Na coorte de cirurgia bariátrica do GHS na Figura 2B, rs72613567 de HSD17B13 foi associado com 13% e 52% de probabilidade de esteatohepatite não alcoólica (NASH) e 13% e 61% de probabilidade de fibrose, em portadores de AT heterozigotos e homozigotos, respectivamente.
[0069] As Figuras 3A a 3D mostram a expressão de quatro transcrições de HSD17B13 (A a D) em portadores homozigóticos de referência (T/T), heterozigóticos (T/TA) e alternativos homozigóticos (TA/TA) da variante de entrelaçamento HSD17B13, rs72613567. Cada transcrição é ilustrada com um modelo genético correspondente. As regiões
Petição 870190068171, de 18/07/2019, pág. 46/358 / 307 de codificação nos modelos genéticos são indicadas nas caixas listradas e nas regiões não traduzidas nas caixas pretas. A Figura 3A mostra uma representação da transcrição A e dados de expressão para a transcrição A. A Figura 3B mostra uma representação da transcrição B e dados de expressão para a transcrição B. Na transcrição B, o éxon 2 é ignorado. A Figura 3C mostra uma representação dos dados da transcrição C e da expressão da transcrição C. Na transcrição C, o éxon 6 é ignorado. A Figura 3D mostra uma representação dos dados da transcrição D e da expressão da transcrição D. O asterisco na transcrição D ilustra a inserção de G de rs72613567 na extremidade 3' do éxon 6, o que leva a truncamento prematuro da proteína. A transcrição D se toma a transcrição dominante em portadores homozigóticos da variante de entrelaçamento de HSD17B13. A expressão gênica é exibida em unidades FPKM (fragmentos por quilobase de transcrição por milhão de leituras mapeadas). Inserções na Figura 3B e na Figura 3C mostram uma visualização ampliada.
[0070] A Figura 4 mostra que estudos de RNA-Seq de fígado humano revelam oito transcrições de HSD17B13, incluindo seis novas transcrições de HSD17B13 (transcrições C a Η). A expressão das transcrições é exibida em unidades FPKM (fragmentos por quilobase de transcrição por milhão de leituras mapeadas). As estruturas das transcrições são providas no lado direito da figura.
[0071] As Figuras 5A e 5B mostram gráficos de locus-zoom de HSD17B13 (gráficos de associação regional na região em torno de HSD17B13) na coorte de descoberta de GHS para ALT e AST, respectivamente. Não houve recombinação significativa em toda a região. Os diamantes indicam a variante de entrelaçamento rs72613567. Cada círculo indica uma variante de nucleotídeo único com a cor do círculo indicando o desequilíbrio de ligação (r2 calculado na coorte DiscovEHR) entre essa variante e rs72613567. Linhas indicam taxas estimadas de recombinação no
Petição 870190068171, de 18/07/2019, pág. 47/358
34/307
HapMap. Os painéis inferiores mostram a posição relativa e a fita transcrita de cada gene no locus. Não houve associações significativas entre ALT ou AST e codificação ou variantes da região de união no gene vizinho HSD17B11 (valores P mais significativos 1,4 x 10'1 e 4,3 x IO'2 para ALT e AST, respectivamente).
[0072] As Eiguras 6A a 6D mostram a expressão de RNAm de quatro novas transcrições de HSD17B13 (E a H) em portadores homozigóticos de referência (T/T), heterozigóticos (T/TA) e alternativos homozigóticos (TA/TA) da variante de entrelaçamento de HSD17B13. Cada transcrição é ilustrada com um modelo genético correspondente. As regiões de codificação nos modelos genéticos são indicadas em caixas com faixas e regiões não traduzidas em caixas pretas. As Figuras 6A e 6D mostram que as transcrições E e H contêm um éxon adicional entre os éxons 3 e 4. A Figura 6B mostra que a transcrição F envolve a leitura do éxon 6 para o intron 6. A Figura 6C mostra que na transcrição G, o éxon 2 é ignorado. O asterisco nas transcrições G e H (Figuras 6C e 6D, respectivamente) ilustra a inserção de G de rs72613567 na extremidade 3' do éxon 6, o que leva a truncamento prematuro da proteína. As transcrições são diferencialmente expressas de acordo com o genótipo de HSD17B13, como mostrado nos gráficos em caixa. A expressão de RNAm é exibida em unidades FPKM (fragmentos por quilobase de transcrição por milhão de leituras mapeadas).
[0073] As Figuras 7A a 7B mostram um alinhamento da sequência proteica das isoformas da proteína de HSD17B13 A a H.
[0074] A Figura 8 mostra que rs72613567 de HSD17B13:TA está associada à redução do risco de fenótipos de doença do fígado alcoólica e não alcoólica. Especificamente, a Figura 8 mostra no estudo do fígado de Dallas, rs72613567 de HSD17B13 foi associado com menor probabilidade de qualquer doença do fígado de uma maneira dependente de dosagem de alelo. Observaram-se efeitos semelhantes dependentes da dosagem de alelo nos
Petição 870190068171, de 18/07/2019, pág. 48/358 / 307 subtipos de doença do fígado. As razões de probabilidade foram calculadas usando regressão logística, com ajuste para idade, idade2, sexo, IMC e etnia autorreferida.
[0075] A Figura 9 mostra que rs72613567 de HSD17B13 está associada à redução do risco de progressão de esteatose simples para esteatohepatite e fibrose. Especificamente, mostra que a prevalência de doença do fígado caracterizada histopatologicamente de acordo com o genótipo rs72613567 de HSD17B13 em 2391 indivíduos com biópsias hepáticas da coorte de cirurgia bariátrica do GHS. A prevalência de fígado normal não pareceu diferir pelo genótipo (P = 0,5 pelo teste do Qui-quadrado para tendência em proporções), mas a prevalência de NASH diminuiu (P = 1,6 x IO'4) e a de esteatose simples aumentou (P = 1,1 x 10'3) com cada alelo TA.
[0076] As Figuras 10A a 10E mostram expressão, localização subcelular e atividade enzimática de uma nova transcrição de HSD17B13. A Figura 10A mostra uma transferência de Western de células HepG2 superexpressando as transcrições A e D de HSD17B13 e mostra que a transcrição D de HSD17B13 foi traduzida para uma proteína truncada com menor peso molecular em comparação com a transcrição A de HSD17B13. A Figura 10B mostra Western blot de HSD17B13 de fígado humano congelado fresco e amostras celulares de HEK293. As amostras de fígado humano são de portadores de referência homozigóticos (T/T), heterozigóticos (T/TA) e alternativos homozigóticos (TA/TA) da variante de entrelaçamento de HSD17B13, rs72613567. As amostras de células são de células HEK293 superexpressando as transcrições A e D de HSD17B13 não marcadas. A transcrição D de HSD17B13 foi traduzida para uma proteína IsoD truncada com um peso molecular inferior a IsoA de HSD17B13. A Figura 10C mostra que os níveis de proteína IsoD de HSD17B13 eram inferiores aos níveis de proteína IsoA tanto de amostras de fígado humano (esquerda) como de células
Petição 870190068171, de 18/07/2019, pág. 49/358 / 307 (direita). O nível de proteína normalizado para actina é mostrado nas colunas da barra; ** P < 0,001, * P < 0,05. A Figura 10D mostra a atividade enzimática das isoformas A e D de HSD17B13 a estradiol 17-beta (estradiol), leucotrieno B4 (LTB4) e ácido 13-hidroxioctadecadienoico (13(S)-HODE). A isoforma D de HSD17B13 apresenta < 10% de atividade enzimática dos valores correspondentes para a Isoforma A. A Figura 10E mostra a isoforma D de HSD17B13 quando superexpressa em células HEK293 não mostrou muita conversão de estradiol (substrato) em estrona (produto) quando medida no meio de cultura, enquanto a isoform A de HSD17B13 superexpressa mostrou forte conversão.
[0077] As Figuras 11A a 11C mostram que a proteína da isoforma D de HSD17B13 tem um peso molecular menor e é instável quando superexpressa em células HEK 293. A Figura 11A mostra a RT-PCR de HSD17B13 a partir de células HEK 293 superexpressando as transcrições A (IsoA) e D (IsoD) de HSD17B13, indicando que o nível de RNA de HSD17B13 era superior ao nível de RNA de IsoA. A Figura 11B mostra Western blot das mesmas linhagens celulares indicando que a transcrição D de HSD17B13 foi traduzida para uma proteína truncada com menor peso molecular em comparação com a transcrição A de HSD17B13. A Figura 11C mostra que os níveis de proteína IsoD de HSD17B13 eram inferiores aos níveis de proteína IsoA, embora o nível de RNA fosse maior. O nível de proteína de HSD17B13 foi normalizado para actina; *P< 0,05.
[0078] A Figura 12 mostra padrões de localização semelhantes das isoforma A e isoforma D de HSD17B13 para gotículas lipídicas isoladas (LD) derivadas de linhagens celulares estáveis de HepG2. ADRP e TIP47 foram utilizados como marcadores de gotículas lipídicas. LAMP1, calreticulina e COX IV foram utilizados como marcadores para os compartimentos lisossômicos, retículo endoplasmático e mitocondrial, respectivamente. A GAPDH foi incluída como marcador citosólico e a actina foi usada como
Petição 870190068171, de 18/07/2019, pág. 50/358 / 307 marcador do citoesqueleto. Este experimento foi repetido duas vezes em células HepG2, sendo o acima representativo de ambas as execuções. PNS = fração pós-nuclear; TM = membrana total.
[0079] As Figuras 13A a 13D mostram ácido oleico aumentado em triglicerídeos em células HepG2 superexpressando a transcrição A ou D de HSD17B13. A Figura 13A mostra tratamento com concentrações crescentes de ácido oléico aumentando o conteúdo de triglicerídeos (TG) em uma extensão similar no controle (células que superexpressam GFP) e linhagens celulares de transcrição A e D de HSD17B13. A Figura 13B mostra que os níveis de RNA das transcrições A e D de HSD17B13 foram semelhantes nas linhagens celulares. Os níveis de RNA são mostrados por quilobase de transcrições por milhão de leituras mapeadas (RPKM). A Figura 13C mostra um Western blot de células HepG2 superexpressando as transcrições A e D de HSD17B13. A transcrição D de HSD17B13 foi traduzida para uma proteína truncada com menor peso molecular em comparação com a transcrição A de HSD17B13. A Figura 13D mostra que os níveis de proteína IsoD de HSD17B13 eram inferiores aos níveis de proteína IsoA. Nível de proteína normalizado para actina; **P< 0,01.
[0080] A Figura 14 mostra valores de Km e Vmax para o estradiol utilizando proteína de HSD17B13 recombinante purificada. Para as determinações de Km e Vmax, os ensaios foram realizados com um intervalo de dose de 17-estradiol entre 0,2 a 200 e os pontos de tempo de 5 minutos a 180 minutos, com 500 de NAD+ e 228 nM de HSD17B13. Vmax e Km foram então determinados usando o modelo de Michaelis-Menten e o software Prism (GraphPad Software, EUA).
[0081] A Figura 15 mostra a porcentagem de edição do genoma (número total de inserções ou deleções observadas dentro de uma janela de 20 pares de bases em cada lado da quebra de DNA induzida por Cas9 sobre o número total de sequências lidas na reação de PCR de um agrupamento de
Petição 870190068171, de 18/07/2019, pág. 51/358 / 307 células lisadas) no locus Hsdl7bl3 de camundongo como determinado por sequenciamento de nova geração (NGS) em hepatócitos primários isolados de camundongos híbridos do tipo selvagem (75% C57BL/6NTac 25% 129S6/SvEvTac). As amostras testadas incluíam hepatócitos tratados com complexos ribonucleoproteicos contendo Cas9 e RNAs guia projetados para atingir o locus Hsdl7bl3 de camundongo.
[0082] A Figura 16 mostra a porcentagem de edição do genoma (número total de inserções ou deleções observadas sobre o número total de sequências lidas na reação de PCR de um agrupamento de células lisadas) no locus Hsdl7bl3 de camundongo, conforme determinado por sequenciamento de nova geração (NGS) em amostras isoladas de fígados de camundongo, três semanas após a injeção de cassetes de expressão de AAV8 contendo sgRNA concebidas para atingir Hsdl7bl3 de camundongo em camundongos prontos para Cas9. Camundongos do tipo selvagem que não expressam qualquer Cas9 foram injetados com AAV8 contendo todas os cassetes de expressão de sgRNA que foram utilizados como um controle negativo.
[0083] As Figuras 17A e 17B mostram a expressão relativa de RNAm para Hsdl7bl3 de camundongo e um membro da família HSD não alvo, respectivamente, conforme determinado por RT-qPCR em amostras de fígado de camundongos Cas9 tratados com AAV8 contendo cassetes de expressão de RNA guia projetados para o Hsdl7bl3 de camundongo alvo. Camundongos de tipo selvagem que não expressam qualquer Cas9 foram injetados com AAV8 contendo cassetes de expressão de RNA guia para todos os RNAs guia foram utilizados como um controle negativo.
DEFINIÇÕES [0084] Os termos “proteína”, “polipeptídeo” e “peptídeo” aqui utilizados indistintamente, incluem formas poliméricas de aminoácidos de qualquer comprimento, incluindo aminoácidos codificados e não codificados e aminoácidos quimicamente ou bioquimicamente modificados ou
Petição 870190068171, de 18/07/2019, pág. 52/358 / 307 derivatizados. Os termos também incluem polímeros que foram modificados, tais como polipeptídeos com estruturas peptídicas modificadas.
[0085] Diz-se que as proteínas têm um “terminal N” e um “terminal C”. O termo “terminal N” se refere ao início de uma proteína ou polipeptídeo, terminado por um aminoácido com um grupo amina livre (-NH2). O termo “terminal C” se refere ao final de uma cadeia de aminoácidos (proteína ou polipeptídeo), terminada por um grupo carboxila livre (-COOH).
[0086] Os termos “ácido nucleico” e “polinucleotídeo”, aqui utilizados indistintamente, incluem formas poliméricas de nucleotídeos de qualquer comprimento, incluindo ribonucleotídeos, desoxirribonucleotídeos, ou análogos ou versões modificadas dos mesmos. Eles incluem DNA ou RNA de cadeia simples, dupla ou múltipla, DNA genômico, cDNA, híbridos DNARNA e polímeros que compreendem bases de purinas, bases de pirimidina ou outros naturais, modificados quimicamente, modificados bioquimicamente, não naturais ou bases nucleotídicas derivatizadas.
[0087] Os ácidos nucleicos são referidos como tendo as “extremidades 5”’ e as extremidades “3”’ porque os mononucleotídeos são reagidos para produzir oligonucleotídeos de uma maneira tal que o 5' fosfato de um anel de pentose mononucleotídico é ligado ao oxigênio 3' de seu vizinho em uma direção através de uma ligação fosfodiéster. Uma extremidade de um oligonucleotídeo é chamada de extremidade “5”’ se seu 5’ fosfato não estiver ligado ao oxigênio 3’ de um anel pentose mononucleotídico. Uma extremidade de um oligonucleotídeo é chamada de extremidade “3”’ se seu oxigênio 3’ não estiver ligado a um 5’ fosfato de outro anel pentose mononucleotídico. Uma sequência de ácido nucleico, mesmo se interna a um oligonucleotídeo maior, também pode ser considerada como tendo extremidades 5’ e 3’. Em uma molécula de DNA linear ou circular, os elementos discretos são referidos como “ascendente” ou 5’ dos elementos “descendentes” ou 3’.
Petição 870190068171, de 18/07/2019, pág. 53/358
40/307 [0088] O termo “tipo selvagem” inclui entidades tendo uma estrutura e/ou atividade como encontradas em um estado ou contexto normal (em contraste com mutante, doente, alterado, ou assim por diante). Os genes e polipeptídeos do tipo selvagem existem frequentemente em múltiplas formas diferentes (por exemplo, alelos).
[0089] O termo “isolado” com relação a proteínas e ácido nucleico inclui proteínas e ácidos nucleicos que são relativamente purificados com relação a outros componentes bacterianos, virais ou celulares que podem estar normalmente presentes in situ, até e incluindo uma preparação substancialmente pura da proteína e do polinucleotídeo. O termo “isolado” também inclui proteínas e ácidos nucleicos que não têm contrainiciação natural, foram quimicamente sintetizados e, portanto, substancialmente não contaminados por outras proteínas ou ácidos nucleicos, ou foram separados ou purificados da maioria dos outros componentes celulares com os quais são naturalmente acompanhados (por exemplo, outras proteínas celulares, polinucleotídeos ou componentes celulares).
[0090] As moléculas ou sequências “exógenas” incluem moléculas ou sequências que não estão normalmente presentes em uma célula nessa forma. A presença normal inclui a presença em relação ao estágio de desenvolvimento específico e às condições ambientais da célula. Uma molécula ou sequência exógena, por exemplo, pode incluir uma versão mutada de uma sequência endógena correspondente dentro da célula ou pode incluir uma sequência correspondente a uma sequência endógena dentro da célula, mas de uma forma diferente (isto é, não dentro de um cromossoma). Em contraste, moléculas ou sequências endógenas incluem moléculas ou sequências que estão normalmente presentes nessa forma em uma célula particular em um determinado estágio de desenvolvimento sob condições ambientais específicas.
[0091] O termo “heterólogo”, quando utilizado no contexto de um
Petição 870190068171, de 18/07/2019, pág. 54/358 / 307 ácido nucleico ou de uma proteína, indica que o ácido nucleico ou proteína compreende pelo menos duas porções que não ocorrem naturalmente em conjunto. Do mesmo modo, o termo “heterólogo”, quando utilizado no contexto de um promotor operativamente ligado a um ácido nucleico que codifica uma proteína, indica que o promotor e o ácido nucleico que codifica a proteína não ocorrem naturalmente em conjunto (isto é, não estão naturalmente ligados operativamente). Por exemplo, o termo “heterólogo”, quando usado com referência a porções de um ácido nucleico ou porções de uma proteína, indica que o ácido nucleico ou a proteína compreende duas ou mais subsequências que não são encontradas na mesma relação entre si (por exemplo, unidos) na natureza. Como um exemplo, uma região “heteróloga” de um vetor de ácido nucleico é um segmento de ácido nucleico dentro ou ligado a outra molécula de ácido nucleico que não é encontrada em associação com a outra molécula na natureza. Por exemplo, uma região heteróloga de um vetor de ácido nucleico podería incluir uma sequência de codificação flanqueada por sequências não encontradas em associação com a sequência de codificação na natureza. Da mesma forma, uma região “heteróloga” de uma proteína é um segmento de aminoácidos dentro ou ligado a outra molécula peptídica que não é encontrada em associação com a outra molécula peptídica na natureza (por exemplo, uma proteína de fusão ou uma proteína com uma marca). De um modo semelhante, um ácido nucleico ou proteína pode compreender um marcador heterólogo ou uma sequência de secreção ou localização heteróloga.
[0092] O termo “etiqueta” se refere a uma porção ou proteína química que é direta ou indiretamente detectável (por exemplo, devido às suas propriedades espectrais, conformação ou atividade) quando ligada a um composto alvo. A etiqueta pode ser diretamente detectável (fluoróforo) ou indiretamente detectável (hapteno, enzima ou supressor de fluoróforo). Tais etiquetas podem ser detectáveis por meios espectroscópicos, fotoquímicos,
Petição 870190068171, de 18/07/2019, pág. 55/358 / 307 bioquímicos, imunoquímicos ou químicos. Tais etiquetas incluem, por exemplo, etiquetas radioativas que podem ser medidas com dispositivos de contagem de radiação; pigmentos, corantes ou outros cromógenos que podem ser observados visualmente ou medidos com um espectrofotômetro; etiquetas de spin que podem ser medidas com um analisador de etiquetas rotativo; e fluorescentes (fluoróforos), onde o sinal de saída é gerado pela excitação de um aduto molecular adequado e que pode ser visualizado por excitação com luz que é absorvida pelo corante ou pode ser medida com fluorômetros padrão ou sistemas de imagem. A etiqueta pode também ser, por exemplo, uma substância quimioluminescente, em que o sinal de saída é gerado por modificação química do composto de sinal; uma substância contendo metal; ou uma enzima, onde ocorre uma geração secundária de sinal dependente de enzima, tal como a formação de um produto colorido a partir de um substrato incolor. O termo “rótulo” também pode se referir a um “marcador” ou hapteno que pode se ligar seletivamente a uma molécula conjugada, de modo que a molécula conjugada, quando adicionada subsequentemente junto com um substrato, seja usada para gerar um sinal detectável. Por exemplo, pode-se usar biotina como etiqueta e então usar um conjugado de avidina ou estreptavidina de peroxidato de rábano (HRP) para se ligar à etiqueta, e então usar um substrato calorimétrico (por exemplo, tetrametilbenzidina (TMB)) ou um substrato fluorogênico para detectar a presença de HRP. O termo “etiqueta” também pode se referir a uma etiqueta que pode ser usada, por exemplo, para facilitar a purificação. Exemplos não limitativos de tais etiquetas incluem myc, HA, FLAG ou 3XFLAG, 6XHis ou polihistidina, glutationa-S-transferase (GST), proteína de ligação à maltose, uma etiqueta epitópica, ou a porção Fe da imunoglobulina. Numerosas etiquetas são conhecidas e incluem, por exemplo, partículas, fluoróforos, haptenos, enzimas e substratos calorimétricos das mesmas, fluorogênicos e quimioluminescentes e outras etiquetas.
Petição 870190068171, de 18/07/2019, pág. 56/358 / 307 [0093] A “otimização do códon” aproveita a degeneração dos códons, como exibido pela multiplicidade de combinações de códons de três pares de bases que especificam um aminoácido, e geralmente inclui um processo de modificação de uma sequência de ácido nucleico para expressão aumentada em determinada célula hospedeira substituindo pelo menos um códon da sequência nativa por um códon que é mais frequentemente ou o mais frequentemente utilizado nos genes da célula hospedeira, mantendo a sequência de aminoácidos nativa. Por exemplo, um polinucleotídeo que codifica uma proteína Cas9 pode ser modificado para substituir códons com uma frequência de uso mais elevada em uma dada célula procariota ou eucariota, incluindo uma célula bacteriana, uma célula de levedura, uma célula humana, uma célula não humana, uma célula de mamífero, uma célula de roedor, uma célula de camundongo, uma célula de rato, uma célula de hamster ou qualquer outra célula hospedeira, em comparação com a sequência de ácido nucleico de ocorrência natural. As tabelas de uso de códon estão prontamente disponíveis, por exemplo, no “Banco de dados de uso de códons”. Essas tabelas podem ser adaptadas de várias maneiras. Ver Nakamura et al. (2000) Nucleic Acids Research 28: 292, aqui incorporado por referência na sua totalidade para todos os efeitos. Algoritmos computacionais para otimização de códons de uma sequência particular para expressão em um hospedeiro particular também estão disponíveis (ver, por exemplo, Gene Forge).
[0094] O termo ‘'locus” se refere a uma localização específica de um gene (ou sequência significativa), sequência de DNA, sequência codificadora de polipeptídeo ou posição em um cromossoma do genoma de um organismo. Por exemplo, um “locus de HSD17B13” pode se referir à localização específica de um gene HSD17B13, sequência de DNA de HSD17B13, sequência codificadora de HSD17B13 ou posição de HSD17B13 em um cromossomo do genoma de um organismo que tenha sido identificado onde
Petição 870190068171, de 18/07/2019, pág. 57/358 / 307 tal sequência reside. Um “locus de HSD17B13” pode compreender um elemento regulador de um gene HSD17B13, incluindo, por exemplo, um potenciador, um promotor, 5' e/ou 3' UTR, ou uma combinação dos mesmos. [0095] O termo “gene” se refere a uma sequência de DNA em um cromossomo que codifica um produto (por exemplo, um produto RNA e/ou um produto polipeptídico) e inclui a região codificante interrompida com um ou mais introns não codificantes e sequência localizado adjacente à região de codificação nas extremidades 5' e 3', de tal modo que o gene corresponde ao RNAm completo (incluindo as sequências 5' e 3' não traduzidas). O termo “gene” também inclui outras sequências não codificadoras incluindo sequências reguladoras (por exemplo, promotores, potenciadores e sítios de ligação do fator de transcrição), sinais de poliadenilação, locais internos de entrada de ribossoma, silenciadores, sequência isolante e regiões de ligação à matriz. Estas sequências podem estar próximas da região de codificação do gene (por exemplo, dentro de 10 kb) ou em locais distantes, e influenciam o nível ou taxa de transcrição e tradução do gene. O termo “gene” também abrange “minigenes”.
[0096] O termo “minigene” se refere a um gene no qual um ou mais segmentos não essenciais do gene foram eliminados em relação a um gene da linhagem germinal correspondente que ocorre naturalmente, mas no qual pelo menos um íntron permanece. Segmentos excluídos podem ser sequências intrônicas. Por exemplo, os segmentos apagados podem ser sequências intrônicas de pelo menos cerca de 500 pares de bases para várias quilobases. Tipicamente, sequências intrônicas que não englobam elementos reguladores essenciais podem ser eliminadas. Os segmentos genéticos compreendendo um minigene estão tipicamente dispostos na mesma ordem linear que a presente no gene da linhagem germinal, mas este nem sempre é o caso. Alguns elementos reguladores desejados (por exemplo, potenciadores, silenciadores) podem ser relativamente insensíveis à posição, de modo que o elemento
Petição 870190068171, de 18/07/2019, pág. 58/358 / 307 regulador funcionará corretamente mesmo se posicionado diferentemente em um minigene do que no gene da linhagem germinativa correspondente. Por exemplo, um intensificador pode estar localizado a uma distância diferente de um promotor, em uma orientação diferente e/ou em uma ordem linear diferente. Por exemplo, um intensificador localizado a 3' de um promotor na configuração da linhagem germinativa pode estar localizado a 5' do promotor em um minigene. Da mesma forma, alguns genes podem ter éxons que são alternativamente ligados ao nível do RNA. Assim, um minigene pode ter menos éxons e/ou éxons em uma ordem linear diferente da correspondente do gene da linhagem germinativa e ainda codificar um produto genético funcional. Um DNAc que codifica um produto genético também pode ser utilizado para construir um minigene (por exemplo, uma fusão genética de DNAc-genético).
[0097] O termo “alelo” se refere a uma forma variante de um gene. Alguns genes têm uma variedade de formas diferentes, que estão localizadas na mesma posição, ou locus genético, em um cromossomo. Um organismo diploide tem dois alelos em cada locus genético. Cada par de alelos representa o genótipo de um locus genético específico. Os genótipos são descritos como homozigotos se houver dois alelos idênticos em um locus específico e como heterozigotos se os dois alelos diferirem.
[0098] O termo “variante” ou “variante genética” se refere a uma sequência nucleotídica que difere da sequência mais prevalente em uma população (por exemplo, por um nucleotídeo). Por exemplo, algumas variações ou substituições em uma sequência nucleotídica alteram um códon de modo que um aminoácido diferente é codificado resultando em um polipeptídeo variante genético. O termo “variante” pode também se referir a um gene diferindo em sequência da sequência mais prevalente em uma população em uma posição que não altera a sequência de aminoácidos do polipeptídeo codificado (isto é, uma alteração conservada). As variantes
Petição 870190068171, de 18/07/2019, pág. 59/358 / 307 genéticas podem estar associadas ao risco, associadas à proteção ou podem ser neutras.
[0099] Um “promotor” é uma região reguladora do DNA que compreende usualmente uma caixa TATA capaz de direcionar a RNA polimerase II para iniciar a síntese de RNA no local apropriado de iniciação da transcrição para uma sequência polinucleotídica particular. Um promotor pode compreender adicionalmente outras regiões que influenciam a taxa de iniciação da transcrição. As sequências promotoras aqui descritas modulam a transcrição de um polinucleotídeo operativamente ligado. Um promotor pode ser ativo em um ou mais dos tipos de células aqui divulgados (por exemplo, uma célula eucariótica, uma célula de mamífero não humana, uma célula humana, uma célula de roedor, uma célula pluripotente, uma célula diferenciada ou uma combinação destas). Um promotor pode ser, por exemplo, um promotor constitutivamente ativo, um promotor condicional, um promotor indutivel, um promotor temporariamente restringido (por exemplo, um promotor regulado no desenvolvimento), ou um promotor espacialmente restrito (por exemplo, um promotor específico de célula ou tecido específico). Exemplos de promotores podem ser encontrados, por exemplo, no documento WO 2013/176772, aqui incorporado por referência na sua totalidade para todos os efeitos.
[00100] Exemplos de promotores indutíveis incluem, por exemplo, promotores quimicamente regulados e promotores fisicamente regulados. Os promotores quimicamente regulados incluem, por exemplo, promotores regulados pelo álcool (por exemplo, um promotor do gene da álcool desidrogenase (alcA)), promotores regulados pela tetraciclina (por exemplo, um promotor responsivo à tetraciclina, uma sequência operadora da tetraciclina (tetO), um promotor tet-on, ou um promotor tet-off), promotores regulados por esteroides (por exemplo, um receptor de glucocorticoides de rato, um promotor de um receptor de estrogênio ou um promotor de um
Petição 870190068171, de 18/07/2019, pág. 60/358 / 307 receptor de ecdisona) ou promotores regulados por metais (por exemplo, um promotor de metaloproteínas). Os promotores fisicamente regulados incluem, por exemplo, promotores regulados pela temperatura (por exemplo, um promotor de choque térmico) e promotores regulados por luz (por exemplo, um promotor indutível pela luz ou um promotor repressível pela luz).
[00101] Os promotores específicos de tecido podem ser, por exemplo, promotores específicos de neurônios, promotores específicos de glia, promotores específicos de células musculares, promotores específicos de células cardíacas, promotores específicos de células renais, promotores específicos de células ósseas, promotores específicos de células endoteliais, ou promotores específicos de células imunes (por exemplo, um promotor de células B ou um promotor de células T).
[00102] Promotores regulados por desenvolvimento incluem, por exemplo, promotores ativos somente durante um estágio embrionário de desenvolvimento, ou somente em uma célula adulta.
[00103] “Ligação operável” ou estar “operativamente ligado” inclui a justaposição de dois ou mais componentes (por exemplo, um promotor e outro elemento de sequência) de modo que ambos os componentes funcionem normalmente e permitam que pelo menos um dos componentes possa mediar uma função que é exercida em pelo menos um dos outros componentes. Por exemplo, um promotor pode ser operativamente ligado a uma sequência de codificação se o promotor controlar o nível de transcrição da sequência de codificação em resposta à presença ou ausência de um ou mais fatores reguladores da transcrição. A ligação operativa pode incluir tais sequências contínuas uma com a outra ou atuando em trans (por exemplo, uma sequência reguladora pode atuar a uma distância para controlar a transcrição da sequência de codificação).
[00104] O termo “iniciador” se refere a um oligonucleotídeo capaz de atuar como um ponto de iniciação da síntese de polinucleotídeos ao longo de
Petição 870190068171, de 18/07/2019, pág. 61/358 / 307 uma cadeia complementar quando colocado sob condições em que a síntese de um produto de extensão de iniciador complementar a um polinucleotídeo é catalisada. Tais condições incluem a presença de quatro nucleotídeos trifosfatos diferentes ou análogos de nucleotídeos e um ou mais agentes para polimerização, tais como polimerase de DNA e/ou transcriptase reversa, em um tampão apropriado (incluindo substituintes que são cofatores, ou que afetam o pH, força iônica, e assim por diante) e a uma temperatura adequada. A extensão do iniciador de um modo específico de sequência pode incluir, por exemplo, métodos de PCR, sequenciamento de DNA, extensão de DNA, polimerização de DNA, transcrição de RNA ou transcrição reversa. Um iniciador deve ser suficientemente longo para iniciar a síntese de produtos de extensão na presença de um agente para a polimerase. Um iniciador típico tem pelo menos cerca de 5 nucleotídeos de comprimento de uma sequência substancialmente complementar à sequência alvo, mas são preferidos iniciadores mais compridos. Tipicamente, os iniciadores têm cerca de 15 a 30 nucleotídeos de comprimento, mas podem também ser utilizados iniciadores mais compridos. Uma sequência de iniciadores não precisa ser exatamente complementar a um modelo ou sequência alvo, mas deve ser suficientemente complementar para hibridizar com um modelo ou sequência alvo. O termo “par de iniciadores” significa um conjunto de iniciadores incluindo um iniciador a montante 5', que hibridiza com a extremidade 5' da sequência de DNA a ser amplificada e um iniciador a jusante 3', que hibridiza com o complemento da extremidade 3' da sequência a ser amplificada. Os pares de iniciadores podem ser utilizados para amplificação de um polinucleotídeo alvo (por exemplo, por reação em cadeia da polimerase (PCR) ou outros métodos de amplificação de ácidos nucleicos convencionais). “PCR” ou “reação em cadeia da polimerase” é uma técnica usada para a amplificação de segmentos de DNA específicos (ver Patentes US Nos. 4.683.195 e 4.800.159, cada uma das quais é aqui incorporada por referência na sua totalidade para
Petição 870190068171, de 18/07/2019, pág. 62/358 / 307 todos os efeitos).
[00105] O termo “sonda” se refere a uma molécula que pode distinguir de forma detectável entre moléculas-alvo que diferem na estrutura. A detecção pode ser realizada de várias maneiras diferentes, dependendo do tipo de sonda usada e do tipo de molécula alvo. Assim, por exemplo, a detecção pode se basear na discriminação dos níveis de atividade da molécula alvo, mas preferencialmente se baseia na detecção de ligação específica. Exemplos de tal ligação específica incluem ligação de anticorpo e hibridização de sonda de ácido nucleico. Assim, as sondas podem incluir, por exemplo, substratos enzimáticos, anticorpos e fragmentos de anticorpos, e sondas de hibridização de ácidos nucleicos. Por exemplo, uma sonda pode ser um polinucleotídeo isolado ligado a uma molécula marcadora ou repórter detectável convencional, tal como um isótopo radioativo, ligando, agente quimioluminescente, enzima ou semelhante. Tal sonda é complementar a uma cadeia de um polinucleotídeo alvo, tal como um polinucleotídeo compreendendo a variante de HSD17B13, rS72613567, ou transcrições de RNAm de HSD17B13 específicos. As sondas de ácido desoxirribonucleico podem incluir aquelas geradas por PCR utilizando iniciadores específicos para o RNAm de HSD17B13/DNAc ou iniciadores específicos para HSD17B13, rs72613567, sondas oligonucleotídicas sintetizadas in vitro ou DNA obtido a partir de bibliotecas de cromossomas bacterianos artificiais, fosmídio ou cosmídio. As sondas incluem não apenas ácidos desoxirribonucleico ou ribonucleico, mas também poliamidas e outros materiais de sonda que podem detectar especificamente a presença de uma sequência de DNA alvo. Para sondas de ácido nucleico, os reagentes de detecção podem incluir, por exemplo, sondas radiomarcadas, sondas marcadas enzimáticas (por exemplo, peroxidase de rábano e fosfatase alcalina), sondas marcadas por afinidade (por exemplo, biotina, avidina e estreptavidina) e sondas marcadas com fluorescência (por exemplo, 6-FAM,
Petição 870190068171, de 18/07/2019, pág. 63/358
50/307
VIC, TAMRA, MGB, fluoresceína, rodamina e vermelho Texas). As sondas de ácido nucleico aqui descritas podem ser prontamente incorporadas em um dos formatos de kit estabelecidos que são bem conhecidos.
[00106] O termo “RNA antissentido” se refere a um RNA de fita simples que é complementar a uma cadeia de RNA mensageiro transcrito em uma célula.
[00107] O termo “pequeno RNA de interferência (siRNA)” se refere a uma molécula de RNA tipicamente de cadeia dupla que induz a via de interferência de RNA (iRNA). Estas moléculas podem variar em comprimento (geralmente entre 18 a 30 pares de bases) e contêm vários graus de complementaridade com o seu RNAm alvo na cadeia antissentido. Alguns, mas não todos, siRNAs têm bases pendentes desemparelhadas na extremidade 5' ou 3' da cadeia com sentido e/ou na cadeia antissentido. O termo “siRNA” inclui duplex de duas cadeias separadas, bem como cadeias simples que podem formar estruturas em grampo compreendendo uma região dúplex. A estrutura de cadeia dupla pode ter, por exemplo, menos de 20, 25, 30, 35, 40, 45 ou 50 nucleotídeos de comprimento. Por exemplo, a estrutura de cadeia dupla pode ser de cerca de 21 a 23 nucleotídeos de comprimento, de cerca de 19 a 25 nucleotídeos de comprimento, ou de cerca de 19 a 23 nucleotídeos de comprimento.
[00108] O termo “pequeno RNA em forma de grampo (shRNA)” se refere a uma única cadeia de bases de RNA que auto-hibridiza em uma estrutura de grampo e pode induzir a via de interferência de RNA (RNAi) após o processamento. Estas moléculas podem variar em comprimento (geralmente cerca de 50 a 90 nucleotídeos de comprimento, ou em alguns casos até mais de 250 nucleotídeos de comprimento, por exemplo, para shRNA adaptado a microRNA). As moléculas de shRNA são processadas dentro da célula para formar siRNAs, o que, por sua vez, pode derrubar a expressão gênica. shRNAs podem ser incorporados em vetores. O termo
Petição 870190068171, de 18/07/2019, pág. 64/358
51/307 “shRNA” também se refere a uma molécula de DNA a partir da qual uma molécula de pequeno RNA em formato de grampo pode ser transcrita.
[00109] “Complementaridade” de ácidos nucleicos significa que uma sequência nucleotídica em uma cadeia de ácido nucleico, devido à orientação dos seus grupos de bases nucleotídicas, forma ligações de hidrogênio com outra sequência em uma cadeia de ácido nucleico oposta. As bases complementares no DNA são tipicamente A com T e C com G. No RNA, elas são tipicamente C com G e U com A. A complementaridade pode ser perfeita ou substancial/suficiente. A complementaridade perfeita entre dois ácidos nucleicos significa que os dois ácidos nucleicos podem formar um duplex no qual cada base no duplex está ligada a uma base complementar pelo emparelhamento Watson-Crick. “Complementar” ou “suficiente” complementar significa que uma sequência em uma cadeia não é completamente e/ou perfeitamente complementar a uma sequência em uma cadeia oposta, mas que uma ligação suficiente ocorre entre as bases nas duas cadeias para formar um complexo híbrido estável no conjunto das condições de hibridização (por exemplo, concentração de sal e temperatura). Tais condições podem ser previstas usando as sequências e cálculos matemáticos padrão para prever a Tm (temperatura de fusão) de cadeias hibridizadas, ou por determinação empírica de Tm usando métodos de rotina. Tm inclui a temperatura a que uma população de complexos de hibridização formada entre duas cadeias de ácido nucleico é 50% desnaturada (isto é, uma população de moléculas de ácido nucleico de cadeia dupla se torna semidissociada em cadeias simples). A uma temperatura abaixo da Tm, a formação de um complexo de hibridização é favorecida, enquanto que a uma temperatura acima da Tm, o derretimento ou a separação das cadeias no complexo de hibridização é favorecido. A Tm pode ser estimada para um ácido nucleico com um conteúdo conhecido de G + C em uma solução aquosa de NaCI 1M utilizando, por exemplo, Tm = 81,5 + 0,41 (% de G + C), embora
Petição 870190068171, de 18/07/2019, pág. 65/358
52/307 outros cálculos de Tm conhecidos levem em conta as características estruturais do ácido nucleico.
[00110] “Condição de hibridização” inclui o ambiente cumulativo em que uma fita de ácido nucleico se liga a uma segunda fita de ácido nucleico por interações de fita complementar e ligação de hidrogênio para produzir um complexo de hibridização. Tais condições incluem os componentes químicos e suas concentrações (por exemplo, sais, agentes quelantes, formamida) de uma solução aquosa ou orgânica contendo os ácidos nucleicos, e a temperatura da mistura. Outros fatores, como o tempo de incubação ou as dimensões da câmara de reação, podem contribuir para o meio ambiente. Ver, por exemplo, Sambrook et al., Molecular Cloning, A Laboratory Manual,
2.sup.nd ed., p. 1.90-1.91, 9.47-9.51, 1 1.47-11.57 (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989), aqui incorporado por referência na sua totalidade para todos os efeitos.
[00111] A hibridização requer que os dois ácidos nucleicos contenham sequências complementares, embora sejam possíveis disparos entre bases. As condições apropriadas para a hibridização entre dois ácidos nucleicos dependem do comprimento dos ácidos nucleicos e do grau de complementação, variáveis bem conhecidas. Quanto maior o grau de complementação entre duas sequências nucleotídicas, maior o valor da temperatura de fusão (Tm) para os híbridos de ácidos nucleicos que possuem essas sequências. Para hibridizações entre ácidos nucleicos com curtos períodos de complementaridade (por exemplo, complementaridade acima de 35 ou menos, 30 ou menos, 25 ou menos, 22 ou menos, 20 ou menos, ou 18 ou menos nucleotídeos), a posição dos desemparelhamentos se toma importante (ver Sambrook et al., supra, 11.7-11.8). Tipicamente, o comprimento para um ácido nucleico hibridizável é de pelo menos cerca de 10 nucleotídeos. Comprimentos mínimos ilustrativos para um ácido nucleico hibridizável incluem pelo menos cerca de 15 nucleotídeos, pelo menos cerca
Petição 870190068171, de 18/07/2019, pág. 66/358 / 307 de 20 nucleotídeos, pelo menos cerca de 22 nucleotídeos, pelo menos cerca de 25 nucleotídeos e pelo menos cerca de 30 nucleotídeos. Além disso, a temperatura e a concentração salina da solução de lavagem podem ser ajustadas conforme necessário, de acordo com fatores como o comprimento da região de complementação e o grau de complementação.
[00112] A sequência do polinucleotídeo não precisa ser 100% complementar à do seu ácido nucleico alvo para ser especificamente hibridizável. Além disso, um polinucleotídeo pode hibridizar sobre um ou mais segmentos, de tal modo que segmentos intervenientes ou adjacentes não estejam envolvidos no evento de hibridização (por exemplo, uma estrutura de laço ou estrutura de grampo). Um polinucleotídeo (por exemplo, gRNA) pode compreender pelo menos 70%, pelo menos 80%, pelo menos 90%, pelo menos 95%, pelo menos 99%, ou 100% de complementaridade de sequência com uma região alvo dentro da sequência de ácido nucleico alvo para os quais eles são direcionados. Por exemplo, um gRNA em que 18 dos 20 nucleotídeos são complementares a uma região alvo e, portanto, hibridizam especificamente, representaria 90% de complementaridade. Neste exemplo, os nucleotídeos não complementares restantes podem ser agrupados ou intercalados com nucleotídeos complementares e não precisam ser contíguos entre si ou com nucleotídeos complementares.
[00113] A complementaridade percentual entre trechos particulares de sequências de ácido nucleico dentro de ácidos nucleicos pode ser determinada rotineiramente usando programas BLAST (ferramentas de busca de alinhamento local básico) e programas PowerBLAST (Altschul et al. (1990) J. Mol. Biol. 215: 403 a 410; Zhang e Madden (1997) Genome Res. 7: 649 a 656) ou usando o programa Gap (Pacote de Análise de Sequência Wisconsin, Versão 8 para Unix, Genetics Computer Group, University Research Park, Madison Wis.), usando configurações padrão, que utiliza o algoritmo de Smith e Waterman (Adv. Appl. Math., 1981, 2, 482 a 489).
Petição 870190068171, de 18/07/2019, pág. 67/358
54/307 [00114] Os métodos e composições aqui providos empregam uma variedade de componentes diferentes. Alguns componentes ao longo da descrição podem ter variantes e fragmentos ativos. Tais componentes incluem, por exemplo, proteínas Cas9, RNAs CRISPR, tracrRNAs e RNAs guia. A atividade biológica para cada um destes componentes é descrita em outro local deste documento.
[00115] “Identidade de sequência” ou “identidade” no contexto de dois polinucleotídeos ou sequências polipeptídicas faz referência aos resíduos nas duas sequências que são os mesmos quando alinhados para correspondência máxima ao longo de uma janela de comparação especificada. Quando a porcentagem de identidade de sequência é usada em referência a proteínas, posições de resíduos que não são idênticas frequentemente diferem por substituições de aminoácidos conservativas, onde resíduos de aminoácidos são substituídos por outros resíduos de aminoácidos com propriedades químicas similares (por exemplo, carga ou hidrofobicidade) e, portanto, não altere as propriedades funcionais da molécula. Quando as sequências diferem nas substituições conservativas, a percentagem de identidade de sequência pode ser ajustada para cima para corrigir a natureza conservativa da substituição. Sequências que diferem por tais substituições conservativas são ditas como tendo “similaridade de sequência” ou “semelhança”. Meios para fazer este ajuste são bem conhecidos. Normalmente, isso envolve a classificação de uma substituição conservativa como uma incompatibilidade parcial e não total, aumentando, assim, a porcentagem de identidade de sequência. Assim, por exemplo, quando um aminoácido idêntico recebe uma pontuação de 1 e uma substituição não conservativa recebe uma pontuação de zero, uma substituição conservativa recebe uma pontuação entre zero e 1. A pontuação das substituições conservativas é calculada, por exemplo, como implementado no programa PC/GENE (Intelligenetics, Mountain View, Califórnia).
Petição 870190068171, de 18/07/2019, pág. 68/358 / 307 [00116] “Porcentagem de identidade de sequência” inclui o valor determinado pela comparação de duas sequências perfeitamente alinhadas (maior número de resíduos perfeitamente correspondentes) sobre uma janela de comparação, em que a porção da sequência polinucleotídica na janela de comparação pode incluir adições ou eliminações (isto é, intervalos) em comparação com a sequência de referência (que não compreende adições ou eliminações) para o alinhamento perfeito das duas sequências. A percentagem é calculada determinando o número de posições nas quais a base de ácido nucleico ou resíduo de aminoácido idêntica ocorre em ambas as sequências para produzir o número de posições casadas, dividindo o número de posições correspondentes pelo número total de posições na janela de comparação e multiplicando o resultado por 100 para gerar a porcentagem de identidade de sequência. Salvo indicação em contrário (por exemplo, a sequência mais curta inclui uma sequência heteróloga ligada), a janela de comparação é o comprimento total da menor das duas sequências que estão sendo comparadas.
[00117] Salvo indicação em contrário, os valores de identidade/ semelhança de sequência incluem o valor obtido usando GAP Versão 10, utilizando os seguintes parâmetros: % de identidade e % de similaridade para uma sequência nucleotídica utilizando o peso GAP de 50 e o peso do comprimento de 3 e o nwsgapdna.cmp matriz de pontuação; % de identidade e % de similaridade para uma sequência de aminoácidos utilizando GAP de peso de 8 e peso de comprimento de 2 e a matriz de marcação de BLOSUM62; ou qualquer outro programa equivalente. “Programa equivalente” inclui qualquer programa de comparação de sequências que, para quaisquer duas sequências em questão, gere um alinhamento com idênticas correspondências de nucleotídeos ou resíduos de aminoácidos e uma identidade de sequência percentual idêntica quando comparado com o alinhamento correspondente gerado pelo GAP Versão 10.
Petição 870190068171, de 18/07/2019, pág. 69/358 / 307 [00118] O termo “substituição conservadora de aminoácido” se refere à substituição de um aminoácido que está normalmente presente na sequência com um aminoácido diferente de tamanho, carga ou polaridade semelhante. Exemplos de substituições conservativas incluem a substituição de um resíduo não polar (hidrofóbico) tal como isoleucina, valina ou leucina por outro resíduo não polar. Do mesmo modo, exemplos de substituições conservativas incluem a substituição de um resíduo polar (hidrofílico) por outro, tal como entre arginina e lisina, entre glutamina e asparagina, ou entre glicina e serina. Adicionalmente, a substituição de um resíduo básico, tal como lisina, arginina ou histidina por outro, ou a substituição de um resíduo ácido, tal como ácido aspártico ou ácido glutâmico por outro resíduo ácido são exemplos adicionais de substituições conservativas. Exemplos de substituições não conservativas incluem a substituição de um resíduo de aminoácido não polar (hidrofóbico), tal como isoleucina, valina, leucina, alanina ou metionina por um resíduo polar (hidrofílico), tal como cisteína, glutamina, ácido glutâmico ou lisina e/ou um resíduo polar para um resíduo não polar. As categorizações típicas de aminoácidos estão resumidas abaixo.
Alanina Ala A Não polar Neutro 1,8
Arginina Arg R Polar Positivo -4,5
Asparagina Asn N Polar Neutro -3,5
Ácido aspártico Asp D Polar Negativo -3,5
Cisteína Cys C Não polar Neutro 2,5
Ácido glutâmico Glu E Polar Negativo -3,5
Glutamina Gin Q Polar Neutro -3,5
Glicina Gly G Não polar Neutro -0,4
Histidina His H Polar Positivo -3,2
Isoleucina Ile I Não polar Neutro 4,5
Leucina Leu L Não polar Neutro 3,8
Lisina Lys K Polar Positivo -3,9
Metionina Met M Não polar Neutro 1,9
Fenilalanina Phe F Não polar Neutro 2,8
Prolina Pro P Não polar Neutro -1,6
Serina Ser s Polar Neutro -0,8
Treonina Thr T Polar Neutro -0,7
Triptofano Trp W Não polar Neutro -0,9
Tirosina Tyr Y Polar Neutro -1,3
Valina Vai V Não polar Neutro 4,2
[00119] Um ácido nucleico da invenção, tal como um iniciador ou um
RNA guia, hibridiza ou direciona para uma posição ou inclui uma posição
Petição 870190068171, de 18/07/2019, pág. 70/358 / 307 próxima de uma posição de nucleotídeo especificada em um ácido nucleico de referência quando está dentro de cerca de 1000, 500, 400, 300, 200, 100, 50, 45, 40, 35, 30, 25, 20, 15, 10 ou 5 nucleotídeos da posição.
[00120] O termo “amostra biológica” se refere a uma amostra de material biológico, dentro ou obtenível de um indivíduo, a partir do qual um ácido nucleico ou proteína é recuperável. O termo amostra biológica também pode abranger qualquer material derivado do processamento da amostra, tal como células ou a sua descendência. O processamento da amostra biológica pode envolver uma ou mais de filtração, destilação, extração, concentração, fixação, inativação de componentes interferentes e semelhantes. Em algumas modalidades, uma amostra biológica compreende um ácido nucleico, tal como DNA genômico, DNAc ou RNAm. Em algumas modalidades, uma amostra biológica compreende uma proteína. Um indivíduo pode ser qualquer organismo, incluindo, por exemplo, um humano, um mamífero não humano, um roedor, um camundongo ou um rato. A amostra biológica pode ser derivada de qualquer célula, tecido ou fluido biológico do indivíduo. A amostra pode compreender qualquer tecido clinicamente relevante, como uma amostra de medula óssea, uma biópsia de tumor, um aspirador de agulha fina ou uma amostra de fluido corporal, como sangue, plasma, soro, linfa, líquido ascítico, fluido cístico ou urina. Em alguns casos, a amostra compreende um esfregaço bucal. A amostra utilizada nos métodos aqui divulgados irá variar com base no formato do ensaio, natureza do método de detecção e tecidos, células ou extratos que são utilizados como amostra.
[00121] O termo “amostra de controle” se refere a uma amostra obtida de um indivíduo que não possui a variante de HSD17B13, rS72613567, e de um modo preferido é homozigótica para o alelo de tipo selvagem do gene HSD17B13. Tais amostras podem ser obtidas ao mesmo tempo que uma amostra biológica ou em uma ocasião diferente. Uma amostra biológica e uma amostra de controle podem ser obtidas do mesmo tecido ou fluido corporal.
Petição 870190068171, de 18/07/2019, pág. 71/358 / 307 [00122] Uma sequência “homóloga” (por exemplo, sequência de ácido nucleico) inclui uma sequência que é idêntica ou substancialmente similar a uma sequência de referência conhecida, tal que é, por exemplo, pelo menos 50%, pelo menos 55%, menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à sequência de referência conhecida. As sequências homólogas podem incluir, por exemplo, sequências ortólogas e sequências parólogas. Genes homólogos, por exemplo, tipicamente descendem de uma sequência de DNA ancestral comum, seja através de um evento de especiação (genes ortólogos) ou um evento de duplicação genética (genes parálogos). Genes “ortólogos” incluem genes em diferentes espécies que evoluíram a partir de um gene ancestral comum por especiação. Os ortólogos normalmente mantêm a mesma função no curso da evolução. Genes “parálogos” incluem genes relacionados por duplicação dentro de um genoma. Parálogos podem evoluir para novas funções no curso da evolução.
[00123] O termo “m vitro” inclui ambientes artificiais e processos ou reações que ocorrem dentro de um ambiente artificial (por exemplo, um tubo de ensaio). O termo “m vivo” inclui ambientes naturais (por exemplo, uma célula ou organismo ou corpo, tal como uma célula dentro de um organismo ou corpo) e a processos ou reações que ocorrem dentro de um ambiente natural. O termo “ex vivo” inclui células que foram removidas do corpo de um indivíduo e a processos ou reações que ocorrem dentro dessas células.
[00124] Composições ou métodos “compreendendo” ou “incluindo” um ou mais elementos citados podem incluir outros elementos não especificamente citados. Por exemplo, uma composição que “compreende” ou “inclui” uma proteína pode conter a proteína sozinha ou em combinação com outros ingredientes. A frase transicional “consistindo essencialmente em” significa que o escopo de uma reivindicação deve ser interpretado como que
Petição 870190068171, de 18/07/2019, pág. 72/358 / 307 abrange os elementos especificados descritos na reivindicação e aqueles que não afetam materialmente as características básicas e novas da invenção reivindicada. Assim, o termo “consistindo essencialmente em” quando usado em uma reivindicação desta invenção não se destina a ser interpretado como sendo equivalente a “compreendendo”.
[00125] “Opcional” ou “opcionalmente” significa que o evento ou circunstância descrito posteriormente pode ou não ocorrer e que a descrição inclui casos em que o evento ou circunstância ocorre e casos em que não ocorre.
[00126] A designação de um intervalo de valores inclui todos os inteiros dentro ou definindo o intervalo, e todos os sub-intervalos definidos por números inteiros dentro do intervalo.
[00127] A menos que de outro modo aparente do contexto, o termo “cerca de” engloba valores dentro de uma margem padrão de erro de medição (por exemplo, SEM) de um valor declarado.
[00128] O termo “e/ou” se refere a e engloba todas e quaisquer combinações possíveis de um ou mais dos itens listados associados, bem como a falta de combinações quando interpretadas na alternativa (“ou”).
[00129] O termo “ou” se refere a qualquer membro de uma lista particular e também inclui qualquer combinação de membros dessa lista.
[00130] As formas singulares dos artigos “um”, “uma” e “o/a” incluem referências plurais, a menos que o contexto indique claramente o contrário. Por exemplo, o termo “uma proteína Cas9” ou “pelo menos uma proteína Cas9” pode incluir uma pluralidade de proteínas Cas9, incluindo misturas das mesmas.
[00131] Estatisticamente significante representa p < 0,05.
DESCRIÇÃO DETALHADA
I. Visão Geral [00132] E aqui apresentada uma variante de HSD17B13 que foi
Petição 870190068171, de 18/07/2019, pág. 73/358
60/307 constatado estar associada a níveis reduzidos de alanina e aspartato transaminase; um risco reduzido de doenças do fígado crônicas, incluindo doença do fígado gorduroso, não alcoólica e alcoólica, cirrose e carcinoma hepatocelular; e reduziu a progressão de esteatose simples para estágios clinicamente mais avançados de doença do fígado crônica. Também são providas aqui transcrições não identificadas do gene HSD17B13 associadas à variante.
[00133] Os ácidos nucleicos isolados e as proteínas relacionadas com as variantes de HSD17B13 e as células que compreendem esses ácidos nucleicos e proteínas são aqui providas. São também providos métodos para modificar uma célula através do uso de qualquer combinação de agentes de nuclease, sequências de doador exógeno, ativadores transcricionais, repressores de transcrição e vetores de expressão para expressar um gene HSD17B13 recombinante ou um ácido nucleico que codifica uma proteína de HSD17B13. São também providos métodos terapêuticos e profiláticos para o tratamento de um indivíduo com ou em risco de desenvolver doença do fígado crônica.
II. Variantes de HSD17B13 [00134] São aqui providos ácidos nucleicos e proteínas isoladas relacionados com variantes de HSD17B13 (também conhecida como hidroxiesteroide 17-beta desidrogenase 13, 17-beta-hidroxiesteroide desidrogenase 13, 173-hidroxiesteroide desidrogenase-13, 17β-Η8ϋ13, desidrogenase de cadeia curta/redutase 9, SCDR9, HMFN0376, NIIL497 e SDR16C3). O gene HSD17B13 humano tem aproximadamente 19 kb de comprimento e inclui sete éxons e seis introns localizados em 4q22.1 no genoma. As sequências proteicas de HSD17B13 humanas exemplares são atribuídas com o número de acesso UniProt Q7Z5P4 (SEQ ID NOS: 240 e 241; Q7Z5P4-1 e Q7Z5P4-2, respectivamente) e as sequências de referência NCBI N NP.835236 e NP.001129702 (SEQ ID NOS: 242 e 243,
Petição 870190068171, de 18/07/2019, pág. 74/358
61/307 respectivamente ). Os RNAm de HSD17B13 humano exemplificativos são atribuídos com sequências de referência NCBI NM_178135 e NM_001136230 (SEQ ID NOS: 244 e 245, respectivamente).
[00135] Em particular, é provida aqui uma variante de entrelaçamento de HSD17B13 (rs72613567) com uma inserção de uma adenina adjacente ao local do entrelaçamento doador no intron 6. A adenina é uma inserção na cadeia de frente (mais) do cromossomo, que corresponde a uma timina inserida no filamento reverso (menos) do cromossomo. Porque o gene HSD17B13 humano é transcrito na direção reversa, esta inserção de nucleotídeos é refletida como uma timina inserida na sequência variante de HSD17B13 exemplar, rs72613567, apresentada na SEQ ID NO: 2 relativamente à sequência do gene HSD17B13 de tipo selvagem exemplar apresentada na SEQ ID NO: 1. A inserção será, portanto, aqui referida como uma timina inserida entre as posições 12665 e 12666 na SEQ ID NO: 1 ou na posição 12666 na SEQ ID NO: 2.
[00136] Duas transcrições de RNAm (A e B; SEQ ID NOS: 4 e 5, respectivamente) foram previamente identificadas como sendo expressas em indivíduos com o gene HSD17B13 de tipo selvagem. A transcrição A inclui todos os sete éxons do gene HSD17B13, enquanto que o éxon 2 é omitido na transcrição B. A transcrição A é a transcrição dominante em indivíduos do tipo selvagem. No entanto, são providas seis transcrições de HSD17B13 adicionais, anteriormente não identificadas, que são expressas (C a H, SEQ ID NOS: 6 a 11, respectivamente). Essas transcrições são mostradas na Figura 4. Na transcrição C, o éxon 6 é omitido comparado à transcrição A. Na transcrição D, há uma inserção de uma guanina 3' do éxon 6, resultando em um deslocamento de enquadramento e um truncamento prematuro do éxon 7 comparado à transcrição A. Na transcrição E, existe um éxon adicional entre os éxons 3 e 4 comparado com a transcrição A. Na transcrição F, que é expressa apenas nos portadores variantes de HSD17B13, rs72613567, existe
Petição 870190068171, de 18/07/2019, pág. 75/358
62/307 uma leitura do éxon 6 no íntron 6 em comparação com transcrição A. Na transcrição G, o éxon 2 é pulado, e há uma inserção de uma guanina 3' do éxon 6, resultando em um desvio de enquadramento e um truncamento prematuro do éxon 7 em comparação com a transcrição A. Na transcrição H, há um éxon adicional entre os éxons 3 e 4, e há uma inserção de uma guanina 3' do éxon 6, resultando em um deslocamento de enquadramento e um truncamento prematuro do éxon 7 comparado à transcrição A. As transcrições C, D, F, G, e H são dominantes em portadores de variante de HSD17B13, rs72613567, com a transcrição D sendo a mais abundante transcrição em portadores da variante de HSD17B13, rs72613567. Também é provida aqui uma transcrição de HSD17B13 adicional, anteriormente não identificado, que é expressa em baixos níveis (F’, SEQ ID NO: 246). Tal como a transcrição F, a transcrição F’ também inclui uma leitura do éxon 6 no íntron 6 em comparação com a transcrito A, mas, em contraste com a transcrição F, a leitura não inclui a timina inserida presente no gene variante de HSD17B13, rs72613567. As posições dos nucleotídeos dos éxons nos genes HSD17B13 para cada transcrição são providas abaixo.
Posições de Nucleotídeos na SEQ ID NO: 1 para Éxons de Transcrições de HSD17B13 mais Pre valentes em Indivíduos Homozigóticos para o Gene HSD17B13 de Tipo Selvagem.
Transcrição A Transcrição B Transcrição E Transcrição F’
Éxon 1 1-275 1-275 1-275 1-275
Éxon 2 4471-4578 pulado 4471-4578 4471-4578
Éxon 3 5684-5815 5684-5815 5684-5815 5684-5815
Éxon 3’ não presente não presente 6210-6281 não presente
Éxon 4 7308-7414 7308-7414 7308-7414 7308-7414
Éxon 5 8947-9084 8947-9084 8947-9084 8947-9084
Éxon 6 12548-12664 12548-12664 12548-12664 12548-13501*
Éxon 7 17599-19118 17599-19118 17599-19118 pulado
* Inclui leitura do éxon 6 no íntron 6; leitura = posições 12665-13501
Posições de Nucleotídeos na SEQ ID NO: 2 para Éxons de Transcrições de HSD17B13 mais Pre valentes em Indivíduos Homozigóticos para o Gene Variante de HSD17B13, rs72613567 (Inserção de T na Posição
Petição 870190068171, de 18/07/2019, pág. 76/358 / 307
12666).
Transcrição C Transcrição D Transcrição F Transcrição G Transcrição H
Éxon 1 1-275 1-275 1-275 1-275 1-275
Éxon 2 4471-4578 4471-4578 4471-4578 pulado 4471-4578
Éxon 3 5684-5815 5684-5815 5684-5815 5684-5815 5684-5815
Éxon 3’ não presente não presente não presente não presente 6210-6281
Éxon 4 7308-7414 7308-7414 7308-7414 7308-7414 7308-7414
Éxon 5 8947-9084 8947-9084 8947-9084 8947-9084 8947-9084
Éxon 6 pulado 12548-12665a 12548-13502* 12548-12665a 12548-12665A
Éxon 7 17600-19119 17600-19119 pulado 17600-19119 17600-19119
Λ Inclui ο resíduo adicional 12665 na extremidade 3’ em comparação com a transcrição A * Inclui leitura do éxon 6 no íntron 6; leitura = posições 12665-13502 [00137] Como explicado em mais detalhe em outro local aqui, a variante de HSD17B13, rs72613567, está associada a níveis reduzidos de alanina e aspartato transaminase e um risco reduzido de doenças do fígado crônicas incluindo doença do fígado gorduroso não alcoólica e alcoólica, cirrose e carcinoma hepatocelular. A variante de HSD17B13, rs72613567, também está associada à progressão reduzida de esteatose simples para estágios clinicamente mais avançados de doença do fígado crônica.
A. Ácidos Nucleicos [00138] São divulgados aqui nucleicos isolados relacionados a variantes de HSD17B13 e transcrições da variante de HSD17B13. Também são revelados ácidos nucleicos isolados que hibridizam sob condições rigorosas ou moderadas com qualquer um dos ácidos nucleicos aqui divulgados. Tais ácidos nucleicos podem ser úteis, por exemplo, para expressar proteínas de variantes de HSD17B13 ou como iniciadores, sondas, sequências de doador exógeno, RNAs guia, RNA antissentido, shRNAs e siARNs, cada um dos quais descrito em mais detalhe em outro local aqui.
[00139] São também divulgados ácidos nucleicos funcionais que podem interagir com os polinucleotídeos divulgados. Os ácidos nucleicos funcionais são moléculas de ácido nucleico que têm uma função específica, tal como ligar uma molécula alvo ou catalisar uma reação específica. Exemplos de ácidos nucleicos funcionais incluem moléculas antissentido, aptâmeros, ribozimas, moléculas formadoras de triplex e sequências guia externas. As moléculas de ácido nucleico funcionais podem atuar como
Petição 870190068171, de 18/07/2019, pág. 77/358 / 307 efetores, inibidores, moduladores e estimuladores de uma atividade específica possuida por uma molécula alvo, ou as moléculas de ácido nucleico funcionais podem possuir uma atividade de novo independente de quaisquer outras moléculas.
[00140] As moléculas antissentido são concebidas para interagir com uma molécula de ácido nucleico alvo, através de emparelhamento de bases canônicas ou não canônicas. A interação da molécula antissentido e da molécula alvo é concebida para promover a destruição da molécula alvo através, por exemplo, da degradação híbrida de RNA-DNA mediada por RNase-Η. Alternativamente, a molécula antissentido é concebida para interromper uma função de processamento que normalmente teria lugar na molécula alvo, tal como transcrição ou replicação. Moléculas antissentido podem ser concebidas com base na sequência da molécula alvo. Existem numerosos métodos para otimização da eficência antissentido encontrando as regiões mais acessíveis da molécula alvo. Métodos exemplificativos seriam experimentos de seleção in vitro e estudos de modificação de DNA usando DMS e DEPC. Moléculas antissentido geralmente ligam a molécula alvo com uma constante de dissociação (kd) menor ou igual a IO'6, 10'8, IO'10 ou IO'12. Uma amostra representativa de métodos e técnicas que auxiliam na concepção e utilização de moléculas antissentido pode ser encontrada na seguinte lista não limitativa de patentes dos EUA: 5.135.917; 5.294.533; 5.627.158;
5.641.754; 5.691.317; 5.780.607; 5.786.138; 5.849.903; 5.856.103;
5.919.772; 5.955.590; 5.990.088; 5.994.320; 5.998.602; 6.005.095;
6.007.995; 6.013.522; 6.017.898; 6.018.042; 6.025.198; 6.033.910;
6.040.296; 6.046.004; 6.046.319; e 6.057.437, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos. Exemplos de moléculas antissentido incluem RNAs antissentido, pequenos RNAs de interferência (siRNAs) e pequenos RNAs em forma de grampo (shRNAs), que são descritos em maior detalhe em outro lugar aqui.
Petição 870190068171, de 18/07/2019, pág. 78/358 / 307 [00141] Os ácidos nucleicos isolados aqui divulgados podem compreender RNA, DNA, ou ambos, RNA e DNA. Os ácidos nucleicos isolados também podem ser ligados ou fundidos a uma sequência de ácido nucleico heteróloga, tal como em um vetor, ou um marcador heterólogo. Por exemplo, os ácidos nucleicos isolados aqui divulgados podem estar em um vetor ou sequências de doador exógeno compreendendo o ácido nucleico isolado e uma sequência de ácido nucleico heteróloga. Os ácidos nucleicos isolados também podem ser ligados ou fundidos a um marcador heterólogo, tal como um marcador fluorescente. Outros exemplos de marcadores são divulgados em outro local deste documento.
[00142] As moléculas de ácidos nucleicos reveladas podem ser constituídas por, por exemplo, nucleotídeos ou nucleotídeos não naturais ou modificados, tais como análogos de nucleotídeos ou substitutos de nucleotídeos. Tais nucleotídeos incluem um nucleotídeo que contém uma base modificada, grupo açúcar ou fosfato, ou que incorpora uma porção não natural na sua estrutura. Exemplos de nucleotídeos não naturais incluem nucleotídeos didesoxinucleotídeos, biotinilados, aminados, desaminados, alquilados, benzilados e marcados com fluoróforos.
[00143] As moléculas de ácidos nucleicos aqui divulgadas podem compreender um ou mais análogos ou substituições de nucleotídeos. Um análogo de nucleotídeo é um nucleotídeo que contém algum tipo de modificação para as porções base, açúcar ou fosfato. Modificações na porção base incluiríam modificações naturais e sintéticas de A, C, G e T/U, bem como diferentes bases de purina ou pirimidina, tais como pseudouridina, uracil-5-ila, hipoxantin-9-il (I), e 2-aminoadenin-9-ila. As bases modificadas incluem, por exemplo, 5-metilcitosina (5-me-C), 5-hidroximetilcitosina, xantina, hipoxantina, 2-aminoadenina, 6-metila e outros derivados de alquila de adenina e guanina, 2-propila e outros derivados de alquila de adenina e guanina, 2-tiouracila, 2-tiotimina e 2-tiocitosina, 5-halouracila e citosina, 5
Petição 870190068171, de 18/07/2019, pág. 79/358 / 307 propinil uracila e citosina, 6-azo-uracila, citosina e timina, 5-uracila (pseudouracila), 4-tiouracil, 8-halo, 8-amino, 8-tiol, 8-tioalquila, 8-hidroxila e outras adeninas e guaninas substituídas em 8,5-halo particularmente 5-bromo, 5-trifluorometila e outros ureias e citosinas substituídas em 5,7- metilguanina e 7-metiladenina, 8-azaguanina e 8-azaadenina, 7-desazaguanina e 7-deazaadenina e 3-deazaguanina e 3-deaza-adenina. Modificações adicionais de base podem ser encontradas, por exemplo, na Patente dos EUA No. 3.687.808; Englisch et al. (1991) Angewandte Chemie, International Edition 30: 613; e Sanghvi, Y. S., Chapter 15, Antissentido Research and Applications, páginas 289 a 302, Crooke, S. T. e Lebleu, B. ed., CRC Press, 1993, cada uma das quais aqui incorporada por referência na sua totalidade para todos os efeitos. Certos análogos de nucleotídeos, tais como pirimidinas substituídas em 5,6azapirimidinas e purinas substituídas em N-2, N-6 e 0-6, incluindo 2aminopropiladenina, 5-propiniluracila, 5-propinilcitosina e 5-metilcitosina podem aumentar a estabilidade de formação de duplex. Muitas vezes, as modificações de base podem ser combinadas com, por exemplo, uma modificação de açúcar, como o 2'-O-metoxietil, para obter propriedades únicas, como o aumento da estabilidade do duplex. Existem inúmeras patentes nos EUA, como 4.845.205; 5.130.302; 5.134.066; 5.175.273; 5.367.066; 5.432.272; 5.457.187; 5.459.255; 5.484.908; 5.502.177; 5.525.711; 5.552.540; 5.587.469; 5.594.121; 5.596.091; 5.614.617; e 5.681.941, que detalham e descrevem uma série de modificações de base. Cada um destes é aqui incorporado por referência na sua totalidade para todos os efeitos.
[00144] Os análogos de nucleotídeos podem também incluir modificações da porção de açúcar. As modificações na porção açúcar podem incluir, por exemplo, modificações naturais da ribose e desoxirribose, bem como modificações sintéticas. As modificações do açúcar incluem, por exemplo, as seguintes modificações na posição 2': OH; F; O, S ou N-alquila; O-, S- ou N-alquenila; O-, S- ou N-alquinila; ou O-alquil-O-alquila, em que
Petição 870190068171, de 18/07/2019, pág. 80/358 / 307 alquila, alquenila e alquinila podem ser alquila Cl a CIO ou alquenila e alquinila C2 a CIO substituído ou não substituído. Exemplos de modificações de açúcar em 2' incluem também, por exemplo, -O[(CH2)nO]mCH3, O(CH2)nOCH3, -O(CH2)nNH2, -O(CH2)nCH3, -O(CH2)n-ONH2 e O(CH2)n[(CH2)nCH3)]2, onde nem são de 1 a cerca de 10.
[00145] Outras modificações na posição 2' incluem, por exemplo, alquila inferior Cl a CIO, alquila inferior substituído, alcarila, aralquila, Oalcarila ou O-aralquila, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2, heterocicloalquila, heterocicloalcarila, aminoalquilamino, polialquilamino, silila substituído, um grupo de clivagem de RNA, um grupo repórter, um intercalador, um grupo para melhorar as propriedades farmacocinéticas de um oligonucleotídeo, ou um grupo para melhorar as propriedades farmacodinâmicas de um oligonucleotídeo e outros substituintes com propriedades semelhantes. Modificações semelhantes também podem ser feitas em outras posições no açúcar, particularmente na posição 3' do açúcar no nucleotídeos terminal 3' ou nos oligonucleotídeos ligados 2-5' e na posição 5' do nucleotídeo terminal 5'. Os açúcares modificados podem também incluir aqueles que contêm modificações no oxigênio do anel em ponte, tais como CH2 e S. Os análogos de açúcar de nucleotídeos podem também ter miméticos de açúcar, tais como porções ciclobutila em vez do açúcar de pentofuranosila. Existem numerosas patentes dos EUA que ensinam a preparação de tais estruturas de açúcar modificadas, tais como 4.981.957; 5.118.800; 5.319.080; 5.359.044; 5.393.878; 5.446.137; 5.466.786; 5.514.785; 5.519.134; 5.567.811; 5.576.427; 5.591.722;
5.597.909; 5.610.300; 5.627.053; 5.639.873; 5.646.265; 5.658.873;
5.670.633; e 5.700.920, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos.
[00146] Os análogos de nucleotídeos podem também ser modificados na porção fosfato. Porções fosfato modificadas incluem, por exemplo, aquelas
Petição 870190068171, de 18/07/2019, pág. 81/358 / 307 que podem ser modificadas de modo que a ligação entre dois nucleotídeos contenha um fosforotioato, fosforotioato quiral, fosforoditioato, fosfotriéster, aminoalquilfosfatriéster, metil e outros alquil fosfonatos incluindo 3'alquileno fosfonato e fosfonatos quirais, fosfinatos, fosforamidatos incluindo 3'-amino-fosforamidato e aminoalquilfosforamidatos, tionofosforamidatos, tionoalquilfosfonatos, tioalquilfosfotercianos e boranofosfatos. Estas ligações de fosfato ou fosfato modificado entre dois nucleotídeos podem ser através de uma ligação 3'-5 'ou uma ligação 2'-5', e a ligação pode conter polaridade invertida como 3'-5 'a 5-3' ou 2'-5' a 5'-2'. Vários sais, sais mistos e formas de ácido livre também estão incluídos. Numerosas patentes dos EUA ensinam como fabricar e utilizar nucleotídeos contendo fosfatos modificados e
incluem, por exemplo, 3.687.808; 4.469.863; 4.476.301; 5.023.243;
5.177.196; 5.188.897; 5.264.423; 5.276.019; 5.278.302; 5.286.717;
5.321.131; 5.399.676; 5.405.939; 5.453.496; 5.455.233; 5.466.677;
5.476.925; 5.519.126; 5.536.821; 5.541.306; 5.550.111; 5.563.253;
5.571.799; 5.587.361; e 5.625.050, cada uma das quais é aqui incorporada por referência na sua totalidade para todos os efeitos.
[00147] Os substitutos de nucleotídeos incluem moléculas com propriedades funcionais semelhantes aos nucleotídeos, mas que não contêm uma porção fosfato, tal como o ácido nucleico peptídico (PNA). Os substitutos de nucleotídeos incluem moléculas que reconhecem os ácidos nucleicos de um modo Watson-Crick ou Hoogsteen, mas que estão ligados entre si através de uma parte diferente de uma porção fosfato. Os substitutos de nucleotídeos são capazes de se adaptar a uma estrutura do tipo hélice dupla quando interagem com o ácido nucleico alvo apropriado.
[00148] Os substitutos de nucleotídeos também incluem nucleotídeos ou análogos de nucleotídeos que tiveram a porção de fosfato ou porções de açúcar substituídas. Os substitutos de nucleotídeos podem não conter um átomo de fósforo padrão. Os substituintes para o fosfato podem ser, por
Petição 870190068171, de 18/07/2019, pág. 82/358 / 307 exemplo, ligações internucleosídicas de cadeia curta ou de cicloalquila, heteroátomos mistos e ligações internucleosídicas de alquila ou cicloalquila, ou uma ou mais ligações internucleosídicas de heteroátomos ou heterocíclicas de cadeia curta. Estes incluem aqueles que possuem ligações morfolino (formadas em parte a partir da porção de açúcar de um nucleosídeo); coluna vertebral de siloxano; estruturas de sulfeto, sulfóxido e sulfona; estruturas de formacetila e tioformacetila; estruturas de metileno formocetila e tioformacetila; estruturas contendo alqueno; estruturas de sulfamato; estruturas de metilenoimina e metileno-hidrazina; estruturas de sulfonato e sulfonamida; estruturas de amida; e outras tendo partes componentes N, O, S e CH2 misturadas. Numerosas patentes dos EUA revelam como fazer e utilizar estes tipos de substituições de fosfato e incluem, mas não se limitam a, 5.034.506; 5.166.315; 5.185.444; 5.214.134; 5.216.141; 5.235.033;
5.264.562; 5.264.564; 5.405.938; 5.434.257; 5.466.677; 5.470.967;
5.489.677; 5.541.307; 5.561.225; 5.596.086; 5.602.240; 5.610.289;
5.602.240; 5.608.046; 5.610.289; 5.618.704; 5.623.070; 5.663.312;
5.633.360; 5.677.437; e 5.677.439, cada uma das quais é aqui incorporada por referência na sua totalidade para todos os efeitos.
[00149] E também entendido em um substituto de nucleotídeos que tanto as porções de açúcar como as de fosfato do nucleotídeo podem ser substituídas, por exemplo, por uma ligação do tipo amida (aminoetilglicina) (PNA). As patentes dos EUA 5.539.082; 5.714.331; e 5.719.262 ensinam como fazer e utilizar moléculas de PNA, cada uma das quais é aqui incorporada por referência na sua totalidade para todos os efeitos. Ver também Nielsen et al. (1991) Science 254: 1497 a 1500, aqui incorporado por referência na sua totalidade para todos os efeitos.
[00150] E também possível ligar outros tipos de moléculas (conjugados) a nucleotídeos ou análogos de nucleotídeos para aumentar, por exemplo, a captação celular. Os conjugados podem ser quimicamente ligados
Petição 870190068171, de 18/07/2019, pág. 83/358 / 307 aos nucleotídeos ou análogos de nucleotídeos. Tais conjugados incluem, por exemplo, porções lipídicas, tais como uma porção de colesterol (Letsinger et al. (1989) Proc. Natl. Acad. Sei. USA 86: 6553 a 6556, aqui incorporada por referência na sua totalidade para todos os efeitos), ácido cólico (Manoharan et al. (1994) Bioorg. Med. Chem. Let. 4: 1053 a 1060, aqui incorporado por referência na sua totalidade para todos os efeitos), um tio éter, tal como hexilS-tritiltiol (Manoharan et al. (1992) Ann. NY Acad. Sei. 660: 306 a 309; Manoharan et al. (1993) Bioorg. Med. Chem. Let. 3: 2765 a 2770, aqui incorporado por refercia na sua totalidade para todos os efeitos), um tiocolesterol (Oberhauser et al. (1992) Nucl. Acids Res. 20: 533 a 538, aqui incorporado por referência na sua totalidade para todos os efeitos), uma cadeia alifática, tal como dodecandiol ou resíduos undecila (SaisonBehmoaras et al. (1991)). EMBO J. 10: 1111 a 1118, Kabanov et al., (1990) FEBS Lett 259: 327 a 330, Svinarchuk et al. (1993) Biochimie 75: 49 a 54, cada um dos quais aqui incorporado por referência na sua totalidade para para todos os efeitos), um fosfolipídio, tal como di-hexadecil-rac-glicerol ou 1,2di-O-hexadecil-rac-glicero-3-H-fosfonato de trietilamônio (Manoharan et al. (1995) Tetrahedron Lett. 36: 3651 a 3654; Shea et al. (1990) Nucl. Acid Res. 18: 3777 a 3783, cada uma das quais é aqui incorporada por referência na sua totalidade para todos os efeitos), uma poliamina ou uma cadeia de polietilenoglicol (Manoharan et al. (1995) Nucleosides & Nucleotides 14: 969 a 973, aqui incorporadas por referência na sua totalidade para todos os efeitos) ou ácido adamantano-acético (Manoharan et al. (1995) Tetrahedron Lett. 36: 3651 a 3654, aqui incorporado por referência na sua totalidade para todos os efeitos), uma porção palmitila (Mishra et al. 1995) Biochim, Biophys, Acta 1264: 229 a 237), ou uma porção octadecilamina ou hexilaminocarboniloxicolesterol (Crooke et al. (1996) J. Pharmacol. Exp. Ther. 277: 923 a 937, aqui incorporada por referência na sua totalidade para todos os efeitos). Numerosas patentes dos EUA ensinam a preparação de tais
Petição 870190068171, de 18/07/2019, pág. 84/358
71/307
conjugados e incluem, por exemplo, as patentes 4.828.979; 4.948.882;
5.218.105; 5.525.465; 5.541.313; 5.545.730; 5.552.538; 5.578.717,
5.580.731; 5.580.731; 5.591.584; 5.109.124; 5.118.802; 5.138.045;
5.414.077; 5.486.603; 5.512.439; 5.578.718; 5.608.046; 4.587.044;
4.605.735; 4.667.025; 4.762.779; 4.789.737; 4.824.941; 4.835.263;
4.876.335; 4.904.582; 4.958.013; 5.082.830; 5.112.963; 5.214.136;
5.082.830; 5.112.963; 5.214.136; 5.245.022; 5.254.469; 5.258.506;
5.262.536; 5.272.250; 5.292.873; 5.317.098; 5.371.241; 5.391.723;
5.416.203; 5.451.463; 5.510.475; 5.512.667; 5.514.785; 5.565.552;
5.567.810; 5.574.142; 5.585.481; 5.587.371; 5.595.726; 5.597.696;
5.599.923; 5.599.928 e 5.688.941, cada uma das quais é aqui incorporada por referência na sua totalidade para todos os efeitos.
[00151] Os ácidos nucleicos isolados aqui divulgados podem compreender uma sequência nucleotídica de uma transcrição de gene ou RNAm de ocorrência natural de HSD17B13, ou podem compreender uma sequência de ocorrência não natural. Em um exemplo, a sequência que não ocorre naturalmente pode diferir da sequência que não ocorre naturalmente devido a mutações ou mutações sinônimas que não afetam a proteína de HSD17B13 codificada. Por exemplo, a sequência pode ser idêntica à exceção de mutações ou mutações sinônimas que não afetam a proteína de HSD17B13 codificada. Uma mutação sinônima ou substituição é a substituição de um nucleotídeo por outro em um éxon de um gene que codifica uma proteína tal que a sequência de aminoácidos produzida não seja modificada. Isso é possível devido à degeneração do código genético, com alguns aminoácidos sendo codificados por mais de um códon de três pares de bases. Substituições sinônimas são usadas, por exemplo, no processo de otimização de códons.
[00152] Também são aqui divulgadas proteínas codificadas pelos ácidos nucleicos aqui divulgados e composições compreendendo um ácido nucleico isolado ou proteína aqui revelada e um veículo aumentando a
Petição 870190068171, de 18/07/2019, pág. 85/358 / 307 estabilidade do ácido nucleico isolado ou proteína (por exemplo, prolongando o período sob dadas condições de armazenamento (por exemplo, -20 °C, 4 °C, ou temperatura ambiente) para o qual os produtos de degradação permanecem abaixo de um limite, abaixo de 0,5% em peso do ácido nucleico ou proteína de iniciação, ou aumentando a estabilidade in vivo). Exemplos não limitativos de tais portadores incluem microsferas de poli(ácido láctico) (PLA), microsferas de poli ácido(D,L-láctico-coglicólico) (PLGA), lipossomas, micelas, micelas inversas, cocleatos lipídicos e microtúbulos lipídicos.
(1) Ácidos nucleicos incluindo resíduos mutantes da variante de HSD17B13, rs72613567 [00153] São aqui divulgados ácidos nucleicos isolados compreendendo pelo menos 15 nucleotídeos contíguos de um gene HSD17B13 e possuindo uma timina em uma posição correspondente à posição 12666 (ou timinas em posições correspondentes às posições 12666 e 12667) da variante de HSD17B13, rs72613567, (SEQ ID NO: 2) quando perfeitamente alinhado com a variante de HSD17B13, rs72613567. Isto é, são aqui divulgados ácidos nucleicos isolados compreendendo pelo menos 15 nucleotídeos contíguos de um gene HSD17B13 e tendo uma timina inserida entre nucleotídeos correspondentes às posições 12665 e 12666 do gene HSD17B13 de tipo selvagem (SEQ ID NO: 1) quando perfeitamente alinhados com o gene HSD17B13 do tipo selvagem. Tais ácidos nucleicos isolados podem ser úteis, por exemplo, para expressar transcrições e proteínas de variantes de HSD17B13 ou como sequências de doador exógeno. Tais ácidos nucleicos isolados também podem ser úteis, por exemplo, como RNAs guia, iniciadores e sondas.
[00154] O gene HSD17B13 pode ser um gene HSD17B13 de qualquer organismo. Por exemplo, o gene HSD17B13 pode ser um gene HSD17B13 humano ou um ortólogo de outro organismo, tal como um mamífero não humano, um roedor, um camundongo ou um rato.
Petição 870190068171, de 18/07/2019, pág. 86/358 / 307 [00155] Entende-se que sequências de genes dentro de uma população podem variar devido a polimorfismos, como polimorfismos de nucleotídeo único. Os exemplos aqui providos são apenas sequências exemplificativas. Outras sequências também são possíveis. Como um exemplo, os pelo menos 15 nucleotídeos contíguos podem ser pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idênticos a uma sequência correspondente na variante de HSD17B13, rs72613567, (SEQ ID NO: 2) incluindo a posição 12666 ou posições 12666 e 12667 da SEQ ID NO: 2 quando perfeitamente alinhado com a SEQ ID NO: 2. Opcionalmente, o ácido nucleico isolado compreende pelo menos 15 nucleotídeos contíguos da SEQ ID NO: 2 incluindo a posição 12666 ou posições 12666 e 12667 da SEQ ID NO: 2. Como outro exemplo, os pelo menos 15 nucleotídeos contíguos podem ser pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% indênticos a uma sequência correspondente no gene HSD17B13 de tipo selvagem (SEQ ID NO: 1) incluindo as posições 12665 e 12666 da SEQ ID NO: 1 quando perfeitamente alinhado com a SEQ ID NO: 1, em que uma timina está presente entre as posições correspondentes às posições 12665 e 12666 da SEQ ID NO: 1. Opcionalmente, o ácido nucleico isolado compreende pelo menos 15 nucleotídeos contíguos da SEQ ID NO: 1 incluindo as posições 12665 e 12666 da SEQ ID NO: 1, em que uma timina está presente entre as posições correspondentes às posições 12665 e 12666 da SEQ ID NO: 1.
[00156] O ácido nucleico isolado pode compreender, por exemplo, pelo menos 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900 ou 1000 nucleotídeos contíguos de um gene HSD17B13. Altemativamente, o ácido nucleico isolado pode compreender, por exemplo, pelo menos 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 11000, 12000, 13000, 14000, 15000, 16000, 17000, 18000, ou 19000
Petição 870190068171, de 18/07/2019, pág. 87/358 / 307 nucleotídeos contíguos de um gene HSD17B13.
[00157] Em alguns casos, o ácido nucleico isolado pode compreender um minigene HSD17B13 em que um ou mais segmentos não essenciais do gene foram eliminados em relação a um gene HSD17B13 tipo selvagem correspondente. Como um exemplo, os segmentos eliminados compreendem uma ou mais sequências intrônicas. Tais minigenes HSD17B13 podem compreender, por exemplo, éxons correspondentes aos éxons 1 a 7 a partir da Transcrição D de HSD17B13 e um íntron correspondente ao íntron na SEQ ID NO: 2 quando perfeitamente alinhado com a SEQ ID NO: 2. Como um exemplo, um minigene HSD17B13 pode compreender os éxons 1 a 7 e o íntron 6 da SEQ ID NO: 2. Os minigenes são descritos com mais detalhe em outro local aqui.
(2) Ácidos Nucleicos que Hibridizam uma Sequência Adjacente ou Incluindo o Resíduo Mutante da Variante de HSD17B13, rs72613567 [00158] Também são aqui divulgados ácidos nucléicos isolados compreendendo pelo menos 15 nucleotídeos contíguos que hibridizam com um gene HSD17B13 (por exemplo, um minigene HSD17B13) em um segmento que inclui ou está dentro de 1000, 500, 400, 300, 200, 100, 50, 45, 40, 35, 30, 25, 20, 15, 10 ou 5 nucleotídeos de uma posição correspondente à posição 12666 ou posições 12666 e 12667 da variante de HSD17B13, rs72613567, (SEQ ID NO: 2) quando otimizado com a variante de HSD17B13, rs72613567. Tais ácidos nucleicos isolados podem ser úteis, por exemplo, como RNAs guias, iniciadores, sondas ou sequências de doador exógeno.
[00159] O gene HSD17B13 pode ser um gene HSD17B13 de qualquer organismo. Por exemplo, o gene HSD17B13 pode ser um gene HSD17B13 humano ou um ortólogo de outro organismo, tal como um mamífero não humano, um camundongo ou um rato.
[00160] Como um exemplo, os pelo menos 15 nucleotídeos contíguos
Petição 870190068171, de 18/07/2019, pág. 88/358 / 307 podem hibridizar com um segmento do gene HSD17B13 ou minigene HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico a uma sequência correspondente na variante de HSD17B13, rs72613567, (SEQ ID NO: 2) quando perfeitamente alinhada com a SEQ ID NO: 2. Opcionalmente, o ácido nucleico isolado pode hibridizar pelo menos 15 nucleotídeos contíguos de SEQ ID NO: 2. Opcionalmente, o ácido nucleico isolado hibridiza com um segmento incluindo a posição 12666 ou as posições 12666 e 12667 na SEQ ID NO: 2 ou uma posição correspondente à posição 12666 ou às posições 12666 e 12667 na SEQ ID NO: 2 quando perfeitamente alinhado com SEQ ID NO: 2.
[00161] O segmento com o qual o ácido nucleico isolado pode hibridizar pode compreender, por exemplo, pelo menos 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 75, 90, 95, 100, 200, 300, 400, 500, 600, 700, 800, 900, ou 1000 nucleotídeos contíguos de um gene HSD17B13. Altemativamente, o ácido nucleico isolado pode compreender, por exemplo, pelo menos 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 11000, 12000, 13000, 14000, 15000, 16000, 17000, 18000, ou 19000 nucleotídeos contíguos de um gene HSD17B13. Altemativamente, o segmento com o qual o ácido nucleico isolado pode hibridizar pode ser, por exemplo, até 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 75, 90, 95, 100, 200, 300, 400, 500, 600, 700, 800, 900, ou 1000 nucleotídeos contíguos de um gene HSD17B13. Por exemplo, o segmento pode ter cerca de 15 a 100 nucleotídeos de comprimento ou cerca de 15 a 35 nucleotídeos de comprimento.
(3) cDNAs e transcrições de variantes produzidos pela variante de HSD17B13, rs72613567 [00162] Também são providos ácidos nucléicos correspondentes a toda ou parte de uma transcrição de RNAm ou um DNAc correspondente a
Petição 870190068171, de 18/07/2019, pág. 89/358 / 307 qualquer uma das transcrições A a H (SEQ ID NOS: 4 a 11, respectivamente), e particularmente transcrições C a H, quando perfeitamente alinhadas com qualquer uma das transcrições A a H. Entende-se que sequências genéticas e dentro de uma população e sequências de RNAm transcritas a partir de tais genes podem variar devido a polimorfismos, tais como polimorfismos de nucleotídeo único. As sequências aqui providas para cada transcrição são apenas sequências exemplificativas. Outras sequências também são possíveis. Exemplos específicos, não limitativos, são providos abaixo. Tais ácidos nucleicos isolados podem ser úteis, por exemplo, para expressar transcrições e proteínas da variante de HSD17B13.
[00163] O ácido nucleico isolado pode ser de qualquer comprimento. Por exemplo, o ácido nucleico isolado pode compreender pelo menos 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 ou 2000 nucleotídeos contíguos que codificam a totalidade ou parte de uma proteína de HSD17B13. Em alguns casos, os ácidos nucleicos isolados compreendem nucleotídeos contíguos que codificam a totalidade ou parte de uma proteína de HSD17B13, em que os nucleotídeos contíguos compreendem sequências de pelo menos dois éxons diferentes de um gene HSD17B13 (por exemplo, que abrange pelo menos um limite éxon-éxon de um gene HSD17B13 sem um íntron interveniente).
[00164] A transcrição D (SEQ ID NO: 7), a transcrição G (SEQ ID NO: 10) e a Transcrição H (SEQ ID NO: 11) de HSD17B13 incluem uma inserção de uma guanina na extremidade 3' do éxon 6, resultando em um desvio de trama no éxon 7 e truncagem prematura da região da proteína de HSD17B13 codificada pelo éxon 7 em comparação com a transcrição A. Por conseguinte, são providos aqui ácidos nucleicos isolados compreendendo um segmento (por exemplo, pelo menos 15 nucleotídeos contíguos) presentes nas transcrições D, G e H (ou fragmentos ou homólogos das mesmas) que não estão presentes na transcrição A (ou um fragmento ou homólogo da mesma).
Petição 870190068171, de 18/07/2019, pág. 90/358 / 307
Tais regiões podem ser prontamente identificadas comparando as sequências das transcrições. Por exemplo, são aqui providos ácidos nucleicos isolados compreendendo pelo menos 15 nucleotídeos contíguos (por exemplo, pelo menos 20 nucleotídeos contíguos ou pelo menos 30 nucleotídeos contíguos) que codificam a totalidade ou parte de uma proteína de HSD17B13, em que um segmento dos nucleotídeos contíguos (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico a uma região de entrelaçamento do limite éxon 6-éxon 7 na SEQ ID NO: 7 (transcrição D de HSD17B13), SEQ ID NO: 10 (transcrição G de HSD17B13) ou SEQ ID NO: 11 (transcrição H de HSD17B13) quando perfeitamente alinhado com a SEQ ID NO: 7, 10 ou 11, respectivamente, e o segmento inclui uma guanina em um resid'/iuo correspondente ao resíduo 878 na extremidade 3' do éxon 6 na SEQ ID NO: 7 (isto é, uma inserção de uma guanina na extremidade 3' do éxon 6 em relação à transcrição A, além da guanina no início do éxon 7), um resíduo correspondente ao resíduo 770 na extremidade 3' do éxon 6 na SEQ ID NO: 10 (isto é, uma inserção de uma guanina na extremidade 3' do éxon 6 em relação à transcrição B em adição à guanina no início do éxon 7) ou um resíduo correspondente ao resíduo 950 na extremidade 3' do éxon 6 na SEQ ID NO: 11 (isto é, uma inserção de uma guanina na extremidade 3' do éxon 6 em relação à transcrição E em adição à guanina no início do éxon 7). Entende-se que tal ácido nucleico incluiría um número suficiente de nucleotídeos em cada um dos éxons 6 e 7 para distinguir a guanina inserida de outras características nas transcrições de HSD17B13 (por exemplo, da guanina no início do éxon 7, da leitura através do íntron 6 na transcrição F, ou a partir do éxon 6 eliminado na transcrição C).
[00165] Como um exemplo, o ácido nucleico isolado pode compreender pelo menos 15 nucleotídeos contíguos (por exemplo, pelo
Petição 870190068171, de 18/07/2019, pág. 91/358 / 307 menos 20 nucleotídeos contíguos ou pelo menos 30 nucleotídeos contíguos) da SEQ ID NO: 7 que abrange o limite do éxon 6-éxon 7, compreendendo opcionalmente éxons 6 e 7 da SEQ ID NO: 7, e opcionalmente compreendendo a sequência completa da SEQ ID NO: 7.
[00166] Opcionalmente, o ácido nucleico isolado compreende adicionalmente um segmento presente na transcrição D (ou um fragmento ou homólogo da mesma) que não está presente na transcrição G (ou um fragmento ou homólogo da mesma), e o ácido nucleico isolado compreende adicionalmente um segmento presente na transcrição D (ou um fragmento ou homólogo da mesma) que não está presente na transcrição H (ou um fragmento ou homólogo da mesma). Tais regiões podem ser prontamente identificadas comparando as sequências das transcrições. Por exemplo, tais ácidos nucleicos isolados podem compreender um segmento dos nucleotídeos contíguos (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico a uma região que abrange o limite dos éxons 3 e 4 da SEQ ID NO: 7 (transcrição D de HSD17B13) quando perfeitamente alinhado com a SEQ ID NO: 7 para se distinguir da transcrição
H. Da mesma forma, tais ácidos nucléicos isolados podem compreender um segmento dos nucleotídeos contíguos (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico a uma região dentro do éxon 2 da SEQ ID NO: 7 (transcrição D de HSD17B13), uma região que abrange o limite éxon 1-éxon 2 da SEQ ID NO: 7, ou uma região que abrange o limite do éxon 2-éxon 3 da SEQ ID NO: 7 quando perfeitamente alinhado com a SEQ ID NO: 7 para se distinguir da transcrição G. Opcionalmente, o ácido nucleico isolado compreende uma
Petição 870190068171, de 18/07/2019, pág. 92/358 / 307 sequência de pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à sequência apresentada na SEQ ID NO: 7 (transcrição D de HSD17B13) e codifica uma proteína de HSD17B13 compreendendo a sequência apresentada na SEQ ID NO: 15 (isoforma D de HSD17B13) .Como a transcrição D, a transcrição H (SEQ ID NO: 11) inclui uma inserção de uma guanina 3' do éxon 6 em comparação com a transcrição A. A transcrição H inclui adicionalmente um éxon adicional (éxon 3') entre os éxons 3 e 4 comparado com a transcrição A e a transcrição D. Por conseguinte, são aqui providos ácidos nucleicos isolados como descrito acima compreendendo um segmento presente nas transcrições D, G e H (ou fragmentos ou homólogos das mesmas) que não está presente no transcrição A (ou um fragmento ou homólogo da mesma), mas compreendendo adicionalmente um segmento (por exemplo, pelo menos 15 nucleotídeos contíguos) da transcrição H (ou um fragmento ou homólogo da mesma) que não está presente na transcrição D (ou um fragmento ou homólogo da mesma). Tais regiões podem ser prontamente identificadas comparando as sequências das transcrições. Por exemplo, são aqui providos ácidos nucleicos isolados como descrito para a transcrição D, em que um segmento dos nucleotídeos contíguos (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico a uma região dentro do éxon 3' da SEQ ID NO: 11 (transcrição H de HSD17B13), uma região que abrange o limite éxon 3-exon 3' da SEQ ID NO: 11, ou uma região que abrange o limite do éxon 3'-éxon 4 da SEQ ID NO: 11 quando perfeitamente alinhada com a SEQ ID NO: 11. Entende-se que tal ácido nucleico incluiría um número suficiente de nucleotídeos em cada um dos éxons 3 e 3' ou cada um dos éxons 3' e 4 para se distinguir de outras características nas transcrições de HSD17B13 (por exemplo, do limite dos
Petição 870190068171, de 18/07/2019, pág. 93/358
80/307 éxons 3 e 4). Por exemplo, a região do éxon 3' pode compreender todo o éxon 3'. Opcionalmente, o ácido nucleico isolado compreende uma sequência de pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à sequência apresentada na SEQ ID NO: 11 (transcrição H de HSD17B13) e codifica uma proteína de HSD17B13 compreendendo a sequência apresentada na SEQ ID NO: 19 (isoforma H de HSD17B13).
[00167] Como um exemplo, o ácido nucleico isolado pode compreender pelo menos 15 nucleotídeos contíguos (por exemplo, pelo menos 20 nucleotídeos contíguos ou pelo menos 30 nucleotídeos contíguos) da SEQ ID NO: 11 incluindo uma região no éxon 3', uma região que abrange o limite éxon 3-éxon 3' ou uma região que abrange o limite éxon 3'-éxon 4, compreendendo opcionalmente o éxon 3' inteiro da SEQ ID NO: 11 e, opcionalmente, compreendendo a sequência completa da SEQ ID NO: 11.
[00168] Como a transcrição D, a transcrição G (SEQ ID NO: 10) inclui uma inserção de uma guanina 3' do éxon 6 em comparação com a transcrição A. Além disso, no entanto, a transcrição G está ausente do éxon 2 comparado com a transcrição A e a transcrição D (isto é, a transcrição G inclui um limite éxon 1-éxon 3 não presente nas transcrições A e D). Por conseguinte, são aqui providos ácidos nucleicos isolados como descrito acima compreendendo um segmento presente nas transcrições D, G e H (ou fragmentos ou homólogos das mesmas) que não está presente na transcrição A (ou um fragmento ou homólogo da mesma) mas compreendendo adicionalmente um segmento (por exemplo, pelo menos 15 nucleotídeos contíguos) da transcrição G (ou um fragmento ou homólogo da mesma) que não está presente na transcrição D (ou um fragmento ou homólogo da mesma). Tais regiões podem ser prontamente identificadas comparando as sequências das transcrições. Por exemplo, são aqui providos ácidos nucleicos isolados como descrito para a transcrição D, em que um segmento dos nucleotídeos contíguos (por exemplo,
Petição 870190068171, de 18/07/2019, pág. 94/358
81/307 pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico a uma região que abrange o limite do éxon 1-éxon 3 na SEQ ID NO: 10 (transcrição G de HSD17B13) quando perfeitamente alinhado com a SEQ ID NO: 10. Entende-se que tal ácido nucleico incluiría um número suficiente de nucleotídeos em cada um dos éxons 1 e 3 para se distinguir de outras características nas transcrições de HSD17B13 (por exemplo, o limite dos éxons 1 e 2 ou o limite dos éxons 2 e 3). Por exemplo, a região pode compreender a totalidade dos éxons 1 e 3 na SEQ ID NO: 10. Opcionalmente, o ácido nucleico isolado compreende uma sequência de pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à sequência apresentada na SEQ ID NO: 10 (transcrição G de HSD17B13) e codifica uma proteína de HSD17B13 compreendendo a sequência apresentada na SEQ ID NO: 18 (isoform G de HSD17B13).
[00169] Como um exemplo, o ácido nucleico isolado pode compreender pelo menos 15 nucleotídeos contíguos (por exemplo, pelo menos 20 nucleotídeos contíguos ou pelo menos 30 nucleotídeos contíguos) da SEQ ID NO: 10 incluindo uma região que abrange o limite éxon 1-éxon 3 compreendendo opcionalmente os éxons 1 e 3 da SEQ ID NO: 10, e opcionalmente compreendendo toda a sequênncia da SEQ ID NO: 10.
[00170] Também são aqui providos ácidos nucleicos isolados compreendendo um segmento (por exemplo, pelo menos 15 nucleotídeos contíguos) presentes na transcrição E (ou um fragmento ou homólogo da mesma) que não está presente na transcrição A (ou um fragmento ou homólogo da mesma). Tais regiões podem ser prontamente identificadas comparando as sequências das transcrições. A transcrição E (SEQ ID NO: 8) inclui um éxon adicional entre os éxons 3 e 4 em comparação com a transcrição A. Por conseguinte, são aqui providos ácidos nucleicos isolados
Petição 870190068171, de 18/07/2019, pág. 95/358
82/307 compreendendo pelo menos 15 nucleotídeos contíguos (por exemplo, pelo menos 20 nucleotídeos contíguos ou pelo menos 30 nucleotídeos contíguos) que codificam toda ou parte de uma proteína de HSD17B13, em que um segmento dos nucleotídeos contíguos (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico a uma região dentro do éxon 3' da SEQ ID NO: 8 (transcrição E de HSD17B13), uma região que abrange o limite éxon 3-éxon 3' da SEQ ID NO: 8, ou uma região que abrange o limite éxon 3'-éxon 4 da SEQ ID NO: 8 quando perfeitamente alinhado com a SEQ ID NO: 8. Entende-se que esse ácido nucleico incluiría um número suficiente de nucleotídeos em cada um dos éxons 3 e 3' ou cada um dos éxons 3' e 4 para se distinguir de outras características nas transcrições HSD17B13 (por exemplo, a partir dos limites dos éxons 3 e 4). Por exemplo, a região do éxon 3' pode compreender todo o éxon 3'. Opcionalmente, o ácido nucleico isolado compreende adicionalmente um segmento (por exemplo, pelo menos 15 nucleotídeos contíguos) da transcrição E (ou um fragmento ou homólogo da mesma) que não está presente na transcrição H (ou um fragmento ou homólogo da mesma). Tais regiões podem ser prontamente identificadas comparando as sequências das transcrições. Por exemplo, são aqui providos ácidos nucleicos isolados como descrito acima, em que um segmento dos nucleotídeos contíguos (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) é pelo menos 90%, pelo menos 95 %, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico a uma região que abrange o limite do éxon 6-éxon 7 na SEQ ID NO: 8 (transcrição E de HSD17B13) quando perfeitamente alinhado com SEQ ID NO: 8. Entende-se que tal ácido nucleico incluiría um número suficiente de nucleotídeos em cada um dos éxons 6 e 7 para se distinguir de
Petição 870190068171, de 18/07/2019, pág. 96/358 / 307 outras características nas transcrições de HSD17B13 (particularmente a guanina adicional na extremidade 3' do éxon 6 na transcrição H). Por exemplo, a região pode compreender a totalidade dos éxons 6 e 7 na SEQ ID NO: 8. Opcionalmente, o ácido nucleico isolado compreende uma sequência de pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico à sequência apresentada na SEQ ID NO: 8 (transcrição E de HSD17B13) e codifica uma proteína de HSD17B13 compreendendo a sequência apresentada na SEQ ID NO: 16 (isoforma E de HSD17B13).
[00171] Como um exemplo, o ácido nucleico isolado pode compreender pelo menos 15 nucleotídeos contíguos (por exemplo, pelo menos 20 nucleotídeos contíguos ou pelo menos 30 nucleotídeos contíguos) da SEQ ID NO: 8 incluindo uma região no éxon 3', uma região que abrange o limite éxon 3-éxon 3', ou uma região que abrange o limite éxon 3'-éxon 4, compreendendo opcionalmente o éxon 3' inteiro da SEQ ID NO: 8 e, opcionalmente, compreendendo a sequência completa da SEQ ID NO: 8.
[00172] Também são aqui providos ácidos nucleicos isolados compreendendo um segmento (por exemplo, pelo menos 15 nucleotídeos contíguos) presentes na transcrição F (ou um fragmento ou homólogo da mesma) que não está presente na transcrição A (ou um fragmento ou homólogo da mesma). Tais regiões podem ser prontamente identificadas comparando as sequências das transcrições. A transcrição F (SEQ ID NO: 9) inclui uma leitura do éxon 6 no íntron 6 em comparação com a transcrição A, e a leitura inclui a timina inserida presente no gene variante de HSD17B13, rs72613567. Consequentemente, são aqui providos ácidos nucleicos isolados compreendendo pelo menos 15 nucleotídeos contíguos (por exemplo, pelo menos 20 nucleotídeos contíguos ou pelo menos 30 nucleotídeos contíguos) que codificam a totalidade ou parte de uma proteína de HSD17B13, em que um segmento dos nucleotídeos contíguos (por exemplo, pelo menos 5
Petição 870190068171, de 18/07/2019, pág. 97/358
84/307 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico a um região dentro da leitura no intron 6 na SEQ ID NO: 9 (transcrição F de HSD17B13) ou uma região que abrange o limite entre a leitura no íntron 6 e o restante do éxon 6 na SEQ ID NO: 9 quando perfeitamente alinhado com a SEQ ID NO: 9. Entende-se que tal ácido nucleico teria um número suficiente de nucleotídeos na leitura para distinguir a leitura de outras características nas transcrições de HSD17B13 (por exemplo, a partir dos limites dos éxons 6 e 7 em outras transcrições de HSD17B13). Opcionalmente, os nucleotídeos contíguos compreendem uma sequência presente na transcrição F (isto é, a timina inserida) que não está presente na transcrição F’ (SEQ ID NO: 246). A transcrição F' também inclui uma leitura do éxon 6 no íntron 6 em comparação com a transcrição A, mas a leitura não inclui a timina inserida presente no gene variante de HSD17B13, rs72613567. Por exemplo, a região pode ser a leitura completa no íntron 6 na SEQ ID NO: 9. Opcionalmente, o ácido nucleico isolado compreende uma sequência de pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico à sequência apresentada na SEQ ID NO: 9 (tanscrição F de HSD17B13) e codifica uma proteína de HSD17B13 compreendendo a sequência apresentada na SEQ ID NO: 17 (isoforma F de HSD17B13).
[00173] Como um exemplo, o ácido nucléico isolado pode compreender pelo menos 15 nucleotídeos contíguos (por exemplo, pelo menos 20 nucleotídeos contíguos ou pelo menos 30 nucleotídeos contíguos) da SEQ ID NO: 9 incluindo uma região dentro da leitura no íntron 6 ou uma região que abrange o limite entre a “leitura” {read-through) no íntron 6 e o restante do éxon 6, compreendendo opcionalmente a totalidade da “leitura” no íntron 6 e, opcionalmente, compreendendo a sequência completa da SEQ ID NO: 9.
Petição 870190068171, de 18/07/2019, pág. 98/358 / 307 [00174] Também são aqui providos ácidos nucléicos isolados compreendendo um segmento (por exemplo, pelo menos 15 nucleotídeos contíguos) presentes na transcrição F' (ou um fragmento ou homólogo da mesma) que não está presente na transcrição A (ou um fragmento ou homólogo da mesma). Tais regiões podem ser prontamente identificadas comparando as sequências das transcrições. A transcrição F’ (SEQ ID NO: 246) inclui uma leitura do éxon 6 no íntron 6 em comparação com a transcrição A, e a leitura não inclui a timina inserida presente no gene variante de HSD17B13, rs72613567. Consequentemente, são aqui providos ácidos nucleicos isolados compreendendo pelo menos 15 nucleotídeos contíguos (por exemplo, pelo menos 20 nucleotídeos contíguos ou pelo menos 30 nucleotídeos contíguos) que codificam a totalidade ou parte de uma proteína de HSD17B13, em que um segmento dos nucleotídeos contíguos (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico a um região dentro da leitura no íntron 6 na SEQ ID NO: 246 (transcrição F' de HSD17B13) ou uma região que abrange o limite entre a leitura no íntron 6 e o restante do éxon 6 na SEQ ID NO: 246 quando perfeitamente alinhado com a SEQ ID NO: 246. Entende-se que tal ácido nucleico teria um número suficiente de nucleotídeos na leitura para distinguir a leitura a partir de outras características nas transcrições de HSD17B13 (por exemplo, a partir dos limites dos éxons 6 e 7 em outras transcrições de HSD17B13). Opcionalmente, os nucleotídeos contíguos compreendem uma sequência presente na transcrição F’ que não está presente na transcrição F (SEQ ID NO: 9). A leitura na transcrição F inclui a timina inserida presente no gene variante de HSD17B13, rs72613567, enquanto a leitura na transcrição F’ não o faz. Por exemplo, a região pode ser a leitura completa no íntron 6 na SEQ ID NO: 246. Opcionalmente, o ácido nucleico isolado
Petição 870190068171, de 18/07/2019, pág. 99/358 / 307 compreende uma sequência de pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%., pelo menos 98%, ou pelo menos 99% idêntico à sequência apresentada na SEQ ID NO: 246 (transcrição F' de HSD17B13) e codifica uma proteína de HSD17B13 compreendendo, consistindo essencialmente em, ou consistindo na sequência apresentada na SEQ ID NO: 247 (isoforma F' de HSD17B13).
[00175] Como um exemplo, o ácido nucleico isolado pode compreender pelo menos 15 nucleotídeos contíguos (por exemplo, pelo menos 20 nucleotídeos contíguos ou pelo menos 30 nucleotídeos contíguos) da SEQ ID NO: 246 incluindo uma região dentro da leitura no íntron 6 ou uma região que abrange a fronteira entre a “leitura” no íntron 6 e o restante do éxon 6, opcionalmente compreendendo a totalidade da “leitura” no íntron 6, e opcionalmente compreendendo toda a sequência da SEQ ID NO: 246.
[00176] Também são aqui providos ácidos nucleicos isolados compreendendo um segmento (por exemplo, pelo menos 15 nucleotídeos contíguos) presentes na transcrição C (ou um fragmento ou homólogo da mesma) que não está presente na transcrição A (ou um fragmento ou homólogo da mesma). Tais regiões podem ser prontamente identificadas comparando as sequências das transcrições. A transcrição C (SEQ ID NO: 6) está ausente do éxon 6 em comparação com a transcrição A (isto é, a transcrição C inclui um limite éxon 5-éxon 7 não presente na transcrição A). Consequentemente, são aqui providos ácidos nucleicos isolados compreendendo pelo menos 15 nucleotídeos contíguos (por exemplo, pelo menos 20 nucleotídeos contíguos ou pelo menos 30 nucleotídeos contíguos) que codificam a totalidade ou parte de uma proteína de HSD17B13, em que um segmento dos nucleotídeos contíguos (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico a uma
Petição 870190068171, de 18/07/2019, pág. 100/358 / 307 região que abrange o limite éxon 5-éxon 7 na SEQ ID NO: 6 (transcrição C de HSD17B13) quando perfeitamente alinhado com a SEQ ID NO: 6. Entendese que esse ácido nucleico teria um número suficiente de nucleotídeos em cada um dos éxons 5 e 7 para se distinguir de outras características nas transcrições de HSD17B13 (por exemplo, do limite dos éxons 5 e 6 ou dos éxons 6 e 7 em outras transcrições de HSD17B13). Por exemplo, a região pode compreender a totalidade dos éxons 5 e 7 na SEQ ID NO: 6. Opcionalmente, o ácido nucleico isolado compreende uma sequência de pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à sequência apresentada na SEQ ID NO: 6 (transcrição C de HSD17B13) e codifica uma proteína de HSD17B13 compreendendo a sequência indicada na SEQ ID NO: 14 (isoforma C de HSD17B13).
[00177] Como um exemplo, o ácido nucleico isolado pode compreender pelo menos 15 nucleotídeos contíguos (por exemplo, pelo menos 20 nucleotídeos contíguos ou pelo menos 30 nucleotídeos contíguos) da SEQ ID NO: 6 incluindo uma região que abrange o limite éxon 5-éxon 7, compreendendo opcionalmente a totalidade dos éxons 5 e 7 na SEQ ID NO: 6, e opcionalmente compreendendo toda a sequência da SEQ ID NO: 6.
(4) Hibridização de Ácidos Nucleicos para cDNAs e Transcrições Variantes de HSD17B13 [00178] Também são providos ácidos nucléicos que hibridizam com segmentos de uma transcrição de RNAm ou um DNAc correspondente a qualquer uma das transcrições A a H (SEQ ID NOS: 4 a 11, respectivamente), e particularmente transcrições C a H, quando perfeitamente alinhados com qualquer uma das transcrições A a H. Exemplos específicos, não limitativos, são providos abaixo. Tais ácidos nucleicos isolados podem ser úteis, por exemplo, iniciadores, sondas, RNA antissentido, siRNAs ou shRNAs.
[00179] O segmento ao qual o ácido nucleico isolado pode hibridizar
Petição 870190068171, de 18/07/2019, pág. 101/358 / 307 pode compreender, por exemplo, pelo menos 5, pelo menos 10, ou pelo menos 15 nucleotídeos contíguos de um ácido nucleico que codifica uma proteína de HSD17B13. O segmento ao qual o ácido nucleico isolado pode hibridizar pode compreender, por exemplo, pelo menos 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 75, 90, 95, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 ou 2000 nucleotídeos contíguos de um ácido nucleico que codifica uma proteína de HSD17B13. Altemativamente, o segmento com o qual o ácido nucleico isolado pode hibridizar pode ser, por exemplo, até 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 75, 90, 95, 100, 200, 300, 400, 500, 600, 700, 800, 900 ou 1000 nucleotídeos contíguos de um ácido nucleico que codifica uma proteína de HSD17B13. Por exemplo, o segmento pode ter cerca de 15 a 100 nucleotídeos de comprimento ou cerca de 15 a 35 nucleotídeos de comprimento.
[00180] A transcrição D (SEQ ID NO: 7), a transcrição G (SEQ ID NO: 10) e a transcrição H (SEQ ID NO: 11) de HSD17B13 incluem uma inserção de uma guanina na extremidade 3' do éxon 6, resultando em um desvio de enquadramento e truncagem prematura do éxon 7 em comparação com a transcrição A. De acordo com isto, são aqui providos ácidos nucleicos isolados compreendendo uma região (por exemplo, pelo menos 15 nucleotídeos contíguos) que hibridiza com um segmento presente nas transcrições D, G e H (ou fragmentos ou homólogos das mesmas) que não estejam presentes na transcrição A (ou um fragmento ou homólogo da mesma). Tais regiões podem ser prontamente identificadas comparando as sequências das transcrições. Por exemplo, são aqui providos ácidos nucleicos isolados que hibridizam com pelo menos 15 nucleotídeos contíguos de um ácido nucleico que codifica uma proteína de HSD17B13, em que nucleotídeos contíguos compreendem um segmento (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) que é pelo menos 90%, pelo menos 95%, pelo
Petição 870190068171, de 18/07/2019, pág. 102/358 / 307 menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica a uma região que abrange o limite éxon 6-éxon 7 na SEQ ID NO: 7 (transcrição D de HSD17B13) quando perfeitamente alinhado com a SEQ ID NO: 7, e o segmento inclui uma guanina em um resíduo correspondente ao resíduo 878 na extremidade 3' do éxon 6 na SEQ ID NO: 7 (isto é, uma inserção de uma guanina na extremidade 3' do éxon 6 em relação à transcrição A além da guanina no início do éxon 7). Altemativamente, são aqui providos ácidos nucleicos isolados que hibridizam com pelo menos 15 nucleotídeos contíguos de um segmento de um ácido nucleico que codifica uma proteína de HSD17B13, em que os nucleotídeos contíguos compreendem um segmento (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica a uma região que abrange o limite éxon 6-éxon 7 na SEQ ID NO: 10 (transcrição G de HSD17B13) quando perfeitamente alinhado com a SEQ ID NO: 10, e o segmento inclui uma guanina em um resíduo correspondente ao resíduo 770 na extremidade 3' do éxon 6 na SEQ ID NO: 10 (isto é, uma inserção de uma guanina na extremidade 3' do éxon 6 em relação à transcrição B além da guanina no início do éxon 7). Altemativamente, são aqui providos ácidos nucleicos isolados compreendendo aqueles que hibridizam com pelo menos 15 nucleotídeos contíguos de um ácido nucleico que codifica uma proteína de HSD17B13, em que os nucleotídeos contíguos compreendem um segmento (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica a uma região que abrange o limite éxon 6-éxon 7 na SEQ ID NO: 11 (transcrição H de HSD17B13) quando perfeitamente alinhado com a SEQ ID NO: 11, e o segmento inclui uma
Petição 870190068171, de 18/07/2019, pág. 103/358
90/307 guanina em um resíduo correspondente ao resíduo 950 na extremidade 3' do éxon 6 na SEQ ID NO: 11 (isto é, uma inserção de uma guanina na extremidade 3' do éxon 6 em relação à transcrição E além da guanina no início do éxon 7). Entende-se que esses ácidos nucleicos seriam concebidos para hibridizar com um número suficiente de nucleotídeos em cada um dos éxons 6 e 7 para distinguir a guanina inserida de outras características nos transcrições de HSD17B13 (por exemplo, da leitura para o íntron 6 na transcrição F ou do éxon 6 eliminado na transcrição C).
[00181] Como um exemplo, o segmento pode compreender uma região da SEQ ID NO: 7 que abrange o limite éxon 6-éxon 7 (isto é, incluindo a guanina no resíduo 878 da SEQ ID NO: 7). Como outro exemplo, o segmento pode compreender uma região da SEQ ID NO: 10 que abrange o limite éxon 6-éxon 7 (isto é, incluindo a guanina no resíduo 770 da SEQ ID NO: 10). Como outro exemplo, o segmento pode compreender uma região da SEQ ID NO: 11 que abrange o limite do éxon 6-éxon 7 (isto é, incluindo a guanina no resíduo 950 da SEQ ID NO: 11).
[00182] Opcionalmente, o ácido nucleico isolado compreende adicionalmente uma região (por exemplo, 15 nucleotídeos contíguos) que hibridiza com um segmento presente na transcrição D (ou um fragmento ou homólogo da mesma) que não está presente na transcrição G (ou um fragmento ou homólogo da mesma), e o ácido nucleico isolado compreende adicionalmente uma região que hibridiza com um segmento presente na transcrição D (ou um fragmento ou homólogo da mesma) que não está presente na transcrição H (ou um fragmento ou homólogo da mesma). Tais segmentos podem ser facilmente identificados comparando as sequências das transcrições. Por exemplo, o segmento (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) presentes na transcrição D (ou um fragmento ou homólogo da mesma) que não está presente na transcrição H (ou um
Petição 870190068171, de 18/07/2019, pág. 104/358
91/307 fragmento ou homólogo da mesma) pode ser pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico a uma região que abrange o limite dos éxons 3 e 4 da SEQ ID NO: 7 (transcrição D de HSD17B13) quando perfeitamente alinhado com a SEQ ID NO: 7 para se distinguir da transcrição H. Da mesma forma, o segmento (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) da transcrição D (ou um fragmento ou homólogo da mesma) que não está presente na transcrição G (ou um fragmento ou homólogo da mesma) pode ser pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98 %, ou pelo menos 99% idêntico a uma região dentro do éxon 2 da SEQ ID NO: 7 (transcrição D de HSD17B13), uma região que abrange o limite éxon 1-éxon 2 da SEQ ID NO: 7, ou uma região que abrange o limite éxon 2-éxon 3 da SEQ ID NO: 7 quando perfeitamente alinhado com a SEQ ID NO: 7 para se distinguir da transcrição G.
[00183] Como a transcrição D, a transcrição H (SEQ ID NO: 11) inclui uma inserção de uma guanina na extremidade 3' do éxon 6 comparada com a transcrição A. A transcrição H inclui adicionalmente um éxon adicional entre os éxons 3 e 4 em comparação com a transcrição A e a transcrição D. Por conseguinte, são aqui providos ácidos nucleicos isolados como descrito acima compreendendo uma região que hibridiza com um segmento presente nas transcrições D, G e H (ou fragmentos ou homólogos das mesmas) que não está presente na transcrição A (ou um fragmento ou homólogo da mesma), mas compreendendo adicionalmente uma região (por exemplo, pelo menos 15 nucleotídeos contíguos) que hibridiza com um segmento que está presente na transcrição H (ou um fragmento ou homólogo da mesma), mas não na transcrição D (ou um fragmento ou homólogo da mesma). Tais regiões podem ser prontamente identificadas comparando as sequências das transcrições. Por exemplo, o segmento pode ser pelo menos 90%, pelo menos 95%, pelo menos
Petição 870190068171, de 18/07/2019, pág. 105/358
92/307
96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico a uma região (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) no éxon 3' da SEQ ID NO: 11 (transcrição H de HSD17B13), uma região que abrange o limite exon 3-éxon 3' da SEQ ID NO: 11, ou uma região que abrange o limite éxon 3’-éxon 4 da SEQ ID NO: 11 quando perfeitamente alinhada com a SEQ ID NO: 11. Entende-se que esse ácido nucleico seria concebido para hibridizar com um número suficiente de nucleotídeos em cada um dos éxons 3 e 3 'ou cada um dos éxons 3' e 4 para se distinguir de outras características nas transcrições de HSD17B13 (por exemplo, do limite dos éxons 3 e 4).
[00184] Como um exemplo, o segmento pode compreender uma região de SEQ ID NO: 11 no éxon 3', que abrange o limite éxon 3-éxon 3', ou que abrange o limite éxon 3'-éxon 4.
[00185] Como a transcrição D, a transcrição G (SEQ ID NO: 10) inclui uma inserção de uma guanina na extremidade 3' do éxon 6 em comparação com a transcrição A. Além disso, no entanto, a transcrição G está ausente do éxon 2 em comparação com a transcrição A e a transcrição D (isto é, a transcrição G inclui um limite éxon 1-éxon 3 não presente nas transcrições A e D). Por conseguinte, são aqui providos ácidos nucleicos isolados como descrito acima compreendendo uma região que hibridiza com um segmento presente nas transcrições D, G e H (ou fragmentos ou homólogos das mesmas) que não está presente na transcrição A (ou um fragmento ou homólogo da mesma) compreendendo adicionalmente uma região (por exemplo, pelo menos 15 nucleotídeos contíguos) que hibridiza com um segmento presente na transcrição G (ou um fragmento ou homólogo da mesma), mas não na transcrição D (ou um fragmento ou homólogo da mesma). Tais regiões podem ser prontamente identificadas comparando as sequências das transcrições. Por exemplo, o segmento pode ser pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%,
Petição 870190068171, de 18/07/2019, pág. 106/358 / 307 pelo menos 99%, ou 100% idêntico a uma região (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) que abrange o limite éxon 1-éxon 3 na SEQ ID NO: 10 (transcrição G de HSD17B13) quando perfeitamente alinhado com a SEQ ID NO: 10. Entende-se que tal ácido nucleico seria concebido para hibridizar com um número suficiente de nucleotídeos em cada um dos éxons 1 e 3 para se distinguir de outras características nas transcrições de HSD17B13 (por exemplo, o limite dos éxons 1 e 2 ou o limite dos éxons 2 e 3).
[00186] Como um exemplo, o segmento pode compreender uma região de SEQ ID NO: 10 que abrange o limite do éxon 1-éxon 3.
[00187] Também são providos ácidos nucléicos isolados compreendendo uma região (por exemplo, pelo menos 15 nucleotídeos contíguos) que hibridiza com um segmento de um ácido nucléico que codifica uma proteína de HSD17B13 que está presente na transcrição E (ou um fragmento ou homólogo da mesma), mas não na transcrição A (ou um fragmento ou homólogo da mesma). Tais regiões podem ser prontamente identificadas comparando as sequências das transcrições. A transcrição E (SEQ ID NO: 8) inclui um éxon adicional entre os éxons 3 e 4 em comparação com a transcrição A. Assim, são aqui providos ácidos nucleicos isolados que hibridizam com pelo menos 15 nucleotídeos contíguos de um ácido nucleico que codifica uma proteína de HSD17B13, em que os nucleotídeos contíguos compreendem um segmento que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico a uma região (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) no éxon 3' da SEQ ID NO: 8 (transcrição E de HSD17B13), uma região que abrange o limite éxon 3-éxon 3' da SEQ ID NO: 8, ou uma região que abrange o limite éxon 3’-éxon 4 da SEQ ID NO: 8 quando perfeitamente alinhada com a SEQ ID NO: 8. Entende-se que esse
Petição 870190068171, de 18/07/2019, pág. 107/358
94/307 ácido nucleico seria concebido para hibridizar com um número suficiente de nucleotídeos em cada um dos éxons 3 e 3' ou cada um dos éxons 3' e 4 para se distinguir de outros recursos nas transcrições de HSD17B13 (por exemplo, a partir dos limites dos éxons 3 e 4).
[00188] Como um exemplo, o segmento pode compreender uma região da SEQ ID NO: 8 dentro do éxon 3', que abrange o limite do éxon 3-éxon 3' da SEQ ID NO: 8, ou que abrange o limite do éxon 3'-éxon 4 .
[00189] Opcionalmente, o ácido nucleico isolado compreende adicionalmente uma região (por exemplo, 15 nucleotídeos contíguos) que hibridiza com um segmento presente na transcrição E (ou um fragmento ou homólogo da mesma) que não está presente na transcrição H (ou um fragmento ou homólogo da mesma). Tais segmentos podem ser facilmente identificados comparando as sequências das transcrições. Por exemplo, o segmento (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) presentes na transcrição E (ou um fragmento ou homólogo da mesma) que não está presente na transcrição H (ou um fragmento ou homólogo da mesma) pode ser pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico a uma região que abrange os limites dos éxons 6 e 7 da SEQ ID NO: 8 (transcrição E de HSD17B13) quando perfeitamente alinhado com a SEQ ID NO: 8 para se distinguir da transcrição G. Entende-se que esse ácido nucleico seria concebido para hibridizar com um número suficiente de nucleotídeos em cada um dos éxons 6 e 7 se distinguir de outras características nas transcrições de HSD17B13 (particularmente a guanina adicional na extremidade 3' do éxon 6 na transcrição H).
[00190] Também são providos ácidos nucléicos isolados compreendendo uma região (por exemplo, pelo menos 15 nucleotídeos contíguos) que hibridiza com um segmento de um ácido nucléico que codifica
Petição 870190068171, de 18/07/2019, pág. 108/358 / 307 uma proteína de HSD17B13 que está presente na transcrição F (ou um fragmento ou homólogo da mesma), mas não na transcrição A (ou um fragmento ou homólogo da mesma). Tais regiões podem ser prontamente identificadas comparando as sequências das transcrições. A transcrição F (SEQ ID NO: 9) inclui uma leitura do éxon 6 para o íntron 6 comparado com a transcrição A. Por conseguinte, são aqui providos ácidos nucleicos isolados que hibridizam com pelo menos 15 nucleotídeos contíguos de um ácido nucleico que codifica uma proteína de HSD17B13, em que os nucleotídeos contíguos compreendem um segmento (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica a uma região dentro da leitura no íntron 6 na SEQ ID NO: 9 (transcrição F de HSD17B13) ou uma região que abrange o limite entre a leitura no íntron 6 e o restante do éxon 6 na SEQ ID NO: 9 quando perfeitamente alinhado com a SEQ ID NO: 9. Entende-se que esse ácido nucleico seria concebido para hibridizar com um número suficiente de nucleotídeos na leitura para distinguir a leitura - através de outras funcionalidades das transcrições de HSD17B13 (por exemplo, do limite dos éxons 6 e 7 em outras transcrições de HSD17B13). Opcionalmente, os nucleotídeos contíguos compreendem uma sequência presente na transcrição F (isto é, a timina inserida) que não está presente na transcrição F’ (SEQ ID NO: 246). A transcrição F' também inclui uma leitura do éxon 6 no íntron 6 em comparação com a transcrição A, mas a leitura não inclui a timina inserida presente no gene variante de HSD17B13, rs72613567.
[00191] Como um exemplo, o segmento pode compreender uma região de SEQ ID NO: 9 dentro da leitura no íntron 6 ou que abrange o limite entre a leitura no íntron 6 e o restante do éxon 6.
[00192] Também são providos ácidos nucléicos isolados
Petição 870190068171, de 18/07/2019, pág. 109/358 / 307 compreendendo uma região (por exemplo, pelo menos 15 nucleotídeos contíguos) que hibridiza com um segmento de um ácido nucléico que codifica uma proteína de HSD17B13 que está presente na transcrição F' (ou um fragmento ou homólogo da mesma), mas não na transcrição A (ou um fragmento ou homólogo da mesma). Tais regiões podem ser prontamente identificadas comparando as sequências das transcrições. A transcrição F' (SEQ ID NO: 246) inclui uma leitura do éxon 6 para o íntron 6 comparado com a transcrição A. Por conseguinte, são aqui providos ácidos nucleicos isolados que hibridizam com pelo menos 15 nucleotídeos contíguos de um ácido nucleico que codifica uma proteína de HSD17B13, em que os nucleotídeos contíguos compreendem um segmento (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) que pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico a uma região dentro da leitura no íntron 6 na SEQ ID NO: 246 (transcrição F' de HSD17B13) ou uma região que abrange o limite entre a leitura em o íntron 6 e o restante do éxon 6 na SEQ ID NO: 246 quando perfeitamente alinhado com a SEQ ID NO: 246. Entende-se que esse ácido nucleico seria concebido para hibridizar com um número suficiente de nucleotídeos na leitura para distinguir a leitura de outros recursos das transcrições de HSD17B13 (por exemplo, a partir do limite dos éxons 6 e 7 em outras transcrições de HSD17B13). Opcionalmente, os nucleotídeos contíguos compreendem uma sequência presente na transcrição F’ que não está presente na transcrição F (SEQ ID NO: 9). A leitura na transcrição F inclui a timina inserida presente no gene variante de HSD17B13, rs72613567, enquanto a leitura na transcrição F’ não o faz.
[00193] Como um exemplo, o segmento pode compreender uma região de SEQ ID NO: 246 dentro da leitura no íntron 6 ou que abrange o limite entre a leitura no íintron 6 e o restante do éxon 6.
Petição 870190068171, de 18/07/2019, pág. 110/358 / 307 [00194] Também são providos ácidos nucléicos isolados compreendendo uma região (por exemplo, pelo menos 15 nucleotídeos contíguos) que hibridiza com um segmento de um ácido nucléico que codifica uma proteína de HSD17B13 que está presente na transcrição C (ou um fragmento ou homólogo da mesma), mas não na transcrição A (ou um fragmento ou homólogo da mesma). Tais regiões podem ser prontamente identificadas comparando as sequências das transcrições. A transcrição C (SEQ ID NO: 6) está ausente do éxon 6 em comparação com a transcrição A (isto é, a transcrição C inclui um limite éxon 5-éxon 7 não presente na transcrição A). Por conseguinte, são aqui providos ácidos nucleicos isolados que hibridizam com pelo menos 15 nucleotídeos contíguos de um ácido nucleico que codifica uma proteína de HSD17B13, em que os nucleotídeos contíguos compreendem um segmento (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica a uma região que abrange o limite do éxon 5-éxon 7 na SEQ ID NO: 6 (transcrição C de HSD17B13) quando perfeitamente alinhado com a SEQ ID NO: 6. Entende-se que esse ácido nucleico seria concebido para hibridizar com um número suficiente de nucleotídeos nos éxons 5 e 7 para se distinguir de outras características nas transcrições de HSD17B13 (por exemplo, dos limites dos éxons 5 e 6 ou dos éxons 6 e 7 em outras transcrições de HSD17B13).
[00195] Como um exemplo, o segmento pode compreender uma região da SEQ ID NO: 6 que abrange o limite do éxon 5-éxon 7.
[00196] Também são aqui providos ácidos nucléicos isolados (por exemplo, RNAs antissentido, siRNAs ou shRNAs) que hibridizam com pelo menos 15 nucleotídeos contíguos de um ácido nucléico que codifica uma proteína de HSD17B13, em que nucleotídeos contíguos compreendem um
Petição 870190068171, de 18/07/2019, pág. 111/358 / 307 segmento (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico a uma região de transcrição D de HSD17B13 (SEQ ID NO: 7). Os ácidos nucleicos isolados podem compreender uma região (por exemplo, pelo menos 15 nucleotídeos contíguos) que hibridiza com um segmento presente na transcrição D (ou fragmentos ou homólogos da mesma) que não está presente na transcrição A (ou um fragmento ou homólogo da mesma). Tais regiões podem ser prontamente identificadas comparando as sequências das transcrições. A transcrição D de HSD17B13 (SEQ ID NO: 7) inclui uma inserção de uma guanina na extremidade 3' do éxon 6, resultando em um desvio de enquadramento e truncagem prematura do éxon 7 em comparação com a transcrição A (SEQ ID NO: 4). Por exemplo, são aqui providos ácidos nucleicos isolados que hibridizam com pelo menos 15 nucleotídeos contíguos de um ácido nucleico que codifica uma proteína de HSD17B13, em que nucleotídeos contíguos compreendem um segmento (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico a uma região que abrange o limite éxon 6-éxon 7 na SEQ ID NO: 7 (transcrição D de HSD17B13) quando perfeitamente alinhado com a SEQ ID NO: 7. O segmento pode incluir uma guanina em um resíduo correspondente ao resíduo 878 na extremidade 3' do éxon 6 na SEQ ID NO: 7 (isto é, uma inserção de uma guanina na extremidade 3' do éxon 6 em relação à transcrição A além da guanina no início do éxon 7). Entende-se que esses ácidos nucleicos seriam concebidos para hibridizar com um número suficiente de nucleotídeos em cada um dos éxons 6 e 7 para distinguir a guanina inserida de outras características nas transcrições de HSD17B13 (por exemplo, da
Petição 870190068171, de 18/07/2019, pág. 112/358 / 307 leitura para o íntron 6 na transcrição F ou do éxon 6 eliminado na transcrição
C).
[00197] Também são aqui providos ácidos nucléicos isolados (por exemplo, RNAs antissentido, siRNAs ou shRNAs) que hibridizam com pelo menos 15 nucleotídeos contíguos de um ácido nucléico que codifica uma proteína de HSD17B13, em que nucleotídeos contíguos compreendem um segmento (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico a uma região de transcrição A de HSD17B13 (SEQ ID NO: 4). Os ácidos nucleicos isolados podem compreender uma região (por exemplo, pelo menos 15 nucleotídeos contíguos) que hibridiza com um segmento presente na transcrição A (ou fragmentos ou homólogos da mesma) que não está presente na transcrição D (ou um fragmento ou homólogo da mesma). Tais regiões podem ser prontamente identificadas comparando as sequências das transcrições. A transcrição D de HSD17B13 (SEQ ID NO: 7) inclui uma inserção de uma guanina na extremidade 3' do éxon 6, resultando em um desvio de enquadramento e truncagem prematura do éxon 7 em comparação com a transcrição A (SEQ ID NO: 4). Por exemplo, são aqui providos ácidos nucleicos isolados que hibridizam com pelo menos 15 nucleotídeos contíguos de um ácido nucleico que codifica uma proteína de HSD17B13, em que nucleotídeos contíguos compreendem um segmento (por exemplo, pelo menos 5 nucleotídeos contíguos, pelo menos 10 nucleotídeos contíguos ou pelo menos 15 nucleotídeos contíguos) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico a uma região que abrange o limite éxon 6-éxon 7 na SEQ ID NO: 4 (transcrição A de HSD17B13) quando perfeitamente alinhado com a SEQ ID NO: 4.
Petição 870190068171, de 18/07/2019, pág. 113/358
100 / 307 (5) Vetores [00198] Também são providos vetores compreendendo qualquer um dos ácidos nucleicos aqui divulgados e um ácido nucleico heterólogo. Os vetores podem ser vetores virais ou não virais capazes de transportar um ácido nucleico. Em alguns casos, um vetor pode ser um plasmídeo (por exemplo, um DNA de cadeia dupla circular no qual segmentos de DNA adicionais podem ser ligados). Em alguns casos, um vetor pode ser um vetor viral, em que segmentos de DNA adicionais podem ser ligados ao genoma viral. Em alguns casos, um vetor pode se replicar autonomamente em uma célula hospedeira na qual é introduzido (por exemplo, vetores bacterianos tendo uma origem bacteriana de replicação e vetores epissômicos de mamíferos). Em outros casos, os vetores (por exemplo, vetores de mamíferos não epissômicos) podem ser integrados no genoma de uma célula hospedeira após introdução na célula hospedeira e, assim, são replicados juntamente com o genoma do hospedeiro. Além disso, certos vetores podem direcionar a expressão de genes aos quais estão operativamente ligados. Tais vetores podem ser referidos como “vetores de expressão recombinantes” ou “vetores de expressão”. Estes vetores podem também ser vetores de direcionamento (isto é, sequências de doador exógeno) como revelado em outro local aqui.
[00199] Em alguns casos, as proteínas codificadas pelas variantes genéticas divulgadas são expressas inserindo ácidos nucleicos que codificam as variantes genéticas divulgadas em vetores de expressão, de tal modo que os genes são operativamente ligados às sequências de controle de expressão necessárias, tais como sequências de controle transcricional e translational. Os vetores de expressão podem incluir, por exemplo, plasmídeos, retrovirus, adenovirus, vírus adeno-associados (AAV), vírus de plantas, tais como vírus do mosaico da couve-flor, vírus do mosaico do tabaco, cosmídios, YACs, epissomas derivados do EBV e semelhantes. Em alguns casos, os ácidos nucleicos compreendendo as variantes genéticas descritas podem ser ligados a
Petição 870190068171, de 18/07/2019, pág. 114/358
101/307 um vetor de tal modo que as sequências de controle de transcrição e translação dentro do vetor servem a sua função pretendida de regulação da transcrição e translação da variante genética. O vetor de expressão e as sequências de controle de expressão são escolhidos para serem compatíveis com a célula hospedeira de expressão utilizada. Sequências de ácido nucleico compreendendo as variantes genéticas descritas podem ser inseridas em vetores separados ou no mesmo vetor de expressão. Uma sequência de ácido nucleico compreendendo as variantes genéticas divulgadas pode ser inserida no vetor de expressão através de métodos padrão (por exemplo, ligação de locais de restrição complementares no ácido nucleico compreendendo as variantes genéticas e vetor divulgados, ou ligação de extremidades arredondadas se não estiverem presentes locais de restrição).
[00200] Além de uma sequência de ácido nucleico compreendendo as variantes genéticas divulgadas, os vetores de expressão recombinantes podem transportar sequências reguladoras que controlam a expressão da variante genética em uma célula hospedeira. A concepção do vetor de expressão, incluindo a seleção de sequências reguladoras, pode depender de fatores, tais como a escolha da célula hospedeira a ser transformada, o nível de expressão da proteína desejada e assim por diante. Sequências reguladoras preferidas para expressão de células hospedeiras de mamífero podem incluir, por exemplo, elementos virais que dirigem níveis elevados de expressão de proteínas em células de mamífero, tais como promotores e/ou potenciadores derivados de LTR retrovirais, citomegalovírus (CMV) (tal como o promotor/potenciador de CMV), Virus Simian 40 (SV40) (tal como o promotor/potenciador SV40), adenovirus (por exemplo, o principal promotor tardio de adenovirus (AdMLP)), polioma e promotores de mamífero fortes, tais como imunoglobulina nativa e promotores de actina. Uma descrição adicional dos elementos reguladores virais, e suas sequências, é provida nas patentes No. US 5.168.062; 4.510.245; e 4.968.615, cada uma das quais é
Petição 870190068171, de 18/07/2019, pág. 115/358
102 / 307 aqui incorporada por referência na sua totalidade para todos os efeitos. Métodos de expressão de polipeptídeos em células bacterianas ou células fúngicas (por exemplo, células de levedura) são também bem conhecidos. [00201] Além de uma sequência de ácido nucleico compreendendo as variantes genéticas divulgadas e sequências reguladoras, os vetores de expressão recombinantes podem transportar sequências adicionais, tais como sequências que regulam a replicação do vetor em células hospedeiras (por exemplo, origens de replicação) e genes marcadores selecionáveis. Um gene marcador selecionável pode facilitar a seleção de células hospedeiras nas quais o vetor foi introduzido (ver, por exemplo, as patentes US 4.399.216, 4.634.665 e 5.179.017, cada uma das quais é aqui incorporada por referência na sua totalidade para todos os efeitos). Por exemplo, um gene marcador selecionável pode conferir resistência a fármacos, tais como G418, higromicina ou metotrexato, em uma célula hospedeira na qual o vetor foi introduzido. Os genes marcadores selecionáveis exemplificativos incluem o gene da di-hidrofolato reductase (DHFR) (para utilização em células hospedeiras dhfr com seleção/amplificação com metotrexato), o gene neo (para selecção com G418) e o gene da glutamato sintetase (GS).
B. Proteínas [00202] São aqui divulgadas proteínas de HSD17B13 isoladas e fragmentos das mesmas, e particularmente proteínas de HSD17B13 e fragmentos das mesmas produzidos pela variante de HSD17B13, rs72613567. [00203] As proteínas isoladas aqui divulgadas podem compreender uma sequência de aminoácidos de uma proteína de HSD17B13 de ocorrência natural, ou podem compreender uma sequência de ocorrência não natural. Em um exemplo, a sequência que não ocorre naturalmente pode diferir da sequência que não ocorre naturalmente devido a substituições conservativas de aminoácidos. Por exemplo, a sequência pode ser idêntica com a exceção de substituições conservativas de aminoácidos.
Petição 870190068171, de 18/07/2019, pág. 116/358
103 / 307 [00204] As proteínas isoladas aqui divulgadas podem ser ligadas ou fundidas a polipeptídeos heterólogos ou a moléculas ou marcadores heterólogos, numerosos exemplos os quais são aqui divulgados em outra parte. Por exemplo, as proteínas podem ser fundidas a um polipeptídeo heterólogo proporcionando estabilidade aumentada ou diminuída. O domínio fundido ou polipeptídeo heterólogo pode estar localizado no terminal N, no terminal C ou intemamente na proteína. Um parceiro de fusão pode, por exemplo, auxiliar no fornecimento de epítopos T auxiliares (um parceiro de fusão imunológico), ou pode auxiliar na expressão da proteína (um intensificador de expressão) com rendimentos mais elevados do que a proteína recombinante nativa. Certos parceiros de fusão são parceiros de fusão tanto imunológicos quanto de expressão. Outros parceiros de fusão podem ser selecionados de modo a aumentar a solubilidade do polipeptídeo ou para permitir que o polipeptídeo seja direcionado para os compartimentos intracelulares desejados. Ainda outros parceiros de fusão incluem etiquetas de afinidade, que facilitam a purificação do polipeptídeo.
[00205] Uma proteína de fusão pode ser diretamente fundida com a molécula heteróloga ou pode estar ligada à molécula heteróloga através de um ligante, tal como um ligante peptídico. Sequências de ligantes peptídicos adequadas podem ser escolhidas, por exemplo, com base nos seguintes fatores: (1) a sua capacidade para adotar uma conformação estendida flexível;
(2) a sua incapacidade de adoptar uma estrutura secundária que pudesse interagir com epítopos funcionais no primeiro e segundo polipeptídeos; e (3) a falta de resíduos hidrofóbicos ou carregados que possam reagir com os epítopos funcionais polipeptídicos. Por exemplo, as sequências de ligantes peptídicas podem conter resíduos Gly, Asn e Ser. Outros aminoácidos próximos do neutro, tais como Thr e Ala, podem também ser utilizados na sequência de ligação. As sequências de aminoácidos que podem ser utilmente utilizadas como ligantes incluem as descritas em Maratea et al. (1985) Gene
Petição 870190068171, de 18/07/2019, pág. 117/358
104 / 307
40: 39 a 46; Murphy et al. (1986) Proc. Natl. Acad. Sci. USA 83: 8258 a 8262; Patente No. US 4.935.233; e Patente No. US 4.751.180, cada um dos quais é aqui incorporado por referência na sua totalidade. Uma sequência de ligação pode geralmente ser, por exemplo, de 1 a cerca de 50 aminoácidos de comprimento. As sequências de ligação não são geralmente requeridas quando o primeiro e o segundo polipeptídeos têm regiões de aminoácidos N terminais não essenciais que podem ser utilizadas para separar os domínios funcionais e prevenir interferências estéricas.
[00206] As proteínas também podem estar operativamente ligadas a um domínio de penetração celular. Por exemplo, o domínio de penetração celular pode ser derivado da proteína HIV-1 TAT, o motivo de penetração de células TLM do vírus da hepatite B humano, MPG, Pep-1, VP22, um peptídeo de penetração celular do vírus Herpes simplex, ou uma sequência peptídica de poliarginina. Ver, por exemplo, WO 2014/089290, aqui incorporado por referência na sua totalidade para todos os efeitos. O domínio de penetração celular pode estar localizado no terminal N, no terminal C ou em qualquer parte da proteína.
[00207] As proteínas também podem ser operativamente ligadas a um polipeptídeo heterólogo para facilidade de rastreamento ou purificação, tal como uma proteína fluorescente, uma etiqueta de purificação ou uma etiqueta epitópica. Exemplos de proteínas fluorescentes incluem proteínas fluorescentes verdes (por exemplo, GFP, GFP-2, tagGFP, turboGFP, eGFP, Esmeralda, Azami Green, Monomérico Azami Verde, CopGFP, AceGFP, ZsGreenl), proteínas fluorescentes amarelas (por exemplo, YFP, eYFP, Citrine, Venus, YPet, PhiYFP, ZsYellowl), proteínas fluorescentes azuis (por exemplo, eBFP, eBFP2, Azurite, mKalamal, GFPuv, safira, T-safira), proteínas fluorescentes ciano (por exemplo, eCFP, Cerulean, CyPet, AmCyanl, Midoriishi-Cyan), proteínas fluorescentes vermelhas (por exemplo, mKate, mKate2, mPlum, monômero DsRed, mCherry, mRFPl, DsRed
Petição 870190068171, de 18/07/2019, pág. 118/358
105 / 307
Express, DsRed2, DsRed-Monômero, HcRed-Tandem, HcRedl, AsRed2, eqFPóll, mRaspberry, mStrawberry, Jred), proteínas fluorescente laranja (por exemplo, mOrange, mKO, Kusabira-Laranja, Monomérica Kusabira-Laranja, mTangerina, tdTomato), e qualquer outra proteína fluorescente adequada. Exemplos de etiquetas incluem glutationa-S-transferase (GST), proteína de ligação à quitina (CBP), proteína de ligação a maltose, tiorredoxina (TRX), poli(NANP), etiqueta de purificaçãoo por afinidade em tandem (TAP), myc, AcV5, AU1, AU5, E, ECS, E2, BANDEIRA, hemaglutinina (HA), nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, Sl, T7, V5, VSV-G, histidina (His), proteína transportadora de biotina carboxila (BCCP) e calmodulina.
[00208] As proteínas isoladas aqui também podem compreender aminoácidos não naturais ou modificados ou análogos peptídicos. Por exemplo, existem numerosos D-aminoácidos ou aminoácidos que têm um substituinte funcional diferente dos aminoácidos que ocorrem naturalmente. Os isômeros estereos opostos de peptídeos de ocorrência natural são divulgados, bem como os isômeros estereos de análogos de peptídeos. Estes aminoácidos podem ser facilmente incorporados em cadeias polipeptídicas por carregamento de moléculas de RNAt com o aminoácido de escolha e construtos genéticos de engenharia que utilizam, por exemplo, códons âmbares, para inserir o aminoácido análogo em uma cadeia peptídica de um modo específico do local (Thorson et al. (1991) Methods Molec Biol 77: 43 a 73, Zoller (1992) Current Opinion in Biotechnology 3: 348 a 354, Ibba, (1995) Biotechnology & Genetic Engineering Reviews 13: 197 a 216, Cahill et al. (1989) TIBS 14 (10): 400 a 403; Benner (1993) TIB Tech 12: 158 a 163 e Ibba e Hennecke (1994) Biotechnology 12: 678 a 682, cada um dos quais aqui incorporado por referência na sua totalidade para todos os efeitos).
[00209] Podem ser produzidas moléculas que se assemelham a peptídeos, mas que não estão ligadas através de uma ligação peptídica natural.
Petição 870190068171, de 18/07/2019, pág. 119/358
106 / 307
Por exemplo, ligações para aminoácidos ou análogos de aminoácidos podem incluir CH2NH-, -CH2S-, -CH2-, -CH=CH- (cis e trans), -COCH2-, CH(OH)CH2- e -CHH2SO- (ver, por exemplo, Spatola, AF em Chemistry and biochemistry of amino acids, peptides, and proteins, B. Weinstein, eds., Marcel Dekker, Nova Iorque, P. 267 (1983), Spatola, AF, Vega Data (Março 1983), Vol. 1, Issue 3, Peptide backbone modifications (revisão geral), Morley (1994) Trends Pharm Sei 15 (12): 463 a 468; Hudson et al. (1979) Int J Pept Prot Res 14: 177 a 185, Spatola et al. (1986) Life Sei 38: 1243 a 1249, Hann (1982) Chem, Soc Perkin Trans I, 307 a 314, Almquist et al. (1980) J. Med. Chem 23: 1392 a 1398, Jennings-White et al. (1982) Tetrahedron Lett 23: 2533); Szelke et al. European Appln, EP 45665 CA (1982): 97: 39405 (1982); Holladay et al. (1983) Tetrahedron. Lett 24: 4401 a 4404; e Hruby (1982) Life Sei 31: 189 a 199; cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos. Análogos peptídicos podem ter mais de um átomo entre os átomos de ligação, tais como b-alanina, ácido gama-butírico e semelhantes.
[00210] Os análogos de aminoácidos e análogos de peptídeos têm frequentemente propriedades aumentadas ou desejáveis, tais como produção mais econômica, maior estabilidade química, propriedades farmacológicas melhoradas (meia vida, absorção, potência, eficácia, etc.), especificidade alterada (por exemplo, um amplo espectro de atividades biológicas), antigenicidade reduzida e outras propriedades desejáveis.
[00211] Os D-aminoácidos podem ser usados para gerar peptídeos mais estáveis porque os D-aminoácidos não são reconhecidos pelas peptidases e similares. A substituição sistemática de um ou mais aminoácidos de uma sequência de consenso com um D-aminoácido do mesmo tipo (por exemplo, D-lisina em vez de L-lisina) pode ser utilizada para gerar peptídeos mais estáveis. Os resíduos de cisteína podem ser utilizados para ciclizar ou ligar dois ou mais peptídeos juntos. Isto pode ser benéfico para restringir peptídeos
Petição 870190068171, de 18/07/2019, pág. 120/358
107 / 307 em conformações particulares (ver, por exemplo, Rizo e Gierasch (1992) Ann. Rev. Biochem. 61: 387, aqui por referência na sua totalidade para todos os efeitos).
[00212] Também são divulgados aqui ácidos nucleicos que codificam qualquer uma das proteínas divulgadas aqui. Isto inclui todas as sequências degeneradas relacionadas com uma sequência polipeptídica específica (isto é, todos os ácidos nucleicos que possuiem uma sequência que codifica uma sequência polipeptídica particular, bem como todos os ácidos nucleicos, incluindo ácidos nucleicos degenerados, que codificam as variantes e derivados divulgados das sequências proteicas). Assim, embora cada sequência particular de ácido nucleico possa não estar escrita aqui, cada uma e todas as sequências são de fato divulgadas e aqui descritas através das sequências polipeptídicas reveladas.
[00213] Também são aqui divulgadas composições compreendendo um polipeptídeo isolado ou proteína aqui descrita e um veículo aumentando a estabilidade do polipeptídeo isolado. Exemplos não limitativos de tais veículos incluem microsferas de poli(ácido láctico) (PLA), microsferas de poli(ácido D,L-láctico-coglicólico) (PLGA), lipossomas, micelas, micelas inversas, cocleatos lipídicos e microtúbulos lipídicos.
(1) Proteínas e Fragmentos de HSD17B13 [00214] São aqui divulgadas proteínas de HSD17B13 isoladas e fragmentos das mesmas, particularmente proteínas de HSD17B13 e fragmentos das mesmas produzidos pela variante de HSD17B13, rs72613567, ou particularmente as isoformas C, D, E, F, F', G e H de HSD17B13. Tais proteínas podem incluir, por exemplo, um polipeptídeo isolado compreendendo pelo menos 5, 6, 8, 10, 12, 14, 15, 16, 18, 20, 22, 24, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 150, 200, 250, ou 300 aminoácidos contíguos das isoformas C, D, E, F, F', G ou H de HSD17B13 ou um fragmento das mesmas. Entende-se que as sequências de genes dentro de uma
Petição 870190068171, de 18/07/2019, pág. 121/358
108 / 307 população e proteínas codificadas por tais genes podem variar devido a polimorfismos, tais como polimorfismos de nucleotídeo único. As sequências aqui providas para cada isoforma de HSD17B13 são apenas sequências exemplificativas. Outras sequências também são possíveis. Por exemplo, o polipeptideo isolado compreende uma sequência de aminoácidos (por exemplo, uma sequência de aminoácidos contíguos) pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99% ou 100% idêntica às isoformas C, D, E, F, F', G ou H de HSD17B13 quando perfeitamente alinhada com as isoformas C, D, E, F, F', G ou H, respectivamente. Opcionalmente, o polipeptideo isolado compreende uma sequência idêntica à isoforma C, D, E, F, F’, G ou H de HSD17B13.
[00215] Como um exemplo, o polipeptideo isolado pode compreender um segmento (por exemplo, pelo menos 8 aminoácidos contíguos) que está presente nas isoformas D, G, e H (ou fragmentos ou homólogos das mesmas) que não está presente na isoforma A (ou um fragmento ou homólogo da mesma). Tais regiões podem ser facilmente identificadas comparando as sequências das isoformas. A região codificada pelo éxon 7 nas isoformas D, G e H é enquadrada e truncada em comparação com a região codificada pelo éxon 7 na isoforma A. Assim, esse polipeptideo isolado pode compreender pelo menos 5, 6, 8, 10, 12, 14, 15, 16, 18, 20, 22, 24, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 150, ou 200 aminoácidos contíguos de uma proteína de HSD17B13 (por exemplo, pelo menos 8 aminoácidos contíguos, pelo menos 10 aminoácidos contíguos, ou pelo menos 15 aminoácidos contíguos de uma proteína de HSD17B13), em que um segmento dos aminoácidos contíguos (por exemplo, pelo menos 3 aminoácidos contíguos, pelo menos 5 aminoácidos contíguos, pelo menos 8 aminoácidos contíguos, pelo menos 10 aminoácidos contíguos, ou pelo menos 15 aminoácidos contíguos) é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico a um segmento incluindo pelo
Petição 870190068171, de 18/07/2019, pág. 122/358
109 / 307 menos uma porção da região codificada pelo éxon 7 na SEQ ID NO: 15 (isoforma D de HSD17B13), SEQ ID NO: 18 (isoforma G de HSD17B13) ou SEQ ID NO: 19 (isoforma H de HSD17B13) quando o polipeptídeo isolado está perfeitamente alinhado com as SEQ ID NOs: 15, 18 ou 19, respectivamente.
[00216] Estes polipeptídeos isolados podem compreender adicionalmente um segmento presente na isoforma D (ou um fragmento ou homólogo da mesma) que não está presente na isoforma G (ou um fragmento ou homólogo da mesma), e pode compreender adicionalmente um segmento presente na isoforma D (ou um fragmento ou homólogo da mesma) que não está presente na isoforma H (ou um fragmento ou homólogo da mesma). Tais regiões podem ser facilmente identificadas comparando as sequências das isoformas. Por exemplo, tais polipeptídeos isolados podem compreender um segmento dos aminoácidos contíguos (por exemplo, pelo menos 3 aminoácidos contíguos, pelo menos 5 aminoácidos contíguos, pelo menos 8 aminoácidos contíguos, pelo menos 10 aminoácidos contíguos, ou pelo menos 15 aminoácidos contíguos) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico a um segmento que abrange o limite das regiões codificadas pelos éxons 3 e 4 da SEQ ID NO: 15 (isoforma D de HSD17B13) quando perfeitamente alinhado com a SEQ ID NO: 15 para se distinguir da isoforma H. Do mesmo modo, tais polipeptídeos isolados podem compreender um segmento dos aminoácidos contíguos (por exemplo, pelo menos 3 aminoácidos contíguos, , pelo menos 5 aminoácidos contíguos, pelo menos 8 aminoácidos contíguos, pelo menos 10 aminoácidos contíguos, ou pelo menos 15 aminoácidos contíguos) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico a um segmento dentro da região codificada pelo éxon 2 na SEQ ID NO: 15 (isoforma D de HSD17B13), um segmento que abrange o limite das regiões codificadas pelos
Petição 870190068171, de 18/07/2019, pág. 123/358
110/307 éxons 1 e 2 na SEQ ID NO: 15, ou um segmento que abrange o limite das regiões codificadas pelos éxons 2 e 3 em SEQ ID NO: 15 quando perfeitamente alinhado com a SEQ ID NO: 15 para se distinguir da isoforma G.
[00217] Como a isoforma D, a região codificada pelo éxon 7 na isoforma H (SEQ ID NO: 19) é deformada e truncada em comparação com a isoforma A. Além disso, no entanto, a isoforma H inclui uma região codificada por um éxon adicional (éxon 3') entre os éxons 3 e 4 em comparação com as isoformas A e D. Consequentemente, tal polipeptídeo isolado pode ser como descrito acima compreendendo um segmento que está presente nas isoformas D, G e H (ou fragmentos ou homólogos das mesmas) que não está presente na isoforma A (ou um fragmento ou homólogo da mesma), mas compreendendo adicionalmente um segmento (por exemplo, pelo menos 8 aminoácidos contíguos) da isoforma H (ou um fragmento ou homólogo da mesma) que não está presente na isoforma D (ou um fragmento ou homólogo da mesma). Tais regiões podem ser facilmente identificadas comparando as sequências das isoformas. Por exemplo, tal polipeptídeo isolado pode compreender adicionalmente um segmento dos aminoácidos contíguos (por exemplo, pelo menos 3 aminoácidos contíguos, pelo menos 5 aminoácidos contíguos, pelo menos 8 aminoácidos contíguos, pelo menos 10 aminoácidos contíguos, ou pelo menos menos 15 aminoácidos contíguos) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico a um segmento incluindo pelo menos uma porção da região codificada pelo éxon 3' na SEQ ID NO: 19 (isoforma H de HSD17B13) quando o polipeptídeo isolado está perfeitamente alinhado com a SEQ ID NO: 19.
[00218] Tal como a isoforma D, a região codificada pelo éxon 7 na isoforma G (SEQ ID NO: 18) é deformada e truncada em comparação com a isoforma A. Além disso, no entanto, a isoforma G não possui a região
Petição 870190068171, de 18/07/2019, pág. 124/358
111/307 codificada pelo éxon 2 em comparação com as isoformas. A e D e, assim, inclui um limite do éxon 1-éxon 3 não presente nas isoformas A e D. Consequentemente, tal polipeptídeo isolado pode ser como descrito acima compreendendo um segmento que está presente nas isoformas D, G e H (ou fragmentos ou homólogos das mesmas) que não está presente na isoforma A (ou um fragmento ou homólogo da mesma), mas compreendendo adicionalmente um segmento (por exemplo, pelo menos 8 aminoácidos contíguos) da isoforma G (ou um fragmento ou homólogo da mesma) que não está presente na isoforma D (ou um fragmento ou homólogo da mesma). Tais regiões podem ser facilmente identificadas comparando as sequências das isoformas. Por exemplo, tal polipeptídeo isolado pode compreender adicionalmente um segmento dos aminoácidos contíguos (por exemplo, pelo menos 3 aminoácidos contíguos, pelo menos 5 aminoácidos contíguos, pelo menos 8 aminoácidos contíguos, pelo menos 10 aminoácidos contíguos, ou pelo menos menos 15 aminoácidos contíguos) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico a um segmento que abrange o limite da regiões codificadas pelos éxons 1 e 3 na SEQ ID NO: 18 (isoforma G de HSD17B13) quando o polipeptídeo isolado está perfeitamente alinhado com a SEQ ID NO: 18.
[00219] São também aqui providos polipeptídeos isolados compreendendo um segmento (por exemplo, pelo menos 8 aminoácidos contíguos) que está presente na isoforma E (ou um fragmento ou homólogo da mesma) que não está presente na isoforma A (ou um fragmento ou homólogo da mesma). A isoforma E inclui uma região codificada por um éxon adicional (éxon 3’) entre os éxons 3 e 4 que não está presente na isoforma A. Estas regiões podem ser prontamente identificadas comparando as sequências das isoformas. Por conseguinte, o polipeptídeo isolado pode compreender pelo menos 5, 6, 8, 10, 12, 14, 15, 16, 18, 20, 22, 24, 25, 30, 35, 40, 45, 50, 60, 70,
Petição 870190068171, de 18/07/2019, pág. 125/358
112/307
80, 90, 100, 150, ou 200 aminoácidos contíguos de uma proteína de HSD17B13 (por exemplo, pelo menos 8 aminoácidos contíguos, pelo menos 10 aminoácidos contíguos, ou pelo menos 15 aminoácidos contíguos de uma proteína de HSD17B13), em que um segmento ds aminoácidos contíguos (por exemplo, pelo menos 3 aminoácidos contíguos, pelo menos 5 aminoácidos contíguos, pelo menos 8 aminoácidos contíguos, pelo menos 10 aminoácidos contíguos, ou pelo menos 15 aminoácidos contíguos) é pelo menos 90%, menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico a um segmento incluindo pelo menos uma porção da região codificada pelo éxon 3' na SEQ ID NO: 16 (isoforma E de HSD17B13) ou SEQ ID NO: 19 (isoforma H de HSD17B13), quando o polipetídeo isolado está perfeitamente alinhado com as SEQ ID NOs: 16 ou 19, respectivamente. Opcionalmente, tal polipeptídeo isolado pode compreender adicionalmente um segmento (por exemplo, pelo menos 8 aminoácidos contíguos) da isoforma E (ou um fragmento ou homólogo da mesma) que não está presente na isoforma H (ou um fragmento ou homólogo da mesma). Tais regiões podem ser facilmente identificadas comparando as sequências das isoformas. Por exemplo, tal polipeptídeo isolado pode compreender adicionalmente um segmento dos aminoácidos contíguos (por exemplo, pelo menos 3 aminoácidos contíguos, pelo menos 5 aminoácidos contíguos, pelo menos 8 aminoácidos contíguos, pelo menos 10 aminoácidos contíguos, ou pelo menos menos 15 aminoácidos contíguos) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico a um segmento que abrange o limite das regiões codificado pelos éxons 6 e 7 na SEQ ID NO: 16 (isoforma E de HSD17B13) quando o polipeptídeo isolado está perfeitamente alinhado com a SEQ ID NO: 16.
[00220] Também é provido um polipeptídeo isolado compreendendo um segmento (por exemplo, pelo menos 8 aminoácidos contíguos) presente na isoforma F (ou um fragmento ou homólogo da mesma) que não está presente
Petição 870190068171, de 18/07/2019, pág. 126/358
113/307 na isoforma A (ou um fragmento ou homólogo da mesma). A isoforma F inclui uma região codificada por leitura do éxon 6 no íntron 6 que não está presente na isoforma A. Essas regiões podem ser facilmente identificadas comparando as sequências das isoformas. Por conseguinte, o polipeptídeo isolado pode compreender pelo menos 5, 6, 8, 10, 12, 14, 15, 16, 18, 20, 22, 24, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 150, ou 200 aminoácidos contíguos de uma proteína de HSD17B13 (por exemplo, pelo menos 8 aminoácidos contíguos, pelo menos 10 aminoácidos contíguos, ou pelo menos 15 aminoácidos contíguos de uma proteína de HSD17B13), em que um segmento dos aminoácidos contíguos (por exemplo, pelo menos 3 aminoácidos contíguos, pelo menos 5 aminoácidos contíguos, pelo menos 8 aminoácidos contíguos, pelo menos 10 aminoácidos contíguos, ou pelo menos 15 aminoácidos contíguos) é pelo menos 90%, menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico a um segmento incluindo pelo menos uma parte da região codificada pela leitura no íntron 6 na SEQ ID NO: 17 (isoforma F de HSD17B13) quando o polipeptídeo isolado está perfetiamente alinhado com a SEQ ID NO: 17.
[00221] Também é provido um polipeptídeo isolado compreendendo um segmento (por exemplo, pelo menos 8 aminoácidos contíguos) presente na isoforma C (ou um fragmento ou homólogo da mesma) que não está presente na isoforma A (ou um fragmento ou homólogo da mesma). A isoforma C está ausente na região codificada pelo éxon 6 em comparação com a isoforma A e inclui um limite éxon 5-éxon 7 não presente na isoforma A. Essas regiões podem ser prontamente identificadas comparando as sequências das isoformas. Por conseguinte, o polipeptídeo isolado pode compreender pelo menos 5, 6, 8, 10, 12, 14, 15, 16, 18, 20, 22, 24, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 150, ou 200 aminoácidos contíguos de uma proteína de HSD17B13 (por exemplo, pelo menos 8 aminoácidos contíguos, pelo menos 10 aminoácidos contíguos, ou pelo menos 15 aminoácidos contíguos de uma
Petição 870190068171, de 18/07/2019, pág. 127/358
114/307 proteína de HSD17B13), em que um segmento dos aminoácidos contíguos (por exemplo, pelo menos 3 aminoácidos contíguos, pelo menos 5 aminoácidos contíguos, pelo menos 8 aminoácidos contíguos, pelo menos 10 aminoácidos contíguos, ou pelo menos 15 aminoácidos contíguos) é pelo menos 90%, menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico a um segmento que abrange os limites das regiões codificadas pelos éxons 5 e 7 na SEQ ID NO: 14 (isoforma C de HSD17B13) quando o polipeptídeo isolado está perfeitamente alinhado com a SEQ ID NO: 14.
[00222] Qualquer um dos polipeptídeos isolados aqui divulgados pode ser ligado a uma molécula heteróloga ou etiqueta heteróloga. Exemplos de tais moléculas ou etiquetas heterólogas são aqui divulgados em outro local. Por exemplo, a molécula heteróloga pode ser um domínio Fe de imunoglobulina, uma etiqueta peptídica como aqui divulgado em outro local, poli(etilenoglicol), ácido polissiálico ou ácido glicólico.
(2) Métodos de produção de proteínas ou fragmentos de HSD17B13 [00223] São também divulgados métodos para produzir qualquer uma das proteínas de HSD17B13 ou fragmentos das mesmas aqui divulgados. Tais proteínas de HSD17B13 ou fragmentos das mesmas podem ser produzidos por qualquer método adequado. Por exemplo, as proteínas de HSD17B13 ou os fragmentos das mesmas podem ser produzidos a partir de células hospedeiras compreendendo ácidos nucleicos (por exemplo, vetores de expressão recombinantes) que codificam tais proteínas de HSD17B13 ou fragmentos das mesmas. Tais métodos podem compreender a cultura de uma célula hospedeira compreendendo um ácido nucleico (por exemplo, vetor de expressão recombinante) que codifica uma proteína de HSD17B13 ou fragmento da mesma, produzindo desse modo a proteína de HSD17B13 ou o fragmento da mesma. O ácido nucleico pode ser operacionalmente ligado a um promotor ativo na célula hospedeira e a cultura pode estar sob condições
Petição 870190068171, de 18/07/2019, pág. 128/358
115/307 em que o ácido nucleico é expresso. Tais métodos podem compreender adicionalmente a recuperação da proteína de HSD17B13 expressa ou fragmento da mesma. A recuperação pode compreender adicionalmente a purificação da proteína de HSD17B13 ou fragmento da mesma.
[00224] Exemplos de sistemas adequados para expressão proteica incluem sistemas de expressão de células bacterianas (por exemplo, Escherichia coli, Lactococcus lactis), sistemas de expressão de células de levedura (por exemplo, Saccharomyces cerevisiae, Pichia pastoris), sistemas de expressão de células de inseto (por exemplo, expressão de proteína mediada por baculovírus) e sistemas de expressão de células de mamíferos.
[00225] Exemplos de ácidos nucléicos que codificam proteínas de HSD17B13 ou fragmentos das mesmas são divulgados em mais detalhe em outro lugar aqui. Opcionalmente, tais ácidos nucleicos são codificados para expressão na célula hospedeira. Opcionalmente, tais ácidos nucleicos estão operativamente ligados a um promotor ativo na célula hospedeira. O promotor pode ser um promotor heterólogo (isto é, um promotor que não é um promotor de HSD17B13 de ocorrência natural). Exemplos de promotores adequados para Escherichia coli incluem os promotores arabinose, lac, tac e T7. Exemplos de promotores adequados para Lactococcus lactis incluem os promotores P170 e nisina. Exemplos de promotores adequados para Saccharomyces cerevisiae incluem promotores constitutivos, tais como promotores de álcool desidrogenase (ADHI) ou enolase (ENO) ou promotores indutíveis, tais como PHO, CUP1, GALI e G10. Exemplos de promotores adequados para Pichia pastoris incluem o promotor da álcool oxidase I (AOX I), o promotor da gliceraldeído 3 fosfato desidrogenase (GAP) e o promotor da formaldeído desidrogenase dependente de glutationa (FLDI). Um exemplo de um promotor adequado para um sistema mediado por baculovírus é o promotor da poliedrina forte viral tardia.
[00226] Opcionalmente, o ácido nucleico codifica ainda uma etiqueta
Petição 870190068171, de 18/07/2019, pág. 129/358
116/307 em quadro com a proteína de HSD17B13 ou fragmento da mesma para facilitar a purificação de proteínas. Exemplos de etiquetas são divulgados em outro local aqui. Tais marcadores podem, por exemplo, ligar-se a um ligando parceiro (por exemplo, imobilizado em uma resina) de tal modo que a proteína marcada pode ser isolada de todas as outras proteínas (por exemplo, proteínas da célula hospedeira). Cromatografia de afinidade, cromatografia líquida de alta eficiência (HPLC) e cromatografia por exclusão de tamanho (SEC) são exemplos de métodos que podem ser usados para melhorar a pureza da proteína expressa.
[00227] Outros métodos também podem ser usados para produzir proteínas de HSD17B13 ou fragmentos das mesmas. Por exemplo, dois ou mais peptídeos ou polipeptídeos podem ser ligados entre si por técnicas de química de proteínas. Por exemplo, peptídeos ou polipeptídeos podem ser quimicamente sintetizados utilizando química Fmoc (9-fluorenilmetiloxi carbonila) ou Boc (terc-butiloxicarbonila). Tais peptídeos ou polipeptídeos podem ser sintetizados por reações químicas padrão. Por exemplo, um peptídeo ou polipeptídeo pode ser sintetizado e não clivado da sua resina de síntese, enquanto o outro fragmento de um peptídeo ou proteína pode ser sintetizado e subsequentemente clivado da resina, expondo desse modo um grupo terminal que é funcionalmente bloqueado no outro fragmento. Por reações de condensação de peptídeos, estes dois fragmentos podem ser ligados covalentemente através de uma ligação peptídica nos seus terminais carboxila e amino, respectivamente (Grant GA (1992) Sunthetic peptides: a user guide. WH Freeman e Co., NY (1992); e Bodansky M e Trost B., Ed. (1993) Principles of Peptide Synthesis. Springer-Verlag Inc., NY, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos). Alternativamente, o peptídeo ou polipeptídeo pode ser independentemente sintetizado in vivo como aqui descrito. Uma vez isolados, estes peptídeos ou polipeptídeos independentes podem ser ligados para formar
Petição 870190068171, de 18/07/2019, pág. 130/358
117/307 um peptídeo ou fragmento deste através de reações de condensação de peptídeo semelhantes.
[00228] Por exemplo, a ligação enzimática de segmentos peptídicos clonados ou sintéticos permite que fragmentos peptídicos relativamente curtos sejam unidos para produzir fragmentos peptídicos maiores, polipeptídeos ou domínios proteicos completos (Abrahmsen L et al. (1991) Biochemistry 30: 4151, aqui incorporados por referência na sua totalidade para todos os efeitos). Alternativamente, a ligação química nativa de peptídeos sintéticos pode ser utilizada para construir sinteticamente peptídeos ou polipeptídeos grandes a partir de fragmentos peptídicos mais curtos. Este método pode consistir em uma reacção química de duas etapas (Dawson et al. (1994) Science 266: 776 a 779, aqui incorporado por referência na sua totalidade para todos os efeitos). A primeira etapa pode ser a reação quimiosseletiva de um peptídeo sintético não protegido - tioéster com outro segmento peptídico desprotegido contendo um resíduo Cys amino-terminal para dar um intermediário ligado a tioéster como o produto covalente inicial. Sem uma alteração nas condições reacionais, este intermediário pode sofrer reação intramolecular espontânea e rápida para formar uma ligação peptídica nativa no local de ligação (Baggiolini et al. (1992) FEBS Lett 307: 97 a 101; ClarkLewis et al. (1994) J Biol Chem 269: 16075, Clark-Lewis et al. (1991) Biochemistry 30: 3128, e Rajarathnam et al. (1994) Biochemistry 33: 6623 a 6630, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos).
[00229] Altemativamente, segmentos peptídicos desprotegidos podem ser quimicamente ligados onde a ligação formada entre os segmentos peptídicos como resultado da ligação química é uma ligação não natural (não peptídica) (Schnolzer et al. (1992) Science 256: 221, aqui incorporada por referência na sua totalidade para todos os efeitos). Esta técnica tem sido utilizada para sintetizar análogos de domínios proteicos, bem como grandes
Petição 870190068171, de 18/07/2019, pág. 131/358
118/307 quantidades de proteínas relativamente puras com atividade biológica completa (deLisle Milton RC et al., Techniques in Protein Chemistry IV. Academic Press, New York, p. 257 a 267 ( 1992), aqui incorporada por referência na sua totalidade para todos os efeitos).
C. Células [00230] Também são providas aqui células (por exemplo, células hospedeiras recombinantes) compreendendo qualquer um dos ácidos nucleicos e proteínas aqui descritas. As células podem ser in vitro, ex vivo ou in vivo. Os ácidos nucleicos podem ser ligados a um promotor e a outras sequências reguladoras, pelo que são expressas para produzir uma proteína codificada. Qualquer tipo de célula é provido.
[00231] A célula pode ser, por exemplo, uma célula totipotente ou uma célula pluripotente (por exemplo, uma célula tronco embrionária (ES), como uma célula ES de roedor, uma célula ES de camundongo ou uma célula ES de rato). Células totipotentes incluem células indiferenciadas que podem dar origem a qualquer tipo de célula, e células pluripotentes incluem células indiferenciadas que possuem a capacidade de se desenvolver em mais de um tipo celular diferenciado. Tais células pluripotentes e/ou totipotentes podem ser, por exemplo, células ES ou células semelhantes a ES, tais como células estaminais pluripotentes induzidas (iPS). As células ES incluem células totipotentes ou pluripotentes derivadas de embriões que são capazes de contribuir para qualquer tecido do embrião em desenvolvimento após a introdução em um embrião. As células ES podem ser derivadas da massa celular interna de um blastocisto e são capazes de se diferenciar em células de qualquer uma das três camadas germinais de vertebrados (endoderme, ectoderme e mesoderme).
[00232] A célula também pode ser uma célula somática primária, ou uma célula que não é uma célula somática primária. As células somáticas podem incluir qualquer célula que não seja gameta, célula germinal,
Petição 870190068171, de 18/07/2019, pág. 132/358
119/307 gametócito ou célula-tronco indiferenciada. A célula também pode ser uma célula primária. As células primárias incluem células ou culturas de células que foram isoladas diretamente de um organismo, órgão ou tecido. As células primárias incluem células que não são transformadas nem imortais. Incluem qualquer célula obtida de um organismo, órgão ou tecido que não tenha passado previamente em cultura de tecidos ou tenha sido previamente passada em cultura de tecidos, mas é incapaz de ser passada indefinidamente em cultura de tecidos. Tais células podem ser isoladas por técnicas convencionais e incluem, por exemplo, células sométicas, células hematopoiéticas, células endoteliais, células epiteliais, fibroblastos, células mesenquimais, queratinócitos, melanócitos, monócitos, células mononucleares, adipócitos, pradipócitos, neurônios, células gliais, hepatócitos, mioblastos esqueléticos e células musculares lisas. Por exemplo, as células primárias podem ser derivadas de tecidos conjuntivos, tecidos musculares, tecidos do sistema nervoso ou tecidos epiteliais.
[00233] Essas células também incluem normalmente não proliferam indefinidamente, mas, devido a mutação ou alteração, evitam a senescência celular normal e, em vez disso, podem continuar a sofrer divisão. Tais mutações ou alterações podem ocorrer naturalmente ou ser intencionalmente induzidas. Exemplos de células imortalizadas incluem células de ovário de hamster chinês (CHO), células de rim embrionário humano (por exemplo, células HEK 293) e células de fibroblasto embrionário de camundongo (por exemplo, células 3T3). Numerosos tipos de células imortalizadas são bem conhecidos. Células imortalizadas ou primárias incluem células que são tipicamente utilizadas para cultivar ou para expressar genes ou proteínas recombinantes.
[00234] A célula também pode ser uma célula diferenciada, tal como uma célula do fígado (por exemplo, uma célula de fígado humana).
[00235] A célula pode ser de qualquer origem. Por exemplo, a célula
Petição 870190068171, de 18/07/2019, pág. 133/358
120/307 pode ser uma célula eucariótica, uma célula animal, uma célula vegetal ou uma célula fúngica (por exemplo, levedura). Tais células podem ser células de peixe ou células de aves, ou tais células podem ser células de mamífero, tais como células humanas, células de mamífero não humano, células de roedor, células de camundongo ou células de rato. Os mamíferos incluem, por exemplo, humanos, primatas não humanos, macacos, símios, cães, gatos, cavalos, touros, veados, bisontes, ovelhas, roedores (por exemplo, camundongos, ratos, hamsters, porquinhos-da-índia), animais domésticos (por exemplo, bovinos, tais como vacas, bois, etc, espécies de ovinos, como ovelhas, cabras, etc, e espécies suínas, como porcos e javalis. Aves incluem, por exemplo, galinhas, perus, avestruzes, gansos, patos, etc. Animais domésticos e animais agrícolas também estão incluídos. O termo “animal não humano” exclui os humanos.
[00236] Para as células de camundongo, o camundongo pode ser de qualquer cepa, incluindo, por exemplo, de uma cepa 129, uma cepa C57BL/6, uma cepa BALB/c, uma cepa Swiss Webster, uma mistura de cepas 129 e C57BL/6, uma mistura de cepas BALB/c e C57BL/6, uma mistura de cepas 129 e BALB/c e uma mistura de cepas BALB/c, C57BL/6 e 129. Por exemplo, um camundongo pode ser pelo menos parcialmente de uma cepa BALB/c (por exemplo, pelo menos cerca de 25%, pelo menos cerca de 50%, pelo menos cerca de 75% derivado de uma cepa BALB/c, ou cerca de 25% 50%, cerca de 75%, ou cerca de 100% derivada de uma cepa BALB/c). Em um exemplo, o camundongo é uma de cepa compreendendo 50% de BALB/c, 25% de C57BL/6 e 25% de 129. Alternativamente, o camundongo compreende uma combinação de cepas ou cepas que exclui BALB/c.
[00237] Exemplos de 129 cepas incluem 129P1, 129P2, 129P3, 129X1, 129S1 (por exemplo, 129S1/SV, 129Sl/Svlm), 129S2, 129S4, 129S5, 129S9/SvEvH, 129S6 (129/SvEvTac), 129S7, 129S8, 129T1 e 129T2. Ver, por exemplo, Eesting et al. (1999) Mamalian Genome 10 (8): 836, aqui
Petição 870190068171, de 18/07/2019, pág. 134/358
121/307 incorporado por referência na sua totalidade para todos os efeitos. Exemplos de cepas C57BL incluem C57BL/A, C57BL/An, C57BL/GrFA, C57BL/Kal_wN, C57BL/6, C57BL/6J, C57BL/6ByJ, C57BL/6NJ,
C57BL/10, C57BL/10ScSn, C57BL/10Cr e C57BL/01a. As células de camundongo também são de uma mistura de uma cepa 129 acima mencionada e uma cepa C57BL/6 acima mencionada (por exemplo, 50% 129 e 50% C57BL/6). Do mesmo modo, as células de camundongo podem ser de uma mistura das cepas 129 acima mencionadas ou de uma mistura das cepas BL/6 acima mencionadas (por exemplo, a cepa 129S6 (129/SvEvTac)).
[00238] Para as células de rato, o rato pode ser qualquer cepa de rato, incluindo, por exemplo, uma cepa de rato ACI, uma cepa de rato Dark Agouti (DA), uma cepa de rato Wistar, uma cepa de rato LEA, uma cepa de rato Sprague Dawley (SD), ou uma cepa de rato Fischer, tal como Fisher F344 ou Fisher F6. Os ratos também podem ser de uma linhagem derivada de uma mistura de duas ou mais linhagens citadas acima. Por exemplo, o rato pode ser de uma cepa DA ou de uma cepa ACL A linhagem de ratos ACI é caracterizada por possuir cutia preta, com barriga e pés brancos e um haplótipo RTlavl. Estas cepas estão disponíveis em uma variedade de fontes, incluindo os Laboratórios Harlan. A cepa de rato Agouti escuro (DA) é caracterizada por ter um revestimento de cutia e um haplótipo RTlavl. Tais ratos estão disponíveis a partir de uma variedade de fontes, incluindo Charles River e Harlan Laboratories. Em alguns casos, os ratos são de uma linhagem de ratos inatos. Ver, por exemplo, US 2014/0235933 Al, aqui incorporado por referência na sua totalidade para todos os efeitos.
III. Métodos de modificação ou alteração da expressão de HSD17B13 [00239] São providos vários métodos para modificar uma célula através da utilização de qualquer combinação de agentes de nuclease, sequências de doador exógeno, ativadores transcricionais, repressores de transcrição, moléculas antissentido, tais como RNA antissentido, siRNA e
Petição 870190068171, de 18/07/2019, pág. 135/358
122 / 307 shRNA, proteínas de HSD17B13 ou fragmentos das mesmas, e vetores de expressão para expressarem um gene HSD17B13 recombinante ou um ácido nucleico que codifica uma proteína de HSD17B13. Os métodos podem ocorrer in vitro, ex vivo ou in vivo. Os agentes de nuclease, sequências de doador exógeno, ativadores da transcrição, repressores de transcrição, moléculas antissentido, como RNA antissentido, siRNA e shRNA, proteínas de HSD17B13 ou fragmentos das mesmas, e vetores de expressão podem ser introduzidos na célula sob qualquer forma e por qualquer meio como descrito em outro lugar aqui, e todos ou alguns podem ser introduzidos simultaneamente ou sequencialmente em qualquer combinação. Alguns métodos envolvem apenas a alteração de um gene HSD17B13 endógeno em uma célula. Alguns métodos envolvem apenas a alteração da expressão de um gene HSD17B13 endógeno através do uso de ativadores ou repressores transcricionais ou através do uso de moléculas antissentido, tais como RNA antissentido, siRNA e shRNA. Alguns métodos envolvem apenas a introdução de um gene HSD17B13 recombinante ou ácido nucleico que codifica uma proteína de HSD17B13 ou um fragmento da mesma em uma célula. Alguns métodos envolvem apenas a introdução de uma proteína de HSD17B13 ou fragmento da mesma em uma célula (por exemplo, qualquer uma ou qualquer combinação das proteínas de HSD17B13 ou fragmentos das mesmas aqui divulgados ou qualquer uma ou qualquer combinação das isoformas A a H de HSD17B13 ou fragmentos das mesmas aqui divulgados). Por exemplo, tais métodos podem envolver a introdução de uma ou mais das isoformas C, D, F, G e H de HSD17B13 (ou fragmentos das mesmas) em uma célula ou a introdução da isoforma D de HSD17B13 (ou um fragmento da mesma) em uma célula. Alternativamente, tais métodos podem envolver a introdução de uma ou mais das isoformas A, B e E ou isoformas A, B, E e F' de HSD17B13 (ou fragmentos das mesmas) em uma célula ou a introdução da isoforma A de HSD17B13 (ou um fragmento da mesma) em uma célula.
Petição 870190068171, de 18/07/2019, pág. 136/358
123/307
Outros métodos podem envolver a alteração de um gene HSD17B13 endógeno em uma célula e a introdução de uma proteína de HSD17B13 ou um fragmento da mesma ou um gene HSD17B13 recombinante ou ácido nucleico que codifica uma proteína de HSD17B13 ou um fragmento da mesma na célula. Ainda outros métodos podem envolver a alteração da expressão de um gene HSD17B13 endógeno em uma célula e a introdução de uma proteína de HSD17B13 ou um fragmento da mesma ou um gene HSD17B13 recombinante ou ácido nucleico que codifica uma proteína de HSD17B13 ou um fragmento da mesma na célula.
A. Métodos de Modificação de Ácidos Nucleicos de HSD17B13 [00240] São providos vários métodos para modificar um gene HSD17B13 em um genoma dentro de uma célula (por exemplo, uma célula pluripotente ou uma célula diferenciada, tal como uma célula de fígado) através da utilização de agentes de nuclease e/ou sequências de doadores exógenos. Os métodos podem ocorrer in vitro, ex vivo ou in vivo. O agente de nuclease pode ser usado sozinho ou em combinação com uma sequência de doador exógeno. Alternativamente, a sequência de doador exógeno pode ser utilizada sozinha ou em combinação com um agente de nuclease.
[00241] O reparo em resposta a quebras de fita dupla (DSBs) ocorre principalmente por meio de duas vias conservadas de reparo de DNA: união de extremidade não homóloga (NHEJ) e recombinação homóloga (HR). Ver Kasparek & Humphrey (2011) Seminars in Cell & Dev. Biol. 22: 886 a 897, aqui incorporado por referência na sua totalidade para todos os efeitos. A NHEJ inclui o reparo de quebras de cadeia dupla em um ácido nucléico por ligação direta das extremidades da quebra a uma outra ou a uma sequência exógena sem a necessidade de um gabarito homólogo. A ligação de sequências não contíguas por NHEJ pode muitas vezes resultar em eliminações, inserções ou translocações perto do local da quebra da fita dupla. [00242] O reparo de um ácido nucleico alvo (por exemplo, um gene
Petição 870190068171, de 18/07/2019, pág. 137/358
124 / 307
HSD17B13) mediado por uma sequência de doador exógeno pode incluir qualquer processo de troca de informação genética entre os dois polinucleotídeos. Por exemplo, o NHEJ pode também resultar na integração direcionada de uma sequência de doador exógeno através da ligação direta das extremidades de quebra com as extremidades da sequência de doador exógeno (isto é, captura baseada em NHEJ). Tal integração direcionada mediada por NHEJ pode ser preferida para inserção de uma sequência de doador exógeno quando as vias de reparação dirigida por homologia (HDR) não são prontamente utilizáveis (por exemplo, em células não divididas, células primárias e células que executam reparação de DNA baseada em homologia). Além disso, em contraste com a reparação dirigida por homologia, o conhecimento sobre grandes regiões de identidade de sequência flanqueando o sítio de clivagem (além das projeções criadas pela clivagem mediada por Cas) não é necessário, o que pode ser benéfico ao tentar a inserção direcionada em organismos que possuem genomas para os quais existe conhecimento limitado da sequência genômica. A integração pode prosseguir através da ligação de extremidades cegas entre a sequência de doador exógeno e a sequência genética clivada, ou através da ligação de extremidades coesivas (isto é, com 5' ou 3' salientes) utilizando uma sequência de doador exógeno que é flanqueada por projeções que sejam compatíveis com aquelas geradas pela proteína Cas na sequência genômica clivada. Ver, por exemplo, US 2011/020722, WO 2014/033644, WO 2014/089290 e Maresca et al. (2013) Genoma Res. 23 (3): 539 a 546, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos. Se as extremidades cegas forem ligadas, a ressecção do alvo e/ou do doador pode ser necessária para regiões de geração de microhomologia necessárias para a junção de fragmentos, o que pode criar alterações indesejadas na sequência alvo.
[00243] O reparo também pode ocorrer via reparo dirigido por
Petição 870190068171, de 18/07/2019, pág. 138/358
125/307 homologia (HDR) ou recombinação homóloga (HR). HDR on HR incluem uma forma de reparo de ácido nucléico que pode exigir homologia de sequências de nucleotídeos, usa uma molécula “doadora” como modelo para o reparo de uma molécula “alvo” (isto é, aquela que sofreu quebra de cadeia dupla) e leva para transferir informações genéticas do doador para o alvo. Sem querer estar vinculado a qualquer teoria em particular, tal transferência pode envolver correção de incompatibilidade de DNA heteroduplex que se forma entre o alvo quebrado e o doador, e/ou recozimento de filamento dependente de síntese, no qual o doador é usado para re-sintetizar a informação genética que irá se tomar parte do alvo e/ou processos relacionados. Em alguns casos, o polinucleotídeo doador, uma porção do polinucleotídeo doador, uma cópia do polinucleotídeo doador ou uma porção de uma cópia do polinucleotídeo doador se integra no DNA alvo. Ver Wang et al. (2013) Cell 153: 910 a 918; Mandalos et al. (2012) PLoS ONE 7: e45768: 1 a 9; e Wang et al. (2013) Nat Biotechnol. 31: 530 a 532, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos.
[00244] Modificações genéticas dirigidas a um gene HSD17B13 em um genoma podem ser geradas pelo contato de uma célula com uma sequência de doador exógeno compreendendo um braço de homologia 5' que hibridiza com uma sequência alvo 5' em um locus genômico alvo dentro do gene HSD17B13 e um braço de homologia 3' que hibridiza com uma sequência alvo 3' no locus genômico alvo no gene HSD17B13. A sequência de doador exógeno pode se recombinar com o locus genômico alvo para gerar a modificação genética direcionada para o gene HSD17B13. Como um exemplo, o braço de homologia 5' pode hibridizar com uma sequência alvo 5' da posição correspondente à posição 12666 da SEQ ID NO: 2, e o braço de homologia 3' pode hibridizar com uma sequência alvo 3' da posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13
Petição 870190068171, de 18/07/2019, pág. 139/358
126/307 está perfeitamente alinhado com a SEQ ID NO: 2. Tais métodos podem resultar, por exemplo, em um gene HSD17B13 no qual uma timina é inserida entre nucleotídeos correspondentes às posições 12665 e 12666 da SEQ. ID NO: 1 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 1 (ou uma adenina é inserida na posição correspondente na cadeia oposta). Como outro exemplo, os braços de homologia 5' e 3' podem hibridizar para sequências alvo 5' e 3', respectivamente, em posições correspondentes àqueles flanqueando o éxon 6 na SEQ ID NO: 1 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 1. Tais métodos podem resultar, por exemplo, em um gene HSD17B13 no qual uma sequência correspondendo ao éxon 6 da SEQ ID NO: 1 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 1 foi eliminada. Como outro exemplo, os braços de homologia 5' e 3' podem hibridizar com as sequências alvo 5' e 3', respectivamente, em posições correspondentes àquelas de éxon 2 flanqueadoras na SEQ ID NO: 1 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO : 1. Tais métodos podem resultar, por exemplo, em um gene HSD17B13 no qual uma sequência correspondente ao éxon 2 da SEQ ID NO: 1 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 1 foi eliminada. Como outro exemplo, os braços de homologia 5' e 3' podem hibridizar com as sequências alvo 5' e 3', respectivamente, em posições correspondentes ao limite do éxon 6/íntron 6 na SEQ ID NO: 1 quando o gene HSD17B13 está perfeitamente alinhado com SEQ ID NO: 1. Como outro exemplo, os braços de homologia 5' e 3' podem hibridizar com sequências alvo 5' e 3', respectivamente, nas posições correspondentes ao éxon 6 e éxon 7 na SEQ ID NO: 1 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 1. Tais métodos podem resultar, por exemplo, em um gene HSD17B13 no qual uma timina é inserida entre nucleotídeos correspondentes às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 está perfeitamente alinhado com
Petição 870190068171, de 18/07/2019, pág. 140/358
127 / 307
SEQ ID NO: 1 (ou uma adenina é inserida na posição correspondente na cadeia oposta). Como outro exemplo, os braços de homologia 5' e 3' podem hibridizar com as sequências alvo 5' e 3', respectivamente, em posições correspondentes àquelas flanqueando ou dentro da região correspondente ao local de entrelaçamento de doador no intron 6 da SEQ ID NO: 1 (isto é, a região na extremidade 5 'do intron 6 na SEQ ID NO: 1). Tais métodos podem resultar, por exemplo, em um gene HSD17B13 em que o local do entrelaçamento do doador no íntron 6 é interrompido. Exemplos de sequências de doador exógeno são divulgados em outro local aqui.
[00245] Modificações genéticas dirigidas a um gene HSD17B13 em um genoma também podem ser geradas pelo contato de uma célula com um agente de nuclease que induz um ou mais cortes ou quebras de cadeia dupla em uma sequência alvo em um locus genômico alvo dentro do gene HSD17B13. Tais métodos podem resultar, por exemplo, em um gene HSD17B13 no qual a região correspondente ao local de entrelaçamento do doador no íntron 6 da SEQ ID NO: 1 está na quebra (isto é, a região na extremidade 5' do íntron 6 na SEQ ID NO: 1). Exemplos e variações de agentes de nuclease que podem ser utilizados nos métodos são aqui descritos em outro local.
[00246] Por exemplo, modificações genéticas direcionadas a um gene HSD17B13 em um genoma podem ser geradas pelo contato de uma célula ou do genoma de uma célula com uma proteína Cas e um ou mais RNAs guia que se hibridizam uma ou mais sequências de reconhecimento de RNA guia dentro um locus genômico alvo no gene HSD17B13. Ou seja, modificações genéticas direcionadas a um gene HSD17B13 em um genoma podem ser geradas pelo contato de uma célula ou do genoma de uma célula com uma proteína Cas e um ou mais RNAs guias que visam uma ou mais sequências alvo de RNA guia dentro de um locus genômico alvo no gene HSD17B13. Por exemplo, tais métodos podem compreender o contato de uma célula com
Petição 870190068171, de 18/07/2019, pág. 141/358 nz/wi uma proteína Cas e um RNA guia que tem como alvo uma sequência alvo de RNA guia dentro do gene HSD17B13. Como um exemplo, a sequência alvo do RNA guia está dentro de uma região correspondente ao éxon 6 e/ou íntron 6 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2. Como um exemplo, o alvo de RNA guia da sequência está dentro de uma região correspondente ao éxon 6 e/ou íntron 6 e/ou éxon 7 (por exemplo, éxon 6 e/ou íntron 6, ou éxon 6 e/ou éxon 7) da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2. Como outro exemplo, a sequência alvo de RNA guia pode incluir ou está próxima de uma posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2 Por exemplo, a sequência alvo de RNA guia pode estar dentro de cerca de 1000, 500, 400, 300, 200, 100, 50, 45, 40, 35, 30, 25, 20, 15, 10 ou 5 nucleotídeos da posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2. Como ainda outro exemplo, a sequência alvo do RNA guia pode incluir ou estar próxima ao códon de iniciação de um gene HSD17B13 ou o códon de terminação de um gene HSD17B13. Por exemplo, a sequência alvo de RNA guia pode estar dentro de cerca de 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos do códon de iniciação ou do códon de terminação. A proteína Cas e o RNA guia formam um complexo, e a proteína Cas cliva a sequência alvo do RNA guia. A clivagem pela proteína Cas pode criar uma quebra de cadeia dupla ou uma quebra de cadeia simples (por exemplo, se a proteína Cas for uma nickase'). Tais métodos podem resultar, por exemplo, em um gene HSD17B13 no qual a região correspondente ao local de entrelaçamento do doador no íntron 6 da SEQ ID NO: 1 está na quebra (isto é, a região na extremidade 5' do íntron 6 na SEQ ID NO: 1), o códon de iniciação é interrompido, o códon de terminação é interrompido ou a sequência de codificação é excluída. Exemplos e variações de proteínas Cas
Petição 870190068171, de 18/07/2019, pág. 142/358
129/307 (por exemplo, Cas9) e RNAs guia que podem ser utilizados nos métodos são aqui descritos em outro local.
[00247] Em alguns métodos, dois ou mais agentes de nuclease podem ser usados. Por exemplo, podem ser utilizados dois agentes de nuclease, cada um tendo como alvo uma sequência alvo de nuclease dentro de uma região correspondente ao éxon 6 e/ou íntron 6, ou éxon 6 e/ou éxon 7, de SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2, ou incluindo ou estando próximo a uma posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2 (por exemplo, dentro de cerca de 1000, 500, 400, 300, 200, 100, 50, 45, 40, 35, 30, 25, 20, 15, 10 ou 5 nucleotídeos da posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2). Por exemplo, podem ser utilizados dois agentes de nuclease, cada um direcionado para uma sequência alvo de nuclease em uma região correspondente ao éxon 6 e/ou íntron 6 e/ou éxon 7 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com SEQ ID NO: 2. Como outro exemplo, podem ser utilizados dois ou mais agentes de nuclease, cada um tendo como alvo uma sequência alvo de nuclease incluindo ou estando próxima ao códon de iniciação. Como outro exemplo, podem ser utilizados dois agentes de nuclease, um direcionado a uma sequência alvo de nuclease incluindo ou estando próximo ao códon de iniciação, e um direcionado a uma sequência alvo de nuclease incluindo ou estando próximo do códon de terminação, em que a clivagem pelos agentes de nuclease pode resultar em eliminação da região de codificação entre as duas sequências alvo de nuclease. Como ainda outro exemplo, podem ser utilizados três ou mais agentes de nuclease, com uma ou mais (por exemplo, duas) sequências alvo de nucleases, incluindo ou estando próximo ao códon de iniciação, e uma ou mais (por exemplo, duas) sequências alvo de nuclease alvo incluindo ou
Petição 870190068171, de 18/07/2019, pág. 143/358
130/307 estando próximo ao códon de terminação, em que a clivagem pelos agentes de nuclease pode resultar na eliminação da região de codificação entre as sequências alvo de nuclease incluindo ou estando próximo ao códon de iniciação e a sequência alvo de nuclease incluindo ou próximo ao códon de terminação.
[00248] Opcionalmente, a célula pode ser adicionalmente ser colocada em contato com um ou mais RNAs guia adicionais que visam sequências alvo de RNA guia adicionais dentro do locus genômico alvo no gene HSD17B13. Ao entrar em contato com a célula com um ou mais RNAs guia adicionais (por exemplo, um segundo RNA guia que tem como alvo uma segunda sequência alvo de RNA guia), a clivagem pela proteína Cas pode criar duas ou mais quebras de fita dupla ou duas ou mais quebras de fita simples (por exemplo, se a proteína Cas é uma nzchxse).
[00249] Opcionalmente, a célula pode adicionalmente ser colocada em contato com uma ou mais sequências de doador exógeno que recombinam com o locus genômico alvo no gene HSD17B13 para gerar uma modificação genética direcionada. Exemplos e variações de sequências de doador exógeno que podem ser utilizadas nos métodos são divulgados em outro local deste documento.
[00250] A proteína Cas, o(s) RNA(s) guia e a(s) sequência(s) doadora(s) exógena(s) podem ser introduzidos na célula em qualquer forma e por qualquer meio aqui descrito, e toda ou parte da proteína Cas, RNA(s) guia e sequência(s) doadora(s) exógena(s) podem ser introduzidos simultaneamente ou sequencialmente em qualquer combinação.
[00251] Em alguns desses métodos, o reparo do ácido nucleico alvo (por exemplo, o gene HSD17B13) pela sequência de doador exógeno ocorre via reparo dirigido por homologia (HDR). O reparo dirigido por homologia pode ocorrer quando a proteína Cas cliva as duas cadeias de DNA no gene HSD17B13 para criar uma quebra de fita dupla, quando a proteína Cas é uma
Petição 870190068171, de 18/07/2019, pág. 144/358
131/307 nickase que cliva uma fita de DNA no ácido nucleico alvo para criar uma quebra de fita única, ou quando Cas nickases são usadas para criar uma quebra de fita dupla formada por dois cortes de deslocamento. Em tais métodos, a sequência de doador exógeno compreende braços de homologia de 5' e 3' correspondendo às sequências alvo de 5' e 3'. A(s) sequência(s) alvo de RNA guia ou sítio de clivagem podem ser adjacentes à sequência alvo 5', adjacente à sequência alvo 3', adjacente à sequência alvo 5' e à sequência alvo 3', ou adjacente a nem a sequência alvo 5' nem a sequência alvo 3'. Opcionalmente, a sequência de doador exógeno pode compreender adicionalmente um inserto de ácido nucleico flanqueado pelos braços de homologia 5’ e 3’ e o inserto de ácido nucleico é inserido entre as sequências alvo 5’ e 3’. Se não existir nenhum inserto de ácido nucleico, a sequência de doador exógeno pode funcionar para eliminar a sequência genômica entre as sequências alvo 5’ e 3’. Exemplos de sequências de doador exógeno são divulgados em outro local aqui.
[00252] Alternativamente, a reparação do gene HSD17B13 mediada pela sequência de doador exógeno pode ocorrer através de ligação mediada por união de extremidade não homóloga (NHEJ). Em tais métodos, pelo menos uma extremidade da sequência de doador exógeno compreende uma região curta de cadeia simples que é complementar a pelo menos uma projeção criada por clivagem mediada por Cas no gene HSD17B13. A extremidade complementar na sequência de doador exógeno pode flanquear um inserto de ácido nucleico. Por exemplo, cada extremidade da sequência de doador exógeno pode compreender uma região curta de cadeia simples que é complementar a uma projeção criada por clivagem mediada por Cas no gene HSD17B13, e estas regiões complementares na sequência de doador exógeno podem flanquear um inserto de ácido nucleico.
[00253] Projeções (isto é, extremidades escalonadas) podem ser criadas pela res secção das extremidades cegas de uma quebra de fita dupla criada por
Petição 870190068171, de 18/07/2019, pág. 145/358
132/307 divagem mediada por Cas. Essa ressecção pode gerar as regiões de microhomologia necessárias para a junção de fragmentos, mas isso pode criar alterações indesejadas ou incontroláveis no gene HSD17B13. Altemativamente, tais projeções podem ser criadas usando Cas nickases emparelhadas. Por exemplo, a célula pode ser colcada em contato com a primeira e segunda nickases que clivam cadeias opostas de DNA, pelo que o genoma é modificado através de duplo corte. Isto pode ser conseguido contatando uma célula com uma primeira proteína CAS nickase, um primeiro RNA guia que tem como alvo uma primeira sequência de RNA guia dentro do locus genômico alvo no gene HSD17B13, uma segunda proteína Cas nickase e um segundo RNA guia que tem como alvo uma segunda sequência alvo de RNA guia dentro do locus genômico alvo no gene HSD17B13. A primeira proteína Cas e o primeiro RNA guia formam um primeiro complexo, e a segunda proteína Cas e o segundo RNA guia formam um segundo complexo. A primeira proteína Cas nickase cliva uma primeira fita de DNA genômico dentro da primeira sequência alvo de RNA guia, a segunda proteína Cas nickase cliva uma segunda fita de DNA genômico dentro da segunda sequência alvo de RNA guia, e opcionalmente a sequência de doador exógeno se recombina com o locus genômico alvo no gene HSD17B13 para gerar a modificação genética alvo.
[00254] A primeira nickase pode clivar uma primeira cadeia de DNA genômico (isto é, a cadeia complementar), e a segunda nickase pode clivar uma segunda cadeia de DNA genômico (isto é, a cadeia não complementar). A primeira e a segunda nickases podem ser criadas, por exemplo, pela mutação de um resíduo catalítico no domínio RuvC (por exemplo, a mutação D10A descrita em outro lugar aqui) de Cas9 ou mutação de um resíduo catalítico no domínio HNH (por exemplo, a mutação H840A descrita em outro lugar aqui) de Cas9. Em tais métodos, o corte duplo pode ser utilizado para criar uma quebra de cadeia dupla com extremidades escalonadas (isto é,
Petição 870190068171, de 18/07/2019, pág. 146/358
133 /307 projeções). A primeira e a segunda sequências alvo de RNA guia podem ser posicionadas para criar um sítio de clivagem de tal modo que os cortes criados pela primeira e pela segunda nickases na primeira e na segunda cadeias de DNA criam uma quebra de cadeia dupla. As projeções são criadas quando os cortes dentro das primeira e segunda sequências de destino de RNA de CRISPR são compensadas. A janela de deslocamento pode ser, por exemplo, pelo menos cerca de 5 pb, 10 pb, 20 pb, 30 pb, 40 pb, 50 pb, 60 pb, 70 pb, 80 pb, 90 pb, 100 pb ou mais. Ver, por exemplo, Ran et al. (2013) Cell 154: 1380 a 1389; Mali et al. (2013) Nat. Biotech. 31: 833 a 838; e Shen et al. (2014) Nat. Methods 11: 399 a 404, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos.
(1) Tipos de modificações genéticas direcionadas [00255] Vários tipos de modificações genéticas direcionadas podem ser introduzidos usando os métodos descritos aqui. Tais modificações direcionadas podem incluir, por exemplo, adições de um ou mais nucleotídeos, eliminações de um ou mais nucleotídeos, substituições de um ou mais nucleotídeos, uma mutação pontual ou uma combinação das mesmas. Por exemplo, pelo menos 1, 2, 3, 4, 5, 7, 8, 9, 10 ou mais nucleotídeos podem ser alterados (por exemplo, eliminados, inseridos ou substituídos) para formar a modificação genômica alvo. As eliminações, inserções ou substituições podem ser de qualquer tamanho, como aqui divulgado em outro local. Ver, por exemplo, Wang et al. (2013) Cell 153: 910 a 918; Mandalos et al. (2012) PLoS ONE 7: e45768: 1 a 9; e Wang et al. (2013) Nat Biotechnol. 31: 530 a 532, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos.
[00256] Tais modificações genéticas direcionadas podem resultar na quebra de um locus genômico alvo. O rompimento pode incluir alteração de um elemento regulador (por exemplo, promotor ou intensificador), uma mutação com troca de sentido, uma mutação sem sentido, uma mutação de
Petição 870190068171, de 18/07/2019, pág. 147/358
134/307 mudança de quadro, uma mutação truncada, uma mutação nula ou uma inserção ou eliminação de um pequeno número de nucleotídeos (por exemplo, causando uma mutação de mudança de quadro), e isso pode resultar em inativação (ou seja, perda de função) ou perda de um alelo. Por exemplo, uma modificação direcionada pode compreender a quebra do códon de iniciação de um gene HSD17B13, de tal modo que o códon de iniciação deixa de ser funcional.
[00257] Em um exemplo específico, uma modificação direcionada pode compreender uma eliminação entre a primeira e a segunda sequências alvo de RNA guia ou sítios de clivagem de Cas. Se for utilizada uma sequência de doador exógeno (por exemplo, modelo de reparação ou vetor de direcionamento), a modificação pode compreender uma eliminação entre a primeira e a segunda sequências alvo de RNA guia ou sítios de clivagem de Cas, bem como uma inserção de um inserto de ácido nucleico entre as sequências alvo 5' e 3'.
[00258] Altemativamente, se uma sequência de doador exógeno é usada, sozinha ou em combinação com um agente de nuclease, a modificação pode compreender uma eliminação entre as sequências alvo 5' e 3', bem como uma inserção de um inserto de ácido nucleico entre as sequências alvo 5' e 3' no par de primeiro e segundo cromossomas homólogos, resultando assim em um genoma modificado homozigótico. Altemativamente, se a sequência de doador exógeno compreender braços de homologia 5’ e 3’ sem inserto de ácido nucleico, a modificação pode compreender uma eliminação entre as sequências alvo 5’ e 3’.
[00259] A eliminação entre as primeira e segunda sequências alvo de RNA guia ou a eliminação entre as sequências alvo 5' e 3' pode ser uma eliminação precisa em que o ácido nucleico eliminado consiste apenas na sequência de ácido nucléico entre o primeira e o segunda sítios clivagem de nuclease ou apenas a sequência de ácido nucleico entre as sequências alvo 5' e
Petição 870190068171, de 18/07/2019, pág. 148/358
135/307
3' de tal modo que não existem eliminações ou inserções adicionais no locus alvo genômico modificado. A eliminação entre a primeira e a segunda sequências alvo de RNA guia também pode ser uma eliminação imprecisa que se estende além dos sítios de clivagem da primeira e da segunda nucleases, consistente com reparo impreciso por união de extremidade não homóloga (NHEJ), resultando em eliminações e/ou inserções adicionais no locus genômico modificado. Por exemplo, a eliminação pode estender cerca de 1 pb, cerca de 2 pb, cerca de 3 pb, cerca de 4 pb, cerca de 5 pb, cerca de 10 pb, cerca de 20 pb, cerca de 30 pb, cerca de 40 pb, cerca de 50 pb, cerca de 100 pb, cerca de 200 pb, cerca de 300 pb, cerca de 400 pb, cerca de 500 pb, ou mais além do primeiro e do segundo sítios de clivagem da proteína Cas. Do mesmo modo, o locus genômico modificado pode compreender inserções adicionais consistentes com reparo impreciso por NHEJ, tais como inserções de cerca de 1 pb, cerca de 2 pb, cerca de 3 pb, cerca de 4 pb, cerca de 5 pb, cerca de 10 pb, cerca de 20 pb, cerca de 30 pb, cerca de 40 pb, cerca de 50 pb, cerca de 100 pb, cerca de 200 pb, cerca de 300 pb, cerca de 400 pb, cerca de 500 pb, ou mais.
[00260] A modificação genética alvo pode ser, por exemplo, uma modificação bialélica ou uma modificação mono-paralela. Modificações bialélicas incluem eventos em que a mesma modificação é feita no mesmo locus nos cromossomas homólogos correspondentes (por exemplo, em uma célula diploide), ou nos quais diferentes modificações são feitas para o mesmo locus nos cromossomas homólogos correspondentes. Em alguns métodos, a modificação genética direcionada é uma modificação mono-paralela. Uma modificação mono-paralela inclui eventos nos quais é feita uma modificação para apenas um alelo (isto é, uma modificação do gene HSD17B13 em apenas um dos dois cromossomas homólogos). Os cromossomos homólogos incluem cromossomos que possuem os mesmos genes nos mesmos locus, mas possivelmente diferentes alelos (por exemplo, cromossomos que são pareados
Petição 870190068171, de 18/07/2019, pág. 149/358
136/307 durante a meiose). O termo alelo inclui qualquer de uma ou mais formas alternativas de uma sequência genética. Em uma célula ou organismo diploide, os dois alelos de uma dada sequência ocupam tipicamente loci correspondentes em um par de cromossomas homólogos.
[00261] Uma mutação mono-paralela pode resultar em uma célula que é heterozigótica para a modificação de HSD17B13 alvo. A heterozigosidade inclui uma situação em que apenas um alelo do gene HSD17B13 (isto é, correspondentes alelos em ambos os cromossomas homólogos) possui a modificação alvo.
[00262] Uma modificação bialélica pode resultar em homozigose para uma modificação direcionada. A homozigosidade inclui situações em que ambos os alelos do gene HSD17B13 (isto é, alelos correspondentes em ambos os cromossomas homólogos) têm a modificação direcionada. Altemativamente, uma modificação bialélica pode resultar em heterozigosidade do composto (por exemplo, hemizigose) para a modificação direcionada. A heterozigosidade composta inclui situações nas quais ambos os alelos do locus alvo (isto é, os alelos em ambos os cromossomos homólogos) foram modificados, mas eles foram modificados de maneiras diferentes (por exemplo, uma modificação direcionada em um alelo e inativação ou interrupção do outro alelo). Por exemplo, no alelo sem a modificação almejada, uma quebra de cadeia dupla criada pela proteína Cas pode ter sido reparada por reparo de DNA mediado por união de extremidade não homóloga (NHEJ), que gera um alelo mutante compreendendo uma inserção ou uma eliminação de uma sequência de ácido nucleico e desse modo causar a quebra desse locus genômico. Por exemplo, uma modificação bialélica pode resultar em heterozigosidade do composto se a célula tiver um alelo com a modificação alvo e outro alelo que não é capaz de ser expresso. A heterozigosidade composta inclui hemizigose. A hemizigose inclui situações em que apenas um alelo (isto é, um alelo em um dos dois cromossomas
Petição 870190068171, de 18/07/2019, pág. 150/358
137/307 homólogos) do locus alvo está presente. Por exemplo, uma modificação bialélica pode resultar em hemizigocidade para uma modificação direcionada se a modificação alvo ocorrer em um alelo com uma perda correspondente ou eliminação do outro alelo.
(2) Identificando Células com Modificações Genéticas Específicas [00263] Os métodos aqui divulgados podem ainda compreender a identificação de uma célula que possui um gene HSD17B13 modificado. Podem ser utilizados vários métodos para identificar células com uma modificação genética direcionada, tal como uma eliminação ou uma inserção. Tais métodos podem compreender a identificação de uma célula possuindo a modificação genética direcionada no gene HSD17B13. O rastreamento pode ser feito para identificar essas células com loci genômicos modificados.
[00264] A etapa de rastreamento pode compreender um ensaio quantitativo para avaliar a modificação de alelo (MOA) (por exemplo, ensaios perda de alelo (LOA) e/ou ganho de alelo (GOA)) de um cromossomo parental. Por exemplo, o ensaio quantitativo pode ser realizado através de uma PCR quantitativa, tal como uma PCR em tempo real (qPCR). A PCR em tempo real pode utilizar um primeiro conjunto de iniciadores que reconhece o locus genômico alvo e um segundo conjunto de iniciadores que reconhece um locus de referência não alvo. O conjunto de iniciadores pode compreender uma sonda fluorescente que reconhece a sequência amplificada. O ensaio de perda de alelo (LOA) inverte a lógica de rastreamento convencional e quantifica o número de cópias do locus nativo para o qual a mutação foi direcionada. Em um clone celular corretamente direcionado, o ensaio LOA detecta um dos dois alelos nativos (para genes que não estão no cromossomo X ou Y), sendo o outro alelo rompido pela modificação direcionada. O mesmo princípio pode ser aplicado em sentido inverso como um ensaio de ganho de alelo (GOA) para quantificar o número de cópias do vetor de direcionamento inserido. Por exemplo, o uso combinado de testes de GOA e
Petição 870190068171, de 18/07/2019, pág. 151/358
138/307
LOA revelará um clone heterozigótico corretamente direcionado como tendo perdido uma cópia do gene alvo nativo e obtido uma cópia do gene de resistência a fármaco ou outro marcador inserido.
[00265] Como exemplo, a reação em cadeia da polimerase quantitativa (qPCR) pode ser usada como o método de quantificação de alelos, mas qualquer método que possa distinguir com segurança a diferença entre zero, uma e duas cópias do gene alvo ou entre zero, uma e duas cópias do inserto de ácido nucleico podem ser usadas para desenvolver um ensaio de MOA. Por exemplo, TAQMAN® pode ser usado para quantificar o número de cópias de um molde de DNA em uma amostra de DNA genômico, especialmente por comparação com um gene de referência (ver, por exemplo, US 6.596.541, incorporado por referência na sua totalidade para todos os efeitos). O gene de referência é quantificado no mesmo DNA genômico que o(s) gene(s) ou locus (loci') alvo. Portanto, duas amplificações TAQMAN® (cada uma com sua respectiva sonda) são realizadas. Uma sonda TAQMAN® determina o “Ct” (ciclo limite) do gene de referência, enquanto a outra sonda determina o Ct da região do(s) gene(s) alvo(s) ou locus(loci) que é substituído pelo direcionamento bem-sucedido (ou seja, ensaio LOA). O Ct é uma quantidade que reflete a quantidade de DNA de partida para cada uma das sondas TAQMAN®, isto é, uma sequência menos abundante requer mais ciclos de PCR para atingir o ciclo limite. Diminuir pela metade o número de cópias da sequência modelo para uma reação TAQMAN® resultará em um aumento de aproximadamente uma unidade Ct. Reações TAQMAN® em células onde um alelo do(s) gene(s) alvo(s) ou locus(loci) foi substituído por recombinação homóloga resultará em um aumento de um Ct para a reação alvo de TAQMAN® sem um aumento no Ct para o gene de referência quando comparado ao DNA de células não alvo. Para um ensaio GOA, outra sonda TAQMAN® pode ser usada para determinar o Ct do inserto de ácido nucleico que está substituindo o(s) gene(s) alvo(s) ou locus(loci) por direcionamento
Petição 870190068171, de 18/07/2019, pág. 152/358
139/307 bem-sucedido.
[00266] Outros exemplos de ensaios quantitativos adequados incluem hibridização in situ por fluorescência (FISH), hibridização genômica comparativa, amplificação isotérmica de DNA, hibridização quantitativa com sonda(s) imobilizada(s), sondas INVADER®, sondas de baliza Molecular TAQMAN® ou tecnologia de sondas ECLIPSE™ (ver, por exemplo, US 2005/0144655, incorporada ao presente pela referência na sua totalidade para todos os propósitos). Ensaios convencionais para rastreamento de modificações direcionadas, tais como PCR de longo alcance, transferência de Southern ou sequenciamento de Sanger, também podem ser utilizados. Tais ensaios são tipicamente utilizados para obter evidência de uma ligação entre o vetor de direcionamento inserido e o locus genômico alvo. Por exemplo, para um ensaio de PCR de longo alcance, um iniciador pode reconhecer uma sequência dentro do DNA inserido enquanto o outro reconhece uma sequência de locus genômico alvo além das extremidades dos braços de homologia do vetor de direcionamento.
[00267] O sequenciamento de nova geração (NGS) também pode ser usado para rastreamento. O sequenciamento de nova geração também pode ser referido como “NGS” ou “sequenciamento maciçamente paralelo” ou “sequenciamento de alto rendimento”. Nos métodos descritos aqui, não é necessário rastrear células alvo usando marcadores de seleção. Por exemplo, os ensaios MOA e NGS aqui descritos podem ser utilizados sem utilizar cassetes de seleção.
B. Métodos de Alteração da Expressão de Ácidos Nucleicos de HSD17B13 [00268] Vários métodos são providos para alterar a expressão de ácidos nucléicos que codificam as proteínas de HSD17B13. Em alguns métodos, a expressão é alterada através de clivagem com um agente de nuclease para causar a quebra do ácido nucleico que codifica a proteína de HSD17B13, como descrito em mais detalhe em outro local deste documento. Em alguns
Petição 870190068171, de 18/07/2019, pág. 153/358
140 / 307 métodos, a expressão é alterada através do uso de uma proteína de ligação ao DNA fundida ou ligada a um domínio de ativação da transcrição ou a um domínio de repressão da transcrição. Em alguns métodos, a expressão é alterada através do uso de composições de interferência de RNA, tais como RNA antissentido, shRNA ou siRNA.
[00269] Em um exemplo, a expressão de um gene HSD17B13 ou um ácido nucleico que codifica uma proteína de HSD17B13 pode ser modificada colocando em contato uma célula ou o genoma dentro de uma célula com um agente de nuclease que induza um ou mais cortes ou quebras duplas em uma sequência alvo em um locus genômico alvo dentro do gene HSD17B13 ou ácido nucleico que codifica uma proteína de HSD17B13. Tal clivagem pode resultar no rompimento da expressão do gene HSD17B13 ou ácido nucleico que codifica uma proteína de HSD17B13. Por exemplo, a sequência alvo de nuclease pode incluir ou estar próxima do códon de iniciação de um gene HSD17B13. Por exemplo, a sequência alvo pode estar dentro de cerca de 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos do códon de iniciação, e a clivagem pelo agente de nuclease pode perturbar o códon de iniciação. Como outro exemplo, podem ser utilizados dois ou mais agentes de nuclease, cada um tendo como alvo uma sequência alvo de nuclease incluindo ou estando próxima do códon de iniciação. Como outro exemplo, podem ser utilizados dois agentes de nuclease, um direcionado a uma sequência alvo de nuclease incluindo ou estando próximo do códon de iniciação, e um direcionado para uma sequência alvo de nuclease incluindo ou estando próximo do códon de terminação, em que a clivagem pelos agentes de nuclease pode resultar em eliminação da região de codificação entre as duas sequências alvo de nuclease. Como ainda outro exemplo, podem ser utilizados três ou mais agentes de nuclease, com uma ou mais (por exemplo, duas) sequências alvo de nucleases, incluindo ou estando próximo do códon de iniciação, e uma ou mais (por exemplo, duas) sequências alvo de nuclease
Petição 870190068171, de 18/07/2019, pág. 154/358
141/307 alvo incluindo ou estando próximo do códon de terminação, em que a clivagem pelos agentes de nuclease pode resultar na eliminação da região de codificação entre as sequências alvo de nuclease incluindo ou estando próximo do códon de iniciação e a sequência alvo de nuclease incluindo ou estando próxima do códon de terminação. Outros exemplos de modificação de um gene HSD17B13 ou de um ácido nucleico que codifica uma proteína HSD17B13 são aqui revelados em outra parte.
[00270] Em outro exemplo, a expressão de um gene HSD17B13 ou um ácido nucleico que codifica uma proteína de HSD17B13 pode ser modificada colocando em contato uma célula ou o genoma dentro de uma célula com uma proteína de ligação a DNA que se liga a um locus genômico alvo dentro do gene HSD17B13. A proteína de ligação ao DNA pode ser, por exemplo, uma proteína Cas inativa por nuclease fundida com um domínio ativador da transcrição ou um domínio repressor da transcrição. Outros exemplos de proteínas de ligação ao DNA incluem proteínas de dedo de zinco fundidas com um domínio de ativador da transcrição ou um domínio repressor da transcrição, ou proteínas do tipo promotor semelhante à transcrição (TALE) fundidas com um domínio do ativador da transcrição ou um domínio repressor da transcrição. Exemplos de tais proteínas são divulgados em outro local aqui. Por exemplo, em alguns métodos, um repressor de transcrição pode ser utilizado para diminuir a expressão de um gene HSD17B13 do tipo selvagem ou um gene HSD17B13 que não é a variante rs72613567 (por exemplo, para diminuir a expressão da transcrição de HSD17B13 ou da isoforma A). Do mesmo modo, em alguns métodos, um ativador da transcrição pode ser utilizado para aumentar a expressão de um gene variante do gene HSD17B13, rs72613567 (por exemplo, para aumentar a expressão da transcrição de HSD17B13 ou da isoforma D).
[00271] A sequência alvo (por exemplo, sequência alvo de RNA guia) para a proteína de ligação a DNA pode estar em qualquer lugar dentro do
Petição 870190068171, de 18/07/2019, pág. 155/358
142 / 307 gene HSD17B13 ou um ácido nucleico que codifica uma proteína de HSD17B13 adequada para alterar a expressão. Como um exemplo, a sequência alvo pode estar dentro de um elemento regulador, tal como um potenciador ou promotor, ou pode estar próximo de um elemento regulador. Por exemplo, a sequência alvo pode incluir ou estar próxima do códon de iniciação de um gene HSD17B13. Por exemplo, a sequência alvo pode estar dentro de cerca de 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos do códon de iniciação.
[00272] Em outro exemplo, moléculas antissentido podem ser usadas para alterar a expressão de um gene HSD17B13 ou um ácido nucléico que codifica uma proteína de HSD17B13. Exemplos de moléculas antissentido incluem RNAs antissentido, pequenos RNAs de interferência (siRNAs) e pequenos RNAs em forma de grampo (shRNAs). Tais RNAs antissentido, siRNAs ou shRNAs podem ser projetados para atingir qualquer região de um RNAm. Por exemplo, os RNAs antissentido, siRNAs ou shRNAs podem ser concebidos para direcionar uma região única para uma ou mais das transcrições de HSD17B13 aqui divulgadas, ou uma região comum a uma ou mais das transcrições de HSD17B13 aqui divulgadas. Exemplos de ácidos nucleicos que hibridizam com DNAc e transcrições variantes de HSD17B13 são divulgados em mais detalhe em outro local aqui. Por exemplo, o RNA antissentido, siRNA, ou shRNA pode hibridizar com uma sequência dentro da SEQ ID NO: 4 (transcrição A de HSD17B13). Opcionalmente, o RNA antissentido, siRNA, ou shRNA pode diminuir a expressão da transcrição A de HSD17B13 em uma célula. Opcionalmente, o RNA antissentido, siRNA, ou shRNA hibridiza com uma sequência presente na SEQ ID NO: 4 (transcrição A de HSD17B13) que não está presente na SEQ ID NO: 7 (transcrição D de HSD17B13). Opcionalmente, o RNA antissentido, siRNA ou shRNA hibridizam com uma sequência no éxon 7 ou uma sequência que abrange o limite éxon 6-éxon 7 da SEQ ID NO: 4 (transcrição A de
Petição 870190068171, de 18/07/2019, pág. 156/358
143 / 307
HSD17B13).
[00273] Como outro exemplo, o RNA antissentido, siRNA, ou shRNA pode hibridizar com uma sequência dentro de SEQ ID NO: 7 (transcrição D de HSD17B13). Opcionalmente, o RNA antissentido, siRNA, ou shRNA pode diminuir a expressão da transcrição D de HSD17B13 em uma célula. Opcionalmente, o RNA antissentido, siRNA ou shRNA hibridiza com uma sequência presente na SEQ ID NO: 7 (transcrição D de HSD17B13) que não está presente na SEQ ID NO: 4 (transcrição A de HSD17B13). Opcionalmente, o RNA antissentido, siRNA, ou shRNA hibridiza com uma sequência no éxon 7 ou uma sequência que abrange o limite do éxon 6-éxon 7 da SEQ ID NO: 7 (transcrição D de HSD17B13).
C. Introdução de Ácidos Nucleicos e Proteínas em Células [00274] Os ácidos nucleicos e proteínas aqui descritos podem ser introduzidos em uma célula por qualquer meio. “Introduzir” inclui apresentar à célula o ácido nucleico ou a proteína de tal maneira que a sequência tenha acesso ao interior da célula. A introdução pode ser realizada por qualquer meio, e um ou mais dos componentes (por exemplo, dois dos componentes, ou todos os componentes) podem ser introduzidos na célula simultaneamente ou sequencialmente em qualquer combinação. Por exemplo, uma sequência de doador exógeno pode ser introduzida antes da introdução de um agente de nuclease, ou pode ser introduzida após a introdução do agente de nuclease (por exemplo, a sequência de doador exógeno pode ser administrada cerca de 1, 2, 3, 4, 8, 12, 24, 36, 48 ou 72 horas antes ou depois da introdução do agente de nuclease). Ver, por exemplo, US 2015/0240263 e US 2015/0110762, cada uma das quais é aqui incorporada por referência na sua totalidade para todos os efeitos. O contato do genoma de uma célula com um agente de nuclease ou sequência de doador exógeno pode compreender a introdução de um ou mais agentes de nuclease ou ácidos nucleicos que codificam agentes de nuclease (por exemplo, uma ou mais proteínas Cas ou
Petição 870190068171, de 18/07/2019, pág. 157/358
144 / 307 ácidos nucleicos que codificam uma ou mais proteínas Cas e um ou mais RNAs guia ou ácidos nucleicos que codificam um ou mais RNAs guia (isto é, um ou mais RNAs CRISPR e um ou mais tracrRNAs) e/ou uma ou mais sequências de doador exógeno na célula. O contato do genoma da célula (isto é, o contato de uma célula) pode compreender a introdução de apenas um dos componentes acima, um ou mais dos componentes, ou todos os componentes na célula.
[00275] Um agente de nuclease pode ser introduzido na célula na forma de uma proteína ou na forma de um ácido nucleico que codifica o agente de nuclease, tal como um RNA (por exemplo, RNA mensageiro (RNAm)) ou DNA. Quando introduzido na forma de um DNA, o DNA pode ser operacionalmente ligado a um promotor ativo na célula. Tais DNAs podem estar em um ou mais construtos de expressão.
[00276] Por exemplo, uma proteína Cas pode ser introduzida na célula na forma de uma proteína, tal como uma proteína Cas complexada com um gRNA, ou na forma de um ácido nucleico que codifica a proteína Cas, tal como um RNA (por exemplo, RNA mensageiro (RNAm)) ou DNA. Um RNA guia pode ser introduzido na célula na forma de um RNA ou na forma de um DNA que codifica o RNA guia. Quando introduzido sob a forma de um DNA, o DNA que codifica a proteína Cas e/ou o RNA guia pode estar operativamente ligado a um promotor ativo na célula. Tais DNAs podem estar em um ou mais construtos de expressão. Por exemplo, tais construtos de expressão podem ser componentes de uma única molécula de ácido nucleico. Altemativamente, eles podem ser separados em qualquer combinação entre duas ou mais moléculas de ácido nucleico (isto é, DNAs que codificam um ou mais RNAs CRISPR, DNAs que codificam um ou mais tracrRNAs, e DNA que codifica uma proteína Cas podem ser componentes de moléculas de ácido nucleico separadas).
[00277] Em alguns métodos, o DNA que codifica um agente de
Petição 870190068171, de 18/07/2019, pág. 158/358
145 / 307 nuclease (por exemplo, uma proteína Cas e um RNA guia) e/ou DNA que codifica uma sequência de doador exógeno pode ser introduzido em uma célula via minicírculos de DNA. Ver, por exemplo, WO 2014/182700, aqui incorporado por referência na sua totalidade para todos os propósitos. Os minicírculos de DNA são moléculas de DNA superenroladas que podem ser usadas para transferência de genes não virais que não têm uma origem de replicação nem um marcador de seleção de antibiótico. Assim, os minicírculos de DNA são tipicamente menores em tamanho que o vetor de plasmídeo. Esses DNAs são desprovidos de DNA bacteriano e, portanto, não possuem os motivos CpG não metilados encontrados no DNA bacteriano.
[00278] Os métodos aqui providos não dependem de um método particular para introduzir um ácido nucleico ou proteína na célula, apenas que o ácido nucleico ou proteína ganha acesso ao interior de pelo menos uma célula. Os métodos para introduzir ácidos nucleicos e proteínas em vários tipos de células são conhecidos e incluem, por exemplo, métodos de transfecção estável, métodos de transfecção transiente e métodos mediados por vírus.
[00279] Protocolos de transfecção, bem como protocolos para a introdução de ácidos nucleicos ou proteínas nas células podem variar. Os métodos de transfecção não limitativos incluem métodos de transfecção baseados em química utilizando lipossomas; nanopartículas; fosfato de cálcio (Graham et al. (1973) Virology 52 (2): 456 a 467, Bacchetti et al. (1977) Proc. Natl. Acad. Sei. USA 74 (4): 1590 a 1594, e Kriegler, M (1991) Transfer and Expression: A Laboratory Manual, Nova Iorque: WH Freeman and Company, p. 96 a 97); dendrímeros; ou polímeros catiônicos, tais como DEAE-dextrano ou polietilenimina. Os métodos não químicos incluem eletroporação, sonoporação e transfecção ótica. A transfecção baseada em partículas inclui o uso de uma pistola de genes, ou transfecção assistida por imãs (Bertram (2006) Current Pharmaceutical Biotechnology 7, 277-28). Os
Petição 870190068171, de 18/07/2019, pág. 159/358
146 / 307 métodos virais também podem ser usados para transfecção.
[00280] A introdução de ácidos nucleicos ou proteínas em uma célula também pode ser mediada por eletroporação, por injeção intracitoplasmática, por infecção viral, por adenovirus, por vírus adeno-associado, por lentivírus, por retrovirus, por transfecção, por transfecção mediada por lipídio ou por nucleofecção. A nucleofecção é uma tecnologia de eletroporação aprimorada que permite que substratos de ácido nucléico sejam liberados não apenas no citoplasma, mas também através da membrana nuclear e no núcleo. Além disso, a utilização de nucleofecção nos métodos aqui descritos requer tipicamente muito menos células do que a electroporação regular (por exemplo, apenas cerca de 2 milhões, em comparação com 7 milhões por eletroporação regular). Em um exemplo, a nucleofecção é realizada usando o sistema LONZA® NUCLEOFECTOR™.
[00281] A introdução de ácidos nucleicos ou proteínas em uma célula também pode ser realizada por microinjeção. A microinjeção de um mRNA é preferencialmente no citoplasma (por exemplo, para fornecer mRNA diretamente ao mecanismo de translação), enquanto a microinjeção de uma proteína ou um DNA que codifica um DNA que codifica uma proteína Cas é preferencialmente no núcleo. Altemativamente, a microinjeção pode ser realizada por injeção no núcleo e no citoplasma: uma agulha pode ser primeiramente introduzida no núcleo e uma primeira quantidade pode ser injetada, e ao remover a agulha da célula uma segunda quantidade pode ser injetada no citoplasma. Se uma proteína de agente de nuclease é injetada no citoplasma, a proteína compreende de preferência um sinal de localização nuclear para assegurar a distribuição no núcleo/pró-núcleo. Os métodos para realizar microinjecção são bem conhecidos. Ver, por exemplo, Nagy et al. (Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003, Manipulating the mouse embryo. Cold Spring Harbor, Nova Iorque: Cold Spring Harbor Laboratory Press); Meyer et al. (2010) Proc. Natl. Acad. Sci. USA 107: 15022
Petição 870190068171, de 18/07/2019, pág. 160/358
147 / 307 a 15026 e Meyer et al. (2012) Proc. Natl. Acad. Sei. EUA 109: 9354 a 9359. [00282] Outros métodos para a introdução de ácido nucleico ou proteínas em uma célula podem incluir, por exemplo, entrega de vetores, entrega mediada por partículas, entrega mediada por exossomos, entrega mediada por nanopartículas de lipídios, entrega mediada por peptídeos penetrantes de células, ou entrega mediada por dispositivo implantável. Métodos de administração de ácidos nucleicos ou proteínas a um indivíduo para modificar células in vivo são aqui revelados em outro local.
[00283] A introdução de ácidos nucleicos e proteínas nas células também pode ser realizada por administração hidrodinâmica (HDD). O fornecimento hidrodinâmico surgiu como um método quase perfeito para a entrega de DNA intracelular in vivo. Para entrega de genes a células do parênquima, apenas sequências de DNA essenciais precisam ser injetadas através de um vaso sanguíneo selecionado, eliminando as preocupações de segurança associadas aos atuais vetores virais e sintéticos. Quando injetado na corrente sanguínea, o DNA é capaz de atingir células nos diferentes tecidos acessíveis ao sangue. A distribuição hidrodinâmica emprega a força gerada pela rápida injeção de um grande volume de solução no sangue incompressível na circulação para superar as barreiras físicas do endotélio e das membranas celulares que impedem que compostos grandes e impermeáveis à membrana entrem nas células do parênquima. Além da entrega de DNA, este método é útil para a entrega intracelular eficiente de RNA, proteínas e outros compostos pequenos in vivo. Ver, por exemplo, Bonamassa et al. (2011) Pharm. Res. 28 (4): 694 a 701, aqui incorporado por referência na sua totalidade para todos os fins.
[00284] Outros métodos para a introdução de ácido nucleico ou proteínas em uma célula podem incluir, por exemplo, entrega vetorial, entrega mediada por partículas, entrega mediada por exossomo, entrega mediada por nanopartículas de lipídios, entrega mediada por peptídeos penetrantes de
Petição 870190068171, de 18/07/2019, pág. 161/358
148 / 307 células, ou entrega mediada por dispositivo implantável. Como exemplos específicos, um ácido nucleico ou proteína pode ser introduzido em uma célula em um veículo, tal como uma microesfera de poli(ácido láctico) (PLA), uma microesfera de poli(ácido D, L-láctico-coglicólico) (PLGA), um lipossoma, uma micela, uma micela inversa, um cocleado lipídico ou um microtúbulo lipídico.
[00285] A introdução de ácidos nucleicos ou proteínas na célula pode ser realizada uma vez ou várias vezes ao longo de um período de tempo. Por exemplo, a introdução pode ser realizada pelo menos duas vezes ao longo de um período de tempo, pelo menos três vezes ao longo de um período de tempo, pelo menos quatro vezes ao longo de um período de tempo, pelo menos cinco vezes ao longo de um período de tempo, pelo menos seis vezes ao longo de um período de tempo, pelo menos sete vezes ao longo de um período de tempo, pelo menos oito vezes ao longo de um período de tempo, pelo menos nove vezes ao longo de um período de tempo, pelo menos dez vezes ao longo de um período de tempo, pelo menos onze vezes ao longo de um período de tempo, pelo menos doze vezes ao longo de um período de tempo, pelo menos treze vezes ao longo de um período de tempo, pelo menos catorze vezes ao longo de um período de tempo, pelo menos quinze vezes ao longo de um período de tempo, pelo menos dezasseis vezes ao longo de um período do tempo, pelo menos dezessete vezes ao longo de um período de tempo, pelo menos dezoito vezes ao longo de um período de tempo, pelo menos dezenove vezes ao longo de um período de tempo, ou pelo menos vinte vezes ao longo de um período de tempo.
[00286] Em alguns casos, as células empregadas nos métodos e composições possuem um construto de DNA incorporado de maneira estável em seu genoma. Em tais casos, o contato pode compreender o fornecimento de uma célula com o construto já estavelmente incorporado no seu genoma. Por exemplo, uma célula empregada nos métodos aqui divulgados pode ter
Petição 870190068171, de 18/07/2019, pág. 162/358
149 / 307 um gene codificante de Cas pré-existente, estavelmente incorporado no seu genoma (isto é, uma célula pronta para Cas). “Incorporado de forma estável” ou “introduzido de forma estável” ou “integrado de forma estável” inclui a introdução de um polinucleotídeo na célula de tal forma que a sequência de nucleotídeos se integre ao genoma da célula e seja capaz de ser herdada por sua progênie. Qualquer protocolo pode ser usado para a incorporação estável dos construtos de DNA ou os vários componentes do sistema de integração genômica alvo.
D. Agentes de nuclease e Proteínas de Ligação ao DNA [00287] Qualquer agente de nuclease que induza um corte ou uma quebra de cadeia dupla em uma sequência alvo desejada ou qualquer proteína de ligação ao DNA que se ligue a uma sequência alvo desejada pode ser utilizado nos métodos e composições aqui descritos. Um agente de nuclease natural ou nativo pode ser empregado desde que o agente de nuclease induza um corte ou quebra de cadeia dupla em uma sequência alvo desejada. Do mesmo modo, uma proteína de ligação ao DNA nativa ou natural pode ser utilizada desde que a proteína de ligação ao DNA se ligue à sequência alvo desejada. Altemativamente, pode ser utilizado um agente de nuclease modificado ou manipulado ou proteína de ligação ao DNA. Um “agente de nuclease modificado ou proteína de ligação ao DNA” inclui um agente de nuclease ou proteína de ligação ao DNA que é modificada (modificada ou derivada) de sua forma nativa para reconhecer especificamente uma sequência alvo desejada. Assim, um agente de nuclease manipulado ou uma proteína de ligação ao DNA pode ser derivado de um agente de nuclease nativo que ocorre naturalmente ou de uma proteína de ligação ao DNA ou pode ser artificialmente criado ou sintetizado. O agente de nuclease manipulado ou proteína de ligação ao DNA pode reconhecer uma sequência alvo, por exemplo, em que a sequência alvo não é uma sequência que teria sido reconhecida por um agente de nuclease nativo (não modificado ou não
Petição 870190068171, de 18/07/2019, pág. 163/358
150/307 manipulado) ou proteína de ligação ao ADN. A modificação do agente de nuclease ou da proteína de ligação ao DNA pode ser tão pequena quanto um aminoácido em um agente de clivagem de proteína ou um nucleotídeo em um agente de clivagem de ácido nucleico. A produção de um corte ou quebra de cadeia dupla em uma sequência alvo ou em outro DNA pode ser aqui referida como “cortar” ou “clivar” a sequência alvo ou outro DNA.
[00288] São também providas variantes ativas e fragmentos de agentes de nuclease ou proteínas de ligação ao DNA (isto é, um agente de nuclease manipulado ou proteína de ligação ao DNA. Tais variantes ativas podem compreender pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade de sequência com o agente de nuclease nativo ou proteína de ligação ao DNA, em que as variantes ativas retêm a capacidade de cortar em uma sequência alvo desejada e, portanto, retêm atividade de induzir a quebra de cadeia dupla ou corte ou retêm a capacidade de se ligar a sequência alvo desejada. Por exemplo, qualquer um dos agentes de nuclease aqui descritos pode ser modificado a partir de uma sequência de endonuclease nativa e concebido para reconhecer e induzir uma quebra de cadeia dupla ou corte em uma sequência alvo que não foi reconhecida pelo agente de nuclease nativo. Assim, algumas nucleases manipuladas têm uma especificidade para induzir um corte ou quebra de cadeia dupla em uma sequência alvo que é diferente da sequência alvo do agente de nuclease nativa correspondente. Os ensaios para a atividade de induzir corte ou quebra de cadeia dupla são conhecidos e geralmente medem a atividade global e a especificidade da endonuclease em substratos de DNA contendo a sequência alvo.
[00289] O termo “sequência alvo para um agente de nuclease” inclui uma sequência de DNA na qual uma quebra de cadeia dupla ou corte é induzida por um agente de nuclease. Da mesma forma, o termo “sequência alvo para uma proteína de ligação ao DNA” inclui uma sequência de DNA à
Petição 870190068171, de 18/07/2019, pág. 164/358
151/307 qual uma proteína de ligação ao DNA se ligará. A sequência alvo pode ser endógena (ou nativa) para a célula ou a sequência alvo pode ser exógena para a célula. Uma sequência alvo que é exógena para a célula não ocorre naturalmente no genoma da célula. A sequência alvo também pode ser exógena para os polinucleotídeos de interesse que se deseja posicionar no locus alvo. Em alguns casos, a sequência alvo está presente apenas uma vez no genoma da célula hospedeira.
[00290] Variantes ativas e fragmentos das sequências alvo exemplificadas são também providos. Tais variantes ativas podem compreender pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade de sequência com a sequência alvo dada, em que as variantes ativas retêm atividade biológica e, portanto, são capazes de serem reconhecidas e clivadas por um agente de nuclease de uma maneira específica da sequência. Ensaios para medir a quebra de cadeia dupla de uma sequência alvo por um agente de nuclease são conhecidos (por exemplo, ensaio TAQMAN® qPCR, Frendewey et al. (2010) Methods in Enzymology 476: 295 a 307, aqui incorporado por referência na sua totalidade para todos os efeitos).
[00291] O comprimento da sequência alvo pode variar, e inclui, por exemplo, sequências alvo que são cerca de 30 a 36 pb para um par de proteína de dedo de zinco ou nuclease de dedo de zinco (ZFN) (isto é, cerca de 15 a 18 pb para cada ZFN), cerca de 36 pb para uma proteína do tipo efetora ativador de transcrição (TALE) ou uma nuclease do tipo efetora semelhante a um ativador da transcrição (TALEN), ou cerca de 20 pb para um RNA guia CRISPR/Cas9.
[00292] A sequência alvo da proteína de ligação ao DNA ou agente de nuclease pode ser posicionada em qualquer lugar dentro ou próximo do locus genômico alvo. A sequência alvo pode estar localizada em uma região codificadora de um gene (por exemplo, o gene HSD17B13), ou dentro de
Petição 870190068171, de 18/07/2019, pág. 165/358
152/307 regiões reguladoras que influenciam a expressão do gene. Uma sequência alvo da proteína de ligação ao DNA ou agente de nuclease pode ser localizada em um íntron, um éxon, um promotor, um potenciador, uma região reguladora ou qualquer região codificadora não proteica.
[00293] Um tipo de proteína de ligação de DNA que pode ser empregada nos vários métodos e composições aqui divulgadas é um efetor semelhante a um ativador da transcrição (TALE). Um TALE pode ser fundido ou ligado a, por exemplo, um domínio de modificação epigenética, um domínio de ativação transcricional ou um domínio repressor transcricional. Exemplos de tais domínios são descritos em relação a proteínas Cas, abaixo, e também podem ser encontrados, por exemplo, em WO 2011/145121, aqui incorporados por referência na sua totalidade para todos os efeitos. Correspondentemente, um tipo de agente de nuclease que pode ser empregado nos vários métodos e composições aqui descritos é uma nuclease efetora semelhante ao ativador da transcrição (TALEN). As nucleases efetoras TAL são uma classe de nucleases específicas de sequência que podem ser usadas para fazer quebras de fita dupla em sequências alvo específicas no genoma de um organismo procariótico ou eucariótico. As nucleases efectoras TAL são criadas através da fusão de um efetor nativo ou manipulador de transcrição (TAL) modificado ou parte funcional do mesmo, ao domínio catalítico de uma endonuclease tal como FokI. O único domínio de ligação de DNA efetor TAL modular permite o projeto de proteínas com potencialmente qualquer especificidade de reconhecimento de DNA. Assim, os domínios de ligação ao DNA das nucleases efetoras TAL podem ser manipulados para reconhecer locais alvo de DNA específicos e assim, utilizados para fazer quebras de cadeia dupla nas sequências alvo desejadas. Ver WO 2010/079430; Morbitzer et al. (2010) Proc. Natl. Acad. Sei. USA 107 50: 21617 a 21622; Scholze & Boch (2010) Virulence 1: 428 a 432; Christian et al. (2010) Genetics 186: 757 a 761; Li et al. (2011) Nucleic Acids Res. 39 (1): 359-372 e Miller et al.
Petição 870190068171, de 18/07/2019, pág. 166/358
153/307 (2011) Nature Biotechnology 29: 143 a 148, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos.
[00294] Exemplos de nucleases TAL adequadas, e métodos para preparar nucleases de TAL adequadas, são divulgados, por exemplo, em US 2011/0239315 Al, US 2011/0269234 Al, US 2011/0145940 Al, US 2003/0232410 Al, US 2005/0208489 Al, US 2005/0026157 Al, US 2005/0064474 Al, US 2006/0188987 Al, e US 2006/0063231 Al, cada uma das quais é aqui incorporada por referência na sua totalidade para todos os efeitos. Em várias modalidades, as nucleases efetoras TAL são manipuladas que cortam ou aproximam uma sequência de ácido nucleico alvo em, por exemplo, um locus genômico de interesse, em que a sequência de ácido nucleico alvo está em uma sequência ou próxima a ser modificada por uma sequência de doador exógeno. As nucleases TAL adequadas para utilização com os vários métodos e composições aqui providos incluem aquelas que são especificamente concebidas para se ligarem a sequências de ácido nucleico alvo, ou próximo delas, para serem modificadas por sequências de doadores exógenos, como aqui descrito em outro local.
[00295] Em alguns TALENs, cada monômero do TALEN compreende 33 a 35 repetições TAL que reconhecem um único par de bases via dois resíduos hipervariáveis. Em alguns TALENs, o agente de nuclease é uma proteína quimérica compreendendo um domínio de ligação ao DNA baseado em repetição de TAL operativamente ligado a uma nuclease independente, tal como uma endonuclease FokI. Por exemplo, o agente de nuclease pode compreender um primeiro domínio de ligação ao DNA baseado na repetição TAL e um segundo domínio de ligação ao DNA baseado na repetição TAL, em que cada um dos primeiros e segundos domínios de ligação ao DNA baseados na repetição TAL está operacionalmente ligado a uma nuclease de FokI, em que o primeiro e o segundo domínios de ligação ao DNA baseado na repetição TAL reconhecem duas sequências de DNA alvo contíguas em cada
Petição 870190068171, de 18/07/2019, pág. 167/358
154/307 cadeia da sequência de DNA alvo separadas por uma sequência espaçadora de comprimento variável (12 a 20 pb) e em que as subunidades de nuclease de Fokl dimerizam para criar uma nuclease ativa que faz com que uma cadeia dupla se quebre em uma sequência alvo.
[00296] Outro exemplo de uma proteína de ligação de DNA é uma proteína de dedo de zinco. Tais proteínas de dedo de zinco podem ser ligadas ou fundidas a, por exemplo, um domínio de modificação epigenético, um domínio de ativação transcricional ou um domínio repressor da transcrição. Exemplos de tais domínios são descritos em relação a proteínas Cas, abaixo, e também podem ser encontrados, por exemplo, em WO 2011/145121, aqui incorporado por referência na sua totalidade para todos os efeitos. Correspondentemente, outro exemplo de um agente de nuclease que pode ser empregado nos vários métodos e composições aqui descritos é uma nuclease de dedo de zinco (ZFN). Em algumas ZFNs, cada monômero da ZFN compreende três ou mais domínios de ligação de DNA baseados em dedos de zinco, em que cada domínio de ligação de DNA baseado em dedo de zinco se liga a um subsítio de 3 pb. Em outras ZFNs, a ZFN é uma proteína quimérica compreendendo um domínio de ligação ao DNA baseado no dedo de zinco operativamente ligado a uma nuclease independente, tal como uma endonuclease Fokl. Por exemplo, o agente de nuclease pode compreender uma primeira ZFN e uma segunda ZFN, em que cada uma das primeiras ZFN e a segunda ZFN estão operacionalmente ligadas a uma subunidade de nuclease Fokl, em que a primeira e a segunda ZFNs reconhecem duas sequências de DNA alvo contíguas em cada cadeia da sequência de DNA alvo separada por espaço de cerca de 5 a 7 pb e em que as subunidades de nuclease de Fokl dimerizam para criar uma nuclease ativa que faz uma quebra de cadeia dupla. Ver, por exemplo, US 2006/0246567; US 2008/0182332; US 2002/0081614; US 2003/0021776; WO 2002/057308 A2; US 2013/0123484; US 2010/0291048; WO 2011/017293 A2; e Gaj et al. (2013) Trends in
Petição 870190068171, de 18/07/2019, pág. 168/358
155/307
Biotechnology 31 (7): 397 a 405, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos.
[00297] Outras proteínas de ligação a DNA e agentes de nuclease adequados para utilização nos métodos e composições aqui descritos incluem sistemas CRISPR-Cas, que são aqui descritos em outra parte.
[00298] A proteína de ligação a DNA ou agente de nuclease pode ser introduzida na célula por qualquer meio conhecido. Um polipeptídeo que codifica a proteína de ligação ao DNA ou o agente de nuclease pode ser introduzido diretamente na célula. Altemativamente, um polinucleotídeo que codifica a proteína de ligação ao DNA ou o agente de nuclease pode ser introduzido na célula. Quando um polinucleotídeo que codifica a proteína de ligação ao DNA ou o agente de nuclease é introduzido na célula, a proteína de ligação ao DNA ou o agente de nuclease podem ser transientemente, condicionalmente ou constitutivamente expressos dentro da célula. Por exemplo, o polinucleotídeo que codifica a proteína de ligação ao DNA ou o agente de nuclease pode estar contido em um cassete de expressão e estar operacionalmente ligado a um promotor condicional, um promotor indutível, um promotor constitutivo ou um promotor específico do tecido. Tais promotores são discutidos em maior detalhe em outro local aqui. Altemativamente, a proteína de ligação ao DNA ou o agente de nuclease podem ser introduzidos na célula como um RNAm que codifica uma proteína de ligação ao DNA ou um agente de nuclease.
[00299] Um polinucleotídeo que codifica uma proteína de ligação ao DNA ou um agente de nuclease pode ser integrado de forma estável no genoma da célula e operativamente ligado a um promotor ativo na célula. Altemativamente, um polinucleotídeo que codifica uma proteína de ligação ao DNA ou agente de nuclease pode estar em um vetor de direcionamento ou em um vetor ou um plasmídeo que é separado do vetor de direcionamento compreendendo o polinucleotídeo de inserção.
Petição 870190068171, de 18/07/2019, pág. 169/358
156/307 [00300] Quando a proteína de ligação ao DNA ou agente de nuclease é provido à célula através da introdução de um polinucleotídeo que codifica a proteína de ligação ao DNA ou agente de nuclease, tal polinucleotídeo que codifica uma proteína de ligação ao DNA ou agente de nuclease pode ser modificado para substituir códons com uma frequência de utilização mais elevada na célula de interesse, em comparação com a sequência polinucleotídica de ocorrência natural que codifica a proteína de ligação ao DNA ou o agente de nuclease. Por exemplo, o polinucleotídeo que codifica a proteína de ligação ao DNA ou o agente de nuclease pode ser modificado para substituir códons com uma frequência de utilização mais elevada em uma dada célula procariota ou eucariota de interesse, incluindo uma célula bacteriana, uma célula de levedura, uma célula humana, uma célula não humana, uma célula de mamífero, uma célula de roedor, uma célula de camundongo, uma célula de rato ou qualquer outra célula hospedeira de interesse, em comparação com a sequência polinucleotídica de ocorrência natural.
E. Sistemas CRISPR-Cas [00301] Os métodos aqui divulgados podem utilizar sistemas de repetições palindrômicas curtas agrupadas e regularmente interespaçadas (CRISPR)/ associadas a CRISPR (Cas) ou componentes de tais sistemas para modificar um genoma dentro de uma célula. Os sistemas CRISPR-Cas incluem transcrições e outros elementos envolvidos na expressão ou no direcionamento da atividade dos genes de Cas. Um sistema CRISPR-Cas pode ser do tipo I, tipo II ou tipo III. Altemativamente, um sistema CRISPR/Cas pode ser, por exemplo, um sistema de tipo V (por exemplo, subtipo V-A ou subtipo V-B). Os métodos e composições aqui divulgados podem empregar sistemas CRISPR-Cas utilizando complexos CRISPR (compreendendo um RNA guia (RNAg) complexado com uma proteína Cas) para clivagem direcionada ao local de ácidos nucleicos.
Petição 870190068171, de 18/07/2019, pág. 170/358
157 / 307 [00302] Os sistemas CRISPR-Cas utilizados nos métodos aqui divulgados podem ser de ocorrência não natural. Um sistema “não natural” inclui qualquer coisa indicando o envolvimento da mão do homem, tal como um ou mais componentes do sistema sendo alterados ou mutados de seu estado natural, sendo pelo menos substancialmente livres de pelo menos um outro componente com que estão naturalmente associados na natureza ou associados a pelo menos um outro componente com o qual não estão naturalmente associados. Por exemplo, os sistemas CRISPR/Cas não naturais podem utilizar complexos CRISPR compreendendo um RNAg e uma proteína Cas que não ocorrem naturalmente em conjunto, uma proteína Cas que não ocorre naturalmente ou um RNAg que não ocorre naturalmente.
(1) Proteínas Cas e Polinucleotídeos que Codificam Proteínas Cas [00303] As proteínas Cas geralmente compreendem pelo menos um domínio de reconhecimento ou ligação de RNA que pode interagir com RNAs guia (RNAgs, descritos em mais detalhes abaixo). As proteínas Cas podem também compreender domínios de nuclease (por exemplo, domínios DNase ou RNase), domínios de ligação ao DNA, domínios de helicase, domínios de interação proteína-proteína, domínios de dimerização e outros domínios. Um domínio de nuclease possui atividade catalítica para clivagem de ácido nucleico, que inclui a quebra das ligações covalentes de uma molécula de ácido nucleico. A clivagem pode produzir extremidades cegas ou extremidades escalonadas e pode ser de fita simples ou dupla. Por exemplo, uma proteína Cas9 do tipo selvagem irá tipicamente criar um produto de clivagem sem corte. Altemativamente, uma proteína Cpfl de tipo selvagem (por exemplo, FnCpfl) pode resultar em num produto de clivagem com um 5nucleotídeo saliente 5', ocorrendo a clivagem após o 18° par de bases da sequência PAM no filamento não alvo e após a 23a base na vertente alvo. Uma proteína Cas pode ter atividade de clivagem completa para criar uma quebra de cadeia dupla no gene HSD17B13 (por exemplo, uma quebra de
Petição 870190068171, de 18/07/2019, pág. 171/358
158/307 cadeia dupla com extremidades cegas), ou pode ser uma nickase que cria uma quebra de cadeia simples no gene HSD17B13.
[00304] Exemplos de proteínas Cas incluem Casl, CaslB, Cas2, Cas3, Cas4, Cas5, Cas5e (CasD), Cas6, Casóe, Casóf, Cas7, Cas8al, Cas8a2, Cas8b, Cas8c, Cas9 (Csnl ou Csxl2), CaslO, CaslOd, CasF, CasG, CasH, Csyl, Csy2, Csy3, Csel (CasA), Cse2 (CasB), Cse3 (CasE), Cse4 (CasC), Cscl, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmrl, Cmr3, Cmr4, Cmr5, Cmr6, Csbl, Csb2, Csb3, Csxl7, Csxl4, CsxlO, Csxló, CsaX, Csx3, Csxl, Csxl5, Csfl, Csf2, Csf3, Csf4 e Cul966, e homólogos ou versões modificadas das mesmas.
[00305] Uma proteína Cas exemplar é uma proteína Cas9 ou uma proteína derivada de uma proteína Cas9 de um sistema CRISPR/Cas tipo II. As proteínas Cas9 são de um sistema CRISPR/Cas tipo II e normalmente compartilham quatro motivos chave com uma estrutura conservada. Os motivos 1, 2 e 4 são motivos semelhantes a RuvC e o motivo 3 é um motivo HNH. Proteínas Cas9 exemplificativos são de Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Staphylococcus aureus, Nocardiopsis dassonvillei, pristinaespiralis Streptomyces, Streptomyces viridochromogenes, Streptomyces viridochromogenes, Streptosporangium roseum, Streptosporangium roseum, Alicyclobacillus acidocaldarius, Bacillus pseudomycoides, Bacillus selenitireducens, Exiguobacterium sibiricum, Lactobacillus delbrueckii, Lactobacillus salivarius, Microscilla marina, Bactéria Burkholderiales, Polaromonas naftalenivorans, Polaromonas sp., Crocosphaera watsonii, Cyanothece sp., Microcystis aeruginosa, Synechococcus sp., Acetohalobium arabaticum, Ammonifex degensii, Caldicelulosiruptor beccii, Candidatus desulforudis, Clostridium botulinum, Clostridium difficile, Finegoldia magna, Natranaerobius thermophilus, Pelotomaculum thermopropionicum, Acidithiobacillus caldus, Acidithiobacillus ferrooxidans, Alocromatium vino sum, Marinobacter sp.,
Petição 870190068171, de 18/07/2019, pág. 172/358
159/307
Nitrosococcus halophilus, Nitrosococcus watsoni, Pseudoalteromonas haloplanktis, Ktedonobacter racemifer, Methanohalobium evestigatum, Anabaena variabilis, Nodularia spumigena, Nostoc sp., Arthrospira maxima, Arthrospira platensis, Arthrospira sp., Lyngbya sp., Microcoleus chthonoplastes, Oscillatoria sp., Petrotoga mobilis, Thermosipho africanus, ou Acaryochloris marina. Exemplos adicionais dos membros da família de Cas9 são descritos em WO 2014/131833, aqui incorporado por referência na sua totalidade para todos os efeitos. Cas9 de S. pyogenes (SpCas9) (designado pelo número de acesso SwissProt Q99ZW2) é uma proteína Cas9 exemplificativa. Cas9 de S. aureus (SaCas9) (designado pelo número de acesso J7RUA5 da UniProt) é outra proteína Cas9 exemplificativa.
[00306] Outro exemplo de uma proteína Cas é uma proteína Cpfl (CRISPR de Prevotella e Francisella 1). Cpfl é uma proteína grande (cerca de 1300 aminoácidos) que contém um domínio de nuclease semelhante a RuvC homólogo ao domínio correspondente de Cas9, juntamente com uma contrapartida ao agregado rico em arginina característico de Cas9. No entanto, a Cpfl não possui o domínio nuclease HNH que está presente nas proteínas Cas9, e o domínio semelhante a RuvC é contíguo na sequência Cpfl, em contraste com Cas9, onde contém inserções longas, incluindo o domínio HNH. Ver, por exemplo, Zetsche et al. (2015) Cell 163 (3): 759 a 771, aqui incorporado por referência na sua totalidade para todos os efeitos. Proteínas Cpfl exemplares são de Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, bactia Lachnospiraceae MC2017 1, Butirivibrio proteoclasticus, bactia Peregrinibacteria GW201 l_GWA2_33_10, bactia Parcubacteria GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, bactia Lachnospiraceae MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, bactia Lachnospiraceae ND2006, Porphyromonas crevioricanis 3, Prevotella disiens, e Porphyromonas
Petição 870190068171, de 18/07/2019, pág. 173/358
160/307 macacae. Cpfl de Francisella novicida U112 (FnCpfl; designado pelo número de acesso A0Q7Q2 da UniProt) é uma proteína Cpfl exemplificativa. [00307] As proteínas Cas podem ser proteínas do tipo selvagem (isto é, aquelas que ocorrem na natureza), proteínas Cas modificadas (isto é, variantes da proteína Cas) ou fragmentos de proteínas Cas do tipo selvagem ou modificadas. As proteínas Cas também podem ser variantes ou fragmentos ativos em relação à atividade catalítica de proteínas Cas tipo selvagem ou modificadas. As variantes ativas ou fragmentos em relação à atividade catalítica podem compreender pelo menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade de sequência ao tipo selvagem ou proteína Cas modificada ou uma porção da mesma, em que as variantes ativas mantêm a capacidade para cortar em um sítio de clivagem desejado e, deste modo, reter a atividade indutora de corte ou de indução de quebra de cadeia dupla. Ensaios para indução de corte ou atividade de indução de quebra de cadeia dupla são conhecidos e geralmente medem a atividade global e especificidade da proteína Cas em substratos de DNA contendo o sítio de clivagem.
[00308] As proteínas Cas podem ser modificadas para aumentar ou diminuir uma ou mais da afinidade de ligação do ácido nucleico, especificidade de ligação ao ácido nucleico e atividade enzimática. As proteínas Cas também podem ser modificadas para alterar qualquer outra atividade ou propriedade da proteína, como a estabilidade. Por exemplo, um ou mais domínios de nuclease da proteína Cas podem ser modificados, eliminados ou inativados, ou uma proteína Cas pode ser truncada para remover domínios que não são essenciais para a função da proteína ou para otimizar (por exemplo, aumentar ou reduzir) a atividade da proteína Cas.
[00309] As proteínas Cas podem compreender pelo menos um domínio de nuclease, tal como um domínio de DNase. Por exemplo, uma proteína Cpfl do tipo selvagem compreende geralmente um domínio semelhante a
Petição 870190068171, de 18/07/2019, pág. 174/358
161/307
RuvC que cliva ambas as cadeias do DNA alvo, talvez em uma configuração dimérica. As proteínas Cas podem também compreender pelo menos dois domínios de nuclease, tais como os domínios da DNAase. Por exemplo, uma proteína Cas9 de tipo selvagem compreende geralmente um domínio de nuclease semelhante a RuvC e um domínio de nuclease semelhante a HNH. Os domínios RuvC e HNH podem, cada um, cortar uma cadeia diferente de DNA de cadeia dupla para fazer uma quebra de cadeia dupla no DNA. Ver, por exemplo, Jinek et al. (2012) Science 337: 816 a 821, aqui incorporado por referência na sua totalidade para todos os efeitos.
[00310] Um ou mais dos domínios de nuclease podem ser eliminados ou mutados de modo que eles não são mais funcionais ou têm reduzida atividade de nuclease. Por exemplo, se um dos domínios de nuclease é eliminado ou mutado em uma proteína Cas9, a proteína Cas9 resultante pode ser referida como uma nickase e pode gerar uma quebra de fita simples em uma sequência alvo de RNA guia dentro de um DNA de fita dupla, mas não uma quebra de fita dupla (isto é, pode clivar a fita complementar ou a fita não complementar, mas não ambas). Se ambos os domínios de nuclease forem eliminados ou mutados, a proteína Cas resultante (por exemplo, Cas9) terá uma capacidade reduzida de clivar as duas cadeias de um DNA de fita dupla (por exemplo, uma proteína Cas nuclease-nuclease-inativa, ou uma proteína Cas cataliticamente morta (dCas). Um exemplo de uma mutação que converte Cas9 em uma nickase é uma mutação D10A (aspartato para alanina na posição 10 de Cas9) no domínio RuvC de Cas9 de S. pyogenes. Do mesmo modo, H939A (histidina para alanina na posição de aminoácido 839) ou H840A (histidina para alanina na posição de aminoácido 840) no domínio HNH de Cas9 de S. pyogenes pode converter o Cas9 em uma nickase. Outros exemplos de mutações que convertem Cas9 em uma nickase incluem as mutações correspondentes a Cas9 de S. thermophilus. Ver, por exemplo, Sapranauskas et al. (2011) Nucleic Acids Research 39: 9275 a 9282 e WO
Petição 870190068171, de 18/07/2019, pág. 175/358
162/307
2013/141680, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos. Tais mutações podem ser geradas utilizando métodos, tais como mutagênese direcionada ao local, mutagênese mediada por PCR ou síntese do gene total. Exemplos de outras mutações que criam nickases podem ser encontrados, por exemplo, nos documentos WO 2013/176772 e WO 2013/142578, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos.
[00311] As proteínas Cas (por exemplo, proteínas Cas ativas por nuclease ou proteínas Cas inativas por nuclease) podem também ser operativamente ligadas a polipeptídeos heterólogos como proteínas de fusão. Por exemplo, uma proteína Cas pode ser fundida com um domínio de clivagem, um domínio de modificação epigenético, um domínio de ativação transcricional ou um domínio repressor da transcrição. Ver WO 2014/089290, aqui incorporado por referência na sua totalidade para todos os efeitos. Exemplos de domínios de ativação transcricional incluem um domínio de ativação VP16 do vírus herpes simplex, VP64 (que é um derivado tetramérico de VP16), um domínio de ativação NFkB p65, domínios de ativação p53 1 e 2, um domínio de ativação CREB (proteína de ligação de elemento de resposta a cAMP), um domínio de ativação E2A e um domínio de ativação NFAT (fator nuclear de células T ativadas). Outros exemplos incluem domínios de ativação de Octi, Oct-2A, SP1, AP-2, CTF1, P300, PCP, PCAF, SRC1, PvALF, ERF-2, OsGAI, HALF-1, Cl, API, ARF-5, ARF- 6, ARF-7, ARF-8, CPF1, CPRF4, MYC-RP/GP, TRAB1PC4 e HSF1. Ver, por exemplo, US 2016/0237456, EP3045537 e WO 2011/145121, cada um dos quais é incorporado por referência na sua totalidade para todos os efeitos. Em alguns casos, pode ser utilizado um sistema de ativação transcricional compreendendo uma proteína de fusão dCas9-VP64 emparelhada com MS2p65-HSFl. RNAs guia em tais sistemas podem ser projetados com sequências de aptâmero anexadas a sgRNA tetraloop e tronco-laço 2 projetados para
Petição 870190068171, de 18/07/2019, pág. 176/358
163/307 ligar proteínas de revestimento de bacteriófago MS2 dimerizadas. Ver, por exemplo, Konermann et al. (2015) Nature 517 (7536): 583 a 588, aqui incorporado por referência na sua totalidade para todos os efeitos. Exemplos de domínios repressores da transcrição incluem domínios repressores iniciais de cAMP indutíveis (ICER), domínios repressores da caixa A associados a Kruppel (KRAB-A), domínios repressores ricos em glicina YY1, repressores do tipo Spl, repressores E (spl), repressores kk e MeCP2 . Outros exemplos incluem domínios repressores da transcrição de genes primários indutíveis de A/B, KOX, TGF-beta (TIEG), v-erbA, SID, SID4X, MBD2, MBD3, DNMT1, DNMG3A, DNMT3B, Rb, R0M2, ver, por exemplo, EP3045537 e WO 2011/145121, cada um dos quais é incorporado por referência na sua totalidade para todos os efeitos. As proteínas Cas também podem ser fundidas a um polipeptídeo heterólogo, proporcionando estabilidade aumentada ou diminuída. O domínio fundido ou polipeptídeo heterólogo pode estar localizado no terminal N, no terminal C ou intemamente na proteína Cas.
[00312] Como um exemplo, uma proteína Cas pode ser fundida a um polipeptídeo heterólogo que fornece localização subcelular. Tais polipeptídeos heterólogos podem incluir, por exemplo, um ou mais sinais de localização nuclear (NLS), tais como o SV40 NLS para direcionamento para o núcleo, um sinal de localização mitocondrial para direcionamento para a mitocôndria, um sinal de retenção ER e semelhantes. Ver, por exemplo, Lange et al. (2007) J. Biol. Chem. 282: 5101 a 5105, aqui incorporado por referência na sua totalidade para todos os efeitos. Tais sinais de localização subcelular podem estar localizados no terminal N, no terminal C ou em qualquer local dentro da proteína Cas. Um NLS pode compreender uma extensão de aminoácidos básicos e pode ser uma sequência monopartida ou uma sequência bipartida.
[00313] As proteínas Cas também podem estar operativamente ligadas a um domínio de penetração celular. Por exemplo, o domínio de penetração
Petição 870190068171, de 18/07/2019, pág. 177/358
164/307 celular pode ser derivado da proteína HIV-1 TAT, o motivo de penetração celular TLM do vírus da hepatite B humano, MPG, Pep-1, VP22, um peptídeo de penetração celular do vírus Herpes simplex, ou um sequência peptídica de poliarginina. Ver, por exemplo, WO 2014/089290, aqui incorporado por referência na sua totalidade para todos os efeitos. O domínio de penetração celular pode estar localizado no terminal N, no terminal C ou em qualquer parte da proteína Cas.
[00314] As proteínas Cas também podem ser operacionalmente ligadas a um polipeptídeo heterólogo para facilidade de rastreamento ou purificação, como uma proteína fluorescente, uma etiqueta de purificação ou uma etiqueta epitópica. Exemplos de proteínas fluorescentes incluem proteínas fluorescentes verdes (por exemplo, GFP, GFP-2, tagGFP, turboGFP, eGFP, Esmeralda, Azami Green, Monomérico Azami Verde, CopGFP, AceGFP, ZsGreenl), proteínas fluorescentes amarelas (por exemplo, YFP, eYFP, Citrine, Venus, YPet, PhiYFP, ZsYellowl), proteínas fluorescentes azuis (por exemplo, eBFP, eBFP2, Azurite, mKalamal, GFPuv, safira, T-safira), proteínas fluorescentes ciano (por exemplo, eCFP, Cerulean, CyPet, AmCyanl, Midoriishi-Cyan), proteínas fluorescentes vermelhas (por exemplo, mKate, mKate2, mPlum, monômero DsRed, mCherry, mRFPl, DsRedExpress, DsRed2, DsRed-Monômero, HcRed-Tandem, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, Jred), proteínas fluorescentes laranja (por exemplo, mOrange, mKO, Kusabira-Laranja, Monomérica KusabiraLaranja, mTangerina, tdTomato), e qualquer outra proteína fluorescente adequada. Exemplos de etiquetas incluem glutationa-S-transferase (GST), proteína de ligação a quitina (CBP), proteína de ligação a maltose, tiorredoxina (TRX), poli(NANP), etiqueta de purificação por afinidade em tandem (TAP), myc, AcV5, AU1, AU5, E, ECS, E2, BANDEIRA, hemaglutinina (HA), nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, Sl, T7, V5, VSV-G, histidina (His), proteína transportadora de
Petição 870190068171, de 18/07/2019, pág. 178/358
165/307 biotina carboxila (BCCP) e calmodulina.
[00315] As proteínas Cas também podem ser ligadas a sequências de doador exógeno ou a ácidos nucleicos marcados. Essa amarração (isto é, ligação física) pode ser alcançada através de interações covalentes ou interações não covalentes, e a fixação pode ser direta (por exemplo, através de fusão direta ou conjugação química, que pode ser alcançada por modificação de resíduos de cisteína ou lisina na proteína ou modificação), ou pode ser conseguida através de um ou mais ligantes intervenientes ou moléculas adaptadoras, tais como estreptavidina ou aptâmeros. Ver, por exemplo, Pierce et al. (2005) Mini Rev. Med. Chem. 5 (1): 41 a55; Duckworth et al. (2JÒQÍ1) Angew. Chem. Int. Ed. Engl. 46 (46): 8819 a 8822; Schaeffer e Dixon (2009) Australian J. Chem. 62 (10): 1328-1332; Goodman et al. (2009) Chembiochem. 10 (9): 1551 a 1557; e Khatwani et al. (2012) Bioorg. Med. Chem. 20 (14): 4532 a 4539, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos. Estratégias não covalentes para sintetizar conjugados de proteína-ácido nucleico incluem métodos de biotina-estreptavidina e níquel-histidina. Os conjugados proteína-ácido covalente-ácido nucleico podem ser sintetizados através da ligação de ácidos nucleicos adequadamente funcionalizados e proteínas utilizando uma ampla variedade de produtos químicos. Algumas dessas químicas envolvem a ligação direta do oligonucleotídeo a um resíduo de aminoácido na superfície da proteína (por exemplo, uma lisina amina ou um cisteína tiol), enquanto outros esquemas mais complexos requerem modificação pós-translacional da proteína ou o envolvimento de um catalisador ou domínio proteico reativo. Métodos para ligação covalente de proteínas a ácidos nucleicos podem incluir, por exemplo, reticulação química de oligonucleotídeos para resíduos de proteína lisina ou cisteína, ligação de proteína expressa, métodos quimioenzimáticos e utilização de fotoaptâmeros. A sequência de doador exógeno ou ácido nucleico marcado pode ser ligada ao terminal C, ao terminal N ou a
Petição 870190068171, de 18/07/2019, pág. 179/358
166/307 uma região interna da proteína Cas. De um modo preferido, a sequência de doador exógeno ou ácido nucleico marcado está amarrada ao terminal C ou ao terminal N da proteína Cas. Do mesmo modo, a proteína Cas pode ser ligada à extremidade 5', à extremidade 3', ou a uma região interna dentro da sequência de doador exógeno ou ácido nucleico marcado. Isto é, a sequência de doador exógeno ou o ácido nucleico marcado podem ser amarrados em qualquer orientação e polaridade. De preferência, a proteína Cas está ligada à extremidade 5' ou à extremidade 3' da sequência de doador exógeno ou ácido nucleico marcado.
[00316] As proteínas Cas podem ser providas em qualquer forma. Por exemplo, uma proteína Cas pode ser provida na forma de uma proteína, tal como uma proteína Cas complexada com um RNAg. Alternativamente, uma proteína Cas pode ser provida na forma de um ácido nucleico que codifica a proteína Cas, tal como um RNA (por exemplo, RNA mensageiro (RNAm)) ou DNA. Opcionalmente, o ácido nucleico que codifica a proteína Cas pode ser otimizado por códon para uma translação eficiente em proteína em uma determinada célula ou organismo. Por exemplo, o ácido nucleico que codifica a proteína Cas pode ser modificado para substituir códons com uma frequência de utilização mais elevada em uma célula bacteriana, uma célula de levedura, uma célula humana, uma célula não humana, uma célula de mamífero, uma célula de roedor, célula de camundongo, uma célula de rato ou qualquer outra célula hospedeira de interesse, em comparação com a sequência polinucleotídica de ocorrência natural. Quando um ácido nucleico que codifica a proteína Cas é introduzido na célula, a proteína Cas pode ser expressa transitoriamente, condicionalmente ou constitutivamente na célula.
[00317] Os ácidos nucleicos que codificam as proteínas Cas podem ser integrados de forma estável no genoma da célula e operativamente ligados a um promotor ativo na célula. Altemativamente, os ácidos nucleicos que codificam as proteínas Cas podem ser operativamente ligados a um promotor
Petição 870190068171, de 18/07/2019, pág. 180/358
167 / 307 em um construto de expressão. Os construtos de expressão incluem quaisquer construtos de ácido nucleico capazes de direcionar a expressão de um gene ou outra sequência de ácido nucleico de interesse (por exemplo, um gene Cas) e que podem transferir tal sequência de ácido nucleico de interesse para uma célula alvo. Por exemplo, o ácido nucleico que codifica a proteína Cas pode estar em um vetor de direcionamento que compreende um inserto de ácido nucleico e/ou um vetor que compreende um DNA que codifica um RNAg. Altemativamente, pode estar em um vetor ou plasmídeo que é separado do vetor de direcionamento que compreende o inserto de ácido nucleico e/ou separado do vetor que compreende o DNA que codifica o RNAg. Os promotores que podem ser utilizados em um construto de expressão incluem promotores ativos, por exemplo, em uma ou mais de uma célula eucariótica, uma célula humana, uma célula não humana, uma célula de mamífero, uma célula de mamífero não humana, uma célula de roedor, uma célula de camundongo, uma célula de rato, uma célula de hamster, uma célula de coelho, uma célula pluripotente, uma célula estaminal embrionária (ES) ou um zigoto. Tais promotores podem ser, por exemplo, promotores condicionais, promotores indutíveis, promotores constitutivos ou promotores específicos de tecidos. Opcionalmente, o promotor pode ser um promotor bidirecional que direciona a expressão de uma proteína Cas em uma direção e de um RNA guia na outra direção. Tais promotores bidirecionais podem consistir em (1) um promotor Pol III completo, convencional, unidirecional, que contém 3 elementos de controle externos: um elemento de sequência distal (DSE), um elemento de sequência proximal (PSE) e uma caixa TATA; e (2) um segundo promotor básico Pol III que inclui uma caixa de PSE e TATA fundida ao terminal 5' do DSE na orientação inversa. Por exemplo, no promotor Hl, o DSE é adjacente ao PSE e à caixa TATA, e o promotor pode se tomar bidirecional criando um promotor híbrido no qual a transcrição na direção reversa é controlada anexando uma caixa PSE e TATA derivada do
Petição 870190068171, de 18/07/2019, pág. 181/358
168/307 promotor U6. Ver, por exemplo, o documento US 2016/0074535, aqui incorporado por referências na sua totalidade para todos os efeitos. A utilização de um promotor bidirecional para expressar genes que codificam uma proteína Cas e um RNA guia permite simultaneamente a geração de cassetes de expressão compactos para facilitar a entrega.
(2) RNAs guia [00318] Um “RNA guia” ou “RNAg” é uma molécula de RNA que se liga a uma proteína Cas (por exemplo, proteína Cas9) e tem como alvo a proteína Cas para um local específico dentro de um DNA alvo (por exemplo, o gene HSD17B13). Em particular, são aqui divulgados RNAs guia eficazes para direcionar uma enzima de Cas para se ligar ou clivar um locus de HSD17B13 ou gene HSD17B13. Um RNA guia exemplificativo é um RNA guia eficaz para direcionar uma enzima Cas para se ligar ou clivar um gene HSD17B13, em que o RNA guia compreende um segmento alvo de DNA que hibridiza com uma sequência guia de reconhecimento de RNA (isto é, direciona uma sequência alvo de RNA guia) dentro do gene HSD17B13 que inclui ou está próximo de uma posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2. Por direcionar uma sequência alvo de RNA guia significa hibridizar com a sequência de filamento complementar que é o complemento inverso da sequência alvo de RNA guia na cadeia não complementar. Por exemplo, a sequência alvo de RNA guia pode estar dentro de cerca de 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos de uma posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2. Outros RNAs exemplificativos compreendem um segmento direcionado para DNA que tem como alvo uma sequência alvo RNA guia dentro do gene HSD17B13 que está dentro de uma região correspondente éxon 6 e/ou íntron 6 de SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com SEQ ID
Petição 870190068171, de 18/07/2019, pág. 182/358
169/307
NO: 2. Outros RNAs guia exemplares compreendem um segmento direcionado para DNA que tem como alvo uma sequência alvo de RNA guia dentro do gene HSD17B13 que é em uma região correspondente ao éxon 6 e/ou ao íntron 6 e/ou éxon 7 da SEQ ID NO: 2, quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2. Outros RNAs guia exemplares compreendem um segmento direcionado para DNA que hibridiza com uma sequência guia de reconhecimento de RNA (ou seja, tem como alvo uma sequência alvo de RNA guia) dentro do gene HSD17B13 que inclui ou está próximo do códon de iniciação do gene HSD17B13 ou inclui ou está próximo do códon de terminação do gene HSD17B13. Por exemplo, a sequência alvo de RNA guia pode estar dentro de cerca de 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos do códon de iniciação ou em cerca de 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos do códon de terminação. Por exemplo, a sequência alvo de RNA guia pode estar dentro de uma região correspondente ao éxon 1 das SEQ ID NOS: 1 ou 2 quando o gene HSD17B13 está perfeitamente alinhado com SEQ ID NOS: 1 ou 2. Da mesma forma, a sequência alvo de RNA guia pode ser em uma região correspondente ao éxon 7 das SEQ ID NOS: 1 ou 2, quando o gene HSD17B13 está perfeitamente alinhado com as SEQ ID NOS: 1 ou 2. O gene HSD17B13 pode ser um gene HSD17B13 de qualquer organismo. Por exemplo, o gene HSD17B13 pode ser um gene HSD17B13 humano ou um ortólogo de outro organismo, tal como um mamífero não humano, um roedor, um camundongo ou um rato.
[00319] Exemplos de sequências alvo de RNA guia na extremidade 5' do gene HSD17B13 humano compreendem, consistem essencialmente em, ou consistem nas sequências apresentadas nas SEQ ID NOS: 20 a 81 e são apresentadas na tabela abaixo. Exemplos de segmentos de direcionamento de DNA de RNA guia correspondentes às SEQ ID NOS: 20 a 81 estão apresentados na tabela abaixo e são idênticos às SEQ ID NOS: 20 a 81,
Petição 870190068171, de 18/07/2019, pág. 183/358
170 / 307 exceto com uracilas em vez de tiaminas. Um segmento de direcionamento de DNA de RNA de guia pode compreender, consistir essencialmente em, ou consistir em qualquer das sequências de segmento de direcionamento de DNA apresentadas na tabela abaixo. Exemplos de sequências alvo de RNA guia adjacentes ao local de iniciação da transcrição (TSS) do gene HSD17B13 humano compreendem, consistem essencialmente em, ou consistem nas sequências apresentadas nas SEQ ID NOS: 20 a 41 e estão apresentadas na tabela abaixo. Sequências alvo de RNA guia exemplares adjacentes ao TSS incluem as SEQ ID NOS: 21 a 23, 33 e 35. SEQ ID NOS: 33 e 35 estão mais perto do TSS. CrRNAs e SgRNA exemplificativos (compreendendo a estrutura de suporte 1, 2, 3 ou 4) correspondendo às sequências alvo de RNA guia na extremidade 5' do gene HSD17B13 humano compreendem, consistem essencialmente em, ou consistem em qualquer uma das sequências estabelecidas na tabela abaixo.
Sequências Alvo de RNA Guia na extremidade 5’ do Gene HSD17B13
Humano
Fita PAM Sequência alvo de RNA guia SEQ ID NO
Seq. alvo de RNAg Segmento de direcionamento de DNA crRNA sgRNA
v2 v3 v4
- GGG TGTCAGGTTAGTTAGATGAA 42 1423 270 500 730 960 1190
- AGG GTGTCAGGTTAGTTAGATGA 43 1424 271 501 731 961 1191
+ AGG CCTGACACATATACAGACTA 44 1425 272 502 732 962 1192
+ GGG CTGACACATATACAGACTAA 45 1426 273 503 733 963 1193
- AGG CCTTAGTCTGTATATGTGTC 46 1427 274 504 734 964 1194
+ AGG CATATACAGACTAAGGGACC 47 1428 275 505 735 965 1195
+ GGG ATATACAGACTAAGGGACCA 48 1429 276 506 736 966 1196
- TGG TCAAAGTTTGATAAATTCCC 49 1430 277 507 737 967 1197
+ TGG AAAATACAAAGATAAGTAGA 50 1431 278 508 738 968 1198
+ TGG ACTCTGTGACTTTAAAAAGT 51 1432 279 509 739 969 1199
- AGG GGTTCTGTGGGATATTAATA 52 1433 280 510 740 970 1200
- GGG ACAGAGCATATTGGTTCTGT 53 1434 281 511 741 971 1201
- TGG GACAGAGCATATTGGTTCTG 54 1435 282 512 742 972 1202
- TGG TGCAAAACGACAGAGCATAT 55 1436 283 513 743 973 1203
- AGG GAGCTGGGCATGGAATAGGC 56 1437 284 514 744 974 1204
- AGG ACTGGAGCTGGGCATGGAAT 57 1438 285 515 745 975 1205
- TGG CTCATTACTGGAGCTGGGCA 58 1439 286 516 746 976 1206
- GGG TTGTTCTCATTACTGGAGCT 59 1440 287 517 747 977 1207
Petição 870190068171, de 18/07/2019, pág. 184/358
171/307
£ s PAM Sequência alvo de RNA guia SEQ ID NO
- TGG ATTGTTCTCATTACTGGAGC 60 1441 288 518 748 978 1208
- TGG GGGGAGATTGTTCTCATTAC 61 1442 289 519 749 979 1209
- GGG GAGGAGAAAATCTGTGGCTG 62 1443 290 520 750 980 1210
- GGG AGAGGAGAAAATCTGTGGCT 63 1444 291 521 751 981 1211
- TGG CAGAGGAGAAAATCTGTGGC 64 1445 292 522 752 982 1212
- TGG TCCTCAGAGGAGAAAATCTG 65 1446 293 523 753 983 1213
- AGG TGAAGTTTTTCATTCCTCAG 20 1447 294 524 754 984 1214
+ AGG CTTCACCAACGACTCCAAGT 21 1448 295 525 755 985 1215
- TGG CTACTCCTACTTGGAGTCGT 22 1449 296 526 756 986 1216
+ TGG CTCCAAGTAGGAGTAGATGA 23 1450 297 527 757 987 1217
- TGG CACCATCATCTACTCCTACT 24 1451 298 528 758 988 1218
+ AGG TGATGGTGATCAGAAGCAGA 25 1452 299 529 759 989 1219
+ AGG TCAGAAGCAGAAGGATTTCT 26 1453 300 530 760 990 1220
+ TGG GATTTCTAGGATGATGTTCA 27 1454 301 531 761 991 1221
+ TGG TTGCTCTGTCCTCTTCCTTC 28 1455 302 532 762 992 1222
- AGG AGGACTGAACCAGAAGGAAG 29 1456 303 533 763 993 1223
- AGG TACACAAGGACTGAACCAGA 30 1457 304 534 764 994 1224
+ AGG TTCAGTCCTTGTGTAGTCCT 31 1458 305 535 765 995 1225
+ GGG TCAGTCCTTGTGTAGTCCTA 32 1459 306 536 766 996 1226
+ AGG GTCCTTGTGTAGTCCTAGGG 33 1460 307 537 767 997 1227
+ AGG CTTGTGTAGTCCTAGGGAGG 34 1461 308 538 768 998 1228
- AGG CTCCTCCCTAGGACTACACA 35 1462 309 539 769 999 1229
- AGG GTAGACAGTACCTCCTCCCT 36 1463 310 540 770 1000 1230
+ AGG TACTGTCTACACAGAGCTCT 37 1464 311 541 771 1001 1231
+ GGG ACTGTCTACACAGAGCTCTA 38 1465 312 542 772 1002 1232
+ AGG TCTACACAGAGCTCTAGGGA 39 1466 313 543 773 1003 1233
+ GGG CTACACAGAGCTCTAGGGAA 40 1467 314 544 774 1004 1234
+ GGG TACACAGAGCTCTAGGGAAG 41 1468 315 545 775 1005 1235
+ TGG GGGGTGTGCCCAGTTGTTAA 66 1469 316 546 776 1006 1236
+ GGG GGGTGTGCCCAGTTGTTAAT 67 1470 317 547 777 1007 1237
- GGG TGGTAGTCCCATTAACAACT 68 1471 318 548 778 1008 1238
- TGG CTGGTAGTCCCATTAACAAC 69 1472 319 549 779 1009 1239
+ TGG TTGTTAATGGGACTACCAGA 70 1473 320 550 780 1010 1240
+ TGG TACCAGATGGAAGCCAGCTT 71 1474 321 551 781 1011 1241
- TGG TTCCAAAGCTGGCTTCCATC 72 1475 322 552 782 1012 1242
+ AGG TGGAAGCCAGCTTTGGAAGC 73 1476 323 553 783 1013 1243
- TGG ACAAGGCCTGCTTCCAAAGC 74 1477 324 554 784 1014 1244
+ TGG GCCTTGTTCACGTGTTCTAA 75 1478 325 555 785 1015 1245
+ GGG CCTTGTTCACGTGTTCTAAT 76 1479 326 556 786 1016 1246
- AGG CCCATTAGAACACGTGAACA 77 1480 327 557 787 1017 1247
- AGG TTGGCATCACTTCATATTTG 78 1481 328 558 788 1018 1248
- TGG CTTGTGCTCTTGGCATCACT 79 1482 329 559 789 1019 1249
- TGG AGCACACTCTCTTGTGCTCT 80 1483 330 560 790 1020 1250
+ TGG GCACAAGAGAGTGTGCTCTC 81 1484 331 561 791 1021 1251
[00320] Exemplos de sequências alvo de RNA guia na extremidade 3’ do gene HSD17B13 humano compreendem, consistem essencialmente em, ou
Petição 870190068171, de 18/07/2019, pág. 185/358
172 / 307 consistem nas sequências apresentadas nas SEQ ID NOS: 82 a 225 e são apresentadas na tabela abaixo. Exemplos de segmentos de direcionamento de DNA de RNA guia correspondentes às SEQ ID NOS: 82 a 225 são apresentados nas SEQ ID NOS: 1485 a 1628, respectivamente, que são idênticas às SEQ ID NOS: 82 a 225, exceto com uracilas em vez de timinas. Um segmento de direcionamento de DNA de RNA guia pode compreender, consistir essencialmente em, ou consistir em quaisquer das sequências apresentadas nas SEQ ID NOS: 1485 a 1628. CrRNAs e SgRNAs exemplificativos (compreendendo a estrutura de suporte 1, 2, 3 ou 4) correspondente às sequências alvo de RNA guia na extremidade 3' do gene HSD17B13 humano compreendem, consistem essencialmente em, ou consistem em qualquer uma das sequências estabelecidas na tabela abaixo.
Sequências Alvo de RNA Guia na Extremidade 3’ do Gene HSD17B13
Humano
Fita PAM Sequência alvo de RNA guia SEQ ID NO
Seq. alvo de RNAg crRNA sgRNA
v2 v3 v4
+ AGG GCTTAATCTCACACATAGAA 82 332 562 792 1022 1252
+ GGG CTTAATCTCACACATAGAAA 83 333 563 793 1023 1253
+ GGG TTAATCTCACACATAGAAAG 84 334 564 794 1024 1254
- TGG AGGAGTGCTGGTTTATCAAC 85 335 565 795 1025 1255
- TGG TTCTTTGACAGCAGGAGTGC 86 336 566 796 1026 1256
- AGG ACTCTGGTTTCTTTGACAGC 87 337 567 797 1027 1257
+ TGG ACCAGAGTTGAGAAAACCCC 88 338 568 798 1028 1258
- TGG TCCAGGGGTTTTCTCAACTC 89 339 569 799 1029 1259
- GGG CAGTTATTAAATGAATCCAG 90 340 570 800 1030 1260
- GGG GCAGTTATTAAATGAATCCA 91 341 571 801 1031 1261
- AGG GGCAGTTATTAAATGAATCC 92 342 572 802 1032 1262
- TGG TGGATGGTAACAGCTACATC 93 343 573 803 1033 1263
+ TGG GCTGTTACCATCCACATCCT 94 344 574 804 1034 1264
- TGG TCAAGAACCAAGGATGTGGA 95 345 575 805 1035 1265
- TGG TCCTTCAAGAACCAAGGATG 96 346 576 806 1036 1266
- AGG TGAGTGTCCTTCAAGAACCA 97 347 577 807 1037 1267
+ AGG TTTTATTTTATAACTACAAG 98 348 578 808 1038 1268
+ AGG TTGTTTTTAATAAAAACAAG 99 349 579 809 1039 1269
- TGG TATTATAGAATGCTTTTGCA 100 350 580 810 1040 1270
+ TGG CAAGATTAGTCTTGATGTAG 101 351 581 811 1041 1271
+ GGG AAGATTAGTCTTGATGTAGT 102 352 582 812 1042 1272
+ CGG AGTCTTGATGTAGTGGGAGT 103 353 583 813 1043 1273
+ AGG TTTTTCTATTAAAAAAAAAA 104 354 584 814 1044 1274
Petição 870190068171, de 18/07/2019, pág. 186/358
173 / 307
PAM Sequência alvo de RNA guia SEQ ID NO
+ TGG TCTATTAAAAAAAAAAAGGC 105 355 585 815 1045 1275
+ GGG CTATTAAAAAAAAAAAGGCT 106 356 586 816 1046 1276
+ CGG AAAAAAAAAAAGGCTGGGCA 107 357 587 817 1047 1277
+ TGG AAAAAAAAGGCTGGGCACGG 108 358 588 818 1048 1278
+ TGG CACCCGTAATCCCAGCACTT 109 359 589 819 1049 1279
+ GGG ACCCGTAATCCCAGCACTTT 110 360 590 820 1050 1280
+ AGG CGTAATCCCAGCACTTTGGG 111 361 591 821 1051 1281
- GGG TCCCAAAGTGCTGGGATTAC 112 362 592 822 1052 1282
- CGG CTCCCAAAGTGCTGGGATTA 113 363 593 823 1053 1283
+ AGG CCCAGCACTTTGGGAGGCCG 114 364 594 824 1054 1284
- GGG CCTCGGCCTCCCAAAGTGCT 115 365 595 825 1055 1285
+ AGG GCACTTTGGGAGGCCGAGGC 116 366 596 826 1056 1286
+ TGG CTTTGGGAGGCCGAGGCAGG 117 367 597 827 1057 1287
+ AGG GCCGAGGCAGGTGGATCACG 118 368 598 828 1058 1288
- CGG ACCTCGTGATCCACCTGCCT 119 369 599 829 1059 1289
+ AGG GGCAGGTGGATCACGAGGTC 120 370 600 830 1060 1290
+ TGG TCAGGAGATCGAGACCATCT 121 371 601 831 1061 1291
+ TGG CGAGACCATCTTGGCTAACA 122 372 602 832 1062 1292
- TGG TTTCACCATGTTAGCCAAGA 123 373 603 833 1063 1293
- GGG TTGTATTTTTTGTAGAGACG 124 374 604 834 1064 1294
- GGG TTTGTATTTTTTGTAGAGAC 125 375 605 835 1065 1295
- CGG TTTTGTATTTTTTGTAGAGA 126 376 606 836 1066 1296
+ CGG AAAAAATACAAAAAATTAGC 127 377 607 837 1067 1297
+ GGG AAAAATACAAAAAATTAGCC 128 378 608 838 1068 1298
+ TGG TACAAAAAATTAGCCGGGTG 129 379 609 839 1069 1299
+ TGG AAAAAATTAGCCGGGTGTGG 130 380 610 840 1070 1300
+ CGG AAATTAGCCGGGTGTGGTGG 131 381 611 841 1071 1301
+ GGG AATTAGCCGGGTGTGGTGGC 132 382 612 842 1072 1302
- CGG CAGGCGCCCGCCACCACACC 133 383 613 843 1073 1303
+ AGG GCCTGTAGTCCCAGCTACTC 134 384 614 844 1074 1304
+ AGG TGTAGTCCCAGCTACTCAGG 135 385 615 845 1075 1305
- AGG TCCTGAGTAGCTGGGACTAC 136 386 616 846 1076 1306
+ AGG CCCAGCTACTCAGGAGGCTG 137 387 617 847 1077 1307
- GGG CCTCAGCCTCCTGAGTAGCT 138 388 618 848 1078 1308
- TGG GCCTCAGCCTCCTGAGTAGC 139 389 619 849 1079 1309
+ TGG AGGAGGCTGAGGCAGGAGAA 140 390 620 850 1080 1310
+ CGG GCAGGAGAATGGCGTGAACC 141 391 621 851 1081 1311
+ GGG CAGGAGAATGGCGTGAACCC 142 392 622 852 1082 1312
+ AGG GAGAATGGCGTGAACCCGGG 143 393 623 853 1083 1313
+ TGG AATGGCGTGAACCCGGGAGG 144 394 624 854 1084 1314
- GGG CACTGCAAGCTCCACCTCCC 145 395 625 855 1085 1315
- CGG TCACTGCAAGCTCCACCTCC 146 396 626 856 1086 1316
+ TGG CATACCACTGCACTCCAGCC 147 397 627 857 1087 1317
+ GGG ATACCACTGCACTCCAGCCT 148 398 628 858 1088 1318
- TGG TCGCCCAGGCTGGAGTGCAG 149 399 629 859 1089 1319
- TGG TCTCACTCTTTCGCCCAGGC 150 400 630 860 1090 1320
- AGG GGAGTCTCACTCTTTCGCCC 151 401 631 861 1091 1321
- TGG TGTTTTTTGTTTTTTTGAGA 152 402 632 862 1092 1322
Petição 870190068171, de 18/07/2019, pág. 187/358
174 / 307
PAM Sequência alvo de RNA guia SEQ ID NO
- TGG AGGAAGAAAGAAAGGTTTTT 153 403 633 863 1093 1323
- AGG AGAAGAAAAGGAAGAAAGAA 154 404 634 864 1094 1324
+ TGG CTTTCTTCCTTTTCTTCTCT 155 405 635 865 1095 1325
+ GGG TTTCTTCCTTTTCTTCTCTT 156 406 636 866 1096 1326
- AGG AATGGACCCAAGAGAAGAAA 157 407 637 867 1097 1327
- TGG GGCTATTACATAAGAAACAA 158 408 638 868 1098 1328
- TGG CACAGGAAAAGGAACTGTAC 159 409 639 869 1099 1329
- AGG ATTAAAGCTAACACAGGAAA 160 410 640 870 1100 1330
- AGG TCAAAAATTAAAGCTAACAC 161 411 641 871 1101 1331
+ TGG TAAAATTGTCTAAACATCTC 162 412 642 872 1102 1332
- AGG AGAGATGTTTAGACAATTTT 163 413 643 873 1103 1333
+ AGG TCTAAACATCTCTGGGACCA 164 414 644 874 1104 1334
- TGG TTTATGCTTTCATATATCCT 165 415 645 875 1105 1335
+ AGG AGCATAAATTACAAAGAAAA 166 416 646 876 1106 1336
+ TGG TACAAAGAAAAAGGTTATCA 167 417 647 877 1107 1337
+ GGG ACAAAGAAAAAGGTTATCAT 168 418 648 878 1108 1338
+ GGG CAAAGAAAAAGGTTATCATG 169 419 649 879 1109 1339
+ CGG TCTGAGATTTAAAATAGAGT 170 420 650 880 1110 1340
- AGG CTTATAAGATACATTATGAA 171 421 651 881 1111 1341
+ AGG TATCTTATAAGACTATAAAA 172 422 652 882 1112 1342
+ GGG ATCTTATAAGACTATAAAAA 173 423 653 883 1113 1343
+ AGG TTATAAGACTATAAAAAGGG 174 424 654 884 1114 1344
+ AGG TAAAAAGGGAGGAAATATAG 175 425 655 885 1115 1345
+ GGG AAAAAGGGAGGAAATATAGA 176 426 656 886 1116 1346
+ TGG AAATATAGAGGGTCCACTTT 177 427 657 887 1117 1347
+ TGG TATAGAGGGTCCACTTTTGG 178 428 658 888 1118 1348
- TGG ACTCTGAAGTCCACCAAAAG 179 429 659 889 1119 1349
+ TGG AGAATAGAGTTGCACCGTTT 180 430 660 890 1120 1350
- TGG AAAACGGTGCAACTCTATTC 181 431 661 891 1121 1351
+ AGG CCGTTTTGGGCTAATGAAAA 182 432 662 892 1122 1352
- CGG CCTTTTTCATTAGCCCAAAA 183 433 663 893 1123 1353
+ AGG TGGGCTAATGAAAAAGGAAG 184 434 664 894 1124 1354
+ AGG TAATGAAAAAGGAAGAGGCT 185 435 665 895 1125 1355
+ GGG AATGAAAAAGGAAGAGGCTA 186 436 666 896 1126 1356
+ AGG CTGAATCTTAAAATATGTCC 187 437 667 897 1127 1357
- TGG CAGGCAGCTTTATCTCAACC 188 438 668 898 1128 1358
- AGG CTAAGAGATCAAGTTTCAGC 189 439 669 899 1129 1359
+ TGG GTGTTCTTGTTGATATTCTG 190 440 670 900 1130 1360
+ TGG CTTGTTGATATTCTGTGGCA 191 441 671 901 1131 1361
+ TGG TCTGTGGCATGGCTACAGAT 192 442 672 902 1132 1362
- AGG AGAACTTATTTACACAGGGA 193 443 673 903 1133 1363
- GGG AAAGAGAACTTATTTACACA 194 444 674 904 1134 1364
- AGG CAAAGAGAACTTATTTACAC 195 445 675 905 1135 1365
+ AGG TTCTCTTTGTATTTACTTTT 196 446 676 906 1136 1366
+ GGG TCTCTTTGTATTTACTTTTA 197 447 677 907 1137 1367
+ AGG CTTTGTATTTACTTTTAGGG 198 448 678 908 1138 1368
+ TGG AGCTTTTGTCCACCTTTAAA 199 449 679 909 1139 1369
- TGG TTTATTTTTCCATTTAAAGG 200 450 680 910 1140 1370
Petição 870190068171, de 18/07/2019, pág. 188/358
175 / 307
PAM Sequência alvo de RNA guia SEQ ID NO
- AGG TATTTTATTTTTCCATTTAA 201 451 681 911 1141 1371
- AGG CTTACATAAACATACTTAAA 202 452 682 912 1142 1372
+ AGG TAAGCACAGAAGTTTTTAAG 203 453 683 913 1143 1373
+ AGG AAGTTTTTAAGAGGCATGAA 204 454 684 914 1144 1374
- AGG ATATTTACGTAGTTTTTCAT 205 455 685 915 1145 1375
+ AGG CGTAAATATTCTTGAGAAAC 206 456 686 916 1146 1376
+ AGG TTCTTGAGAAACAGGAAGAC 207 457 687 917 1147 1377
- TGG TAATATTAAAAACATTGGTT 208 458 688 918 1148 1378
+ AGG CCAATGTTTTTAATATTATC 209 459 689 919 1149 1379
- TGG CCTGATAATATTAAAAACAT 210 460 690 920 1150 1380
+ TGG CATTATCATGCATACATCTC 211 461 691 921 1151 1381
+ TGG ATCATGCATACATCTCTGGC 212 462 692 922 1152 1382
+ TGG TTCATTTCATTTTGATTTTG 213 463 693 923 1153 1383
- TGG ATTCAATTTGAAGCAGTGGT 214 464 694 924 1154 1384
- TGG GAATATTCAATTTGAAGCAG 215 465 695 925 1155 1385
+ AGG CATACGATTTAAAATCGCTG 216 466 696 926 1156 1386
+ AGG AAAATCGCTGAGGCGCGTTC 217 467 697 927 1157 1387
- AGG TTTTTTTTTCTTTTTTGTAC 218 468 698 928 1158 1388
- TGG CTGTTGTCAAAGATTTTAAA 219 469 699 929 1159 1389
+ TGG TGACAACAGAGTTCTGTTTT 220 470 700 930 1160 1390
+ TGG AGAATACGCTGAGAGTTATC 221 471 701 931 1161 1391
- AGG GCAAGAGAAGAAAAGAACGG 222 472 702 932 1162 1392
- CGG GTTGCAAGAGAAGAAAAGAA 223 473 703 933 1163 1393
- TGG ATGCACACGTAAAAGAGAGG 224 474 704 934 1164 1394
- AGG AAGATGCACACGTAAAAGAG 225 475 705 935 1165 1395
[00321] Exemplos de sequências alvo de RNA guia próximas de uma posição correspondente à posição 12666 da SEQ ID NO: 2 compreendem, consistem essencialmente em, ou consistem nas sequências apresentadas nas SEQ ID NOS: 226 a 239 e são apresentadas na tabela abaixo. Exemplos de segmentos de direcionamento de DNA de RNA guia que correspondem às SEQ ID NOS: 226 a 239 são apresentados nas SEQ ID NOS: 1629 a 1642, respectivamente, que são idênticas às SEQ ID NOS: 226 a 239 exceto com uracilas em vez de timinas. Um segmento de direcionamento de DNA de RNA guia pode compreender, consistir essencialmente em, ou consistir em qualquer uma das sequências apresentadas nas SEQ ID NOS: 1629 a 1642. Exemplos de sequências alvo de RNA guia, na proximidade de uma posição correspondente à posição 12666 da SEQ ID NO: 2, incluem as SEQ ID NOS: 230 e 231. CrRNAs e SgRNA exemplificativos (compreendendo a estrutura de suporte 1, 2, 3 ou 4) correspondentes às sequências de direcionamento de
Petição 870190068171, de 18/07/2019, pág. 189/358
176 / 307
RNA guia próximas de uma posição correspondente à posição 12666 da SEQ ID NO: 2 compreendem, consistem essencialmente em, ou consistem em qualquer uma das sequências apresentadas na tabela abaixo.
Sequências alvo do RNA guia próximas da variação rs72613567
Fita PAM Sequência alvo de RNA guia L a variação SEQ ID NO
Seq. alvo de RNAg crRNA sgRNA
v2 v3 v4
+ TGG ATCATGCATACATCTCTGGC 107 226 476 706 936 1166 1396
+ TGG TTCATTTCATTTTGATTTTG 74 227 477 707 937 1167 1397
- TGG ATTCAATTTGAAGCAGTGGT 62 228 478 708 938 1168 1398
- TGG GAATATTCAATTTGAAGCAG 58 229 479 709 939 1169 1399
+ AGG CATACGATTTAAAATCGCTG 22 230 480 710 940 1170 1400
+ AGG AAAATCGCTGAGGCGCGTTC 12 231 481 711 941 1171 1401
- AGG TTTTTTTTTCTTTTTTGTAC 22 232 482 712 942 1172 1402
- TGG CTGTTGTCAAAGATTTTAAA 40 233 483 713 943 1173 1403
+ TGG TGACAACAGAGTTCTGTTTT 65 234 484 714 944 1174 1404
+ TGG AGAATACGCTGAGAGTTATC 94 235 485 715 945 1175 1405
- AGG GCAAGAGAAGAAAAGAACGG 121 236 486 716 946 1176 1406
- CGG GTTGCAAGAGAAGAAAAGAA 124 237 487 717 947 1177 1407
- TGG ATGCACACGTAAAAGAGAGG 146 238 488 718 948 1178 1408
- AGG AAGATGCACACGTAAAAGAG 149 239 489 719 949 1179 1409
[00322] Exemplos de sequências alvo de RNA guia no gene Hsdl7bl3 de camundongo próximo de uma posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene Hsdl7bl3 de camundongo está perfeitamente alinhado com SEQ ID NO: 2 compreendem, consistem essencialmente em, ou consistem das sequências apresentadas na Tabela 12 no Exemplo 4. Exemplos de sequências alvo de RNA guia na extremidade 5' do gene Hsdl7bl3 de camundongo compreendem, consistem essencialmente em, ou consistem nas sequências apresentadas na Tabela 12 no Exemplo 4. Exemplos de segmentos de direcionamento de DNA de RNA guia correspondendo às sequências alvo de RNA guia são também apresentados na Tabela 12 do Exemplo 4. Um segmento de direcionamento de DNA de RNA guia pode compreender, consistir essencialmente em, ou consistir em qualquer daquelas sequências. CrRNAs e SgRNAs exemplificativos (compreendendo as estruturas de suporte 1, 2, 3 ou 4) correspondendo às sequências alvo de RNA guia na Tabela 12 do Exemplo 4 podem compreender, consistir essencialmente em,
Petição 870190068171, de 18/07/2019, pág. 190/358
177 / 307 ou consistir em qualquer das sequências de crRNA ou sgRNA apresentadas em Tabela 12 no Exemplo 4.
[00323] Os RNAs guia podem compreender dois segmentos: um “segmento de direcionamento de DNA” e um “segmento de ligação de proteínas”. “Segmento” inclui uma seção ou região de uma molécula, como um trecho contíguo de nucleotídeos em um RNA. Alguns RNAgs, tais como os de Cas9, podem compreender duas moléculas de RNA separadas: um “RNA ativador” (por exemplo, tracrRNA) e um “RNA-alvo” (por exemplo, RNA CRISPR ou crRNA). Outros RNAgs são uma única molécula de RNA (polinucleotídeo de RNA único), que também pode ser chamada de “RNAg de molécula única”, “RNA de guia único” ou “sgRNA”. Ver, por exemplo, WO 2013/176772, WO 2014/065596, WO 2014/089290, WO 2014/093622, WO 2014/099750, WO 2013/142578 e WO 2014/131833, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos. Para Cas9, por exemplo, um RNA guia único pode compreender um crRNA fundido a um tracrRNA (por exemplo, via um ligador). Para Cpfl, por exemplo, apenas é necessário um crRNA para conseguir a ligação e/ou clivagem de uma sequência alvo. Os termos “RNA guia” e “RNAg” incluem ambos os RNAgs de molécula dupla (isto é, modular) e RNAgs de molécula única.
[00324] Um exemplo de RNAg de duas moléculas compreende uma molécula do tipo de crRNA (“RNA CRISPR” ou “RNA alvo” ou “crRNA” ou “repetição de crRNA”) e uma molécula semelhante a tracrRNA correspondente (“RNA CRISPR trans-actuante” ou “RNA-ativador” ou “tracrRNA”). Um crRNA compreende tanto o segmento de direcionamento de DNA (fita simples) do RNAg quanto um trecho de nucleotídeos (ou seja, a cauda de crRNA) que forma metade do duplex de dsRNA do segmento de ligação de proteína do RNAg. Um exemplo de uma cauda de crRNA, localizada a jusante (3’) do segmento de direcionamento de DNA,
Petição 870190068171, de 18/07/2019, pág. 191/358
178 / 307 compreende, consiste essencialmente em, ou consiste em GUUUUAGAGCUAUGCU (SEQ ID NO: 1421). Qualquer um dos segmentos de direcionamento para DNA aqui divulgados pode ser unido à extremidade 5' da SEQ ID NO: 1421 para formar um crRNA.
[00325] Um tracrRNA correspondente (RNA-ativador) compreende um trecho de nucleotídeos que forma a outra metade do duplex de dsRNA do segmento de ligação de proteína do RNAg. Um trecho de nucleotídeos de um crRNA são complementares e hibridizam com um trecho de nucleotídeos de um tracrRNA para formar o dsRNA duplex do domínio de ligação da proteína do RNAg. Como tal, cada crRNA pode ser dito como tendo um tracrRNA correspondente. Um exemplo de uma sequência de tracRRNA compreende, consiste essencialmente em, ou consiste em AGCAUAGCAAGUUAAAAUA AGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUG CUUU (SEQ ID NO: 1422).
[00326] Em sistemas em que ambos, um crRNA e um tracrRNA são necessários, o crRNA e o tracrRNA correspondente hibridizam para formar um RNAg. Em sistemas nos quais apenas um crRNA é necessário, o crRNA pode ser o RNAg. O crRNA proporciona adicionalmente o segmento alvo de DNA de cadeia simples que tem como alvo uma sequência alvo de RNA guia por hibridização com a cadeia oposta (isto é, a cadeia complementar). Se usado para modificação dentro de uma célula, a sequência exata de uma dada molécula de crRNA ou tracrRNA pode ser projetada para ser específica para as espécies nas quais as moléculas de RNA serão usadas. Ver, por exemplo, Mali et al. (2013) Science 339: 823 a 826; Jinek et al. (2012) Science 337: 816 a 821; Hwang et al. (2013) Nat. Biotechnol. 31: 227 a 229; Jiang et al. (2013) Nat. Biotechnol. 31: 233 a 239; e Cong et al. (2013) Science 339: 819 a 823, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos.
[00327] O segmento de DNA alvo (crRNA) de um dado RNAg
Petição 870190068171, de 18/07/2019, pág. 192/358
179 / 307 compreende uma sequência de nucleotídeos que é complementar a uma sequência (ou seja, a fita complementar da sequência guia de reconhecimento de RNA na fita oposta da sequência alvo de RNA guia) em um DNA alvo. O segmento de direcionamento de DNA de um RNAg interage com um DNA alvo (por exemplo, o gene HSD17B13) de um modo específico da sequência, via hibridização (isto é, emparelhamento de bases). Como tal, a sequência de nucleotídeos do segmento de direcionamento para DNA pode variar e determina a localização dentro do DNA alvo com o qual o RNAg e o DNA alvo irão interagir. O segmento de direcionamento de DNA de um RNAg sujeito pode ser modificado para hibridizar com qualquer sequência desejada dentro de um DNA alvo. CrRNAs de ocorrência natural diferem dependendo do sistema e organismo CRISPR/Cas, mas geralmente contêm um segmento alvo de 21 a 72 nucleotídeos de comprimento, flanqueado por duas repetições diretas (DR) de um comprimento entre 21 e 46 nucleotídeos (ver, por exemplo, WO 2014/131833, incorporada ao presente pela referência na sua totalidade para todos os efeitos). No caso de S. pyogenes, as DRs têm 36 nucleotídeos de comprimento e o segmento alvo tem 30 nucleotídeos de comprimento. A DR localizada em 3' é complementar e hibridiza com o tracrRNA correspondente, que por sua vez se liga à proteína Cas.
[00328] O segmento de direcionamento de DNA pode ter um comprimento de pelo menos cerca de 12 nucleotídeos, pelo menos cerca de 15 nucleotídeos, pelo menos cerca de 17 nucleotídeos, pelo menos cerca de 18 nucleotídeos, pelo menos cerca de 19 nucleotídeos, pelo menos cerca de 20 nucleotídeos, menos cerca de 25 nucleotídeos, pelo menos cerca de 30 nucleotídeos, pelo menos cerca de 35 nucleotídeos, ou pelo menos cerca de 40 nucleotídeos. Esses segmentos de direcionamento de DNA podem ter um comprimento de cerca de 12 nucleotídeos a cerca de 100 nucleotídeos, de cerca de 12 nucleotídeos a cerca de 80 nucleotídeos, de cerca de 12 nucleotídeos a cerca de 50 nucleotídeos, de cerca de 12 nucleotídeos a cerca
Petição 870190068171, de 18/07/2019, pág. 193/358
180/307 de 40 nucleotídeos, de cerda de 12 nucleotídeos a cerca de 30 nucleotídeos, de cerca de 12 nucleotídeos a cerca de 25 nucleotídeos, ou de cerca de 12 nucleotídeos a cerca de 20 nucleotídeos. Por exemplo, o segmento alvo de DNA pode ser de cerca de 15 nucleotídeos a cerca de 25 nucleotídeos (por exemplo, de cerca de 17 nucleotídeos a cerca de 20 nucleotídeos, ou cerca de 17 nucleotídeos, cerca de 18 nucleotídeos, cerca de 19 nucleotídeos ou cerca de 20 nucleotídeos). Ver, por exemplo, o documento US 2016/0024523, aqui incorporado por referência na sua totalidade para todos os efeitos. Para Cas9 de S. pyogenes, um segmento típico de direcionamento de DNA tem entre 16 e 20 nucleotídeos de comprimento ou entre 17 e 20 nucleotídeos de comprimento. Para Cas9 de S. aureus, um segmento típico de direcionamento de DNA tem entre 21 e 23 nucleotídeos de comprimento. Para Cpfl, um segmento típico de direcionamento de DNA tem pelo menos 16 nucleotídeos de comprimento ou pelo menos 18 nucleotídeos de comprimento.
[00329] Os tracrRNAs podem estar em qualquer forma (por exemplo, tracrRNAs completos ou tracrRNAs parciais ativos) e de comprimentos variados. Eles podem incluir transcrições primárias ou formas processadas. Por exemplo, tracrRNAs (como parte de um RNA guia único ou como uma molécula separada como parte de um RNAg de duas moléculas) podem compreender ou consistir em toda ou uma porção de uma sequência de tracrRNA do tipo selvagem (por exemplo, cerca ou mais do que 20, 26, 32, 45, 48, 54, 63, 67, 85 ou mais nucleotídeos de uma sequência de tracrRNA de tipo selvagem). Exemplos de sequências de tracrRNA do tipo selvagem de S. pyogenes incluem versões de 171 nucleotídeos, 89 nucleotídeos, 75 nucleotídeos e 65 nucleotídeos. Ver, por exemplo, Deltcheva et al. (2011) Nature 471: 602 a 607; WO 2014/093661, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos. Exemplos de tracrRNAs dentro de RNAs guia únicos (sgRNAs) incluem os segmentos de tracrRNA encontrados nas versões de +48, +54, +67 e +85 de sgRNAs,
Petição 870190068171, de 18/07/2019, pág. 194/358
181/307 onde “+n” indica que até o nucleotídeo +n de tracrRNA do tipo selvagem está incluído no sgRNA. Ver US 8.697.359, aqui incorporado por referência na sua totalidade para todos os efeitos.
[00330] A percentagem de complementaridade entre a sequência de direcionamento de DNA e a fita complementar da sequência de reconhecimento de RNA guia dentro do DNA alvo pode ser pelo menos 60% (por exemplo, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 95%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100%). A percentagem de complementaridade entre a sequência de direcionamento de DNA e a fita complementar da sequência de reconhecimento de RNA guia dentro do DNA alvo pode ser de pelo menos 60% em cerca de 20 nucleotídeos contíguos. Como exemplo, a percentagem de complementaridade entre a sequência de direcionamento de DNA e a fita complementar da sequência de reconhecimento de RNA guia dentro do DNA alvo é de 100% ao longo dos 14 nucleotídeos contíguos na extremidade 5' da fita complementar da sequência de reconhecimento de RNA guia dentro da fita complementar do DNA alvo e tão baixo quanto 0% em relação ao restante. Nesse caso, a sequência de direcionamento de DNA pode ser considerada como tendo 14 nucleotídeos de comprimento. Como outro exemplo, a percentagem de complementaridade entre a sequência de direcionamento de DNA e a fita complementar da sequência de reconhecimento de RNA guia dentro do DNA alvo é de 100% ao longo dos sete nucleotídeos contíguos na extremidade 5' da fita complementar da sequência de reconhecimento de RNA guia dentro da fita complementar do DNA alvo e tão baixo quanto 0% em relação ao restante. Nesse caso, a sequência de direcionamento de DNA pode ser considerada de 7 nucleotídeos de comprimento. Em alguns RNAs guia, pelo menos 17 nucleotídeos dentro da sequência de direcionamento de DNA são complementares ao DNA alvo. Por exemplo, a sequência direcionada para o
Petição 870190068171, de 18/07/2019, pág. 195/358
182/307
DNA pode ter 20 nucleotídeos de comprimento e pode compreender 1, 2 ou 3 desemparelhamentos com a fita complementar da sequência de reconhecimento de RNA guia. De um modo preferido, os desemparelhamentos não estão adjacentes a uma sequência de motivo adjacente de protospacer (PAM) (por exemplo, os desemparelhamentos estão na extremidade 5' da sequência que direciona o DNA, ou os desemparelhamentos são pelo menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 ou 19 pares de bases afastados da sequência PAM).
[00331] O segmento de ligação de proteína de um RN Ag pode compreender dois trechos de nucleotídeos que são complementares um ao outro. Os nucleotídeos complementares do segmento de ligação às proteínas hibridizam para formar um duplex de fita dupla de RNA (dsRNA). O segmento de ligação de proteína de um RNAg sujeito interage com uma proteína Cas e o RNAg direciona a proteína Cas ligada a uma sequência nucleotídica específica no DNA alvo através do segmento de direcionamento para o DNA.
[00332] Os RNAs guia únicos têm o segmento de direcionamento de DNA e uma sequência de suporte (isto é, a sequência de ligação de proteína ou a sequência de ligação a Cas do RNA guia). Por exemplo, esses RNAs guia têm um segmento de direcionamento de DNA de 5 ’ e uma sequência de estrutura de supoerte de 3’. Exemplos de sequências de estruturas de suporte compreendem, consistem essencialmente em, ou consistem em: GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGU UAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU (versão 1; SEQ ID NO: 1420); GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAA AUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCG GUGC (versão 2; SEQ ID NO: 256); GUUUUAGAGCUAGAAAUA GCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUG GCACCGAGUCGGUGC (versão 3; SEQ ID NO: 257); e
Petição 870190068171, de 18/07/2019, pág. 196/358
183/307
GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAG GCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC (versão 4; SEQ ID NO: 258). RNAs guia visando qualquer uma das sequências alvo de RNA guia aqui divulgadas (por exemplo, SEQ ID NOS: 20 a 239 e 259 a 268) podem incluir, por exemplo, um segmento de direcionamento de DNA na extremidade 5' do RNA guia fundido a qualquer das sequências de estrutura de RNA guia exemplares na extremidade 3' do RNA guia. Ou seja, qualquer um dos segmentos de direcionamento de DNA aqui divulgados pode ser unido à extremidade 5’ de qualquer uma das SEQ ID NOS: 1420, 256, 257 ou 258 para formar um único RNA guia (RNA guia quimérico). As versões de RNA guia 1, 2, 3 e 4, conforme divulgado em outro lugar aqui, referem-se a segmentos de direcionamento de DNA unidos com as versões de estrutura de suporte 1, 2, 3 e 4, respectivamente.
[00333] Os RNA guia podem incluir modificações ou sequências que proporcionam características desejáveis adicionais (por exemplo, estabilidade modificada ou regulada; direcionamento subcelular; rastreamento com um marcador fluorescente; um local de ligação para um complexo proteico ou proteína; e semelhantes). Exemplos de tais modificações incluem, por exemplo, uma tampa de 5 '(por exemplo, uma tampa de 7-metilguanilato (m7G)); uma cauda poliadenilada 3’ (isto é, uma cauda poli(A) 3’); uma sequência riboswitch (por exemplo, para permitir estabilidade regulada e/ou acessibilidade regulada por proteínas e/ou complexos proteicos); uma sequência de controle de estabilidade; uma sequência que forma um duplex de dsRNA (isto é, um hairpin); uma modificação ou sequência que tem como alvo o RNA para uma localização subcelular (por exemplo, núcleo, mitocôndrias, cloroplastos e semelhantes); uma modificação ou sequência que proporciona seguimento (por exemplo, conjugação direta a uma molécula fluorescente, conjugação com uma porção que facilita a detecção por fluorescência, uma sequência que permite a detecção por fluorescência e
Petição 870190068171, de 18/07/2019, pág. 197/358
184/307 assim por diante); uma modificação ou sequência que proporciona um local de ligação para proteínas (por exemplo, proteínas que atuam no DNA, incluindo ativadores da transcrição, repressores da transcrição, DNA metiltransferases, DNA desmetilases, histona acetiltransferases, histonas desacetilases e semelhantes); e combinações dos mesmos. Outros exemplos de modificações incluem estruturas de duplex de laço com hastes manipuladas, regiões salientes manipuladas, grampos manipulados 3' da estrutura de duplex de laço de hastes ou qualquer combinação dos mesmos. Ver, por exemplo, US 2015/0376586, aqui incorporado por referência na sua totalidade para todos os efeitos. Uma projeção pode ser uma região não pareada de nucleotídeos dentro do duplex formado pela região semelhante a crRNA e a região mínima do tipo tracrRNA. Uma projeção pode compreender, em um lado do duplex, um 5-XXXY-3' não emparelhado onde X é qualquer purina e Y pode ser um nucleotídeo que pode formar um par oscilante com um nucleotídeo na fita oposta, e uma região de nucleotídeo não emparelhado do outro lado do duplex.
[00334] Em alguns casos, um sistema de ativação transcricional pode ser utilizado compreendendo uma proteína de fusão dCas9-VP64 emparelhado com MS2-p65-HSFl. RNAs guia em tais sistemas podem ser projetados com sequências de aptâmero anexadas a sgRNA tetraloop e tronco-laço 2 projetados para ligar proteínas de revestimento de bacteriófago MS2 dimerizadas. Ver, por exemplo, Konermann et al. (2015) Nature 517 (7536): 583 a 588, aqui incorporado por referência na sua totalidade para todos os efeitos.
[00335] Os RNAs guia podem ser providos em qualquer forma. Por exemplo, o RN Ag pode ser provido na forma de RNA, seja como duas moléculas (crRNA e tracrRNA separados) ou como uma molécula (sgRNA), e opcionalmente na forma de um complexo com uma proteína Cas. Por exemplo, os RNAg podem ser preparados por transcrição in vitro utilizando,
Petição 870190068171, de 18/07/2019, pág. 198/358
185/307 por exemplo, polimerase de RNA de T7 (ver, por exemplo, os documentos WO 2014/089290 e WO 2014/065596, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos). Os RNAs guia também podem ser preparados por síntese química.
[00336] O RNAg também pode ser provido na forma de DNA que codifica o RNAg. O DNA que codifica o RNAg pode codificar uma única molécula de RNA (sgRNA) ou moléculas de RNA separadas (por exemplo, crRNA e tracrRNA separados). No último caso, o DNA que codifica o RNAg pode ser provido como uma molécula de DNA ou como moléculas de DNA separadas que codificam o crRNA e o tracrRNA, respectivamente.
[00337] Quando um RNAg é provido sob a forma de DNA, o RNAg pode ser transitoriamente, condicionalmente ou constitutivamente expresso na célula. Os DNAs que codificam os RNAgs podem ser integrados de forma estável no genoma da célula e operativamente ligados a um promotor ativo na célula. Altemativamente, os DNAs que codificam os RNAgs podem ser operativamente ligados a um promotor em um construto de expressão. Por exemplo, o DNA que codifica o RNAg pode estar em um vetor que compreende um ácido nucleico heterólogo. O vetor pode compreender adicionalmente uma sequência de doador exógeno e/ou o vetor pode compreender adicionalmente um ácido nucleico que codifica uma proteína Cas. Altemativamente, o DNA que codifica o RNAg pode estar em um vetor ou em um plasmídeo que é separado do vetor que compreende uma sequência de doador exógeno e/ou o vetor que compreende o ácido nucleico que codifica a proteína Cas. Os promotores que podem ser utilizados em tais construtos de expressão incluem promotores ativos, por exemplo, em uma ou mais de uma célula eucariótica, uma célula humana, uma célula não humana, uma célula de mamífero, uma célula de mamífero não humana, uma célula de roedor, uma célula de camundongo, uma célula de rato, uma célula de hamster, uma célula de coelho, uma célula pluripotente, uma célula estaminal
Petição 870190068171, de 18/07/2019, pág. 199/358
186/307 embrionária (ES), uma célula estaminal adulta, uma célula progenitora restrita de desenvolvimento, uma célula estaminal pluripotente induzida (iPS) ou uma célula única de estágio embrionário. Tais promotores podem ser, por exemplo, promotores condicionais, promotores indutíveis, promotores constitutivos ou promotores específicos de tecidos. Tais promotores podem também ser, por exemplo, promotores bidirecionais. Exemplos específicos de promotores adequados incluem um promotor de RNA polimerase III, tal como um promotor U6 humano, um promotor U6 de polimerase III de rato ou um promotor U6 de polimerase III de camundongo.
[00338] Também são aqui divulgadas composições compreendendo um ou mais RNAs guia (por exemplo, 1, 2, 3, 4 ou mais RNAs guia) divulgados aqui e um veículo que aumenta a estabilidade do ácido nucléico isolado ou proteína (por exemplo, prolongando o período em determinadas condições de armazenamento (por exemplo, -20 °C, 4 °C, ou temperatura ambiente) para as quais os produtos de degradação permanecem abaixo de um limite, abaixo de 0,5% em peso do ácido nucleico ou proteína inicial ou aumentando a estabilidade in vivo). Exemplos não limitativos de tais veículos incluem microsferas de poli(ácido láctico) (PLA), microsferas de poli(ácido D,Lláctico-coglicólico) (PLGA), lipossomas, micelas, micelas inversas, cocleatos lipídicos e microtúbulos lipídicos. Tais composições podem compreender adicionalmente uma proteína Cas, tal como uma proteína Cas9, ou um ácido nucleico que codifica uma proteína Cas. Tais composições podem compreender adicionalmente uma ou mais (por exemplo, 1, 2, 3, 4 ou mais) sequências de doador exógeno e/ou um ou mais (por exemplo, 1, 2, 3, 4 ou mais) vetores alvo e/ou um ou mais (por exemplo, 1, 2, 3, 4 ou mais) vetores de expressão como aqui divulgados em outro local.
(3) Sequências de reconhecimento de RNA guia e sequências alvo de RNA guia [00339] O termo “sequência de reconhecimento de RNA guia” inclui
Petição 870190068171, de 18/07/2019, pág. 200/358
187/307 sequências de ácido nucleico presentes em um DNA alvo (por exemplo, o gene HSD17B13) ao qual um segmento de direcionamento de DNA de um RNAg se ligará, desde que existam condições suficientes para a ligação. O termo sequência de reconhecimento de RNA guia, como aqui utilizado, abrange ambas as fitas do DNA de fita dupla alvo (isto é, a sequência na fita complementar com a qual o RNA guia hibridiza e a sequência correspondente na fita não complementar adjacente ao motivo protospacer adjacente (PAM)). O termo “sequência alvo de RNA guia “, tal como aqui utilizado, refere-se especificamente à sequência na fita não complementar adjacente ao PAM (isto é, a montante ou 5’ do PAM). Ou seja, a sequência alvo de RNA guia se refere à sequência na fita não complementar correspondente à sequência com a qual o RNA guia hibridiza na fita complementar. Uma sequência alvo de RNA guia é equivalente ao segmento de direcionamento de DNA de um RNA guia, mas com timinas ao invés de uracilas. Como um exemplo, uma sequência alvo de RNA guia para uma enzima Cas9 se referiria à sequência na fita não complementar adjacente ao PAM 5'-NGG-3’. As sequências de reconhecimento de RNA guia incluem sequências para as quais um RNA guia é concebido para ter complementaridade, onde a hibridização entre a fita complementar de uma sequência de reconhecimento de RNA guia e uma sequência de direcionamento de DNA de um RNA guia promove a formação de um complexo CRISPR. A complementaridade total não é necessariamente necessária, desde que haja complementaridade suficiente para causar hibridização e promover a formação de um complexo CRISPR. As sequências de reconhecimento de RNA guia ou sequências alvo de RNA guia também incluem sítios de clivagem para proteínas Cas, descritas em mais detalhe abaixo. Uma sequência de reconhecimento de RNA guia ou uma sequência alvo de RNA guia pode compreender qualquer polinucleotídeo, que pode estar localizado, por exemplo, no núcleo ou citoplasma de uma célula ou em uma organela de uma célula, tal como uma mitocôndria ou cloroplasto.
Petição 870190068171, de 18/07/2019, pág. 201/358
188/307 [00340] A sequência de reconhecimento de RNA guia dentro de um DNA alvo pode ser direcionada (isto é, ser ligada, ou hibridizar com, ou ser complementar a) uma proteína Cas ou um RNAg. Condições de ligação a DNA/RNA adequadas incluem condições fisiológicas normalmente presentes em uma célula. São conhecidas outras condições adequadas de ligação de DNA/RNA (por exemplo, condições em um sistema isento de células) (ver, por exemplo, Molecular Cloning: A Laboratory Manual, 3a Ed. (Sambrook et al., Harbor Laboratory Press 2001), incorporado aqui por referência na sua totalidade para todos os efeitos). O filamento do DNA alvo complementar e hibridizado com a proteína Cas ou RNAg pode ser chamado de “filamento complementar” e o filamento do DNA alvo que é complementar à “fita complementar” (e, portanto, não é complementar à proteína Cas ou RNAg) pode ser chamado de “fita não complementar” ou “fita molde”.
[00341] A proteína Cas pode clivar o ácido nucleico em um sítio dentro ou fora da sequência de ácido nucléico presente no DNA alvo ao qual o segmento de DNA alvo de um RNAg se ligará. O “sítio de clivagem” inclui a posição de um ácido nucléico no qual uma proteína Cas produz uma quebra de fita simples ou uma quebra de fita dupla. Por exemplo, a formação de um complexo CRISPR (compreendendo um RNAg hibridizado com a fita complementar de uma sequência de reconhecimento de RNA guia e complexada com uma proteína Cas) pode resultar na clivagem de uma ou ambas as fitas em ou perto (por exemplo, dentro de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 ou mais pares de bases da) sequência de ácido nucleico presente em um DNA alvo ao qual um segmento de direcionamento de DNA de um RNAg se ligar. Se o sítio de clivagem estiver fora da sequência de ácido nucleico à qual o segmento de direcionamento de DNA do RNAg se ligará, o sítio de clivagem ainda é considerado dentro da “sequência de reconhecimento de RNA guia” ou da sequência alvo de RNA guia. O sítio de clivagem pode estar em apenas uma fita ou em ambas as fitas de um ácido nucleico. Os sítios de
Petição 870190068171, de 18/07/2019, pág. 202/358
189/307 clivagem podem estar na mesma posição em ambas as fitas do ácido nucleico (produzindo extremidades cegas) ou podem estar em locais diferentes em cada fita (produzindo extremidades escalonadas (isto é, projeções)). As extremidades escalonadas podem ser produzidas, por exemplo, utilizando duas proteínas Cas, cada uma das quais produz uma quebra de fita simples em um sítio de clivagem diferente em uma fita diferente, produzindo assim uma quebra de fita dupla. Por exemplo, uma primeira nickase pode criar uma quebra de fita simples na primeira fita de DNA de fita dupla (dsDNA), e uma segunda nickase pode criar uma quebra de fita simples na segunda fita de dsDNA de tal forma que as sequências pendentes são criadas. Em alguns casos, a sequência de reconhecimento de RNA guia ou a sequência alvo de RNA guia da nickase na primeira fita é separada da sequência de reconhecimento de RNA guia ou da sequência alvo de RNA guia da nickase na segunda fita por pelo menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100, 250, 500 ou 1000 pares de bases.
[00342] A ligação sítio-específica e/ou clivagem do DNA alvo pelas proteínas Cas pode ocorrer em locais determinados por (i) complementaridade de emparelhamento de bases entre o RNAg e o DNA alvo e (ii) um motivo curto, designado pelo motivo protospacer adjacente (PAM), no DNA alvo. O PAM pode flanquear a sequência alvo de RNA guia na fita não complementar oposta à fita à qual o RNA guia hibridiza. Opcionalmente, a sequência alvo do RNA guia pode ser flanqueada na extremidade 3' pelo PAM. Altemativamente, a sequência alvo do RNA guia pode ser flanqueada na extremidade 5' pelo PAM. Por exemplo, o sítio de clivagem das proteínas Cas pode ser de cerca de 1 a cerca de 10 ou de cerca de 2 a cerca de 5 pares de bases (por exemplo, 3 pares de bases) a montante ou a jusante da sequência PAM. Em alguns casos (por exemplo, quando Cas9 de S. pyogenes ou um Cas9 estreitamente relacionado é usado), a sequência PAM da fita não complementar pode ser 5'-NiGG-3', onde Ni é qualquer nucleotídeo de DNA
Petição 870190068171, de 18/07/2019, pág. 203/358
190/307 e é imediatamente 3' da sequência de reconhecimento de RNA guia da fita não complementar do DNA alvo (isto é, imediatamente 3' da sequência alvo de RNA guia). Como tal, a sequência PAM da fita complementar seria 5'CCN2-3', em que N2 é qualquer nucleotídeo de DNA e é imediatamente 5' da sequência de reconhecimento de RNA guia da fita complementar do DNA alvo. Em alguns casos, Ni e N2 podem ser complementares e o par de bases N1-N2 pode ser qualquer par de bases (por exemplo, Ni=CeN2 = G;Ni=G e N2 = C; Ni = A e N2 = T; ou Ni = T e N2 = A). No caso de Cas9 de S. aureus, o PAM pode ser NNGRRT ou NNGRR, onde N pode ser A, G, C ou T, e R pode ser G ou A. Em alguns casos (por exemplo, para FnCpfl), a sequência PAM pode ser a montante da extremidade 5' e ter a sequência 5'TTN-3'.
[00343] Exemplos de sequências alvo de RNA guia ou sequências alvo de RNA guia além de uma sequência PAM são providas abaixo. Por exemplo, a sequência alvo de RNA guia pode ser uma sequência de DNA de 20 nucleotídeos imediatamente precedendo um motivo NGG reconhecido por uma proteína Cas9. Exemplos de tal sequência alvo de RNA guia mais uma sequência PAM são GN19NGG (SEQ ID NO: 248) ou N20NGG (SEQ ID NO: 249). Ver, por exemplo, o documento WO 2014/165825, aqui incorporado por referência na sua totalidade para todos os efeitos. A guanina na extremidade 5' pode facilitar a transcrição pela RNA polimerase nas células. Outros exemplos de sequências alvo de RNA guia mais uma sequência PAM podem incluir dois nucleotídeos de guanina na extremidade 5' (por exemplo, GGN20NGG; SEQ ID NO: 250) para facilitar a transcrição eficiente pela polimerase T7 in vitro. Ver, por exemplo, WO 2014/065596, aqui incorporado por referência na sua totalidade para todos os efeitos. Outras sequências alvo de RNA guia mais uma sequência PAM podem ter entre 4 a 22 nucleotídeos de comprimento de SEQ ID NOS: 248 a 250, incluindo o 5’ G ou GG e o 3’ GG ou NGG. Ainda outras sequências alvo de RNA guia
Petição 870190068171, de 18/07/2019, pág. 204/358
191/307 podem ter entre 14 e 20 nucleotídeos de comprimento de SEQ ID NOS: 248 a 250.
[00344] A sequência de reconhecimento de RNA guia ou sequência alvo de RNA guia pode ser qualquer sequência de ácido nucleico endógena ou exógena a uma célula. A sequência de reconhecimento de RNA guia ou a sequência alvo de RNA guia pode ser uma sequência que codifica um produto genético (por exemplo, uma proteína) ou uma sequência não codificante (por exemplo, uma sequência reguladora) ou pode incluir ambas.
[00345] Como um exemplo, a sequência de reconhecimento de RNA guia ou a sequência alvo de RNA guia pode estar dentro de uma região correspondente ao éxon 6 e/ou íntron 6, éxon 6 e/ou éxon 7, ou éxon 6 e/ou íntron 6 e/ou o éxon 7 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2. Como outro exemplo, a sequência de reconhecimento de RNA guia ou a sequência alvo de RNA guia pode incluir ou está próximo de uma posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2. Por exemplo, sequência de reconhecimento de RNA guia ou a sequência alvo de RNA guia pode estar dentro de cerca de 1000, 500, 400, 300, 200, 100, 50, 45, 40, 35, 30, 25, 20, 15, 10 ou 5 nucleotídeos da posição correspondente para a posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2. Como ainda outro exemplo, a sequência de reconhecimento de RNA guia ou sequência alvo de RNA guia pode incluir ou estar próximo do códon de iniciação de um gene HSD17B13 ou o códon de terminação de um gene HSD17B13. Por exemplo, a sequência de reconhecimento de RNA guia ou a sequência alvo de RNA guia pode estar dentro de cerca de 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos do códon de iniciação ou do códon de terminação. Exemplos de tais sequências alvo de RNA guia e de direcionamento de RNA guia que direcionam tais sequências alvo de RNA
Petição 870190068171, de 18/07/2019, pág. 205/358
192/307 guia estão aqui divulgadas em outro local.
F. Sequências de Doadores Exógenos ou Vetores de Direcionamento [00346] Os métodos e composições aqui descritos podem utilizar sequências de doador exógeno (por exemplo, vetores de direcionamento ou modelos de reparação) para modificar um gene HSD17B13, quer sem clivagem do gene HSD17B13 quer após clivagem do gene HSD17B13 com um agente de nuclease. Uma sequência de doador exógeno se refere a qualquer ácido nucleico ou vetor que inclui os elementos que são necessários para permitir a recombinação específica do local com uma sequência alvo. A utilização de sequências de doadores exógenos em combinação com agentes de nuclease pode resultar em modificações mais precisas no gene HSD17B13, promovendo a reparação dirigida por homologia.
[00347] Em tais métodos, o agente de nuclease cliva o gene HSD17B13 para criar uma quebra de fita simples (corte) ou quebra de fita dupla, e a sequência de doador exógeno recombina o gene HSD17B13 via união de extremidade não homóloga (NHEJ) mediada por ligadura ou através de um evento de reparo dirigido por homologia. Opcionalmente, o reparo com a sequência de doador exógeno remove ou interrompe o sítio de clivagem da nuclease de modo que os alelos que foram direcionados não possam ser redirecionados pelo agente de nuclease.
[00348] As sequências de doador exógeno podem compreender ácido desoxirribonucleico (DNA) ou ácido ribonucleico (RNA), podem ser de fita simples ou dupla, e podem estar na forma linear ou circular. Por exemplo, uma sequência de doador exógeno pode ser um oligodesoxinucleotídeo de fita simples (ssODN). Ver, por exemplo, Yoshimi et al. (2016) Nat. Comum. 7: 10431, aqui incorporado por referência na sua totalidade para todos os efeitos. Uma sequência de doador exógeno exemplificativa tem entre cerca de 50 nucleotídeos a cerca de 5 kb de comprimento, tem entre cerca de 50 nucleotídeos a cerca de 3 kb de comprimento ou tem entre cerca de 50 a cerca
Petição 870190068171, de 18/07/2019, pág. 206/358
193/307 de 1000 nucleotídeos de comprimento. Outras sequências de doador exógeno exemplificativas têm entre cerca de 40 e cerca de 200 nucleotídeos de comprimento. Por exemplo, uma sequência de doador exógeno pode estar entre cerca de 50 a cerca de 60, cerca de 60 a cerca de 70, cerca de 70 a cerca de 80, cerca de 80 a cerca de 90, cerca de 90 a cerca de 100, cerca de 100 a cerca de 110, cerca de 110 a cerca de 120, cerca de 120 a cerca de 130, cerca de 130 a cerca de 140, cerca de 140 a cerca de 150, cerca de 150 a cerca de 160, cerca de 160 a cerca de 170, cerca de 170 a cerca de 180, cerca de 180 a cerca de 190 ou cerca de 190 a cerca de 200 nucleotídeos de comprimento. Altemativamente, uma sequência de doador exógeno pode estar entre cerca de 50 e cerca de 100, cerca de 100 a cerca de 200, cerca de 200 a cerca de 300, cerca de 300 a cerca de 400, cerca de 400 a cerca de 500, cerca de 500 a cerca de 600, cerca de 700 a cerca de 800, cerca de 800 a cerca de 900, ou cerca de 900 a cerca de 1000 nucleotídeos de comprimento. Alternativamente, uma sequência de doador exógeno pode estar entre cerca de 1 kb a cerca de 1,5 kb, cerca de 1,5 kb a cerca de 2 kb, cerca de 2 kb a cerca de 2,5 kb, cerca de 2,5 kb a cerca de 3 kb, cerca de 3 kb a cerca de 3,5 kb, cerca de 3,5 kb a cerca de 4 kb, cerca de 4 kb a cerca de 4,5 kb, ou cerca de 4,5 kb a cerca de 5 kb de comprimento. Altemativamente, uma sequência de doador exógena pode ser, por exemplo, não mais do que 5 kb, 4,5 kb, 4 kb, 3,5 kb, 3 kb, 2,5 kb, 2 kb,
1,5 kb, 1 kb, 900 nucleotídeos, 800 nucleotídeos, 700 nucleotídeos, 600 nucleotídeos, 500 nucleotídeos, 400 nucleotídeos, 300 nucleotídeos, 200 nucleotídeos, 100 nucleotídeos ou 50 nucleotídeos de comprimento.
[00349] Em um exemplo, uma sequência de doador exógeno é um ssODN que tem entre cerca de 80 nucleotídeos e cerca de 200 nucleotídeos de comprimento (por exemplo, cerca de 120 nucleotídeos de comprimento). Em outro exemplo, uma sequência de doadores exógenos é um ssODN que tem entre cerca de 80 nucleotídeos e cerca de 3 kb de comprimento. Tal ssODN pode ter braços de homologia, por exemplo, que têm entre cerca de 40
Petição 870190068171, de 18/07/2019, pág. 207/358
194/307 nucleotídeos e cerca de 60 nucleotídeos de comprimento. Tal ssODN pode também ter braços de homologia, por exemplo, que têm entre cerca de 30 nucleotídeos e 100 nucleotídeos de comprimento. Os braços de homologia podem ser simétricos (por exemplo, cada 40 nucleotídeos ou cada 60 nucleotídeos de comprimento), ou podem ser assimétricos (por exemplo, um braço de homologia de 36 nucleotídeos de comprimento e um braço de homologia de 91 nucleotídeos de comprimento).
[00350] As sequências de doador exógeno podem incluir modificações ou sequências que proporcionam características desejáveis adicionais (por exemplo, estabilidade modificada ou regulada; rastrear ou detectar com uma etiqueta fluorescente; um local de ligação para um complexo proteico ou proteína; e assim por diante). As sequências de doador exógeno podem compreender uma ou mais etiquetas fluorescentes, etiquetas de purificação, etiquetas de epítopo ou uma combinação dos mesmos. Por exemplo, uma sequência de doador exógeno pode compreender uma ou mais etiquetas fluorescentes (por exemplo, proteínas fluorescentes ou outros fluoróforos ou corantes), tal como pelo menos 1, pelo menos 2, pelo menos 3, pelo menos 4, ou pelo menos 5 etiqueras fluorescentes. Etiquetas fluorescentes exemplificativas incluem fluoróforos, tais como fluoresceína (por exemplo, 6carboxifluoresceína (6-FAM)), Vermelho do Texas, HEX, Cy3, Cy5, Cy5.5, Azul do Pacífico, 5-(e-6)-carboxitetrametil-rodamina (TAMRA), e Cy7. Está disponível comercialmente uma vasta gama de corantes fluorescentes para marcação de oligonucleotídeos (por exemplo, da Integrated DNA Technologies). Tais etiquetas fluorescentes (por exemplo, etiquetas fluorescentes internas) podem ser utilizadas, por exemplo, para detectar uma sequência de doador exógeno que foi diretamente integrada em um gene HSD17B13 clivado possuindo extremidades salientes compatíveis com as extremidades da sequência de doador exógeno. O rótulo ou etiqueta pode estar na extremidade 5', na extremidade 3' ou intemamente na sequência de
Petição 870190068171, de 18/07/2019, pág. 208/358
195/307 doador exógeno. Por exemplo, uma sequência de doador exógeno pode ser conjugada na extremidade 5' com o fluoróforo IR700 da Integrated DNA Technologies (5'IRDYE®700).
[00351] As sequências de doador exógeno podem também compreender inserções de ácido nucleico incluindo segmentos de DNA a serem integrados no gene HSD17B13. A integração de um inserto de ácido nucleico no gene HSD17B13 pode resultar na adição de uma sequência de ácido nucleico de interesse no gene HSD17B13, eliminação de uma sequência de ácido nucleico de interesse no gene HSD17B13, ou substituição de uma sequência de ácido nucleico de interesse no gene HSD17B13 (isto é, eliminação e inserção). Algumas sequências de doador exógeno são concebidas para inserção de um inserto de ácido nucleico no gene HSD17B13 sem qualquer eliminação correspondente no gene HSD17B13. Outras sequências doadoras exógenas são projetadas para eliminar uma sequência de ácido nucleico de interesse no gene HSD17B13 sem qualquer inserção correspondente de um inserto de ácido nucleico. Ainda outras sequências de doador exógeno são concebidas para eliminar uma sequência de ácido nucleico de interesse no gene HSD17B13 e substituí-la por um inserto de ácido nucleico.
[00352] O inserto de ácido nucleico ou o ácido nucleico correspondente no gene HSD17B13 a ser eliminado e/ou substituído pode ter vários comprimentos. Um inserto exemplificativo de ácido nucleico ou ácido nucleico correspondente no gene HSD17B13 a ser eliminado e/ou substituído está entre cerca de 1 nucleotídeo a cerca de 5 kb de comprimento ou está entre cerca de 1 nucleotídeo a cerca de 1000 nucleotídeos de comprimento. Por exemplo, um inserto de ácido nucleico ou um ácido nucleico correspondente no gene HSD17B13 a ser eliminado e/ou substituído pode estar entre cerca de 1 a cerca de 10, cerca de 10 a cerca de 20, cerca de 20 a cerca de 30, cerca de 30 a cerca de 40, cerca de 40 a cerca de 50, cerca de 50 a cerca de 60, cerca
Petição 870190068171, de 18/07/2019, pág. 209/358
196/307 de 60 a cerca de 70, cerca de 70 a cerca de 80, cerca de 80 a cerca de 90, cerca de 90 a cerca de 100, cerca de 100 a cerca de 110, cerca de 110 a cerca de 120, cerca de 120 a cerca de 130, cerca de 130 a cerca de 140, cerca de 140 a cerca de 150, cerca de 150 a cerca de 160, cerca de 160 a cerca de 170, cerca de 170 a cerca de 180, cerca de 180 a cerca de 190 ou cerca de 190 a cerca de 200 nucleotídeos. Do mesmo modo, um inserto de ácido nucleico ou um ácido nucleico correspondente no gene HSD17B13 a ser eliminado e/ou substituído pode estar entre cerca de 1 a cerca de 100, cerca de 100 a cerca de 200, cerca de 200 a cerca de 300, cerca de 300 a cerca de 400, cerca de 400 a cerca de 500, cerca de 500 a cerca de 600, cerca de 600 a cerca de 700, cerca de 700 a cerca de 800, cerca de 800 a cerca de 900, ou cerca de 900 a cerca de 1000 nucleotídeos de comprimento. Do mesmo modo, um inserto de ácido nucleico ou um ácido nucleico correspondente no gene HSD17B13 a ser eliminado e/ou substituído pode estar entre cerca de 1 kb a cerca de 1,5 kb, cerca de 1,5 kb a cerca de 2 kb, cerca de 2 kb a cerca de 2,5 kb, cerca de 2,5 kb a cerca de 3 kb, cerca de 3 kb a cerca de 3,5 kb, cerca de 3,5 kb a cerca de 4 kb, cerca de 4 kb a cerca de 4,5 kb, ou cerca de 4,5 kb a cerca de 5 kb de comprimento.
[00353] O inserto de ácido nucleico pode compreender DNA genômico ou qualquer outro tipo de DNA. Por exemplo, o inserto de ácido nucleico pode compreender DNAc.
[00354] O inserto de ácido nucleico pode compreender uma sequência que é homóloga a todo ou parte do gene HSD17B13 (por exemplo, uma porção do gene que codifica um motivo particular ou região de uma proteína de HSD17B13). Por exemplo, o inserto de ácido nucleico pode compreender uma sequência que compreende uma ou mais mutações pontuais (por exemplo, 1, 2, 3, 4, 5 ou mais) ou uma ou mais inserções ou eliminações de nucleotídeos comparadas com uma sequência direcionada para substituição no gene HSD17B13.
Petição 870190068171, de 18/07/2019, pág. 210/358
197 / 307 [00355] O inserto de ácido nucleico ou o ácido nucleico correspondente no gene HSD17B13 a ser eliminado e/ou substituído pode ser uma região codificante, tal como um éxon; uma região não codificante, tal como um íntron, uma região não traduzida ou uma região reguladora (por exemplo, um promotor, um potenciador ou um elemento de ligação ao repressor transcricional); ou qualquer combinação dos mesmos.
[00356] O inserto de ácido nucleico também pode compreender um alelo condicional. O alelo condicional pode ser um alelo multifuncional, como descrito no documento US 2011/0104799, aqui incorporado por referência na sua totalidade para todos os efeitos. Por exemplo, o alelo condicional pode compreender: (a) uma sequência de atuação na orientação de sentido em relação à transcrição de um gene alvo; (b) uma cassete de seleção de fármaco (DSC) na orientação de sentido ou antissentido; (c) uma sequência nucleotídica de interesse (NSI) na orientação antissentido; e (d) um módulo de inversão condicional (COIN, que utiliza um íntron de divisão de éxon e um módulo semelhante à armadilha de genes invertível) em orientação reversa. Ver, por exemplo, US 2011/0104799. O alelo condicional pode compreender adicionalmente unidades recombinantes que se recombinam após exposição a uma primeira recombinase para formar um alelo condicional que (i) não possui a sequência de atuação e o DSC; e (ii) contém o NSI na orientação de sentido e a COIN na orientção antissentido. Ver, por exemplo, US 2011/0104799.
[00357] Os insertos de ácido nucleico também podem compreender um polinucleotídeo que codifica um marcador de seleção. Altemativamente, os insertos de ácido nucleico podem não ter um polinucleotídeo que codifique um marcador de seleção. O marcador de seleção pode estar contido em um cassete de seleção. Opcionalmente, o cassete de seleção pode ser um cassete de auto-eliminação. Ver, por exemplo, US 8.697.851 e US 2013/0312129, cada uma das quais é aqui incorporada por referência na sua totalidade para
Petição 870190068171, de 18/07/2019, pág. 211/358
198/307 todos os efeitos. Como um exemplo, a cassete de auto-eliminação pode compreender um gene Crei (compreende dois éxons que codificam uma recombinase Cre, que estão separados por um íntron) operativamente ligado a um promotor Prml de rato e um gene de resistência à neomicina operativamente ligado a um promotor de ubiquitina humano. Os marcadores de seleção exemplares incluem neomicina-fosfotransferase (neor), higromicina B-fosfotransferase (higgr), puromicina-N-acetiltransferase (puror), blasticidina S-desaminase (bsrr), xantina/guanina fosforribosiltransferase (gpt) ou timidina-quinase do vírus herpes simplex (HSV-k), ou uma combinação dos mesmos. O polinucleotídeo que codifica o marcador de seleção pode estar operativamente ligado a um promotor ativo em uma célula sendo direcionada. Exemplos de promotores são descritos em outro local aqui. [00358] O inserto de ácido nucleico também pode compreender um gene repórter. Exemplos de genes repórteres incluem os que codificam luciferase, β-galactosidase, proteína verde fluorescente (GFP), proteína verde fluorescente aumentada (eGFP), proteína fluorescente ciano (CFP), proteína fluorescente amarela (YFP), proteína fluorescente amarela aumentada (eYFP), proteína fluorescente azul (BFP), proteína fluorescente azul aumentada (eBFP), DsRed, ZsGreen, MmGFP, mPlum, mCherry, tdTomato, mStrawberry, J-Vermelho, mOrange, mKO, mCitrine, Venus, YPet, Esmeralda, CyPet, Cerulean, T- Safira e fosfatase alcalina. Tais genes repórteres podem ser operacionalmente ligados a um promotor ativo em uma célula alvo. Exemplos de promotores são descritos em outro local aqui.
[00359] O inserto de ácido nucleico também pode compreender um ou mais cassetes de expressão ou cassetes de eliminação. Dado cassete pode compreender uma ou mais de uma sequência nucleotídica de interesse, um polinucleotídeo que codifica um marcador de seleção e um gene repórter, juntamente com vários componentes reguladores que influenciam a expressão. Exemplos de marcadores selecionáveis e genes repórter que podem
Petição 870190068171, de 18/07/2019, pág. 212/358
199/307 ser incluídos são discutidos em detalhe em outro local aqui.
[00360] O inserto de ácido nucleico pode compreender um ácido nucleico flanqueado com sequências alvo de recombinação específicas do local. Altemativamente, o inserto de ácido nucleico pode compreender uma ou mais sequências alvo de recombinação específicas do local. Embora todo o inserto de ácido nucleico possa ser flanqueado por tais sequências alvo de recombinação específica do local, qualquer região ou polinucleotídeo individual de interesse dentro do inserto de ácido nucleico pode também ser flanqueado por tais locais. As sequências alvo de recombinação específica do local, que podem flanquear o inserto de ácido nucleico ou qualquer polinucleotídeo de interesse no inserto de ácido nucleico podem incluir, por exemplo, loxP, lox511, lox2272, lox66, lox71, loxM2, lox5171, FRT, FRT11, FRT71, attp, att, FRT, rox, ou uma combinação dos mesmos. Em um exemplo, os locais de recombinação específica do local flanqueiam um polinucleotídeo que codifica um marcador de seleção e/ou um gene repórter contido no inserto de ácido nucleico. Após integração do inserto de ácido nucleico no gene HSD17B13, as sequências entre os locais de recombinação específicos do local podem ser removidas. Opcionalmente, podem ser utilizadas duas sequências de doador exógeno, cada uma com um inserto de ácido nucleico compreendendo um local de recombinação específico do local. As sequências de doador exógeno podem ser direcionadas para regiões 5’ e 3’ que flanqueiam um ácido nucleico de interesse. Após a integração dos dois insertos de ácido nucleico no locus genômico alvo, o ácido nucleico de interesse entre os dois locais de recombinação específicos do local inserido pode ser removido.
[00361] Os insertos de ácido nucleico também podem compreender um ou mais locais de restrição para endonucleases de restrição (isto é, enzimas de restrição), que incluem endonucleases do tipo I, do tipo II, do tipo III e do tipo
IV. As endonucleases de restrição do tipo I e do tipo III reconhecem
Petição 870190068171, de 18/07/2019, pág. 213/358
200 / 307 sequências de reconhecimento específicas, mas tipicamente clivam em uma posição variável do local de ligação da nuclease, que pode estar a centenas de pares de bases longe do sítio de clivagem (sequência de reconhecimento). Nos sistemas do tipo II, a atividade de restrição é independente de qualquer atividade de metilase e a clivagem ocorre tipicamente em locais específicos dentro ou próximo do local de ligação. A maioria das enzimas do tipo II cortam sequências palindrômicas, entretanto as enzimas tipo lia reconhecem sequências de reconhecimento não palindrômicas e clivam fora da sequência de reconhecimento, enzimas tipo Ilb cortam duas vezes com ambos os locais fora da sequência de reconhecimento e as enzimas tipo II reconhecem uma sequência de reconhecimento assimétrica e clivamde um lado e a uma distância definida de cerca de 1 a 20 nucleotídeos da sequência de reconhecimento. As enzimas de restrição do tipo IV direcionam DNA metilado. As enzimas de restrição são ainda descritas e classificadas, por exemplo, na base de dados REBASE (página da rede em rebase.neb.com; Roberts et al., (2003) Nucleic Acids Res. 31: 418 a 420; Roberts et al., (2003) Nucleic Acids Acids Res. 31: 1805 a 1812 e Belfort et al. (2002) em Mobile DNA II, p. 761 a 783, Eds. Craigie et al. (ASM Press, Washington, DC)).
(1) Sequências de doadores para inserção não homóloga mediada pela junção de extremidade [00362] Algumas sequências de doador exógeno têm regiões curtas de fita simples na extremidade 5' e/ou na extremidade 3' que são complementares a uma ou mais projeções criadas por clivagem mediada por nucleases ou por proteína Cas no locus genômico alvo (por exemplo, no gene HSD17B13). Essas projeções também podem ser chamadas de braços de homologia de 5' e 3'. Por exemplo, algumas sequências de doador exógeno têm regiões curtas de fita simples na extremidade 5' e/ou na extremidade 3' que são complementares a uma ou mais projeções criadas pela clivagem mediada por proteína Cas em sequências alvo 5' e/ou 3' no locus genômico alvo. Algumas dessas
Petição 870190068171, de 18/07/2019, pág. 214/358
201/307 sequências de doador exógeno têm uma região complementar apenas na extremidade 5’ ou apenas na extremidade 3’. Por exemplo, algumas dessas sequências de doador exógeno têm uma região complementar apenas na extremidade 5' complementar a uma projeção criada em uma sequência alvo 5' no locus genômico alvo ou apenas na extremidade 3' complementar a uma projeção criada na sequência alvo 3' no locus genômico alvo. Outras dessas sequências de doador exógeno têm regiões complementares nas extremidades 5' e 3'. Por exemplo, outras tais sequências de doador exógeno têm regiões complementares nas extremidades 5' e 3', por exemplo, complementares à primeira e segunda projeções, respectivamente, geradas por clivagem mediada por Cas no locus genômico alvo. Por exemplo, se a sequência de doador exógeno for de fita dupla, as regiões complementares de fita simples podem se prolongar a partir da extremidade 5' da fita superior da sequência de doador e da extremidade 5' da fita inferior da sequência de doador, criando projeções em cada extremidade 5’. Alternativamente, a região complementar de fita simples pode se estender a partir da extremidade 3' da fita superior da sequência de doador e da extremidade 3' da fita inferior do modelo, criando projeções 3'.
[00363] As regiões complementares podem ter qualquer comprimento suficiente para promover a ligação entre a sequência de doador exógeno e o gene HSD17B13. Regiões complementares exemplificativas têm entre cerca de 1 e cerca de 5 nucleotídeos de comprimento, entre cerca de 1 e cerca de 25 nucleotídeos de comprimento, ou entre cerca de 5 e cerca de 150 nucleotídeos de comprimento. Por exemplo, uma região complementar pode ser pelo menos cerca de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 nucleotídeos de comprimento. Alternativamente, a região complementar pode ser de cerca de 5 a cerca de 10, cerca de 10 a cerca de 20, cerca de 20 a cerca de 30, cerca de 30 a cerca de 40, cerca de 40 a cerca de 50, cerca de 50 a cerca de 60, cerca de 60 a cerca de 70, cerca de 70
Petição 870190068171, de 18/07/2019, pág. 215/358
202 / 307 a cerca de 80, cerca de 80 a cerca de 90, cerca de 90 a cerca de 100, cerca de 100 a cerca de 110, cerca de 110 a cerca de 120, cerca de 120 a cerca de 130, cerca de 130 a cerca de 140, cerca de 140 a cerca de 150 nucleotídeos de comprimento ou mais.
[00364] Tais regiões complementares podem ser complementares às projeções criadas por dois pares de nickases. Duas quebras de fita dupla com extremidades escalonadas podem ser criadas usando-se primeira e segunda nickases que clivam filamentos opostos de DNA para criar uma primeira quebra de fita dupla e terceira e quarta nickases que clivam filamentos opostos de DNA para criar uma segunda quebra de fita dupla. Por exemplo, uma proteína Cas pode ser utilizada para cortar primeira, segunda, terceira e quarta sequências alvo de RNA guia correspondendo com o primeiro, segundo, terceiro e quarto RNAs guia. A primeira e a segunda sequências alvo de RNA guia podem ser posicionadas para criar um primeiro sítio de clivagem de tal modo que os cortes criados pela primeira e pela segunda nickases na primeira e na segunda fitas de DNA criam uma quebra de fita dupla (isto é, o primeiro sítio de clivagem compreende os cortes dentro da primeira e da segunda sequências alvo de RNA guia). Do mesmo modo, a terceira e a quarta sequências alvo de RNA guia podem ser posicionadas para criar um segundo sítio de clivagem de tal modo que os cortes criados pela terceira e quarta nickases na primeira e segunda fitas de DNA criam uma quebra de fita dupla (isto é, o segundo sítio de clivagem compreende os cortes dentro das terceira e quarta sequências alvo de RNA guia). De preferência, os cortes dentro da primeira e da segunda sequências alvo de RNA guia e/ou da terceira e da quarta sequências alvo de RNA guia podem ser cortes interrompidos que criam projeções. A janela de deslocamento pode ser, por exemplo, pelo menos cerca de 5 pb, 10 pb, 20 pb, 30 pb, 40 pb, 50 pb, 60 pb, 70 pb, 80 pb, 90 pb, 100 pb ou mais. Ver Ran et al. (2013) Cell 154: 1380 a 1389; Mali et al. (2013) Nat. Biotech. 31: 833 a 838; e Shen et al. (2014) Nat.
Petição 870190068171, de 18/07/2019, pág. 216/358
203 / 307
Methods 11: 399 a 404, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos. Em tais casos, uma sequência de doadores exógenos de filamento duplo pode ser projetada com regiões complementares de filamento único que são complementares às projeções criadas pelos cortes dentro da primeira e da segunda sequências alvo de RNA guia e pelos cortes dentro da terceira e da quarta sequências alvo de RNA guia. Tal sequência de doador exógeno pode então ser inserida por ligação não mediada por ligação não homóloga.
(2) Sequências de doador para inserção por reparo dirigido por homologia [00365] Algumas sequências de doador exógeno (isto é, vetores de direcionamento) compreendem braços de homologia. Se a sequência de doador exógeno também compreender um inserto de ácido nucleico, os braços de homologia podem flanquear o inserto de ácido nucleico. Para facilitar a referência, os braços de homologia são aqui referidos como braços de homologia 5' e 3' (isto é, a montante e a jusante). Esta terminologia se refere à posição relativa dos braços de homologia ao inserto de ácido nucleico dentro da sequência de doador exógeno. Os braços de homologia 5' e 3' correspondem a regiões dentro do gene HSD17B13, que são aqui referidas como “sequência alvo 5'“ e “sequência alvo 3'“, respectivamente.
[00366] Um braço de homologia e uma sequência de destino “correspondem” ou são “correspondentes” um ao outro quando as duas regiões compartilham um nível suficiente de identidade de sequência entre si para atuar como substratos para uma reação de recombinação homóloga. O termo “homologia” inclui sequências de DNA que são idênticas ou compartilham a identidade da sequência com uma sequência correspondente. A identidade de sequência entre uma dada sequência alvo e o braço de homologia correspondente encontrado na sequência de doador exógeno pode ser qualquer grau de identidade de sequência que permita que ocorra recombinação homóloga. Por exemplo, a quantidade de identidade de
Petição 870190068171, de 18/07/2019, pág. 217/358
204 / 307 sequência partilhada pelo braço de homologia da sequência de doador exógeno (ou um fragmento da mesma) e da sequência alvo (ou um fragmento da mesma) pode ser pelo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência, de tal modo que as sequências sofrem recombinação homóloga. Além disso, uma região correspondente de homologia entre o braço de homologia e a sequência alvo correspondente pode ser de qualquer comprimento que seja suficiente para promover recombinação homóloga. Braços de homologia exemplificativos possuem entre cerca de 25 nucleotídeos e cerca de 2,5 kb de comprimento, possuem entre cerca de 25 nucleotídeos e cerca de 1,5 kb de comprimento ou estão entre cerca de 25 a cerca de 500 nucleotídeos de comprimento. Por exemplo, um dado braço de homologia (ou cada um dos braços de homologia) e/ou sequência alvo correspondente pode compreender regiões correspondentes de homologia que estão entre cerca de 25 e cerca de 30, cerca de 30 a cerca de 40, cerca de 40 a cerca de 50, cerca de 50 a cerca de 60, cerca de 60 a cerca de 70, cerca de 70 a cerca de 80, cerca de 80 a cerca de 90, cerca de 90 a cerca de 100, cerca de 100 a cerca de 150, cerca de 150 a cerca de 200, cerca de 200 a cerca de 250, cerca de 250 a cerca de 300, cerca de 300 a cerca de 350, cerca de 350 a cerca de 400, cerca de 400 a cerca de 450, ou cerca de 450 a cerca de 500 nucleotídeos de comprimento, de tal modo que os braços de homologia têm homologia suficiente para sofrer recombinação homóloga com as sequências alvo correspondentes dentro do gene HSD17B13. Altemativamente, um dado braço de homologia (ou cada braço de homologia) e/ou sequência alvo correspondente pode compreender regiões correspondentes de homologia que estão entre cerca de 0,5 kb a cerca de 1 kb, cerca de 1 kb a cerca de 1,5 kb, cerca de 1,5 kb a cerca de 2 kb ou cerca de 2 kb a cerca de 2,5 kb de comprimento. Por exemplo, os braços de homologia podem ter cerca de 750 nucleotídeos de comprimento. Os braços
Petição 870190068171, de 18/07/2019, pág. 218/358
205 / 307 de homologia podem ser simétricos (cada um com o mesmo tamanho de comprimento), ou podem ser assimétricos (um mais comprido que o outro). [00367] Os braços de homologia podem corresponder a um locus que é nativo de uma célula (por exemplo, o locus alvo). Altemativamente, por exemplo, eles podem corresponder a uma região de um segmento de DNA heterólogo ou exógeno que foi integrado no genoma da célula, incluindo, por exemplo, transgenes, cassetes de expressão, ou regiões heterólogas ou exógenas de DNA. Altemativamente, os braços de homologia do vetor de direcionamento podem corresponder a uma região de um cromossoma artificial de levedura (YAC), um cromossoma artificial bacteriano (BAC), um cromossoma artificial humano ou qualquer outra região modificada contida em uma célula hospedeira apropriada. Ainda mais, os braços de homologia do vetor de direcionamento podem corresponder ou ser derivados de uma região de uma biblioteca BAC, uma biblioteca de cosmídeos ou uma biblioteca de fagos Pl, ou podem ser derivados de DNA sintético.
[00368] Quando um agente de nuclease é utilizado em combinação com uma sequência de doador exógeno, as sequências alvo 5' e 3' estão preferencialmente localizadas em uma proximidade suficiente do sítio de clivagem da nuclease, de modo a promover a ocorrência de um evento de recombinação homóloga entre as sequências alvo e os braços de homologia sobre uma quebra de fita simples (corte) ou quebra de fita dupla no sítio de clivagem de nuclease. O termo “sítio de clivagem de nuclease” inclui uma sequência de DNA na qual é criada uma quebra de fita dupla ou corte por um agente de nuclease (por exemplo, uma proteína Cas9 complexada com um RNA guia). As sequências alvo dentro do gene HSD17B13 que correspondem aos braços de homologia 5' e 3' da sequência de doador exógeno estão “localizadas em proximidade suficiente” a um sítio de clivagem de nuclease se a distância é tal que promova a ocorrência de um evento de recombinação homóloga entre as sequências alvo 5' e 3' e os braços de homologia sobre uma
Petição 870190068171, de 18/07/2019, pág. 219/358
206 / 307 quebra de fita simples ou quebra de fita dupla no sítio de clivagem da nuclease. Assim, as sequências alvo correspondentes aos braços de homologia 5' e/ou 3' da sequência de doador exógeno podem ser, por exemplo, dentro de pelo menos 1 nucleotídeo de um dado sítio de clivagem de nuclease ou dentro de pelo menos 10 nucleotídeos a cerca de 1000 nucleotídeos de um dado sítio de clivagem de nuclease. Como exemplo, o sítio de clivagem de nuclease pode ser imediatamente adjacente a pelo menos uma ou ambas as sequências alvo.
[00369] A relação espacial das sequências alvo que correspondem aos braços de homologia da sequência de doador exógeno e do sítio de clivagem da nuclease pode variar. Por exemplo, as sequências alvo podem estar localizadas a 5' do sítio de clivagem da nuclease, as sequências alvo podem estar localizadas a 3' do sítio de clivagem da nuclease, ou as sequências alvo podem flanquear o sítio de clivagem da nuclease.
IV. Aplicações Terapêuticas e Profiláticas [00370] Também são providos métodos terapêuticos e métodos de tratamento ou profilaxia de uma doença do fígado crônica em um indivíduo com ou em risco de ter a doença, utilizando os métodos aqui divulgados para modificar ou alterar a expressão de um gene HSD17B13 endógeno. São também providos métodos terapêuticos e métodos de tratamento ou profilaxia de uma doença do fígado, tal como uma doença do fígado alcoólica ou uma doença do fígado não alcoólica em um indivíduo com ou em risco ter a doença utilizando os métodos aqui descritos para modificar ou alterar a expressão de um gene HSD17B13 endógeno. São também providos métodos terapêuticos e métodos de tratamento ou profilaxia de uma doença do fígado crônica em um indivíduo com ou em risco de ter a doença utilizando métodos para diminuir a expressão de transcrições de RNAm de HSD17B13 ou utilizando métodos para fornecer ácidos nucleicos recombinantes codificando proteínas de HSD17B13, fornecendo RNAm que codifica proteínas de
Petição 870190068171, de 18/07/2019, pág. 220/358
207 / 307
HSD17B13, ou fornecer proteínas de HSD17B13 ao indivíduo. São também providos métodos terapêuticos e métodos de tratamento ou profilaxia de uma doença do fígado, tal como uma doença do fígado alcoólica ou uma doença do fígado não alcoólica em um indivíduo com ou em risco de ter a doença utilizando métodos para diminuir a expressão de transcrições de RNAm de HSD17B13 ou utilizando métodos para fornecer ácidos nucleicos recombinantes que codificam proteínas de HSD17B13, fornecendo RNAm que codifica proteínas de HSD17B13 ou fornecendo proteínas de HSD17B13 ao indivíduo. Os métodos podem compreender a introdução de um ou mais ácidos nucleicos ou proteínas no indivíduo, no fígado do indivíduo ou em uma célula (por exemplo, célula do fígado) do indivíduo (por exemplo, in vivo ou ex vivo).
[00371] As doenças do fígado crônicas incluem doenças do fígado que duram ao longo de um período de seis meses e podem incluir, por exemplo, doenças do fígado que envolvem a destruição progressiva e a regeneração do parênquima do fígado que pode levar a fibrose e cirrose. As doenças do fígado crônicas podem ser doenças do fiado alcoólicas ou doenças do fígado não alcoólicas. Patologias do fígado abrangidas por doenças do fígado crônicas podem incluir, por exemplo, inflamação (por exemplo, hepatite crônica), cirrose hepática e carcinoma hepatocelular. Tipos de doença do fígado crônica são aqui divulgados em outros locais e incluem, por exemplo, doença do fígado gorduroso, doença do fígado gorduroso não alcoólica, doença do fígado gorduroso alcoólico, cirrose e carcinoma hepatocelular. Os sintomas e sinais de doenças do fígado crônicas são conhecidos e podem incluir, por exemplo, aumento do fígado, fadiga, dor no abdômen superior direito, inchaço abdominal (ascite), vasos sanguíneos dilatados logo abaixo da superfície da pele, seios aumentados nos homens, baço aumentado, palmas vermelhas e amarelecimento da pele e dos olhos (icterícia). Testes para doenças do fígado crônicas podem envolver exames de sangue, imagens do
Petição 870190068171, de 18/07/2019, pág. 221/358
208 / 307 fígado e biópsia do fígado. Um indivíduo apresenta risco aumentado de doença do fígado crônica se o indivíduo tiver pelo menos um fator de risco conhecido (por exemplo, fator genético, como mutação causadora de doença), colocando os indivíduos com esse fator de risco em um risco estatisticamente significativo de desenvolver a doença do que indivíduos sem o fator de risco. Os fatores de risco para hepatopatias crônicas também são bem conhecidos e podem incluir, por exemplo, uso excessivo de álcool, obesidade, colesterol alto, altos níveis de triglicerídeos no sangue, síndrome dos ovários policísticos, apneia do sono, diabetes tipo 2, tireoide subativa (hipotireoidismo), hipófise subativa (hipopituitarismo) e síndromes metabólicas, incluindo lipídios sanguíneos elevados.
[00372] O termo “indivíduo” inclui seres humanos e outros mamíferos (por exemplo, felino, canino, roedor, camundongo ou rato) ou indivíduos não mamíferos (por exemplo, aves) que recebem tratamento profilático ou terapêutico. Tais indivíduos podem ser, por exemplo, um indivíduo (por exemplo, um humano) que não é um portador da variante de HSD17B13, rs72613567, (ou é apenas um portador heterozigótico da variante de HSD17B13, rs72613567,) e tem ou é suscetível a desenvolver uma doença do fígado crônica. Vários métodos são possíveis para detectar a presença da variante de HSD17B13, rs72613567, em uma amostra biológica compreendendo DNA genômico, para detectar a presença ou níveis de qualquer uma ou uma combinação de transcrições C, D, E, F, F', G, e H de HSD17B13, e particularmente D, em uma amostra biológica compreendendo RNAm ou DNAc, ou para detectar a presença ou níveis de qualquer uma ou uma combinação das isoformas da proteína de C, D, E, F, F', G ou H de HSD17B13, e particularmente D, em uma amostra biológica compreendendo proteína. Os métodos para detectar a presença de uma sequência no DNA genômico e para detectar a presença de uma transcrição de RNAm particular ou isoforma proteica são bem conhecidos. Entende-se que as sequências de
Petição 870190068171, de 18/07/2019, pág. 222/358
209 / 307 genes dentro de uma população e RNAm e proteínas codificadas por tais genes podem variar devido a polimorfismos, tais como polimorfismos de nucleotídeo único. As sequências aqui providas para o gene HSD17B13 e para cada transcrição de HSD17B13 e isoform de HSD17B13 são apenas sequências exemplares para o gene HSD17B13 e para cada transcrição de HSD17B13 e isoforma de HSD17B13. Outras sequências para o gene HSD17B13 e para cada transcrição de HSD17B13 e isoforma de HSD17B13 também são possíveis.
[00373] Por exemplo, um método para detectar uma variante de HSD17B13, rs72613567, em uma célula ou em um indivíduo, tal como um indivíduo humano pode compreender, por exemplo, a obtenção de uma amostra biológica do indivíduo compreendendo um gene HSD17B13, e realizar um ensaio na amostra biológica que determina que uma posição do gene HSD17B13 correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 e a SEQ ID NO: 2 estão perfeitamente alinhados é ocupada por uma timina ou que uma timina é inserida entre posições correspondentes às posições 12665 e 12666 quando o gene HSD17B13 e a SEQ ID NO: 1 estão perfeitamente alinhados. Entende-se que a determinação de que uma posição do gene HSD17B13 correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 e a SEQ ID NO: 2 estão perfeitamente alinhados é ocupada por uma timina significa que a identidade de um número suficiente de nucleotídeos é determinada nas posições que flanqueiam as posições correspondentes às posições 12665 e 12666 da SEQ ID NO: 1 que pode ser determinado que uma timina é inserida entre as posições correspondentes às posições 12665 e 12666 da SEQ ID NO: 1. Tais ensaios podem compreender, por exemplo, determinar a identidade de posições do gene HSD17B13 correspondente à posição 12666 da SEQ ID NO: 2 (ou posições 12665 e 12666 da SEQ ID NO: 1) e uma ou mais posições circundantes (por exemplo, pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 posições flanqueando um lado ou
Petição 870190068171, de 18/07/2019, pág. 223/358
210/307 cada lado da posição 12666 da SEQ ID NO: 2 ou posições 12665 e 12666 da SEQ ID NO: 1) quando o gene HSD17B13 e a SEQ ID NO: 2 (ou SEQ ID NO: 1) estão perfeitamente alinhados. O ensaio em tal método pode compreender, por exemplo, o sequenciamento de uma porção do gene HSD17B13 incluindo uma posição correspondente à posição 12666 ou às posições 12666 e 12667 da SEQ ID NO: 2 quando o gene HSD17B13 e a SEQ ID NO: 2 estão perfeitamente alinhados . Do mesmo modo, o ensaio pode compreender o sequenciamento de uma porção do gene HSD17B13 incluindo posições correspondentes às posições 12665 e 12666 da SEQ ID NO: 1, quando o gene HSD17B13 e a SEQ ID NO: 1 estão perfeitamente alinhados. Alternativamente, o ensaio em tal método pode compreender o contato da amostra biológica com um iniciador ou sonda que hibridiza especificamente com a variante de HSD17B13, rs72613567, e não com a sequência de HSD17B13 de tipo selvagem correspondente (por exemplo, sob condições rigorosas), e determinar se ocorreu hibridização.
[00374] Tais métodos podem compreender a edição de genoma ou terapia genética. Por exemplo, um gene HSD17B13 endógeno que não é a variante de HSD17B13, rs72613567, pode ser modificado para compreender a variação associada à variante de HSD17B13, rs72613567, (isto é, uma inserção de uma timina entre nucleotídeos correspondente às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 1, ou uma inserção de uma adenina na posição correspondente na fita oposta). Como outro exemplo, um gene HSD17B13 endógeno que não é a variante de HSD17B13, rs72613567, pode ser eliminado ou inativado. Do mesmo modo, um gene HSD17B13 endógeno que não é a variante de HSD17B13, rs72613567, pode ser eliminado ou inativado e um gene HSD17B13 compreendendo a modificação associada à variante de HSD17B13, rs72613567, (por exemplo, a variante de HSD17B13, rs72613567, completa ou um minigene compreendendo a modificação) pode
Petição 870190068171, de 18/07/2019, pág. 224/358
211/307 ser introduzido e expresso. De modo semelhante, um gene HSD17B13 endógeno que não é a variante de HSD17B13, rs72613567, pode ser eliminado ou inativado e um DNA recombinante que codifica qualquer uma ou qualquer combinação de isoformas C, D, F, G e H de HSD17B13 (ou fragmentos das mesmas) pode ser introduzido e expresso, um RNAm que codifica qualquer uma ou qualquer combinação de isoformas C, D, F, G e H de HSD17B13 (ou fragmentos das mesmas) pode ser introduzido e expresso (por exemplo, terapia de substituição de proteínas intracelulares) ou qualquer uma ou qualquer combinação de isoformas C, D, F, G e H de HSD17B13 (ou fragmentos das mesmas) pode ser introduzida (por exemplo, terapia de substituição de proteínas). Em modalidades particulares, a combinação de isoformas de HSD17B13 (ou DNA ou RNAm que codifica) é uma combinação compreendendo a isoforma D de HSD17B13 (por exemplo, D, DC, DF, DG, DH, DCF, DCG, DCH, DFG, DFH, DGH, DCFG, DCFH, DCGH, DFGH ou DCFGH).
[00375] Outros métodos podem compreender a introdução e expressão de um gene HSD17B13 recombinante compreendendo a modificação associada à variante de HSD17B13, rs72613567 (por exemplo, a variante de HSD17B13, rs72613567, completa ou um minigene compreendendo a modificação), introduzindo e expressando ácidos nucleicos recombinantes (por exemplo, DNA) que codificam qualquer uma ou qualquer combinação de isoformas C, D, F, G, e H de HSD17B13 ou fragmentos das mesmas, introduzindo e expressando um ou mais RNAm que codifica qualquer uma ou qualquer combinação de isoformas C, D, F, G, e H de HSD17B13 ou fragmentos das mesmas (por exemplo, terapia de substituição de proteína intracelular), ou introdução de qualquer uma ou qualquer combinao das isoformas C, D, F, G e H de HSD17B13 ou fragmentos das mesmas (por exemplo, terapia de substituição de proteína) sem eliminar ou inativar um gene HSD17B13 endógeno que não é a variante de HSD17B13, rs72613567.
Petição 870190068171, de 18/07/2019, pág. 225/358
212/307
Em modalidades particulares, a combinação de isoformas de HSD17B13 (ou DNA ou RNAm que codifica) é uma combinação que compreende a isoforma D de HSD17B13 (por exemplo, D, DC, DF, DG, DH, DCF, DCG, DCH, DFG, DFH, DGH, DCFG, DCFH, DCGH, DFGH ou DCFGH). Opcionalmente, esses métodos também podem ser feitos em combinação com métodos nos quais uma transcrição de HSD17B13 cuja expressão diminui em portadores da variante de HSD17B13, rs72613567, (por exemplo, transcrições A, B, E e F') é direcionada para expressão reduzida, tal como através de uso de RNA antissentido, siRNA ou shRNA. Em modalidades particulares, as transcrições de HSD17B13 direcionadas para expressão reduzida são uma combinação compreendendo a transcrição A (por exemplo, A, AB, AE, AF’, ABE, ABF’, AEF’ ou ABEF’).
[00376] Um gene ou minigene HSD17B13 ou um DNA que codifica qualquer uma ou qualquer combinação da isoformas C, D, F, G e H de HSD17B13 ou fragmentos das mesmas podem ser introduzidos e expressos na forma de um vetor de expressão que não modifica o genoma, pode ser introduzido na forma de um vetor de direcionamento de tal modo que se integra genomicamente em um locus de HSD17B13, ou pode ser introduzido de tal forma que se integra genomicamente em um locus diferente do locus de HSD17B13, tal como um locus de porto seguro. O gene HSD17B13 genomicamente integrado pode ser operacionalmente ligado a um promotor de HSD17B13 ou a outro promotor, tal como um promotor endógeno no local da integração. Locus de porto seguro são locais cromossômicos onde os transgenes podem ser expressos de forma estável e confiável em todos os tecidos de interesse sem afetar adversamente a estrutura ou a expressão do gene. Os loci de porto seguro podem ter, por exemplo, uma ou mais ou todas as seguintes características: (1) distância superior a 50 kb da extremidade 5' de qualquer gene; distância superior a 300 kb de qualquer gene relacionado ao câncer; distância superior a 300 kb de qualquer microRNA; fora de uma
Petição 870190068171, de 18/07/2019, pág. 226/358
213/307 unidade de transcrição de genes, e fora de regiões ultra-conservadas. Exemplos de loci de porto seguro adequados incluem o sítio do vírus adenoassociado 1 (AAVS1), o locus do gene do receptor 5 da quimiocina (motivo CC) 5 (CCR5) e o ortólogo humano do locus de ROSA26 de camundongo.
[00377] Combinações de isoformas da proteína de HSD17B13 ou ácidos nucleicos que codificam as isoformas da proteína de HSD17B13 que podem ser introduzidas e expressas incluem, por exemplo, C, D, F, G, H, CD, CF, CG, CH, DF, DG, DH, FG, FH, GH, CDF, CDG, CDH, CFG, CFH, CGH, DFG, DFH, DGH, FGH, CDFG, CDFH, CFGH, DFGH e CDFGH. Em métodos particulares, a isoforma D de HSD17B13 ou um ácido nucleico que codifica a isoforma D (sozinha ou em combinação com outras isoformas) é introduzido ou expresso. Sequências exemplificativas para cada uma destas isoformas e transcrições são providas em outro local deste documento. Entende-se, no entanto, que sequências de genes e dentro de uma população, sequências de RNAm transcritas a partir desses genes e proteínas traduzidas a partir de tais RNAms podem variar devido a polimorfismos, tais como polimorfismos de nucleotídeo único. As sequências aqui providas para cada transcrição e isoforma são apenas sequências exemplificativas. Outras sequências também são possíveis.
[00378] Combinações de transcrições de HSD17B13 cuja expressão pode ser direcionada para redução através de RNA antissentido, shRNA, ou siRNA incluem, por exemplo, A, Β, E, F', AB, AE, AF', BE, BF', ABE, ABF', AEF', BEF 'e ABEF'. Em métodos particulares, a transcrição A de HSD17B13 (sozinha ou em combinação com outras transcrições) é direcionada. Por exemplo, o RNA antissentido, siRNA, ou shRNA pode hibridizar com uma sequência dentro da SEQ ID NO: 4 (transcrição A de HSD17B13). Opcionalmente, o RNA antissentido, siRNA, ou shRNA hibridiza com uma sequência presente na SEQ ID NO: 4 (transcrição A de HSD17B13) que não está presente na SEQ ID NO: 7 (transcrição D de HSD17B13).
Petição 870190068171, de 18/07/2019, pág. 227/358
214/307
Opcionalmente, o RNA antissentido, siRNA ou shRNA hibridizam com uma sequência no éxon 7 ou uma sequência que abrange o limite éxon 6-éxon 7 da SEQ ID NO: 4 (transcrição A de HSD17B13).
[00379] Por exemplo, alguns desses métodos compreendem um método de tratamento de um indivíduo que não é um portador da variante de HSD17B13, rs72613567 (ou é apenas um portador heterozigótico da variante de HSD17B13, rs72613567) e tem ou é suscetível a desenvolver uma doença do fígado crônica, compreendendo introduzir no indivíduo ou introduzir em uma célula do fígado no indivíduo: (a) um agente de nuclease (ou ácido nucleico codificador) que se liga a uma sequência alvo de nuclease dentro de um gene HSD17B13, em que a sequência alvo de nuclease inclui ou está próxima de uma posição correspondendo à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2; e (b) uma sequência de doador exógeno compreendendo um braço de homologia 5' que hibridiza com uma sequência alvo 5' da posição correspondente à posição 12666 da SEQ ID NO: 2, um braço de homologia 3' que hibridiza com uma sequência alvo 3' da posição correspondente à posição 12666 da SEQ ID NO: 2 e um inserto de ácido nucleico compreendendo uma timina flanqueada pelo braço de homologia 5' e o braço de homologia 3'. O agente de nuclease pode clivar o gene HSD17B13 em uma célula do fígado no indivíduo, e a sequência de doador exógeno pode se recombinar com o gene HSD17B13 na célula do fígado, em que mediante recombinação da sequência de doador exógeno com o gene HSD17B13, a timina é inserida entre nucleotídeos correspondentes às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 1. Exemplos de agentes de nuclease (por exemplo, uma proteína Cas9 e um RNA guia) que podem ser utilizados em tais métodos são divulgados em outro local aqui. Exemplos de RNAs guia adequados e sequências alvo de RNA guia são divulgados em outro local deste documento. Exemplos de
Petição 870190068171, de 18/07/2019, pág. 228/358
215/307 sequências de doador exógeno que podem ser utilizadas em tais métodos são divulgados em outro local deste documento.
[00380] Como outro exemplo, alguns desses métodos compreendem um método de tratamento de um indivíduo que não é portador da variante de HSD17B13, rs72613567 (ou é apenas um portador heterozigótico da variante de HSD17B13, rs72613567) e tem ou é suscetível ao desenvolvimento de uma doença do fígado crônica compreendendo introduzir no indivíduo ou introduzir em uma célula de fígado no indivíduo uma sequência de doador exógeno compreendendo um braço de homologia 5' que hibridiza com uma sequência alvo 5' da posição correspondente à posição 12666 da SEQ ID NO: 2, um braço de homologia 3’ que hibridiza com uma sequência alvo 3' da posição correspondente à posição 12666 da SEQ ID NO: 2, e um inserto de ácido nucleico que compreende uma timina flanqueada pelo braço de homologia 5' e o braço de homologia 3'. A sequência de doador exógeno pode se recombinar com o gene HSD17B13 na célula do fígado, em que após a recombinação da sequência de doador exógeno com o gene HSD17B13, a timina é inserida entre nucleotídeos correspondentes às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 1. Exemplos de sequências de doador exógeno que podem ser utilizadas em tais métodos são divulgados em outro local da presente invenção.
[00381] Alguns desses métodos compreendem um método para tratar um indivíduo que não é portador da variante de HSD17B13, rs72613567 (ou é apenas um portador heterozigótico da variante de HSD17B13, rs72613567) e tem ou é suscetível a desenvolver uma doença do fígado crônica, compreendendo introduzir no indivíduo ou introduzir em uma célula do fígado no indivíduo: (a) um agente de nuclease (ou codificação de ácido nucleico) que se liga a uma sequência alvo de nuclease dentro de um gene HSD17B13, em que a sequência alvo de nuclease compreende o códon de
Petição 870190068171, de 18/07/2019, pág. 229/358
216/307 iniciação para o gene HSD17B13 ou está dentro de cerca de 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos do códon de iniciação ou é selecionado a partir das SEQ ID NOS: 20 a 81. O agente de nuclease pode clivar e interromper a expressão do gene HSD17B13 em uma célula de fígado no indivíduo. Alguns desses métodos compreendem um método de tratamento de um indivíduo que não é um portador da variante de HSD17B13, rs72613567 (ou é apenas um portador heterozigótico da variante de HSD17B13, rs72613567) e tem ou é suscetível a desenvolver uma doença do fígado crônica, compreendendo introduzir no indivíduo ou introduzir em uma célula do fígado no indivíduo: (a) um agente de nuclease (ou codificação de ácido nucleico) que se liga a uma sequência alvo de nuclease em um gene HSD17B13, em que a sequência alvo de nuclease compreende o códon de iniciação para o gene HSD17B13 ou está dentro de cerca de 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos do códon de iniciação ou é selecionado a partir das SEQ ID NOS: 20 a 81; e (b) um vetor de expressão que compreende um gene HSD17B13 recombinante que compreende uma timina inserida entre nucleotídeos correspondendo às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 recombinante está perfeitamente alinhado com a SEQ ID NO: 1. O vetor de expressão pode ser um que não se integra genomicamente. Altemativamente, um vetor de direcionamento (isto é, sequência de doador exógeno) pode ser introduzido compreendendo um gene HSD17B13 recombinante que compreende uma timina inserida entre nucleotídeos correspondendo às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 recombinante está perfeitamente alinhado com a SEQ ID NO : 1. O agente de nuclease pode clivar e interromper a expressão do gene HSD17B13 em uma célula de fígado no indivíduo e o vetor de expressão pode expressar o gene HSD17B13 recombinante na célula de fígado no indivíduo. Altemativamente, o gene HSD17B13 recombinante genomicamente integrado pode expressar na célula do fígado no indivíduo.
Petição 870190068171, de 18/07/2019, pág. 230/358
217/307
Exemplos de agentes de nuclease (por exemplo, uma proteína Cas9 ativa em nuclease e RNA guia) que podem ser utilizados em tais métodos são divulgados em outro local aqui. Exemplos de RNAs guia adequados e sequências alvo de RNA guia são divulgados em outro local deste documento. A etapa (b) pode altemativamente compreender introduzir um vetor de expressão ou vetor de direcionamento que compreende um ácido nucleico (por exemplo, DNA) que codifica uma proteína de HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica às isoformas C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas e/ou que compreende uma sequência que seja pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica às transcrições C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas. Do mesmo modo, a etapa (b) pode altemativamente compreender introduzir um RNAm que codifica uma proteína de HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100 % idêntica às isoformas C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas e/ou um DNA complementar (ou uma porção do mesmo) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, a menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico às transcrições C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas. Do mesmo modo, a etapa (b) pode altemativamente compreender introduzir uma proteína que compreende uma sequência que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica às isoformas C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas. Em métodos específicos, a transcrição pode ser transcrição D de HSD17B13 (por exemplo, SEQ ID NO: 7), ou a isoforma pode ser isoforma D de HSD17B13 (por exemplo, SEQ ID NO: 15). Em outros métodos específicos, pode ser introduzida uma combinação de
Petição 870190068171, de 18/07/2019, pág. 231/358
218/307 isoformas de HSD17B13, ou vetores de expressão ou vetores de direcionamento que codificam uma combinação de isoformas de HSD17B13 ou RNAm que codifica uma combinação de isoformas de HSD17B13 (por exemplo, D, DC, DF, DG, DH, DCF, DCG, DCH, DFG, DFH, DGH, DCFG, DCFH, DCGH, DFGH ou DCFGH).
[00382] Em alguns desses métodos, um segundo agente de nuclease é também introduzido no indivíduo ou na célula do fígado no indivíduo, em que o segundo agente de nuclease se liga a uma segunda sequência alvo de nuclease dentro do gene HSD17B13, em que a segunda sequência alvo de nuclease compreende o códon de terminação para o gene HSD17B13 ou está dentro de cerca de 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos do códon de terminação ou é selecionado a partir das SEQ ID NOS: 82 a 225 em que o agente de nuclease cliva o gene HSD17B13 na célula do fígado tanto na sequência alvo da primeira nuclease como na sequência alvo da segunda nuclease, em que a célula do fígado é modificada para compreender uma eliminação entre a primeira sequência alvo da nuclease e a segunda sequência alvo da nuclease. Por exemplo, o segundo agente de nuclease pode ser uma proteína Cas9 e um RNA guia. RNAs guia adequados e sequências alvo de RNA guia na proximidade do códon de terminação são aqui divulgados em outro local.
[00383] Tais métodos também podem compreender um método de tratamento de um indivíduo que não é portador da variante de HSD17B13, rs72613567 (ou é apenas um portador heterozigótico da variante de HSD17B13, rs72613567) e tem ou é suscetível a desenvolver uma doença do fígado crônica, compreendendo introduzir no indivíduo ou introduzir em uma célula do fígado no indivíduo: (a) uma proteína de ligação ao DNA (ou ácido nucleico codificador) que se liga a uma sequência alvo da proteína de ligação ao DNA dentro de um gene HSD17B13, em que a sequência alvo da proteína de ligação ao DNA compreende o códon de iniciação para o gene HSD17B13
Petição 870190068171, de 18/07/2019, pág. 232/358
219/307 ou está dentro de cerca de 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos do códon de iniciação ou é selecionada a partir das SEQ ID NOS: 20 a 81. A proteína de ligação ao DNA pode alterar (por exemplo, reduzir) a expressão do gene HSD17B13 em uma célula do fígado no indivíduo. Tais métodos também podem compreender um método de tratamento de um indivíduo que não é um portador da variante de HSD17B13, rs72613567 (ou é apenas um portador heterozigótico da variante de HSD17B13, rs72613567) e tem ou é suscetível a desenvolver uma doença do fígado crônica, compreendendo a introduzir no indivíduo ou introduzir em uma célula do fígado no indivíduo: (a) uma proteína de ligação ao DNA (ou de ácido nucleico que codifica) que se liga a uma sequência alvo da proteína de ligação ao DNA dentro de um gene HSD17B13, em que a sequência alvo de proteína de ligação ao DNA compreende o códon de iniciação para o gene HSD17B13 ou está dentro de cerca de 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos do códon de iniciação ou é selecionado a partir das SEQ ID NOS: 20 a 81; e (b) um vetor de expressão que compreende um gene HSD17B13 recombinante que compreende uma timina inserida entre nucleotídeos correspondendo às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 recombinante está perfeitamente alinhado com a SEQ ID NO: 1. O vetor de expressão pode ser um que não se integra genomicamente. Alternativamente, um vetor de direcionamento (isto é, sequência de doador exógeno) pode ser introduzido compreendendo um gene HSD17B13 recombinante que compreende uma timina inserida entre nucleotídeos correspondendo às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 recombinante está perfeitamente alinhado com a SEQ ID NO : 1. A proteína de ligação ao DNA pode alterar (por exemplo, reduzir) a expressão do gene HSD17B13 em uma célula do fígado no indivíduo e o vetor de expressão pode expressar o gene HSD17B13 recombinante na célula do fígado no indivíduo. Altemativamente, o gene
Petição 870190068171, de 18/07/2019, pág. 233/358
220 / 307
HSD17B13 recombinante genomicamente integrado pode expressar na célula do fígado no indivíduo. Exemplos de proteínas de ligação ao DNA adequadas para utilização em tais métodos são aqui divulgados em outro local. Tais proteínas de ligação a DNA (por exemplo, proteína Cas9 e RNA guia) podem ser fundidas ou operativamente ligadas a um domínio repressor de transcrição. Por exemplo, a proteína de ligação a DNA pode ser uma proteína Cas9 inativa cataliticamente fundida a um domínio repressor de transcrição. Tal proteína de ligação ao DNA fundida com um domínio repressor de transcrição pode ser utilizada, por exemplo, para diminuir a expressão de um gene HSD17B13 do tipo selvagem ou um gene HSD17B13 que não é a variante rs72613567 (por exemplo, para diminuir a expressão de transcrições de HSD17B13 ou isoform A). Exemplos de RNAs guia adequados e sequências alvo de RNA guia são divulgados em outro local deste documento. A etapa (b) pode altemativamente compreender introduzir um vetor de expressão ou vetor de direcionamento que compreende um ácido nucleico (por exemplo, DNA) que codifica uma proteína de HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica às isoforma C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas e/ou compreendendo uma sequência que seja pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica às transcrições C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas. Do mesmo modo, a etapa (b) pode altemativamente compreender introduzir um RNAm que codifica uma proteína de HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100 % idêntica às isoformas C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas e/ou um DNA complementar (ou uma porção do mesmo) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, a menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico às
Petição 870190068171, de 18/07/2019, pág. 234/358
221 / 307 transcrições C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas. Do mesmo modo, a etapa (b) pode altemativamente compreender introduzir uma proteína que compreende uma sequência que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica às isoformas C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas. Em métodos específicos, a transcrição pode ser transcrição D de HSD17B13 (por exemplo, SEQ ID NO: 7), ou a isoforma pode ser isoforma D de HSD17B13 (por exemplo, SEQ ID NO: 15). Em outros métodos específicos, pode ser introduzida uma combinação de isoformas de HSD17B13, ou vetores de expressão ou vetores de direcionamento que codificam uma combinação de isoformas de HSD17B13 ou RNAm que codifica uma combinação de isoformas de HSD17B13 (por exemplo, D, DC, DF, DG, DH, DCF, DCG, DCH, DFG, DFH, DGH, DCFG, DCFH, DCGH, DFGH ou DCFGH).
[00384] Esses métodos também podem compreender um método para tratar um indivíduo que não é um portador da variante de HSD17B13, rs72613567 (ou é apenas um portador heterozigótico da variante de HSD17B13, rs72613567) e tem ou é suscetível a desenvolver uma doença do fígado crônica, compreendendo introduzir no indivíduo ou introduzir em uma célula do fígado no indivíduo: um RNA antissentido, um siRNA, ou um shRNA que hibridiza com uma sequência dentro de uma região de uma ou mais das transcrições A, B, E e F' de HSD17B13 (e particularmente A) que opcionalmente não está presente em uma ou mais das transcrições C, D, F, G e H de HSD17B13 (e particularmente D). Opcionalmente, o RNA antissentido, siARN ou shRNA hibridiza com uma sequência dentro da SEQ ID NO: 4 (transcrição A de HSD17B13), e o RNA antissentido, siRNA ou shRNA pode diminuir a expressão da transcrição A de HSD17B13 em uma célula. Opcionalmente, o RNA antissentido, siRNA, ou shRNA hibridiza com uma sequência presente na SEQ ID NO: 4 (transcrição A de HSD17B13) que
Petição 870190068171, de 18/07/2019, pág. 235/358
222 / 307 não está presente na SEQ ID NO: 7 (transcrição D de HSD17B13). Opcionalmente, o RNA antissentido, siRNA ou shRNA hibridizam com uma sequência no éxon 7 ou uma sequência que abrange o limite éxon 6-éxon 7 da SEQ ID NO: 4 (transcrição A de HSD17B13). Por exemplo, o RNA antissentido, siRNA ou shRNA pode hibridizar com a sequência dentro de uma região no éxon 7 ou uma região que abrange o limite do éxon 6-éxon 7 da SEQ ID NO: 4 (transcrição A de HSD17B13) e diminuir a expressão da transcrição A de HSD17B13 em uma célula do fígado no indivíduo. Opcionalmente, tais métodos podem compreender adicionalmente introduzir no indivíduo um vetor de expressão que compreende um gene HSD17B13 recombinante que compreende uma timina inserida entre nucleotídeos correspondendo às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 recombinante está perfeitamente alinhado com a SEQ ID NO: 1. O vetor de expressão pode ser um que não se integra genomicamente. Altemativamente, um vetor de direcionamento (isto é, sequência de doador exógeno) pode ser introduzido compreendendo um gene HSD17B13 recombinante que compreende uma timina inserida entre nucleotídeos correspondendo às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 recombinante está perfeitamente alinhado com a SEQ ID NO : 1. Nos métodos em que é utilizado um vetor de expressão, o vetor de expressão pode expressar o gene HSD17B13 recombinante na célula do fígado no indivíduo. Altemativamente, em métodos nos quais um gene HSD17B13 recombinante é genomicamente integrado, o gene HSD17B13 recombinante pode expressar na célula do fígado no indivíduo. Tais métodos podem compreender introduzir um vetor de expressão ou vetor de direcionamento que compreende um ácido nucleico (por exemplo, DNA) que codifica uma proteína de HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98 %, pelo menos 99%, ou 100% idêntica às isoformas C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas
Petição 870190068171, de 18/07/2019, pág. 236/358
223 / 307 e/ou compreendendo uma sequência que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica às transcrições C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas. Do mesmo modo, tais métodos podem alternativamente compreender introduzir um RNAm que codifica uma proteína de HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica às isoformas C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas e/ou possuindo um DNA complementar (ou uma porção do mesmo) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97 %, pelo menos 98%, pelo menos 99%, ou 100% idêntico às transcrições C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas. Do mesmo modo, tais métodos podem alternativamente compreender introduzir uma proteína que compreende uma sequência que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica às isoformas C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas. Em métodos específicos, a transcrição pode ser transcrição D de HSD17B13 (por exemplo, SEQ ID NO: 7), ou a isoforma pode ser isoforma D de HSD17B13 (por exemplo, SEQ ID NO: 15). Em outros métodos específicos, pode ser introduzida uma combinação de isoformas de HSD17B13, ou vetores de expressão ou vetores de direcionamento que codificam uma combinação de isoformas de HSD17B13 ou RNAm que codifica uma combinação de isoformas de HSD17B13 (por exemplo, D, DC, DF, DG, DH, DCF, DCG, DCH, DFG, DFH, DGH, DCFG, DCFH, DCGH, DFGH ou DCFGH).
[00385] Outros métodos deste tipo podem compreender o método de tratamento de um indivíduo que não é portador da variante de HSD17B13, rs72613567 (ou é apenas um portador heterozigótico da variante de HSD17B13, rs72613567) e tem ou é suscetível a desenvolver uma doença do
Petição 870190068171, de 18/07/2019, pág. 237/358
224 / 307 fígado crônica, compreendendo introduzir no indivíduo ou em uma célula do fígado no indivíduo um vetor de expressão, em que o vetor de expressão compreende um gene HSD17B13 recombinante que compreende uma timina inserida entre nucleotídeos correspondendo às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 recombinante está perfeitamente alinhado com a SEQ ID NO: 1, em que o vetor de expressão expressa o gene HSD17B13 recombinante em uma célula do fígado no indivíduo. O vetor de expressão pode ser um que não se integra genomicamente. Alternativamente, um vetor de direcionamento (isto é, sequência de doador exógeno) pode ser introduzido compreendendo um gene HSD17B13 recombinante que compreende uma timina inserida entre nucleotídeos correspondendo às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 recombinante está perfeitamente alinhado com a SEQ ID NO: 1. Nos métodos em que é utilizado um vetor de expressão, o vetor de expressão pode expressar o gene HSD17B13 recombinante na célula do fígado no indivíduo. Alternativamente, em métodos nos quais um gene HSD17B13 recombinante é genomicamente integrado, o gene HSD17B13 recombinante pode expressar na célula do fígado no indivíduo. Tais métodos podem compreender introduzir um vetor de expressão ou vetor de direcionamento que compreende um ácido nucleico (por exemplo, DNA) que codifica uma proteína de HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98 %, pelo menos 99%, ou 100% idêntica às isoformas C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas e/ou compreendendo uma sequência que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica às Transcrições C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas. Do mesmo modo, tais métodos podem alternativamente compreender introduzir um RNAm que codifica uma proteína de HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%,
Petição 870190068171, de 18/07/2019, pág. 238/358
225 / 307 pelo menos 98%, pelo menos 99%, ou 100% idêntica às isoformas C, D, F, G ou H de HSD17B13ou um fragmento das mesmas e/ou possuindo um DNA complementar (ou uma porção do mesmo) que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97 %, pelo menos 98%, pelo menos 99%, ou 100% idêntico às transcrições C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas. Do mesmo modo, tais métodos podem altemativamente compreender introduzir uma proteína que compreende uma sequência que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica às isoformas C, D, F, G ou H de HSD17B13 ou um fragmento das mesmas. Em métodos específicos, a transcrição pode ser transcrição D de HSD17B13 (por exemplo, SEQ ID NO: 7), ou a isoforma pode ser isoforma D de HSD17B13 (por exemplo, SEQ ID NO: 15). Em outros métodos específicos, pode ser introduzida uma combinação de isoformas de HSD17B13, ou vetores de expressão ou vetores de direcionamento que codificam uma combinação de isoformas de HSD17B13 ou RNAm que codifica uma combinação de isoformas de HSD17B13 (por exemplo, D, DC, DF, DG, DH, DCF, DCG, DCH, DFG, DFH, DGH, DCFG, DCFH, DCGH, DFGH ou DCFGH).
[00386] Vetores de expressão adequados e genes HSD17B13 recombinantes para utilização em qualquer um dos métodos acima são divulgados em outro local aqui. Por exemplo, o gene HSD17B13 recombinante pode ser o gene HSD17B13 variante, rs72613567, completo ou pode ser um minigene em que um ou mais segmentos não essenciais do gene foram eliminados em relação a um gene HSD17B13 de tipo selvagem correspondente. Como um exemplo, os segmentos eliminados podem compreender uma ou mais sequências intrônicas, e o minigene pode compreender um íntron correspondente ao íntron 6 da SEQ ID NO: 2 quando perfeitamente alinhado com a SEQ ID NO: 2. Um exemplo de um gene variante rs72613567 completo é um que é pelo menos 90%, pelo menos 95%,
Petição 870190068171, de 18/07/2019, pág. 239/358
226 / 307 pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico à SEQ ID NO: 2 quando perfeitamente alinhado com a SEQ ID NO:
2.
[00387] Alguns desses métodos compreendem um método de modificação de uma célula (por exemplo, uma célula do fígado) em um indivíduo com ou suscetível a desenvolver uma doença do fígado crônica. Em tais métodos, os agentes de nuclease e/ou sequências de doador exógeno e/ou vetores de expressão recombinantes podem ser introduzidos na célula via administração em um regime efetivo significando uma dosagem, via de administração e frequência de administração que atrasa o início, reduz a severidade, inibe ainda mais a deterioração e/ou melhora pelo menos um sinal ou sintoma de uma doença do fígado crônica a ser tratada. O termo “sintoma” se refere a uma evidência subjetiva de uma doença como percebida pelo indivíduo, e um “sinal” se refere à evidência objetiva de uma doença como observada por um médico. Se um indivíduo já está sofrendo de uma doença, o regime pode ser referido como um regime terapeuticamente eficaz. Se o indivíduo está em risco elevado de ter a doença em relação à população em geral, mas ainda não está experimentando sintomas, o regime pode ser referido como um regime profilaticamente eficaz. Em alguns casos, a eficácia terapêutica ou profilática pode ser observada em um paciente individual em relação a controles históricos ou experiências passadas no mesmo indivíduo. Em outros casos, a eficácia terapêutica ou profilática pode ser demonstrada em um ensaio clínico ou pré-clínico em uma população de indivíduos tratados em relação a uma população controle de indivíduos não tratados.
[00388] A entrega pode ser qualquer método adequado, como divulgado em outro lugar aqui. Por exemplo, os agentes de nuclease ou sequências de doador exógeno ou vetores de expressão recombinantes podem ser administrados por entrega de vetor, entrega viral, entrega mediada por partículas, entrega mediada por nanopartículas, entrega mediada por
Petição 870190068171, de 18/07/2019, pág. 240/358
227 / 307 lipossoma, entrega mediada por exossomo, entrega mediada por lipídio, entrega mediada por nanopartículas e lipídio, entrega mediada por peptídeo penetrante de células ou entrega mediada por dispositivo implantável. Alguns exemplos específicos incluem entrega hidrodinâmica, entrega mediada por vírus e entrega mediada por nanopartículas e lipídios.
[00389] A administração pode ser por qualquer via adequada incluindo, por exemplo, parenteral, intravenosa, oral, subcutânea, intra-arterial, intracraniana, intratecal, intraperitoneal, tópica, intranasal ou intramuscular. Um exemplo específico que é frequentemente usado, por exemplo, para terapias de substituição de proteínas é a infusão intravenosa. A frequência de administração e o número de dosagens podem depender da meia vida dos agentes de nuclease ou sequências de doador exógeno ou vetores de expressão recombinantes, do estado do indivíduo e da via de administração entre outros factores. As composições farmacêuticas para administração são de preferência estéreis e substancialmente isotônicas e fabricadas sob condições de BPF. As composições farmacêuticas podem ser providas na forma de dosagem unitária (isto é, a dosagem para uma única administração). As composições farmacêuticas podem ser formuladas utilizando um ou mais veículos, diluentes, excipientes ou auxiliares fisiologicamente e farmaceuticamente aceitáveis. A formulação depende da via de administração escolhida. O termo “farmaceuticamente aceitável” significa que o veículo, diluente, excipiente ou auxiliar é compatível com os outros ingredientes da formulação e não substancialmente prejudicial para o seu receptor.
[00390] Outros desses métodos compreendem um método ex vivo em uma célula de um indivíduo com ou suscetível a desenvolver uma doença do fígado crônica. A célula com a modificação genética direcionada pode então ser transplantada de volta para o indivíduo.
[00391] Qualquer dos métodos terapêuticos ou profiláticos aqui divulgados pode compreender adicionalmente administrar um tratamento
Petição 870190068171, de 18/07/2019, pág. 241/358
228 / 307 terapêutico adaptado para prevenir ou aliviar um ou mais sintomas associados à progressão para estágios clinicamente mais avançados de doença do fígado crônica (por exemplo, progressão de esteatose simples para estágios clinicamente mais avançados da doença do fígado crônica ou progressão de esteatose simples para uma ou mais esteato-hepatite, fibrose, cirrose e carcinoma hepatocelular). Por exemplo, tais tratamentos podem ser focados na prevenção ou redução da inflamação ou na prevenção ou redução da fibrose. Exemplos de tais terapêuticas em desenvolvimento são providos abaixo.
Fármaco (Empresa) Estágio Tipo Alvo genético Notas
OCA - ácido Obeticólico (Intercept) Fase III Agonista NR1H4 (FXR) NAS melhorado, fibrose revertida na Fase lib
GS-9674 (Gilead) Fase I
Simtuzumab (Gilead) Fase II Inibidor LOXL2 Potencial para reverter a fiborse (NASH/PSC)
GS-4997 (Gilead) Fase II Inibidor MAP3K5 Reduz o estresse oxidativo
NDI-010976 (Gilead) Fase I Inibidor ACACA Previne a lipogênese
ACACB
GFT505/Elafibranor (Genfit) Fase III Agonista PPARA Quebra os ácidos graxos, bloqueia a gordura e a produção de glicose, dec. Inflamação
PPARD
Aramchol (Galmed) Fase II Inibidor SCD Conjugado de ácido graxo-ácido biliar; aumenta o metabolismo da gordura no fígado
(ABCA1)
Cenicriviroc (Tobira) Fase Ilb Inibidor CCR2 Receptores de quimiocina estão envolvidos na inflamação e fibrose
CCR5
GR-MD-02 (Galectin Therapeutics) Fase II Inibidor LGALS3 Galectina-3 é regulada para cima na fibrose
TD139 (Galecto Biotech) Fase I
SHP626 (Shire) Fase I Inibidor SLC10A2 Interfere na reciclagem do ácido biliar
PXS4728A - (Boehringer Ingelheim) Fase I Inibidor AOC3 Anti-inflamatório
RP103 - Bitartarato de cisteamina (Raptor) Fase II Agente empobrecedor CTNS Empobrece a cisteína; potencial antioxidante
[00392] Todos os pedidos de patente, páginas eletrônicas, outras publicações, números de acesso e semelhantes citados acima ou abaixo são
Petição 870190068171, de 18/07/2019, pág. 242/358
229 / 307 incorporados por referência na sua totalidade para todos os efeitos na mesma medida como se cada item individual fosse especificamente e individualmente indicado para ser assim incorporado por referência. Se versões diferentes de uma sequência estão associadas a um número de acesso em momentos diferentes, a versão associada ao número de acesso na data de depósito efetiva deste pedido é indicada. A data de depósito efetiva significa a data de depósito real da data anterior ou a data de apresentação de um pedido de prioridade referente ao número de acesso, se aplicável. Da mesma forma, se versões diferentes de uma publicação, página eletrônica ou algo semelhante forem publicadas em momentos diferentes, a versão mais recentemente publicada na data efetiva de depósito do pedido deve ser feita, salvo indicação em contrário. Qualquer característica, etapa, elemento, modalidade ou aspecto da invenção podem ser utilizados em combinação com qualquer outro, a menos que especificamente indicado de outro modo. Embora a presente invenção tenha sido descrita com algum detalhe a título ilustrativo e exemplificativo para fins de clareza e compreensão, será evidente que certas alterações e modificações podem ser praticadas dentro do escopo das reivindicações anexas.
BREVE DESCRIÇÃO DAS SEQUÊNCIAS [00393] As sequências de nucleotídeos e aminoácidos listadas na listagem de sequências anexa são mostradas utilizando abreviaturas de letra padrão para bases de nucleotídeos e código de três letras para aminoácidos. As sequências de nucleotídeos seguem a convenção padrão de começar na extremidade 5' da sequência e prosseguir para a frente (isto é, da esquerda para a direita em cada linha) até à extremidade 3'. Apenas uma fita de cada sequência de nucleotídeos é mostrada, mas a fita complementar é entendida como sendo incluída por qualquer referência à fita exibida. As sequências de aminoácidos seguem a convenção padrão de começar no terminal amino da sequência e seguir em frente (isto é, da esquerda para a direita em cada linha)
Petição 870190068171, de 18/07/2019, pág. 243/358
230 / 307 até o terminal carboxi.
SEQ ID NO Tipo Descrição
1 DNA Sequência genômica de tipo selvage de HSD17B13 (Montagem de genoma humano GRCh38) Transcições mais prevalentes em indivíduos com gene HSD17B13 de tipo selvagem: Transcrição A Éxon 1 = 1-275 Éxon 2 = 4471-4578 Éxon 3 = 5684-5815 Éxon 4 = 7308-7414 Éxon 5 = 8947-9084 Éxon 6vl = 12548-12664 Éxon7 = 17599-19118 Transcrição B Éxon 1 = 1-275 Éxon 2 = pulado Éxon 3 = 5684-5815 Éxon 4 = 7308-7414 Éxon 5 = 8947-9084 Éxon 6vl = 12548-12664 Éxon7 = 17599-19118 Transcrição E Éxon 1 = 1-275 Éxon 2 = 4471-4578 Éxon 3 = 5684-5815 Éxon 3’ = 6210-6281 Éxon 4 = 7308-7414 Éxon 5 = 8947-9084 Éxon 6vl = 12548-12664 Éxon7 = 17599-19118 Transcrição F’ Éxon 1 = 1-275 Éxon 2 = 4471-4578 Éxon 3 = 5684-5815 Éxon 4 = 7308-7414 Éxon 5 = 8947-9084 Éxon 6v3 = 12548-13501 (leitura do éxon 6 no íntron 6 = 1266513501) Éxon 7 = pulado
2 DNA Variante da sequência genômica de HSD17B13 (Montagem do genoma humano GRCh38; rs72613567—inserção de T em chr4: 8731024187310240): Inserção de T na posição 12666 Transcrições mais prevalentes em indivíduos com variante do gene HSD17B13, rs72613567: Transcrição C Éxon 1 = 1-275 Éxon 2 = 4471-4578 Éxon 3 = 5684-5815 Éxon 4 = 7308-7414 Éxon 5 = 8947-9084 Éxon 6 = pulado Éxon 7 = 17600-19119 Transcrição D Éxon 1 = 1-275 Éxon 2 = 4471-4578 Éxon 3 = 5684-5815 Éxon 4 = 7308-7414 Éxon 5 = 8947-9084 Éxon 6v2 = 12548-12665 (inclui resíduo adicional 12665 na
Petição 870190068171, de 18/07/2019, pág. 244/358
231/307
SEQ ID NO Tipo Descrição
extremidade 3’) Éxon 7 = 17600-19119 Transcrição F Éxon 1 = 1-275 Éxon 2 = 4471-4578 Éxon 3 = 5684-5815 Éxon 4 = 7308-7414 Éxon 5 = 8947-9084 Éxon 6v3 = 12548-13502 (Leitura do éxon 6 no íntron 6 = 1266513502) Éxon 7 = pulado Transcrição G Éxon 1 = 1-275 Éxon 2 = pulado Éxon 3 = 5684-5815 Éxon 4 = 7308-7414 Éxon 5 = 8947-9084 Éxon 6v2 = 12548-12665 (inclui resíduo adicional 12665 na extremidade 3’) Éxon 7 = 17600-19119 Transcrição H Éxon 1 = 1-275 Éxon 2 = 4471-4578 Éxon 3 = 5684-5815 Éxon 3’ = 6210-6281 Éxon 4 = 7308-7414 Éxon 5 = 8947-9084 Éxon 6v2 = 12548-12665 (inclui resíduo adicional 12665 na extremidade 3’) Éxon 7= 17600-19119
3 DNA Promotor de HSD17B13 endógeno (-499 a 100 em relação ao local de iniciação de transcrição (TSS))
4 DNA cDNA de transcrição A de HSD17B13
5 DNA cDNA de transcrição B de HSD17B13
6 DNA cDNA de transcrição C de HSD17B13
7 DNA cDNA de transcrição D de HSD17B13
8 DNA cDNA de transcrição E de HSD17B13
9 DNA cDNA de transcrição F de HSD17B13
10 DNA cDNA de transcrição G de HSD17B13
11 DNA cDNA de transcrição H de HSD17B13
12 Proteína Isoforma A da Proteína de HSD17B13
13 Proteína Isoforma B da Proteína de HSD17B13
14 Proteína Isoforma C da Proteína de HSD17B13
15 Proteína Isoforma D da Proteína de HSD17B13
16 Proteína Isoforma E da Proteína de HSD17B13
17 Proteína Isoforma F da Proteína de HSD17B13
18 Proteína Isoforma G da Proteína de HSD17B13
19 Proteína Isoforma H da Proteína de HSD17B13
20-41 DNA Sequências alvo de RNA guia TSS de HSD17B13 Humano
42-81 DNA Outras Sequências alvo de RNA guia 5’ de HSD17B13 Humano
82-225 DNA Sequências alvo de RNA guia 3’ de HSD17B13 Humano
226-239 DNA Sequências alvo de RNA guia de HSD17B13 Humano próximo da variação rs72613567
240 Proteína Proteína de HSD17B13 Humano Q7Z5P4-1
241 Proteína Proteína de HSD17B13 Humano Q7Z5P4-2
242 Proteína Proteína de HSD17B13 Humano NP 835236.2
243 Proteína Proteína de HSD17B13 Humano NP 001129702.1
244 DNA cDNA de HSD17B13 Humano NM 178135.4
245 DNA cDNA de HSD17B13 Humano NM 001136230.2
Petição 870190068171, de 18/07/2019, pág. 245/358
232 / 307
SEQ ID NO Tipo Descrição
246 DNA Transcrição F’de HSD17B13
247 Proteína Isoforma F’da Proteína de HSD17B13
248-250 DNA Sequências alvo de RNA guia mais PAM
251 DNA Iniciador de PST516
252 DNA Iniciador de PST517
253 DNA Iniciador de DE002
254 DNA Iniciador 1 de HSD17B13
255 DNA Iniciador 2 de HSD17B13
256-258 RNA Estruturas de suporte de RNA guia v2-v4
259-263 DNA Sequências alvo de RNA guia 5’ de camundongo
264-268 DNA Sequências alvo de RNA guia Éxon 6/7 de camundongo
269 DNA Locus de Hsdl7bl3 de camundongo
270-489 RNA crRNAs HSD17B13 Humano
490-499 RNA crRNAs de Hsdl7bl3 de camundongo
500-719 RNA sgRNAs de HSD17B13 Humano vl
720-729 RNA sgRNAs de Hsdl7bl3àe. camundongo vl
730-949 RNA sgRNAs de HSD17B13 Humano v2
950-959 RNA sgRNAs de Hsdl7bl3 de camundongo v2
960-1179 RNA sgRNAs de HSD17B13 Humano v3
1180-1189 RNA sgRNAs de Hsdl7bl3 camundongo v3
1190-1409 RNA sgRNAs de HSD17B13 Humano v4
1410-1419 RNA sgRNAs de Hsdl7bl3 camundongo v4
1420 RNA Estruturas de suporte de RNA guia vl
1421 RNA Cauda de crRNA
1422 RNA tracrRNA
1423-1642 RNA Segmentos de direcionamento de DNA de RNA guia de HSD17B13 Humano
1643-1652 RNA Segmentos de direcionamento de DNA de RNA guia de Hsdl7bl3 de camundongo
EXEMPLOS
Exemplo 1. A variante 17beta-hidroxiesteroide desidrogenase 13 protege contra a doença do fígado crônica.
[00394] A doença do fígado crônica e a cirrose são as principais causas de morbilidade e mortalidade nos EUA (Kochanek et al. (2016) Natl Vital Stat Rep 65: 1 a 122, aqui incorporado por referência na sua totalidade para todos os efeitos). As etiologias mais comuns da cirrose são doença do fígado alcoólica, hepatite C crônica e doença do fígado gordurosa não alcoólica (DHGNA), responsáveis, em conjunto, por cerca de 80% dos pacientes que aguardam o transplante de fígado (Wong et al., 2015; Gastroenterology 148: 547 a 555, aqui incorporado por referência na sua totalidade para todos os efeitos). Notavelmente, a prevalência estimada de DHGNA nos EUA é entre 19 e 46% (Browning et al. (2004) Hepatology 40: 1387 a 1395; Lazo et al. (2013) Am J Epidemiol 178: 38 a 45 e Williams et al. (2011) Gastroenterology 140: 124 a 131, cada um dos quais aqui incorporado por
Petição 870190068171, de 18/07/2019, pág. 246/358
233 / 307 referência na sua totalidade para todos os efeitos) e esta aumentando ao longo do tempo (Younossi et al. (2011) Clin Gastroenterol Hepatol 9: 524 a 530 el; questionário e60 (2011), aqui incorporado por referência na sua totalidade para todos os efeitos), provavelmente em conjunto com o aumento das taxas de obesidade. Até o momento, permanece muita incerteza sobre a variação interindividual na progressão e nos resultados da DHGNA. O conhecimento dos fatores genéticos subjacentes pode melhorar a estratificação de risco e fornecer a base para novas estratégias terapêuticas. Aqui, é mostrado que os portadores de uma variante de entrelaçamento em HSD17B13 (que codifica a hidroxiesteroide-17-beta desidrogenase 13) têm reduzido risco de doença do fígado alcoólica e não alcoólica e redução do risco de progressão da DHGNA. Estudos de associação de dados de sequências completas de exomos ligados a registros eletrônicos de saúde de 46.544 participantes de ancestralidade europeia no estudo DiscovEHR levaram à identificação de uma variante de entrelaçamento em HSD17B13 (rs72613567) associada a níveis reduzidos de alanina transaminase e aspartato transaminase; essas contatações foram replicadas em três coortes separadas, compreendendo 12.528 indivíduos. Na coorte de descoberta, a variante de HSD17B13 foi associada à redução do risco de doença do fígado alcoólica e não alcoólica, cirrose e carcinoma hepatocelular. Em uma coorte de cirurgia bariátrica, a variante foi associada à redução do risco de esteato-hepatite histopatológica em indivíduos com esteatose. O sequenciamento de RNA de amostras de fígado humano da coorte de cirurgia bariátrica revelou que portadores homozigotos da variante de entrelaçãmento expressam predominantemente uma nova transcrição que codifica uma isoforma de HSD17B13 truncada. Essas constatações lançam nova luz sobre o papel de HSD17B13 na promoção da progressão da doença do fígado e seu potencial como alvo terapêutico para esteato-hepatite e cirrose.
[00395] Estudos anteriores de associação ampla do genoma (GWAS)
Petição 870190068171, de 18/07/2019, pág. 247/358
234 / 307 identificaram um número limitado de genes e variantes associados à doença do fígado crônica. A associação genética validada mais robusta até hoje é uma variante de troca de sentido comum no domínio da fosfolipase tipo patatina contendo o gene 3 (PNPLA3 p.Ilel48Met, rs738409), inicialmente associada ao aumento do risco de doença do fígado gordurosa não alcoólica (DHGNA) (Romeo et al. (2008) Nat Genet 40: 1461 a 1465 e Speliotes et al. (2011) PLoS Genet 7: el001324, cada um dos quais aqui incorporado por referência na sua totalidade para todos os efeitos), e subsequentemente considerados associados com a gravidade da doença (Rotman et al. (2010) Hepatology 52: 894 a 903 e Sookoian et al. (2009) J Lipid Res 50: 2111 a 2116, cada um dos quais aqui incorporado por referência na sua totalidade para todos os efeitos) e progressão (Trepo et al. (2016) J Hepatol doi: 10.1016/j.jhep.2016.03.011, incorporada aqui pela referência na sua totalidade para todos os efeitos). A variação no gene do membro 2 da superfamília transmembrana 2 (TM6SF2) também demonstrou conferir risco aumentado para a DHGNA (Kozlitina et al. (2014) Nat Genet 46: 352 a 356, Liu et al. (2014) Nat Commun 5: 4309 e Sookoian et al. (2015) Hepatology 61: 515 a 525, cada um dos quais aqui incorporado por referência na sua totalidade para todos os efeitos). As funções normais destas duas proteínas não são bem compreendidas, embora ambas tenham sido propostas para estarem envolvidas no metabolismo lipídico dos hepatócitos. Como variantes no PNPLA3 e TM6SF2 contribuem para o aumento do risco de doença do fígado ainda não foi elucidado. Os GWAS também identificaram vários fatores genéticos associados à alanina aminotransferase sérica (ALT) e à aspartato aminotransferase (AST) (Chambers et al. (2011) Nat Genet 43: 1131 a 1138 e Yuan et al. (2008) Am J Hum Genet 83: 520 a 528, cada uma das quais é aqui incorporada por referência na sua totalidade para todos os efeitos), marcadores quantitativos de lesão de hepatócitos e acumulação de gordura no fígado que são frequentemente medidos clinicamente. Até o momento, não há variantes
Petição 870190068171, de 18/07/2019, pág. 248/358
235 / 307 genéticas protetoras descritas para doença do fígado crônica. A descoberta de variantes genéticas de proteção em outros ambientes, como as variantes de perda de função em PCSK9 que reduzem o risco de doença cardiovascular, tem sido o catalisador para o desenvolvimento de novas classes de terapias. [00396] A colaboração DiscovEHR entre o Regeneron Genetics Center e o Geisinger Health System (GHS) une o sequenciamento de exoma a dados de registros eletrônicos de saúde (EHR) desidentificados para permitir descobertas genéticas e medicina de precisão (Dewey et al. (2016) Science 354 (6319) doi: 10.1126/science.aaf6814, aqui incorporado por referência na sua totalidade para todos os efeitos). A coorte DiscovEHR é composta por pacientes recrutados de coortes de cuidados médicos primários e especializados em todo o sistema de saúde integrado do GHS, incluindo pacientes de cirurgia bariátrica com amostras de biópsia hepática (Gorden et al., 2013) Hum Hered 75: 34 a 43, incorporados por referência na sua totalidade para todos os efeitos). Neste estudo, foi realizada uma abordagem abrangente da genômica funcional para avaliar a contribuição da variação da sequência do exoma para características quantitativas, diagnósticos de doença e fenótipos histopatológicos relevantes para doença do fígado crônica e cirrose em 49.188 indivíduos descendentes de europeus da coorte DiscovEHR, com seguimento estudos usando sequenciamento completo exoma de 9.883 indivíduos de ascendência europeia.
[00397] Utilizando dados de sequência de exoma total ligados a fenótipos derivados de EHR, primeiro foi realizado um estudo de associação de medidas de ALT e AST no soro em 46.544 indivíduos descendentes de europeus da coorte DiscovEHR (“coorte de descoberta de GHS”). As características clínicas da coorte estão descritas na Tabela IA. Havia 41.908 indivíduos com medidas de transaminase documentadas por EHR (incluindo 40.561 indivíduos com medidas de ALT e AST). Foi utilizado um modelo linear misto (Yang et al. (2011) Am J Hum Genet 88: 76 a 82, aqui
Petição 870190068171, de 18/07/2019, pág. 249/358
236 / 307 incorporado por referência na sua totalidade para todos os efeitos) para detectar associações entre os níveis de ALT e AST medidos por logio (ajustado para sexo, idade, idade2, índice de massa corporal (IMC) e os quatro primeiros componentes principais da ancestralidade) e 502.219 variantes únicas bialélicas com frequência alélica menor que 0,1%. Utilizando um limite de significância em todo o exoma de P < 1,0 x IO'7, foram identificadas 35 variantes em 19 genes significativamente associados com ALT ou AST, incluindo oito variantes em sete genes que estavam associados tanto a ALT como a AST (Fig. 1 e Tabela 2 ).
Tabela IA. Características demográficas e clínicas de indivíduos descendentes de europeus sequenciados das coortes de descoberta e replicação.
Característica Coorte de descoberta (N = 46.544) Coorte de cirurgia bariátrica (N = 2.644) Estudo do Dallas Heart (N = 1.357) Penn Medicine Biobank (N = 8.526)
Idade (anos) - mediano (IQR) 52,9 (49,6 - 73,8) 52,9 (44,1 -61,2) 46,0 (38,0 - 54,0) 68,0 (60,0 - 76,0)
Sexo feminino - número (%) 26.875 (57,7) 2.119(80,1) 724 (53,4) 3.242 (38,0)
índice de massa corporal mediano (IQR) 29,9 (35,4 - 44,8) 47,4 (42,0 - 53,7) 28 (25-32) 30 (25-32)
Nível de Transaminase (U/L) - mediano (IQR)
Alanina aminotransferase (ALT) 22,0(17,0-29,0) 23,0(17,5 -29,5) 20,0(15,0 - 27,0) 22,0(17,0 - 30,0)
Aspartato aminotransferase (AST) 23,0 (20,0 - 27,5) 23,0 (20,0 - 27,0) 21,0(18,0-25,0) 24,0 (20,0 - 30,5)
Presença de doença do fígado ( pelo código ICD-9) - N (%)
Doença do fígado alcoólica 197 (0,4) 7(0,3)
Cirrose alcoólica 130 (0,3) 3 (0,1)
Doença do fígado não viral, não alcoólica 1.938 (4,2) 1.543 (58,4)
Cirrose não alcoólica 382 (0,8) 24 (0,9)
Carcinoma hepatocelular 76 (0,2) 1 (0,04)
Sem doença do fígado 30.628 (65,8) 1 (0,04)
Tabela 1B. Características demográficas e clínicas de casos multiétnicos
genotipados e controles dos estudos do Dallas Liver e Pediatric river.
Característica Casos de estudo do Dallas Liver (N = 517) Controles de estudo do Dallas Liver (N = 4.279) Casos de estudo do Dallas Pediatric Liver (N = 203) Controles de estudo do Dallas Pediatric Liver (N = 244)
Idade (anos) - mediano (IQR) 55 (48 - 60) 44 (36 - 53) 12(10-15) 12(11 - 14)
Sexo feminino - número (%) 277 (54) 2.494 (58) 65 (32) 126 (52)
índice de massa corporal mediano (IQR) 30 (27 - 35) 30 (26 - 35) 30 (27 - 34) 31 (28 - 35)
Etinicidade por auto-relato
Afro-americano 33 (6) 2.291 (54) -
Petição 870190068171, de 18/07/2019, pág. 250/358
237 / 307
Europeus-americanos 158 (31) 1.266 (30)
Hispanoamericanos 326 (63) 722 (17) 203 (100) 244 (100)
Presença de doença do fígado ( pelo código ICD-9) - N (%)
Doença do fígado alcoólica 223 (43)
Cirrose alcoólica 215 (42)
Doença do fígado não viral, não alcoólica 212 (20)
Cirrose não alcoólica 100 (19)
Carcinoma hepatocelular 44(9)
Sem doença do fígado 4.279 (100) -244(100)
Petição 870190068171, de 18/07/2019, pág. 251/358
Tabela 2. Variantes de nucleotídeo único associadas aos níveis de transaminase sérica em P < 1,0 x IO'7 na coorte de descoberta.
N Nível médio de AST ou ALT (U/L)
Traço CHR BP REF ALT rsll) Gene Anotação Substituição de AA Beta (SE) P AAF N REI/ REF REF/ ALT ALT/ ALT REF/ REF REF/ ALT ALT/ ALT
ALT 1 220970028 A G rs2642438 MARC1 troca do sentido p.Thrl65Ala 0,008 (0,001) 4,67E-08 0,7067 41.414 3.515 17.262 20.637 23,88 24,52 24,92
4 88231392 T TA *rs72613567 HSD17B13 doador de entrelaçamento -0,009 (0,001) 4,16E-12 0,2634 41.414 2.441 16.130 2.843 25,02 24,26 2,.1
8 144997604 C T rs371119003 PLEC troca do sentido p.Ala2302Thr -0,160 (0,026) L30E-09 0,0005 41.413 4.373 40 0 24,67 18,1 ΝΑ
8 145008502 G A PLEC troca do sentido p.Arg522Cys -0,268 (0,032) 3,26E-17 0,0003 41.414 41.387 27 0 24,67 13,8 ΝΑ
8 145692918 G A rs35968570 KIFC2 troca do sentido p.Glul74Lys -0,033 (0,005) L40E-11 0,0139 41.414 40.271 1.133 10 24,67 12,07 ΝΑ
8 145730072 G A rsl43408057 GPT troca do sentido p.Arg83His -0,314 (0,036) 3,28E-18 0,0003 41.414 41.393 21 0 24,67 12,07 ΝΑ
8 145730161 C T rs201815297 GPT troca do sentido p.Ala87Val -0,224 (0,014) 6,28E-59 0,0018 41.414 41.270 144 0 24,7 14,68 ΝΑ
8 145730221 G A rsl 12574791 GPT troca do sentido p.ArglO7Lys -0,033 (0,005) 4,25E-11 0,0136 41.414 40.293 1.111 10 24,71 23,09 18,35
8 145731636 T G rsl45155876 GPT terminação adquirida p.Tyr326* -0,235 (0,031) L76E-14 0,0004 41.394 41.364 30 0 24,67 14,07 ΝΑ
8 145732114 G C rsl41505249 GPT troca do sentido p.Glu430Gln -0,224(0,013) 8,84E-64 0,0019 41.375 41.223 150 2 24,7 14,48 13,75
8 145732151 G A rsl43462595 GPT troca do sentido p.Arg442His -0,077 (0,013) L18E-09 0,0021 41.406 41.232 174 0 24,68 20,87 ΝΑ
8 145732180 G C rsl47998249 GPT troca do sentido p.Val452Leu -0,225 (0,013) 8,19E-65 0,0019 41.413 41.254 159 0 24,7 14,74 ΝΑ
8 145732305 G GC GPT mudança de quadro p.Glu475fs -0,271 (0,031) Ι,ΟΟΕ-18 0,0004 41.414 41.385 29 0 24,67 14,24 ΝΑ
8 145748532 A G rs567402720 LRRC24 troca do sentido p.Leu290Ser -0,185 (0,028) 3,42E-11 0,0004 41.393 41.358 35 0 24,67 17,71 ΝΑ
9 117122202 C T rs3748177 AKNA Sinônimo p.Glu755Glu -0,007 (0,001) 9,51E-09 0,5232 41.414 9.414 20.645 11.355 25,12 24,72 24,18
9 117124731 G A rs3748176 AKNA troca do sentido p.Pro624Leu -0,007 (0,001) 4,31E-09 0,5230 41.412 9.427 20.634 11.351 25,12 24,73 24,17
10 101595996 T A rsl7222723 ABCC2 troca do sentido p.Valll88Glu -0,015 (0,003) 2,97E-08 0,0608 41.414 36.543 4.704 167 24,77 23,97 22,12
10 101606861 G T rsl 137968 ABCC2 Sinônimo p.Vall430Val -0,015 (0,003) 2,71E-08 0,0608 41.414 36.543 4.704 167 24,77 23,97 22,04
10 101610533 C T rs8187707 ABCC2 Sinônimo p.Hisl496His -0,015 (0,003) 2,77E-08 0,0608 41.414 36.542 4.706 166 24,77 23,97 22,03
10 101611294 G A rs8187710 ABCC2 troca do sentido p.Cysl515Tyr -0,015 (0,003) 2,15E-08 0,0611 41.414 36.519 4.726 169 24,77 23,97 21,99
10 101912064 T C *rs2862954 ERLIN1 troca do sentido p.Ile291Val -0,012(0,001) 2,43E-21 0,4755 41.414 11.318 20.819 9.277 25,32 24,71 23,77
10 101977883 C T rs2230804 CHUK troca do sentido p.Val268Ile -0,009 (0,001) L93E-13 0,5072 41.414 10.048 20.733 10.633 25,18 24,75 24,01
10 113917085 T A rs2254537 GPAM Sinônimo p.Pro681Pro -0,008 (0,001) 4,61E-10 0,7073 41.414 3.627 16.984 20.803 25 24,97 24,36
10 113940329 T C rs2792751 GPAM troca do sentido p.Ile43Val -0,008 (0,001) 2,54E-10 0,7097 41.412 3.567 16.910 20.935 25 24,98 24,35
14 94844947 C T *rs28929474 SERPINA1 troca do sentido p.Glu366Lys 0,042 (0,005) 9,28E-21 0,0171 41.414 40.006 1.399 9 24,58 26,91 43,89
19 19379549 C T *rs58542926 TM6SF2 troca do sentido p.Glul67Lys 0,014 (0,002) 4,76E-09 0,0759 41.413 35.388 5.780 245 24,52 25,46 26,84
22 44324727 C G *rs738409 PNPLA3 troca do sentido p.Ilel48Met 0,023 (0,002) L34E-50 0,2351 41.414 24.257 14.837 2.320 24,06 24,99 28,91
22 44324730 C T *rs738408 PNPLA3 Sinônimo p.Prol49Pro 0,023 (0,002) LHE-50 0,2349 41.414 24.273 14.824 2.317 24,06 24,98 28,92
22 44342116 A G rs2294918 PNPLA3 troca do sentido p.Lys434Glu 0,007 (0,001) 8,26E-08 0,5986 41.412 6.691 19.833 14.888 24,15 24,47 25,15
22 44368122 A G *rs3761472 SAMM50 troca do sentido p.AspllOGly 0,019 (0,002) 8,85E-30 0,1682 41.413 28.626 11.618 1.169 24,23 25,36 28,45
22 44395451 T C *rs!007863 PARVB troca do sentido p.Trp37Arg 0,011 (0,001) 7,98E-16 0,3963 41.414 15.036 19.920 6.458 24,15 24,6 26,09
AST 4 88231392 T TA *rs72613567 HSD17B13 doador de entrelaçamento -0,005 (0,001) 6,24E-10 0,2638 40.753 22.068 15.870 2.815 24,47 24,1 23,96
10 18242311 A G rsl0764176 SLC39A12 troca do sentido p.Ser36Gly -0,006 (0,001) L09E-10 0,2881 40.753 20.645 16.738 3.370 24,47 24,15 23,85
238 / 307
Petição 870190068171, de 18/07/2019, pág. 252/358
N Nível médio de AST ou ALT (U/L)
Traço CHR BP REF ALT rsll) Gene Anotação Substituição de AA Beta (SE) P AAF N REF/ REF REF/ ALT ALT/ ALT REF/ REF REF/ ALT ALT/ ALT
10 101157378 CGTT C GOT1 inframe indel p.Asn389del -0,221 (0,024) l,96E-20 0,0002 40.753 40.733 20 0 24,29 14,7 ΝΑ
10 101165533 G c rs374966349 GOT1 troca do sentido p.Gln208Glu 0,271 (0,027) 2,43E-24 0,0002 40.753 40.736 17 0 24,28 44,5 ΝΑ
10 101912064 T c *rs2862954 ERLIN1 troca do sentido p.Ile291Val -0,005 (0,001) 4,82E-09 0,4754 40.753 11.138 20.486 9.129 24,59 24,26 23,99
11 22271870 A T rs7481951 ANO5 troca do sentido p.Leu322Phe 0,004 (0,001) 9,61E-08 0,5833 40.722 7.123 19.686 13.913 24,03 24,22 24,53
14 94844947 C T *rs28929474 SERPINA1 troca do sentido p.Glu366Lys 0,027 (0,003) 2,44E-20 0,0172 40.753 39.361 1.384 8 24,24 25,76 34,5
19 19379549 C T *rs58542926 TM6SF2 troca do sentido p.Glul67Lys 0,008 (0,002) 6,54E-08 0,0760 40.752 34.811 5.698 243 24,21 24,74 25,43
22 44324727 C G *rs738409 PNPLA3 troca do sentido p.Ilel48Met 0,014(0,001) 8,31E-46 0,2343 40.753 23.889 14.622 2.242 23,96 24,48 26,62
22 44324730 C T *rs738408 PNPLA3 Sinônimo p.Prol49Pro 0,014(0,001) 8,93E-46 0,2341 40.753 23.905 14.609 2.239 23,96 24,47 26,63
22 44368122 A G *rs3761472 SAMM50 troca do sentido p.AspllOGly 0,011 (0,001) l,22E-22 0,1680 40.752 28.170 11.450 1.132 24,07 24,64 26,24
22 44395451 T C *rsl007863 PARVB troca do sentido p.Trp37Arg 0,006 (0,001) 1,31E-13 0,3961 40.753 14.761 19.678 6.314 24,02 24,23 25,1
* Indica variantes que possuem associações significativas de todo exoma com ambos ALT e AST.
Abreviaturas: AAF, frequência do alelo alternativo; Alt, alelo alternativo; ALT, alanina aminotransferase; AST, aspartato aminotransferase; Ref, alelo de referência; SE, erro padrão.
239 / 307
Petição 870190068171, de 18/07/2019, pág. 253/358
240 / 307 [00398] Para replicar estas associações, analisamos as 35 variantes associadas a AST ou ALT determinadas através do sequenciamento completo do exoma em três coortes distintas de ancestralidade europeia: 2.644 pacientes de cirurgia bariátrica da DiscovEHR (“coorte de cirurgia bariátrica do GHS”), 1.357 indivíduos o Estudo do Dallas Heart e 8.526 indivíduos do Penn Medicine Biobank (Tabela IA). Na metanálise das coortes de replicação, treze variantes em nove genes foram significativamente associadas (limite de significância de Bonferroni de P < 1,43 x 10'3) com ALT ou AST (Tabela 3). Estes incluem genes e variantes associados anteriormente à doença do fígado, tais como PNPLA3 p.Ilel48Met (Romeo et al. (2008) Nat Genet 40: 1461 a 1465, aqui incorporado por referência na sua totalidade para todos os efeitos), TM6SF2 p.Glul67Lys (Kozlitina et al. (2014) Nat Genet 46: 352 a 356, aqui incorporado por referência na sua totalidade para todos os efeitos), e SERPINA1 p.Glu366Lys (alelo Z associado à deficiência de alfa-1antitripsina) (Brantly et al. (1988) Am J Med 84: 13 a 31, aqui incorporado por referência na sua totalidade para todos os efeitos), SAMM50 e ERLINL SERPINA1 codifica alfa-l-antitripsina, cuja deficiência funcional é conhecida por causar doença do fígado hereditária; a associação com SAMM50 pode ser mediada via desequilíbrio de ligação com variação no PNPLA3, e ERLIN1 foi implicada na deposição de gordura no fígado. Diversas variantes em GPT e GOT1, os genes que codificam ALT e AST, respectivamente, foram significativamente associados aos níveis de ALT ou AST, mas não foram relatados anteriormente como associados à doença do fígado. O SLC39A12 não foi previamente ligado a transaminases ou doença do fígado. Meta-análise também replicou novas associações na coorte de descoberta entre os níveis diminuídos de ALT (beta (SE) -0,009 (0,001); P = 4,16 x IO12) e AST (beta (SE) -0,005 (0,001); P = 6,24 x IO'10) e uma variante de entrelaçamento em HSD17B13, o gene que codifica hidroxiesteroide 17-beta desidrogenase 13, um membro não caracterizado da família da 17-beta-hidroxiesteroide
Petição 870190068171, de 18/07/2019, pág. 254/358
241 / 307 desidrogenase. Esta variante, rs72613567, corresponde à inserção de um nucleotídeo A adjacente ao local de entrelaçamento do doador (alelo TA). Os valores P da meta-análise de replicação para estas associações foram de 3,85 x 10'5 e 9,38 x 10'5, e os valores p de meta-análise conjunta foram 1,17 x 10'15 e 6,82 x 10'13 para ALT e AST, respectivamente (Tabela 3). Um GWAS anterior identificou um locus próximo em 4q22 (rs6834314) como estando associado aos níveis de ALT (Chambers et al. (2011) Nat Genet 43: 1131 a 1138, aqui incorporado por referência na sua totalidade para todos os efeitos). Até onde se sabe, não há estudos anteriores descrevendo qualquer associação com rs72613567.
Petição 870190068171, de 18/07/2019, pág. 255/358
Tabela 3. Replicação e meta-análise conjunta de 35 variantes de nucleotídeo único significativo de todo o exoma da coorte de descoberta em três coortes distintas de ancestralidade
GHS Coorte de descoberta Coortes de replicação **Meta-análise de replicação (Ν=3) ***Meta-análise conjunta (N = 4)
GHS Coorte de cirurgia bariátrica Estudo do Dallas Heart U. Penn
© V © H Λ u BP *3 fiá 3 RS ID Gene © © Substituição de AA Beta (SE) P Z Beta (SE) P Z Beta (SE) Ρ Ζ Beta (SE) Ρ Ζ Beta (SE) Ρ Beta (SE) P
1 1 220970028 < o rs2642438 MARC1 e p.Thrl65Ala 0,008 (0,001) 4,67E- 08 41.414 0,005 (0,005) 3,10E- 01 § 0,011 (0,008) 1,76Ε- 01 0,007 (0,004) 1,02Ε- 01 00 \ο 0,007 (0,003) 2,31E-02 0,008 (0,001) 3,38E-09
88231392 rs72613567 HSD17B13 g- -0,009 (0,001) 4,16E- 12 41.414 -0,010 (0,005) 5,57E- 02 § -0,016 (0,008) 6,60Ε- 02 -0,013 (0,004) 1,33Ε- 03 00 \ο -0,013 (0,003) *3,85E05 -0,010 (0,001) 1,17E-15
00 144997604 U rs371119003 PLEC e p.Ala2302Thr -0,160 (0,026) l,30E- 09 41.413 -0,492 (0,165) 2,84E- 03 § ΝΑ (ΝΑ) ΝΑ < Ζ -0,051 (0,072) 4,79Ε- 01 00 \ο -0,121 (0,066) 6,56E-02 -0,155 (0,025) 2,68E-10
00 145008502 O < PLEC e p.Arg522Cys -0,268 (0,032) 3,26E- 17 41.414 -0,161 (0,165) 3,29E- 01 § ΝΑ (ΝΑ) ΝΑ < ζ -0,247 (0,143) 8,48Ε- 02 00 \ο -0,210 (0,108) 5,23E-02 -0,264 (0,031) 5,54E-18
00 145692918 o < rs35968570 KIFC2 e p.Glul74Lys -0,033 (0,005) l,40E- 11 41.414 -0,009 (0,020) 6,48E- 01 § 0,032 (0,036) 3,76Ε- 01 \ο -0,053 (0,018) 3,72Ε- 03 00 \ο -0,025 (0,013) 4,69E-02 -0,032 (0,005) 2,25E-12
00 145730072 o < rsl43408057 GPT e p.Arg83His -0,314 (0,036) 3,28E- 18 41.414 -0,189 (0,165) 2,50E- 01 § ΝΑ (ΝΑ) ΝΑ < Ζ -0,298 (0,101) 3,26Ε- 03 00 \ο -0,268 (0,086) l,88E-03 -0,308 (0,033) 2,79E-20
00 145730161 u rs201815297 GPT e p.Ala87Val -0,224 (0,014) 6,28E- 59 41.414 -0,341 (0,074) 3,64E- 06 § ΝΑ (ΝΑ) ΝΑ < ζ -0,143 (0,054) 8,50Ε- 03 00 \ο -0,213 (0,044) *1,14E06 -0,223 (0,013) 4,49E-64
00 145730221 o < rsl 12574791 GPT e p.ArglO7Lys -0,033 (0,005) 4,25E- 11 41.414 -0,009 (0,020) 6,45E- 01 § 0,028 (0,036) 4,37Ε- 01 -0,060 (0,018) 5,60Ε- 04 00 \ο -0,031 (0,013) l,36E-02 -0,033 (0,005) 1,92E-12
00 145731636 O rsl45155876 GPT o' p.Tyr326* -0,235 (0,031) 1,76E- 14 41.394 -0,314 (0,165) 5,71E- 02 § -0,317 (0,140) 2,35Ε- 02 \ο -0,148 (0,143) 3,04Ε- 01 \ο -0,256 (0,086) 2,79E-03 -0,237 (0,029) 1,94E-16
00 145732114 O u rsl41505249 GPT e p.Glu430Gln -0,224 (0,013) 8,84E- 64 41.375 -0,273 (0,048) 9,83E- 09 £ -0,240 (0,075) 1,36Ε- 03 -0,197 (0,041) 1,31Ε- 06 \ο -0,231 (0,029) *7,24E- 16 -0,225 (0,012) 6,06E-78
00 145732151 O < rsl43462595 GPT e p.Arg442His -0,077 (0,013) 1,18E- 09 41.406 -0,115 (0,058) 4,82E- 02 § -0,106 (0,099) 2,86Ε- 01 \ο -0,049 (0,041) 2„27Ε- 01 \ο -0,074 (0,032) l,88E-02 -0,076 (0,012) 7,03E-ll
00 145732180 o u rsl47998249 GPT e p.Va!452Leu -0,225 (0,013) 8,19E- 65 41.413 -0,273 (0,050) 4,26E- 08 § -0,191 (0,070) ÓSSE- OS -0,197 (0,041) 1,31Ε- 06 00 \ο -0,221 (0,029) *1,41E- 14 -0,224 (0,012) l,04E-77
00 145732305 o u o GPT p.Glu475fs -0,271 (0,031) l,00E- 18 41.414 -0,161 (0,165) 3,29E- 01 § ΝΑ (ΝΑ) ΝΑ < Ζ -0,509 (0,203) 1,21Ε- 02 00 \ο -0,299 (0,128) l,93E-02 -0,273 (0,030) 6,44E-20
00 145748532 < o rs567402720 LRRC24 e p.Leu290Ser -0,185 (0,028) 3,42E- 11 41.393 -0,161 (0,165) 3,29E- 01 § ΝΑ (ΝΑ) ΝΑ < Ζ -0,307 (0,143) 3,21Ε- 02 00 \ο -0,244 (0,108) 2,40E-02 -0,189 (0,027) 2,93E-12
Ch 117122202 u rs3748177 AKNA g, p.Glu755Glu -0,007 (0,001) 9,51E- 09 41.414 -0,004 (0,005) 4,09E- 01 § 0,004 (0,008) 6,18Ε- 01 £ -0,007 (0,004) 5,29Ε- 02 00 \ο -0,005 (0,003) 8,42E-02 -0,007 (0,001) 3,08E-09
242 / 307
Petição 870190068171, de 18/07/2019, pág. 256/358
GHS Coorte de descoberta Coortes de replicação **Meta-analise de replicação (N=3) ***Meta-analise conjunta (N = 4)
GHS Coorte de cirurgia bariátrica Estudo do Dallas Heart U. Penn
© V © Η Λ u BP *3 3 RS ID Gene © © Substituição de AA Beta (SE) P z Beta (SE) P Z Beta (SE) P z Beta (SE) P Z Beta (SE) P Beta (SE) P
Ch 117124731 O < rs3748176 AKNA e p.Pro624Leu -0,007 (0,001) 4,31E- 09 41.412 -0,004 (0,005) 3,90E- 01 § 0,003 (0,008) 7,33E- 01 \o -0,007 (0,004) 4,24E- 02 00 \o -0,005 (0,003) 6,15E-02 -0,007 (0,001) l,00E-09
o 101595996 < rsl7222723 ABCC2 e p.Valll88Glu -0,015 (0,003) 2,97E- 08 41.414 -0,002 (0,010) 8,01E- 01 § -0,007 (0,017) 6,88E- 01 S -0,017 (0,007) 1,55E- 02 00 \o -0,012 (0,005) 3,43E-02 -0,014 (0,002) 3,44E-09
o 101606861 O rs 1137968 ABCC2 © p.Vall430Val -0,015 (0,003) 2,71E- 08 41.414 -0,003 (0,010) 7,74E- 01 § -0,008 (0,017) 6,28E- 01 S -0,017 (0,007) l,70E- 02 00 \o -0,012 (0,005) 3,25E-02 -0,014 (0,002) 2,99E-09
o 101610533 u rs8187707 ABCC2 a p.Hisl496His -0,015 (0,003) 2,77E- 08 41.414 -0,003 (0,010) 7,93E- 01 § -0,008 (0,017) 6,28E- 01 S -0,017 (0,007) 1,76E- 02 00 \o -0,012 (0,005) 3,43E-02 -0,014 (0,002) 3,23E-09
o 101611294 o < rs8187710 ABCC2 e p.Cysl515Tyr -0,015 (0,003) 2,BE- OS 41.414 -0,001 (0,010) 9,11E- 01 § -0,010 (0,017) 5,40E- 01 S -0,016 (0,007) 2,77E- 02 00 \o -0,011 (0,005) 5,21E-02 -0,014 (0,002) 4,09E-09
o 101912064 U rs2862954 ERLIN1 e p.Ile291Val -0,012 (0,001) 2,43E- 21 40.834 -0,010 (0,005) 2,91E- 02 § -0,006 (0,007) 4,02E- 01 \o -0,009 (0,004) 2,06E- 02 00 \o -0,009 (0,003) *1,14E- 03 -0,011 (0,001) 1J6E-23
o 101977883 u rs2230804 CHUK e p.Val268Ile -0,009 (0,001) 1,93E- 13 41.414 -0,006 (0,005) 2,05E- 01 § 0,0001 (0,008) 9,94E- 01 S -0,011 (0,004) 3,91E- 03 00 \o -0,008 (0,003) 4,33E-03 -0,009 (0,001) 3,59E-15
o 113917085 < rs2254537 GPAM © p.Pro681Pro -0,008 (0,001) 4,61E- 10 41.414 -0,003 (0,005) 5,80E- 01 § -0,013 (0,008) 1,15E- 01 S -0,008 (0,004) 5,12E- 02 00 \o -0,007 (0,003) 2,07E-02 -0,008 (0,001) 3,28E-11
o 113940329 U rs2792751 GPAM e p.Ile43Val -0,008 (0,001) 2,54E- 10 41.412 -0,003 (0,005) 5,61E- 01 § -0,013 (0,008) 1,33E- 01 S -0,008 (0,004) 4,77E- 02 00 \o -0,007 (0,003) 2,00E-02 -0,008 (0,001) 1,77E-11
94844947 U rs28929474 SERPINA1 e p.Glu366Lys 0,042 (0,005) 9,28E- 21 41.414 0,035 (0,020) 7,97E- 02 § 0,034 (0,032) 2,92E- 01 S 0,054 (0,013) 1,63E- 05 00 \o 0,047 (0,010) *2,82E06 0,043 (0,004) l,59E-25
19379549 u rs58542926 TM6SF2 e p.Glul67Lys 0,014 (0,002) 4,76E- 09 41.413 0,040 (0,010) 2,40E- 05 § 0,024 (0,014) 9,50E- 02 S 0,013 (0,008) 7,51E- 02 00 \o 0,024 (0,006) *1,37E05 0,016 (0,002) 1J5E-12
(N 44324727 u O rs738409 PNPLA3 e p.Ilel48Met 0,023 (0,002) 1,34E- 50 41.414 0,019 (0,006) 5,54E- 04 § 0,006 (0,009) 5,43E- 01 S 0,016 (0,004) 2,05E- 04 00 \o 0,016 (0,003) *7,45E07 0,021 (0,001) 3,55E-55
(N 44324730 u rs738408 PNPLA3 © p.Prol49Pro 0,023 (0,002) 1,11E- 50 41.414 0,019 (0,006) 5,51E- 04 § 0,006 (0,009) 5,43E- 01 S 0,016 (0,004) 2,14E- 04 00 \o 0,016 (0,003) *7,73E07 0,021 (0,001) 3,10E-55
(N 44342116 < O rs2294918 PNPLA3 e p.Lys434Glu 0,007 (0,001) 8,26E- 08 41.412 0,001 (0,005) 7,77E- 01 § 0,005 (0,008) 5,18E- 01 S 0,005 (0,004) 2,16E- 01 00 \o 0,004 (0,003) l,91E-01 0,006 (0,001) 6,24E-08
(N 44368122 < O rs3761472 SAMM50 e p.AspllOGly 0,019 (0,002) 8,85E- 30 41.413 0,009 (0,006) 1,66E- 01 § -0,001 (0,01) 9,37E- 01 S 0,018 (0,005) 4,02E- 04 00 \o 0,012 (0,004) *7,69E04 0,018 (0,002) l,08E-31
(N 44395451 u rs 1007 863 PARVB e p.Trp37Arg 0,011 (0,001) 7,98E- 16 41.414 0,003 (0,005) 5,22E- 01 § 0,008 (0,008) 3,13E- 01 S 0,009 (0,004) 2,50E- 02 00 \o 0,007 (0,003) l,78E-02 0,010 (0,001) 1J6E-16
1 AST 1 -t 88231392 rs72613567 HSD17B13 g- -0,005 (0,001) 6,24E- 10 Ó -0,010 (0,003) 3,12E 03 $ -0,012 (0,006) 5,32E- 02 S -0,007 (0,004) 5,56E- 02 \o \o \o -0,009 (0,002) *8,38E05 -0,006 (0,001) 6,82E-13
O 18242311 < o rsl0764176 SLC39A12 e p.Ser36Gly -0,006 (0,001) l,09E- 10 o -0,010 (0,003) 2,91E- 03 -0,003 (0,006) 5,80E- 01 -0,009 (0,004) l,03E- 02 \o \o \o -0,009 (0,002) *1,16E04 -0,006 (0,001) Ι,ΙΟΕ-13
243 / 307
Petição 870190068171, de 18/07/2019, pág. 257/358
GHS Coorte de descoberta Coortes de replicação **Meta-análise de replicação (Ν=3) ***Meta-análise conjunta (N = 4)
GHS Coorte de cirurgia bariátrica Estudo do Dallas Heart II. Penn
© V © H Λ U BP *3 fiá 3 RS ID Gene © © Substituição de AA Beta (SE) P Z Beta (SE) P z Beta (SE) Ρ Ζ Beta (SE) Ρ Ζ Beta (SE) Ρ Beta (SE) P
o 101157378 CGTT u GOT1 p.Asn389del -0,221 (0,024) 1,96E- 20 ó -0,205 (0,062) 8,57E- 04 $ ΝΑ (ΝΑ) ΝΑ < Ζ -0,243 (0,088) 5,97Ε- 03 6165 -0,218 (0,051) *1,66E- 05 -0,220 (0,022) l,68E-24
o 101165533 O u rs374966349 GOT1 e p.Gln208Glu 0,271 (0,027) 2,43E- 24 ó NA (NA) NA < z ΝΑ (ΝΑ) ΝΑ < ζ 0,339 (0,079) 1,85Ε- 05 6166 0,339 (0,079) *1,85E05 0,278 (0,025) 3,25E-28
o 101912064 u rs2862954 ERLIN1 e p.Ile291Val -0,005 (0,001) 4,82E- 09 ó -0,004 (0,003) 1,54E- 01 -0,007 (0,006) 2,21Ε- 01 1357 -0,004 (0,003) 1,94Ε- 01 6166 -0,005 (0,002) 2,51E-02 -0,005 (0,001) 3,68E-10
22271870 < rs7481951 ANO5 e p.Leu322Phe 0,004 (0,001) 9,61E- 08 o -0,001 (0,003) 7,85E- 01 2466 0,006 (0,006) Μ 00 ο -0,002 (0,003) 5,46Ε- 01 6165 0,000 (0,002) 8,43E-01 0,004 (0,001) l,13E-06
94844947 U rs28929474 SERPINA1 e p.Glu366Lys 0,027 (0,003) 2,44E- 20 o 0,023 (0,013) 7,79E- 02 $ 0,044 (0,024) 6,98Ε- 02 0,055 (0,011) 4,01Ε- 07 6166 0,042 (0,008) *9,54E08 0,029 (0,003) 6,71E-26
19379549 u rs58542926 TM6SF2 e p.Glul67Lys 0,008 (0,002) 6,54E- 08 ó 0,023 (0,006) 1,99E- 04 $ 0,010 (0,011) 3,42Ε- 01 0,004 (0,007) 5,94Ε- 01 6166 0,014 (0,004) *l,20E03 0,009 (0,002) 5,92E-10
CN 44324727 u O rs738409 PNPLA3 e p.Ilel48Met 0,014 (0,001) 8,31E- 46 ó 0,014 (0,004) 1,27E- 04 $ 0,004 (0,007) 5,44Ε- 01 1357 0,015 (0,004) 4,87Ε- 05 6166 0,013 (0,002) *5,51E08 0,014 (0,001) 3,14E-52
CN 44324730 u rs738408 PNPLA3 g, p.Prol49Pro 0,014 (0,001) 8,93E- 46 ó 0,014 (0,004) 1,32E- 04 $ 0,004 (0,007) 5,44Ε- 01 1357 0,015 (0,004) 4,96Ε- 05 6166 0,013 (0,002) *5,81E08 0,014 (0,001) 3,55E-52
CN 44368122 < O rs3761472 SAMM50 e p.AspllOGly 0,011 (0,001) 1,22E- 22 o 0,008 (0,004) 6,03E- 02 $ -0,001 (0,008) 9,45Ε- 01 0,016 (0,004) 2,64Ε- 04 6166 0,010 (0,003) *3,40E04 0,011 (0,001) L91E-25
CN 44395451 u rs 1007 863 PARVB e p.Trp37Arg 0,006 (0,001) 1,31E- 13 o 0,003 (0,003) 4,12E- 01 $ 0,006 (0,006) 2,95Ε- 01 1357 0,009 (0,003) 6,17Ε- 03 6166 0,006 (0,002) 7,34E-03 0,006 (0,001) 3,62E-15
* Indica valores P que atendem ao limite de significância de Bonferroni de P < 1,43 x 103. - ** Meta-análise de replicação inclui as três coortes de replicação: GHS Coorte de cirurgia bariátrica, Estudo do Dallas Heart e Penn Medicine Biobank. - *** A meta-análise conjunta inclui a coorte de descoberta e as três coortes de replicação: GHS Coorte de Descobertas, GHS Coorte de Cirurgia Bariátrica, Estudo do Dallas Heart e Penn Medicine Biobank. - Abreviaturas: AAF, frequência do alelo alternativo; Alt, alelo alternativo; ALT, alanina aminotransferase; AST, aspartato aminotransferase; Ref, alelo de referência; SE, erro padrão; ann, anotação; mis, troca do sentido; syn, sinônimo; spl, doador de entrelaçamento; stop, terminação adquirida; fs, mudança de quadro; inf, inframe indel.
244 / 307
Petição 870190068171, de 18/07/2019, pág. 258/358
245 / 307 [00399] A HSD17B13 é de 30 kb a montante de HSD17B11, um membro da mesma família de genes, e ambos os genes estão dentro de um único grande bloco de haplótipos em europeus. Não foi observada nenhuma associação entre codificação ou variantes de entrelaçamento nos níveis de HSD17B11 e transaminases na coorte de descoberta (Fig. 5A e 5B; valores P mais significativos na descoberta 1,36 χ 10'1 para ALT e 4,32 x IO'2 para AST) ou na meta-análise conjunta da coorte de descoberta e três coortes de replicação (valores P mais significativos 6,25 x 10'3 e 1,17 x 10'5 para ALT e AST, respectivamente). Além disso, o desequilíbrio de ligação de rs72613567 com variantes em HSD17B11 foi modesto em todos os grupos de ancestralidade, incluindo em americanos-europeus que em grande parte compõem nosso grupo de descoberta, e também em hispânicos e afroamericanos representados no Estudo do Dallas Heart (r2 < 0,4 com todas as variantes confirmadas em HSD17B11 em todos os grupos de ancestralidade, dados não mostrados). Coletivamente, esses achados sugerem HSD17B13 como o gene na região genômica que é mais provável que seja funcionalmente relacionado aos níveis de transaminases.
[00400] Em seguida, procurou-se estabelecer se as variantes associadas aos níveis de ALT ou AST também estavam associadas à doença do fígado crônica. Na coorte de descoberta, foram usados códigos de diagnóstico de RSE para definir amplamente casos de doença do fígado alcoólica e não alcoólica (não viral), bem como as seguintes sequelas da doença: cirrose alcoólica, cirrose não alcoólica e carcinoma hepatocelular (CHC). Um grupo de controle comum (“sem doença do fígado”) foi definido como indivíduos sem códigos de diagnóstico para qualquer tipo de doença do fígado (Tabela 1). Foram testadas as doze variantes associadas à transaminase das coortes de descoberta e replicação para associação com doença do fígado crônica, usando um limite de significância de Bonferroni de P < 0,05/24 (P < 2,08 x 10'3) para contabilizar as treze variantes e duas amplas categorias de doenças
Petição 870190068171, de 18/07/2019, pág. 259/358
246 / 307 do fígado crônicas (alcoólicas e não alcoólicas) testadas (Tabela 4). No geral, foram encontradas associações significativas entre seis variantes em cinco genes (HSD17B13, SERPINA1, TM6SF2, PNPLA3 e SAMM50) e fenótipos de doença do fígado crônica. As associações SERPINA1, TM6SF2, PNPLA3 e SAMM50 confirmam associações previamente relatadas. As variantes no GPT, GOT1, ERLIN1 e SLC39A12 não foram significativamente associadas a qualquer fenótipo de doença do fígado. A associação HSD17B13 com doença do fígado relatada aqui é nova e a primeira variante genética potencialmente protetora descrita.
Petição 870190068171, de 18/07/2019, pág. 260/358
Tabela 4. Associação de doze variantes de nucleotídeo único de replicação e significativas de todo o exoma com fenótipos de doença do fígado na coorte de descoberta.
CHR:BP:Ref:Alt Gene rsll) Doença do fígado alcoólica Cirrose alcoólica Doença do fígado não alcoólica Cirrose não alcoólica Carcinoma hepatocelular
OR (95% Cl) Valor P OR (95% Cl) Valor P OR (95% Cl) Valor P OR (95% Cl) Valor P OR (95% Cl) Valor P
4:88231392:T:TA HSD17B13 rs72613567 0,62 (0,48-0,81) *l,82E-04 0,56 (0,41-0,78) *3,35E-04 0,84 (0,78-0,91) *l,31E-05 0,74 (0,62-0,88) *4,48E-04 0,67 (0,45-1,00) 4,66E-02
8:145730161:C:T GPT rs201815297 3,83 (1,05-13,94) 8,88E-02 6,33 (1,71-23,43) 2,88E-02 0,23 (0,04-1,14) l,86E-02 1,25 (0,24-6,38) 7,98E-01 3,66 (0,70-19,01) 2,01E-01
8:145732114:G:C GPT rsl41505249 0,77 (0,06-10,73) 8,43E-01 1,13 (0,08-15,39) 9,30E-01 1,02 (0,49-2,11) 9,70E-01 0,36 (0,02-5,37) 3,82E-01 1,84 (0,15-23,25) 6,88E-01
8:145732180:G:C GPT rsl47998249 0,73 (0,05-11,76) 8,17E-01 1,07 (0,07-17,16) 9,60E-01 1,03 (0,49-2,17) 9,30E-01 0,34 (0,02-5,59) 3,67E-01 1,74 (0,11-27,05) 7,21E-01
10:18242311:A:G SLC39A12 rsl0764176 0,85 (0,68-1,07) l,64E-01 0,92 (0,70-1,22) 5,80E-01 0,92 (0,86 (0,99) 3,43E-02 1,03 (0,88-1,21) 7,15E-01 1,29 (0,93-1,79) l,37E-01
10:101157378:CGTT:C GOT1 4,60 (0,25-86,41) 3,93E-01 7,11 (0,38-133,19) 3,00E-01 2,37 (0,61-9,27) 2,50E-01 8,27 (1;44 47;49) 5,92E-02 9,81 (0,52-183,54) 2,43E-01
10:101165533:G:C GOT1 rs374966349 2,20 (0,13-37,68) 6,24E-01 3,47 (0,20 - 59,04) 4,70E-01 1,63 (0,53-4,96) 4,20E-01 1,17 (0,07-20,09) 9,13E-01 5,37 (0,32-91,12) 3,55E-01
14:94844947:C:T SERPINA1 rs28929474 2,49 (1,49-4,17) 2,30E-03 3,35 (1,93-5,83) *3,01E-04 1,50 (1,21-1,87) *5,29E-04 2,99 (2,11-4,24) *9,08E-08 1,86 (0,74-4,67) 2,40E-01
19:19379549:C:T TM6SF2 rs58542926 1,47 (1,06-2,04) 2,76E-02 1,35 (0,89-2,04) l,80E-01 1,36 (1,21-1,52) *2,42E-07 1,64 (1,31-2,05) *6,04E-05 1,93 (1,22-3,04) l,08E-02
22:44324727:C:G PNPLA3 rs738409 1,76 (1,43-2,18) *4,98E-07 2,07 (1,60-2,67) *l,08E-07 1,65 (1,54-1,78) *1,31E-41 2,05 (1,76-2,38) *l,70E-19 2,20 (1,60-3,02) *5,59E-06
22:44324730:C:T PNPLA3 rs738408 1,77 (1,43-2,18) *4,70E-07 2,07 (1,61-2,67) *l,03E-07 1,65 (1,54-1,78) *1,42E-41 2,05 (1,77-2,38) *1,45E-19 2,20 (1,60-3,03) *5,41E-06
22:44368122:A:G SAMM50 rs3761472 1,90 (1,52-2,38) *l,36E-07 2,28 (1,75-2,98) *l,83E-08 1,52 (1,41-1,65) *7,33E-24 1,86 (1,58-2,19) *1,81E-12 1,66 (1,16-2,39) l,05E-02
* Indica valores de P que atendem ao limite de significância de Bonferroni de P < 2,08 x IO-3.
Petição 870190068171, de 18/07/2019, pág. 261/358
247 / 307
248 / 307 [00401] O alelo alternativo (TA) de HSD17B13, rs72613567, foi observado com maior frequência nos controles em comparação com os participantes com qualquer um dos fenótipos da doença do fígado crônica avaliados (Fig. 2A e Tabela 5). Após o ajuste para idade, idade2, sexo, IMC e ancestralidade, foi observada uma probabilidade 38% menor de doença do fígado alcoólica (razão de probabilidade [OR] 0,62; intervalo de confiança de 95% [IC] 0,48-0,81, P = 1,8 x IO'4) e 16% menor probabilidade de doença do fígado não alcoólica (não viral) (OR 0,84, IC 95% 0,78-0,91, P = 1,3 x 10'5) por alelo TA. Ao se restringir aos casos com cirrose, o alelo TA foi associado com uma probabilidade de cirrose alcoólica 44% menor (OR 0,56, IC 95% 0,41-0,78, P = 3,4 x IO'4) e 26% de probabilidade de não alcoólica (OR 0,74, 95% IC 0,62-0,88, P = 4,5 x IO-4). O alelo TA estava nominalmente associado com 33% de probabilidade de CHC menor por alelo (OR 0,67, IC 95% 0,451,00, P = 4,7 x IO'2). ORs genotípicas não ajustadas sugeriram um efeito codominante; por exemplo, para cirrose alcoólica, a OR foi de 0,59 (IC 95% 0,40-0,86) para portadores heterozigotos T/TA e 0,26 (IC 95% 0,08-0,82) para portadores homozigotos TA/TA, e para cirrose não alcoólica, a OR foi 0,75 (IC 95% 0,61-0,93) para portadores heterozigóticos e 0,55 (IC 95% 0,340,91) para homozigóticos.
[00402] Assim, na coorte de descoberta, o alelo alternativo (TA) de HSD17B13, rs72613567, foi associado com menores probabilidades de todos os fenótipos de doença do fígado crônica derivados de EHR avaliados, de uma maneira consistente dependente de dose de alelo (Fig. 2A): categorias de doença do fígado alcoólica, razão de probabilidades heterozigótica (ORhet) [intervalo de confiança de 95%] 0,58 [0,42-0,79], OR homozigoto (ORhom) 0,46 [0,23-0,94], OR alélico (ORaiéiico) 0,62 [0,48-0,81], P = 1,82 x W4; todas as categorias de doença do fígado não alcoólica, ORhet 0,84 [0,76-0,92], ORhom 0,73 [0,59-0,89], ORaiéiico 0,84 [0,78-0,91], P = 1,31 x 105. O alelo TA também foi associado com probabilidades mais baixas das formas mais
Petição 870190068171, de 18/07/2019, pág. 262/358
249 / 307 avançadas dessas doenças do fígado crônicas (como definido pelos códigos diagnósticos derivados do EHR), a saber: cirrose alcoólica e não alcoólica e CHC. O alelo TA foi associado com 42% e 73% de probabilidade de cirrose alcoólica para heterozigotos e homozigotos, respectivamente (ORhet 0,59 [0,40-0,86], ORhom 0,26 [0,08-0,82], ORaiéiico 0,56 [0,41-0,78], P = 3,35 x 10’ 4), 26% e 49% menos probabilidades de cirrose não alcoólica para heterozigotos e homozigotos, respectivamente (ORhet 0,75 [0,61-0,93], ORhom 0,55 [0,34-0,91], ORaiéiico 0,74 [0,62-0,88], P = 4,48 χ IO’4). O alelo TA também foi associado nominalmente com menores probabilidades de HCC.
[00403] Em seguida, procurou-se confirmar e estender estes resultados no estudo do Dallas Liver (DLS) e estudo do Dallas Pediátrico Liver (DPLS) multi-étnico, incluindo afro-americanos, europeusamericanos e hispanoamericanos adultos e crianças (Tabela IB). No DLS, o alelo TA estava associado com menor probabilidade de qualquer doença do fígado de maneira dependente da dose do alelo (ORhet 0,74 [0,57-0,97], ORhom 0,41 [0,21-0,83], ORaiéiico 0,70 [0,5-0,88], P = 1,77 x I0’3, Fig. 8). Efeitos semelhantes de dosagem de alelos dependentes foram observados através dos subtipos de doença do fígado derivados do EHR, incluindo associações protetoras de doença do fígado com formas de cirrose alcoólica avançadas (ORaiéiico 0,72 [0,53-0,99], P = 4,37 x IO'2) e não alcoólica (ORaiéiico 0,65 [0,40- 1,07], P = 8,96 x IO'2). Em análises de subgrupos de indivíduos agrupados por etnia por auto relato, a associação com doença do fígado permaneceu significativa em hispanoamericanos, em particular, devido à alta taxa de doença do fígado nessa subpopulação (n = 326 casos e 722 controles, ORaiéiico 0,51 [0,35-0,74], P = 3,98 χ IO-4); tendências numéricas semelhantes, que não alcançaram significância estatística, também foram observadas nos subconjuntos do DLS de afro-americano (n = 33 casos e 2.291 controles, ORaiéiico 0,74 [0,25-2,47], P = 0,67) e de europeu-americano (n = 158 casos e
1.266 controles, ORaiéiico 0,87 [0,65-1,15], P = 0,32). No DPLS, um estudo
Petição 870190068171, de 18/07/2019, pág. 263/358
250 / 307 separado de pacientes com doença do fígado pediátrica hispanoamericana e controles obesos (Tabela 1B), o alelo TA também foi associado com menor probabilidade de doença do fígado (ORaiéiico 0,59 [0,36-0,97], P = 3,6 x IO'2). Assim, o alelo HSD17B13, rs72613567:TA foi associado à redução da probabilidade de múltiplas formas de doença do fígado crônica, incluindo cirrose, em adultos e crianças em três populações independentes.
[00404] A DHGNA descreve um espectro de doença que varia de esteatose hepática sem evidência de inflamação significativa (designada como “esteatose simples” ao exame histopatológico) a manifestações clinicamente mais impactantes (designadas como “esteato-hepatite não alcoólica” (NASH), com evidência histopatológica de inflamação lobular, balonização de hepatócitos e/ou fibrose). Para entender a relação entre o alelo TA de HSD17B13 e a DHGNA e EHNA histologicamente definidas, foram realizados testes de associação de rs72613567 em 2.391 indivíduos com sequenciamento total de exoma de amostras de biópsia hepática da coorte de GHS cirurgia bariátrica. Entre esses indivíduos, havia 555 (23%) sem evidência de esteatose, esteato-hepatite ou fibrose (“normal”), 830 (35%) com esteatose simples e 1006 (42%) com EHNA (ou seja, evidência de inflamação lobular, balonização de hepatócitos ou fibrose). O alelo TA de HSD17B13 não foi significativamente associado com esteatose simples (OR 1,11, IC 95% 0,94-1,32, P = 0,21) ou NASH (OR 0,86, IC 95% 0,72-1,02, P = 0,09) em comparação com o fígado normal (Fig. 2B e Tabela 5). Ao comparar a prevalência de fígado normal, esteatose simples e EH por genótipo, observouse que a prevalência de fígado normal não pareceu diferir pelo genótipo (23%, 24% e 23% para portadores de T/T, T/TA, e TA/TA, respectivamente, P = 0,5 pelo teste do qui-quadrado para tendência em proporções), mas que a prevalência de NASH diminuiu (45%, 40% e 31% para portadores de T/T, T/TA e TA/TA, respectivamente, P = 1,6 x IO'4) e de esteatose simples aumentaram (33%, 35% e 47% para portadores de T/T, T/TA e TA/TA,
Petição 870190068171, de 18/07/2019, pág. 264/358
251 /307 respectivamente, P = 1,1 x 10'3) com cada alelo TA (Fig. 9). Entre os indivíduos com esteatose, o alelo TA se associou a probabilidades estatisticamente significativamente menores de EHNA, quando comparado à esteatose simples, de maneira alélica e dependente da dose. No contexto de esteatose simples, o alelo TA foi associado com uma probabilidade 23% menor de NASH (OR 0,77, IC 95% 0,66-0,90, P = 6,5 x I04), sugerindo um papel para HSD17B13 na mediação da progressão da DHGNA para estágios mais avançados de NASH e fibrose. Os resultados da associação genotípica foram consistentes com um efeito co-dominante; na comparação entre NASH e esteatose simples, a OR foi 0,84 (IC 95% 0,69-1,02) para portadores heterozigotos de T/TA e 0,48 (IC 95% 0,34-0,68) para portadores de TA/TA homozigotos.
Petição 870190068171, de 18/07/2019, pág. 265/358
Tabela 5. HSD17B13 rs72613567 está associado à redução do risco de fenótipos de doença do fígado alcoólica e não alcoólica na coorte de descoberta e com risco reduzido de progressão da doença do fígado gordurosa não alcoólica para esteato-hepatite não alcoólica e fibrose na coorte de cirurgia bariátrica.
Casos Controles
Coor te Definições N REF/REF REF/ ALT ALT/ ALT Definições N REF/REF REF/ALT ALT/ALT AAF OR Het (95% CI) OR Hom (95% CI) OR por alelo (95% CI) Valor P
Coorte de descoberta Doença do fígado alcoólica 197 133 56 8 Sem doença do fígado 30,522 16413 11969 2140 0,266 0,58 (0,42-0,79) 0,46 (0,23-0,94) 0,62 (0,48-0,81) L82E-04
Cirrose alcoólica 130 89 38 3 0,266 0,59 (0,40-0,86) 0,26 (0,08-0,82) 0,56 (0,41-0,78) 3,35E-04
Doença do fígado não alcoólica 1930 1131 692 107 0,264 0,84 (0,76-0,92) 0,73 (0,59-0,89) 0,84 (0,78-0,91) L31E-05
Cirrose não alcoólica 381 235 129 17 0,266 0,75 (0,61-0,93) 0,55 (0,34-0,91) 0,74 (0,62-0,88) 4,48E-04
Carcinoma hepatocelular 76 49 24 3 0,266 0,67 (0,41-1,10) 0,47 (0,15-1,51) 0,67 (0,45-1,00) 4,66E-02
Coorte de cirurgia bariátrica Esteatose simples 830 421 321 88 Normal 555 288 224 43 0,291 0,98 (0,78-1,23) 1,39 (0,94-2,08) 1,11 (0,94-1,32) 2,11E-O1
NASH 1006 578 370 58 0,255 0,82 (0,66-1,02) 0,67 (0,44-1,02) 0,86 (0,72-1,02) 8,53E-02
NASH 1006 578 370 58 Esteatose simples 830 421 321 88 0,268 0,84 (0,69-1,02) 0,48 (0,34-0,68) 0,77 (0,66-0,90) 6,47E-04
252 / 307
Petição 870190068171, de 18/07/2019, pág. 266/358
253 / 307 [00405] Em seguida, procurou-se entender como o alelo TA de HSD17B13 afeta a expressão de transcrições conhecidas e novas do gene. Foi utilizado o sequenciamento de RNA para avaliar a expressão de RNAm de HSD17B13 em amostras de fígado histologicamente normais de 22 portadores de referência homozigotos (T/T), 30 heterozigotos (T/TA) e 17 portadores alternativos homozigotos (TA/TA) da variante de entrelaçamento de HSD17B13, rs72613567 (Fig. 3). Além de duas transcrições de HSD17B13 conhecidas, A e B, duass novas transcrições foram identificadas: transcrição C sem éxon 6, e transcrição D caracterizada pela inserção de um nucleotídeo G na extremidade 3' do éxon 6, levando à prematura truncagem de proteínas. Novas transcrições foram validados por RT-PCR, e a transcrição D foi adicionalmente validada por sequenciamento de DNAc de leitura longa. Os níveis de expressão destas transcrições variaram de acordo com o genótipo de HSD17B13, rs72613567; os níveis das transcrições A e B diminuíram, enquanto os das transcrições C e D aumentaram de um modo dependente da dose de alelo nos heterozigotos T/TA e nos homozigotos TA/TA (Fig. 3). A transcrição A, que codifica uma proteína de 300 aminoácidos, foi a transcrição predominante em homozigotos T/T (Fig. 3A), enquanto a transcrição D, que codifica a proteína prematuramente truncada, foi a transcrição predominante em homozigotos TA/TA (Fig. 3D). Estes padrões de expressão sugerem um papel funcional para HSD17B13, rs72613567, na determinação da expressão da isoforma de HSD17B13. Quatro transcrições adicionais (E a H) com níveis muito baixos de expressão foram também identificadas (Figs. 6A a 6D). O alinhamento da sequência proteica de todas as isoformas de HSD17B13 identificadas é mostrado nas Fig. 7A a 7B.
[00406] HSD17B13 foi previamente descrito como uma proteína associada a gotículas de lipídios em hepatócitos humanos (Su et al. (2014) Proc Natl Acad Sei USA 111:11437 a 11442, aqui incorporada por referência na sua totalidade para todos os efeitos). Avaliou-se a expressão e a
Petição 870190068171, de 18/07/2019, pág. 267/358
254 / 307 localização de isoformas de proteínas em uma linhagem celular de fígado humana perpétua (células de hepatoma HepG2) transduzidas de forma estável com lentivírus que expressa as novas e conhecidas isoformas A a D de HSD17B13. A isoforma A de HSD17B13 é localizada em gotíulas lipídicas em células tratadas com ácido oleico e não tratadas. A isoforma A foi principalmente detectada em membranas que circundam as gotículas lipídicas marcadas com BODIPY, e co-localizada com a proteína perilipina de cobertura de gotículas lipídicas (PLIN). Localização subcelular similar foi observada para a isoforma D de HSD17B13 na superfície das gotículas lipídicas; no entanto, as gotículas lipídicas apareceram maiores após o tratamento com ácido oleico. Em contraste, as isoformas B e C co-localizaram com o marcador de retículo endoplasmático calnexina.
[00407] Em resumo, usando dados da sequência de exoma ligada a EHR e dados de biópsia hepática de 49.188 indivíduos da população de estudo DiscovEHR, e em estudos de acompanhamento de dados sequência exoma de 9.883 indivíduos adicionais com medições de ALT e AST, foi verificada uma nova associação entre uma variante de entrelaçamento em HSD17B13, níveis de transaminases e fenótipos de doença do fígado crônica. No estudo, a variante de HSD17B13 reduziu o risco de doença do fígado não alcoólica e alcoólica e cirrose. Isso, para nosso conhecimento, é o primeiro relato de uma variante exônica com uma associação protetora com fenótipos da doença do fígado crônica. O alelo de HSD17B13 não estava associado à esteatose simples, mas reduziu o risco de esteato-hepatite histopatológica em indivíduos com esteatose, sugerindo um papel para HSD17B13 na progressão para estágios clinicamente mais avançados da doença do fígado crônica. A consistência de associações protetoras em quatro coortes independentes (GHS descoberta, GHS bariátrica, DLS e DPLS) através de várias categorias diferentes de doença do fígado, caracterizadas usando códigos de diagnóstico de EHR, bem como definições histopatológicas de doença do fígado, junto
Petição 870190068171, de 18/07/2019, pág. 268/358
255 / 307 com a impressionante dependência de dosagem de alelo das associações, apoiam a noção de que a variante de HSD17B13 relatada protege da progressão para estágios clinicamente mais avançados da doença do fígado crônica. A dependência da dosagem do alelo observado também defende que uma regulação mais profunda da função de HSD17B13 pode resultar em efeitos mais profundos no risco e progressão da doença.
[00408] Sabe-se que outros membros da família da 17betahidroxiesteroide desidrogenase estão envolvidos no metabolismo dos esteroides sexuais e ácidos graxos (Moeller e Adamski (2009) Mol Cell Endocrinol 301: 7 a 19, aqui incorporado por referência na sua totalidade para todos os efeitos), mas pouco se sabe sobre a função de HSD17B13. HSD17B13 é expresso principalmente no fígado (Liu et al. (2007) Acta Biochim Pol 54: 213 a 218, aqui incorporado por referência na sua totalidade para todos os efeitos), onde se localiza em gotículas lipídicas (Su et al. (2014). Proc Natl Acad Sei USA 111: 11437 a 11442, aqui incorporado por referência na sua totalidade para todos os efeitos), consistente com um papel para HSD17B13 na patogênese da doença do fígado gorduroso. Os dados são consistentes com constatações recentes de que a superexpressão de HSD17B13 aumentou a lipogênese no fígado de camundongo e aumentou o número e o tamanho de gotículas lipídicas em hepatócitos cultivados (Su et al. (2014) Proc Natl Acad Sei USA 111:11437 a 11442, aqui incorporado por referência na sua totalidade para todos os efeitos). Dois estudos anteriores também mostraram que a expressão hepática da proteína de HSD17B13 está aumentada em pacientes com esteatose hepática (Su et al. (2014) Proc Natl Acad Sei USA 111: 11437 a 11442 e Kampf et al. (2014) FASEB J 28: 2901 a 2914, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos). Dois genes com variantes que foram relatados como estando associados com o aumento do risco de doença do fígado - PNPLA3 e TM6SF2 - também têm papéis fisiológicos no metabolismo lipídico dos
Petição 870190068171, de 18/07/2019, pág. 269/358
256 / 307 hepatócitos. A variante de HSD17B13 que é descrita aqui é a primeira variante protetora da doença do fígado, e pode fornecer um caminho para novas estratégias terapêuticas direcionadas à doença do fígado crônica, semelhante às variantes genéticas que têm orientado o caminho para novas terapias em outros domínios.
[00409] Em geral, os dados suportam HSD17B13 como um novo alvo terapêutico para reduzir o risco de doença do fígado crônica em humanos. E importante ressaltar que os dados indicam que o direcionamento do HSD17B13 podería reduzir a progressão da DHGNA para estágios posteriores de NASH, fibrose e cirrose, que estão associados com morbidade e mortalidade significativas, e para os quais atualmente não há tratamentos eficazes.
Métodos [00410] Participantes do estudo. Estudos de genética humana foram conduzidos como parte da colaboração DiscovEHR do Regeneron Genetics Center e do Geisinger Health System (GHS). O estudo foi aprovado pelo Conselho de Revisão Institucional do GHS. As duas populações de estudo DiscovEHR (coorte de descoberta e coorte de cirurgia bariátrica) se originaram dos primeiros 50.726 participantes consentidos >18 anos de idade da Iniciativa de Saúde Comunitária MYCODE® do GHS (Dewey et al. (2016) Science 354 (6319) doi: 10.1126/science.aaf6814, aqui incorporado por referência na sua totalidade para todos os efeitos). A coorte de descoberta do GHS consistiu de 46.544 indivíduos europeus recrutados de clínicas de atenção primária e especialidades ambulatoriais entre 2007 e 2016, excluindo todos aqueles recrutados para a coorte de cirurgia bariátrica. A coorte de cirurgia bariátrica do GHS foi composta por 2.644 indivíduos europeus que foram encaminhados para cirurgia bariátrica.
[00411] Os estudos de replicação incluíram 1.357 indivíduos europeus do Estudo do Dallas Heart e 8.527 europeus do Penn Medicine Biobank. O
Petição 870190068171, de 18/07/2019, pág. 270/358
257 / 307
Estudo do Dallas Heart é um estudo de coorte populacional baseado em probabilidades de residentes do Condado de Dallas com idade entre 30 e 65 anos (Victor et al. (2004) Am J Cardiol 93: 1473 a 1480, aqui incorporado por referência na sua totalidade para todos os efeitos. A Penn Medicine Biobank inclui participantes recrutados do Sistema de Saúde da Universidade da Pensilvânia e consentiram o armazenamento de amostras biológicas, o acesso aos dados de EHR e a permissão para entrar em contato.
[00412] Estudos de replicação das associações com doença do fígado crônica incluíram 517 indivíduos do Estudo do Dallas Liver (DLS) e 447 indivíduos do Estudo do Dallas Pediatric Liver (DPLS). O DLS é um biobanco de pacientes com doença do fígado de etiologia não viral. O recrutamento começou em janeiro de 2015 e está em andamento. Os participantes foram recrutados em clínicas de fígado na UT Southwestern e na Parkland Health and Hospital System, em Dallas. O biobanco foi aprovado pelo Conselho de Revisão Institucional da UT Southwestern. Os participantes forneceram consentimento informado por escrito. Os participantes preencheram um questionário sobre antecedentes étnicos/raciais, histórico médico, fatores de estilo de vida e história familiar de doença do fígado e outras doenças. Informações clínicas adicionais foram extraídas dos registros médicos por um técnico treinado. Todos os pacientes afro-americanos, europeus-americanos e hispanoamericanos com o DNA disponível no momento do presente estudo foram incluídos (n = 517). O DPLS é um biobanco de crianças recrutadas em clínicas pediátricas de fígado na UT Southwestern e na Parkland Health and Hospital System, em Dallas, e em uma clínica de obesidade do Children's Medical Center, em Dallas. Ο biobanco foi aprovado pelo Conselho de Revisão Institucional da UT Southwestern. Os responsáveis legais dos participantes forneceram consentimento informado por escrito. A informação clínica foi extraída dos registros médicos por um técnico treinado. Como mais de 95% dos pacientes
Petição 870190068171, de 18/07/2019, pág. 271/358
258 / 307 eram hispanoamericanos, apenas pacientes hispano-americanos e controles foram incluídos no presente estudo (n = 203 pacientes e 244 controles).
[00413] Preparação de Amostra e Sequenciamento. A preparação da amostra e o sequenciamento completo do exoma foram realizados no Regeneron Genetics Center como descrito anteriormente (Dewey et al. (2016) Science 354 (6319) doi: 10.1126/science.aaf6814, aqui incorporado por referência na sua totalidade para todos os efeitos). Em resumo, a captura do exoma foi realizada usando sondas NimbleGen de acordo com o protocolo recomendado pelo fabricante (Roche NimbleGen). O DNA capturado foi amplificado por PCR e quantificado por qRT-PCR (Kapa Biosystems). As amostras multiplexadas foram sequenciadas usando sequenciamento pareado de 75 pb em uma Illumina v4 HiSeq 2500 a uma profundidade de cobertura suficiente para fornecer mais de 20x de profundidade haplóide de mais de 85% de bases direcionadas em 96% das amostras (aproximadamente 80x de profundidade de leitura haplóide média de bases alvo). Os dados de sequência bruta de cada corrida Illumina Hiseq 2500 foram carregados para a plataforma DNAnexus (Reid et al. (2014) BMC Bioinformática 15, 30 doi: 10.1186/1471-2105-15-30) para alinhamento de leitura de sequência e identificação de variante. Em resumo, os dados de sequência bruta foram convertidos de arquivos BCL para arquivos FASTQ específicos de amostra, que foram alinhados à construção de referência humana GRCh37.pl3 com BWA-mem (Li e Durbin (2009) Bioinformatics 25: 1754 a 1760, incorporados aqui por referência na sua totalidade para todos os efeitos). Variantes de nucleotídeo único (SNV) e variantes de sequência de inserção/eliminação (indel) foram identificadas utilizando o Genome Analysis Toolkit (McKenna et al. (2010) Genome Res 20: 1297 a 1303, aqui incorporado por referência na sua totalidade para todos os efeitos).
[00414] Genotipagem direcionada de rs72613567 nos Estudos do Dallas Liver e Pediatric Liver. HSD17B13, rs72613567, foi genotipado pelo
Petição 870190068171, de 18/07/2019, pág. 272/358
259 / 307 ensaio TAQMAN® no Estudo do Dallas Liver e no estudo do Dallas Pediatric Liver, e por sequenciamento de exoma no Estudo do Dallas Heart. Chamadas TAQMAN® foram verificadas por sequenciamento Sanger de 5 indivíduos com cada genótipo.
[00415] Medições clínicas e definições de doença do fígado crônica na coorte de descoberta. As medições laboratoriais clínicas para ALT e AST foram extraídas dos EHRs dos participantes da coorte de descoberta do GHS e da coorte de cirurgia bariátrica. Os valores medianos de ALT e AST foram calculados para todos os participantes com duas ou mais medições e foram transformados em logio para normalizar a distribuição antes das análises de associação.
[00416] Os códigos de doenças da Classificação Internacional de Doenças, Nona Revisão (ICD-9) foram extraídos dos EHRs e colapsados em categorias de doenças clínicas para não viral, não alcoólico (CCD-9 571.40, 571.41, 571.49, 571.5, 571.8, 571.9) ou definições de caso de doença do fígado alcoólica (CID-9 571.0, 571.1, 571.2, 571.3). Definições de caso adicionais baseadas em códigos de diagnóstico único incluíram: cirrose alcoólica (CID-9 571.2), cirrose não alcoólica (CID-9 571.5) e HCC (CID-9 155.0). Para essas definições de casos, um grupo controle comum sem doença do fígado foi definido como participantes sem nenhum critério de caso ou código de diagnóstico de encontro único ou lista de problemas que indicasse qualquer tipo de doença do fígado.
[00417] Definições do Fenótipo Histopatológico do Fígado na Coorte de Cirurgia Bariátrica. A coorte de cirurgia bariátrica do GHS consistiu de 2.644 indivíduos de descendência européia, com espécimes de biópsia hepática intra-operatórios disponíveis em 2.391 desses indivíduos. Os espécimes de biópsia hepática foram fixados em formol e corados com hematoxilina e eosina para histologia de rotina, e tricrômico de Masson para avaliação de fibrose, como descrito anteriormente (Gerhard et al. (2011)
Petição 870190068171, de 18/07/2019, pág. 273/358
260 / 307
Patient Saf Surg 5, 1, doi: 10.1186/1754- 9493-5-1, aqui incorporado por referência na sua totalidade para todos os efeitos). Os diagnósticos histológicos foram determinados por hepatopatologistas utilizando critérios previamente estabelecidos (Brunt et al. (1999) Am J Gastroenterol 94: 2467 a 2474, aqui incorporados por referência na sua totalidade para todos os efeitos). Os diagnósticos histológicos foram utilizados para definir os seguintes fenótipos: 1) Normal: sem evidência de esteatose, EHNA ou fibrose; 2) Esteatose simples: Esteatose (independente do grau) sem evidência de EHNA ou fibrose; 3) NASH/fibrose: Qualquer presença de inflamação lobular ou balonamento de hepatócitos (independentemente do grau), ou qualquer presença de fibrose (independentemente do estágio); 4) Fibrose: Qualquer presença de fibrose (independentemente do estágio).
[00418] Análise da Associação de todo o Exoma de Enzimas do Fígado. Na coorte de descoberta do GHS, 502.219 variantes bialélicas com taxa de dados perdida <1%, valor de p de equilíbrio de Hardy-Weinberg > 1,0 x IO'6 e frequência alélica menor >0,1% foram testadas para associação com os níveis de transaminases. ALT e AST medianos transformados com Logio foram ajustados para idade, idade2, sexo, IMC e os quatro primeiros componentes principais de ancestralidade. Para explicar o parentesco entre os participantes do estudo, também foi ajustada uma matriz de parentesco genético como uma covariável de efeitos aleatórios. Ambos os componentes principais e a matriz de relação genética foram construídos a partir de 39.858 marcadores não MHC em equilíbrio de ligação aproximado e com frequência alélica menor > 0,1%. Foram utilizados modelos mistos lineares como implementado no pacote GCTA (Yang et al. (2011) Am J Hum Genet 88: 76 a 82, aqui incorporado por referência na sua totalidade para todos os efeitos) para testar a associação entre traços residuais e variantes de nucleotídeo único. Os testes foram bem calibrados, como mostrado pelos gráficos quantilquantil em escala exótica e valores lambda de controle genômico (Fig. 1).
Petição 870190068171, de 18/07/2019, pág. 274/358
261/307 [00419] Meta-Análise de Replicação de Associações de Enzimas do
Fígado. Tentamos replicar associações na coorte de descoberta do GHS em três coortes separadas de descendência européia: a coorte de cirurgia bariátrica do GHS, o Estudo do Dallas Heart e o Penn Medicine Biobank (descrito acima). As medidas de ALT e AST na coorte de cirurgia bariátrica do GHS e na Penn Medicine Biobank foram transformadas em logio e ajustadas para idade, idade2, sexo, IMC e os quatro primeiros componentes principais de ancestralidade. As medidas de ALT e AST das amostras do Penn Medicine Biobank foram transformadas com logio e ajustadas para idade, idade2, sexo, IMC e os quatro primeiros componentes principais de ancestralidade. Matrizes de relação genética foram incluídas como covariáveis de efeitos aleatórios, e a análise foi realizada usando modelos mistos lineares no GCTA. No estudo de Dallas Heart, as medidas de ALT e AST transformadas com logw foram ajustadas para idade, idade2, sexo e os dez primeiros componentes principais de ancestralidade, e a análise foi realizada usando a regressão linear implementada em PLINK. A estatística resumida para as três coortes de replicação foi meta-analisada utilizando METAL (meta-análise de replicação) (Wilier et al. (2010) Bioinformatica 26: 2190 a 2191, aqui incorporado por referncia na sua totalidade para todos os efeitos). As estatísticas resumidas para a coorte de descoberta e as três coortes de replicação foram meta-analisadas de forma semelhante (meta-análise conjunta).
[00420] Análise de associação com fenótipos de doença do fígado crônica. Foram analisadas nove variantes de nucleotídeo único e replicadas da enzima hepática ExWAS para associações com fenótipos de doença do fígado binária definidos a partir da coorte de descoberta do GHS, conforme descrito acima. Foi utilizado um limite de significância de Bonferroni de P < 0,05/26 (P < 1,92 x 10'3) para considerar as treze variantes e duas categorias gerais de doença do fígado crônica (alcoólicas e não alcoólicas) testadas. A
Petição 870190068171, de 18/07/2019, pág. 275/358
262 / 307 variante de HSD17B13 foi ainda testada quanto à associação com fenótipos hepáticos histopatologicamente definidos da coorte de cirurgia bariátrica do GHS, como descrito acima. As razões de probabilidade foram estimadas com o uso do método de regressão logística penalizada de Firth após ajuste para idade, idade2, sexo, IMC e os quatro primeiros componentes principais de ancestralidade. As razões de probabilidade genotípicas não ajustadas também foram estimadas para HSD17B13, rs72613567.
[00421] As razões de probabilidades para doença do fígado no DLS foram estimadas por regressão logística, ajustada para idade, idade2, sexo, IMC e etnia auto relatada. Participantes do Estudo do Dallas Heart com genótipos de rs72613567 disponíveis foram usados como controles normais (n = 4.279). As razões de probabilidade no DPLS foram estimadas por regressão logística.
[00422] Software. Análises de associação genética foram realizadas usando o software GCTA, versão 1.25.0 (Yang et al. (2011) Am J Hum Genet 88: 76 a 82, incorporado aqui por referência na sua totalidade para todos os efeitos), e PLINK, versão 1.9.0 . Quantil-quantil e Manhattan foram gerados usando o software R, versão 3.2.1 (R Project for Statistical Computing). Gráficos de associação regional foram gerados utilizando LocusZoom (Pruim et al. (2010) Bioinformatics 26: 2336 a 2337, aqui incorporado por referência na sua totalidade para todos os efeitos).
[00423] Estudos de sequenciamento de RNA. A qualidade e a concentração de RNA foram avaliadaa através da corrida de RNA total em um chip Agilent RNA Nano Bioanalyzer; todas as amostras tinham um número de integridade de RNA (NIR) maior que 8. As transcrições de RNA poliadeniladas foram isoladas usando dois ciclos de enriquecimento com esferas de oligo(dT)25 (Thermo Fisher Scientific). As amostras foram purificadas e concentradas com esferas de RNA-XP-XP (Beckman Coulter) e fragmentadas pelo calor para aproximadamente 140 pares de bases. A síntese
Petição 870190068171, de 18/07/2019, pág. 276/358
263 / 307 da primeira fita foi completada com a transcriptase reversa SuperScript III (Thermo Fisher Scientific) usando hexâmeros aleatórios; o dTTP foi substituído por dUTP durante a síntese da segunda fita. As amostras foram processadas de acordo com o método de preparação de biblioteca de DNA padrão referenciado acima para exomas com a adição de uma etapa de DNAglicosilase de uracila para gerar bibliotecas de sequenciamento específicas de fita. As amostras foram reunidas e sequenciadas utilizando um sequenciamento emparelhado de 75 pb em uma Illumina v4 HiSeq 2500.
[00424] Identificação de Transcrições de HSD17B13 novas. As leituras foram mapeadas para o Human.B38 usando o software ARRAYSTUDIO® (OMICSOFT®, Cary, NC), permitindo duas incompatibilidades. Duas abordagens foram empregadas para identificar transcrições de HSD17B13 novas. Novas junções de éxon foram verificadas com base no Gencode v24. A montagem de transcrição de novo foi executada usando o Trinity (v2.2.0) na configuração padrão. Modelos de genes personalizados foram construídos para incorporar novas transcrições de HSD17B13, e a quantificação de transcrições foi estimada pelo alinhamento de leitura ao modelo de gene personalizado. O alinhamento da sequência proteica de todas as isoformas de HSD17B13 identificadas é mostrado nas Figs. 7A e 7B.
[00425] Validação RT-PCR de Novas Transcrições. RT-PCR no RNA total de amostras de fígado humano foi realizada utilizando o sistema de RT-PCR One-Step SUPERSCRIPT™ com PlatinumTM Taq DNA Polymerase (Thermofisher). Cada reação de 50 uL de RT-PCR continha IX de mistura de reação, 500 nM de cada iniciador direto e reverso (PST516: ATGAACATCATCCTAGAAATCCTTC (SEQ ID N 251) e PST517: ATCATGCATACATCTCTGGCTGGAG (SEQ ID N 252)), 1 de RT/Platinum Taq e 75 ng de RNA. As condições de ciclagem foram: um ciclo de 45 °C por 30 minutos; um ciclo de 94 °C por 2 minutos; 40 ciclos de 94 °C
Petição 870190068171, de 18/07/2019, pág. 277/358
264 / 307 por 20 s, 53 °C por 30 s e 72 °C por 90 s; um ciclo de 72 °C por 5 minutos; depois, uma espera de 10 °C. Os produtos foram purificados utilizando o kit de purificação QIAquick PCR (Qiagen) e submetidos a sequenciamento direto de Sanger utilizando o iniciador DE002 (ATCAGAACTTCAGGCCTTGG (SEQ ID NO: 253)). Para identificar os transcrições B e C, os produtos de RT-PCR foram eliminados em um gel de agarose a 2% corado com corante de gel de ácido nucleico SYBR GOLDSYBR® Gold (Thermofisher), e bandas do peso molecular esperado foram excisadas e purificadas usando o Kit de Extração de Gel QIAquick (Qiagen), depois submetido à clonagem com o Kit TOPO® TA Cloning (Thermofisher). O sequenciamento dos clones de TOPO foi realizado utilizando os iniciadores de sequenciamento M13F e M13R. A análise da sequência foi realizada utilizando o software de análise de DNA Sequencher (Gene Codes Corporation).
[00426] Validação de PacBio de Novas Transcrições. As transcrições de HSD17B13 de comprimento total foram amplificadas diretamente a partir de 50 ng de RNA total com o sistema de RT-PCR de uma etapa SuperScript III com Platinum Taq High Fidelity (Thermo Fisher Scientific) usando iniciadores específicos de gene no primeiro (GCAAAGCCATGAACATCA TCC) (SEQ ID NO: 254 ) e nos últimos éxons (TCTTGATGTAGTGGG AGTCGGATT (SEQ ID NO: 255)) para gerar um amplicon de ~2,2 kb (tamanho máximo do transcrição previsto). Os amplicons foram verificados em um Aganent Bioanalyzer Adaptadores com código de barras compatível com PacBio foram ligados aos amplicons e limpos com esferas PacBio PB (Pacific Biosciences). As bibliotecas foram agrupadas em quantidades iguais e sequenciadas em uma célula SMRT por 180 minutos na plataforma PacBio RSII, os dados foram desmultiplexados usando o software PacBio e analisado com o ConsensusTools Amplicon Analysis. Os amplicons foram comparados aos genes HSD17B13 RefSeq para determinar a situação da isoforma e do genótipo.
Petição 870190068171, de 18/07/2019, pág. 278/358
265 / 307 [00427] Localização subcelular de isoformas de HSD17B13. As células HepG2 foram cultivadas em Meio Essencial Mínimo de Eagle suplementado com 10% de soro bovino fetal. As transcrições A, B, C e D de HSD17B13 foram subclonadas em construtos de lentivírus da estrutura MycDDK, e foram gerados lentivírus. As células HepG2 foram infectadas com lentivírus contendo as várias transcrições de HSD17B13. Linhagens celulares estáveis que expressam cada transcrição de HSD17B13 foram selecionadas com 1 a 3 mg/mL de sulfato de Geneticina G-418 em meio de cultura completo durante duas semanas. As células HepG2 selecionadas foram tratadas com ou sem 200 μΜ de ácido oleico durante a noite e depois fixadas. As isoformas de HSD17B13 foram marcadas com anticorpo anti-Myc de camundongo. As gotículas lipídicas foram marcadas com corante BODIPY FL (Sigma). A proteína de revestimento lipídico e o retículo endoplasmático foram marcados com anticorpo de coelho anti-PLIN (Sigma) e anticorpo anticalexina de coelho (Cell Signalling Technology), respectivamente. Os anticorpos secundários para a imunofluorescência foram IgG de anti-coelho de burro Alexa Fluor 488 e IgG de anti-camundongo de burro Alexa Fluor 594 (Jackson ImmunoResearch).
Exemplo 2. Efeito de rs72613567:TA em RNAm de HSD17B13 e Expressão de Proteína de HSD17B13.
[00428] O efeito do alelo de HSD17B13, rs72613567:TA na expressão de transcrições conhecidas e novas do gene foi examinado. Utilizou-se sequenciamento de RNA para avaliar a expressão de RNAm de HSD17B13 em amostras de fígado histologicamente normais a partir de 22 portadores homozigóticos T/T, 30 heterozigóticos T/TA e 17 homozigóticos TA/TA da variante de entrelaçamento de HSD17B13, rs72613567. Além das duas transcrições de HSD17B13 conhecidas, A e B, duas novas transcrições foram identificadas: transcrição C, sem o éxon 6, e transcrição D que continha uma inserção de um nucleotídeo guanina na extremidade 3' do éxon 6, que seria
Petição 870190068171, de 18/07/2019, pág. 279/358
266 / 307 previsto para resultar em truncamento prematuro da proteína. As transcrições foram validadas por RT-PCR e sequenciamento Sanger (dados não mostrados). A transcrição D também foi validado usando sequenciamento de DNAc de leitura longa. Os níveis de expressão destas transcrições variaram de acordo com o genótipo de HSD17B13, rs72613567; os níveis de transcrição A diminuíram, enquanto o nível de transcrições D aumentou de um modo dependente de dosagem de alelo com cada alelo de TA (ver Figs. 3A, 3D e 10B). A transcrição A, que codifica a proteína de 300 aminoácidos de comprimento total, foi a transcrição predominante nos homozigotos T/T, enquanto a transcrição D, que codifica a proteína prematuramente truncada, foi a transcrição predominante nos homozigotos TA/TA. Em tecido de biópsia de fígado humano, a proteína da isoforma D truncada estava minimamente presente em heterozigotos e homozigotos de TA/TA, e a abundância de proteína de isoforma A foi reduzida de um modo dependente de dosagem de alelo (ver Figs. 10B e 10C). Estes dados são consistentes com HSD17B13, rs72613567 alterando o processamento de RNAm, resultando na síntese de uma forma truncada da proteína com expressão substancialmente reduzida no fígado humano.
[00429] Com referência às Figuras 10A a 10E, a expressão, a localização subcelular, e a atividade enzimática de uma nova transcrição de HSD17B13 é mostrada. A expressão das transcrições A e D de HSD17B13 em portadores homozigóticos de referência (T/T), heterozigóticos (T/TA) e homozigóticos alternativos (TA/TA) da variante de entrelaçamento de HSD17B13, rs72613567, é mostrada nas Figuras 3A e 3D. As regiões de codificação nos modelos genéticos são indicadas nas caixas listradas e as regiões não traduzidas nas caixas pretas. O asterisco na transcrição D indica a inserção de G de rs72613567 na extremidade 3' do éxon 6, o que leva ao truncamento prematuro da proteína. A expressão de RNAm é exibida em unidades FPKM (fragmentos por quilobase de transcrição por milhão de
Petição 870190068171, de 18/07/2019, pág. 280/358
267 / 307 leituras mapeadas). Um Western blot de células HepG2 sobre-expressando as transcrições A e D de HSD17B13 mostra que a transcrição D de HSD17B13 foi traduzida para uma proteína truncada com menor peso molecular em comparação com o transcrição A de HSD17B13 (ver Figura 10A). Resultados semelhantes foram observados com um Western blot de HSD17B13 de amostras de fígado humano fresco congelado e HEK293 (ver Figura 10B). As amostras de fígado humano eram de portadores homozigóticos de referência (Ί7Τ), heterozigóticos (Ί7ΤΑ) e homozigóticos alternativos (TA/TA) da variante de entrelaçamento de HSD17B13, rs72613567. As amostras celulares foram de células HEK293 que sobre-expressam as transcrições A e D de HSD17B13 não marcadas. A transcrição D de HSD17B13 foi traduzida para uma proteína truncada IsoD com um peso molecular inferior à IsoA de HSD17B13. Os níveis de proteína IsoD de HSD17B13 foram inferiores aos níveis de proteína IsoA tanto de amostras de fígado humano (esquerda) como de células (direita) (ver Figura 10C). O nível de proteína normalizado para actina é mostrado nas colunas de barra na Figura 10C; ** P < 0,001, * P < 0,05. Ambas as isoformas A e D de HSD17B13 foram localizadas na membrana de gotículas lipídicas em HepG2 sobre-expressando HSD17B13. As transcrições A ou D foram marcadas com BODIPY para mostrar gotículas lipídicas e anti-Myc para mostrar a localização de HSD17B13 (dados não mostrados). A atividade enzimática das isoformas A e D de HSD17B13 a estradiol 17-beta (estradiol), leucotrieno B4 (LTB4) e ácido 13hidroxioctadecadienoico (13(S)-HODE) foi também avaliada (ver Figura 10D). A isoforma D de HSD17B13 apresentou < 10% de atividade enzimática dos valores correspondentes para a isoforma A. A isoforma D de HSD17B13 quando sobre-expressa em células HEK293 não mostrou muita conversão de estradiol (substrato) a estrona (produto) quando medida no meio de cultura, enquanto a isoforma A de HSD17B13 sobre-expressa mostrou conversão robusta (ver Figura 10E).
Petição 870190068171, de 18/07/2019, pág. 281/358
268 / 307 [00430] HSD17B13 é expressa principalmente no fígado (Liu et al., Acta Biochim. Pol., 2007, 54, 213 a 218, aqui incorporado por referência na sua totalidade para todos os efeitos), onde se localizam as gotículas lipídicas (Su et al., Proc. Natl. Acad. Sei. USA, 2014, 111, 11437 a 11442, aqui incorporado por referência na sua totalidade para todos os efeitos), consistente com um papel na patogênese da doença do fígado gorduroso. A expressão de HSD171B3 e a sua localização foi avaliada em uma linhagem celular de fígado humano imortalizada estavelmente transduzida com lentivírus que expressa as transcrições A e D de HSD17B13. HSD17B13 foi detectada principalmente em membranas que rodeiam gotículas lipídicas marcadas com BODIPY (dados não mostrados). A localização subcelular similar foi observada para a isoforma D de HSD17B13 na superfície das gotículas lipídicas (ver Figura 10D).
[00431] Para compreender as consequências funcionais do truncamento prematuro da proteína de HSD17B13 devido a rs72613567:TA, a atividade enzimática das isoformas A e D foi avaliada in vitro utilizando proteína recombinante. Foram examinados mais de 300 substratos putativos, dos quais o estradiol, o leucotrieno B4 e o ácido 13-hidroxioctadecadienoico foram enzimaticamente convertidos por HSD17B13, resultando na oxidação de um grupo hidroxila a uma cetona. A isoforma D de HSD17B13 mostrou uma atividade muito reduzida em relação aos três substratos (ver Figura 10D).
[00432] Comparado ao controle GFP, células HSD17B13-transcriçãoA-sobre-expressa tinham menor concentração de estradiol, bem como maior concentração de estrona no meio de cultura de células, sugerindo atividade enzimática contra o estradiol (ver Figura 10E). As células HSD17B13transcrição-D-sobre-expressa tiveram uma proporção similar de estrona/estradiol para as células de controle GFP, sugerindo que a transcrição D de HSD17B13 tem uma perda significativa de função. A análise de espectrometria de massa revelou a rápida conversão de estrona em
Petição 870190068171, de 18/07/2019, pág. 282/358
269 / 307 hidroxiestrona e outros produtos responsáveis pelo baixo acúmulo de estrona em comparação com o estradiol consumido.
[00433] Através de sequenciamento de exoma em grande escala, uma nova associação foi identificada entre uma variante de entrelaçamento em HSD17B13 e diminuição dos níveis séricos de transaminase, bem como redução do risco de formas não alcoólicas e alcoólicas da doença do fígado, incluindo formas de cirrose avançadas de doença do fígado e HCC. Para nosso conhecimento, este é o primeiro relato de uma variante de alteração de proteína que tem uma associação protetora com doença do fígado. O alelo HSD17B13, rs72613567:TA não foi associado à esteatose simples, mas reduziu o risco de progressão para NASH. A consistência das associações protetoras dependentes de dosagem em quatro coortes independentes (DiscovEHR, uma coorte de cirurgia bariátrica independente em DiscovEHR, DLS e DPLS) em várias categorias diferentes de doenças hepáticas e etnias apoiam a noção de que a variante de HSD17B13 relatada protege da progressão para mais estágios clinicamente avançados da doença do fígado crônica. A dependência da dosagem do alelo observado também defende que uma regulação mais profunda da função de HSD17B13 pode resultar em efeitos mais profundos no risco e progressão da doença.
[00434] Os resultados da associação aqui descritos foram principalmente baseados em observações em europeus e hispanoamericanos que têm IMC elevado. HSD17B13 está próximo a HSD17B11, um membro da mesma família de genes com alta similaridade de sequência com HSD17B13, mas com uma distribuição tecidual mais ampla. No geral, os dados aqui apresentados suportam a posição de que HSD17B13 é um alvo terapêutico potencial para a prevenção e tratamento da doença do fígado gordurosa em humanos. Os dados aqui apresentados indicam que o direcionamento de HSD17B13 poderia reduzir a progressão da doença do fígado de esteatose para fases posteriores de NASH, fibrose e cirrose, que
Petição 870190068171, de 18/07/2019, pág. 283/358
270 / 307 estão associadas à morbidade e à mortalidade significativas, e para as quais atualmente não há tratamentos eficazes.
Exemplo 3. A variante 17-beta-hidroxiesteroide desidrogenase 13 protege contra a doença do fígado crônica.
[00435] Para identificar fatores genéticos que contribuem para a doença do fígado crônica, foram utilizados dados de sequência de exoma e registros eletrônicos de saúde de 46.544 participantes no estudo de genética humana DiscovEHR. Foram identificadas variantes genéticas associadas a biomarcadores estabelecidos de lesão hepática (alanina aminotransferase sérica (ALT) e aspartato aminotransferase (AST)) para nomear candidatos que possam estar associados à doença do fígado crônica. As variantes candidatas replicando em três coortes adicionais (12.527 indivíduos) foram subsequentemente avaliadas para associação com diagnósticos clínicos de doença do fígado crônica em DiscovEHR e duas coortes independentes (total de 37.892 indivíduos). Também foi examinada a associação com a gravidade histopatológica da doença do fígado em uma coorte de cirurgia bariátrica independente (n = 2.391 amostras de fígado humano).
[00436] Uma variante de entrelaçamento (rs72613567:TA) em HSD17B13, codificando a proteína 17-beta-hidroxiesteroide desidrogenase 13 de gotículas lipídicas hepáticas, foi reproduzivelmente associada com níveis de ALT (P = 4,2 x IO'12) e AST (P = 6,2 x IO'10) reduzidos. Em DiscovEHR, essa variante foi associada à redução do risco de doença do fígado alcoólica e não alcoólica (38%, intervalo de confiança (IC) 95% -52% e 16%, IC 95% 9% -22%, respectivamente, para cada alelo rs72613567:TA) e cirrose (em 44%, IC 95% 22-59% e em 26%, IC 95% 12% -38% para cirrose alcoólica e não alcoólica, respectivamente, para cada alelo rs72613567:TA) de uma maneira dependente de dosagem de alelo; associações foram confirmadas em duas coortes independentes. rs72613567:TA esteve associado à diminuição da gravidade das características histológicas da esteato-hepatite não alcoólica
Petição 870190068171, de 18/07/2019, pág. 284/358
271 /307 (NASH) (redução de 23%, IC 95% 10% -34% para cada alelo rs72613567: TA entre indivíduos com doença do fígado gordurosa). rs72613567:TA resulta em uma proteína instável e truncada com atividade enzimática reduzida contra substratos esteroides.
[00437] Uma variante de perda de função em HSD17B13 foi associada com risco reduzido de doença do fígado alcoólica e não alcoólica, e progressão de esteatose para NASH.
Projeto de estudo e participantes [00438] Os estudos de genética humana foram realizados como parte da colaboração DiscovEHR do Regeneron Genetics Center e do Geisinger Health System (GHS). As duas populações de estudo DiscovEHR (coorte de descoberta e coorte de cirurgia bariátrica) se originaram dos primeiros 50.726 participantes consentidos > 18 anos de idade da Iniciativa de Saúde Comunitária MyCode® do GHS. A coorte de descoberta do GHS consistiu de 46.544 indivíduos europeus recrutados de clínicas de atenção primária e especialidades ambulatoriais entre 2007 e 2016, excluindo todos aqueles recrutados para a coorte de cirurgia bariátrica. A coorte de cirurgia bariátrica do GHS foi composta por 2.644 indivíduos europeus que foram encaminhados para cirurgia bariátrica. Estudos de replicação de associações com transaminases hepáticas incluíram 1.357 indivíduos europeus do Estudo do Dallas Heart e 8.527 indivíduos europeus do Penn Medicine Biobank. O Estudo do Dallas Heart é um estudo de coorte populacional baseado em probabilidades de residentes do Condado de Dallas com idade entre 30 e 65 anos (Victor et al., Am. J. Cardiol., 2004; 93, 1473 a 1480, aqui incorporado por referência na sua totalidade para todos os efeitos). O Penn Medicine Biobank inclui participantes recrutados do Sistema de Saúde da Universidade da Pensilvânia e consentiram no armazenamento de amostras biológicas, no acesso a dados EHR e na permissão para entrar em contato.
[00439] Estudos de replicação das associações com doença do fígado
Petição 870190068171, de 18/07/2019, pág. 285/358
272 / 307 crônica incluíram 517 indivíduos do Estudo do Dallas Liver (DLS) e 447 indivíduos do Estudo do Dallas Pediatric Liver (DPLS). O DLS é um biobanco de pacientes com doença do fígado de etiologia não viral. O recrutamento começou em janeiro de 2015 e está em andamento. Os participantes foram recrutados em clínicas de fígado na UT Southwestern e na Parkland Health and Hospital System, em Dallas. Os participantes preencheram um questionário sobre antecedentes étnicos/raciais, histórico médico, fatores de estilo de vida e história familiar de doença do fígado e outras doenças. Informações clínicas adicionais foram extraídas dos registros médicos por um técnico treinado. Todos os pacientes afro-americanos, europeus-americanos e hispanoamericanos com o DNA disponível no momento do presente estudo foram incluídos (n = 517) com controles do Estudo do Dallas Heart. O DPLS é um biobanco de crianças hispânicas recrutadas em clínicas pediátricas de fígado na UT Southwestern e Parkland Health and Hospital System, em Dallas, e em uma clínica de obesidade do Children's Medical Center, em Dallas. A informação clínica foi extraída dos registros médicos por um técnico treinado. Como mais de 95% dos pacientes eram hispanoamericanos, apenas pacientes hispanoamericanos e controles foram incluídos no presente estudo (n = 205 pacientes e 234 controles).
Medições Clínicas e Definições de Doenças do Fígado Crônicas na Coorte de Descoberta [00440] As medições laboratoriais clínicas para ALT e AST foram extraídas dos EHRs dos participantes da coorte de descoberta do GHS e da coorte de cirurgia bariátrica. Os valores medianos de ALT e AST foram calculados para todos os participantes com duas ou mais medições, e foram transformados em logw para normalizar a distribuição antes das análises de associação.
[00441] Os códigos de diagnóstico de doença da Nona Revisão Internacional (CID-9) foram extraídos de EHRs e colapsados em categorias
Petição 870190068171, de 18/07/2019, pág. 286/358
273 / 307 de doenças clínicas para definições de caso de doença do fígado não viral, não alcoólica (CID-9 571.40, 571.41, 571.49, 571.5, 571.8, 571.9) ou alcoólica (CID-9 571.0, 571.1, 571.2, 571.3). Definições de caso adicionais baseadas em códigos de diagnóstico único incluíram: cirrose alcoólica (CID-9 571.2), cirrose não alcoólica (CID-9 571.5) e HCC (CID-9 155.0). Para essas definições de casos, um grupo controle comum sem doença do fígado (“sem doença do fígado”) foi definido como participantes sem nenhum critério de caso ou código de diagnóstico de encontro único ou lista de problemas que indicasse qualquer tipo de doença do fígado.
Definições do fenótipo histopatológico do fígado na coorte de cirurgia bariátrica [00442] A coorte de cirurgia bariátrica do GHS consistiu de 2.644 indivíduos descendentes de europeus. Biópsias do fígado foram obtidas no intraoperatório durante a cirurgia bariátrica, a partir de 2.391 desses indivíduos. As biópsias foram consistentemente obtidas 10 cm à esquerda do ligamento falciforme antes de qualquer retração do fígado ou cirurgia no estômago. A biópsia foi dividida em seções, com a secção primária entregue aos histopatologistas para histologia do fígado (fixada em formalina tamponada neutra a 10% e corada com hematoxilina e eosina para histologia de rotina e tricrômio de Masson para avaliação da fibrose) e as seções restantes armazenadas no biobanco de pesquisa (congelado em RNA depois e/ou nitrogênio líquido). A histologia hepática foi conduzida por um patologista experiente e subsequentemente reavaliada por um segundo patologista experiente utilizando o sistema de pontuação da Rede de Pesquisa Clínica NASH (Kleiner et al., Hepatology, 2005, 41, 1313 a 1321, aqui incorporado por referência na sua totalidade para para todos os efeitos): grau de esteatose 0 (envolvimento parenquimatoso < 5%), 1 (5 a < 33%), 2 (34 a < 66%) e 3 (> 67%); inflamação lobular grau 0 (sem focos), grau 1 (leve, < 2 focos por 200X campo), grau 2 (moderado, 2 a 4 focos por 200X campo),
Petição 870190068171, de 18/07/2019, pág. 287/358
274 / 307 grau 3 (grave, > 4 focos por 200X campo); fibrose estágio 0 (nenhum), estágio 1 (fibrose perisortusoidal ou periportal), estágio 2 (fibrose perisortal e periportal), estágio 3 (fibrose em ponte) e estágio 4 (cirrose). Esses diagnósticos histológicos foram utilizados para definir os seguintes fenótipos: 1) Normal: sem evidência de esteatose, EHNA ou fibrose; 2) Esteatose simples: Esteatose (independente do grau) sem evidência de EHNA ou fibrose; 3) NASH: Qualquer presença de inflamação lobular ou balonização de hepatócitos (independentemente do grau), ou qualquer presença de fibrose (independentemente do estágio); 4) Fibrose: Qualquer presença de fibrose (independentemente do estágio).
Preparação de amostras, sequenciamento e genotipagem [00443] A preparação da amostra de DNA e o sequenciamento completo do exoma para os participantes do estudo DiscovEHR, do Estudo do Dallas Heart e do Penn Medicine Biobank foram realizados na Regeneron Genetics (Dewey et al., Science In Press, 2016, incorporados aqui por referência na sua totalidade para todos os efeitos). HSD17B13, rs72613567, foi genotipado por ensaio Taqman (e verificado por sequenciamento Sanger em 5 indivíduos de cada genótipo) no Estudo do Dallas Liver e no estudo do Dallas Pediatric Liver.
[00444] Em particular, a captura de exoma foi realizada utilizando sondas NimbleGen de acordo com o protocolo recomendado pelo fabricante (Roche NimbleGen). O DNA capturado foi amplificado por PCR e quantificado por qRT-PCR (Kapa Biosystems). As amostras multiplexadas foram sequenciadas usando sequenciamento pareado de 75 pb em uma Illumina v4 HiSeq 2500 a uma profundidade de cobertura suficiente para fornecer mais de 20x de profundidade haplóide de mais de 85% de bases direcionadas em 96% das amostras (aproximadamente 80x profundidade de leitura haplóide média de bases alvo). Os dados da sequência bruta de cada percurso Illumina Hiseq 2500 foram carregados para a plataforma DNAnexus
Petição 870190068171, de 18/07/2019, pág. 288/358
275 / 307 (Reid et al., BMC Bioinformática, 2014, 15, 30, aqui incorporado por referência na sua totalidade para todos os efeitos) para alinhamento de leitura de sequências e identificação de variantes. Em resumo, os dados de sequência bruta foram convertidos de arquivos BCL para arquivos FASTQ específicos de amostra, que foram alinhados à compilação de referência humana GRCh37.pl3 com BWA-mem (Li et al., Bioinformatics, 2009, 25, 1754 a 1760, aqui incorporada por referência na sua totalidade para todos os efeitos). Variantes de nucleotídeo único (SNV) e variantes de sequência de inserção/eliminação (indel) foram identificadas utilizando o Genome Analysis Toolkit (McKenna et al., Genome Res., 2010, 20, 1297 a 12303, aqui incorporado por referência na sua totalidade para todos os efeitos).
Análise da Associação de todo o Exoma de Enzimas do Fígado e Fenótipos de Doença do Fígado Crônica [00445] Foram utilizados modelos mistos lineares para testar 502.219 variantes bialélicas que tinham taxa de dados perdida < 1%, valor de equilíbrio de Hardy-Weinberg > 1,0 x IO'6 e frequência do alelo menor > 0,1% para associação com os níveis de transaminase. Para variantes com associações significativas de exoma com as transaminases (p < 1 x IO'7) na coorte de descoberta do GHS, foram realizadas análises de associação e metanálise, nos estudos de replicação de ancestralidade europeia descritos acima. Foi utilizado um limite de significância de Bonferroni determinado pelo número de variantes testadas para definir associações replicadas. Metaanálise de estudos de descoberta e replicação também foi realizada. Todos os valores P reportados no texto correspondem ao modelo alélico.
[00446] Subsequentemente, foram testadas variantes de nucleotídeo único associadas à transaminase para associações com fenótipos de doença do fígado crônica. Foi utilizado um limite de significância de Bonferroni determinado pelo número de variantes e categorias gerais de doença do fígado testadas para determinar a significância das associações. Foram testadas ainda
Petição 870190068171, de 18/07/2019, pág. 289/358
276 / 307 novas variantes replicadas para associação com fenótipos hepáticos histopatologicamente definidos da coorte de cirurgia bariátrica do GHS. Também foi realizado um estudo em todo o corpo de associações de novas variantes replicadas com 405 medidas clínicas quantitativas e 3.168 diagnósticos clínicos.
[00447] Em particular, foram testadas 502.219 variantes bialélicas com taxa de dados perdida <1%, valor de equilíbrio de Hardy-Weinberg > 1,0 x IO'6 e frequência alélica menor >0,1% para associação com os níveis de transaminase. ALT e AST medianos transformados com Logio foram ajustados para idade, idade2, sexo, IMC e os quatro primeiros componentes principais de ancestralidade. Para explicar o parentesco entre os participantes do estudo, também foi ajustada uma matriz de parentesco genético como uma covariável de efeitos aleatórios. Ambos os componentes principais e a matriz de relação genética foram construídos a partir de 39.858 marcadores não MHC em equilíbrio de ligação aproximado e com frequência alélica menor > 0,1%. Foram utilizados modelos mistos lineares como implementado no pacote GCTA (Yang et al., Am. J. Hum. Genet., 2011, 88, 76 a 82, incorporado aqui por referência na sua totalidade para todos os efeitos) para testar a associação entre traços residuais e variantes de nucleotídeo único. Todos os valores P reportados no texto correspondem ao modelo alélico.
[00448] Tentou-se replicar associações na coorte de descoberta do GHS em três coortes separadas de descendência européia: a coorte de cirurgia bariátrica do GHS, o Estudo do Dallas Heart e o Penn Medicine Biobank (descrito acima). As medidas de ALT e AST da coorte de cirurgia bariátrica do GHS e da Penn Medicine Biobank foram transformadas em logio e ajustadas para idade, idade2, sexo, IMC e os quatro primeiros componentes principais de ancestralidade. Matrizes de relação genética foram incluídas como covariáveis de efeitos aleatórios, e a análise foi realizada usando modelos mistos lineares no GCTA. No estudo de Dallas Heart, as medidas de
Petição 870190068171, de 18/07/2019, pág. 290/358
2T1 / 307
ALT e AST transformadas com logw foram ajustadas para idade, idade2, sexo, IMC e os dez primeiros componentes principais de ancestralidade, e a análise foi realizada usando a regressão linear implementada em PLINK. As estatísticas de resumo para as três coortes de replicação foram metaanalisadas utilizando METAL (Wilier et al., Bioinformatics, 2010, 26, 2190 a 2191, aqui incorporado por referência na sua totalidade para todos os efeitos) (meta-análise de replicação). As estatísticas resumidas para a coorte de descoberta e as três coortes de replicação foram meta-analisadas de forma semelhante (meta-análise conjunta).
Análise de associação com fenótipos de doença do fígado crônica [00449] Foram analisadas treze variantes de nucleotídeo único significativas e replicadas da enzima hepática ExWAS para associações com fenótipos de doença do fígado crônica definidos a partir da coorte de descoberta do GHS, conforme descrito acima. Foi utilizado um limite de significância de Bonferroni de P < 0,05/26 (P < 1,92 x 10'3) para considerar as treze variantes e duas categorias gerais de doença do fígado crônica (alcoólicas e não alcoólicas) testadas. A variante de HSD17B13, rs72613567, foi ainda testada quanto à associação com fenótipos hepáticos definidos histopatologicamente a partir da coorte de cirurgia bariátrica do GHS, como descrito acima. As razões de probabilidade foram estimadas com o uso do método de regressão logística penalizada de Firth após ajuste para idade, idade2, sexo, IMC e os quatro primeiros componentes principais de ancestralidade. As razões de probabilidade genotípicas foram estimadas para HSD17B13, rs72613567, usando as mesmas covariáveis.
[00450] As razões de probabilidades para doença do fígado no DLS foram estimadas por regressão logística, ajustada para idade, idade2, sexo, índice de massa corporal e etnia auto relatada. Participantes do Estudo do Dallas Heart com genótipos de rs72613567 disponíveis foram usados como controles normais (n = 4.279). As razões de probabilidade no DPLS foram
Petição 870190068171, de 18/07/2019, pág. 291/358
278 / 307 estimadas por regressão logística.
Estudo de associação em todo o fenômeno de HSD17B13, rs72613567 [00451] Foi realizado um estudo em larga escala de associações de HSD17B13, rs72613567, com 405 medidas antropométricas, sinais vitais, laboratoriais, eletrocardiográficas, ecocardiográficas e de densitometria óssea derivadas de EHR, e também com 3.168 diagnósticos clínicos derivados de EHR. Os valores medianos de laboratório para indivíduos com medidas ambulatoriais seriadas foram calculados após a remoção de valores espúrios prováveis que eram > 3 desvios padrão do valor mediano intra-individual; os valores máximo e mínimo também foram calculados. Então, foram calculados os traços residuais para todas as características do laboratório após o ajuste para idade, idade2, sexo e os dez primeiros componentes principais da ancestralidade, e foram aplicadas transformações apropriadas antes da análise de associação. Códigos de diagnósticos baseados na CID-9 foram coletados para grupos de doenças clínicas hierárquicas e controles correspondentes usando uma versão modificada dos agrupamentos propostos por Denny et al (Denny et al., Nature Biotechnology, 2013, 31, 1102 a 1110 e Denny et al., Bioinformatic, 2010, 26, 1205 a 1210, cada uma das quais é aqui incorporada por referência na sua totalidade para todos os efeitos). Os diagnósticos baseados na CID-9 exigiam um ou mais dos seguintes procedimentos: uma entrada de lista de problemas do código de diagnóstico ou um código de diagnóstico de encontro inserido para dois encontros clínicos separados em dias de calendário separados. As análises de associação com resíduos quantitativos de medições clínicas transformadas foram realizadas utilizando regressão linear, e as análises de associação com diagnósticos clínicos foram realizadas utilizando a regressão logística ajustada para idade, idade2, sexo e os primeiros quatro componentes principais. Os alelos foram codificados utilizando os modelos aditivo (0 para alelo de referência homozigoto, 1 para heterozigoto e 2 para alelo homozigoto alternativo) e recessivo (0 para alelo
Petição 870190068171, de 18/07/2019, pág. 292/358
279 / 307 de referência homozigoto e heterozigoto, 1 para alelo homozigoto alternativo).
Programas [00452] As análises de associação genética foram realizadas utilizando o software GCTA, versão 1.25.07 e PLINK, versão 1.9.0. Quantil-quantil e Manhattan foram gerados usando o software R, versão 3.2.1 (R Project for Statistical Computing). Gráficos de associação regional foram gerados utilizando LocusZoom (Pruim et al., Bioinformatics, 2010, 26, 2336 a 2337, aqui incorporado por referência na sua totalidade para todos os efeitos).
Estudos de sequenciamento de RNA [00453] A qualidade e concentração de RNA foi avaliada pela corrida de RNA total em um chip Agilent RNA Nano Bioanalyzer; todas as amostras tinham um número de integridade de RNA (NIR) maior que 8. As transcrições de RNA poliadeniladas foram isoladas usando dois ciclos de enriquecimento com esferas de oligo(dT)25 (Thermo Fisher Scientific). As amostras foram purificadas e concentradas com esferas de RNA-XP-XP (Beckman Coulter) e fragmentadas pelo calor para aproximadamente 140 pares de bases. A síntese da primeira fita foi completada com a transcriptase reversa SuperScript III (Thermo Fisher Scientific) usando hexâmeros aleatórios; o dTTP foi substituído por dUTP durante a síntese da segunda fita. As amostras foram processadas de acordo com o método de preparação de biblioteca de DNA padrão referenciado acima para exomas com a adição de uma etapa de DNA-glicosilase de uracila para gerar bibliotecas de sequenciamento específicas de fita.
Identificação e Validação de Transcrições de HSD17B13 Novas [00454] As leituras foram mapeadas para o Human.B38 usando o software ArrayStudio® (OmicSoft®, Cary, NC), permitindo duas incompatibilidades. Duas abordagens foram empregadas para identificar novas transcrições de HSD17B13. Novas junções éxon foram descobertas
Petição 870190068171, de 18/07/2019, pág. 293/358
280 / 307 com base no Gencode v24 usando o ArrayStudio. A montagem de transcrição de novo foi realizada usando Trinity (v2.2.0) na configuração padrão. Modelos de genes personalizados foram construídos para incorporar novas transcrições de HSD17B13, e a quantificação de transcrições foi estimada pelo alinhamento de leitura ao modelo de gene personalizado. O alinhamento da sequência proteica de todas as isoformas de HSD17B13 identificadas é mostrado nas Figuras 7A e 7B. A RT-PCR foi realizada em RNA total de amostras de fígado humano foi realizada utilizando o sistema de RT-PCR One-Step SuperScriptTM com polimerase de DNA PlatinumTM Taq (Thermo Fisher). Cada reação de RT-PCR a 50 μΕ continha Mistura de Reação IX, 500 nM de cada iniciador direto e reverso (PST516: ATGAACATCATCCTAGAAATCCTTC (SEQ ID NO: 251) e PST517: ATCATGCATACATCTCTGGCTGGAG (SEQ ID NO: 252)), 1 μΕ de RT/Platinum Taq e 75 ng de RNA. As condições de ciclagem foram: um ciclo de 45 °C por 30 minutos; um ciclo de 94 °C por 2 minutos; 40 ciclos de 94 °C por 20 segundos, 53 °C por 30 segundos e 72 °C por 90 segundos; um ciclo de 72 °C por 5 minutos; depois, uma espera de 10 °C. Os produtos foram purificados utilizando o kit de purificao QIAquick PCR (Qiagen) e submetidos a sequenciamento direto de Sanger utilizando o iniciador DE002 (ATCAGAACTTCAGGCCTTGG (SEQ ID NO: 253)). Para identificar as transcrições B e C, os produtos de RT-PCR foram descartados em um gel de agarose a 2% corado com SYBR GoldSYBR® Gold Nucleic Acid Gel Stain (ThermoFisher), e bandas do peso molecular esperado foram excisadas e purificadas usando o QIAquick Gel Extraction Kit (Qiagen), depois submetido à clonagem com o Kit TOPO® TA Cloning (ThermoFisher). O sequenciamento dos clones de TOPO foi realizado utilizando os iniciadores de sequenciamento M13F e M13R. A análise da sequência foi realizada utilizando o software de análise de DNA Sequencher (Gene Codes Corporation).
Petição 870190068171, de 18/07/2019, pág. 294/358
281/307 [00455] As transcrições de HSD17B13 de comprimento total foram amplificados diretamente a partir de 50 ng de RNA total com o Sistema de RT-PCR de uma etapa SuperScript III com Platinum Taq High Fidelity (ThermoFisher Scientific) usando iniciadores específicos de gene no primeiro (GCAAAGCCATGAACATCATCC (SEQ ID NO: 254)) e últimos éxons (TCTTGATGTAGTGGGAGTCGGATT (SEQ ID NO: 255)) para gerar urn amplicon de cerca de 2,2 kb (transcrição de tamanho máximo previsto). Os amplicons foram verificados em um bioanalisador Agilent. Adaptadores com códigos de barras compatíveis com PacBio foram ligados aos amplicons e limpos com esferas PacBio PB (Pacific Biosciences). As bibliotecas foram agrupadas em quantidades iguais e sequenciadas em uma célula SMRT por 180 minutos na plataforma PacBio RSII. Os dados foram desmultiplexados utilizando o software PacBio smrtanalysis v2.3 toolzmw e depois analisados com o ConsensusTools Amplicon Analysis. Os amplicons resultantes foram comparados aos genes HSD17B13 RefSeq para determinar a situação da isoforma e do genótipo.
Localização subcelular de isoformas de HSD17B13 [00456] Células HepG2 foram cultivadas em Meio Essencial Mínimo de Eagle suplementado com 10% de soro bovino fetal. As transcrições A e D de HSD17B13 foram subclonadas em construções de lentivírus da estrutura Myc-DDK e foram gerados lentivírus. As células HepG2 foram infectadas com lentivírus carregando as transcrições HSD17B13. Linhagens celulares estáveis que expressam cada transcrição de HSD17B13 foram selecionadas com 1 a 3 mg/mL de sulfato de Geneticina G-418 em meio de cultura completo durante duas semanas. Após a fixação, as isoformas de HSD17B13 foram detectadas com o anticorpo anti-Myc de camundongo. As gotículas lipídicas foram marcadas com corante BODIPY FL (Sigma). Os anticorpos secundários para a imunofluorescência foram IgG de anti-coelho de burro Alexa Fluor 488 e IgG de anti-camundongo de burro Alexa Fluor 594
Petição 870190068171, de 18/07/2019, pág. 295/358
282 / 307 (Jackson ImmunoResearch).
Quantificação da Expressão da Proteína de HSD171B3 em Tecido de Biópsia Hepática Humana e Linhagens Celulares Estáveis [00457] Fígado humano e amostras de sedimento celular foram homogeneizadas em tampão de lise RIPA Ix gelado (EMD Millipore) na presença de misturas inibidoras de proteinase e fosfatase (ThermoFisher). O sobrenadante foi coletado e usado para concentração de proteína usando ensaio de proteína BCA (ThermoFisher). O tecido humano e os lisados celulares foram carregados e separados em gs de SDS/PAGE (Bio-Rad) e transferidos para membranas de PVDF (Bio-Rad). As membranas foram bloqueadas durante 1 hora com leite a 5% (p/vol) em Ix TBS suplementado com 0,1% de Tween20 (Bio-Rad). As membranas foram incubadas com anticorpo a 4 °C durante a noite contra HSD17B13 (1:200, Thermo-Fisher) e B-Actina (1:500, Cell Signaling Technology). O anticorpo ligado foi detectado utilizando anticorpo anti-coelho conjugado com HRP (1:10.000, Jackson ImmunoResearch) e melhorado utilizando o reagente quimioluminescente (ThermoFisher). Intensidades de bandas foram quantificadas usando o software Image J.
PCR semi-quantitativa em tempo real [00458] O RNA foi extraído da célula usando TRIzol® (Invitrogen, Carlsbad, CA). O DNAc de primeira fita foi sintetizado utilizando Superscript III RT (Invitrogen) e utilizado para PCR semi-quantitativa com base em iniciadores que medem introns. Um sistema de PCR em tempo real QuantStudio 6 Flex foi usado para medir o nível de expressão das transcrições. Os iniciadores de HSD17B13 e TBP foram encomendados da IDT (Integrated DNA Technologies). A expressão genética relativa foi analisada com o método AACt, proporcionando uma modificação de expressão de dobras normalizada ao gene de manutenção interno TBP (ACt). Isolamento e caracterização de gotículas lipídicas por Western Blot
Petição 870190068171, de 18/07/2019, pág. 296/358
283 / 307 [00459] Prepararam-se gotículas lipídicas a partir de células HepG2 que expressam estavelmente a transcrição A (IsoA) de HSD17B13 ou transcrição D (IsoD) como anteriormente relatado (Brasaemle DL, Wolins NE. Isolation of lipid droplets from cells by density gradiente centrifugation. Current protocols in cell biology. 2006; Capítulo 3: Unidade 3 15 e Ding et al., Nature Protocols, 2013, 8, 43 a 51, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos). Em resumo, células HepG2 que expressam estavelmente IsoA, IsoD de HSD17B13 ou a linhagem parental foram incubadas durante a noite com ácido oleico 1 mM. As seguintes cargas lipídicas, as células foram raspadas e ressuspensas em tampão de lise hipotônico (20 mM Tris, pH 7,5, 1 mM EDTA) suplementado com IX inibidores de proteínase/fosfatase HaltTM (Thermo) e lisados por cavitação a 50 bar durante 8 minutos. Os lisados foram centrifugados a 1000 g/4 °C por 10 minutos, e o sobrenadante pós-nuclear (PNS) foi misturado com sacarose para um volume final de 2 mL e concentração de 20% em tubos de ultracentrífuga. Em seguida, 1,5 mL de sacarose a 5% e outros 1,5 mL de tampão de lise hipotônico foram colocados em camadas no topo do lisado. Os tubos foram centrifugados a 182000 g/4 °C durante 40 minutos e as camadas de gotículas lipídicas (LD) foram transferidas para tubos novos. O volume remanescente no tubo foi aspirado e o sedimento (membrana total, TM) foi ressuspenso em 0,5 mL de tampão de lise hipotônico. As frações PNS, LD e TM foram misturadas com Ix tampão de radioimunoprecipitação (RIPA) (EMD) + Tampão de Amostra NuPAGETM LDS (Thermo) e pmercaptoetanol e sonicados durante 3 horas a 37 °C. O lisado de MT foi diluído 2,5 vezes para normalizar para o SNP. Os lisados foram corridos em gás de SDS-PAGE a 4 a 20% (Biorad), transferidos utilizando o Trans-Blot (Biorad) em membranas de PVDF de baixa fluorescência e bloqueados durante 1 hora em tampão de bloqueio Odyssey TBS. As membranas foram incubadas de um dia para o outro com os seguintes anticorpos: OC-HSD17B13
Petição 870190068171, de 18/07/2019, pág. 297/358
284 / 307 (Abgent, cat No. AP5729a 1:500); Marcador LD: oc-ADRP (Proteinatech, 152-94-1-AP, 1:2500); Marcador LD: 0C-TIP47 (Proteinatech, 10694 1:2000); marcador de lisossoma: oc-LAMPl (Novus, NBP2-25183, 1:1000); marcador citosólico: oc-GAPDH (Proteinatech, 60004-1-Ig, 1:2000); marcador de retículo endoplasmático: oc-calreticulina (Abeam, ab92516, 1:1000); marcador mitocondrial: oc-COX IV (Abeam, ab 33985, 1:500); marcador de citoesqueleto: oc-actina (Sigma, A5441, 1:4000). No dia seguinte as membranas foram lavadas 4 vezes com solução salina tamponada com Tris + Tween a 0,1%, depois incubadas durante 1 hora à temperatura ambiente com tampão de bloqueio contendo anticorpos secundários IRDye® oc-coelho (800CW) e oc-rato (680RD) (Li-Cor) às diluições de 1:5000 e 1:10000, respectivamente. Os géis foram lavados novamente com TBST e fotografados usando o Odyssey.
Quantificação do teor de triglicerídeos intracelulares [00460] O teor de triglicerídeos (TG) das células estáveis foi determinado utilizando um kit de quantificação TG (Abeam). No ensaio, os TG são convertidos em ácidos graxos livres e glicerol. O glicerol é então oxidado para gerar um produto que é quantificado (espectrofotometria a λ = 570 nm).
Rastreamento de Substrato de Bibliotecas Lipídicas de Esteroides e Bioativos Contra HSD17B13 Purificado Recombinante [00461] As reações foram realizadas em um volume final de 40 μί de tampão de ensaio (0,2 M Tris-HCl, pH 7,5) que continha 500 μΜ de NAD+, 5 μΜ de lipídio bioativo ou 50 μΜ de esteroide (tudo em uma concentração final de 5% de DMSO) e 100 ng de HSD17B13 humana recombinante. As reações foram incubadas durante 3 horas, a 23 °C, após o que foi adicionado um reagente de deteção NADH-Glo de igual volume (Promega). Após uma incubação de 1 hora a 23 °C, as unidades relativas de luz (RLUs) foram medidas em um Leitor de Placas Envision (Perkin Elmer). Valores RLU
Petição 870190068171, de 18/07/2019, pág. 298/358
285 / 307 foram normalizados como porcentagem de controle (50 μΜ estradiol) após subtração do controle negativo (5% DMSO) usando a seguinte fórmula: Porcentagem de controle (POC) = 100 x (Amostra (RLU) - CTRLmédio Negativo)/(CTRLmédio Positivo - CTRLmédio negativo).
Caracterização in vitro e celular da atividade enzimática de HSD17B13 [00462] A proteína de HSD17B13 humana recombinante foi purificada a partir de E. coli (Genscript) transformada com DNA de plasmídeo contendo a transcrição A ou a transcrição D de HSD17B13. As variantes de HSD17B13 continham uma etiqueta lOxHis no terminal C e foram purificadas a partir da fração solúvel utilizando uma purificação por afinidade de Ni2+ . A atividade enzimática foi determinada através da medição da produção de NADH usando o sistema de detecção NAD(P)H-Glo (Promega). As reações foram realizadas durante 3 horas a 25 °C em 0,2 M de Tris-HCl, pH 7,5, 0,5 mM de NAD+, 75 μΜ de substrato (Sigma) e 500 ng de enzima purificada em um volume final de 100 μΕ. Após incubação, 20 μΕ da reação foram combinados com 20 μΕ de reagente luciferase (Promega), incubados à temperatura ambiente durante 1 hora e lidos em um leitor de placas Envision (Perkin Elmer).
[00463] Células HEK293 sobre-expressando a transcrição A, a transcrição D de HSD17B13 ou proteína fluorescente verde (GFP, controle) foram usadas para investigar a atividade de HSD17B13 contra o estradiol em um ensaio baseado em células. Estradiol (1 μΜ) foi alimentado a cada tipo de célula. Após 48 horas, os meios foram coletados e a concentração de estradiol e seu produto convertido, estrona, foram identificados e quantificados por LCMS.
Associação de variantes exônicas com aspartato e alanina aminotransferases [00464] Foram testadas 502.219 variantes genéticas únicas bialélicas para associação com níveis séricos de ALT ou AST em 46.544 indivíduos de ascendência europeia do estudo DiscovEHR (“coorte de descoberta de GHS”;
Petição 870190068171, de 18/07/2019, pág. 299/358
286 / 307 dados demográficos básicos na Tabela 6). Um total de 35 variantes em 19 genes foi encontrado para ser associado com ALT ou AST em P < 1,0 x IO'7 (Figuras 1A e 1B, e Tabela 7). Foram realizados estudos de replicação em três coortes de indivíduos de ascendência europeia: 1) pacientes de cirurgia bariátrica (n = 2.644) de DiscovEHR (“coorte de cirurgia bariátrica do GHS”); 2) 1.357 indivíduos do Estudo do Dallas Heart; e 3) 8.526 indivíduos do Pennbank Bio Medicine. Na meta-análise das coortes de replicação, treze variantes em nove genes foram significativamente associadas aos níveis séricos de ALT ou AST (limite de significância de Bonferroni de P < 1,43 x 10'3 para 35 variantes testadas, Tabela 8). Estes incluíram variantes que foram previamente relatadas como estando associadas a níveis elevados de transaminases, tais como PNPLA37, TM6SF211, SERPINA122, SAMM5023 e ERLIN124. SERPINA1 codifica alfa-l-antitripsina, cuja deficiência funcional causa doença do fígado; a associação com SAMM50 é mediada via desequilíbrio de ligação com variação no PNPLA3, e ERLIN1 tem sido implicado na deposição de gordura no fígado. Também foram identificadas variantes que não foram relatadas anteriormente como associadas à doença do fígado. Estes incluíram várias variantes em GPT e GOT1, os genes que codificam ALT e AST, respectivamente, e SLC39A12, que codifica a família de portadores de soluto 39 membros 12.
[00465] Também foi identificada uma associação reprodutível entre uma variante em HSD17B13, o gene que codifica 17-beta hidroxiesteroide desidrogenase 13, um membro não caracterizado da família de 17-beta hidroxiesteroide desidrogenase, e diminuição dos níveis de ALT (descoberta P = 4,2 x IO'12, replicação P = 1,7 x IO4) e AST (descoberta P = 6,2 x IO'10, replicação P = 1,7 x IO-4, Tabela 8). A variante associada, rs72613567, é uma inserção de uma adenina adjacente ao local de entrelaçamento do doador do éxon seis (alelo TA) e teve uma frequência de alelos de 26,0% na coorte de descoberta do GHS. Anteriormente, Chambers et al. identificou um locus
Petição 870190068171, de 18/07/2019, pág. 300/358
287 / 307 próximo em 4q22 (rs6834314) associado a níveis de ALT (Chambers et al., Nat. Genet., 2011, 43, 1131 a 1138, doi: 10.1038/ng.970, aqui incorporado por referência na sua totalidade para todos os efeitos); rs72613567 não foi relatado até agora como estando associado aos níveis de transaminase. HSD17B13 é 30 kb a montante de HSD17B11, outro membro da mesma família de genes. Não foram observadas associações significativas entre o exoma entre as variantes de codificação ou de entrelaçamento nos níveis de HSD17B11 e transaminases na coorte de descoberta (Figs. 5A e 5B) ou na meta-análise conjunta da coorte de descoberta e três coortes de replicação. Além disso, o desequilíbrio de ligação de rs72613567 com variantes em HSD17B11 foi modesto em todos os grupos de ancestralidade (r2 < 0,4 com todas as variantes determinadas em HSD17B11 em todos os grupos de ancestralidade). Coletivamente, esses achados sugerem HSD17B13 como o gene na região genômica que é mais provável que seja funcionalmente relacionado aos níveis de transaminases.
Tabela 6. Características demográficas e clínicas de indivíduos com ascendência europeia sequenciados das coortes de descoberta e replicação.
Característica Coorte de descoberta (N = 46,544) Coorte de cirurgia bariátrica (N = 2,644) Estudo do Dallas Heart (Ν = 1,357) Penn Medicine Biobank (N = 8,526)
Idade (anos) - mediano (IQR) 52,9 (49,6 - 73,8) 52,9 (44,1 -61,2) 46,0 (38,0 - 54,0) 68,0 (60,0 - 76,0)
Sexo feminino - número (%) 26.875 (57,7) 2.119(80,1) 724 (53,4) 3.242 (38,0)
índice de massa corporal mediano (IQR) 29,9 (35,4 - 44,8) 47.4 (42.0 - 53.7) 28 (25-32) 30 (25-32)
Nível de Transaminase (U/L) - mediano (IQR)
Alanina aminotransferase (ALT) 22,0(17,0-29,0) 23,0(17,5 -29,5) 20,0(15,0 - 27,0) 22,0(17,0 - 30,0)
Aspartato aminotransferase (AST) 23,0 (20,0 - 27,5) 23,0 (20,0 - 27,0) 21,0(18,0-25,0) 24,0 (20,0 - 30,5)
Presença de doença do fígado (by ICD-9 code) - Ν (%)
Doença do fígado alcoólica 197 (0,4) 7(0,3)
Cirrose alcoólica 130 (0,3) 3(0,1)
Doença do fígado não viral, não alcoólica 1.938 (4,2) 1.543 (58,4)
Cirrose não alcoólica 382 (0,8) 24 (0,9)
Carcinoma hepatocelular 76 (0,2) 1 (0,04)
Sem doença do fígado 30.628 (65,8) 1 (0,04)
Tabela 7. Variantes de nucleotídeo único associadas aos níveis de
Petição 870190068171, de 18/07/2019, pág. 301/358
288 / 307 transaminase sérica em P < 1,0 x 107 na coorte de descoberta.
Traço CHR BP REF ALT rsID Gene Anotação Substituição de AA Beta (SE)
ALT >—1 220970028 O rs2642438 MARC1 troca do sentido p.Thrl65Ala 0,008 (0,001)
ri- 88231392 H *rs72613567 HSD17B13 doador de entrelaçamento -0,009 (0,001)
00 144997604 U rs371119003 PLEC troca do sentido p.Ala2302Thr -0,160 (0,026)
00 145008502 O PLEC troca do sentido p.Arg522Cys -0,268 (0,032)
00 145692918 o rs35968570 KIFC2 troca do sentido p.Glul74Lys -0,033 (0,005)
00 145730072 o rsl43408057 GPT troca do sentido p.Arg83His -0,314 (0,036)
00 145730161 u rs201815297 GPT troca do sentido p.Ala87Val -0,224 (0,014)
00 145730221 o rsl 12574791 GPT troca do sentido p.ArglO7Lys -0,033 (0,005)
00 145731636 O rsl45155876 GPT terminação adquirida p.Tyr326* -0,235 (0,031)
00 145732114 o U rsl41505249 GPT troca do sentido p.Glu430Gln -0,224 (0,013)
00 145732151 o rsl43462595 GPT troca do sentido p.Arg442His -0,077 (0,013)
00 145732180 o U rsl47998249 GPT troca do sentido p.Va!452Leu -0,225 (0,013)
00 145732305 o U o GPT mudança de quadro p.Glu475fs -0,271 (0,031)
00 145748532 o rs567402720 LRRC24 troca do sentido p.Leu290Ser -0,185 (0,028)
O\ 117122202 u rs3748177 AKNA sinônimo p.Glu755Glu -0,007 (0,001)
O\ 117124731 o rs3748176 AKNA troca do sentido p.Pro624Leu -0,007 (0,001)
o 101595996 H rsl7222723 ABCC2 troca do sentido p.Va!1188Glu -0,015 (0,003)
o 101606861 o rsl 137968 ABCC2 sinônimo p.Va!1430Val -0,015 (0,003)
o 101610533 u rs8187707 ABCC2 sinônimo p.Hisl496His -0,015 (0,003)
o 101611294 o rs8187710 ABCC2 troca do sentido p.Cysl515Tyr -0,015 (0,003)
o 101912064 H U *rs2862954 ERLIN1 troca do sentido p.Ile291Val -0,012 (0,001)
o 101977883 u rs2230804 CHUK troca do sentido p.Va!268Ile -0,009 (0,001)
o 113917085 H rs2254537 GPAM sinônimo p.Pro681Pro -0,008 (0,001)
o 113940329 H U rs2792751 GPAM troca do sentido p.Ile43Val -0,008 (0,001)
>—1 94844947 u H *rs28929474 SERPINA1 troca do sentido p.Glu366Lys 0,042 (0,005)
O\ 19379549 u H *rs58542926 TM6SF2 troca do sentido p.Glul67Lys 0,014 (0,002)
ri ri 44324727 u O *rs738409 PNPLA3 troca do sentido p.Ilel48Met 0,023 (0,002)
ri ri 44324730 u H *rs738408 PNPLA3 Sinônimo p.Prol49Pro 0,023 (0,002)
ri ri 44342116 O rs2294918 PNPLA3 troca do sentido p.Lys434Glu 0,007 (0,001)
ri ri 44368122 O *rs3761472 SAMM50 troca do sentido p.AspllOGly 0,019 (0,002)
ri ri 44395451 U *rsl007863 PARVB troca do sentido p.Trp37Arg 0,011 (0,001)
AST 88231392 H *rs72613567 HSD17B13 doador de entrelaçamento -0,005 (0,001)
O 18242311 O rsl0764176 SLC39A12 troca do sentido p.Ser36Gly -0,006 (0,001)
o 101157378 Ο H U G0T1 inframe indel p.Asn389del -0,221 (0,024)
o 101165533 o U rs374966349 G0T1 troca do sentido p.Gln208Glu 0,271 (0,027)
o >—1 101912064 U *rs2862954 ERLIN1 troca do sentido p.Ile291Val -0,005 (0,001)
22271870 H rs7481951 AN05 troca do sentido p.Leu322Phe 0,004 (0,001)
94844947 U H *rs28929474 SERPINA1 troca do sentido p.Glu366Lys 0,027 (0,003)
O\ 19379549 U H *rs58542926 TM6SF2 troca do sentido p.Glul67Lys 0,008 (0,002)
ri ri 44324727 U O *rs738409 PNPLA3 troca do sentido p.Ilel48Met 0,014 (0,001)
ri ri 44324730 U H *rs738408 PNPLA3 Sinônimo p.Prol49Pro 0,014 (0,001)
ri ri 44368122 O *rs3761472 SAMM50 troca do sentido p.AspllOGly 0,011 (0,001)
ri ri 44395451 U *rs!007863 PARVB troca do sentido p.Trp37Arg 0,006 (0,001)
Petição 870190068171, de 18/07/2019, pág. 302/358
289 / 307
Table 7 (cont.)
N Nível médio de AST ouALT(U/L)
Traço tá K o BP W a H J C P AAF N REF/ REF REF/ ALT ALT/ ALT REF/ REF REF/ ALT ALT/ ALT
ALT >—1 220970028 O 4,67E-08 0,7067 41.414 3.515 17.262 20.637 23,88 24,52 24,92
ri- 88231392 H H < 4,16E-12 0,2634 41.414 22.441 16.130 2.843 25,02 24,26 24,1
OO 144997604 U H L30E-09 0,0005 41.413 41.373 40 0 24,67 18,1 ΝΑ
00 145008502 O 3,26E-17 0,0003 41.414 41.387 27 0 24,67 13,8 ΝΑ
OO 145692918 o l,40E-ll 0,0139 41.414 40.271 1.133 10 24,67 12,07 ΝΑ
OO 145730072 o 3,28E-18 0,0003 41.414 41.393 21 0 24,67 12,07 ΝΑ
OO 145730161 u 6,28E-59 0,0018 41.414 41.270 144 0 24,7 14,68 ΝΑ
OO 145730221 o 4,25E-11 0,0136 41.414 40.293 1.111 10 24,71 23,09 18,35
OO 145731636 H O 1,76E-14 0,0004 41.394 41.364 30 0 24,67 14,07 ΝΑ
OO 145732114 o U 8,84E-64 0,0019 41.375 41.223 150 2 24,7 14,48 13,75
00 145732151 o L18E-09 0,0021 41.406 41.232 174 0 24,68 20,87 ΝΑ
00 145732180 o U 8,19E-65 0,0019 41.413 41.254 159 0 24,7 14,74 ΝΑ
00 145732305 o 3 í- Ι,ΟΟΕ-18 0,0004 41.414 41.385 29 0 24,67 14,24 ΝΑ
00 145748532 O 3,42E-11 0,0004 41.393 41.358 35 0 24,67 17,71 ΝΑ
O\ 117122202 u H 9,51E-09 0,5232 41.414 9.414 20.645 11.355 25,12 24,72 24,18
O\ 117124731 o 4,31E-09 0,5230 41.412 9.427 20.634 11.351 25,12 24,73 24,17
o 101595996 H 2,97E-08 0,0608 41.414 36.543 4.704 167 24,77 23,97 22,12
o 101606861 o 2,71E-08 0,0608 41.414 36.543 4.704 167 24,77 23,97 22,04
o 101610533 u 2,77E-08 0,0608 41.414 36.542 4.706 166 24,77 23,97 22,03
o 101611294 o 2,15E-08 0,0611 41.414 36.519 4.726 169 24,77 23,97 21,99
o 101912064 H U 2,43E-21 0,4755 41.414 11.318 20.819 9.277 25,32 24,71 23,77
o 101977883 u L93E-13 0,5072 41.414 10.048 20.733 10.633 25,18 24,75 24,01
o 113917085 H 4,61E-10 0,7073 41.414 3.627 16.984 20.803 25 24,97 24,36
o 113940329 H U 2,54E-10 0,7097 41.412 3.567 16.910 20.935 25 24,98 24,35
94844947 u H 9,28E-21 0,0171 41.414 40.006 1.399 9 24,58 26,91 43,89
O\ 19379549 u H 4,76E-09 0,0759 41.413 35.388 5.780 245 24,52 25,46 26,84
ΓΊ ΓΊ 44324727 u O L34E-50 0,2351 41.414 24.257 14.837 2.320 24,06 24,99 28,91
ΓΊ ΓΊ 44324730 u H 1,11E-5O 0,2349 41.414 24.273 14.824 2.317 24,06 24,98 28,92
ΓΊ ΓΊ 44342116 O 8,26E-08 0,5986 41.412 6.691 19.833 14.888 24,15 24,47 25,15
ΓΊ ΓΊ 44368122 O 8,85E-30 0,1682 41.413 28.626 11.618 1.169 24,23 25,36 28,45
ΓΊ ΓΊ 44395451 U 7,98E-16 0,3963 41.414 15.036 19.920 6.458 24,15 24,6 26,09
AST ri- 88231392 H < 6,24E-10 0,2638 40.753 22.068 15.870 2.815 24,47 24,1 23,96
O 18242311 O L09E-10 0,2881 40.753 20.645 16.738 3.370 24,47 24,15 23,85
O 101157378 □ í- u L96E-20 0,0002 40.753 40.733 20 0 24,29 14,7 ΝΑ
o 101165533 o u 2,43E-24 0,0002 40.753 40.736 17 0 24,28 44,5 ΝΑ
o >—1 101912064 u 4,82E-09 0,4754 40.753 11.138 20.486 9.129 24,59 24,26 23,99
22271870 H 9,61E-08 0,5833 40.722 7.123 19.686 13.913 24,03 24,22 24,53
94844947 u H 2,44E-20 0,0172 40.753 39.361 1.384 8 24,24 25,76 34,5
O\ 19379549 u H 6,54E-08 0,0760 40.752 34.811 5.698 243 24,21 24,74 25,43
ΓΊ ΓΊ 44324727 u O 8,31E-46 0,2343 40.753 23.889 14.622 2.242 23,96 24,48 26,62
ΓΊ ΓΊ 44324730 u H 8,93E-46 0,2341 40.753 23.905 14.609 2.239 23,96 24,47 26,63
ΓΊ ΓΊ 44368122 O L22E-22 0,1680 40.752 28.170 11.450 1.132 24,07 24,64 26,24
ΓΊ ΓΊ 44395451 U L31E-13 0,3961 40.753 14.761 19.678 6.314 24,02 24,23 25,1
* Indica variantes que possuem associações significativas em todo o exoma com ALT e AST.
Abreviaturas: AAF, frequência do alelo alternativo; Alt, alelo alternativo; ALT, alanina aminotransferase; AST, aspartato aminotransferase; Ref, alelo de referência; SE, erro padrão.
Petição 870190068171, de 18/07/2019, pág. 303/358
290 / 307
Tabela 8. Replicação e meta-análise conjunta de 35 variantes de nucleotídeo único de todo exoma da coorte de descoberta em três coortes de ancestralidade europeia separadas.
GHS Coorte de descoberta
Traço X O BP % RSID Gene s s Substituição de AA Beta (SE) P N
ALT >—1 220970028 o rs2642438 MARC1 CZD s p.Thrl65Ala 0,008 (0,001) 4,67E- 08 41.414
ri- 88231392 H rs72613567 HSD17B13 K CZD -0,009 (0,001) 4,16E- 12 41.414
OO 144997604 U rs371119003 PLEC CZD s p.Ala2302Thr -0,160 (0,026) l,30E- 09 41.413
00 145008502 O PLEC CZD s p.Arg522Cys -0,268 (0,032) 3,26E- 17 41.414
OO 145692918 O rs35968570 KIFC2 CZD s p.Glul74Lys -0,033 (0,005) l,40E- 11 41.414
OO 145730072 o rsl43408057 GPT CZD s p.Arg83His -0,314 (0,036) 3,28E- 18 41.414
OO 145730161 u rs201815297 GPT CZD s p.Ala87Val -0,224 (0,014) 6,28E- 59 41.414
OO 145730221 o rsl 12574791 GPT CZD s p.ArglO7Lys -0,033 (0,005) 4,25E- 11 41.414
00 145731636 H O rsl45155876 GPT CL o CZD p.Tyr326* -0,235 (0,031) 1,76E- 14 41.394
00 145732114 o u rsl41505249 GPT CZD s p.Glu430Gln -0,224 (0,013) 8,84E- 64 41.375
00 145732151 o rsl43462595 GPT CZD s p.Arg442His -0,077 (0,013) 1,18E- 09 41.406
00 145732180 o u rsl47998249 GPT CZD s p.Va!452Leu -0,225 (0,013) 8,19E- 65 41.413
00 145732305 o u o GPT p.Glu475fs -0,271 (0,031) l,00E- 18 41.414
00 145748532 o rs567402720 LRRC24 s p.Leu290Ser -0,185 (0,028) 3,42E- 11 41.393
O\ 117122202 u rs3748177 AKNA c CZD p.Glu755Glu -0,007 (0,001) 9,51E- 09 41.414
O\ 117124731 o rs3748176 AKNA CZD s p.Pro624Leu -0,007 (0,001) 4,31E- 09 41.412
o >—1 101595996 H rs 17222723 ABCC2 CZD s p.Va!1188Glu -0,015 (0,003) 2,97E- 08 41.414
o >—1 101606861 o rs 1137968 ABCC2 c CZD p.Va!1430Val -0,015 (0,003) 2,71E- 08 41.414
o >—1 101610533 u rs8187707 ABCC2 C CZD p.Hisl496His -0,015 (0,003) 2,77E- 08 41.414
o >—1 101611294 o rs8187710 ABCC2 CZD s p.Cysl515Tyr -0,015 (0,003) 2,15E- 08 41.414
o >—1 101912064 H U rs2862954 ERLIN1 CZD s p.Ile291Val -0,012 (0,001) 2,43E- 21 40.834
O >—1 101977883 u rs2230804 CHUK CZD s p.Va!268Ile -0,009 (0,001) 1,93E- 13 41.414
O >—1 113917085 H rs2254537 GPAM c CZD p.Pro681Pro -0,008 (0,001) 4,61E- 10 41.414
O >—1 113940329 H U rs2792751 GPAM CZD s p.Ile43Val -0,008 (0,001) 2,54E- 10 41.412
>—1 94844947 u H rs28929474 SERPINA1 CZD s p.Glu366Lys 0,042 (0,005) 9,28E- 21 41.414
O\ >—1 19379549 u H rs5 8542926 TM6SF2 CZD s p.Glul67Lys 0,014 (0,002) 4,76E- 09 41.413
Petição 870190068171, de 18/07/2019, pág. 304/358
291/307
GHS Coorte de descoberta
Traço X Ο BP % + RSID Gene s s Substituição de AA Beta (SE) P N
ri ri 44324727 u O rs738409 PNPLA3 CZD s p.Ilel48Met 0,023 (0,002) 1,34E- 50 41.414
ri ri 44324730 u H rs738408 PNPLA3 c CZD p.Prol49Pro 0,023 (0,002) 1,11E- 50 41.414
ri ri 44342116 O rs2294918 PNPLA3 CZD s p.Lys434Glu 0,007 (0,001) 8,26E- 08 41.412
ri ri 44368122 o rs3761472 SAMM50 CZD s p.AspllOGly 0,019 (0,002) 8,85E- 30 41.413
ri ri 44395451 u rsl007863 PARVB CZD s p.Trp37Arg 0,011 (0,001) 7,98E- 16 41.414
AST 88231392 H rs72613567 HSD17B13 K CZD -0,005 (0,001) 6,24E- 10 40.753
O >—1 18242311 O rs 10764176 SLC39A12 CZD s p.Ser36Gly -0,006 (0,001) l,09E- 10 40.753
o >—1 101157378 H Ο H U U G0T1 <0 p.Asn389del -0,221 (0,024) 1,96E- 20 40.753
o >—1 101165533 o U rs374966349 G0T1 CZD s p.Gln208Glu 0,271 (0,027) 2,43E- 24 40.753
o >—1 101912064 u rs2862954 ERLIN1 CZD s p.Ile291Val -0,005 (0,001) 4,82E- 09 40.753
>—1 22271870 H rs7481951 AN05 CZD s p.Leu322Phe 0,004 (0,001) 9,61E- 08 40.722
>—1 94844947 U H rs28929474 SERPINA1 CZD s p.Glu366Lys 0.027 (0,003) 2,44E- 20 40.753
O\ >—1 19379549 U H rs5 8542926 TM6SF2 CZD s p.Glul67Lys 0,008 (0,002) 6,54E- 08 40.192
ri ri 44324727 U O rs738409 PNPLA3 CZD s p.Ilel48Met 0,014 (0,001) 8,31E- 46 40.753
ri ri 44324730 U H rs738408 PNPLA3 c CZD p.Prol49Pro 0,014 (0,001) 8,93E- 46 40.753
ri ri 44368122 O rs3761472 SAMM50 CZD s p.AspllOGly 0,011 (0,001) 1,22E- 22 40.752
ri ri 44395451 U rsl007863 PARVB s p.Trp37Arg 0,006 (0,001) 1,31E- 13 40.753
Table 8 (cont.)
GHS Coorte de cirurgia bariátrica Estudo do Dallas Heart U. Penn
Traço X O BP Beta (SE) P N Beta (SE) P N Beta (SE) P N
ALT >—1 220970028 0,005 (0,005) 3J0E-01 2475 0,011 (0,008) l,76E-01 1357 0,007 (0,004) l,02E-01 6158
ri- 88231392 -0,010 (0,005) 5,57E-02 2475 -0,016 (0,008) 6,60E-02 1357 -0,013 (0,004) 1,33E-O3 6158
OO 144997604 -0,492 (0,165) 2,84E-03 2475 NA (NA) NA NA -0,051 (0,072) 4,79E-01 6158
00 145008502 -0,161 (0,165) 3,29E-01 2475 NA (NA) NA NA -0,247 (0,143) 8,48E-02 6158
OO 145692918 -0,009 (0,020) 6,48E-01 2475 0,032 (0,036) 3,76E-01 1356 -0,053 (0,018) 3,72E-03 6158
OO 145730072 -0,189 (0,165) 2,50E-01 2475 NA (NA) NA NA -0,298(0,101) 3,26E-03 6158
OO 145730161 -0,341 (0,074) 3,64E-06 2475 NA (NA) NA NA -0,143 (0,054) 8,50E-03 6158
OO 145730221 -0,009 (0,020) 6,45E-01 2475 0,028 (0,036) 4,37E-01 1357 -0,060 (0,018) 5,60E-04 6158
OO 145731636 -0,314 (0,165) 5,71E-02 2475 -0,317 (0,140) 2,35E-02 1356 -0,148 (0,143) 3,04E-01 6157
Petição 870190068171, de 18/07/2019, pág. 305/358
292 / 307
GHS Coorte de cirurgia bariátrica Estudo do Dallas Heart U. Penn
Traço X Ο BP Beta (SE) P N Beta (SE) Ρ Ν Beta (SE) Ρ Ν
00 145732114 -0,273 (0,048) 9,83E-09 2474 -0,240 (0,075) 1,36Ε-03 1357 -0,197 (0,041) 1,31Ε-06 6157
00 145732151 -0,115 (0,058) 4,82E-02 2475 -0,106 (0,099) 2,86Ε-01 1356 -0,049 (0,041) 2,27Ε-01 6157
00 145732180 -0,273 (0,050) 4,26E-08 2475 -0,191 (0,070) 6,58Ε-03 1357 -0,197 (0,041) 1,31Ε-06 6158
00 145732305 -0,161 (0,165) 3,29E-01 2475 ΝΑ (ΝΑ) ΝΑ ΝΑ -0,509 (0,203) 1,21Ε-02 6158
00 145748532 -0,161 (0,165) 3,29E-01 2475 ΝΑ (ΝΑ) ΝΑ ΝΑ -0,307 (0,143) 3,21Ε-02 6158
CN 117122202 -0,004 (0,005) 4,09E-01 2475 0,004 (0,008) 648Ε-01 1357 -0,007 (0,004) 5,29Ε-02 6158
CN 117124731 -0,004 (0,005) 3,90E-01 2475 0,003 (0.008) 7,33Ε-01 1356 -0,007 (0,004) 4,24Ε-02 6158
O >—1 101595996 -0,002 (0,010) 8,01E-01 2475 -0,007 (0,017) 6,88Ε-01 1357 -0,017 (0,007) 1,55Ε-02 6158
O >—1 101606861 -0,003 (0,010) 7,74E-01 2475 -0,008 (0,017) 6,28Ε-01 1357 -0,017 (0,007) 1,70Ε-02 6158
O >—1 101610533 -0,003 (0,010) 7,93E-01 2475 -0,008 (0,017) 6,28Ε-01 1357 -0,017 (0,007) 1,76Ε-02 6158
O >—1 101611294 -0,001 (0,010) 9,11E-O1 2475 -0,010 (0,017) 5,40Ε-01 1357 -0,016 (0,007) 2,77Ε-02 6158
O >—1 101912064 -0,010 (0,005) 2,91E-02 2475 -0,006 (0,007) 4,02Ε-01 1356 -0,009 (0,004) 2,06Ε-02 6158
O >—1 101977883 -0,006 (0,005) 2,05E-01 2475 0,0001 (0,008) 9,94Ε-01 1357 -0,011 (0,004) 3,91Ε-03 6158
O >—1 113917085 -0,003 (0,005) 5,80E-01 2475 -0,013 (0,008) 1,15Ε-01 1357 -0,008 (0,004) 542Ε-02 6158
O >—1 113940329 -0,003 (0,005) 5,61E-01 2475 -0,013 (0,008) 1,33Ε-Ο1 1357 -0,008 (0,004) 4,77Ε-02 6158
94844947 0,035 (0,020) 7,97E-02 2475 0,034 (0,032) 2,92Ε-01 1357 0,054 (0,013) 1,63Ε-05 6158
CN 19379549 0,040 (0,010) 2,40E-05 2475 0,024 (0,014) 9,50Ε-02 1357 0,013 (0,008) 7,51Ε-02 6158
OI OI 44324727 0,019 (0,006) 5,54E-04 2475 0,006 (0,009) 5,43Ε-01 1357 0,016 (0,004) 2,05Ε-04 6158
OI OI 44324730 0,019 (0,006) 5,51E-04 2475 0,006 (0,009) 5,43Ε-01 1357 0,016 (0,004) 244Ε-04 6158
OI OI 44342116 0,001 (0,005) 7,77E-01 2475 0,005 (0,008) 5,18Ε-01 1357 0,005 (0,004) 246Ε-01 6158
OI OI 44368122 0,009 (0,006) l,66E-01 2475 -0,001 (0,01) 9,37Ε-01 1357 0,018 (0,005) 4,02Ε-04 6158
OI OI 44395451 0,003 (0,005) 5,22E-01 2475 0,008 (0,008) 3,13Ε-01 1357 0,009 (0,004) 2,50Ε-02 6158
AST •rf- 88231392 -0,010 (0,003) 3,12E-03 2469 -0,012 (0,006) 5,32Ε-02 1357 -0,007 (0,004) 5,56Ε-02 6166
o >—1 18242311 -0,010 (0,003) 2,91E-03 2469 -0,003 (0,006) 5,80Ε-01 1357 -0,009 (0,004) 1,03Ε-02 6166
o >—1 101157378 -0,205 (0,062) 8,57E-04 2469 ΝΑ (ΝΑ) ΝΑ ΝΑ -0,243 (0,088) 5,97Ε-03 6165
o >—1 101165533 NA (NA) NA NA ΝΑ (ΝΑ) ΝΑ ΝΑ 0,339 (0,079) 1,85Ε-05 6166
o >—1 101912064 -0,004 (0,003) l,54E-01 2469 -0,007 (0,006) 2,21Ε-01 1357 -0,004 (0,003) 1,94Ε-01 6166
>—1 22271870 -0,001 (0,003) 7,85E-01 2466 0,006 (0,006) 2,85Ε-01 1357 -0,002 (0,003) 5,46Ε-01 6165
94844947 0,023 (0,013) 7,79E-02 2469 0,044 (0,024) 6,98Ε-02 1357 0,055 (0,011) 4,01Ε-07 6166
CN 19379549 0,023 (0,006) l,99E-04 2469 0,010(0,011) 3,42Ε-01 1356 0,004 (0,007) 5,94Ε-01 6166
OI OI 44324727 0,014 (0,004) l,27E-04 2469 0,004 (0,007) 5,44Ε-01 1357 0,015 (0,004) 4,87Ε-05 6166
OI OI 44324730 0,014 (0,004) l,32E-04 2469 0,004 (0,007) 5,44Ε-01 1357 0,015 (0,004) 4,96Ε-05 6166
OI OI 44368122 0,008 (0,004) 6,03E-02 2469 -0,001 (0,008) 9,45Ε-01 1357 0,016 (0,004) 2,64Ε-04 6166
OI OI 44395451 0,003 (0,003) 4,12E-01 2469 0,006 (0,006) 2,95Ε-01 1357 0,009 (0,003) 647Ε-03 6166
Petição 870190068171, de 18/07/2019, pág. 306/358
293 / 307
Table 8 (cont.)
**Meta-análise de replicação (N=3) ***Meta-análise conjunta (N = 4)
Traço Chr BP Beta (SE) P Beta (SE) P
ALT >—1 220970028 0,007 (0,003) 2,31E-02 0,008 (0,001) 3,38E-09
ri- 88231392 -0,013 (0,003) *3,85E-05 -0,010 (0,001) 1J7E-15
00 144997604 -0,121 (0,066) 6,56E-02 -0,155 (0,025) 2,68E-10
00 145008502 -0,210 (0,108) 5,23E-02 -0,264 (0,031) 5,54E-18
00 145692918 -0,025 (0,013) 4,69E-02 -0,032 (0,005) 2,25E-12
00 145730072 -0,268 (0,086) L88E-03 -0,308 (0,033) 2,79E-20
00 145730161 -0,213 (0,044) *l,14E-06 -0,223 (0,013) 4,49E-64
00 145730221 -0,031 (0,013) L36E-02 -0,033 (0,005) L92E-12
00 145731636 -0,256 (0,086) 2,79E-03 -0,237 (0,029) L94E-16
00 145732114 -0,231 (0,029) *7,24E-16 -0,225 (0,012) 6,06E-78
00 145732151 -0,074 (0,032) L88E-02 -0,076 (0,012) 7,03E-ll
00 145732180 -0,221 (0,029) *1,41E-14 -0,224 (0,012) L04E-77
00 145732305 -0,299 (0,128) L93E-02 -0,273 (0,030) 6,44E-20
00 145748532 -0,244 (0,108) 2,40E-02 -0,189 (0,027) 2,93E-12
CN 117122202 -0,005 (0,003) 8,42E-02 -0,007 (0,001) 3,08E-09
CN 117124731 -0,005 (0,003) 6,15E-02 -0,007 (0,001) Ι,ΟΟΕ-09
o 101595996 -0,012 (0,005) 3,43E-02 -0,014 (0,002) 3,44E-09
o 101606861 -0,012 (0,005) 3,25E-02 -0,014 (0,002) 2,99E-09
o 101610533 -0,012 (0,005) 3,43E-02 -0,014 (0,002) 3,23E-09
o 101611294 -0,011 (0,005) 5,21E-02 -0,014 (0,002) 4,09E-09
o 101912064 -0,009 (0,003) *l,14E-03 -0,011 (0,001) L76E-23
o 101977883 -0,008 (0,003) 4,33E-03 -0,009 (0,001) 3,59E-15
o 113917085 -0,007 (0,003) 2,07E-02 -0,008 (0,001) 3,28E-11
o 113940329 -0,007 (0,003) 2,00E-02 -0,008 (0,001) L77E-11
>—1 94844947 0,047 (0,010) *2,82E-06 0,043 (0,004) L59E-25
CN 19379549 0,024 (0,006) *l,37E-05 0,016 (0,002) 1J5E-12
Cl Cl 44324727 0,016 (0,003) *7,45E-07 0,021 (0,001) 3,55E-55
Cl Cl 44324730 0,016 (0,003) *7,73E-07 0,021 (0,001) 3J0E-55
Cl Cl 44342116 0,004 (0,003) L91E-01 0,006 (0,001) 6,24E-08
Cl Cl 44368122 0,012 (0,004) *7,69E-04 0,018 (0,002) L08E-31
Cl Cl 44395451 0,007 (0,003) L78E-02 0,010 (0,001) 1J6E-16
AST ri- 88231392 -0,009 (0,002) *8,38E-05 -0,006 (0,001) 6,82E-13
o 18242311 -0,009 (0,002) *l,16E-04 -0,006 (0,001) Ι,ΙΟΕ-13
o 101157378 -0,218 (0,051) *l,66E-05 -0,220 (0,022) L68E-24
o 101165533 0,339 (0,079) *l,85E-05 0,278 (0,025) 3,25E-28
o >—1 101912064 -0,005 (0,002) 2,51E-02 -0,005 (0,001) 3,68E-10
22271870 0,000 (0,002) 8,43E-01 0,004 (0,001) 1J3E-06
>—1 94844947 0,042 (0,008) *9,54E-08 0,029 (0,003) 6,71E-26
CN 19379549 0,014 (0,004) *l,20E-03 0,009 (0,002) 5,92E-10
Cl Cl 44324727 0,013 (0,002) *5,51E-08 0,014 (0,001) 3J4E-52
Cl Cl 44324730 0,013 (0,002) *5,81E-08 0,014 (0,001) 3,55E-52
Cl Cl 44368122 0,010 (0,003) *3,40E-04 0,011 (0,001) L91E-25
Cl Cl 44395451 0,006 (0,002) 7,34E-03 0,006 (0,001) 3,62E-15
* Indica valores de P que atendem ao limite de significância de Bonferroni de P < 1,43 x 103.
** Meta-análise de replicação inclui as três coortes de replicação: GHS Coorte de cirurgia bariátrica, Estudo do Dallas Heart e Penn Medicine Biobank.
*** A meta-análise conjunta inclui a coorte de descoberta e as três coortes de replicação: GHS Coorte de Descobertas, GHS Coorte de Cirurgia Bariátrica, Estudo do Dallas Heart e Penn
Petição 870190068171, de 18/07/2019, pág. 307/358
294 / 307
Medicine Biobank.
Abreviaturas: AAF, frequência do alelo alternativo; Alt, alelo alternativo; ALT, alanina aminotransferase; AST, aspartato aminotransferase; Ref, alelo de referência; SE, erro padrão; ann, anotação; mis, troca do sentido; syn, sinônimo; spl, doador de entrelaçamento; stop, terminação adquirida; fs, mudança de quadro; inf, inframe indel.
Associação de variantes exônicas com diagnóstico clínico de doença do fígado crônica [00466] Em seguida, foi analisada a relação entre as treze variantes associadas à transaminase nos nove genes encontrados nas coortes de descoberta e replicação e doença do fígado crônica, incluindo doença do fígado alcoólica e não alcoólica (não viral), bem como as mais avançadas formas de doença do fígado crônica: cirrose alcoólica, cirrose não alcoólica e carcinoma hepatocelular (CHC). Usando um limite de significância de Bonferroni de P < 1,92 x 10'3 para as treze variantes testadas, foram encontradas associações significativas entre seis variantes em cinco genes (HSD17B13, SERPINA1, TM6SF2, PNPLA3 e SAMM50) e fenótipos de doença do fígado crônica (Tabela 9). As associações SERPINA1, TM6SF2, PNPLA3 e SAMM50 confirmam associações previamente relatadas. Na coorte de descoberta, HSD17B13, rs72613567:TA foi associado com menor probabilidade de todas as categorias derivadas de EHR de doença do fígado alcoólica e não alcoólica de maneira dependente de dose de alelo (Figura 2A): todas as categorias de doença do fígado alcoólica, razão de probabilidades heterozigótica (ORhet) (intervalo de confiança de 95%) 0,58 (0,42-0,80), OR homozigótico (ORhom) 0,47 (0,23-0,97), ORaiéiico (ORaiéiico) 0,62 (0,48-0,81), P = 1,8 x IO'4; todas as categorias de doença do fígado não alcoólica, ORhet 0,83 (0,75-0,92), ORhom 0,70 (0,57-0,87), ORaiéiico 0,84 (0,78-0,91), P = 1,3 x IO \ HSD17B13, rs72613567:TA também foi associado com menor probabilidade de cirrose alcoólica e não alcoólica, com probabilidades 42% e 73% mais baixas de cirrose alcoólica para heterozigotos e homozigotos, respectivamente
Petição 870190068171, de 18/07/2019, pág. 308/358
295 / 307 (ORhet 0,58 (0,39-0,86), ORhOm 0,27 (0,09-0,85), ORaiéiico: 0,56 (0,41-0,78), P = 3,4 x I O’4) e 26% e 49% de probabilidade de cirrose não alcoólica para heterozigotos e homozigotos, respectivamente (ORhet 0,74 (0,60-0,93), ORhom 0,51 (0,31-0,85), ORaiéiico 0,74 (0,62-0,88), P = 4,5 x IO’4). HSD17B13 rs72613567:TA também foi associado nominalmente com menores probabilidades de HCC.
[00467] Procurou-se confirmar e estender esses achados no estudo de Dallas Liver (DLS) e no estudo de Dallas Pediatric Liver (DPLS, Tabela 10) multi-étnico. No DLS, o alelo TA foi associado com menor probabilidade de qualquer doença do fígado de maneira dependente de dosagem de alelo (ORhet 0,74 (0,57-0,97), ORhOm0,41 (0,21-0,83), ORaiéiico 0,70 (0,5-0,88), P = 1,8 x 10'3, Fig. 8). Efeitos similares foram observados através dos subtipos de doença do fígado derivados do EHR, incluindo associações protetoras com doença do fígado na formas de cirrose avançadas alcoólica (ORaiéiico 0,72 (0,53-0,99), P = 4,4 x IO’2) e não alcoólica (ORaiéiico 0,65 (0,40-1,07), P = 9,0 x IO'2). Em análises de subgrupos de indivíduos agrupados por etnia auto relatada, a associação com doença do fígado foi significativa em hispanoamericanos (n = 326 casos e 722 controles, ORaiéiico 0,51 (0,35-0,74), P = 4,0 x IO'4); tendências numéricas semelhantes, que não alcançaram significância estatística, também foram observadas nos subconjuntos do DLS de afro-americano (n = 33 casos e 2.291 controles, ORaiéiico 0,74 (0,25-2,47), P = 0,67) e europeus-americanos (n = 158 casos e 1,266 controles, 0,87 orais (0,65-1,15), P = 0,32). No DPLS, um estudo separado de pacientes hispanoamericanos com doença do fígado pediátrica e controles obesos, o alelo TA também foi associado com menor probabilidade de doença do fígado (ORaiéiico 0,61 (0,37-0,99), P = 4,6 x IO’2). Assim, HSD17B13, rs72613567:TA foi associada com uma redução na probabilidade de múltiplas formas de doença do fígado crônica, incluindo cirrose, em adultos e crianças em três populações independentes.
Petição 870190068171, de 18/07/2019, pág. 309/358
296 / 307
Tabela 9. Associação de doze variantes de nucleotídeo único significativas e replicantes de todo o exoma com fenótipos de doença do fígado na coorte de descoberta.
CHR:BP:Ref:Alt Gene rsID Doença do fígado alcoólica Cirrose alcoólica
OR (95% Cl) Valor P OR (95% Cl) Valor P
4:88231392:T:TA HSD17B13 rs72613567 0,62 (0,48-0,81) *l,82E-04 0,56 (0,41-0,78) *3,35E-04
8:145730161:C:T GPT rs201815297 3,83 (1,05-13,94) 8,88E-02 6,33 (1,71-23,43) 2,88E-02
8:145732114:G:C GPT rsl41505249 0,77 (0,06-10,73) 8,43E-01 1,13 (0,08-15,39) 9,30E-01
8:145732180:G:C GPT rsl47998249 0,73 (0,05-11,76) 8,17E-01 1,07 (0,07-17,16) 9,60E-01
10:18242311:A:G SLC39A12 rs 10764176 0,85 (0,68-1,07) l,64E-01 0,92 (0,70-1,22) 5,80E-01
10:101157378:CGTT:C GOT1 4,60 (0,25-86,41) 3,93E-01 7,11 (0,38- 133,19) 3,00E-01
10:101165533:G:C GOT1 rs374966349 2,20 (0,13-37,68) 6,24E-01 3,47 (0,20 59,04) 4,70E-01
14:94844947:C:T SERPINA1 rs28929474 2,49 (1,49-4,17) 2,30E-03 3,35 (1,93-5,83) *3,01E-04
19:19379549:C:T TM6SF2 rs5 8542926 1,47 (1,06-2,04) 2,76E-02 1,35 (0,89-2,04) l,80E-01
22:44324727:C:G PNPLA3 rs738409 1,76 (1,43-2,18) *4,98E-07 2,07 (1,60-2,67) *l,08E-07
22:44324730:C:T PNPLA3 rs738408 1,77 (1,43-2,18) *4,70E-07 2,07 (1,61-2,67) *l,03E-07
22:44368122:A:G SAMM50 rs3761472 1,90 (1,52-2,38) *l,36E-07 2,28 (1,75-2,98) *l,83E-08
* Indica valores de P que atendem ao limite de significância de Bonferroni de P < 2,08 x IO-3.
Tabela 9 (cont.)
CHR:BP:Ref:Alt Gene rsID Doença do fígado não alcoólica Cirrose não alcoólica Carcinoma hepatocelular
OR (95% Cl) Valor P OR (95% Cl) Valor P OR (95% Cl) Valor P
4:88231392:T:TA HSD17B13 rs72613567 0,84 (0,78- 0,91) *1,31E05 0,74 (0,62-0,88) *4,48E04 0,67 (0,45-1,00) 4,66E-02
8:145730161:C:T GPT rs201815297 0,23 (0,041,14) 1,86E- 02 1,25 (0,24-6,38) 7,98E-01 3,66 (0,70-19,01) 2,01E-01
8:145732114:G:C GPT rsl41505249 1,02 (0,492,11) 9,70E- 01 0,36 (0,02-5,37) 3,82E-01 1,84 (0,15-23,25) 6,88E-01
8:145732180:G:C GPT rs 147998249 1,03 (0,492,17) 9,30E- 01 0,34 (0,02-5,59) 3,67E-01 1,74 (0,11-27,05) 7,21E-01
10:18242311:A:G SLC39A12 rsl0764176 0,92 (0,86 (0,99) 3,43E- 02 1,03 (0,88-1,21) 7,15E-01 1,29 (0,93-1,79) l,37E-01
10:101157378:CGTT:C GOT1 2,37 (0,619,27) 2,50E- 01 8,27 (1,4447,49) 5,92E-02 9,81 (0,52183,54) 2,43E-01
10:101165533:G:C GOT1 rs374966349 1,63 (0,53- 4,96) 4,20E- 01 1,17 (0,0720,09) 9,13E-01 5,37 (0,32-91,12) 3,55E-01
Petição 870190068171, de 18/07/2019, pág. 310/358
297 / 307
14:94844947:C:T SERPINA1 rs28929474 1,50 (1,211,87) *5,29E04 2,99 (2,11-4,24) *9,08E08 1,86 (0,74-4,67) 2,40E-01
19:19379549:C:T TM6SF2 rs5 8542926 1,36 (1,211,52) *2,42E07 1,64 (1,31-2,05) *6,04E05 1,93 (1,22-3,04) l,08E-02
22:44324727:C:G PNPLA3 rs738409 1,65 (1,541,78) *1,31E- 41 2,05 (1,76-2,38) *l,70E- 19 2,20 (1,60-3,02) *5,59E06
22:44324730:C:T PNPLA3 rs738408 1,65 (1,541,78) *1,42E- 41 2,05 (1,77-2,38) *1,45E- 19 2,20 (1,60-3,03) *5,41E06
22:44368122:A:G SAMM50 rs3761472 1,52 (1,411,65) *7,33E- 24 1,86 (1,58-2,19) *1,81E- 12 1,66 (1,16-2,39) l,05E-02
Tabela 10. Características demográficas e clínicas de casos multi-étnicos genotipados e controles de estudo do Dallas Liver e Pediatric Liver.
Característica Casos de estudo do Dallas Liver (N = 517) Controles de estudo do Dallas Liver (N = 4.279) Casos de estudo do Dallas Pediatric Liver (N = 203) Controles de estudo do Dallas Pediatric Liver (N = 244)
Idade (anos) - mediano (IQR) 55 (48 - 60) 44 (36 - 53) 12(10-15) 12(11 - 14)
Sexo feminino - número (%) 277 (54) 2.494 (58) 65 (32) 126 (52)
índice de massa corporal mediano (IQR) 30 (27 - 35) 30 (26 - 35) 30 (27 - 34) 31 (28 - 35)
Etinicidade auto reportada
Afro-americano 33 (6) 2.291 (54)
Europeu-americano 158 (31) 1.266 (30)
Hispanoamericano 326 (63) 722(17) 203 (100) 244 (100)
Presença de doença do fígado ( pelo códico ICD-9) - N (%)
Doença do fígado alcoólica 223 (43)
Cirrose alcoólica 215 (42)
Doença do fígado não viral, não alcoólica 212 (20)
Cirrose não alcoólica 100(19)
Carcinoma hepatocelular 44 (9)
Sem doença do fígado 4.279 (100) -244(100)
Associação de HSD17B13, rs72613567:TA com Patologia Hepática [00468] A DHGNA descreve um espectro de doença que vai do acúmulo de gordura hepática, sem evidência de inflamação significativa (esteatose simples), até NASH com maior impacto clínico. Para confirmar a associação entre os códigos diagnósticos da doença do fígado derivada de HSD17B13, rs72613567: A e EHR, e para entender melhor sua associação com a progressão histopatológica da esteatose para NASH, foram realizados testes de associação na coorte de cirurgia bariátrica do GHS. Nesta coorte de 2.391 indivíduos do total de exomas avaliados por biópsia hepática no momento da cirurgia bariátrica, um total de 555 (23%) indivíduos não
Petição 870190068171, de 18/07/2019, pág. 311/358
298 / 307 apresentava evidência de esteatose, esteato-hepatite ou fibrose (“normal”), 830 (35 %) tinha esteatose simples e 1006 (42%) tinham NASH. Ao comparar a prevalência de fígado normal, esteatose simples e EH por genótipo, observou-se que a prevalência de fígado normal não pareceu diferir pelo genótipo (23%, 24% e 23% para portadores de T/T, T/TA, e TA/TA, respectivamente, P = 0,5 pelo teste do qui-quadrado para tendência em proporções), mas que a prevalência de NASH diminuiu (45%, 40% e 31% para portadores de T/T, T/TA e TA/TA, respectivamente, P = 1,6 x IO'4) e de esteatose simples aumentaram (33%, 35% e 47% para portadores de T/T, T/TA e TA/TA, respectivamente, P = 1,1 x 10'3) com cada alelo TA (Fig. 9). Entre os indivíduos com esteatose, o alelo TA foi associado com estatisticamente significativamente menor a probabilidade de NASH e fibrose, em comparação com esteatose simples (ORaiéiico 0,77 (0,66-0,90), P =
6,5 x IO’4 para NASH; ORaiéiico 0,74 (0,62-0,88)), P = 4,15 χ I0-4 para fibrose, Fig. 2B), de maneira dependente de dose de alelo. Em conjunto, esses dados sugerem um papel para HSD17B13 na mediação da progressão da DHGNA de esteatose simples para estágios mais avançados de EHNA e fibrose.
Associação de HSD17B13, rs72613567:TA com traços e diagnósticos quantitativos clínicos [00469] Para examinar de forma mais abrangente as consequências clínicas da variante de entrelaçamento de HSD17B13, foi realizado um estudo de associações de HSD17B13, rs72613567:TA com 405 medições de antropometria quantitativa derivada de EHR, sinal vital, eletrocardiográfica, ecocardiográfica e densitometria óssea, e também com 3.168 diagnósticos clínicos derivados de EHR. Utilizando os limites de significância de Bonferroni de 1,23 χ I0-4 e 1,58 x 10'5 para associações com medidas clínicas quantitativas e diagnósticos clínicos, respectivamente, foram identificadas associações estatisticamente significantes do alelo HSD17B13, rs72613567: TA com maior contagem de plaquetas, além das associações com
Petição 870190068171, de 18/07/2019, pág. 312/358
299 / 307 transaminases hepáticas (Tabela 11). Não houve associações estatisticamente significativas com outros diagnósticos clínicos além da doença do fígado crônica (OR (IC95%) = 0,88 (0,84-0,93); P = 9,14 x IO’6; AAF = 0,263; N Total de casos = 4031, T/T = 2331, T/TA = 1449, TA/TA = 251, N Controles Total = 35701, T/T = 19238, T/TA = 13984, TA/TA = 2479).
Tabela 11. Estudo da Associação de Fenômenos de HSD17B13, rs72613567:TA com Medições Clínicas Quantitativas.
Fenótipo Efeito SE P AAF N
Total T/T T/TA TA/TA
Alanina Aminotransferase mediana:Ajustado(Log residual) -0.009 0.001 1.74E-12 0.264 44038 23868 17115 3055
Aspartato Aminotransferase mediana:AjustadoíLog residual) -0.006 0.001 2.75E-11 0.264 43370 23493 16851 3026
Alanina Aminotransferase max:Ajustado(Log residual) -0.013 0.002 1.39E-09 0.264 43905 23797 17065 3043
Aspartato Aminotransferase max:Ajustado(Log residual) -0.010 0.002 8.73E-09 0.264 42733 23145 16609 2979
Plaquetas mediana:Ajustado(Log residual) 0.004 0.001 1.44E-08 0.264 46182 25020 17944 3218
Alanina Aminotransferase min:Ajustado(Log residual) -0.008 0.002 2.47E-07 0.264 44029 23864 17111 3054
Plaquetas min:Ajustado(Residual) 1.919 0.443 1.47E-05 0.264 46181 25020 17943 3218
Plaquetas max:Ajustado(Log residual) 0.004 0.001 3.03E-05 0.264 46165 25014 17936 3215
Aspartato Aminotransferase min:Ajustado(Log residual) -0.004 0.001 5.00E-05 0.264 43327 23471 16831 3025
Negrito e itálico indicam Valor Ps atingindo o limite de significância de Bonferroni de P < 1,23 x IO-4.
Abreviaturas: AAF, frequência do alelo alternativo; SE, erro padrão.
Efeito de HSD17B13, rs72613567:TA na expressão de RNAm de HSD17B13 e proteína de HSD17B13 [00470] Em seguida, foi examinado o efeito do alelo de HSD17B13, rs72613567:TA na expressão de transcrições conhecidas e novas do gene. Utilizou-se sequenciamento de RNA para avaliar a expressão de RNAm de HSD17B13 em amostras de fígado histologicamente normais de portadores de 22 T/T homozigóticos, 30 T/TA heterozigóticos e 17 homozigóticos TA/TA da variante de entrelaçamento de HSD17B13, rs72613567. Além das duas transcrições de HSD17B13 conhecidas, A e B, duas novas transcrições foram identificados: transcrição C, sem o éxon 6, e transcrição D que continha uma inserção de um nucleotídeo guanina na extremidade 3' do éxon 6, que seria previsto para resultar em truncamento prematuro da proteína. Quatro transcrições adicionais (E a H) foram expressas em níveis muito baixos (Figs.
Petição 870190068171, de 18/07/2019, pág. 313/358
300 / 307
3A a 3D e 6A a 6D). As transcrições foram validados por RT-PCR e sequenciamento de Sanger. A transcrição D também foi validada usando sequenciamento de DNAc de leitura longa. O alinhamento da sequência proteica de todas as isoformas HSD17B13 identificadas (A a H) é mostrado nas Figuras 7A e 7B. Os níveis de expressão destas transcrições variaram de acordo com o genótipo de HSD17B13, rs72613567; os níveis das transcrições A e B diminuíram, enquanto os das transcrições C e D aumentaram de um modo dependente de dosagem de alelos com cada alelo de TA (Figs. 3A a3D). A transcrição A, que codifica a proteína de 300 aminoácidos de comprimento total, foi a transcrição predominante nos homozigóticos T/T, enquanto o transcrição D, que codifica a proteína prematuramente truncada, foi a transcrição predominante nos homozigotos TA/TA. Em tecido de biópsia de fígado humano, a proteína da isoforma D truncada estava minimamente presente em heterozigotos e homozigotos de TA/TA, e a abundância de proteína de isoforma A foi reduzida de um modo dependente de dosagem de alelo (Figs. 10B e 10C). A expressão heteróloga das isoformas A e D em células HEK 293 indicaram uma abundância reduzida da isoforma D em relação à expressão de RNAm, sugerindo instabilidade da isoforma D quando comparada com a isoforma A (Figs. 11A a 1 IC). Estes dados são consistentes com o de HSD17B13, rs72613567, alterando o processamento de RNAm, resultando na síntese de uma forma truncada da proteína com expressão substancialmente reduzida no fígado humano.
Expressão de HSD17B13 em células hepáticas humanas [00471] HSD17B13 é expressa principalmente no fígado (Liu et al., Acta Biochim. Pol. 2007, 54, 213 a 218, aqui incorporada por referência na sua totalidade para todos os efeitos), onde se localiza em gotículas lipídicas (Su et al., Proc. Natl. Acad. Sei. USA, 2014, 111, 11437 a 11442, doi: 10.1073/pnas.l410741111, aqui incorporado por referência na sua totalidade para todos os efeitos), consistente com um papel na patogênese de doença do
Petição 870190068171, de 18/07/2019, pág. 314/358
301/307 fígado gorduroso. Foi avaliada a expressão de HSD17B13 e a sua localização em uma linhagem celular hepática humana imortalizada estavelmente transduzida com lentivírus que expressa a transcrição A ou D de HSD17B13. A isoforma A de HSD17B13 foi detectada principalmente em membranas que rodeiam gotículas lipídicas marcadas com BODIPY (dados não mostrados). Localização subcelular semelhante foi observada para a isoforma D de HSD17B13 na superfie da gotícula lipídica (dados não mostrados e Fig. 12). Não foram observadas diferenças no teor intracelular de triglicerídeos com o tratamento com ácido oleico de linhagens celulares que sobre-expressam o controle de GFP ou as isoformas A ou D de HSD17B13 (Figs. 13A a 13D).
Efeito de rs72613567:TA na atividade de HSD17B13 in vitro e em modelos celulares [00472] Para entender as consequências funcionais do truncamento prematuro da proteína de HSD17B13 devido a rs72613567:TA, foi avaliada a atividade enzimática das isoformas A e D in vitro usando proteína recombinante e dinucleotídeo de nicotinamida adenosina como cofator. Foram testados 265 substratos putativos únicos e foram identificados substratos esteroides e lipídios bioativos (por exemplo, leucotrieno B4) como substratos enzimáticos de HS17B13. Foi focalizada a subsequente caracterização da atividade enzimática da HSD17B13 na conversão enzimática do estradiol (valores de Vmax e Km na Fig. 14), o que resultou na oxidação de um grupo hidroxila a uma cetona. A isoforma D de HSD17B13 mostrou uma atividade muito reduzida em relação ao estradiol in vitro (Fig. 10D) e em ensaios de conversão enzimática baseados em células (Fig. 10E) quando comparada com a isoforma A de HSD17B13.
[00473] Ao ligar o sequenciamento de exoma em grande escala aos fenótipos clínicos derivados de EHR, foi identificada uma nova associação entre uma variante de entralçamento em HSD17B13 e diminuição dos níveis séricos de transaminase, bem como redução do risco de formas não alcoólicas
Petição 870190068171, de 18/07/2019, pág. 315/358
302 / 307 e alcoólicas de doença do fígado. Essas associações foram observadas consistentemente em quatro coortes independentes e em várias categorias diferentes de doença do fígado, incluindo formas de cirrose avançadas de doença do fígado e CHC. O alelo de HSD17B13, rs72613567:TA não foi associado à esteatose simples, mas foi associado à redução do risco de NASH e fibrose, sugerindo que esse alelo variante protege da progressão para estágios clinicamente mais avançados da doença do fígado crônica. Em um estudo de associação ampla, HSD17B13, rs72613567:TA não foi significativamente associado a diagnósticos clínicos ou a outras medidas além da doença do fígado crônica e medições clínicas associadas (transaminases hepáticas e contagem de plaquetas), sugerindo que os efeitos clínicos do alelo variante podem ser específicos à doença do fígado crônica.
[00474] Outros membros da família de 17-beta hidroxiesteroide desidrogenase estão envolvidos no metabolismo dos esteroides sexuais e dos ácidos graxos (Moeller, Mol. Cell. Endocrinol., 2009, 301, 7 a 19, doi: 10.1016/j.mce.2008.10.040, aqui incorporada por referência na sua totalidade para todos os efeitos), mas pouco se sabe sobre a função de HSD17B13. Verificou-se anteriormente que a sobre-expressão de HSD17B13 aumenta a lipogênese no fígado de camundongo e aumenta o número e o tamanho de gotículas lipídicas em hepatócitos cultivados (Su et al., Proc. Natl. Acad. Sei. USA, 2014, 111, 11437 a 11442, doi : 10.1073/pnas.l410741111, aqui incorporado por referência na sua totalidade para todos os efeitos). Dois estudos anteriores também mostraram que a expressão hepática da proteína de HSD17B13 está aumentada em pacientes com esteatose hepática (Su et al., Proc. Natl. Acad. Sei. EUA, 2014, 111, 11437 a 11442, doi: 10.1073/pnas. 1410741111 e Kampf et al., FASEB J., 2014, 28, 2901 a 2914, doi: 10.1096/fj.14-250555, cada um dos quais é aqui incorporado por referência na sua totalidade para todos os efeitos). Os dados sugerem que ambas as isoformas de HSD17B13 são expressas na membrana de gotículas
Petição 870190068171, de 18/07/2019, pág. 316/358
303 / 307 lipídicas, mas não parecem modular o conteúdo de gordura neutra intracelular, um achado que espelha a falta de uma associação entre o HSD17B13, rs72613567:TA e esteatose simples em humanos. Embora os substratos fisiológicos de HSD17B13 não sejam conhecidos, estudos enzimáticos demonstram que a isoforma de HSD17B13 codificada pelo alelo de HSD17B13, rs72613567:TA é cataliticamente defeituosa contra o estradiol. Embora neste momento não esteja claro se algum dos substratos testados é crítico para a doença do fígado, é intrigante que HSD17B13 tenha atividade enzimática contra várias espécies lipídicas bioativas (por exemplo, leucotrieno B4) que foram previamente implicadas na inflamação mediada por lipídios (Li et al., Nature Medicine, 2015, 21, 239 a 247, doi: 10.1038/nm.3800, aqui incorporado por referência na sua totalidade para todos os efeitos).
[00475] Esta variante de HSD17B13 pode fornecer uma caminho para novas estratégias terapêuticas visando doença do fígado crônica, semelhante às variantes genéticas que orientaram o caminho para novas terapêuticas em outros domínios. Os dados indicam que HSD17B13 modula a progressão da doença do fígado de esteatose para fases posteriores de NASH, fibrose e cirrose, que estão associadas com morbidade e mortalidade significativas, e para as quais atualmente não há tratamentos eficazes.
Exemplo 4. Modificação do Locus de Hsdl7bl3 de Camundongo Utilizando CRISPR/Cas9 Ex Vivo e In Vivo.
[00476] Como uma prova de conceito para segmentação de Hsdl7bl3 usando o sistema CRISPR/Cas9, RNA guia de Hsdl7bl3 do camundongo visando a região éxon 1 ou a região éxon 6/7 do locus de Hsdl7bl3 de camundongo foram testados. As sequências alvo de RNA guia são providas na Tabela 12. Os segmentos de direcionamento de DNA de RNA guia correspondentes às SEQ ID NOS: 259 a 268 são expostos nas SEQ ID NOS: 1643 a 1652, respectivamente, que são idênticas às SEQ ID NOS: 259 a 268
Petição 870190068171, de 18/07/2019, pág. 317/358
304 / 307 exceto com uracilas ao invés de tiaminas. A ID do gene de NCBI para o Hsdl7bl3 (hidroxiesteroide (17-beta) desidrogenase 13) de camundongo é 243168 (SEQ ID NO: 269) .0 locus genômico do camundongo está no cromossoma 5, NC_000071.6 (103955442..103977388, complemento).
Tabela 12. Sequências Alvo de RNA Guia para Camundongo
Região de Hsdl7bl3 No. Sequência alvo de RNA guia SEQ ID NO
Seq alvo de RNAg crRNA sgRNA vl sgRNA v2 sgRNA v3 sgRNA v4
Éxon 1 1 GGCAGACCGTTCTCATCACG 259 490 720 950 1180 1410
2 CTTTACCAGTGACTCCAGGT 260 491 721 951 1181 1411
3 GTCACAGATTTCCTTCTCCG 261 492 722 952 1182 1412
4 AGATGATGACGCCCACCAGA 262 493 723 953 1183 1413
5 GGAGAAGGAAATCTGTGACC 263 494 724 954 1184 1414
Éxons 6/7 1 TGCGAGGAACTTACTTTTCC 264 495 725 955 1185 1415
2 AGAGAAATATTGATATAGGA 265 496 726 956 1186 1416
3 TATCAATATTTCTCTGATCC 266 497 727 957 1187 1417
4 ATCGCTTTTAAGGCACGCTC 267 498 728 958 1188 1418
5 TATACGACTGATCGCTTTTA 268 499 729 959 1189 1419
[00477] Os RNAs guia foram primeiro testados ex vivo em hepatócitos primários de camundongos isolados de camundongos híbridos do tipo selvagem (75% C57BL/6NTac 25% 129S6/SvEvTac). Fungos de camundongos foram perfundidos com 50 mL de meio de perfusão hepático contendo IX PenStrep, seguido por 50 mL de meio de digestão do fígado (HBSS, 100 mM CaC12, 500 mM HEPES, colagenase). Uma vez que os fígados pareciam digeridos, eles foram colocados em meio de lavagem contendo IX PenStrep e L-glutamina. Os fígados foram arrancados para liberar os hepatócitos do fígado através de agitação suave. Uma vez que as células foram liberadas, elas foram colocadas através de um filtro de malha de 70 μπι e centrifugadas a 50 g por 4 minutos a 4 °C. Os sedimentos foram lavados 2x com tampão de lavagem. Os sedimentos foram então ressuspensos em 20 ml de Percoll a 38 a 40% e centrifugados a 200 g x 10 minutos a 4 °C. O sedimento foi lavado 2X e ressuspenso em meio de revestimento (Williams E Media, IxPenstrep, IXL-glutamina, 5% FBS). As células foram plaqueadas a 300000 células por poço em placas de cultura de tecidos revestidas com colágeno de 24 poços. Depois de as células terem sido deixadas se ligar
Petição 870190068171, de 18/07/2019, pág. 318/358
305 / 307 durante 6 a 18 horas, o meio de revestimento foi substituído por meio sem
FBS. Os reagentes utilizados são mostrados na Tabela 13.
Tabela 13. Reagentes para Isolamento de Hepatócitos Primários.
Material Número do catálogo
Meio de perfusão de fígado Gibco [17701-038]
HBSS (Ix) Gibco [14175-079]
Meio de lavagem de hepatócito Gibco [17704-024]
Meio Williams E Gibco [A12176-01]
Penstrep (lOOx) Gibco [15140163]
L-glutamina (200mM) Gibco [25030081]
Suplemento FBS Gibco [Al3450]
HEPES Gibco [15630080]
Colágeno Gibco [A1048301]
Ácido acético Sigma [A6283]
Liberase TM Roche [TM05401119001]
Descongelamento Primário de Hepatócitos e Suplementos de Revestimento Gibco [CM3000]
Suplementos Primários de Manutenção de Hepatócitos Gibco [CM4000]
Percoll GE [17-0891-01]
[00478] Foram adicionados complexos de ribonucleoproteína (RNPs) contendo Cas9 e um RN Ag de Hsdl7bl3 de camundongo aos hepatócitos primários de camundongo recentemente isolados. Para experimentos ex vivo em hepatócitos primários de camundongo, foram utilizados RNA guia modulares possuindo um crRNA e tracrRNA separados. As SEQ ID NOS de crRNA são apresentadas na Tabela 12, e a sequência tracRRNA é apresentada na SEQ ID NO: 1422. Cada complexo Cas9/RNAg RNP foi transfectado em uma concentração final de 2 nM utilizando CRISPRMAX™. Após 48 horas, os lisados de DNA foram preparados a partir das células, e o sequenciamento de nova geração foi realizadp para cada RNA guia testado para determinar a frequência de inserção/eliminação (indel) ao longo dos locais de corte previstos.
[00479] A Figura 15 mostra os níveis de edição (% de leitura com indels) no gene Hsdl7bl3 de camundongo com cada um dos RNAs guia nos hepatócitos primários de camundongo, incluindo cada um dos cinco RNAs guia direcionados à região éxon 1 e cada um dos cinco RNAs guia direcionados à região do éxon 6/7. A eficiência de edição se refere ao número total de inserções ou eliminações observadas sobre o número total de sequências lidas na reação de PCR a partir de um conjunto de células lisadas,
Petição 870190068171, de 18/07/2019, pág. 319/358
306 / 307 conforme determinado pelo sequenciamento da próxima geração. Quase todos os RNAs guia mostraram uma eficiência de edição de pelo menos 20%. [00480] Em seguida, os cinco RNAs guia de Hsdl7bl3 de camundongo foram testados in vivo em camundongos com um gene Cas9 genomicamente integrado (camundongos Cas9-pronto). Para experimentos in vivo em camundongos, foram utilizados RNA guia simples quiméricos. A sequência direcionada ao DNA para cada RNA guia equivale à sequência alvo de RNA guia apresentada na Tabela 12, com os uracilas substituindo as timinas. Cada RNA guia único incluiu a sequência de DNA alvo a montante (5’) da estrutura de suporte do RNAg apresentado na SEQ ID NO: 1420. As SEQ ID NOs de sgRNA são apresentadas na Tabela 12 (coluna para sgRNA vl). Outras variações de sgRNA usando diferentes estruturas de RNA guia estão incluídas na Tabela 12, mas não foram testadas. Para cada RNA guia, três camundongos machos prontos para Cas9 foram doseados por grupo. Os RNAs guia foram introduzidos através de vírus adenoassociados (AAV8) transportando uma cassete de expressão de sgRNA por injeção na veia caudal (1E11 por rato em 100 μΕ de PBS). Os camundongos do tipo selvagem que não expressam qualquer Cas9 foram doseados com todos os cinco RNAs guia como um controle negativo. Três semanas após a injecção, os animais foram eutanasiados e o soro sanguíneo foi colhido juntamente com o fígado e outros tecidos. Os tecidos foram processados em lisados de DNA que foram então analisados por sequenciamento de NGS.
[00481] Como mostrado na Figura 16, o sequenciamento NGS mostrou edição significativa no fígado para todos os cinco RNAs guia (edição percentual de pelo menos 20% para cada). A eficiência de edição se refere ao número total de inserções ou eliminações observadas sobre o número total de sequências lidas na reação de PCR de um conjunto de células lisadas. Mínimo ou nenhum nível estatisticamente significativo de edição genética foi observado em outros tecidos (dados não mostrados).
Petição 870190068171, de 18/07/2019, pág. 320/358
307 / 307 [00482] A análise química do soro para as enzimas hepáticas ALT, AST, triglicerídeos, colesterol total, HDL, LDL, ácidos graxos não esterificados (NEFA) e albumina mostrou pouca diferença entre os vários grupos de tratamento (dados não mostrados).
[00483] A expressão de Hsdl7bl3 foi examinada avaliando-se quantidades de massa iguais de RNA do fígado por RT-qPCR. O DNA genômico foi degradado para não contar para a reação de qPCR. O RNA foi transcrito reversamente e, em seguida, um ensaio específico para Cas9 foi usado para detectar transcrições de Cas9. Cada RNA guia individual de Hsdl7bl3 mostrou pelo menos 50% de ablação da expressão de RN Am de Hsdl7bl3. Ver a Fig. 17A. Em contraste, não foram observadas diminuições significativas na expressão de um membro da família HSD não alvo. Ver a Fig. 17B.

Claims (60)

  1. REIVINDICAÇÕES
    1. RNA guia eficaz para direcionar uma enzima Cas para se ligar ou clivar um gene HSD17B13, caracterizado pelo fato de que o RNA guia compreende um segmento direcionado para o DNA que tem como alvo uma sequência alvo de RNA guia dentro do gene HSD17B13.
  2. 2. RNA guia de acordo com a reivindicação 1, caracterizado pelo fato de que a sequência alvo de RNA guia inclui ou está próxima de uma posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2.
  3. 3. RNA guia de acordo com a reivindicação 2, caracterizado pelo fato de que:
    (a) a sequência alvo de RNA guia compreende qualquer uma das SEQ ID NOS: 226 a 239 e 264 a 268; e/ou (b) o segmento de direcionamento de DNA compreende qualquer uma das SEQ ID NOS: 1629 a 1642 e 1648 a 1652; e/ou (c) o RNA guia compreende qualquer uma das SEQ ID NOS: 706 a 719, 936 a 949, 1166 a 1179, 1396 a 1409, 725 a 729, 955 a 959, 1185 a 1189e1415 a 1419.
  4. 4. RNA guia de acordo com a reivindicação 2 ou 3, caracterizado pelo fato de que:
    (a) a sequência alvo de RNA guia está dentro de uma região correspondente ao éxon 6 e/ou ao íntron 6 e/ou éxon 7 da SEQ ID NO: 2, quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2; e/ou (b) a sequência alvo do RNA guia está dentro de cerca de 1000, 500, 400, 300, 200, 100, 50, 45, 40, 35, 30, 25, 20, 15, 10 ou 5 nucleotídeos da posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2, opcionalmente em que a sequência alvo do RNA guia inclui a posição
    Petição 870190068171, de 18/07/2019, pág. 322/358
    2/15 correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2.
  5. 5. RNA guia de acordo com a reivindicação 1, caracterizado pelo fato de que a sequência alvo de RNA guia inclui ou está próxima do códon de iniciação do gene HSD17B13.
  6. 6. RNA guia de acordo com a reivindicação 5, caracterizado pelo fato de que:
    (a) a sequência alvo de RNA guia compreende qualquer uma das SEQ ID NOS: 20 a 81 e 259 a 263; e/ou (b) o segmento de direcionamento de DNA compreende qualquer uma das SEQ ID NOS: 1423 a 1484 e 1643 a 1647; e/ou (c) o RNA guia compreende qualquer uma das SEQ ID NOS: 500 a 561, 730 a 791, 960 a 1021, 1190 a 1251, 720 a 724, 950 a 954, 1180 a 1184 e 1410 a 1414.
  7. 7. RNA guia de acordo com a reivindicação 5 ou 6, caracterizado pelo fato de que:
    (a) a sequência alvo de RNA guia está dentro de uma região correspondente ao éxon 1 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2; e/ou (b) a sequência alvo de RNA guia está dentro de cerca de 1000, 500, 400, 300, 200, 100, 50, 45, 40, 35, 30, 25, 20, 15, 10 ou 5 nucleotídeos do códon de iniciação.
  8. 8. RNA guia de acordo com a reivindicação 1, caracterizado pelo fato de que a sequência alvo de RNA guia inclui ou está próxima do códon de terminação do gene HSD17B13.
  9. 9. RNA guia de acordo com a reivindicação 8, caracterizado pelo fato de que:
    (a) a sequência alvo de RNA guia compreende qualquer uma das SEQ ID NOS: 82 a 225; e/ou
    Petição 870190068171, de 18/07/2019, pág. 323/358
    3/15 (b) o segmento de direcionamento de DNA compreende qualquer uma das SEQ ID NOS: 1485 a 1628; e/ou (c) o RNA guia compreende qualquer uma das SEQ ID NOS: 562 a 705, 792 a 935, 1022 a 1165 e 1252 a 1395.
  10. 10. RNA guia de acordo com a reivindicação 8 ou 9, caracterizado pelo fato de que:
    (a) a sequência alvo do RNA guia está dentro de uma região correspondente ao éxon 7 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2; e/ou (b) a sequência alvo do RNA guia está dentro de cerca de 1000, 500, 400, 300, 200, 100, 50, 45, 40, 35, 30, 25, 20, 15, 10 ou 5 nucleotídeos do códon de terminação.
  11. 11. RNA guia de acordo com qualquer uma das reivindicações 1 a 10, caracterizado pelo fato de que o gene HSD17B13 é um gene HSD17B13 humano ou um gene Hsdl7bl3 de camundongo, opcionalmente, em que o gene HSD17B13 é o gene HSD17B13 humano e compreende a SEQ ID NO: 2.
  12. 12. RNA guia de acordo com qualquer uma das reivindicações 1 a 11, caracterizado pelo fato de que o RNA guia compreende um RNA de Repetições Palindrômicas Curtas Agrupadas e Regularmente Interespaçadas (CRISPR) (CrRNA) compreendendo o segmento de direcionamento de DNA e um RNA de CRISPR transativado (TracrRNA).
  13. 13. RNA guia de acordo com a reivindicação 12, caracterizado pelo fato de que o RNA guia é um RNA guia modular no qual o CrRNA e o TracrRNA são moléculas separadas que se hibridizam entre si, opcionalmente, em que o CrRNA compreende a sequência apresentada na SEQ ID NO: 1421 e o TracrRNA compreende a sequência apresentada na SEQ ID NO: 1422.
  14. 14. RNA guia de acordo com a reivindicação 12, caracterizado
    Petição 870190068171, de 18/07/2019, pág. 324/358
    4/15 pelo fato de que o RNA guia é um RNA guia único no qual o CrRNA é fundido ao TracrRNA por meio de um ligador, opcionalmente em que o RNA guia compreende a sequência apresentada em qualquer uma das SEQ ID NOS: 1420 e 256 a 258.
  15. 15. Uso do RNA guia como definido em qualquer uma das reivindicações 1 a 14, caracterizado pelo fato de ser em um método de modificação de um gene HSD17B13 em uma célula ou em um método para alterar a expressão de um gene HSD17B13 em uma célula.
  16. 16. Ácido nucleico isolado, caracterizado pelo fato de que compreende um DNA que codifica o RNA guia como definido em qualquer uma das reivindicações 1 a 14.
  17. 17. RNA antissentido, SiRNA, ou ShRNA, caracterizado pelo fato de que hibridiza com uma sequência dentro de SEQ ID NO: 4 (transcrição A de HSD17B13) e diminui a expressão da transcrição A de HSD17B13 em uma célula.
  18. 18. RNA antissentido, o SiRNA, ou o ShRNA de acordo com a reivindicação 17, caracterizado pelo fato de que:
    (a) o RNA antissentido, o SiRNA ou o ShRNA hibridiza com uma sequência presente na SEQ ID NO: 4 (transcrição A de HSD17B13) que não está presente na SEQ ID NO: 7 (transcrição D de HSD17B13); e/ou (b) o RNA antissentido, o SiRNA ou o ShRNA hibridizam com uma sequência que abrange o limite de éxon 6-éxon 7 da SEQ ID NO: 4 (transcrição A de HSD17B13).
  19. 19. Uso do RNA antissentido, do SiRNA ou do ShRNA como definido na reivindicação 17 ou 18, caracterizado pelo fato de ser em um método para alterar a expressão de um gene HSD17B13 em uma célula.
  20. 20. Ácido nucleico isolado, caracterizado pelo fato de que compreende um DNA que codifica o RNA antissentido, o SiRNA ou o ShRNA como definido na reivindicação 17 ou 18.
    Petição 870190068171, de 18/07/2019, pág. 325/358
    5/15
  21. 21. Vetor, caracterizado pelo fato de que compreende o ácido nucleico isolado ccomo definido na reivindicação 16 ou 20 e um ácido nucleico heterólogo.
  22. 22. Composição, caracterizada pelo fato de que compreende o RNA guia como definido em qualquer uma das reivindicações 1 a 14 e um veículo aumentando a estabilidade do RNA guia, opcionalmente em que a composição compreende adicionalmente uma proteína Cas, opcionalmente em que a proteína Cas é Cas9.
  23. 23. Composição, caracterizada pelo fato de que compreende o RNA antissentido, o SiRNA, ou o ShRNA como definido na reivindicação 17 ou 18 e um veículo aumentando a estabilidade do RNA antissentido, do SiRNA, ou do ShRNA.
  24. 24. Célula, caracterizada pelo fato de que compreende o RNA guia como definido em qualquer uma das reivindicações 1 a 14.
  25. 25. Célula, caracterizada pelo fato de que compreende o RNA antissentido, o SiRNA, ou o ShRNA ccomo definido na reivindicação 17 ou 18.
  26. 26. Célula de acordo com a reivindicação 24 ou 25, caracterizada pelo fato de que a célula é uma célula humana, opcionalmente em que a célula é uma célula do fígado.
  27. 27. Célula de acordo com a reivindicação 24 ou 25, caracterizada pelo fato de que a célula é uma célula de roedor, uma célula de camundongo ou uma célula de rato, opcionalmente, em que a célula é uma célula pluripotente ou uma célula do fígado.
  28. 28. Método para modificar um gene HSD17B13 em uma célula, caracterizado pelo fato de que compreende contatar o genoma da célula com:
    (a) uma proteína Cas; e (b) um RNA guia que forma um complexo com a proteína Cas
    Petição 870190068171, de 18/07/2019, pág. 326/358
    6/15 e tem como alvo uma sequência alvo de RNA guia dentro do gene HSD17B13, em que a sequência alvo de RNA guia inclui ou está próximo de uma posição correspondente à posição 12666 de SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2, em que a proteína Cas cliva o gene HSD17B13.
  29. 29. Método de acordo com a reivindicação 28, caracterizado pelo fato de que:
    (a) a sequência alvo de RNA guia compreende qualquer uma das SEQ ID NOS: 226 a 239 e 264 a 268; e/ou (b) o segmento de direcionamento de DNA compreende qualquer uma das SEQ ID NOS: 1629 a 1642 e 1648 a 1652; e/ou (c) o RNA guia compreende qualquer uma das SEQ ID Nos: 706 a 719; 936 a 949; 1166 a 1179, 1396 a 1409, 725 a 729, 955 a 959, 1185 a 1189e1415 a 1419.
  30. 30. Método de acordo com a reivindicação 28 ou 29, caracterizado pelo fato de que:
    (a) a sequência alvo de RNA guia está dentro de uma região correspondente ao éxon 6 e/ou ao íntron 6 e/ou éxon 7 da SEQ ID NO: 2, quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2; e/ou (b) a sequência alvo do RNA guia está dentro de cerca de 1000, 500, 400, 300, 200, 100, 50, 45, 40, 35, 30, 25, 20, 15, 10 ou 5 nucleotídeos da posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2, opcionalmente em que a sequência alvo do RNA guia inclui a posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 2.
  31. 31. Método de acordo com qualquer uma das reivindicações 28 a 30, caracterizado pelo fato de que compreende adicionalmente contatar o
    Petição 870190068171, de 18/07/2019, pág. 327/358
    7/15 genoma com uma sequência de doador exógeno compreendendo um braço de homologia 5' que hibridiza com uma sequência alvo 5' da posição correspondente à posição 12666 da SEQ ID NO: 2 e um braço de homologia 3' que hibridiza com uma sequência alvo 3' da posição correspondente à posição 12666 da SEQ ID NO: 2, em que a sequência de doador exógeno se recombina com o gene HSD17B13.
  32. 32. Método de acordo com a reivindicação 31, caracterizado pelo fato de que a sequência de doador exógeno compreende adicionalmente um inserto de ácido nucleico flanqueado pelo braço de homologia 5’ e pelo braço de homologia 3’.
  33. 33. Método de acordo com a reivindicação 32, caracterizado pelo fato de que o inserto de ácido nucleico compreende uma timina, e em que após recombinação da sequência de doador exógeno com o gene HSD17B13, a timina é inserida entre nucleotídeos correspondentes às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 1.
  34. 34. Método de acordo com qualquer uma das reivindicações 31 a 33, caracterizado pelo fato de que:
    (a) a sequência de doador exógeno tem entre cerca de 50 nucleotídeos a cerca de 1 kb de comprimento, opcionalmente em que a sequência de doador exógeno tem entre cerca de 80 nucleotídeos e cerca de 200 nucleotídeos de comprimento; e/ou (b) a sequência de doador exógeno é um oligodesoxinucleotídeo de fita simples.
  35. 35. Método para modificar um gene HSD17B13 em uma célula, caracterizado pelo fato de que compreende: contatar o genoma da célula com:
    (a) uma proteína Cas; e (b) um primeiro RNA guia que forma um complexo com a
    Petição 870190068171, de 18/07/2019, pág. 328/358
    8/15 proteína Cas e tem como alvo uma primeira sequência alvo de RNA guia dentro do gene HSD17B13, em que a primeira sequência alvo de RNA guia compreende o códon de iniciação para o gene HSD17B13 ou está dentro de 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos do códon de iniciação, em que a proteína Cas cliva ou altera a expressão do gene HSD17B13.
  36. 36. Método de acordo com a reivindicação 35, caracterizado pelo fato de que:
    (a) a primeira sequência alvo de RNA guia compreende qualquer uma das SEQ ID NOS: 20 a 81 e 259 a 263, opcionalmente, em que a primeira sequência alvo de RNA guia compreende qualquer uma das SEQ ID NOS: 20 a 41, qualquer uma de SEQ ID NOS: 21 a 23, 33 e 35, ou qualquer uma das SEQ ID NOS: 33 e 35; e/ou (b) o primeiro RNA guia compreende um segmento de direcionamento de DNA que compreende qualquer uma das SEQ ID NOS: 1423 a 1484 e 1643 a 1647, opcionalmente, em que o primeiro RNA guia compreende um segmento de direcionamento de DNA que compreende qualquer uma de SEQ ID NOS: 1447 a 1468, qualquer uma das SEQ ID NOS: 1448 a 1450, 1460 e 1462; ou qualquer uma das SEQ ID NOS: 1460 e 1462; e/ou (c) o primeiro RNA guia compreende qualquer uma das SEQ ID NOS: 500 a 561, 730 a 791, 960 a 1021, 1190 a 1251, 720 a 724, 950 a 954, 1180 a 1184 e 1410 a 1414, opcionalmente em que o primeiro RNA guia compreende qualquer uma das SEQ ID NOS: 524 a 545, 754 a 775, 984 a 1005 e 1214 a 1235, ou qualquer uma das SEQ ID NOS: 295 a 297, 525 a 527, 755 a 757, 985 a 987, 1215 a 1217, 307, 309, 537, 539, 767, 769, 997, 999, 1227 e 1229, ou qualquer uma das SEQ ID NOS: 307, 309, 537, 539, 767, 769, 997, 999, 1227 e 1229.
    Petição 870190068171, de 18/07/2019, pág. 329/358
    9/15
  37. 37. Método de acordo com a reivindicação 35 ou 36, caracterizado pelo fato de que:
    (a) a proteína Cas é uma proteína Cas ativa em nuclease; ou (b) a proteína Cas é uma proteína Cas inativa em nuclease, fundida a um domínio ativador da transcrição ou a um domínio repressor da transcrição.
  38. 38. Método de acordo com qualquer uma das reivindicações 35 a 37, caracterizado pelo fato de que compreende adicionalmente contatar o genoma da célula com um segundo RNA guia que forma um complexo com a proteína Cas e tem como alvo uma segunda sequênncia alvo de RNA guia dentro do gene HSD17B13, em que a segunda sequência alvo de RNA guia compreende o códon de terminação para o gene HSD17B13 ou está dentro de cerca de 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos do códon de terminação, em que a célula é modificada para compreender uma eliminação entre a primeira sequência alvo de RNA guia e a segunda sequência alvo de RNA guia.
  39. 39. Método de acordo com a reivindicação 38, caracterizado pelo fato de que:
    (a) a segunda sequência alvo de RNA guia compreende qualquer uma das SEQ ID NOS: 82 a 225; e/ou (b) o segundo RNA guia compreende um segmento de direcionamento de DNA que compreende qualquer uma das SEQ ID NOS: 1485 a 1628; e/ou (c) o segundo RNA guia compreende qualquer uma das SEQ ID NOS: 562 a 705, 792 a 935, 1022 a 1165 e 1252 a 1395.
  40. 40. Método para diminuir a expressão de um gene HSD17B13 em uma célula, caracterizado pelo fato de que compreende: contatar o genoma da célula com um RNA antissentido, um SiRNA ou um ShRNA que hibridiza com uma sequência na SEQ ID NO: 4 (transcrição A de HSD17B13) e
    Petição 870190068171, de 18/07/2019, pág. 330/358
    10/15 diminui a expressão da transcrição A de HSD17B13.
  41. 41. Método de acordo com a reivindicação 40, caracterizado pelo fato de que o RNA antissentido, o SiRNA ou o ShRNA hibridizam com uma sequência presente na SEQ ID NO: 4 (transcrição A de HSD17B13) que não está presente na SEQ ID NO: 7 (transcrição D de HSD17B13), opcionalmente, em que o RNA antissentido, o SiRNA ou o ShRNA hibridizam para uma sequência que abrange o limite do éxon 6-éxon 7 da SEQ ID NO: 4 (transcrição A de HSD17B13).
  42. 42. Método de acordo com qualquer uma das reivindicações 35 a 41, caracterizado pelo fato de que compreende adicionalmente a introdução de um vetor de expressão na célula, em que o vetor de expressão compreende um gene HSD17B13 recombinante que compreende uma timina inserida entre nucleotídeos correspondentes às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 recombinante está perfeitamente alinhado com a SEQ ID NO: 1, opcionalmente em que o gene HSD17B13 recombinante é um gene humano.
  43. 43. Método de acordo com a reivindicação 42, caracterizado pelo fato de que o gene HSD17B13 recombinante é um minigene HSD17B13 no qual um ou mais segmentos não essenciais do gene foram eliminados em relação a um gene HSD17B13 de tipo selvagem correspondente, opcionalmente em que os segmentos eliminados compreendem uma ou mais sequências intrônicas, opcionalmente em que o minigene HSD17B13 compreende um íntron correspondente ao intron 6 da SEQ ID NO: 2 quando perfeitamente alinhado com a SEQ ID NO: 2.
  44. 44. Método de acordo com qualquer uma das reivindicações 35 a 41, caracterizado pelo fato de que compreende adicionalmente a introdução de um vetor de expressão na célula, em que o vetor de expressão compreende um ácido nucleico que codifica uma proteína de HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo
    Petição 870190068171, de 18/07/2019, pág. 331/358
    11/15 menos 98%, pelo menos 99%, ou 100% idêntico a SEQ ID NO: 15 (isoforma D de HSD17B13), opcionalmente, em que o ácido nucleico que codifica a proteína de HSD17B13 é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico à SEQ ID NO: 7 (transcrição D de HSD17B13) quando perfeitamente alinhado com a SEQ ID NO: 7.
  45. 45. Método de acordo com qualquer uma das reivindicações 35 a 41, caracterizado pelo fato de que compreende adicionalmente a introdução de uma proteína de HSD17B13 ou seu fragmento na célula, em que a proteína de HSD17B13 ou seu fragmento é pelo menos 90%, pelo menos 95%, pelo menos 96%, menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 15 (isoforma D de HSD17B13).
  46. 46. Método de acordo com qualquer uma das reivindicações 28 a 45, caracterizado pelo fato de que a proteína Cas é Cas9.
  47. 47. Método para modificar uma célula, caracterizado pelo fato de que compreende introduzir um vetor de expressão na célula, em que o vetor de expressão compreende um gene HSD17B13 recombinante que compreende uma timina inserida entre nucleotídeos correspondendo às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 recombinante está perfeitamente alinhado com a SEQ ID NO: 1, opcionalmente, em que o gene HSD17B13 recombinante é um gene humano.
  48. 48. Método de acordo com a reivindicação 47, caracterizado pelo fato de que o gene HSD17B13 recombinante é um minigene HSD17B13 no qual um ou mais segmentos não essenciais do gene foram eliminados em relação a um gene HSD17B13 de tipo selvagem correspondente, opcionalmente em que os segmentos eliminados compreendem uma ou mais sequências intrônicas, opcionalmente em que o minigene HSD17B13 compreende um íntron correspondente ao íntron 6 da SEQ ID NO: 2 quando perfeitamente alinhado com a SEQ ID NO: 2.
    Petição 870190068171, de 18/07/2019, pág. 332/358
    12/15
  49. 49. Método para modificar uma célula, caracterizado pelo fato de que compreende introduzir um vetor de expressão na célula, em que o vetor de expressão compreende um ácido nucleico que codifica uma proteína de HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 15 (isoforma D de HSD17B13), opcionalmente em que o ácido nucleico que codifica a proteína de HSD17B13 é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 7 (transcrição D de HSD17B13) quando perfeitamente alinhado com a SEQ ID NO: 7.
  50. 50. Método para modificar uma célula, caracterizado pelo fato de que compreende introduzir uma proteína de HSD17B13 ou um fragmento das mesmas na célula, em que a proteína de HSD17B13 ou seu fragmento é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntico à SEQ ID NO: 15 (Isoforma D de HSD17B13).
  51. 51. Método de acordo com qualquer uma das reivindicações 28 a 50, caracterizado pelo fato de que a célula é uma célula de roedor, uma célula de camundongo ou uma célula de rato, opcionalmente em que a célula é uma célula pluripotente ou uma célula de fígado.
  52. 52. Método de acordo com qualquer uma das reivindicações 28 a 50, caracterizado pelo fato de que a célula é uma célula humana, opcionalmente em que a célula é uma célula do fígado.
  53. 53. Método de acordo com qualquer uma das reivindicações 28 a 52, caracterizado pelo fato de que a célula é ex vivo ou in vivo.
  54. 54. Método para tratar um indivíduo que não é portador da variante de HSD17B13, rS72613567, e tem ou é suscetível de desenvolver uma doença do fígado crônica, caracterizado pelo fato de que compreende introduzir no indivíduo:
    Petição 870190068171, de 18/07/2019, pág. 333/358
    13/15 (a) uma proteína Cas ou um ácido nucleico que codifica a proteína Cas;
    (b) um RNA guia ou um ácido nucleico que codifica o RNA guia, em que o RNA guia forma um complexo com a proteína Cas e tem como alvo uma sequência guia de RNA alvo dentro de um gene HSD17B13, em que a sequência alvo de RNA guia inclui ou está próxima a uma posição correspondente à posição 12666 da SEQ ID NO: 2 quando o gene HSD17B13 é perfeitamente alinhado com a SEQ ID NO: 2; e (c) uma sequência de doador exógeno compreendendo um braço de homologia 5' que hibridiza com uma sequência alvo 5' da posição correspondente à posição 12666 da SEQ ID NO: 2, um braço de homologia 3' que hibridiza com uma sequência alvo 3' da posição correspondente à posição 12666 da SEQ ID NO: 2, e um inserto de ácido nucleico compreendendo uma timina flanqueada pelo braço de homologia 5' e o braço de homologia 3', em que a proteína Cas cliva o gene HSD17B13 em uma célula do fígado no indivíduo e a sequência de doador exógeno se recombina com o gene HSD17B13 na célula do fígado, em que por recombinação da sequência de doador exógeno com o gene HSD17B13, a timina é inserida entre nucleotídeos correspondentes às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 está perfeitamente alinhado com a SEQ ID NO: 1.
  55. 55. Método para tratar um indivíduo que não é portador da variante de de HSD17B13, rs72613567, e tem ou é suscetível de desenvolver uma doença do fígado crônica, caracterizado pelo fato de que compreende introduzir no indivíduo:
    (a) uma proteína Cas ou um ácido nucleico que codifica a proteína Cas;
    (b) um primeiro RNA guia ou um ácido nucleico que codifica o primeiro RNA guia, em que o primeiro RNA guia forma um complexo com a proteína Cas e tem como alvo uma primeira sequência alvo de RNA guia em
    Petição 870190068171, de 18/07/2019, pág. 334/358
    14/15 um gene HSD17B13, em que a primeira sequência alvo de RNA guia compreende o códon de iniciação para o gene HSD17B13 ou está dentro de cerca de 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 ou 1000 nucleotídeos do códon de iniciação ou é selecionado das SEQ ID NOS: 20 a 81; e (c) um vetor de expressão compreendendo um gene HSD17B13 recombinante que compreende uma timina inserida entre os nucleotídeos correspondendo às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 recombinante está perfeitamente alinhado com a SEQ ID NO: 1, em que a proteína Cas cliva ou altera a expressão do gene HSD17B13 em uma célula do fígado no indivíduo e o vetor de expressão expressa o gene HSD17B13 recombinante na célula do fígado no indivíduo.
  56. 56. Método para tratar um indivíduo que não é um portador da variante de HSD17B13, rS72613567, e que tem ou que é suscetível a desenvolver uma doença crônica do fígado, caracterizado pelo fato de que compreende introduzir no indivíduo: um RNA antissentido, um SiRNA ou um ShRNA que hibridiza com uma sequência da SEQ ID NO: 4 (transcrição A de HSD17B13) e diminui a expressão da transcrição A de HSD17B13 em uma célula de fígado no indivíduo.
  57. 57. Método para tratar um indivíduo que não é um portador da variante de HSD17B13, rS72613567, e que tem ou que é suscetível de desenvolver uma doença crônica do fígado caracterizado pelo fato de que compreende introduzir um vetor de expressão no indivíduo, em que o vetor de expressão compreende um gene HSD17B13 recombinante que compreende uma timina inserido entre nucleotídeos correspondendo às posições 12665 e 12666 da SEQ ID NO: 1 quando o gene HSD17B13 recombinante está perfeitamente alinhado com a SEQ ID NO: 1, em que o vetor de expressão expressa o gene HSD17B13 recombinante em uma célula do fígado no indivíduo.
    Petição 870190068171, de 18/07/2019, pág. 335/358
    15/15
  58. 58. Método para tratar um indivíduo que não é um portador da variante de HSD17B13, rS72613567, e que tem ou que é suscetível a desenvolver uma doença do fígado crônica caracterizado pelo fato te compreender introduzir um vetor de expressão no indivíduo, em que o vetor de expressão compreende um ácido nucleico que codifica uma proteína de HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 15 (isoforma D de HSD17B13), em que o vetor de expressão expressa o ácido nucleico que codifica a proteína de HSD17B13 em uma célula do fígado no indivíduo.
  59. 59. Método para tratar um indivíduo que não é portador da variante de HSD17B13, rS72613567, e tem ou é suscetível de desenvolver uma doença do fígado crônica caracterizado pelo fato de que compreende introduzir um RNA mensageiro no indivíduo, em que o RNA mensageiro codifica uma proteína de HSD17B13 que é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 15 (isoforma D de HSD17B13), em que o RNAm expressa a proteína de HSD17B13 na célula do fígado do indivíduo.
  60. 60. Método para tratar um indivíduo que não é um portador da variante de HSD17B13, rS72613567, e tem ou é suscetível de desenvolver uma doença do fígado crônica caracterizado pelo fato de que compreende introduzir uma proteína de HSD17B13 ou um fragmento das mesmas no fígado do indivíduo, em que a proteína de HSD17B13 ou seu fragmento é pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 15 (isoforma D de HSD17B13).
BR112019014841A 2017-01-23 2018-01-19 rna guia, uso do rna guia, rna antissentido, sirna ou shrna, uso do rna antissentido, do sirna ou do shrna, ácido nucleico isolado, vetor, composição, célula, e, métodos para modificar um gene hsd17b13 em uma célula, para diminuir a expressão de um gene hsd17b13 em uma célula, para modificar uma célula e para tratar um indivíduo que não é portador da variante de hsd17b13 BR112019014841A2 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201762449335P 2017-01-23 2017-01-23
US201762472972P 2017-03-17 2017-03-17
US201762581918P 2017-11-06 2017-11-06
PCT/US2018/014454 WO2018136758A1 (en) 2017-01-23 2018-01-19 Hsd17b13 variants and uses thereof

Publications (1)

Publication Number Publication Date
BR112019014841A2 true BR112019014841A2 (pt) 2020-04-28

Family

ID=61768397

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112019014841A BR112019014841A2 (pt) 2017-01-23 2018-01-19 rna guia, uso do rna guia, rna antissentido, sirna ou shrna, uso do rna antissentido, do sirna ou do shrna, ácido nucleico isolado, vetor, composição, célula, e, métodos para modificar um gene hsd17b13 em uma célula, para diminuir a expressão de um gene hsd17b13 em uma célula, para modificar uma célula e para tratar um indivíduo que não é portador da variante de hsd17b13

Country Status (13)

Country Link
US (6) US10787647B2 (pt)
EP (2) EP3571321A1 (pt)
JP (5) JP7094963B2 (pt)
KR (3) KR102619197B1 (pt)
CN (2) CN110199032A (pt)
AU (4) AU2018210364B2 (pt)
BR (1) BR112019014841A2 (pt)
CA (2) CA3047429A1 (pt)
IL (5) IL301053A (pt)
MX (5) MX2019008755A (pt)
RU (3) RU2021133626A (pt)
SG (2) SG11201906735RA (pt)
WO (2) WO2018136758A1 (pt)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112019014841A2 (pt) 2017-01-23 2020-04-28 Regeneron Pharma rna guia, uso do rna guia, rna antissentido, sirna ou shrna, uso do rna antissentido, do sirna ou do shrna, ácido nucleico isolado, vetor, composição, célula, e, métodos para modificar um gene hsd17b13 em uma célula, para diminuir a expressão de um gene hsd17b13 em uma célula, para modificar uma célula e para tratar um indivíduo que não é portador da variante de hsd17b13
SG11201909453RA (en) 2017-04-11 2019-11-28 Regeneron Pharma Assays for screening activity of modulators of members of the hydroxysteroid (17-beta) dehydrogenase (hsd17b) family
WO2019075181A1 (en) 2017-10-11 2019-04-18 Regeneron Pharmaceuticals, Inc. INHIBITION OF HSD17B13 IN THE TREATMENT OF HEPATIC DISEASE IN PATIENTS EXPRESSING PNPLA3 I148M VARIATION
US20210000906A1 (en) * 2018-03-21 2021-01-07 Ionis Pharmaceuticals, Inc. Modulation of hsd17b13 expression
SG11202007583SA (en) * 2018-03-21 2020-09-29 Regeneron Pharma 17β-HYDROXYSTEROID DEHYDROGENASE TYPE 13 (HSD17B13) iRNA COMPOSITIONS AND METHODS OF USE THEREOF
EP3781705A4 (en) 2018-04-19 2022-01-26 The Regents of the University of California COMPOSITIONS AND METHODS FOR GENE EDITING
SG11202101698WA (en) * 2018-09-19 2021-04-29 Arrowhead Pharmaceuticals Inc Rnai agents for inhibiting expression of 17beta-hsd type 13- (hsd17b13), compositions thereof, and methods of use
JP7394137B2 (ja) * 2018-12-21 2023-12-07 アイオニス・ファーマシューティカルズ・インコーポレイテッド Hsd17b13発現のモジュレータ
EP3994125A1 (en) 2019-07-02 2022-05-11 Regeneron Pharmaceuticals, Inc. Modulators of hsd17b13 and methods of use thereof
CN112626199A (zh) * 2021-01-04 2021-04-09 杭州艾迪康医学检验中心有限公司 检测慢性肝炎转化为肝硬化的风险预测位点的引物和方法
WO2022223015A1 (zh) * 2021-04-22 2022-10-27 上海拓界生物医药科技有限公司 靶向第13型17β-羟基类固醇脱氢酶的siRNA和siRNA缀合物
WO2023091644A2 (en) * 2021-11-19 2023-05-25 Wave Life Sciences Ltd. Hsd17b13-related double stranded oligonucleotide compositions and methods relating thereto

Family Cites Families (315)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4209A (en) * 1845-09-27 Straw-cutter
US3687808A (en) 1969-08-14 1972-08-29 Univ Leland Stanford Junior Synthetic polynucleotides
US5179017A (en) 1980-02-25 1993-01-12 The Trustees Of Columbia University In The City Of New York Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials
US4634665A (en) 1980-02-25 1987-01-06 The Trustees Of Columbia University In The City Of New York Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials
US4399216A (en) 1980-02-25 1983-08-16 The Trustees Of Columbia University Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials
US4469863A (en) 1980-11-12 1984-09-04 Ts O Paul O P Nonionic nucleic acid alkyl and aryl phosphonates and processes for manufacture and use thereof
US5023243A (en) 1981-10-23 1991-06-11 Molecular Biosystems, Inc. Oligonucleotide therapeutic agent and method of making same
US4476301A (en) 1982-04-29 1984-10-09 Centre National De La Recherche Scientifique Oligonucleotides, a process for preparing the same and their application as mediators of the action of interferon
JPS5927900A (ja) 1982-08-09 1984-02-14 Wakunaga Seiyaku Kk 固定化オリゴヌクレオチド
US4510245A (en) 1982-11-18 1985-04-09 Chiron Corporation Adenovirus promoter system
FR2540122B1 (fr) 1983-01-27 1985-11-29 Centre Nat Rech Scient Nouveaux composes comportant une sequence d'oligonucleotide liee a un agent d'intercalation, leur procede de synthese et leur application
US4605735A (en) 1983-02-14 1986-08-12 Wakunaga Seiyaku Kabushiki Kaisha Oligonucleotide derivatives
US4948882A (en) 1983-02-22 1990-08-14 Syngene, Inc. Single-stranded labelled oligonucleotides, reactive monomers and methods of synthesis
US4824941A (en) 1983-03-10 1989-04-25 Julian Gordon Specific antibody to the native form of 2'5'-oligonucleotides, the method of preparation and the use as reagents in immunoassays or for binding 2'5'-oligonucleotides in biological systems
US4587044A (en) 1983-09-01 1986-05-06 The Johns Hopkins University Linkage of proteins to nucleic acids
US5118800A (en) 1983-12-20 1992-06-02 California Institute Of Technology Oligonucleotides possessing a primary amino group in the terminal nucleotide
US5118802A (en) 1983-12-20 1992-06-02 California Institute Of Technology DNA-reporter conjugates linked via the 2' or 5'-primary amino group of the 5'-terminal nucleoside
US5550111A (en) 1984-07-11 1996-08-27 Temple University-Of The Commonwealth System Of Higher Education Dual action 2',5'-oligoadenylate antiviral derivatives and uses thereof
FR2567892B1 (fr) 1984-07-19 1989-02-17 Centre Nat Rech Scient Nouveaux oligonucleotides, leur procede de preparation et leurs applications comme mediateurs dans le developpement des effets des interferons
US5430136A (en) 1984-10-16 1995-07-04 Chiron Corporation Oligonucleotides having selectably cleavable and/or abasic sites
US5258506A (en) 1984-10-16 1993-11-02 Chiron Corporation Photolabile reagents for incorporation into oligonucleotide chains
US5367066A (en) 1984-10-16 1994-11-22 Chiron Corporation Oligonucleotides with selectably cleavable and/or abasic sites
US4828979A (en) 1984-11-08 1989-05-09 Life Technologies, Inc. Nucleotide analogs for nucleic acid labeling and detection
FR2575751B1 (fr) 1985-01-08 1987-04-03 Pasteur Institut Nouveaux nucleosides de derives de l'adenosine, leur preparation et leurs applications biologiques
US5168062A (en) 1985-01-30 1992-12-01 University Of Iowa Research Foundation Transfer vectors and microorganisms containing human cytomegalovirus immediate-early promoter-regulatory DNA sequence
US5235033A (en) 1985-03-15 1993-08-10 Anti-Gene Development Group Alpha-morpholino ribonucleoside derivatives and polymers thereof
US5166315A (en) 1989-12-20 1992-11-24 Anti-Gene Development Group Sequence-specific binding polymers for duplex nucleic acids
US5034506A (en) 1985-03-15 1991-07-23 Anti-Gene Development Group Uncharged morpholino-based polymers having achiral intersubunit linkages
US5185444A (en) 1985-03-15 1993-02-09 Anti-Gene Deveopment Group Uncharged morpolino-based polymers having phosphorous containing chiral intersubunit linkages
US5405938A (en) 1989-12-20 1995-04-11 Anti-Gene Development Group Sequence-specific binding polymers for duplex nucleic acids
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4751180A (en) 1985-03-28 1988-06-14 Chiron Corporation Expression using fused genes providing for protein product
US4683202A (en) * 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4762779A (en) 1985-06-13 1988-08-09 Amgen Inc. Compositions and methods for functionalizing nucleic acids
US4935233A (en) 1985-12-02 1990-06-19 G. D. Searle And Company Covalently linked polypeptide cell modulators
US4968615A (en) 1985-12-18 1990-11-06 Ciba-Geigy Corporation Deoxyribonucleic acid segment from a virus
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US5317098A (en) 1986-03-17 1994-05-31 Hiroaki Shizuya Non-radioisotope tagging of fragments
JPS638396A (ja) 1986-06-30 1988-01-14 Wakunaga Pharmaceut Co Ltd ポリ標識化オリゴヌクレオチド誘導体
US5264423A (en) 1987-03-25 1993-11-23 The United States Of America As Represented By The Department Of Health And Human Services Inhibitors for replication of retroviruses and for the expression of oncogene products
US5276019A (en) 1987-03-25 1994-01-04 The United States Of America As Represented By The Department Of Health And Human Services Inhibitors for replication of retroviruses and for the expression of oncogene products
US4904582A (en) 1987-06-11 1990-02-27 Synthetic Genetics Novel amphiphilic nucleic acid conjugates
ATE113059T1 (de) 1987-06-24 1994-11-15 Florey Howard Inst Nukleosid-derivate.
US5585481A (en) 1987-09-21 1996-12-17 Gen-Probe Incorporated Linking reagents for nucleotide probes
US5188897A (en) 1987-10-22 1993-02-23 Temple University Of The Commonwealth System Of Higher Education Encapsulated 2',5'-phosphorothioate oligoadenylates
US4924624A (en) 1987-10-22 1990-05-15 Temple University-Of The Commonwealth System Of Higher Education 2,',5'-phosphorothioate oligoadenylates and plant antiviral uses thereof
US5525465A (en) 1987-10-28 1996-06-11 Howard Florey Institute Of Experimental Physiology And Medicine Oligonucleotide-polyamide conjugates and methods of production and applications of the same
DE3738460A1 (de) 1987-11-12 1989-05-24 Max Planck Gesellschaft Modifizierte oligonukleotide
US5082830A (en) 1988-02-26 1992-01-21 Enzo Biochem, Inc. End labeled nucleotide probe
EP0406309A4 (en) 1988-03-25 1992-08-19 The University Of Virginia Alumni Patents Foundation Oligonucleotide n-alkylphosphoramidates
US5278302A (en) 1988-05-26 1994-01-11 University Patents, Inc. Polynucleotide phosphorodithioates
US5109124A (en) 1988-06-01 1992-04-28 Biogen, Inc. Nucleic acid probe linked to a label having a terminal cysteine
US5216141A (en) 1988-06-06 1993-06-01 Benner Steven A Oligonucleotide analogs containing sulfur linkages
US5175273A (en) 1988-07-01 1992-12-29 Genentech, Inc. Nucleic acid intercalating agents
US5294533A (en) 1988-07-05 1994-03-15 Baylor College Of Medicine Antisense oligonucleotide antibiotics complementary to the macromolecular synthesis operon, methods of treating bacterial infections and methods for identification of bacteria
US5262536A (en) 1988-09-15 1993-11-16 E. I. Du Pont De Nemours And Company Reagents for the preparation of 5'-tagged oligonucleotides
US5512439A (en) 1988-11-21 1996-04-30 Dynal As Oligonucleotide-linked magnetic particles and uses thereof
US5457183A (en) 1989-03-06 1995-10-10 Board Of Regents, The University Of Texas System Hydroxylated texaphyrins
US5599923A (en) 1989-03-06 1997-02-04 Board Of Regents, University Of Tx Texaphyrin metal complexes having improved functionalization
US5391723A (en) 1989-05-31 1995-02-21 Neorx Corporation Oligonucleotide conjugates
US4958013A (en) 1989-06-06 1990-09-18 Northwestern University Cholesteryl modified oligonucleotides
US5451463A (en) 1989-08-28 1995-09-19 Clontech Laboratories, Inc. Non-nucleoside 1,3-diol reagents for labeling synthetic oligonucleotides
US5134066A (en) 1989-08-29 1992-07-28 Monsanto Company Improved probes using nucleosides containing 3-dezauracil analogs
US5254469A (en) 1989-09-12 1993-10-19 Eastman Kodak Company Oligonucleotide-enzyme conjugate that can be used as a probe in hybridization assays and polymerase chain reaction procedures
US5591722A (en) 1989-09-15 1997-01-07 Southern Research Institute 2'-deoxy-4'-thioribonucleosides and their antiviral activity
US5399676A (en) 1989-10-23 1995-03-21 Gilead Sciences Oligonucleotides with inverted polarity
US5264564A (en) 1989-10-24 1993-11-23 Gilead Sciences Oligonucleotide analogs with novel linkages
CA2071510C (en) 1989-10-24 2004-07-06 Chris A. Buhr 2' modified oligonucleotides
US5264562A (en) 1989-10-24 1993-11-23 Gilead Sciences, Inc. Oligonucleotide analogs with novel linkages
US5292873A (en) 1989-11-29 1994-03-08 The Research Foundation Of State University Of New York Nucleic acids labeled with naphthoquinone probe
US5177198A (en) 1989-11-30 1993-01-05 University Of N.C. At Chapel Hill Process for preparing oligoribonucleoside and oligodeoxyribonucleoside boranophosphates
US5130302A (en) 1989-12-20 1992-07-14 Boron Bilogicals, Inc. Boronated nucleoside, nucleotide and oligonucleotide compounds, compositions and methods for using same
US5486603A (en) 1990-01-08 1996-01-23 Gilead Sciences, Inc. Oligonucleotide having enhanced binding affinity
US5578718A (en) 1990-01-11 1996-11-26 Isis Pharmaceuticals, Inc. Thiol-derivatized nucleosides
US5670633A (en) 1990-01-11 1997-09-23 Isis Pharmaceuticals, Inc. Sugar modified oligonucleotides that detect and modulate gene expression
US5681941A (en) 1990-01-11 1997-10-28 Isis Pharmaceuticals, Inc. Substituted purines and oligonucleotide cross-linking
US5587361A (en) 1991-10-15 1996-12-24 Isis Pharmaceuticals, Inc. Oligonucleotides having phosphorothioate linkages of high chiral purity
US5646265A (en) 1990-01-11 1997-07-08 Isis Pharmceuticals, Inc. Process for the preparation of 2'-O-alkyl purine phosphoramidites
US5459255A (en) 1990-01-11 1995-10-17 Isis Pharmaceuticals, Inc. N-2 substituted purines
US5214136A (en) 1990-02-20 1993-05-25 Gilead Sciences, Inc. Anthraquinone-derivatives oligonucleotides
WO1991013080A1 (en) 1990-02-20 1991-09-05 Gilead Sciences, Inc. Pseudonucleosides and pseudonucleotides and their polymers
US5321131A (en) 1990-03-08 1994-06-14 Hybridon, Inc. Site-specific functionalization of oligodeoxynucleotides for non-radioactive labelling
US5470967A (en) 1990-04-10 1995-11-28 The Dupont Merck Pharmaceutical Company Oligonucleotide analogs with sulfamate linkages
GB9009980D0 (en) 1990-05-03 1990-06-27 Amersham Int Plc Phosphoramidite derivatives,their preparation and the use thereof in the incorporation of reporter groups on synthetic oligonucleotides
DK0455905T3 (da) 1990-05-11 1998-12-07 Microprobe Corp Dipsticks til nukleinsyrehybridiseringsassays og fremgangsmåde til kovalent immobilisering af oligonukleotider
US5135917A (en) 1990-07-12 1992-08-04 Nova Pharmaceutical Corporation Interleukin receptor expression inhibiting antisense oligonucleotides
US5541307A (en) 1990-07-27 1996-07-30 Isis Pharmaceuticals, Inc. Backbone modified oligonucleotide analogs and solid phase synthesis thereof
US5610289A (en) 1990-07-27 1997-03-11 Isis Pharmaceuticals, Inc. Backbone modified oligonucleotide analogues
US5602240A (en) 1990-07-27 1997-02-11 Ciba Geigy Ag. Backbone modified oligonucleotide analogs
US5218105A (en) 1990-07-27 1993-06-08 Isis Pharmaceuticals Polyamine conjugated oligonucleotides
US5608046A (en) 1990-07-27 1997-03-04 Isis Pharmaceuticals, Inc. Conjugated 4'-desmethyl nucleoside analog compounds
US5618704A (en) 1990-07-27 1997-04-08 Isis Pharmacueticals, Inc. Backbone-modified oligonucleotide analogs and preparation thereof through radical coupling
US5677437A (en) 1990-07-27 1997-10-14 Isis Pharmaceuticals, Inc. Heteroatomic oligonucleoside linkages
US5138045A (en) 1990-07-27 1992-08-11 Isis Pharmaceuticals Polyamine conjugated oligonucleotides
US5623070A (en) 1990-07-27 1997-04-22 Isis Pharmaceuticals, Inc. Heteroatomic oligonucleoside linkages
JPH0874B2 (ja) 1990-07-27 1996-01-10 アイシス・ファーマシューティカルス・インコーポレーテッド 遺伝子発現を検出および変調するヌクレアーゼ耐性、ピリミジン修飾オリゴヌクレオチド
US5688941A (en) 1990-07-27 1997-11-18 Isis Pharmaceuticals, Inc. Methods of making conjugated 4' desmethyl nucleoside analog compounds
US5489677A (en) 1990-07-27 1996-02-06 Isis Pharmaceuticals, Inc. Oligonucleoside linkages containing adjacent oxygen and nitrogen atoms
US5245022A (en) 1990-08-03 1993-09-14 Sterling Drug, Inc. Exonuclease resistant terminally substituted oligonucleotides
WO1992002534A2 (en) 1990-08-03 1992-02-20 Sterling Drug, Inc. Compounds and methods for inhibiting gene expression
US5177196A (en) 1990-08-16 1993-01-05 Microprobe Corporation Oligo (α-arabinofuranosyl nucleotides) and α-arabinofuranosyl precursors thereof
US5512667A (en) 1990-08-28 1996-04-30 Reed; Michael W. Trifunctional intermediates for preparing 3'-tailed oligonucleotides
US5214134A (en) 1990-09-12 1993-05-25 Sterling Winthrop Inc. Process of linking nucleosides with a siloxane bridge
US5561225A (en) 1990-09-19 1996-10-01 Southern Research Institute Polynucleotide analogs containing sulfonate and sulfonamide internucleoside linkages
WO1992005186A1 (en) 1990-09-20 1992-04-02 Gilead Sciences Modified internucleoside linkages
US5432272A (en) 1990-10-09 1995-07-11 Benner; Steven A. Method for incorporating into a DNA or RNA oligonucleotide using nucleotides bearing heterocyclic bases
US5271941A (en) 1990-11-02 1993-12-21 Cho Chung Yoon S Antisense oligonucleotides of human regulatory subunit RI.sub.α of cAMP-dependent protein kinases
ATE198598T1 (de) 1990-11-08 2001-01-15 Hybridon Inc Verbindung von mehrfachreportergruppen auf synthetischen oligonukleotiden
US5539082A (en) 1993-04-26 1996-07-23 Nielsen; Peter E. Peptide nucleic acids
US5714331A (en) 1991-05-24 1998-02-03 Buchardt, Deceased; Ole Peptide nucleic acids having enhanced binding affinity, sequence specificity and solubility
US5719262A (en) 1993-11-22 1998-02-17 Buchardt, Deceased; Ole Peptide nucleic acids having amino acid side chains
US5371241A (en) 1991-07-19 1994-12-06 Pharmacia P-L Biochemicals Inc. Fluorescein labelled phosphoramidites
US5571799A (en) 1991-08-12 1996-11-05 Basco, Ltd. (2'-5') oligoadenylate analogues useful as inhibitors of host-v5.-graft response
EP0538194B1 (de) 1991-10-17 1997-06-04 Novartis AG Bicyclische Nukleoside, Oligonukleotide, Verfahren zu deren Herstellung und Zwischenprodukte
US5594121A (en) 1991-11-07 1997-01-14 Gilead Sciences, Inc. Enhanced triple-helix and double-helix formation with oligomers containing modified purines
US5484908A (en) 1991-11-26 1996-01-16 Gilead Sciences, Inc. Oligonucleotides containing 5-propynyl pyrimidines
US5359044A (en) 1991-12-13 1994-10-25 Isis Pharmaceuticals Cyclobutyl oligonucleotide surrogates
US5565552A (en) 1992-01-21 1996-10-15 Pharmacyclics, Inc. Method of expanded porphyrin-oligonucleotide conjugate synthesis
US5595726A (en) 1992-01-21 1997-01-21 Pharmacyclics, Inc. Chromophore probe for detection of nucleic acid
FR2687679B1 (fr) 1992-02-05 1994-10-28 Centre Nat Rech Scient Oligothionucleotides.
US5633360A (en) 1992-04-14 1997-05-27 Gilead Sciences, Inc. Oligonucleotide analogs capable of passive cell membrane permeation
US5434257A (en) 1992-06-01 1995-07-18 Gilead Sciences, Inc. Binding compentent oligomers containing unsaturated 3',5' and 2',5' linkages
EP0577558A2 (de) 1992-07-01 1994-01-05 Ciba-Geigy Ag Carbocyclische Nukleoside mit bicyclischen Ringen, Oligonukleotide daraus, Verfahren zu deren Herstellung, deren Verwendung und Zwischenproduckte
US5272250A (en) 1992-07-10 1993-12-21 Spielvogel Bernard F Boronated phosphoramidate compounds
US5574142A (en) 1992-12-15 1996-11-12 Microprobe Corporation Peptide linkers for improved oligonucleotide delivery
US5786138A (en) 1993-01-29 1998-07-28 Board Of Supervisors Of Louisiana State University And Agricultural And Mechanical College Hyperstabilizing antisense nucleic acid binding agents
US5476925A (en) 1993-02-01 1995-12-19 Northwestern University Oligodeoxyribonucleotides including 3'-aminonucleoside-phosphoramidate linkages and terminal 3'-amino groups
GB9304618D0 (en) 1993-03-06 1993-04-21 Ciba Geigy Ag Chemical compounds
DK0691968T3 (da) 1993-03-30 1998-02-23 Sanofi Sa Acykliske nukleosid-analoge og oligonukleotidsekvenser indeholdende disse
EP0691977B1 (en) 1993-03-31 1997-11-26 Sanofi Oligonucleotides with amide linkages replacing phosphodiester linkages
DE4311944A1 (de) 1993-04-10 1994-10-13 Degussa Umhüllte Natriumpercarbonatpartikel, Verfahren zu deren Herstellung und sie enthaltende Wasch-, Reinigungs- und Bleichmittelzusammensetzungen
WO1994029444A1 (en) 1993-06-04 1994-12-22 The Government Of The United States Of America, Represented By The Secretary, Department Of Health And Human Services Method for treating kaposi's sarcoma with antisense oligonucleotides
US5502177A (en) 1993-09-17 1996-03-26 Gilead Sciences, Inc. Pyrimidine derivatives for labeled binding partners
US5578716A (en) 1993-12-01 1996-11-26 Mcgill University DNA methyltransferase antisense oligonucleotides
US5457187A (en) 1993-12-08 1995-10-10 Board Of Regents University Of Nebraska Oligonucleotides containing 5-fluorouracil
US5446137B1 (en) 1993-12-09 1998-10-06 Behringwerke Ag Oligonucleotides containing 4'-substituted nucleotides
US5641754A (en) 1994-01-10 1997-06-24 The Board Of Regents Of The University Of Nebraska Antisense oligonucleotide compositions for selectively killing cancer cells
US5519134A (en) 1994-01-11 1996-05-21 Isis Pharmaceuticals, Inc. Pyrrolidine-containing monomers and oligomers
US5596091A (en) 1994-03-18 1997-01-21 The Regents Of The University Of California Antisense oligonucleotides comprising 5-aminoalkyl pyrimidine nucleotides
US5627053A (en) 1994-03-29 1997-05-06 Ribozyme Pharmaceuticals, Inc. 2'deoxy-2'-alkylnucleotide containing nucleic acid
US5625050A (en) 1994-03-31 1997-04-29 Amgen Inc. Modified oligonucleotides and intermediates useful in nucleic acid therapeutics
US5624813A (en) 1994-04-21 1997-04-29 Mahant; Vijay K. NAD(P)+ /NAD(P)H based chemiluminescent diagnostics
US5525711A (en) 1994-05-18 1996-06-11 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Pteridine nucleotide analogs as fluorescent DNA probes
US5597696A (en) 1994-07-18 1997-01-28 Becton Dickinson And Company Covalent cyanine dye oligonucleotide conjugates
JPH10503934A (ja) 1994-08-09 1998-04-14 ノバルティス アクチエンゲゼルシャフト 抗腫瘍性アンチセンスオリゴヌクレオチド
US5597909A (en) 1994-08-25 1997-01-28 Chiron Corporation Polynucleotide reagents containing modified deoxyribose moieties, and associated methods of synthesis and use
US5580731A (en) 1994-08-25 1996-12-03 Chiron Corporation N-4 modified pyrimidine deoxynucleotides and oligonucleotide probes synthesized therewith
US5856103A (en) 1994-10-07 1999-01-05 Board Of Regents The University Of Texas Method for selectively ranking sequences for antisense targeting
US5994320A (en) 1995-02-06 1999-11-30 Regents Of The University Of Minnesota Antisense oligonucleotides and methods for treating central nervous system tumors
IT1275862B1 (it) 1995-03-03 1997-10-24 Consiglio Nazionale Ricerche Trascritto antisenso associato ad alcuni tipi di cellule tumorali ed oligodeossinucleotidi sintetici utili nella diagnosi e nel trattamento
US6040296A (en) 1995-06-07 2000-03-21 East Carolina University Specific antisense oligonucleotide composition & method for treatment of disorders associated with bronchoconstriction and lung inflammation
FR2739029B1 (fr) 1995-09-21 1997-11-21 Roussel Uclaf Nouvelle application therapeutique des composes antimineralo-corticoides
WO1997014709A1 (en) 1995-10-13 1997-04-24 F. Hoffmann-La Roche Ag Antisense oligomers
KR19990071523A (ko) 1995-11-21 1999-09-27 해리 에이. 루스제 Il-8 및 il-8 수용체에 대한 안티센스올리고누클레오티드에 의한 종양 성장의 억제방법
WO1997020942A1 (en) 1995-12-05 1997-06-12 Piao Yun Shang Hsd17b1 promoter, enhancer, silencer and use thereof
EP1007655A1 (en) 1996-02-15 2000-06-14 National Institutes Of Health Rnase l activators and antisense oligonucleotides effective to treat rsv infections
US5955590A (en) 1996-07-15 1999-09-21 Worcester Foundation For Biomedical Research Conjugates of minor groove DNA binders with antisense oligonucleotides
US6046004A (en) 1997-02-27 2000-04-04 Lorne Park Research, Inc. Solution hybridization of nucleic acids with antisense probes having modified backbones
JPH1142091A (ja) 1997-07-25 1999-02-16 Toagosei Co Ltd アンチセンス核酸化合物
US6391311B1 (en) * 1998-03-17 2002-05-21 Genentech, Inc. Polypeptides having homology to vascular endothelial cell growth factor and bone morphogenetic protein 1
US6046319A (en) 1997-10-22 2000-04-04 University Technologies International, Inc. Antisense oligodeoxynucleotides regulating expression of TNF-α
EP1490386B1 (en) 1998-03-10 2008-08-13 Genentech, Inc. Novel polypeptide and nucleic acids encoding the same
HUP0101809A3 (en) 1998-03-11 2002-07-29 Endorech Inc Sainte Foy Inhibitors of type 5 and type 3 17betha-hydroxysteroid dehydrogenase and methods for their use
US6007995A (en) 1998-06-26 1999-12-28 Isis Pharmaceuticals Inc. Antisense inhibition of TNFR1 expression
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US6013522A (en) 1999-02-23 2000-01-11 Isis Pharmaceuticals Inc. Antisense inhibition of human Smad1 expression
US20030104526A1 (en) 1999-03-24 2003-06-05 Qiang Liu Position dependent recognition of GNN nucleotide triplets by zinc fingers
US6025198A (en) 1999-06-25 2000-02-15 Isis Pharmaceuticals Inc. Antisense modulation of Ship-2 expression
US6033910A (en) 1999-07-19 2000-03-07 Isis Pharmaceuticals Inc. Antisense inhibition of MAP kinase kinase 6 expression
FR2801218B1 (fr) 1999-11-23 2001-12-28 Hoechst Marion Roussel Inc Compositions pharmaceutiques comprenant de la trimegestone, leurs procedes de preparation ainsi que le conditionnement primaire les renfermant
US20050144655A1 (en) 2000-10-31 2005-06-30 Economides Aris N. Methods of modifying eukaryotic cells
US6596541B2 (en) 2000-10-31 2003-07-22 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
US7026462B2 (en) 2000-12-07 2006-04-11 Sangamo Biosciences, Inc. Regulation of angiogenesis with zinc finger proteins
WO2002057308A2 (en) 2001-01-22 2002-07-25 Sangamo Biosciences, Inc. Zinc finger polypeptides and their use
US7273923B2 (en) 2001-01-22 2007-09-25 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
ATE347593T1 (de) 2002-01-23 2006-12-15 Univ Utah Res Found Zielgerichtete chromosomale mutagenese mit zinkfingernukleasen
WO2003080809A2 (en) 2002-03-21 2003-10-02 Sangamo Biosciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
EP1581610A4 (en) 2002-09-05 2009-05-27 California Inst Of Techn USE OF CHIMERIC NUCLEASES TO STIMULATE GENE TARGETING
US7754709B2 (en) 2003-06-10 2010-07-13 Solvay Pharmaceuticals Bv Tetracyclic thiophenepyrimidinone compounds as inhibitors of 17β hydroxysteroid dehydrogenase compounds
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
US20090169585A1 (en) 2003-10-23 2009-07-02 Resveratrol Partners, Llc Resveratrol-Containing Compositions And Their Use In Modulating Gene Product Concentration Or Activity
US20050158376A1 (en) 2003-10-23 2005-07-21 Sardi William F. Dietary supplement and method of processing same
US20080299042A1 (en) 2004-04-30 2008-12-04 Biogen Idec Ma Inc. Membrane Associated Molecules
EP2423326B1 (en) 2004-05-07 2014-01-08 Celera Corporation Genetic polymorphism associated with liver fibrosis methods of detection and uses thereof
US20060063231A1 (en) 2004-09-16 2006-03-23 Sangamo Biosciences, Inc. Compositions and methods for protein production
FR2904000A1 (fr) 2006-07-19 2008-01-25 Galderma Res & Dev S N C Snc Modulateurs de hsd17b7 dans le traitement de l'acne ou de l'hyperseborrhee
US20080300170A1 (en) 2006-09-01 2008-12-04 Cohava Gelber Compositions and methods for diagnosis and treatment for type 2 diabetes
US20100267052A1 (en) 2006-09-01 2010-10-21 American Type Culture Collection Compositions and methods for diagnosis and treatment of type 2 diabetes
US7951776B2 (en) 2006-09-01 2011-05-31 American Type Culture Collection Methods for treatment of type 1 diabetes
US20090203602A1 (en) 2006-09-01 2009-08-13 Cohava Gelber Compositions and methods for diagnosis and treatment of type 2 diabetes
WO2008091873A2 (en) 2007-01-24 2008-07-31 Dana-Farber Cancer Institute, Inc. Compositions and methods for the identification, assessment, prevention and therapy of thymic lymphoma or hamartomatous tumours
EP3070169B1 (en) 2006-12-14 2018-05-09 Dow AgroSciences LLC Optimized non-canonical zinc finger proteins
CA2699908C (en) 2007-09-20 2012-09-11 Resveratrol Partners, Llc Resveratrol-containing compositions for modulating gene product concentration or activity
JP2011517838A (ja) 2008-04-11 2011-06-16 ユーティーシー パワー コーポレイション マニホルド・サンプを備えたバイポーラプレートおよび燃料電池
JPWO2009148137A1 (ja) 2008-06-04 2011-11-04 協和発酵キリン株式会社 肥満細胞の脱顆粒を制御する核酸
US20100056384A1 (en) 2008-09-04 2010-03-04 Board Of Regents, The University Of Texas System Sequence Variations in PNPLA3 Associated with Hepatic Steatosis
US20100209427A1 (en) 2008-09-24 2010-08-19 Yu Li Lysine acetylation sites
EP2177615A1 (en) 2008-10-10 2010-04-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for a genome wide identification of expression regulatory sequences and use of genes and molecules derived thereof for the diagnosis and therapy of metabolic and/or tumorous diseases
WO2010064702A1 (ja) 2008-12-05 2010-06-10 国立大学法人 東京大学 癌の予後を予測するためのバイオマーカー
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
CA2697169A1 (en) 2009-03-18 2010-09-18 David Stojdl Compositions and methods for augmenting activity of oncolytic viruses
JP5932632B2 (ja) 2009-03-20 2016-06-15 サンガモ バイオサイエンシーズ, インコーポレイテッド 改変された亜鉛フィンガータンパク質を使用したcxcr4の修飾
US20120028816A1 (en) 2009-03-31 2012-02-02 Warren Stephen T Methods and systems for screening for and diagnosing dna methylation associated with autism spectrum disorders
US8772008B2 (en) 2009-05-18 2014-07-08 Sangamo Biosciences, Inc. Methods and compositions for increasing nuclease activity
WO2010147992A1 (en) 2009-06-15 2010-12-23 Alnylam Pharmaceuticals, Inc. Methods for increasing efficacy of lipid formulated sirna
EP2453735B1 (en) 2009-07-15 2015-07-08 Calimmune Inc. Dual Vector for Inhibition of Human Immunodeficiency Virus
WO2011006214A1 (en) 2009-07-16 2011-01-20 Peter Maccallum Cancer Institute Method of detecting radiation exposure and adverse toxicity thereto
WO2011017293A2 (en) 2009-08-03 2011-02-10 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
WO2011020014A1 (en) 2009-08-14 2011-02-17 Regeneron Pharmaceuticals, Inc. Promoter-regulated differentiation-dependent self-deleting cassette
TR201903376T4 (tr) 2009-10-29 2019-04-22 Regeneron Pharma Çok fonksiyonlu alleller.
WO2011066458A2 (en) 2009-11-25 2011-06-03 Prometheus Laboratories Inc. Novel genomic biomarkers for irritable bowel syndrome diagnosis
CN106834320B (zh) 2009-12-10 2021-05-25 明尼苏达大学董事会 Tal效应子介导的dna修饰
WO2011084747A2 (en) 2009-12-21 2011-07-14 The Johns Hopkins University Compositions and methods for somatic tissue induced pluripotent stem cells having an endoderm origin
US20130029873A1 (en) 2010-04-12 2013-01-31 University Health Network Methods and compositions for diagnosing pulmonary fibrosis subtypes and assessing the risk of primary graft dysfunction after lung transplantation
WO2011128096A1 (en) 2010-04-16 2011-10-20 Roche Diagnostics Gmbh Polymorphism markers for predicting response to interleukin-6 receptor-inhibiting monoclonal antibody drug treatment
CA2799165C (en) 2010-05-12 2022-04-12 Steven E. Schutzer Diagnostic markers for neuropsychiatric disease
WO2011145121A1 (en) 2010-05-18 2011-11-24 Scatolificio Mogliani S.N.C. Di Mogliani Mauro E Andrea Cardboard box for stable stacking with other identical specimens
US8945847B2 (en) 2010-05-24 2015-02-03 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Methods and kits for ascertaining biosafety of an agent
US20120058088A1 (en) 2010-06-28 2012-03-08 Resveratrol Partners, Llc Resveratrol-Containing Compositions And Methods Of Use
CA2804763C (en) 2010-07-14 2023-01-03 The Regents Of The University Of California Biomarkers for diagnosis of transient ischemic attacks
WO2012031008A2 (en) 2010-08-31 2012-03-08 The General Hospital Corporation Cancer-related biological materials in microvesicles
WO2012052953A1 (en) 2010-10-20 2012-04-26 Fondazione Centro San Raffaele Del Monte Tabor MiRNA
WO2012058097A1 (en) 2010-10-26 2012-05-03 Buck Institute For Age Research Downregulation of sine/alu retrotransposon transcription to induce or restore proliferative capacity and/or pluripotency to a stem cell
US9920317B2 (en) 2010-11-12 2018-03-20 The General Hospital Corporation Polycomb-associated non-coding RNAs
AU2011325956B2 (en) 2010-11-12 2016-07-14 The General Hospital Corporation Polycomb-associated non-coding RNAs
WO2012070014A2 (en) 2010-11-26 2012-05-31 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Identification of novel cell surface markers for pancreatic progenitor cells and definite endodermal cells
US20140057800A1 (en) 2010-12-16 2014-02-27 Norwegian Univeristy of Science and Technology (NTNU) Single nucleotide polymorphism associated with risk of insulin resistance development
DK2655621T3 (en) 2010-12-20 2018-08-13 Massachusetts Gen Hospital Polycomb-associated non-coding RNAS
US20140163118A1 (en) 2011-05-03 2014-06-12 Dermachip Inc. Expression Signatures of Genes and Gene Networks Associated with Skin Aging
GB201112246D0 (en) 2011-07-15 2011-08-31 Univ Birmingham Diagnosis of alzheimer's disease
US20130079241A1 (en) 2011-09-15 2013-03-28 Jianhua Luo Methods for Diagnosing Prostate Cancer and Predicting Prostate Cancer Relapse
WO2013126565A1 (en) 2012-02-24 2013-08-29 Lunyak Victoria V Downregulation of sine/alu retrotransposon transcription to induce or restore proliferative capacity and/or pluripotency to a stem cell
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
WO2013166264A2 (en) 2012-05-02 2013-11-07 University Of Georgia Research Foundation, Inc. Methods for altering virus replication
US9677138B2 (en) 2012-05-20 2017-06-13 Trustees Of Boston University Methods and systems for monitoring, diagnosing, and treating chronic obstructive pulmonary disease
UA118014C2 (uk) 2012-05-25 2018-11-12 Те Ріджентс Оф Те Юніверсіті Оф Каліфорнія Спосіб модифікації днк-мішені
US20150147761A1 (en) 2012-06-20 2015-05-28 Helmut E. Meyer Specific biomarkers for hepatocellular carcinoma (hcc)
US20140004153A1 (en) 2012-07-02 2014-01-02 Lancell, L.L.C. Use of somatic mutations in the extracellular domain of transmembrane proteins in a patient's tumor as immunogens for active humoral immunotherapy of cancer
US9526720B2 (en) 2012-08-17 2016-12-27 The Broad Institute, Inc. Modulators of hepatic lipoprotein metabolism
WO2014033644A2 (en) 2012-08-28 2014-03-06 Novartis Ag Methods of nuclease-based genetic engineering
WO2014049071A1 (en) 2012-09-26 2014-04-03 Tangent Reprofiling Limited Modulators of androgen synthesis
US9375433B2 (en) 2012-09-26 2016-06-28 Tangent Reprofiling Limited Modulators of androgen synthesis
CN110669746B (zh) 2012-10-23 2024-04-16 基因工具股份有限公司 用于切割靶dna的组合物及其用途
LT2929031T (lt) 2012-12-05 2018-02-12 Alnylam Pharmaceuticals, Inc. Pcsk9 irna kompozicijos ir jų naudojimo būdai
IL300199A (en) 2012-12-06 2023-03-01 Sigma Aldrich Co Llc CRISPR-based genome modification and regulation
WO2014089486A1 (en) 2012-12-07 2014-06-12 Shire Human Genetic Therapies, Inc. Lipidic nanoparticles for mrna delivering
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
DK2921557T3 (en) 2012-12-12 2016-11-07 Broad Inst Inc Design of systems, methods and optimized sequence manipulation guide compositions
RU2721275C2 (ru) 2012-12-12 2020-05-18 Те Брод Инститьют, Инк. Доставка, конструирование и оптимизация систем, способов и композиций для манипуляции с последовательностями и применения в терапии
ES2741951T3 (es) 2012-12-17 2020-02-12 Harvard College Modificación por ingeniería genética del genoma humano guiada por ARN
ES2904803T3 (es) 2013-02-20 2022-04-06 Regeneron Pharma Modificación genética de ratas
JP2016507244A (ja) 2013-02-27 2016-03-10 ヘルムホルツ・ツェントルム・ミュンヒェン・ドイチェス・フォルシュンクスツェントルム・フューア・ゲズントハイト・ウント・ウムベルト(ゲーエムベーハー)Helmholtz Zentrum MuenchenDeutsches Forschungszentrum fuer Gesundheit und Umwelt (GmbH) Cas9ヌクレアーゼによる卵母細胞における遺伝子編集
US10526655B2 (en) * 2013-03-14 2020-01-07 Veracyte, Inc. Methods for evaluating COPD status
CA2915653A1 (en) 2013-03-14 2014-10-02 Genomedx Biosciences, Inc. Cancer biomarkers and classifiers and uses thereof
EP3431592A1 (en) 2013-03-14 2019-01-23 Translate Bio, Inc. Mrna therapeutic compositions and use to treat diseases and disorders
CA3161835A1 (en) 2013-03-15 2014-09-25 The General Hospital Corporation Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
EP2971128B1 (en) 2013-03-15 2023-03-01 Veracyte, Inc. Biomarkers for diagnosis of lung diseases and methods of use thereof
US20140329704A1 (en) 2013-03-28 2014-11-06 President And Fellows Of Harvard College Markers for mature beta-cells and methods of using the same
CN105518146B (zh) 2013-04-04 2022-07-15 哈佛学院校长同事会 利用CRISPR/Cas系统的基因组编辑的治疗性用途
GB201306536D0 (en) 2013-04-10 2013-05-22 Gt Biolog Ltd Polypeptide and immune modulation
JP2016518142A (ja) 2013-05-10 2016-06-23 サンガモ バイオサイエンシーズ, インコーポレイテッド ヌクレアーゼ媒介ゲノム遺伝子操作のための送達方法および組成物
US9574241B2 (en) 2013-06-03 2017-02-21 The Trustees Of Columbia University In The City Of New York Recurrent mutations in epigenetic regulators, RHOA and FYN kinase in peripheral T-cell lymphomas
EP3004376B1 (en) 2013-06-03 2018-05-09 Nestec S.A. Methods for diagnosing chronic valvular disease
US9267135B2 (en) 2013-06-04 2016-02-23 President And Fellows Of Harvard College RNA-guided transcriptional regulation
CN113425857A (zh) 2013-06-17 2021-09-24 布罗德研究所有限公司 用于肝靶向和治疗的crispr-cas系统、载体和组合物的递送与用途
AU2014281030B2 (en) 2013-06-17 2020-07-09 Massachusetts Institute Of Technology Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells
US20150079061A1 (en) 2013-07-12 2015-03-19 Patrick J. Casey Method for the harvesting, processing, and storage of proteins from the mammalian feto-placental unit and use of such proteins in compositions and medical treatment
US20150079062A1 (en) 2013-07-12 2015-03-19 Patrick J. Casey Method for harvesting, processing, and storage of proteins from the mammalian feto-placental unit and use of such proteins in compositions and medical treatment
RU2545990C2 (ru) 2013-07-16 2015-04-10 Государственное бюджетное учреждение здравоохранения города Москвы Московский клинический научно-практический центр Департамента здравоохранения города Москвы Способ дифференциальной диагностики стеатоза печени и стеатогепатита
CN110713995B (zh) 2013-10-17 2023-08-01 桑格摩生物科学股份有限公司 用于核酸酶介导的基因组工程改造的递送方法和组合物
CN105813656B (zh) 2013-10-22 2021-01-15 夏尔人类遗传性治疗公司 用于递送信使rna的脂质制剂
CN103520724B (zh) 2013-10-23 2016-05-25 江苏美迪森生物医药有限公司 Hsd17b13蛋白或其编码基因的抑制剂的新用途
GB201320061D0 (en) 2013-11-13 2013-12-25 Electrophoretics Ltd Materials nad methods for diagnosis and prognosis of liver cancer
WO2015127439A1 (en) 2014-02-24 2015-08-27 Sangamo Biosciences, Inc. Methods and compositions for nuclease-mediated targeted integration
EP3139923B1 (en) 2014-05-09 2023-09-27 Tangent Reprofiling Limited Composition for treating pancreatic adenocarcinoma
CA2951707A1 (en) 2014-06-10 2015-12-17 Massachusetts Institute Of Technology Method for gene editing
CA2952697A1 (en) 2014-06-16 2015-12-23 The Johns Hopkins University Compositions and methods for the expression of crispr guide rnas using the h1 promoter
US10588980B2 (en) 2014-06-23 2020-03-17 Novartis Ag Fatty acids and their use in conjugation to biomolecules
US20150376586A1 (en) 2014-06-25 2015-12-31 Caribou Biosciences, Inc. RNA Modification to Engineer Cas9 Activity
WO2016004387A1 (en) 2014-07-02 2016-01-07 H. Lee Moffitt Cancer Center And Research Institute, Inc. Gene expression signature for cancer prognosis
CA2955157A1 (en) 2014-07-14 2016-01-21 Patrick J. Casey Method for the harvesting, processing, and storage of proteins from the mammalian feto-placental unit and use of such proteins in compositions and medical treatment
US20170247758A1 (en) 2014-08-18 2017-08-31 Drexel University Methods, computer-readable media, and systems for assessing samples and wounds, predicting whether a wound will heal, and monitoring effectiveness of a treatment
CN114606309A (zh) 2014-11-05 2022-06-10 威拉赛特公司 使用机器学习和高维转录数据的诊断系统和方法
CA2976445A1 (en) 2015-02-13 2016-08-18 Alnylam Pharmaceuticals, Inc. Patatin-like phospholipase domain containing 3 (pnpla3) irna compositions and methods of use thereof
CN104698108B (zh) 2015-03-26 2016-11-09 中国药科大学 一种利用固定化酶筛选I型17β羟类固醇脱氢酶抑制剂的方法
EP3350328A1 (en) 2015-09-14 2018-07-25 Alnylam Pharmaceuticals, Inc. Polynucleotide agents targeting patatin-like phospholipase domain containing 3 (pnpla3) and methods of use thereof
EP3159407A1 (en) 2015-10-23 2017-04-26 Silence Therapeutics (London) Ltd Guide rnas, methods and uses
WO2017100542A1 (en) 2015-12-10 2017-06-15 Alnylam Pharmaceuticals, Inc. Sterol regulatory element binding protein (srebp) chaperone (scap) irna compositions and methods of use thereof
CA3005090A1 (en) 2015-12-14 2017-06-22 Cold Spring Harbor Laboratory Compositions and methods for treatment of liver diseases
JP7049249B2 (ja) 2015-12-14 2022-04-06 コールド スプリング ハーバー ラボラトリー 中枢神経系疾患の処置のための組成物および方法
JP2018538288A (ja) 2015-12-14 2018-12-27 コールド スプリング ハーバー ラボラトリー アラジール症候群の処置のためのアンチセンスオリゴマー
CA3005249A1 (en) 2015-12-14 2017-06-22 Cold Spring Harbor Laboratory Compositions and methods for treatment of kidney diseases
WO2017106375A1 (en) 2015-12-14 2017-06-22 Cold Spring Harbor Laboratory Antisense oligomers for treatment of tuberous sclerosis complex
EP3390634A4 (en) 2015-12-14 2019-08-14 Cold Spring Harbor Laboratory COMPOSITIONS AND METHODS FOR THE TREATMENT OF EYE DISEASES
WO2017106364A2 (en) 2015-12-14 2017-06-22 Cold Spring Harbor Laboratory Compositions and methods for treatment of retinitis pigmentosa 18 and retinitis pigmentosa 13
CN109790643A (zh) 2016-03-09 2019-05-21 分子听诊器公司 用于检测组织状况的方法和系统
IL295513B1 (en) 2016-03-16 2024-04-01 Spogen Biotech Inc Methods for promoting plant health using free enzymes and microorganisms that cause enzyme overexpression
EP3452101A2 (en) 2016-05-04 2019-03-13 CureVac AG Rna encoding a therapeutic protein
US10036024B2 (en) 2016-06-03 2018-07-31 Purdue Research Foundation siRNA compositions that specifically downregulate expression of a variant of the PNPLA3 gene and methods of use thereof for treating a chronic liver disease or alcoholic liver disease (ALD)
GB201609977D0 (en) 2016-06-08 2016-07-20 Cancer Rec Tech Ltd Chemosensitivity predictive biomarkers
US10767175B2 (en) 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
KR102595683B1 (ko) 2016-12-08 2023-10-31 인텔리아 테라퓨틱스, 인크. 변형된 가이드 rna
WO2018107026A1 (en) 2016-12-09 2018-06-14 Sangamo Therapeutics, Inc. Delivery of target specific nucleases
WO2018112282A1 (en) 2016-12-14 2018-06-21 Ligandal, Inc. Compositions and methods for nucleic acid and/or protein payload delivery
BR112019014841A2 (pt) 2017-01-23 2020-04-28 Regeneron Pharma rna guia, uso do rna guia, rna antissentido, sirna ou shrna, uso do rna antissentido, do sirna ou do shrna, ácido nucleico isolado, vetor, composição, célula, e, métodos para modificar um gene hsd17b13 em uma célula, para diminuir a expressão de um gene hsd17b13 em uma célula, para modificar uma célula e para tratar um indivíduo que não é portador da variante de hsd17b13
EP3635121A1 (en) 2017-06-02 2020-04-15 Institut National de la Sante et de la Recherche Medicale (INSERM) Viral vector combining gene therapy and genome editing approaches for gene therapy of genetic disorders
WO2019075181A1 (en) 2017-10-11 2019-04-18 Regeneron Pharmaceuticals, Inc. INHIBITION OF HSD17B13 IN THE TREATMENT OF HEPATIC DISEASE IN PATIENTS EXPRESSING PNPLA3 I148M VARIATION
US20210000906A1 (en) 2018-03-21 2021-01-07 Ionis Pharmaceuticals, Inc. Modulation of hsd17b13 expression
SG11202007583SA (en) 2018-03-21 2020-09-29 Regeneron Pharma 17β-HYDROXYSTEROID DEHYDROGENASE TYPE 13 (HSD17B13) iRNA COMPOSITIONS AND METHODS OF USE THEREOF
US11690921B2 (en) 2018-05-18 2023-07-04 Sangamo Therapeutics, Inc. Delivery of target specific nucleases
CA3102950A1 (en) 2018-06-08 2019-12-12 Intellia Therapeutics, Inc. Modified guide rnas for gene editing
JP2021528426A (ja) 2018-06-19 2021-10-21 ザ ボード オブ リージェンツ オブ ザ ユニバーシティー オブ テキサス システム mRNAおよび長い核酸の送達のための脂質ナノ粒子組成物

Also Published As

Publication number Publication date
KR20190112004A (ko) 2019-10-02
CN110446785B (zh) 2024-04-26
MX2019008755A (es) 2019-12-16
JP2020513784A (ja) 2020-05-21
JP2022095909A (ja) 2022-06-28
IL293377B1 (en) 2023-04-01
EP3571321A1 (en) 2019-11-27
JP2024038085A (ja) 2024-03-19
RU2019126483A3 (pt) 2021-06-29
MX2022015080A (es) 2023-01-18
US20180216104A1 (en) 2018-08-02
IL267925A (en) 2019-09-26
RU2021133626A (ru) 2022-01-31
RU2019126483A (ru) 2021-02-24
IL285053B (en) 2022-07-01
US11485958B2 (en) 2022-11-01
US20200354693A1 (en) 2020-11-12
CN110199032A (zh) 2019-09-03
IL268156A (en) 2019-09-26
MX2022015081A (es) 2023-01-18
RU2760851C2 (ru) 2021-11-30
US20180216084A1 (en) 2018-08-02
US20220267743A1 (en) 2022-08-25
JP7425106B2 (ja) 2024-01-30
IL301053A (en) 2023-05-01
IL285053A (en) 2021-08-31
IL293377B2 (en) 2023-08-01
SG11201905508VA (en) 2019-08-27
KR102619197B1 (ko) 2024-01-03
SG11201906735RA (en) 2019-08-27
AU2022203239A1 (en) 2022-06-02
JP7094963B2 (ja) 2022-07-04
AU2018209950B2 (en) 2023-02-09
JP7458785B2 (ja) 2024-04-01
AU2018210364A1 (en) 2019-08-15
AU2018210364B2 (en) 2022-03-17
WO2018136702A1 (en) 2018-07-26
KR20240001333A (ko) 2024-01-03
US11753628B2 (en) 2023-09-12
CA3049980A1 (en) 2018-07-26
US11845963B2 (en) 2023-12-19
EP3571301A1 (en) 2019-11-27
IL267925B (en) 2021-08-31
AU2023202663A1 (en) 2023-05-25
NZ755715A (en) 2021-10-29
CN110446785A (zh) 2019-11-12
RU2019126354A (ru) 2021-02-24
US10787647B2 (en) 2020-09-29
US20240141305A1 (en) 2024-05-02
IL293377A (en) 2022-07-01
MX2019008675A (es) 2019-09-18
RU2019126354A3 (pt) 2021-05-04
JP2023175705A (ja) 2023-12-12
MX2022015079A (es) 2023-01-18
AU2018209950A1 (en) 2019-09-12
CA3047429A1 (en) 2018-07-26
US20230031669A1 (en) 2023-02-02
WO2018136758A1 (en) 2018-07-26
KR20190111067A (ko) 2019-10-01
JP2020505920A (ja) 2020-02-27

Similar Documents

Publication Publication Date Title
US11485958B2 (en) HSD17B13 variants and uses thereof
Lauri et al. The mitochondrial genome in aging and senescence
US20200399617A1 (en) B4GALT1 Variants And Uses Thereof
WO2017041063A2 (en) Compositions and methods for identifying genetic predisposition to obesity and for enhancing adipogenesis
Crittenden et al. Inhibition of SULT4A1 expression induces up-regulation of phototransduction gene expression in 72-hour postfertilization zebrafish larvae
NZ796466A (en) Hsd17b13 variants and uses thereof
NZ755715B2 (en) Hsd17b13 variants and uses thereof
NZ785361A (en) Hsd17b13 variants and uses thereof
NZ796465A (en) Hsd17b13 variants and uses thereof
Silva-Pinheiro et al. In vivo and in vitro mechanistic characterization of a clinically relevant PolγA mutation
Rivolta et al. SWISS RNA WORKSHOP

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]