KR20200062314A - Pnpla3 i148m 변이를 발현하는 환자의 간 질환의 치료에서의 hsd17b13의 저해 - Google Patents
Pnpla3 i148m 변이를 발현하는 환자의 간 질환의 치료에서의 hsd17b13의 저해 Download PDFInfo
- Publication number
- KR20200062314A KR20200062314A KR1020207013128A KR20207013128A KR20200062314A KR 20200062314 A KR20200062314 A KR 20200062314A KR 1020207013128 A KR1020207013128 A KR 1020207013128A KR 20207013128 A KR20207013128 A KR 20207013128A KR 20200062314 A KR20200062314 A KR 20200062314A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- hsd17b13
- protein
- nucleic acid
- liver disease
- Prior art date
Links
- 102100037429 17-beta-hydroxysteroid dehydrogenase 13 Human genes 0.000 title claims abstract description 1016
- 101000806241 Homo sapiens 17-beta-hydroxysteroid dehydrogenase 13 Proteins 0.000 title claims abstract description 1015
- 102200129022 rs738409 Human genes 0.000 title claims abstract description 217
- 208000019423 liver disease Diseases 0.000 title claims abstract description 152
- 238000011282 treatment Methods 0.000 title claims abstract description 10
- 230000035772 mutation Effects 0.000 title claims description 40
- 230000005764 inhibitory process Effects 0.000 title description 6
- 238000000034 method Methods 0.000 claims abstract description 248
- 230000002401 inhibitory effect Effects 0.000 claims abstract description 98
- 239000003112 inhibitor Substances 0.000 claims abstract description 54
- 241000282414 Homo sapiens Species 0.000 claims abstract description 45
- 150000007523 nucleic acids Chemical class 0.000 claims description 614
- 102100031251 1-acylglycerol-3-phosphate O-acyltransferase PNPLA3 Human genes 0.000 claims description 392
- 101001129184 Homo sapiens 1-acylglycerol-3-phosphate O-acyltransferase PNPLA3 Proteins 0.000 claims description 340
- 239000002299 complementary DNA Substances 0.000 claims description 314
- 102000039446 nucleic acids Human genes 0.000 claims description 275
- 108020004707 nucleic acids Proteins 0.000 claims description 275
- 108020004999 messenger RNA Proteins 0.000 claims description 269
- 150000001413 amino acids Chemical group 0.000 claims description 252
- 239000000523 sample Substances 0.000 claims description 227
- 108020004414 DNA Proteins 0.000 claims description 194
- 239000002773 nucleotide Substances 0.000 claims description 175
- 125000003729 nucleotide group Chemical group 0.000 claims description 174
- 108020004705 Codon Proteins 0.000 claims description 128
- 108090000623 proteins and genes Proteins 0.000 claims description 110
- 102000004169 proteins and genes Human genes 0.000 claims description 83
- 208000008338 non-alcoholic fatty liver disease Diseases 0.000 claims description 72
- 208000022309 Alcoholic Liver disease Diseases 0.000 claims description 66
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 52
- 229930182817 methionine Natural products 0.000 claims description 52
- 238000012163 sequencing technique Methods 0.000 claims description 41
- 206010053219 non-alcoholic steatohepatitis Diseases 0.000 claims description 37
- 231100000240 steatosis hepatitis Toxicity 0.000 claims description 32
- 206010016654 Fibrosis Diseases 0.000 claims description 29
- 230000007882 cirrhosis Effects 0.000 claims description 29
- 208000019425 cirrhosis of liver Diseases 0.000 claims description 28
- 230000007863 steatosis Effects 0.000 claims description 26
- 206010073071 hepatocellular carcinoma Diseases 0.000 claims description 23
- 231100000844 hepatocellular carcinoma Toxicity 0.000 claims description 23
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 18
- 229930024421 Adenine Natural products 0.000 claims description 14
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 14
- 108700028369 Alleles Proteins 0.000 claims description 14
- 229960000643 adenine Drugs 0.000 claims description 14
- 238000003018 immunoassay Methods 0.000 claims description 9
- 208000004930 Fatty Liver Diseases 0.000 claims description 7
- 208000010706 fatty liver disease Diseases 0.000 claims description 7
- 206010019708 Hepatic steatosis Diseases 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 6
- 102100022582 (3R)-3-hydroxyacyl-CoA dehydrogenase Human genes 0.000 claims description 2
- 101710120738 (3R)-3-hydroxyacyl-CoA dehydrogenase Proteins 0.000 claims description 2
- 102100037425 17-beta-hydroxysteroid dehydrogenase 14 Human genes 0.000 claims description 2
- 102100037426 17-beta-hydroxysteroid dehydrogenase type 1 Human genes 0.000 claims description 2
- 102100022586 17-beta-hydroxysteroid dehydrogenase type 2 Human genes 0.000 claims description 2
- 102100022585 17-beta-hydroxysteroid dehydrogenase type 3 Human genes 0.000 claims description 2
- 102100038794 17-beta-hydroxysteroid dehydrogenase type 6 Human genes 0.000 claims description 2
- 102100039358 3-hydroxyacyl-CoA dehydrogenase type-2 Human genes 0.000 claims description 2
- 102100022584 3-keto-steroid reductase/17-beta-hydroxysteroid dehydrogenase 7 Human genes 0.000 claims description 2
- 102100023400 Estradiol 17-beta-dehydrogenase 11 Human genes 0.000 claims description 2
- 101000806245 Homo sapiens 17-beta-hydroxysteroid dehydrogenase 14 Proteins 0.000 claims description 2
- 101000806242 Homo sapiens 17-beta-hydroxysteroid dehydrogenase type 1 Proteins 0.000 claims description 2
- 101001045223 Homo sapiens 17-beta-hydroxysteroid dehydrogenase type 2 Proteins 0.000 claims description 2
- 101001045211 Homo sapiens 17-beta-hydroxysteroid dehydrogenase type 3 Proteins 0.000 claims description 2
- 101001031333 Homo sapiens 17-beta-hydroxysteroid dehydrogenase type 6 Proteins 0.000 claims description 2
- 101001035740 Homo sapiens 3-hydroxyacyl-CoA dehydrogenase type-2 Proteins 0.000 claims description 2
- 101001045215 Homo sapiens 3-keto-steroid reductase/17-beta-hydroxysteroid dehydrogenase 7 Proteins 0.000 claims description 2
- 101000907855 Homo sapiens Estradiol 17-beta-dehydrogenase 11 Proteins 0.000 claims description 2
- 101001045218 Homo sapiens Peroxisomal multifunctional enzyme type 2 Proteins 0.000 claims description 2
- 101000806155 Homo sapiens Short-chain dehydrogenase/reductase 3 Proteins 0.000 claims description 2
- 101000806266 Homo sapiens Very-long-chain 3-oxoacyl-CoA reductase Proteins 0.000 claims description 2
- 229940123774 Hydroxysteroid 17-beta dehydrogenase 13 inhibitor Drugs 0.000 claims description 2
- 102100022587 Peroxisomal multifunctional enzyme type 2 Human genes 0.000 claims description 2
- 102100037857 Short-chain dehydrogenase/reductase 3 Human genes 0.000 claims description 2
- 102100037438 Very-long-chain 3-oxoacyl-CoA reductase Human genes 0.000 claims description 2
- 101001111656 Homo sapiens Retinol dehydrogenase 10 Proteins 0.000 claims 1
- 102100023918 Retinol dehydrogenase 10 Human genes 0.000 claims 1
- 230000001681 protective effect Effects 0.000 abstract description 7
- 108010029485 Protein Isoforms Proteins 0.000 description 385
- 102000001708 Protein Isoforms Human genes 0.000 description 385
- 108091028043 Nucleic acid sequence Proteins 0.000 description 309
- 230000006870 function Effects 0.000 description 163
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 91
- 235000018102 proteins Nutrition 0.000 description 81
- 102000053602 DNA Human genes 0.000 description 59
- 238000009396 hybridization Methods 0.000 description 47
- 102220282751 rs1555594589 Human genes 0.000 description 40
- 230000000295 complement effect Effects 0.000 description 31
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 28
- 230000004075 alteration Effects 0.000 description 25
- 229940024606 amino acid Drugs 0.000 description 24
- 235000001014 amino acid Nutrition 0.000 description 24
- 238000003556 assay Methods 0.000 description 23
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 22
- 238000003199 nucleic acid amplification method Methods 0.000 description 20
- VYXXMAGSIYIYGD-NWAYQTQBSA-N propan-2-yl 2-[[[(2R)-1-(6-aminopurin-9-yl)propan-2-yl]oxymethyl-(pyrimidine-4-carbonylamino)phosphoryl]amino]-2-methylpropanoate Chemical compound CC(C)OC(=O)C(C)(C)NP(=O)(CO[C@H](C)Cn1cnc2c(N)ncnc12)NC(=O)c1ccncn1 VYXXMAGSIYIYGD-NWAYQTQBSA-N 0.000 description 20
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 19
- 230000003321 amplification Effects 0.000 description 19
- 230000004071 biological effect Effects 0.000 description 17
- 239000012472 biological sample Substances 0.000 description 16
- 230000008859 change Effects 0.000 description 15
- 239000012634 fragment Substances 0.000 description 15
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 12
- 239000000758 substrate Substances 0.000 description 12
- 230000000692 anti-sense effect Effects 0.000 description 11
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical group NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 11
- 102000040430 polynucleotide Human genes 0.000 description 11
- 108091033319 polynucleotide Proteins 0.000 description 11
- 239000002157 polynucleotide Substances 0.000 description 11
- 229940113082 thymine Drugs 0.000 description 11
- 238000005406 washing Methods 0.000 description 11
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 238000001514 detection method Methods 0.000 description 10
- 229920001184 polypeptide Polymers 0.000 description 10
- 102000004196 processed proteins & peptides Human genes 0.000 description 10
- 108090000765 processed proteins & peptides Proteins 0.000 description 10
- 239000004055 small Interfering RNA Substances 0.000 description 10
- 230000014509 gene expression Effects 0.000 description 7
- 108091093088 Amplicon Proteins 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 108091027967 Small hairpin RNA Proteins 0.000 description 5
- 108020004459 Small interfering RNA Proteins 0.000 description 5
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 5
- 229940104302 cytosine Drugs 0.000 description 5
- -1 epitope tag Proteins 0.000 description 5
- 238000007901 in situ hybridization Methods 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 238000003752 polymerase chain reaction Methods 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 4
- 108010082126 Alanine transaminase Proteins 0.000 description 4
- 108010003415 Aspartate Aminotransferases Proteins 0.000 description 4
- 102000004625 Aspartate Aminotransferases Human genes 0.000 description 4
- 101150000579 Hsd17b13 gene Proteins 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 238000003559 RNA-seq method Methods 0.000 description 4
- 238000010240 RT-PCR analysis Methods 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 210000004185 liver Anatomy 0.000 description 4
- 238000002844 melting Methods 0.000 description 4
- 230000008018 melting Effects 0.000 description 4
- 238000002864 sequence alignment Methods 0.000 description 4
- 102000002057 Patatin-like phospholipase domains Human genes 0.000 description 3
- 108050009491 Patatin-like phospholipase domains Proteins 0.000 description 3
- 102100035330 Transmembrane 6 superfamily member 2 Human genes 0.000 description 3
- 208000010002 alcoholic liver cirrhosis Diseases 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 238000007834 ligase chain reaction Methods 0.000 description 3
- 230000004777 loss-of-function mutation Effects 0.000 description 3
- 238000007899 nucleic acid hybridization Methods 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000010839 reverse transcription Methods 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- 206010009208 Cirrhosis alcoholic Diseases 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 2
- 208000005176 Hepatitis C Diseases 0.000 description 2
- 101000597918 Homo sapiens Transmembrane 6 superfamily member 2 Proteins 0.000 description 2
- 102100034343 Integrase Human genes 0.000 description 2
- 206010067125 Liver injury Diseases 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 208000008589 Obesity Diseases 0.000 description 2
- 102000012464 Retinol dehydrogenase 10 Human genes 0.000 description 2
- 108050002017 Retinol dehydrogenase 10 Proteins 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 101710142587 Short-chain dehydrogenase/reductase Proteins 0.000 description 2
- 102000003929 Transaminases Human genes 0.000 description 2
- 108090000340 Transaminases Proteins 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000003149 assay kit Methods 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000007707 calorimetry Methods 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 231100000517 death Toxicity 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000004761 fibrosis Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 231100000234 hepatic damage Toxicity 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 230000008818 liver damage Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 235000020824 obesity Nutrition 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000000049 pigment Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002285 radioactive effect Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 239000001509 sodium citrate Substances 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 102100036506 11-beta-hydroxysteroid dehydrogenase 1 Human genes 0.000 description 1
- 102100031236 11-beta-hydroxysteroid dehydrogenase type 2 Human genes 0.000 description 1
- 101710194118 17-beta-hydroxysteroid dehydrogenase 13 Proteins 0.000 description 1
- 102100039082 3 beta-hydroxysteroid dehydrogenase/Delta 5->4-isomerase type 1 Human genes 0.000 description 1
- 108020005065 3' Flanking Region Proteins 0.000 description 1
- YRNWIFYIFSBPAU-UHFFFAOYSA-N 4-[4-(dimethylamino)phenyl]-n,n-dimethylaniline Chemical compound C1=CC(N(C)C)=CC=C1C1=CC=C(N(C)C)C=C1 YRNWIFYIFSBPAU-UHFFFAOYSA-N 0.000 description 1
- 108020005029 5' Flanking Region Proteins 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 108020004491 Antisense DNA Proteins 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 240000003291 Armoracia rusticana Species 0.000 description 1
- 235000011330 Armoracia rusticana Nutrition 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 208000006154 Chronic hepatitis C Diseases 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 108010069514 Cyclic Peptides Proteins 0.000 description 1
- 102000001189 Cyclic Peptides Human genes 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 244000148064 Enicostema verticillatum Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- VZCYOOQTPOCHFL-OWOJBTEDSA-N Fumaric acid Chemical compound OC(=O)\C=C\C(O)=O VZCYOOQTPOCHFL-OWOJBTEDSA-N 0.000 description 1
- 229920002683 Glycosaminoglycan Polymers 0.000 description 1
- 101000928753 Homo sapiens 11-beta-hydroxysteroid dehydrogenase 1 Proteins 0.000 description 1
- 101000845090 Homo sapiens 11-beta-hydroxysteroid dehydrogenase type 2 Proteins 0.000 description 1
- 101000744065 Homo sapiens 3 beta-hydroxysteroid dehydrogenase/Delta 5->4-isomerase type 1 Proteins 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- 102000000020 Lipid Droplet Associated Proteins Human genes 0.000 description 1
- 108010080221 Lipid Droplet Associated Proteins Proteins 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 1
- 229920002732 Polyanhydride Polymers 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 229920000954 Polyglycolide Polymers 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 239000004809 Teflon Substances 0.000 description 1
- 229920006362 Teflon® Polymers 0.000 description 1
- 101710140337 Transmembrane 6 superfamily member 2 Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- 230000001476 alcoholic effect Effects 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 239000003816 antisense DNA Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 238000002820 assay format Methods 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229920001971 elastomer Polymers 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000002509 fluorescent in situ hybridization Methods 0.000 description 1
- NBVXSUQYWXRMNV-UHFFFAOYSA-N fluoromethane Chemical compound FC NBVXSUQYWXRMNV-UHFFFAOYSA-N 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 210000003731 gingival crevicular fluid Anatomy 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 208000010710 hepatitis C virus infection Diseases 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000003365 immunocytochemistry Methods 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 238000003364 immunohistochemistry Methods 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 238000010197 meta-analysis Methods 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 238000003645 oxidoreductase activity assay Methods 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 229920000747 poly(lactic acid) Polymers 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 239000004633 polyglycolic acid Substances 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 239000004626 polylactic acid Substances 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000000734 protein sequencing Methods 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- SBEQWOXEGHQIMW-UHFFFAOYSA-N silicon Chemical compound [Si].[Si] SBEQWOXEGHQIMW-UHFFFAOYSA-N 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000011343 solid material Substances 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- UFTFJSFQGQCHQW-UHFFFAOYSA-N triformin Chemical compound O=COCC(OC=O)COC=O UFTFJSFQGQCHQW-UHFFFAOYSA-N 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/713—Double-stranded nucleic acids or oligonucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
- A61P1/16—Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/106—Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Medicinal Chemistry (AREA)
- Plant Pathology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Gastroenterology & Hepatology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Epidemiology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
본 개시내용은 HSD17B13을 저해함으로써 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법을 제공한다. 본 개시내용은 또한 HSD17B13의 저해제를 투여함으로써 PNPLA3 Ile148Met+인 대상체를 치료하는 방법을 제공한다. 본 개시내용은 또한 대상체에서 PNPLA3 Ile148Met 변이체 및 기능성 HSD17B13을 검출하는 방법을 제공한다. 본 개시내용은 또한 간 질환에 대해서 보호 효과를 갖는 대상체를 식별하는 방법을 제공한다. 본 개시내용은 또한 간 질환의 치료에 사용하기 위한 HSD17B13의 저해제를 제공한다.
Description
서열 목록에 대한 참고
본 출원은 2018년 10월 10일자로 생성되고, 238KB의 크기를 갖는, 파일명 18923801002SEQ의 텍스트 파일로서 전자적으로 제출된 서열 목록을 포함한다. 서열 목록은 참조에 의해 본 명세서에 포함된다.
기술분야
본 개시내용은 일반적으로 정밀 의료의 분야에 관한 것이다. 보다 특별하게는, 본 개시내용은 파타틴 유사 포스포리파제 도메인 함유 3(patatin like phospholipase domain containing 3: PNPLA3) Ile148Met 양성이고, 간 질환 또는 간 질환에 대한 민감성을 갖는 대상체를 식별하는 방법 및 이러한 대상체를 하이드록시스테로이드 17-베타 데하이드로게나제 13(hydroxysteroid 17-beta dehydrogenase 13: HSD17B13)의 저해제로 치료하는 방법에 관한 것이다.
특허, 특허 출원, 공개된 특허 출원, 등록 번호, 기술 논문 및 학술 논문을 비롯한 다양한 참고문헌이 본 명세서 전체에서 인용된다. 각각의 참고문헌은 본 명세서에서 전체적으로 그리고 모든 목적을 위해서 참조에 의해 포함된다.
만성 간 질환 및 간경변은 미국에서 질병률 및 사망률의 선두적인 원인이며, 2014년에 사망자는 38,170명(전체 사망의 1.5%)을 차지한다(Kochanek et al., Nat'l. Vital Stat. Rep., 2016, 65, 1-122). 미국에서 간경변의 가장 일반적인 병인론은 알코올성 간 질환, 만성 C형 간염, 및 비알코올성 지방 간 질환(nonalcoholic fatty liver disease: NAFLD)이며, 2004년에서 2013년 사이에 간 이식을 기다리는 환자의 약 80%를 차지한다(Wong et al., Gastroenterology, 2015, 148, 547-555). 미국에서 NAFLD의 예측된 유병률은 19 내지 46%(Browning et al., Hepatology, 2004, 40, 1387-1395; Lazo et al., Am. J. Epidemiol., 2013, 178, 38-45; 및 Williams et al., Gastroenterology, 2011, 140, 124-131)이고, 아마도 이의 주요 인자인 비만율 증가(Cohen et al., Science, 2011, 332, 1519-1523)와 관련하여 점점 증가하고 있다(Younossi et al., Clin. Gastroenterol. Hepatol., 2011, 9, 524-530). C형 간염의 치료에서 상당한 진전이 이루어졌지만, 알코올성 또는 비알코올성 간 질환 및 간경변에 대해서는 현재 어떠한 증거 기반 치료법도 존재하지 않는다.
이전의 전장 유전체 연관성 연구(genome wide association studies: GWAS)는 만성 간 질환의 위험성 증가와 연관된 서열 변이를 식별하였다. 가장 강력하게 검증된 연관성은 유전자 PNPLA3에 의해서 암호화된, 파타틴-유사 포스포리파제 도메인-함유 3에서의 일반적인 미스센스 변이체와의 연관성이다. 이러한 변이체(rs738409, p.Ile148Met)는 초기에 간 트라이글리세리드 수준의 증가와 연관되고(Romeo et al., Nat. Genet., 2008, 40, 1461-5), 그 다음 비알코올성 지방간염(NASH)(Rotman et al., Hepatology, 2010, 52, 894-903; Sookoian et al., J. Lipid Res., 2009, 50, 2111-2116) 및 간경변(Shen et al., J. Lipid Res., 2015, 56, 167-175)과 연관되는 것으로 밝혀졌다. 막관통 6 슈퍼패밀리 구성원 2를 암호화하는 TM6SF2에서의 미스센스 변이체가 또한 비알코올성 지방간 질환(NAFLD)의 위험을 증가시킨다(Kozlitina et al., Nat. Genet., 2014, 46, 352-6; Liu et al., Nat. Commun., 2014, 5, 4309; 및 Sookoian et al., Hepatology, 2015, 61, 515-25). PNPLA3 및 TM6SF2에서의 변이체가 정확히 어떻게 간 질환에 기여하는지는 아직 완전히 설명되어 있지는 않다(Smagris et al., J. Biol. Chem., 2016, 291, 10659-76; Mahdessian et al., Proc. Natl. Acad. Sci. USA, 2014, 111, 8913-8; Huang et al., J. Biol. Chem., 2011, 286, 37085-93; 및 Pirazzi et al., J. Hepatol., 2012, 57, 1276-82). 지금까지, 만성 간 질환을 보호하는 어떠한 유전자 변이체도 식별되어 있지 않다.
본 개시내용은 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법을 제공하며, 이 방법은, 대상체로부터의 샘플이 i) I148M 변이를 포함하는 파타틴 유사 포스포리파제 도메인 함유 3(PNPLA3) 단백질을 암호화하는 제1 핵산, 및 기능성 HSD17B13 단백질을 암호화하는 제2 핵산; 및/또는 ii) I148M 변이를 포함하는 PNPLA3 단백질 및 기능성 HSD17B13 단백질을 포함하는지의 여부를 결정하는 단계; 및 i)에 정의된 바와 같은 제1 핵산 및 제2 핵산 둘 다 및/또는 ii)에 정의된 바와 같은 단백질 둘 다가 검출되는 경우 대상체를 HSD17B13을 저해함으로써 간 질환을 치료 또는 저해하기 위한 후보자로서 식별하는 단계를 포함한다.
일부 실시형태에서, 제1 핵산 분자는 게놈 DNA, mRNA 또는 mRNA로부터 획득된 cDNA를 포함한다.
일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함하거나; mRNA는 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함하거나; mRNA는 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함하거나; cDNA는 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함하거나; 또는 cDNA는 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함한다.
일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 뉴클레오타이드 서열 또는 서열번호 31과 적어도 90%의 서열 동일성을 갖고 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나; mRNA는 서열번호 34에 따른 뉴클레오타이드 서열 또는 서열번호 34와 적어도 90%의 서열 동일성을 갖고 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나; mRNA는 서열번호 35에 따른 뉴클레오타이드 서열 또는 서열번호 35와 적어도 90%의 서열 동일성을 갖고 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나; cDNA는 서열번호 38에 따른 뉴클레오타이드 서열 또는 서열번호 38과 적어도 90%의 서열 동일성을 갖고 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나; 또는 cDNA는 서열번호 39에 따른 뉴클레오타이드 서열 또는 서열번호 39와 적어도 90%의 서열 동일성을 갖고 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함한다.
일부 실시형태에서, 제1 핵산을 검출하는 단계는, 제1 핵산의 적어도 일부를 서열분석하는 단계로서, 여기서 일부는 I148M 변이를 암호화하는 코돈을 포함하는, 상기 서열분석하는 단계; 또는 제1 핵산을 제1 핵산의 일부에 특이적으로 혼성화하는 프로브 또는 프라이머와 혼성화시키는 단계로서, 여기서 일부는 I148M 변이를 암호화하는 코돈을 포함하는, 상기 혼성화시키는 단계를 포함한다.
일부 실시형태에서, 프로브 또는 프라이머는 대립유전자-특이적 프로브 또는 프라이머이고, 여기서 프로브 또는 프라이머는 표지를 선택적으로 포함한다.
일부 실시형태에서, 방법은 대상체가 I148M 변이에 대해서 동형접합성(homozygous)인지 또는 이형접합성(heterozygous)인지를 결정하는 단계를 추가로 포함한다.
일부 실시형태에서, 제2 핵산은 게놈 DNA, mRNA 또는 mRNA로부터 획득된 cDNA를 포함한다.
일부 실시형태에서, 게놈 DNA는 서열번호 1에 따른 12,667번 위치에 상응하는 위치에 아데닌을 포함하거나; 게놈 DNA는 서열번호 1에 따른 뉴클레오타이드 서열 또는 서열번호 1과 적어도 90%의 서열 동일성을 갖고 기능성 HSD17B13 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나; mRNA는 서열번호 3에 따른 뉴클레오타이드 서열 또는 서열번호 3과 적어도 90%의 서열 동일성을 갖고 기능성 HSD17B13 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나; mRNA는 서열번호 4에 따른 뉴클레오타이드 서열 또는 서열번호 4와 적어도 90%의 서열 동일성을 갖고 기능성 HSD17B13 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나; mRNA는 서열번호 7에 따른 뉴클레오타이드 서열 또는 서열번호 7과 적어도 90%의 서열 동일성을 갖고 기능성 HSD17B13 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나; mRNA는 서열번호 11에 따른 뉴클레오타이드 서열 또는 서열번호 11과 적어도 90%의 서열 동일성을 갖고 기능성 HSD17B13 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나; cDNA는 서열번호 12에 따른 뉴클레오타이드 서열 또는 서열번호 12와 적어도 90%의 서열 동일성을 갖고 기능성 HSD17B13 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나; cDNA는 서열번호 13에 따른 뉴클레오타이드 서열 또는 서열번호 13과 적어도 90%의 서열 동일성을 갖고 기능성 HSD17B13 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나; cDNA는 서열번호 16에 따른 뉴클레오타이드 서열 또는 서열번호 16과 적어도 90%의 서열 동일성을 갖고 기능성 HSD17B13 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나; 또는 cDNA는 서열번호 20에 따른 뉴클레오타이드 서열 또는 서열번호 20과 적어도 90%의 서열 동일성을 갖고 기능성 HSD17B13 단백질을 암호화하는 뉴클레오타이드 서열을 포함한다.
일부 실시형태에서, 제2 핵산을 검출하는 단계는, 제2 핵산을 서열분석하는 단계; 또는 제2 핵산을 제2 핵산의 일부에 특이적으로 혼성화하는 프로브 또는 프라이머와 혼성화시키는 단계로서, 여기서 일부는 서열번호 1에 따른 12,667번 위치에 상응하는 위치에 아데닌을 포함하는, 상기 혼성화시키는 단계를 포함한다.
일부 실시형태에서, 프로브 또는 프라이머는 대립유전자-특이적 프로브 또는 프라이머이고, 여기서 프로브 또는 프라이머는 표지를 선택적으로 포함한다.
일부 실시형태에서, 방법은 대상체가 샘플에서 기능성 HSD17B13 단백질을 암호화하는 제2 핵산에 대해서 동형접합성인지 또는 이형접합성인지를 결정하는 단계를 추가로 포함한다.
일부 실시형태에서, 방법은 대상체에게 HSD17B13의 저해제를 투여하는 단계를 추가로 포함한다.
일부 실시형태에서, 간 질환은 알코올성 간 질환이다. 일부 실시형태에서, 알코올성 간 질환은 알코올 섭취로 인한 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함한다.
일부 실시형태에서, 간 질환은 비알코올성 간 질환이다. 일부 실시형태에서, 비알코올성 간 질환은 비알코올성 지방간 질환(NAFLD) 또는 비알코올성 지방간염(NASH)을 포함한다. 일부 실시형태에서, 비알코올성 간 질환은 알코올 섭취에 의해서 유발되지 않은 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함한다.
본 명세서의 부분에 포함되어 이를 구성하는 첨부된 도면은 몇몇 양상을 예시하며, 설명과 함께 본 개시내용의 원리를 설명하기 위해서 제공된다.
도 1은 발견 및 반복 코호트로부터의 서열분석된 유럽 혈통(European-ancestry) 개체의 기준선 특징을 나타낸 도면.
도 2는 발견 코호트에서 1.0×10-7 미만의 P로 혈청 트랜스아미나제와 연관된 단일 뉴클레오타이드 변이체를 나타낸 도면.
도 3은 3개의 개별 유럽 혈통 코호트에서 발견 코호트로부터의 35개의 엑솜-와이드(exome-wide) 유의한 단일 뉴클레오타이드 변이체의 반복 및 공동 메타-분석(replication and joint meta-analysis)을 나타낸 도면.
도 4는 발견 코호트에서 간 질환 표현형을 갖는 13개의 엑솜-와이드 유의한 반복 단일 뉴클레오타이드 변이체의 연관성을 나타낸 도면.
도 5는 댈러스 간 연구(Dallas Liver Study) 및 소아 간 연구(Pediatric Liver Study)로부터의 유전자형분석된 다민족 사례 및 대조군의 기준선 특징을 나타낸 도면.
도 6(패널 A 및 패널 B)은 HSD17B13 주변 영역에서 GHS 발견 코호트에서의 알라닌 아미노트랜스퍼라제(ALT; A) 및 아스파테이트 아미노트랜스퍼라제(AST; B)에 대한 영역 연관성 플롯을 나타낸 도면.
도 7은 HSD17B13 rs72613567 스플라이스 변이체의 동형접합성 참조군(T/T), 이형접합성(T/TA) 및 동형접합성 대체(TA/TA) 보유자에서의 PNPLA3의 발현을 나타낸 도면.
도 8은 3개의 HSD17B13 rs72613567 유전자형(T/T, T/TA, TA/TA)에서의 63 PNPLA3 rs738409 보유자(C/C 및 C/G)의 발현 차이를 나타낸 도면.
도 9는 PNPLA3 rs738409(p.I148M)와 HSD17B13 rs72613567 간의 유전적 상호작용의 분석을 나타낸 도면.
도 10(패널 A 및 패널 B)은 HSD17B13 rs72613567:TA가 PNPLA3 p.I148M과 연관된 간 손상의 위험을 완화시킨다는 것을 나타낸 도면.
도 11(패널 A 내지 패널 F)은 PNPLA3 rs738409(p.I148M) 및 HSD17B13 rs72613567 유전자형에 의한 원시 및 잔차화(residualized) ALT 수준을 나타낸 도면.
도 12(패널 A 내지 패널 F)는 PNPLA3 rs738409(p.I148M) 및 HSD17B13 rs72613567 유전자형에 의한 원시 및 잔차화 AST 수준을 나타낸 도면.
도 13(패널 A 내지 패널 F)은 HSD17B13 스플라이스 변이체의 동형접합성 참조군(T/T), 이형접합성(T/TA) 및 동형접합성 대체(TA/TA) 보유자에서의 4개의 추가적인 신규 HSD17B13 전사물(E-H)의 mRNA 발현을 나타낸 도면.
도 14(패널 A 및 패널 B)는 GHS 발견 코호트에서 혈청 트랜스아미나제 수준과 단일 뉴클레오타이드 변이체 연관성의 맨허튼(Manhattan) 플롯(좌측) 및 분위수(quantile)-분위수 플롯(우측)을 나타낸 도면.
도 15(패널 A 및 패널 B)는 HSD17B13 rs72613567:TA가 알코올성 간 질환 표현형 및 비알코올성 간 질환 표현형의 위험 감소와 연관된다는 것을 나타낸 도면.
도 16(패널 A 및 패널 B)은 HSD17B13 rs72613567:TA가 PNPLA3 p.I148M과 연관된 간 손상의 위험을 완화시킨다는 것을 나타낸 도면.
도 17(패널 A 및 패널 B)은 HSD17B13 rs72613567:TA가 단순 지방증에서 지방간염 및 섬유증으로 진행되는 위험을 감소시키는 것과 연관된다는 것을 나타낸 도면.
도 18(패널 A 내지 패널 G)은 신규 HSD17B13 전사물의 발현, 세포 이하 국지화(subcellular localization) 및 효소 활성도를 나타낸 도면.
도 19(패널 A 및 패널 B)는 HSD17B13 rs72613567:TA가 PNPLA3 I148M과 연관된 알코올성 간 질환 및 비알코올성 간 질환의 위험을 완화시킨다는 것을 나타낸 도면. 각각의 막대 위의 번호는 대조군/사례를 나타낸다.
본 개시내용의 추가 이점은 하기 발명을 실시하기 위한 구체적인 내용에 부분적으로 제시될 것이며, 발명을 실시하기 위한 구체적인 내용으로부터 부분적으로 자명할 것이거나, 본 명세서에 개시된 실시형태의 실시에 의해서 학습될 수 있다. 본 개시내용의 이점은 첨부된 청구범위에 특별하게 제시된 요소 및 조합에 의해서 실현 및 달성될 것이다. 상기 일반적인 설명 및 하기 발명을 실시하기 위한 구체적인 내용 둘 다는 단지 예시 및 설명이며, 청구된 바와 같은 실시형태를 제한하지 않는 것으로 이해되어야 한다.
도 1은 발견 및 반복 코호트로부터의 서열분석된 유럽 혈통(European-ancestry) 개체의 기준선 특징을 나타낸 도면.
도 2는 발견 코호트에서 1.0×10-7 미만의 P로 혈청 트랜스아미나제와 연관된 단일 뉴클레오타이드 변이체를 나타낸 도면.
도 3은 3개의 개별 유럽 혈통 코호트에서 발견 코호트로부터의 35개의 엑솜-와이드(exome-wide) 유의한 단일 뉴클레오타이드 변이체의 반복 및 공동 메타-분석(replication and joint meta-analysis)을 나타낸 도면.
도 4는 발견 코호트에서 간 질환 표현형을 갖는 13개의 엑솜-와이드 유의한 반복 단일 뉴클레오타이드 변이체의 연관성을 나타낸 도면.
도 5는 댈러스 간 연구(Dallas Liver Study) 및 소아 간 연구(Pediatric Liver Study)로부터의 유전자형분석된 다민족 사례 및 대조군의 기준선 특징을 나타낸 도면.
도 6(패널 A 및 패널 B)은 HSD17B13 주변 영역에서 GHS 발견 코호트에서의 알라닌 아미노트랜스퍼라제(ALT; A) 및 아스파테이트 아미노트랜스퍼라제(AST; B)에 대한 영역 연관성 플롯을 나타낸 도면.
도 7은 HSD17B13 rs72613567 스플라이스 변이체의 동형접합성 참조군(T/T), 이형접합성(T/TA) 및 동형접합성 대체(TA/TA) 보유자에서의 PNPLA3의 발현을 나타낸 도면.
도 8은 3개의 HSD17B13 rs72613567 유전자형(T/T, T/TA, TA/TA)에서의 63 PNPLA3 rs738409 보유자(C/C 및 C/G)의 발현 차이를 나타낸 도면.
도 9는 PNPLA3 rs738409(p.I148M)와 HSD17B13 rs72613567 간의 유전적 상호작용의 분석을 나타낸 도면.
도 10(패널 A 및 패널 B)은 HSD17B13 rs72613567:TA가 PNPLA3 p.I148M과 연관된 간 손상의 위험을 완화시킨다는 것을 나타낸 도면.
도 11(패널 A 내지 패널 F)은 PNPLA3 rs738409(p.I148M) 및 HSD17B13 rs72613567 유전자형에 의한 원시 및 잔차화(residualized) ALT 수준을 나타낸 도면.
도 12(패널 A 내지 패널 F)는 PNPLA3 rs738409(p.I148M) 및 HSD17B13 rs72613567 유전자형에 의한 원시 및 잔차화 AST 수준을 나타낸 도면.
도 13(패널 A 내지 패널 F)은 HSD17B13 스플라이스 변이체의 동형접합성 참조군(T/T), 이형접합성(T/TA) 및 동형접합성 대체(TA/TA) 보유자에서의 4개의 추가적인 신규 HSD17B13 전사물(E-H)의 mRNA 발현을 나타낸 도면.
도 14(패널 A 및 패널 B)는 GHS 발견 코호트에서 혈청 트랜스아미나제 수준과 단일 뉴클레오타이드 변이체 연관성의 맨허튼(Manhattan) 플롯(좌측) 및 분위수(quantile)-분위수 플롯(우측)을 나타낸 도면.
도 15(패널 A 및 패널 B)는 HSD17B13 rs72613567:TA가 알코올성 간 질환 표현형 및 비알코올성 간 질환 표현형의 위험 감소와 연관된다는 것을 나타낸 도면.
도 16(패널 A 및 패널 B)은 HSD17B13 rs72613567:TA가 PNPLA3 p.I148M과 연관된 간 손상의 위험을 완화시킨다는 것을 나타낸 도면.
도 17(패널 A 및 패널 B)은 HSD17B13 rs72613567:TA가 단순 지방증에서 지방간염 및 섬유증으로 진행되는 위험을 감소시키는 것과 연관된다는 것을 나타낸 도면.
도 18(패널 A 내지 패널 G)은 신규 HSD17B13 전사물의 발현, 세포 이하 국지화(subcellular localization) 및 효소 활성도를 나타낸 도면.
도 19(패널 A 및 패널 B)는 HSD17B13 rs72613567:TA가 PNPLA3 I148M과 연관된 알코올성 간 질환 및 비알코올성 간 질환의 위험을 완화시킨다는 것을 나타낸 도면. 각각의 막대 위의 번호는 대조군/사례를 나타낸다.
본 개시내용의 추가 이점은 하기 발명을 실시하기 위한 구체적인 내용에 부분적으로 제시될 것이며, 발명을 실시하기 위한 구체적인 내용으로부터 부분적으로 자명할 것이거나, 본 명세서에 개시된 실시형태의 실시에 의해서 학습될 수 있다. 본 개시내용의 이점은 첨부된 청구범위에 특별하게 제시된 요소 및 조합에 의해서 실현 및 달성될 것이다. 상기 일반적인 설명 및 하기 발명을 실시하기 위한 구체적인 내용 둘 다는 단지 예시 및 설명이며, 청구된 바와 같은 실시형태를 제한하지 않는 것으로 이해되어야 한다.
본 개시내용의 양상과 관련된 다양한 용어가 명세서 및 청구범위 전체에서 사용된다. 이러한 용어는, 달리 제시되지 않는 한, 관련 기술 분야에서의 이의 통상의 의미로 제공되어야 한다. 다른 구체적으로 정의된 용어는 본 명세서에 제공된 정의와 일관된 방식으로 이해되어야 한다.
달리 명확하게 표현되지 않는 한, 본 명세서에 제시된 임의의 방법 또는 양상은, 어떠한 방식으로도, 그 단계가 구체적인 순서로 수행되는 것을 요구하는 것으로 이해되도록 의도되지 않는다. 따라서, 방법 청구항이 청구범위 또는 설명에서 단계가 특정 순서로 제한되어야 한다는 것을 구체적으로 언급하지 않는 경우, 어떠한 경우에도 어떠한 식으로도 순서가 추론되는 것으로 의도되지 않는다. 이는, 단계 또는 작업 흐름의 배열과 관련된 로직의 문제, 문법적 구성 또는 구두점으로부터 유래된 일반적인 의미, 또는 본 명세서에 기재된 양상의 수 또는 양상을 비롯한, 해석에 대한 임의의 가능한 비표현 기반을 수용한다.
본 명세서에서 사용되는 바와 같이, 단수 형태는 그 문맥이 달리 명확하게 언급하지 않는 한 복수 대상을 포함한다.
본 명세서에서 사용되는 바와 같이, 용어 "대상체" 및 "환자"는 상호 교환 가능하게 사용된다. 대상체는 포유동물을 비롯한 임의의 동물을 포함한다. 포유동물은 비제한적으로 농장 동물(예를 들어, 말, 소, 돼지), 반려 동물(예를 들어, 개, 고양이), 실험 동물(예를 들어, 마우스, 래트, 토끼) 및 비인간 영장류를 포함한다. 일부 실시형태에서, 대상체는 인간이다.
본 명세서에서 사용되는 바와 같이, "핵산", "핵산 분자", "핵산 서열", "폴리뉴클레오타이드", 또는 "올리고뉴클레오타이드"는 임의의 길이의 뉴클레오타이드의 중합체 형태를 포함할 수 있고, DNA 및/또는 RNA를 포함할 수 있고, 단일 가닥, 이중 가닥 또는 다중 가닥일 수 있다. 한 가닥의 핵산을 또한 이의 상보체라고 지칭한다.
본 명세서에서 사용되는 바와 같이, 구 "에 상응하는" 또는 이의 문법적 변형은, 주어진 아미노산 또는 핵산 서열 또는 위치의 넘버링과 관련하여 사용되는 경우, 주어진 아미노산 서열 또는 핵산 서열을 참조 서열(예를 들어, 본 명세서에서 참조 서열은 예를 들어, (기능성 또는 기능성으로 거동하는 전사물) HSD17B13의 핵산 분자 또는 폴리펩타이드임)과 비교할 때 명시된 참조 서열의 넘버링을 지칭한다. 즉, 주어진 중합체의 잔기(예를 들어, 아미노산 또는 뉴클레오타이드) 번호 또는 잔기(예를 들어, 아미노산 또는 뉴클레오타이드) 위치는 주어진 아미노산 또는 핵산 서열 내의 잔기의 실제 번호 위치에 의하기 보다는 표준 서열에 대해서 지정된다. 예를 들어, 주어진 아미노산 서열은 두 서열 사이에 잔기 매치를 최적화하기 위한 갭을 도입함으로써 참조 서열에 정렬될 수 있다. 이러한 사례에서, 갭이 존재하긴 하지만, 주어진 아미노산 또는 핵산 서열에서 잔기의 넘버링은 이것이 정렬된 참조 서열에 대해서 수행된다.
예를 들어, 구 "서열번호 2에 따른 12,667번 위치에 상응하는 위치에 티민을 포함하는 HSD17B13 기능 상실 변이체 단백질(loss-of-function variant protein)을 암호화하는 핵산 분자"(및 유사한 구)는, 조사될 HSD17B13 게놈 DNA의 핵산 서열이 서열번호 2에 따른 뉴클레오타이드 서열에 정렬되는 경우, 조사될 HSD17B13 게놈 DNA가 서열번호 2의 12,667번 위치에 상응하는 위치에 티민을 포함한다는 것을 의미한다.
예를 들어, 서열번호 2에 따른 12,667번 위치에 상응하는 위치에 티민을 포함하는 HSD17B13 기능 상실 변이체 단백질을 암호화하는 핵산 분자는 주어진 HSD17B13 단백질과 서열번호 2의 핵산 서열 사이에 서열 정렬을 수행함으로써 쉽게 식별될 수 있다. 마찬가지로, 서열번호 42에 따른 148번 위치에 상응하는 위치 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 갖는 PNPLA3 Ile148Met 단백질은, 주어진 PNPLA3 단백질과 서열번호 42 또는 서열번호 43의 아미노산 서열 사이에 서열 정렬을 수행함으로써 쉽게 식별될 수 있다. 특정 서열번호의 위치에 상응하는 특정 위치에 특정 뉴클레오타이드 또는 아미노산을 갖는 특정 핵산 분자 및 단백질을 식별하기 위해서 서열 정렬을 수행하는 데 사용될 수 있는 다양한 컴퓨터 알고리즘이 존재한다. 예를 들어, 백분율 서열 동일성을 식별하기 위한 프로그램을 사용하여 서열 정렬을 수행할 수 있다. 핵산 내의 핵산 서열의 특정 스트레치 또는 폴리펩타이드 내의 아미노산 서열의 특정 스트레치 간의 백분율 동일성(또는 백분율 상보성)은 BLAST 프로그램(기본적인 국지 정렬 탐색 툴) 및 PowerBLAST 프로그램(Altschul et al., J. Mol. Biol., 1990, 215, 403-410; Zhang and Madden, Genome Res., 1997, 7, 649-656) 또는 CLUSTALW 소프트웨어(Sievers et al., 2014, Methods Mol. Biol., 1079, 105-116)를 사용함으로써 또는 디폴트 설정을 사용하는 Gap 프로그램(위스콘신 서열 분석 패키지(Wisconsin Sequence Analysis Package), 유닉스용 버전 8, 제네틱스 컴퓨터 그룹(Genetics Computer Group), 미국 위스콘신주 매디슨 유니버시티 리서치 파크 소재))(이것은 스미쓰 및 워터만의 알고리즘(Adv. Appl. Math., 1981, 2, 482-489)을 사용함)을 사용함으로써 결정될 수 있다. 그러나, 서열은 또한 수동으로 정렬될 수 있다. 본 명세서에서, 백분율 서열 동일성에 대해서 언급되는 경우, 더 높은 서열 동일성 백분율이 더 낮은 것보다 바람직하다.
본 개시내용은, HSD17B13을 저해함으로써 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법; HSD17B13의 저해제를 투여하는 것을 포함하는 간 질환을 치료 또는 저해하는 방법; 대상체에서 PNPLA3 Ile148Met(본 명세서에서 "I148M"이라고도 지칭됨) 및 기능성 HSD17B13을 검출하는 방법; 간 질환에 대해서 보호 효과를 갖는 대상체를 식별하는 방법; 및 간 질환의 치료에 사용하기 위한 HSD17B13의 저해제를 제공한다.
본 개시내용은, HSD17B13을 저해함으로써 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 분류하는 방법; HSD17B13의 저해제를 투여하는 것을 포함하는 간 질환을 치료 또는 저해하는 방법; 대상체에서 PNPLA3 Ile148Met(본 명세서에서 "I148M"이라고도 지칭됨) 및 기능성 HSD17B13을 검출하는 방법; 간 질환에 대해서 보호 효과를 갖는 대상체를 분류하는 방법; 및 간 질환의 치료에 사용하기 위한 HSD17B13의 저해제를 제공한다.
본 개시내용에 따라서, 간 지방 소립 단백질(hepatic lipid droplet protein)인 17-베타 하이드록시스테로이드 데하이드로게나제 13를 암호화하는, HSD17B13에서의 스플라이스 변이체(rs72613567:TA)가 감소된 ALT(P=4.2×10-12) 및 AST(P=6.2×10-10) 수준과 재현 가능하게 연관되어 있다는 것을 발견하였다. 또한 이러한 변이체는 대립유전자 용량-의존적 방식으로, 알코올성 간 질환 및 비알코올성 간 질환(각각의 rs72613567:TA 대립유전자에 대해서, 각각 38%, 95% 신뢰 구간(CI) 19% 내지 52%; 및 16%, 95% CI 9% 내지 22%) 및 간경변(각각의 rs72613567:TA 대립유전자에 대해서, 알코올성 간경변 및 알코올성 간경변에 대해서 각각 44%, 95% CI 22-59%; 및 26%, 95% CI 12% 내지 38%)의 감소된 위험과 연관되어 있다는 것을 발견하였다. 이러한 연관성은 2개의 독립적인 코호트에서 확인되었다. rs72613567:TA는 비알코올성 지방간염(NASH)의 조직학적 특징의 중증도 감소(지방간 질환을 갖는 개체 중에서 각각의 rs72613567:TA 대립유전자에 대해서 비알코올성 지방간염(NASH)에서 23% 감소, 95% CI 10% 내지 34%) 및 PNPLA3 p.I148M과 연관된 완화된 간 손상과 연관되어 있다. rs72613567:TA는 스테로이드 기질에 대한 효소 활성이 결핍된 절두된 아이소폼을 초래한다. 따라서, HSD17B13에서의 기능 상실 변이체는 알코올성 간 질환 및 비알코올성 간 질환 및 지방증에서 NASH로의 진행의 위험 감소와 연관되어 있다. 미국 특허 출원 공개 제US2018/0216084호(PCT 공개 제WO 2018/136702호에 상응함)는 이의 전문이 참조에 의해 본 명세서에 포함된다.
본 개시내용은 하이드록시스테로이드 17-베타 데하이드로게나제 13(HSD17B13)을 저해함으로써 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법을 제공하며, 이 방법은, 대상체로부터의 샘플이 I148M 변이를 포함하는 파타틴 유사 포스포리파제 도메인 함유 3(PNPLA3) 단백질을 암호화하는 제1 핵산, 및 기능성 HSD17B13 단백질을 암호화하는 제2 핵산, 및/또는 I148M 변이를 포함하는 PNPLA3 단백질 및 기능성 HSD17B13 단백질을 포함하는지의 여부를 결정하는 단계; 및 제1 핵산 및 제2 핵산 둘 다 및/또는 단백질 둘 다가 검출되는 경우 대상체를 HSD17B13을 저해함으로써 간 질환을 치료 또는 저해하기 위한 후보자로서 식별하는 단계를 포함한다.
본 개시내용은, 또한 HSD17B13을 저해함으로써 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 분류하는 방법; HSD17B13의 저해제를 투여하는 것을 포함하는 간 질환을 치료 또는 저해하는 방법; 대상체에서 PNPLA3 Ile148Met(본 명세서에서 "I148M"이라고도 지칭됨) 및 기능성 HSD17B13을 검출하는 방법; 간 질환에 대해서 보호 효과를 갖는 대상체를 분류하는 방법; 및 간 질환의 치료에 사용하기 위한 HSD17B13의 저해제를 제공한다.
본 개시내용은 또한 간 질환을 치료 또는 저해하는 방법을 제공하며, 이 방법은 하이드록시스테로이드 17-베타 데하이드로게나제 13(HSD17B13)의 저해제를, I148M 변이를 포함하는 파타틴 유사 포스포리파제 도메인 함유 3(PNPLA3) 단백질을 발현하는 인간 간 질환 환자에게 투여하여 환자에서 간 질환을 치료 또는 저해하는 단계를 포함한다.
본 명세서에 기재된 방법에서, 다양한 PNPLA3 및 HSD17B13 단백질, 및 이를 암호화하는 핵산 분자(예를 들어, 게놈 DNA, mRNA, 및 mRNA로부터 유래된 cDNA)가 검출, 발현 또는 사용된다. 이들 PNPLA3 및 HSD17B13 단백질, 및 이를 암호화하는 핵산 분자를 보다 상세하게 기재한다.
두 야생형 PNPLA3 단백질에 대한 아미노산 서열을 서열번호 40 및 서열번호 41에 제시한다. 서열번호 40을 갖는 야생형 PNPLA3 단백질은 481개 아미노산 길이인 반면, 서열번호 41을 갖는 야생형 PNPLA3 단백질은 477개 아미노산 길이이다. 서열번호 40을 갖는 야생형 PNPLA3 단백질은 148번 위치에 아이소류신을 갖는다. 서열번호 41을 갖는 야생형 PNPLA3 단백질은 144번 위치에 아이소류신을 갖는다.
일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질은 서열번호 42에 따른 아미노산 서열과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질은 서열번호 42에 따른 아미노산 서열과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질은 서열번호 42에 따른 아미노산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 변이체 PNPLA3 Ile144Met 단백질은 서열번호 43에 따른 아미노산 서열과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile144Met 단백질은 서열번호 43에 따른 아미노산 서열과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하고, 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile144Met 단백질은 서열번호 43에 따른 아미노산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 변이체 PNPLA3 Ile148Met 및 변이체 PNPLA3 Ile144Met 단백질은 상기에 기재된 단백질의 단편이고, 여기서 단편은 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하거나 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 단편은 암호화된 폴리펩타이드(예컨대, 서열번호 42 또는 서열번호 43의 아미노산 서열을 갖는 폴리펩타이드)의 적어도 약 10, 적어도 약 15, 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 55, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 적어도 약 90, 적어도 약 95, 적어도 약 100, 적어도 약 150 또는 적어도 약 200개의 인접 아미노산 잔기를 포함한다. 이와 관련하여, 더 긴 단편이 더 짧은 단편에 비해서 바람직하다. 일부 실시형태에서, 단편은 암호화된 폴리펩타이드의 적어도 약 10, 적어도 약 15, 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 55, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 적어도 약 90, 적어도 약 95 또는 적어도 약 100개의 인접 아미노산 잔기를 포함한다. 이와 관련하여, 더 긴 단편이 더 짧은 단편에 비해서 바람직하다.
야생형 PNPLA3 단백질을 암호화하는 게놈 DNA 분자에 대한 핵산 서열을 서열번호 30에 제시한다. 서열번호 30을 갖는 야생형 PNPLA3 게놈 DNA 분자는 5109번 위치에 사이토신을 포함한다. 서열번호 30을 갖는 야생형 PNPLA3 게놈 DNA 분자는 5107 내지 5109번 위치에 코돈 ATC를 포함한다.
일부 실시형태에서, 변이체 PNPLA3 게놈 DNA 분자는 PNPLA3 Ile148Met 단백질, 또는 각각 서열번호 42 또는 서열번호 43과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어지고, 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하거나 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 게놈 DNA 분자는 PNPLA3 Ile148Met 단백질, 또는 각각 서열번호 42 또는 서열번호 43과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어지고, 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하거나 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 게놈 DNA 분자는 PNPLA3 Ile148Met 단백질, 또는 각각 서열번호 42 또는 서열번호 43에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질 또는 변이체 PNPLA3 Ile144Met 단백질을 암호화하는 변이체 PNPLA3 게놈 DNA 분자는, 서열번호 31과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어지고, 서열번호 31에 따른 5109번 위치에 상응하는 위치에 구아닌을 포함하거나 또는 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 코돈 ATG를 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질 또는 변이체 PNPLA3 Ile144Met 단백질을 암호화하는 변이체 PNPLA3 게놈 DNA 분자는, 서열번호 31과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어지고, 서열번호 31에 따른 5109번 위치에 상응하는 위치에 구아닌을 포함하거나 또는 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 코돈 ATG를 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질 또는 변이체 PNPLA3 Ile144Met 단백질을 암호화하는 변이체 PNPLA3 게놈 DNA 분자는 서열번호 31에 따른 뉴클레오타이드 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 변이체 PNPLA3 게놈 DNA 분자는 전체 게놈 DNA 서열보다 적은 서열을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 게놈 DNA 분자는 서열번호 31의 적어도 약 15, 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 200, 적어도 약 300, 적어도 약 400, 적어도 약 500, 적어도 약 600, 적어도 약 700, 적어도 약 800, 적어도 약 900, 적어도 약 1000, 적어도 약 2000, 적어도 약 3000, 적어도 약 4000, 적어도 약 5000, 적어도 약 6000, 적어도 약 7000, 적어도 약 8000, 적어도 약 9000, 적어도 약 10000, 적어도 약 11000 또는 적어도 약 11500개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 변이체 PNPLA3 게놈 DNA 분자는 서열번호 31의 적어도 약 1000 내지 적어도 약 2000개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 변이체 PNPLA3 게놈 DNA 분자는 서열번호 31의 적어도 약 15, 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 200, 적어도 약 300, 적어도 약 400, 적어도 약 500, 적어도 약 600, 적어도 약 700, 적어도 약 800, 적어도 약 900, 적어도 약 1000, 적어도 약 1100, 적어도 약 1200, 적어도 약 1300, 적어도 약 1400, 적어도 약 1500, 적어도 약 1600, 적어도 약 1700, 적어도 약 1800, 적어도 약 1900, 적어도 약 2000, 적어도 약 2100, 적어도 약 2200, 적어도 약 2300, 적어도 약 2400 또는 적어도 약 2500개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다.
두 야생형 PNPLA3 mRNA 분자의 핵산 서열을 서열번호 32 및 서열번호 33에 제시한다. 서열번호 32를 갖는 야생형 PNPLA3 mRNA 분자는 444번 위치에 사이토신을 포함한다. 서열번호 32를 갖는 야생형 PNPLA3 mRNA 분자는 442번 내지 444번 위치에 코돈 AUC를 포함한다. 서열번호 33을 갖는 야생형 PNPLA3 mRNA 분자는 432번 위치에 사이토신을 포함한다. 서열번호 33을 갖는 야생형 PNPLA3 mRNA 분자는 430번 내지 432번 위치에 코돈 AUC를 포함한다.
일부 실시형태에서, 변이체 PNPLA3 mRNA 분자는 PNPLA3 Ile148Met 단백질, 또는 각각 서열번호 42 또는 서열번호 43과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어지고, 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하거나 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 mRNA 분자는 PNPLA3 Ile148Met 단백질, 또는 각각 서열번호 42 또는 서열번호 43과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어지고, 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하거나 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 mRNA 분자는 PNPLA3 Ile148Met 단백질, 또는 각각 서열번호 42 또는 서열번호 43에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질을 암호화하는 변이체 PNPLA3 mRNA 분자는 서열번호 34와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어지고, 서열번호 34에 따른 444번 위치에 상응하는 위치에 구아닌을 포함하거나 또는 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 코돈 AUG를 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질을 암호화하는 변이체 PNPLA3 mRNA 분자는 서열번호 34와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어지고, 서열번호 34에 따른 444번 위치에 상응하는 위치에 구아닌을 포함하거나 또는 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 코돈 AUG를 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질을 암호화하는 변이체 PNPLA3 mRNA 분자는 서열번호 34에 따른 뉴클레오타이드 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 변이체 PNPLA3 Ile144Met 단백질을 암호화하는 변이체 PNPLA3 mRNA 분자는 서열번호 35와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어지고, 서열번호 35에 따른 432번 위치에 상응하는 위치에 구아닌을 포함하거나, 또는 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 코돈 AUG를 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile144Met 단백질을 암호화하는 변이체 PNPLA3 mRNA 분자는 서열번호 35와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어지고, 서열번호 35에 따른 432번 위치에 상응하는 위치에 구아닌을 포함하거나 또는 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 코돈 AUG를 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile144Met 단백질을 암호화하는 변이체 PNPLA3 mRNA 분자는 서열번호 35에 따른 뉴클레오타이드 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 변이체 PNPLA3 mRNA 분자는 전체 변이체 PNPLA3 mRNA 서열보다 더 적은 뉴클레오타이드를 포함한다. 일부 실시형태에서, 변이체 PNPLA3 mRNA 분자는 서열번호 34 또는 서열번호 35의 적어도 약 5, 적어도 약 8, 적어도 약 10, 적어도 약 12, 적어도 약 15, 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 200, 적어도 약 300, 적어도 약 400, 적어도 약 500 또는 적어도 약 600개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 변이체 PNPLA3 mRNA 분자는 서열번호 34 또는 서열번호 35의 적어도 약 200 내지 적어도 약 500개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다. 이와 관련하여, 더 긴 mRNA 분자가 더 짧은 것에 비해서 바람직하다. 일부 실시형태에서, 변이체 PNPLA3 mRNA 분자는 서열번호 34 또는 서열번호 35의 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 200, 적어도 약 300, 적어도 약 400 또는 적어도 약 500개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다. 이와 관련하여, 더 긴 mRNA 분자가 더 짧은 것에 비해서 바람직하다. 일부 실시형태에서, 이러한 변이체 PNPLA3 mRNA 분자는 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 암호화하는 코돈 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 암호화하는 코돈을 포함한다. 일부 실시형태에서, 이러한 변이체 PNPLA3 mRNA 분자는 서열번호 34에 따른 444번 위치에 상응하는 위치에 구아닌을 포함하거나 또는 서열번호 35에 따른 432번 위치에 사응하는 위치에 구아닌을 포함한다. 일부 실시형태에서, 이러한 변이체 PNPLA3 mRNA 분자는 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 코돈 AUG를 포함하거나 또는 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 코돈 AUG를 포함한다.
두 야생형 PNPLA3 cDNA 분자의 핵산 서열을 서열번호 36 및 서열번호 37에 제시한다. 서열번호 36을 갖는 야생형 PNPLA3 cDNA 분자는 444번 위치에 사이토신을 포함한다. 서열번호 36을 갖는 야생형 PNPLA3 cDNA 분자는 442 내지 444번 위치에 코돈 ATC를 포함한다. 서열번호 37을 갖는 야생형 PNPLA3 cDNA 분자는 432번 위치에 사이토신을 포함한다. 서열번호 37을 갖는 야생형 PNPLA3 cDNA 분자는 430 내지 432번 위치에 코돈 ATC를 포함한다.
일부 실시형태에서, 변이체 PNPLA3 cDNA 분자는 PNPLA3 Ile148Met 단백질, 또는 각각 서열번호 42 또는 서열번호 43과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어지고, 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하거나 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 cDNA 분자는 PNPLA3 Ile148Met 단백질, 또는 각각 서열번호 42 또는 서열번호 43과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어지고, 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하거나 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 cDNA 분자는 PNPLA3 Ile148Met 단백질, 또는 각각 서열번호 42 또는 서열번호 43에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질을 암호화하는 변이체 PNPLA3 cDNA 분자는 서열번호 38과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어지고, 서열번호 38에 따른 444번 위치에 상응하는 위치에 구아닌을 포함하거나 또는 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 코돈 ATG를 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질을 암호화하는 변이체 PNPLA3 cDNA 분자는 서열번호 38와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어지고, 서열번호 38에 따른 444번 위치에 상응하는 위치에 구아닌을 포함하거나 또는 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 코돈 ATG를 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질을 암호화하는 변이체 PNPLA3 cDNA 분자는 서열번호 38에 따른 뉴클레오타이드 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 변이체 PNPLA3 Ile144Met 단백질을 암호화하는 변이체 PNPLA3 cDNA 분자는 서열번호 39와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어지고, 서열번호 39에 따른 432번 위치에 상응하는 위치에 구아닌을 포함하거나 또는 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 코돈 ATG를 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile144Met 단백질을 암호화하는 변이체 PNPLA3 cDNA 분자는 서열번호 39와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어지고, 서열번호 39에 따른 432번 위치에 상응하는 위치에 구아닌을 포함하거나 또는 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 코돈 ATG를 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile144Met 단백질을 암호화하는 변이체 PNPLA3 cDNA 분자는 서열번호 39에 따른 뉴클레오타이드 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 변이체 PNPLA3 cDNA 분자는 전체 변이체 PNPLA3 cDNA 서열보다 더 적은 뉴클레오타이드를 포함한다. 일부 실시형태에서, 변이체 PNPLA3 cDNA 분자는 서열번호 38 또는 서열번호 39의 적어도 약 5, 적어도 약 8, 적어도 약 10, 적어도 약 12, 적어도 약 15, 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 200, 적어도 약 300, 적어도 약 400, 적어도 약 500 또는 적어도 약 600개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 변이체 PNPLA3 cDNA 분자는 서열번호 38 또는 서열번호 39의 적어도 약 200 내지 적어도 약 500개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다. 이와 관련하여, 더 긴 cDNA 분자가 더 짧은 것에 비해서 바람직하다. 일부 실시형태에서, 변이체 PNPLA3 cDNA 분자는 서열번호 38 또는 서열번호 39의 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 200, 적어도 약 300, 적어도 약 400 또는 적어도 약 500개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다. 이와 관련하여, 더 긴 cDNA 분자가 더 짧은 것에 비해서 바람직하다. 일부 실시형태에서, 이러한 변이체 PNPLA3 cDNA 분자는 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 암호화하는 코돈 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 암호화하는 코돈을 포함한다. 일부 실시형태에서, 이러한 변이체 PNPLA3 cDNA 분자는 서열번호 38에 따른 444번 위치에 상응하는 위치에 구아닌을 포함하거나 또는 서열번호 39에 따른 432번 위치에 사응하는 위치에 구아닌을 포함한다. 일부 실시형태에서, 이러한 변이체 PNPLA3 cDNA 분자는 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 코돈 ATG를 포함하거나 또는 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 코돈 ATG를 포함한다.
기능성 HSD17B13 단백질과 연관된 4개의 HSD17B13 아이소폼 단백질에 대한 아미노산 서열을 서열번호 21(아이소폼 A), 서열번호 22(아이소폼 B), 서열번호 25(아이소폼 E) 및 서열번호 29(아이소폼 I)에 제시한다. 서열번호 21(아이소폼 A)을 갖는 HSD17B13 단백질은 300개 아미노산 길이이다. 서열번호 22(아이소폼 B)를 갖는 HSD17B13 단백질은 264개 아미노산 길이이다. 서열번호 25(아이소폼 E)를 갖는 HSD17B13 단백질은 324개 아미노산 길이이다. 서열번호 29(아이소폼 I)를 갖는 HSD17B13 단백질은 271개 아미노산 길이이다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 HSD17B13 아이소폼 단백질은 서열번호 21(아이소폼 A)에 따른 아미노산 서열과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 HSD17B13 아이소폼 단백질은 서열번호 21(아이소폼 A)에 따른 아미노산 서열과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 HSD17B13 아이소폼 단백질은 서열번호 21(아이소폼 A)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 HSD17B13 아이소폼 단백질은 서열번호 22(아이소폼 B)에 따른 아미노산 서열과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 HSD17B13 아이소폼 단백질은 서열번호 22(아이소폼 B)에 따른 아미노산 서열과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 HSD17B13 아이소폼 단백질은 서열번호 22(아이소폼 B)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 HSD17B13 아이소폼 단백질은 서열번호 25(아이소폼 E)에 따른 아미노산 서열과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 HSD17B13 아이소폼 단백질은 서열번호 25(아이소폼 E)에 따른 아미노산 서열과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 HSD17B13 아이소폼 단백질은 서열번호 25(아이소폼 E)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 HSD17B13 아이소폼 단백질은 서열번호 29(아이소폼 I)에 따른 아미노산 서열과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 HSD17B13 아이소폼 단백질은 서열번호 29(아이소폼 I)에 따른 아미노산 서열과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 HSD17B13 아이소폼 단백질은 서열번호 29(아이소폼 I)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진다.
기능 상실 rs72613567 HSD17B13 단백질(서열번호 2)과 연관된 5개의 HSD17B13 아이소폼 단백질에 대한 아미노산 서열을 서열번호 23(아이소폼 C), 서열번호 24(아이소폼 D), 서열번호 26(아이소폼 F), 서열번호 27(아이소폼 G) 및 서열번호 28(아이소폼 H)에 제시한다. 서열번호 23(아이소폼 C)을 갖는 HSD17B13 단백질은 261개 아미노산 길이이다. 서열번호 24(아이소폼 D)를 갖는 HSD17B13 단백질은 274개 아미노산 길이이다. 서열번호 26(아이소폼 F)을 갖는 HSD17B13 단백질은 284개 아미노산 길이이다. 서열번호 27(아이소폼 G)을 갖는 HSD17B13 단백질은 238개 아미노산 길이이다. 서열번호 28(아이소폼 H)을 갖는 HSD17B13 단백질은 298개 아미노산 길이이다.
일부 실시형태에서, 기능 상실과 연관된 HSD17B13 변이체 단백질은 서열번호 23(아이소폼 C)에 따른 아미노산 서열과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 기능 상실과 연관된 HSD17B13 변이체 단백질은 서열번호 23(아이소폼 C)에 따른 아미노산 서열과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 기능 상실과 연관된 HSD17B13 변이체 단백질은 서열번호 23(아이소폼 C)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 HSD17B13 변이체 단백질은 서열번호 24(아이소폼 D)에 따른 아미노산 서열과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 기능 상실과 연관된 HSD17B13 변이체 단백질은 서열번호 24(아이소폼 D)에 따른 아미노산 서열과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 기능 상실과 연관된 HSD17B13 변이체 단백질은 서열번호 24(아이소폼 D)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 아미노산 서열을 포함한다.
일부 실시형태에서, 기능 상실과 연관된 HSD17B13 변이체 단백질은 서열번호 26(아이소폼 F)에 따른 아미노산 서열과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 기능 상실과 연관된 HSD17B13 변이체 단백질은 서열번호 26(아이소폼 F)에 따른 아미노산 서열과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 기능 상실과 연관된 HSD17B13 변이체 단백질은 서열번호 26(아이소폼 F)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 HSD17B13 변이체 단백질은 서열번호 27(아이소폼 G)에 따른 아미노산 서열과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 기능 상실과 연관된 HSD17B13 변이체 단백질은 서열번호 27(아이소폼 G)에 따른 아미노산 서열과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 기능 상실과 연관된 HSD17B13 변이체 단백질은 서열번호 27(아이소폼 G)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 HSD17B13 변이체 단백질은 서열번호 28(아이소폼 H)에 따른 아미노산 서열과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 기능 상실과 연관된 HSD17B13 변이체 단백질은 서열번호 28(아이소폼 H)에 따른 아미노산 서열과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 기능 상실과 연관된 HSD17B13 변이체 단백질은 서열번호 28(아이소폼 H)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 HSD17B13 아이소폼 단백질 및 기능 상실과 연관된 HSD17B13 변이체 단백질은 상기에 기재된 단백질의 단편이다. 일부 실시형태에서, 단편은 암호화된 폴리펩타이드(예컨대, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 28 또는 서열번호 29의 아미노산 서열을 갖는 폴리펩타이드)의 적어도 약 10, 적어도 약 15, 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 55, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 적어도 약 90, 적어도 약 95, 적어도 약 100, 적어도 약 150 또는 적어도 약 200개의 인접 아미노산 잔기를 포함한다. 이와 관련하여, 더 긴 단편이 더 짧은 단편에 비해서 바람직하다. 일부 실시형태에서, 단편은 암호화된 폴리펩타이드의 적어도 약 10, 적어도 약 15, 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 55, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 적어도 약 90, 적어도 약 95 또는 적어도 약 100개의 인접 아미노산 잔기를 포함한다. 이와 관련하여, 더 긴 단편이 더 짧은 단편에 비해서 바람직하다.
기능성 HSD17B13 게놈 DNA 분자에 대한 핵산 서열을 서열번호 1에 제시한다. 서열번호 1을 갖는 기능성 HSD17B13 게놈 DNA 분자는 12,667번 위치에 아데닌을 포함한다.
일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 분자는 서열번호 21(아이소폼 A)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 분자는 서열번호 21(아이소폼 A)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 분자는 서열번호 21(아이소폼 A)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 분자는 서열번호 22(아이소폼 B)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 분자는 서열번호 22(아이소폼 B)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 분자는 서열번호 22(아이소폼 B)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 분자는 서열번호 25(아이소폼 E)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 분자는 서열번호 25(아이소폼 E)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 분자는 서열번호 25(아이소폼 E)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 분자는 서열번호 29(아이소폼 I)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 분자는 서열번호 29(아이소폼 I)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 분자는 서열번호 29(아이소폼 I)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 분자는 서열번호 1과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 분자는 서열번호 1과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 분자는 서열번호 21에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
기능 상실과 연관된 HSD17B13 변이체 단백질을 암호화하는 변이체 HSD17B13 게놈 DNA 분자에 대한 핵산 서열을 서열번호 2에 제시한다. 서열번호 2를 갖는 변이체 HSD17B13 게놈 DNA 분자는 12,667번 위치에 티민을 포함한다.
일부 실시형태에서, 변이체 HSD17B13 게놈 DNA 분자는 서열번호 23(아이소폼 C)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 변이체 HSD17B13 게놈 DNA 분자는 서열번호 23(아이소폼 C)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 변이체 HSD17B13 게놈 DNA 분자는 서열번호 23(아이소폼 C)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 변이체 HSD17B13 게놈 DNA 분자는 서열번호 24(아이소폼 D)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 변이체 HSD17B13 게놈 DNA 분자는 서열번호 24(아이소폼 D)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 변이체 HSD17B13 게놈 DNA 분자는 서열번호 24(아이소폼 D)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 변이체 HSD17B13 게놈 DNA 분자는 서열번호 26(아이소폼 F)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 변이체 HSD17B13 게놈 DNA 분자는 서열번호 26(아이소폼 F)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 변이체 HSD17B13 게놈 DNA 분자는 서열번호 26(아이소폼 F)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 변이체 HSD17B13 게놈 DNA 분자는 서열번호 27(아이소폼 G)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 변이체 HSD17B13 게놈 DNA 분자는 서열번호 27(아이소폼 G)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 변이체 HSD17B13 게놈 DNA 분자는 서열번호 27(아이소폼 G)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 변이체 HSD17B13 게놈 DNA 분자는 서열번호 28(아이소폼 H)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 변이체 HSD17B13 게놈 DNA 분자는 서열번호 28(아이소폼 H)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 변이체 HSD17B13 게놈 DNA 분자는 서열번호 28(아이소폼 H)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 변이체 HSD17B13 게놈 DNA 분자는 서열번호 2와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 변이체 HSD17B13 게놈 DNA 분자는 서열번호 2와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 변이체 HSD17B13 게놈 DNA 분자는 서열번호 2에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 및 변이체 HSD17B13 게놈 DNA 분자는 전체 게놈 DNA 서열보다 적은 서열을 포함한다. 일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 및 변이체 HSD17B13 게놈 DNA 분자는 서열번호 1(기능성 HSD17B13 게놈 DNA) 또는 서열번호 2(변이체 HSD17B13 게놈 DNA)의 적어도 약 15, 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 200, 적어도 약 300, 적어도 약 400, 적어도 약 500, 적어도 약 600, 적어도 약 700, 적어도 약 800, 적어도 약 900, 적어도 약 1000, 적어도 약 2000, 적어도 약 3000, 적어도 약 4000, 적어도 약 5000, 적어도 약 6000, 적어도 약 7000, 적어도 약 8000, 적어도 약 9000, 적어도 약 10000, 적어도 약 11000 또는 적어도 약 11500개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 및 변이체 HSD17B13 게놈 DNA 분자는 서열번호 1(기능성 HSD17B13 게놈 DNA) 또는 서열번호 2(변이체 HSD17B13 게놈 DNA)의 적어도 약 1000 내지 적어도 약 2000개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 게놈 DNA 및 변이체 HSD17B13 게놈 DNA 분자는 서열번호 1(기능성 HSD17B13 게놈 DNA) 또는 서열번호 2(변이체 HSD17B13 게놈 DNA)의 적어도 약 15, 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 200, 적어도 약 300, 적어도 약 400, 적어도 약 500, 적어도 약 600, 적어도 약 700, 적어도 약 800, 적어도 약 900, 적어도 약 1000, 적어도 약 1100, 적어도 약 1200, 적어도 약 1300, 적어도 약 1400, 적어도 약 1500, 적어도 약 1600, 적어도 약 1700, 적어도 약 1800, 적어도 약 1900, 적어도 약 2000, 적어도 약 2100, 적어도 약 2200, 적어도 약 2300, 적어도 약 2400 또는 적어도 약 2500개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다.
기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 4개의 HSD17B13 RNA 전사물에 대한 핵산 서열을 서열번호 44(전사물 A), 서열번호 45(전사물 B), 서열번호 48(전사물 E) 및 서열번호 52(전사물 I)에 제시한다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 21(아이소폼 A)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 21(아이소폼 A)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 21(아이소폼 A)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 22(아이소폼 B)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 22(아이소폼 B)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 22(아이소폼 B)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 25(아이소폼 E)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 25(아이소폼 E)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 25(아이소폼 E)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 29(아이소폼 I)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 29(아이소폼 I)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 29(아이소폼 I)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 44(전사물 A)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 44(전사물 A)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 44(전사물 A)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 45(전사물 B)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 45(전사물 B)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 45(전사물 B)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 48(전사물 E)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 48(전사물 E)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 48(전사물 E)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 52(전사물 I)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 52(전사물 I)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 52(전사물 I)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
기능 상실과 연관된 아이소폼 단백질을 암호화하는 5개의 HSD17B13 RNA 전사물에 대한 핵산 서열을 서열번호 46(전사물 C), 서열번호 47(전사물 D), 서열번호 49(전사물 F), 서열번호 50(전사물 G) 및 서열번호 51(전사물 H)에 제시한다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 23(아이소폼 C)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 23(아이소폼 C)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 23(아이소폼 C)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 24(아이소폼 D)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 24(아이소폼 D)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 24(아이소폼 D)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 26(아이소폼 F)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 26(아이소폼 F)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 26(아이소폼 F)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 27(아이소폼 G)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 27(아이소폼 G)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 27(아이소폼 G)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 28(아이소폼 H)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 28(아이소폼 H)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 28(아이소폼 H)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 46(전사물 C)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 46(전사물 C)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 46(전사물 C)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 47(전사물 D)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 47(전사물 D)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 47(전사물 D)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 49(전사물 F)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 49(전사물 F)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 49(전사물 F)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 50(전사물 G)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 50(전사물 G)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 50(전사물 G)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 51(전사물 H)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 51(전사물 H)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 RNA 전사물은 서열번호 51(전사물 H)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 RNA 전사물 및 변이체 HSD17B13 RNA 전사물은 RNA 전사물 서열보다 적은 서열을 포함한다. 일부 실시형태에서, 기능성 HSD17B13 RNA 전사물 및 변이체 HSD17B13 RNA 전사물은 서열번호 44, 서열번호 45, 서열번호 48 또는 서열번호 52(기능성 HSD17B13 RNA 전사물) 또는 서열번호 46, 서열번호 47, 서열번호 49, 서열번호 50 또는 서열번호 51(변이체 HSD17B13 RNA 전사물)의 적어도 약 15, 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 200, 적어도 약 300, 적어도 약 400, 적어도 약 500, 적어도 약 600, 적어도 약 700, 적어도 약 800, 적어도 약 900, 적어도 약 1000, 적어도 약 2000 또는 적어도 약 2500개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 RNA 전사물 및 변이체 HSD17B13 RNA 전사물은 RNA 전사물 서열보다 적은 서열을 포함한다. 일부 실시형태에서, 기능성 HSD17B13 RNA 전사물 및 변이체 HSD17B13 RNA 전사물은 서열번호 44, 서열번호 45, 서열번호 48 또는 서열번호 52(기능성 HSD17B13 RNA 전사물) 또는 서열번호 46, 서열번호 47, 서열번호 49, 서열번호 50 또는 서열번호 51(변이체 HSD17B13 RNA 전사물)의 적어도 약 15, 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 200, 적어도 약 300, 적어도 약 400 또는 적어도 약 500개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 RNA 전사물 및 변이체 HSD17B13 RNA 전사물은 서열번호 44, 서열번호 45, 서열번호 48 또는 서열번호 52(기능성 HSD17B13 RNA 전사물) 또는 서열번호 46, 서열번호 47, 서열번호 49, 서열번호 50 또는 서열번호 51(변이체 HSD17B13 RNA 전사물)의 적어도 약 1000 내지 적어도 약 2000개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다.
기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 4개의 HSD17B13 cDNA 전사물에 대한 핵산 서열을 서열번호53(전사물 A), 서열번호 54(전사물 B), 서열번호 57(전사물 E) 및 서열번호 61(전사물 I)에 제시한다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 21(아이소폼 A)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 21(아이소폼 A)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 21(아이소폼 A)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 22(아이소폼 B)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 22(아이소폼 B)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 22(아이소폼 B)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 25(아이소폼 E)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 25(아이소폼 E)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 25(아이소폼 E)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 29(아이소폼 I)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 29(아이소폼 I)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 29(아이소폼 I)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 53(전사물 A)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 53(전사물 A)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 53(전사물 A)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 54(전사물 B)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 54(전사물 B)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 54(전사물 B)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 57(전사물 E)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 57(전사물 E)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 57(전사물 E)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 61(전사물 I)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 61(전사물 I)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 61(전사물 I)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
기능 상실과 연관된 아이소폼 단백질을 암호화하는 5개의 HSD17B13 cDNA 전사물에 대한 핵산 서열을 서열번호 55(전사물 C), 서열번호 56(전사물 D), 서열번호 58(전사물 F), 서열번호 59(전사물 G) 및 서열번호 60(전사물 H)에 제시한다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 23(아이소폼 C)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 23(아이소폼 C)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 23(아이소폼 C)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 24(아이소폼 D)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 24(아이소폼 D)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 24(아이소폼 D)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 26(아이소폼 F)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 26(아이소폼 F)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 26(아이소폼 F)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 27(아이소폼 G)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 27(아이소폼 G)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 27(아이소폼 G)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 28(아이소폼 H)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 28(아이소폼 H)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 28(아이소폼 H)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 55(전사물 C)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 55(전사물 C)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 55(전사물 C)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 56(전사물 D)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 56(전사물 D)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 56(전사물 D)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 58(전사물 F)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 58(전사물 F)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 58(전사물 F)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 59(전사물 G)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 59(전사물 G)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 59(전사물 G)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 60(전사물 H)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 60(전사물 H)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 전사물은 서열번호 60(전사물 H)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, HSD17B13 cDNA 전사물은 cDNA 전사물 서열보다 적은 서열을 포함한다. 일부 실시형태에서, HSD17B13 cDNA 전사물은 서열번호 53, 서열번호 54, 서열번호 57 또는 서열번호 61 또는 서열번호 55, 서열번호 56, 서열번호 58, 서열번호 59 또는 서열번호 60의 적어도 약 15, 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 200, 적어도 약 300, 적어도 약 400, 적어도 약 500, 적어도 약 600, 적어도 약 700, 적어도 약 800, 적어도 약 900, 적어도 약 1000, 적어도 약 2000 또는 적어도 약 2500개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다. 일부 실시형태에서, HSD17B13 cDNA 전사물은 cDNA 전사물 서열보다 적은 서열을 포함한다. 일부 실시형태에서, HSD17B13 cDNA 전사물은 서열번호 53, 서열번호 54, 서열번호 57 또는 서열번호 61 또는 서열번호 55, 서열번호 56, 서열번호 58, 서열번호 59 또는 서열번호 60의 적어도 약 15, 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 200, 적어도 약 300, 적어도 약 400 또는 적어도 약 500개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다. 일부 실시형태에서, HSD17B13 cDNA 전사물은 서열번호 53, 서열번호 54, 서열번호 57 또는 서열번호 61 또는 서열번호 55, 서열번호 56, 서열번호 58, 서열번호 59 또는 서열번호 60의 적어도 약 1000 내지 적어도 약 2000개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다.
기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 4개의 HSD17B13 mRNA 분자에 대한 핵산 서열을 서열번호 3(전사물 A), 서열번호 4(전사물 B), 서열번호 7(전사물 E) 및 서열번호 11(전사물 I)에 제시한다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 21(아이소폼 A)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 21(아이소폼 A)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 21(아이소폼 A)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 22(아이소폼 B)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 22(아이소폼 B)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 22(아이소폼 B)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 25(아이소폼 E)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 25(아이소폼 E)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 25(아이소폼 E)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 29(아이소폼 I)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 29(아이소폼 I)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 29(아이소폼 I)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 3(전사물 A)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 3(전사물 A)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 3(전사물 A)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 4(전사물 B)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 4(전사물 B)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 4(전사물 B)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 7(전사물 E)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 7(전사물 E)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 7(전사물 E)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 11(전사물 I)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 11(전사물 I)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 11(전사물 I)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
기능 상실과 연관된 아이소폼 단백질을 암호화하는 5개의 HSD17B13 mRNA 분자에 대한 핵산 서열을 서열번호 5(전사물 C), 서열번호 6(전사물 D), 서열번호 8(전사물 F), 서열번호 9(전사물 G) 및 서열번호 10(전사물 H)에 제시한다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 23(아이소폼 C)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 23(아이소폼 C)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 23(아이소폼 C)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 24(아이소폼 D)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 24(아이소폼 D)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 24(아이소폼 D)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 26(아이소폼 F)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 26(아이소폼 F)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 26(아이소폼 F)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 27(아이소폼 G)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 27(아이소폼 G)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 27(아이소폼 G)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 28(아이소폼 H)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 28(아이소폼 H)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 28(아이소폼 H)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 5(전사물 C)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 5(전사물 C)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 5(전사물 C)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 6(전사물 D)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 6(전사물 D)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 6(전사물 D)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 8(전사물 F)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 8(전사물 F)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 8(전사물 F)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 9(전사물 G)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 9(전사물 G)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 9(전사물 G)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 10(전사물 H)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 10(전사물 H)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 mRNA 분자는 서열번호 10(전사물 H)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, HSD17B13 mRNA 분자는 전체 mRNA 서열보다 더 적은 뉴클레오타이드를 포함한다. 일부 실시형태에서, HSD17B13 mRNA 분자는 서열번호 3, 서열번호 4, 서열번호 7 또는 서열번호 11 또는 서열번호 5, 서열번호 6, 서열번호 8, 서열번호 9 또는 서열번호 10의 적어도 약 5, 적어도 약 8, 적어도 약 10, 적어도 약 12, 적어도 약 15, 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 200, 적어도 약 300, 적어도 약 400, 적어도 약 500, 적어도 약 600, 적어도 약 700, 적어도 약 800 또는 적어도 약 900개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다. 일부 실시형태에서, HSD17B13 mRNA 분자는 서열번호 3, 서열번호 4, 서열번호 7 또는 서열번호 11 또는 서열번호 5, 서열번호 6, 서열번호 8, 서열번호 9 또는 서열번호 10의 적어도 약 200 내지 적어도 약 500개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다. 이와 관련하여, 더 긴 mRNA 분자가 더 짧은 것에 비해서 바람직하다. 일부 실시형태에서, HSD17B13 mRNA 분자는 서열번호 3, 서열번호 4, 서열번호 7 또는 서열번호 11 또는 서열번호 5, 서열번호 6, 서열번호 8, 서열번호 9 또는 서열번호 10의 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 200, 적어도 약 300, 적어도 약 400 또는 적어도 약 500개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다. 이와 관련하여, 더 긴 mRNA 분자가 더 짧은 것에 비해서 바람직하다.
기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 4개의 HSD17B13 cDNA 분자에 대한 핵산 서열을 서열번호 12(전사물 A), 서열번호 13(전사물 B), 서열번호 16(전사물 E) 및 서열번호 20(전사물 I)에 제시한다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 21(아이소폼 A)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 21(아이소폼 A)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 21(아이소폼 A)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 22(아이소폼 B)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 22(아이소폼 B)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 22(아이소폼 B)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 25(아이소폼 E)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 25(아이소폼 E)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 25(아이소폼 E)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 29(아이소폼 I)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 29(아이소폼 I)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 29(아이소폼 I)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 12(전사물 A)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 12(전사물 A)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 12(전사물 A)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 13(전사물 B)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 13(전사물 B)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 13(전사물 B)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 16(전사물 E)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 16(전사물 E)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 16(전사물 E)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 20(전사물 I)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 20(전사물 I)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능성 HSD17B13 단백질과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 20(전사물 I)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
기능 상실과 연관된 아이소폼 단백질을 암호화하는 5개의 HSD17B13 cDNA 분자에 대한 핵산 서열을 서열번호 14(전사물 C), 서열번호 15(전사물 D), 서열번호 17(전사물 F), 서열번호 18(전사물 G) 및 서열번호 19(전사물 H)에 제시한다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 23(아이소폼 C)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 23(아이소폼 C)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 23(아이소폼 C)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 24(아이소폼 D)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 24(아이소폼 D)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 24(아이소폼 D)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 26(아이소폼 F)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 26(아이소폼 F)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 26(아이소폼 F)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 27(아이소폼 G)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 27(아이소폼 G)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 27(아이소폼 G)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 28(아이소폼 H)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 28(아이소폼 H)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 28(아이소폼 H)에 따른 아미노산 서열을 포함하거나 이것으로 이루어진 HSD17B13 아이소폼 단백질을 암호화하는 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 14(전사물 C)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 14(전사물 C)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 14(전사물 C)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 15(전사물 D)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 15(전사물 D)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 15(전사물 D)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 17(전사물 F)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 17(전사물 F)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 17(전사물 F)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 18(전사물 G)과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 18(전사물 G)과 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 18(전사물 G)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 19(전사물 H)와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 19(전사물 H)와 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 기능 상실과 연관된 아이소폼 단백질을 암호화하는 HSD17B13 cDNA 분자는 서열번호 19(전사물 H)에 따른 핵산 서열을 포함하거나 이것으로 이루어진다.
일부 실시형태에서, HSD17B13 cDNA 분자는 전체 cDNA 서열보다 더 적은 뉴클레오타이드를 포함한다. 일부 실시형태에서, HSD17B13 cDNA 분자는 서열번호 12, 서열번호 13, 서열번호 16 또는 서열번호 20 또는 서열번호 14, 서열번호 15, 서열번호 17, 서열번호 18 또는 서열번호 19의 적어도 약 5, 적어도 약 8, 적어도 약 10, 적어도 약 12, 적어도 약 15, 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 200, 적어도 약 300, 적어도 약 400, 적어도 약 500, 적어도 약 600, 적어도 약 700, 적어도 약 800 또는 적어도 약 900개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다. 일부 실시형태에서, HSD17B13 cDNA 분자는 서열번호 12, 서열번호 13, 서열번호 16 또는 서열번호 20 또는 서열번호 14, 서열번호 15, 서열번호 17, 서열번호 18 또는 서열번호 19의 적어도 약 200 내지 적어도 약 500개의 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다. 이와 관련하여, 더 긴 cDNA 분자가 더 짧은 것에 비해서 바람직하다. 일부 실시형태에서, HSD17B13 cDNA 분자는 서열번호 12, 서열번호 13, 서열번호 16 또는 서열번호 20 또는 서열번호 14, 서열번호 15, 서열번호 17, 서열번호 18 또는 서열번호 19의 적어도 약 50, 적어도 약 60, 적어도 약 70, 적어도 약 80, 적어도 약 90, 적어도 약 100, 적어도 약 200, 적어도 약 300, 적어도 약 400 또는 적어도 약 500 인접 뉴클레오타이드를 포함하거나 이것으로 이루어진다. 이와 관련하여, 더 긴 cDNA 분자가 더 짧은 것에 비해서 바람직하다.
본 명세서에 기재된 프로브 및 프라이머를 사용하여 본 명세서에 기재된 기능성 또는 변이체 PNPLA3 게놈 DNA 분자, mRNA 분자 또는 mRNA 분자로부터 유래된 cDNA 분자 중 임의의 것에 혼성화시킬 수 있다. 프라이머를 사용하여 예를 들어, 본 명세서에 기재된 기능성 또는 변이체 PNPLA3 게놈 DNA 분자, mRNA 분자 또는 mRNA 분자로부터 유래된 cDNA 분자 중 임의의 것의 부분을 증폭시킬 수 있어서, 증폭 산물을 예를 들어, 검출 또는 서열분석할 수 있다.
예를 들어, 프로브 및 프라이머를 사용하여 서열번호 30을 포함하는 야생형 PNPLA3 게놈 DNA 분자를 비롯한, 본 명세서에 기재된 야생형 PNPLA3 게놈 DNA 분자 중 임의의 것에 혼성화시킬 수 있다. 프로브 및 프라이머를 또한 사용하여 서열번호 32 또는 서열번호 33을 포함하는 야생형 PNPLA3 mRNA 분자를 비롯한, 본 명세서에 기재된 야생형 PNPLA3 mRNA 분자 중 임의의 것에 혼성화시킬 수 있다. 프로브 및 프라이머를 또한 사용하여 서열번호 36 또는 서열번호 37을 포함하는 야생형 PNPLA3 cDNA 분자를 비롯한, 본 명세서에 기재된 야생형 PNPLA3 cDNA 분자 중 임의의 것에 혼성화시킬 수 있다.
프로브 및 프라이머를 또한 사용하여 서열번호 31을 포함하는 변이체 PNPLA3 게놈 DNA 분자를 비롯한, 본 명세서에 기재된 변이체 PNPLA3 게놈 DNA 분자 중 임의의 것에 혼성화시킬 수 있다. 프로브 및 프라이머를 또한 사용하여 서열번호 34 또는 서열번호 35를 포함하는 변이체 PNPLA3 mRNA 분자를 비롯한, 본 명세서에 기재된 변이체 PNPLA3 mRNA 분자 중 임의의 것에 혼성화시킬 수 있다. 프로브 및 프라이머를 또한 사용하여 서열번호 38 또는 서열번호 39를 포함하는 변이체 PNPLA3 cDNA 분자를 비롯한, 본 명세서에 기재된 변이체 PNPLA3 cDNA 분자 중 임의의 것에 혼성화시킬 수 있다.
프로브를 사용하여 예를 들어, 본 명세서에 기재된 기능성 또는 변이체 HSD17B13 게놈 DNA 분자, mRNA 분자 또는 mRNA 분자로부터 유래된 cDNA 분자 중 임의의 것을 검출할 수 있다. 프라이머를 사용하여 예를 들어, 본 명세서에 기재된 기능성 또는 변이체 HSD17B13 게놈 DNA 분자, mRNA 분자 또는 mRNA 분자로부터 유래된 cDNA 분자 중 임의의 것의 부분을 증폭시킬 수 있어서, 증폭 산물을 예를 들어, 검출 또는 서열분석할 수 있다.
예를 들어, 프로브 및 프라이머를 사용하여 서열번호 1을 포함하는 기능성 HSD17B13 게놈 DNA 분자를 비롯한, 본 명세서에 기재된 기능성 HSD17B13 게놈 DNA 분자 중 임의의 것에 혼성화시킬 수 있다. 프로브 및 프라이머를 또한 사용하여 서열번호 44, 서열번호 45, 서열번호 48 또는 서열번호 52를 포함하는 기능성 HSD17B13 RNA 전사물을 비롯한, 본 명세서에 기재된 기능성 HSD17B13 RNA 전사물 중 임의의 것에 혼성화시킬 수 있다. 프로브 및 프라이머를 또한 사용하여 서열번호 53, 서열번호 54, 서열번호 57 또는 서열번호 61을 포함하는 기능성 HSD17B13 DNA 전사물을 비롯한, 본 명세서에 기재된 기능성 HSD17B13 DNA 전사물 중 임의의 것에 혼성화시킬 수 있다. 프로브 및 프라이머를 또한 사용하여 서열번호 3, 서열번호 4, 서열번호 7 또는 서열번호 11을 포함하는 기능성 HSD17B13 mRNA 분자를 비롯한 본 명세서에 기재된 기능성 HSD17B13 mRNA 분자 중 임의의 것에 혼성화시킬 수 있다. 프로브 및 프라이머를 또한 사용하여 서열번호 12, 서열번호 13, 서열번호 16 또는 서열번호 20을 포함하는 기능성 HSD17B13 cDNA 분자를 비롯한 본 명세서에 기재된 기능성 HSD17B13 cDNA 분자 중 임의의 것에 혼성화시킬 수 있다.
프로브 및 프라이머를 또한 사용하여 서열번호 2를 포함하는 변이체 HSD17B13 게놈 DNA 분자를 비롯한, 본 명세서에 기재된 변이체 HSD17B13 게놈 DNA 분자 중 임의의 것에 혼성화시킬 수 있다. 프로브 및 프라이머를 또한 사용하여 서열번호 46, 서열번호 47, 서열번호 49, 서열번호 50 또는 서열번호 51을 포함하는 변이체 HSD17B13 RNA 전사물을 비롯한, 본 명세서에 기재된 변이체 HSD17B13 RNA 전사물 중 임의의 것에 혼성화시킬 수 있다. 프로브 및 프라이머를 또한 사용하여 서열번호 55, 서열번호 56, 서열번호 58, 서열번호 59 또는 서열번호 60을 포함하는 변이체 HSD17B13 DNA 전사물을 비롯한, 본 명세서에 기재된 변이체 HSD17B13 DNA 전사물 중 임의의 것에 혼성화시킬 수 있다. 프로브 및 프라이머를 또한 사용하여 서열번호 5, 서열번호 6, 서열번호 8, 서열번호 9 또는 서열번호 10을 포함하는 변이체 HSD17B13 mRNA 분자를 비롯한, 본 명세서에 기재된 변이체 HSD17B13 mRNA 분자 중 임의의 것에 혼성화시킬 수 있다. 프로브 및 프라이머를 또한 사용하여 서열번호 14, 서열번호 15, 서열번호 17, 서열번호 18 또는 서열번호 19를 포함하는 HSD17B13 cDNA 분자를 비롯한 본 명세서에 기재된 HSD17B13 cDNA 분자 중 임의의 것에 혼성화시킬 수 있다.
일부 실시형태에서, 본 명세서에 기재된 프로브 및/또는 프라이머는 본 명세서에 기재된 핵산 분자 또는 이의 상보체 중 임의의 것에 특이적으로 혼성화하는 핵산 서열을 포함한다. 일부 실시형태에서, 프로브 또는 프라이머는 엄격한(stringent) 조건 하에서 본 명세서에 개시된 핵산 분자 중 임의의 것에 특이적으로 혼성화한다. 본 개시내용은 또한 온화한 조건 하에서 본 명세서에 개시된 핵산 분자 또는 이의 상보체 중 임의의 것에 혼성화하는 핵산 서열을 갖는 핵산 분자를 제공한다.
DNA 혼성화를 촉진시키는 적절한 엄격성 조건, 예를 들어, 약 45℃에서 6× 염화나트륨/시트르산나트륨(SSC), 그 다음 50℃에서 2× SSC의 세척을 포함한다(또한 문헌[Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6)] 참고). 전형적으로, 혼성화 및 검출을 위한 엄격한 조건은 염 농도가 pH 7.0 내지 8.3에서 약 1.5M Na 이온보다 낮고, 전형적으로 약 0.01 내지 1.0M Na 이온 농도(또는 다른 염)이고, 온도가, 짧은 프로브(예를 들어, 10 내지 50개 뉴클레오타이드)의 경우 적어도 약 30℃이고, 보다 긴 프로브(예를 들어, 50개 초과의 뉴클레오타이드)의 경우 적어도 약 60℃인 것일 것이다. 엄격한 조건은 또한 탈안정화제, 예컨대, 폼아마이드의 첨가로 달성될 수 있다. 예시적인 저 엄격성 조건은 37℃에서 30 내지 35% 폼아마이드, 1M NaCl, 1% SDS(황산도데실나트륨)의 완충액으로 혼성화 및 50 내지 55℃에서 1× 내지 2× SSC(20× SSC = 3.0M NaCl/0.3M 구연산삼나트륨)에서의 세척을 포함한다. 예시적인 중간 엄격성 조건은 37℃에서 40 내지 45% 폼아마이드, 1.0M NaCl, 1% SDS에서의 혼성화 및 55 내지 60℃에서 0.5× 내지 1× SSC에서의 세척을 포함한다. 예시적인 고 엄격성 조건은 37℃에서 50% 폼아마이드, 1M NaCl, 1% SDS에서의 혼성화 및 60 내지 65℃에서 0.1× SSC에서의 세척을 포함한다. 선택적으로, 세척 완충액은 약 0.1% 내지 약 1%의 SDS를 포함할 수 있다. 혼성화의 기간은 일반적으로 약 24시간 미만, 통상적으로 약 4 내지 약 12시간이다. 세척 시간의 기간은 적어도 평형에 도달하는데 충분한 시간 기간일 것이다.
혼성화 반응에서, 특이성은 전형적으로 혼성화 후 세척의 함수이고, 결정적인 인자는 이온 강도 및 최종 세척 용액의 온도이다. DNA-DNA 혼성체의 경우, Tm은 문헌[Meinkoth and Wahl, Anal. Biochem., 1984, 138, 267-284]의 식: Tm = 81.5℃ + 16.6(log M) + 0.41(GC%) - 0.61(폼%) - 500/L로부터 근사될 수 있고; 식 중 M은 일가 양이온의 몰 농도이고, GC%는 DNA 내의 구아노신 및 사이토신 뉴클레오타이드의 백분율이고, 폼%는 혼성화 용액에서 폼아마이드의 백분율이고, L은 염기쌍에서 혼성체의 길이이다. Tm은 상보적인 표적 서열의 50%가 완벽하게 매치되는 프로브에 혼성화되는 온도(명시된 이온 강도 및 pH 하에서)이다. Tm은 각각 1%의 미스매치에 대해 약 1℃만큼 감소되고; 따라서, Tm, 혼성화 및/또는 세척 조건은 목적하는 동일성의 서열에 혼성화되도록 조정될 수 있다. 예를 들어, 90% 이상의 동일성을 갖는 서열이 추구되면, Tm은 10℃ 감소될 수 있다. 일반적으로, 엄격한 조건은 정의된 이온 강도 및 pH에서 특정 서열 및 이의 상보체에 대한 열 융점(Tm)보다 약 5℃ 낮도록 선택된다. 그러나, 극심한 엄격한 조건은 열 융점(Tm)보다 1℃, 2℃, 3℃ 또는 4℃ 더 낮은 온도에서의 혼성화 및/또는 세척을 활용할 수 있고; 중간 정도의 엄격한 조건은 열 융점(Tm)보다 6℃, 7℃, 8℃, 9℃ 또는 10℃ 더 낮은 온도에서의 혼성화 및/또는 세척을 활용할 수 있고; 저 엄격성 조건은 열 융점(Tm)보다 11℃, 12℃, 13℃, 14℃, 15℃ 또는 20℃ 더 낮은 온도에서의 혼성화 및/또는 세척을 활용할 수 있다. 상기 식, 혼성화 및 세척 조성물 및 목적하는 Tm을 사용하여, 당업자는 혼성화의 엄격성 및/또는 세척 용액에서 변동이 내재적으로 설명된다고 이해할 것이다. 목적하는 정도의 미스매치가 45℃(수성 용액) 또는 32℃(폼아마이드 용액)보다 낮은 Tm을 유발하면, 보다 더 높은 온도가 사용될 수 있도록 SSC 농도를 증가시키는 것이 최적이다.
본 명세서에 기재된 프로브는 검출을 보조하기 위해서 표지에 연결 또는 융합될 수 있다. 표지는 직접 검출 가능(예를 들어, 형광단)하거나 또는 간접적으로 검출 가능(예를 들어, 합텐, 효소 또는 형광단 켄처)할 수 있다. 이러한 표지는 분광학, 광화학, 생화학, 면역화학 또는 화학 수단에 의해 검출 가능할 수 있다. 이러한 표지는 예를 들어, 방사선-계수 장치로 측정될 수 있는 방사성 표지; 시각적으로 관찰되거나 또는 분광광도계로 측정될 수 있는 안료, 염료 또는 다른 색소원; 스핀 표지 분석기로 측정될 수 있는 스핀 표지; 및 형광 표지(예를 들어, 형광단)를 포함하고, 여기서 출력 신호는 적합한 분자 부가물의 여기에 의해 생성되고, 염료에 의해 흡수되는 광으로의 여기에 의해 가시화될 수 있거나, 또는 표준 형광측정기 또는 영상화 시스템으로 측정될 수 있다. 표지는 또한, 예로서 화학발광 물질(여기서 출력 신호는 신호 화합물의 화학적 변형에 의해서 생성됨); 금속-함유 물질; 또는 효소(여기서 신호의 효소-의존성 이차 생성, 예컨대, 무색 기질로부터 착색된 산물의 형성이 발생함)일 수 있다. 용어 "표지"는 또한 접합된 분자가 나중에 기질과 함께 첨가될 때, 검출 가능한 신호를 산출하는데 사용되도록, 접합된 분자에 선택적으로 결합할 수 있는 "태그" 또는 합텐을 지칭할 수 있다. 예를 들어, 바이오틴을 태그로서 사용하고, 이어서, 호스래디쉬 퍼옥시데이트(HRP)의 아비딘 또는 스트렙타비딘 접합체를 사용하여 태그에 결합시키고, 이어서 열량측정 기질(예를 들어, 테트라메틸 벤지딘(TMB)) 또는 형광원 기질을 사용하여 HRP의 존재를 검출할 수 있다. 예시적인 표지는 myc, HA, FLAG 또는 3XFLAG, 6XHis 또는 폴리히스티딘, 글루타티온-S-트랜스퍼라제(GST), 말토스 결합 단백질, 에피토프 태그, 또는 면역글로불린의 Fc 부분을 포함하지만 이로 제한되지 않는다. 다수의 표지는 예를 들어, 입자, 형광단, 합텐, 효소 및 이들의 열량측정, 형광원 및 화학발광 기질 및 다른 표지를 포함한다.
프로브 또는 프라이머는 임의의 적합한 길이를 포함할 수 있고, 이의 비제한적인 예는 적어도 약 5, 적어도 약 8, 적어도 약 10, 적어도 약 11, 적어도 약 12, 적어도 약 13, 적어도 약 14, 적어도 약 15, 적어도 약 16, 적어도 약 17, 적어도 약 18, 적어도 약 19, 적어도 약 20, 적어도 약 21, 적어도 약 22, 적어도 약 23, 적어도 약 24 또는 적어도 약 25개 뉴클레오타이드 길이를 포함한다. 일부 실시형태에서, 프로브 또는 프라이머는 적어도 약 18개 뉴클레오타이드 길이 내지 약 25개 뉴클레오타이드 길이를 포함할 수 있다. 프로브 또는 프라이머는 약 10 내지 약 35, 약 10 내지 약 30, 약 10 내지 약 25, 약 12 내지 약 30, 약 12 내지 약 28, 약 12 내지 약 24, 약 15 내지 약 30, 약 15 내지 약 25, 약 18 내지 약 30, 약 18 내지 약 25, 약 18 내지 약 24, 또는 약 18 내지 약 22개 뉴클레오타이드 길이를 포함할 수 있다. 일부 실시형태에서, 프로브 또는 프라이머는 약 18 내지 약 30개 뉴클레오타이드 길이이다. 대체적으로, 일부 실시형태에서, 프로브는 적어도 약 20, 적어도 약 25, 적어도 약 30, 적어도 약 35, 적어도 약 40, 적어도 약 45, 적어도 약 50, 적어도 약 55, 적어도 약 60, 적어도 약 65, 적어도 약 70, 적어도 약 75, 적어도 약 80, 적어도 약 85, 적어도 약 90, 적어도 약 95 또는 적어도 약 100개의 뉴클레오타이드를 포함하거나 이것으로 이루어진다.
일부 실시형태에서, 프로브 및/또는 프라이머는 본 명세서에 기재된 야생형 PNPLA3 또는 HSD17B13 핵산 분자 또는 변이체 PNPLA3 또는 HSD17B13 핵산 분자 중 임의의 것과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 100% 동일한 핵산 분자의 적어도 약 15개의 인접 뉴클레오타이드에 혼성화할 수 있다.
일부 실시형태에서, 프로브 또는 프라이머는 DNA를 포함한다. 일부 실시형태에서, 프로브 또는 프라이머는 RNA를 포함한다.
본 명세서에 기재된 프로브 및 프라이는 또한 변경(alteration)-특이적 프로브 및 변경-특이적 프라이머일 수 있다. 변경-특이적 프로브 또는 변경-특이적 프라이머는 변이체 PNPLA3 단백질을 암호화하는 핵산 서열에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하지만, 야생형 PNPLA3 단백질을 암호화하는 핵산 서열에 상보성이 아니고/아니거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함할 수 있다. 이와 관련하여, "특이적으로 혼성화한다"는 프로브 또는 프라이머(예를 들어, 변경-특이적 프로브 또는 변경-특이적 프라이머)가 야생형 PNPLA3 단백질을 암호화하는 핵산 분자에 혼성화하지 않는다는 것을 의미한다. 본 명세서에서, 용어 "특이적으로 혼성화한다"는 제시된 핵산 분자에만 혼성화하고, 또 다른 핵산 분자에 혼성화하지 않는 프로브 또는 프라이머를 의미한다. 따라서, I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 핵산 분자에 특이적으로 혼성화하는 프로브 또는 프라이머는 I148M 변이를 포함하지 않는 PNPLA3 단백질을 암호화하는 핵산 분자에 혼성화하지 않는다. 변경-특이적 프로브 또는 변경-특이적 프라이머는 또한 야생형 PNPLA3 단백질을 암호화하는 핵산 서열에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하지만, 변이체 PNPLA3 단백질을 암호화하는 핵산 서열에 상보성이 아니고/아니거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함할 수 있다. 이와 관련하여, "특이적으로 혼성화한다"는 프로브 또는 프라이머(예를 들어, 변경-특이적 프로브 또는 변경-특이적 프라이머)가 변이체 PNPLA3 단백질을 암호화하는 핵산 분자에 혼성화하지 않는다는 것을 의미한다.
변경-특이적 프로브 또는 변경-특이적 프라이머는 또한 변이체 HSD17B13 단백질을 암호화하는 핵산 서열에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하지만, 기능성 HSD17B13 단백질을 암호화하는 핵산 서열에 상보성이 아니고/아니거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함할 수 있다. 이와 관련하여, "특이적으로 혼성화한다"는 프로브 또는 프라이머(예를 들어, 변경-특이적 프로브 또는 변경-특이적 프라이머)가 기능성 HSD17B13 단백질을 암호화하는 핵산 분자에 혼성화하지 않는다는 것을 의미한다. 예를 들어, 이와 관련하여, "특이적으로 혼성화한다"는 프로브 또는 프라이머가 비활성/기능 상실 HSD17B13 단백질을 암호화하는 핵산 분자에 혼성화하지 않는다는 것을 의미한다. 변경-특이적 프로브 또는 변경-특이적 프라이머는 또한 가능성 HSD17B13 단백질을 암호화하는 핵산 서열에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하지만, 변이체 HSD17B13 단백질을 암호화하는 핵산 서열에 상보성이 아니고/아니거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함할 수 있다. 이와 관련하여, "특이적으로 혼성화한다"는 프로브 또는 프라이머(예를 들어, 변경-특이적 프로브 또는 변경-특이적 프라이머)가 변이체 HSD17B13 단백질을 암호화하는 핵산 분자에 혼성화하지 않는다는 것을 의미한다.
일부 실시형태에서, 변경-특이적 프로브 또는 변경-특이적 프라이머는 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하거나 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함하는 PNPLA3 핵산 서열의 일부에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함한다. 일부 실시형태에서, 변경-특이적 프로브 또는 변경-특이적 프라이머는 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함하는 변이체 PNPLA3 게놈 DNA의 일부에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함한다. 일부 실시형태에서, 변경-특이적 프로브 또는 변경-특이적 프라이머는 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함하는 변이체 PNPLA3 mRNA의 일부에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함한다. 일부 실시형태에서, 변경-특이적 프로브 또는 변경-특이적 프라이머는 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함하는 변이체 PNPLA3 mRNA의 일부에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함한다. 일부 실시형태에서, 변경-특이적 프로브 또는 변경-특이적 프라이머는 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함하는 변이체 PNPLA3 cDNA의 일부에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함한다. 일부 실시형태에서, 변경-특이적 프로브 또는 변경-특이적 프라이머는 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함하는 변이체 PNPLA3 cDNA의 일부에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함한다.
일부 실시형태에서, 변경-특이적 프로브 또는 변경-특이적 프라이머는 서열번호 1에 따른 12,667번 위치에 상응하는 위치에 아데닌을 포함하는 HSD17B13 게놈 DNA의 일부에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함한다. 일부 실시형태에서, 변경-특이적 프로브 또는 변경-특이적 프라이머는 서열번호 2에 따른 12,667번 위치에 상응하는 위치에 티민을 포함하는 HSD17B13 게놈 DNA의 일부에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함한다.
일부 실시형태에서, 프로브 또는 프라이머가 혼성화되는 핵산 분자의 일부는 약 10 내지 약 200, 약 10 내지 약 150, 약 10 내지 약 100, 약 10 내지 약 50, 약 10 내지 약 40, 약 10 내지 약 30, 또는 약 10 내지 약 20개의 뉴클레오타이드를 포함하고, 특정 변이를 암호화하는 코돈을 함유하는 위치에 상응하는 코돈(예를 들어, PNPLA3의 I148M 또는 상응하는 야생형 HSD17B13 단백질과 상이한 변이체 HSD17B13 단백질의 일부)을 포함한다. 일부 바람직한 실시형태에서, 프로브 또는 프라이머가 혼성화되는 핵산 분자의 일부는 약 10 내지 약 50, 약 10 내지 약 40, 약 10 내지 약 30, 또는 약 10 내지 약 20개의 뉴클레오타이드를 포함하고, 특정 변이를 암호화하는 코돈을 함유하는 위치에 상응하는 코돈(예를 들어, PNPLA3의 I148M 또는 상응하는 야생형 HSD17B13 단백질과 상이한 변이체 HSD17B13 단백질의 일부)을 포함한다.
본 명세서에 기재된 키트는 본 명세서에 기재된 야생형 PNPLA3 및/또는 HSD17B13 핵산 분자 중 임의의 것 및/또는 본 명세서에 기재된 변이체 PNPLA3 및/또는 HSD17B13 핵산 분자 중 임의의 것을 검출 및/또는 증폭시키는 데 사용될 수 있는 검출 및/또는 증폭 검정 시약을 포함할 수 있다. 일부 실시형태에서, 이러한 검출 및/또는 증폭을 위한 키트는 본 명세서에 기재된 시약(예를 들어, 프로브 및 프라이머) 중 임의의 것을 함유할 수 있다. 일부 실시형태에서, 베이직 키트는 본 명세서에 개시된 핵산 분자 중 임의의 것 내의 유전자좌에 대해서, 적어도 하나의 프로브 또는 프라이머 또는 적어도 2개의 프로브 또는 프라이머, 예컨대, 변경-특이적 프로브 또는 변경-특이적 프라이머를 갖는 용기를 포함할 수 있다. 키트는 또한 사용 설명서를 선택적으로 포함할 수 있다. 키트는 또한 다른 선택적인 키트 성분, 예를 들어, 증폭된 유전자좌 각각에 안내되는 대립유전자 래더, 충분한 품질의 증폭용 효소, 증폭을 용이하게 하기 위한 증폭 완충제, 효소 활성을 용이하게 하기 위한 2가 양이온 용액, 증폭 동안 가닥 연장을 위한 dNTP, 전기영동법을 위한 증폭된 재료의 제조를 위한 로딩 용액, 주형 대조군으로서의 게놈 DNA, 분리 배지에서 기대되는 바와 같이 물질이 이동하는 것을 보장하기 위한 크기 마커 및 사용자를 교육하고, 사용시 오류를 제한하기 위한 프로토콜 및 매뉴얼 중 하나 이상을 포함할 수 있다. 키트 중의 다양한 시약의 양은 또한 다수의 인자, 예컨대, 공정의 최적의 민감도에 따라서 달라질 수 있다. 수동 응용에 사용하기 위한 시험 키트 또는 자동화 샘플 제조, 반응 설정, 검출기 또는 분석기와 함께 사용하기 위한 시험 키트를 제공하는 것은 이러한 개시내용의 범주에 포함된다. 일부 실시형태에서, 키트는 검출을 위한 적어도 하나의 표지된 프로브(예를 들어, 변경-특이적 프로브)를 포함한다. 일부 실시형태에서, 본 명세서에 개시된 키트 중 임의의 것은 어닐링 반응을 수행하는 데 필요한 시약 및 생성물, 및 설명서를 추가로 포함할 수 있다.
본 개시내용은 본 명세서에 기재된 야생형 PNPLA3 단백질 중 임의의 것의 존재를 검출하기 위한 방법을 제공한다. 본 개시내용은 또한 본 명세서에 기재된 변이체 PNPLA3 단백질 중 임의의 것의 존재를 검출하기 위한 방법을 제공한다. 본 개시내용은 또한 본 명세서에 기재된 야생형 PNPLA3 핵산 분자(예를 들어, 본 명세서에 기재된 게놈 DNA 분자, mRNA 분자, 및 cDNA 분자) 중 임의의 것을 검출하기 위한 방법을 제공한다. 본 개시내용은 또한 본 명세서에 기재된 변이체 PNPLA3 핵산 분자(예를 들어, 본 명세서에 기재된 게놈 DNA 분자, mRNA 분자, 및 cDNA 분자) 중 임의의 것을 검출하기 위한 방법을 제공한다.
본 개시내용은 또한 본 명세서에 기재된 기능성 HSD17B13 단백질 중 임의의 것의 존재를 검출하기 위한 방법을 제공한다. 본 개시내용은 또한 본 명세서에 기재된 변이체 HSD17B13 단백질 중 임의의 것의 존재를 검출하기 위한 방법을 제공한다. 본 개시내용은 또한 본 명세서에 기재된 기능성 HSD17B13 핵산 분자(예를 들어, 본 명세서에 기재된 게놈 DNA 분자, RNA 전사물, cDNA 전사물, mRNA 분자, 및 cDNA 분자) 중 임의의 것을 검출하기 위한 방법을 제공한다. 본 개시내용은 또한 본 명세서에 기재된 변이체 HSD17B13 핵산 분자(예를 들어, 본 명세서에 기재된 게놈 DNA 분자, RNA 전사물, cDNA 전사물, mRNA 분자, 및 cDNA 분자) 중 임의의 것을 검출하기 위한 방법을 제공한다.
본 명세서에 기재된 방법 중 임의의 것의 일부 실시형태에서, 기능성 HSD17B13 단백질 또는 이를 암호화하는 핵산 분자는 대상체 또는 환자에서 검출되거나 검출이 추구된다. 일부 실시형태에서, 대상체 또는 환자는 기능성 HSD17B13 단백질을 포함한다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 본 명세서에 기재된 기능성 HSD17B13 단백질(이를 암호화하는 본 명세서에 기재된 핵산 분자 중 임의의 것에 의해서 암호화될 수 있음) 중 하나이다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 서열번호 40에 따른 아미노산 서열을 갖는 HSD17B13 단백질의 생물학적 활성도의 적어도 90%, 적어도 80%, 적어도 70%, 적어도 60%, 적어도 50%, 적어도 40%, 적어도 30%, 적어도 20%, 적어도 10%, 적어도 5% 또는 적어도 1%를 갖는다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 서열번호 40에 따른 아미노산 서열을 갖는 HSD17B13 단백질의 생물학적 활성도의 적어도 90%, 적어도 80%, 적어도 70%, 적어도 60% 또는 적어도 50%를 갖는다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 서열번호 40을 갖는 HSD17B13 단백질의 생물학적 활성도의 적어도 90%, 적어도 80%, 적어도 70%, 적어도 60%, 적어도 50%, 적어도 40%, 적어도 30%, 적어도 20%, 적어도 10%, 적어도 5% 또는 적어도 1%를 갖는다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 서열번호 40을 갖는 HSD17B13 단백질의 생물학적 활성도의 적어도 70%, 적어도 60%, 적어도 50%, 적어도 40%, 적어도 30%, 적어도 20%, 적어도 10%, 적어도 5% 또는 적어도 1%를 갖는다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 서열번호 40을 갖는 HSD17B13 단백질의 생물학적 활성도의 적어도 50%, 적어도 40%, 적어도 30%, 적어도 20%, 적어도 10%, 적어도 5% 또는 적어도 1%를 갖는다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 서열번호 40을 갖는 HSD17B13 단백질의 생물학적 활성도의 적어도 30%, 적어도 20%, 적어도 10%, 적어도 5% 또는 적어도 1%를 갖는다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 서열번호 40을 갖는 HSD17B13 단백질의 생물학적 활성도의 90%를 갖는다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 서열번호 40을 갖는 HSD17B13 단백질의 생물학적 활성도의 80%를 갖는다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 서열번호 40을 갖는 HSD17B13 단백질의 생물학적 활성도의 70%를 갖는다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 서열번호 40을 갖는 HSD17B13 단백질의 생물학적 활성도의 60%를 갖는다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 서열번호 40을 갖는 HSD17B13 단백질의 생물학적 활성도의 50%를 갖는다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 서열번호 40을 갖는 HSD17B13 단백질의 생물학적 활성도의 40%를 갖는다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 서열번호 40을 갖는 HSD17B13 단백질의 생물학적 활성도의 30%를 갖는다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 서열번호 40을 갖는 HSD17B13 단백질의 생물학적 활성도의 20%를 갖는다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 서열번호 40을 갖는 HSD17B13 단백질의 생물학적 활성도의 10%를 갖는다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 서열번호 40을 갖는 HSD17B13 단백질의 생물학적 활성도의 5%를 갖는다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 서열번호 40을 갖는 HSD17B13 단백질의 생물학적 활성도의 1%를 갖는다. 일부 실시형태에서, HSD17B13 단백질의 활성도(예를 들어, 기능성)는 예를 들어, 옥시도리덕타제 활성도 검정을 수행함으로써 결정될 수 있다.
집단 내에서 유전자 서열, 및 이러한 유전자에 의해 암호화된 mRNA 및 단백질은 다형성, 예컨대, 단일-뉴클레오타이드 다형성으로 인해 달라질 수 있다는 것이 이해된다. 본 명세서에 제공된 서열은 단지 예시적인 서열이다. 변이체 PNPLA3 및 HSD17B13 게놈 DNA, mRNA, cDNA 및 폴리펩타이드의 다른 서열이 또한 가능하다.
생물학적 샘플은 대상체로부터의 임의의 세포, 조직 또는 생물학적 유체로부터 유래될 수 있다. 샘플은 임의의 임상적으로 관련된 조직, 예컨대, 골수 샘플, 종양 생검, 미세 바늘 흡인물 또는 체액, 예컨대, 혈액, 치은 열구액(gingival crevicular fluid), 혈장, 혈청, 림프, 복수, 낭성 유체 또는 소변을 포함할 수 있다. 일부 실시형태에서, 샘플은 협측 스왑(swab)을 포함한다. 본 명세서에 개시된 방법에서 사용되는 샘플은 검정 포맷, 검출 방법의 특성, 및 샘플로서 사용되는 조직, 세포 또는 추출물을 기초로 달라질 것이다. 생물학적 샘플은 사용되는 검정에 따라서 상이하게 가공될 수 있다. 예를 들어, 변이체 PNPLA3 핵산 분자를 검출하는 경우, 게놈 DNA에 대한 샘플을 단리시키거나 또는 농축시키도록 설계된 예비 가공이 사용될 수 있다. 다양한 기술이 이러한 목적으로 사용될 수 있다. 변이체 PNPLA3 mRNA의 수준을 검출하는 경우, 상이한 기술이 mRNA를 갖는 생물학적 샘플을 농축시키는 데 사용될 수 있다. mRNA의 존재 또는 수준 또는 특정 변이체 게놈 DNA 유전자좌의 존재를 검출하는 다양한 방법이 사용될 수 있다.
일부 실시형태에서, 특정 PNPLA3 단백질 또는 HSD17B13 단백질(예를 들어, 기능성 또는 변이체)의 존재 또는 부재는, 단백질의 적어도 일부를 서열분석하여 단백질이 본 명세서에 기재된 변이체 PNPLA3 단백질 또는 HSD17B13 단백질(예를 들어, 기능성 또는 변이체) 중 임의의 것을 암호화하는 아미노산을 포함하는지의 여부를 결정함으로써 검출된다. 일부 실시형태에서, 특정 PNPLA3 단백질 또는 HSD17B13 단백질(예를 들어, 기능성 또는 변이체)의 존재 또는 부재는, 면역검정, 예컨대, ELISA를 수행하여 본 명세서에 기재된 변이체 PNPLA3 단백질 또는 HSD17B13 단백질(예를 들어, 기능성 또는 변이체) 중 임의의 것이 샘플 중에 존재하는지의 여부를 결정함으로써 검출된다.
일부 실시형태에서, 서열분석된 단백질 중 일부는 약 5 내지 약 100, 약 5 내지 약 50, 약 5 내지 약 40, 약 5 내지 약 30, 약 5 내지 약 20 또는 약 5 내지 약 10개의 아미노산을 포함하고, 변이(예를 들어, PNPLA3의 I148M 또는 상응하는 야생형 HSD17B13 단백질과 상이한 변이체 HSD17B13 단백질의 일부)를 함유하는 위치에 상응하는 위치를 포함한다. 일부 바람직한 실시형태에서, 서열분석된 단백질 중 일부는 약 5 내지 약 20 또는 약 5 내지 약 10개의 아미노산을 포함하고, 변이(예를 들어, PNPLA3의 I148M 또는 상응하는 야생형 HSD17B13 단백질과 상이한 변이체 HSD17B13 단백질의 일부)를 함유하는 위치에 상응하는 위치를 포함한다.
단백질 서열분석 기술의 예시적인 비제한적인 예는 질량 분광분석법 및 에드만 분해를 포함하지만 이들로 제한되지 않는다. 면역검정의 예시적인 면역침전, 웨스턴 블롯, 면역조직화학, ELISA, 면역세포화학, 유세포 분석법 및 면역-PCR을 포함하지만 이들로 제한되지 않는다. 다양한 기술(예를 들어, 비색정량, 형광, 화학발광 또는 방사성)을 이용하여 검출 가능하게 표지된 다클론성 또는 단클론성 항체가 면역검정에서의 사용에 적합하다.
일부 실시형태에서, 특정 PNPLA3 핵산 분자 또는 HSD17B13 핵산 분자(예를 들어, 기능성 또는 변이체 게놈 DNA, mRNA, cDNA, RNA 전사물 또는 cDNA 전사물)의 존재 또는 부재는 핵산 분자의 적어도 일부를 서열분석하여 핵산 분자가 본 명세서에 기재된 변이체 PNPLA3 핵산 분자 또는 HSD17B13 핵산 분자(예를 들어, 기능성 또는 변이체) 중 임의의 것에 따른 핵산 서열를 포함을 포함하는지의 여부를 결정함으로써 검출된다.
일부 실시형태에서, 서열분석되는 핵산 분자의 일부는 약 10 내지 약 200, 약 10 내지 약 150, 약 10 내지 약 100, 약 10 내지 약 50, 약 10 내지 약 40, 약 10 내지 약 30, 또는 약 10 내지 약 20개의 뉴클레오타이드를 포함하고, 특정 변이를 암호화하는 코돈을 함유하는 위치에 상응하는 코돈(예를 들어, PNPLA3의 I148M 또는 상응하는 야생형 HSD17B13 단백질과 상이한 변이체 HSD17B13 단백질의 일부)을 포함한다. 일부 바람직한 실시형태에서, 서열분석되는 핵산 분자의 일부는 약 10 내지 약 50, 약 10 내지 약 40, 약 10 내지 약 30, 또는 약 10 내지 약 20개의 뉴클레오타이드를 포함하고, 특정 변이를 암호화하는 코돈을 함유하는 위치에 상응하는 코돈(예를 들어, PNPLA3의 I148M 또는 상응하는 야생형 HSD17B13 단백질과 상이한 변이체 HSD17B13 단백질의 일부)을 포함한다.
일부 실시형태에서, 대상체에서 본 명세서에 기재된 특정 PNPLA3 핵산 분자 또는 HSD17B13 핵산 분자 중 임의의 것(예를 들어, 기능성 또는 변이체 게놈 DNA 분자, mRNA 분자, cDNA 분자, RNA 전사물 또는 cDNA 전사물 중 임의의 것)의 존재 또는 부재를 검출하는 방법은, 대상체로부터 획득된 생물학적 샘플에 대해서 검정을 수행하는 것을 포함하는데, 이 검정은 생물학적 샘플 중의 핵산 분자가 본 명세서에 기재된 특정 PNPLA3 핵산 분자 또는 HSD17B13 핵산 분자 중 임의의 것(예를 들어, 기능성 또는 변이체 게놈 DNA 분자, mRNA 분자, cDNA 분자, RNA 전사물 또는 cDNA 전사물 중 임의의 것)을 포함하는지의 여부를 결정한다. 일부 실시형태에서, 생물학적 샘플은 세포 또는 세포 용해물을 포함한다. 이러한 방법은 예를 들어, 대상체로부터 생물학적 샘플을 획득하는 단계, 선택적으로 mRNA를 cDNA로 역전사시키는 단계, 및 검정을 수행하는 단계를 추가로 포함할 수 있다. 이러한 검정은 예를 들어, 본 명세서에 기재된 특정 핵산 분자의 특정 위치의 동일성을 결정하는 단계를 포함할 수 있다.
예를 들어, 검정은 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하거나 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함하는 PNPLA3 핵산 서열의 일부에 또는 이에 인접한 일부에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함하는 변경-특이적 프로브 또는 변경-특이적 프라이머를 사용하는 것을 포함할 수 있다. 일부 실시형태에서, 검정은 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함하는 변이체 PNPLA3 게놈 DNA의 일부에, 또는 이에 인접한 일부에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함하는 변경-특이적 프로브 또는 변경-특이적 프라이머를 사용하는 것을 포함할 수 있다. 일부 실시형태에서, 검정은 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함하는 변이체 PNPLA3 mRNA의 일부 또는 이에 인접한 일부에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함하는 변경-특이적 프로브 또는 변경-특이적 프라이머를 사용하는 것을 포함할 수 있다. 일부 실시형태에서, 검정은 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함하는 변이체 PNPLA3 mRNA의 일부 또는 이에 인접한 일부에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함하는 변경-특이적 프로브 또는 변경-특이적 프라이머를 사용하는 것을 포함할 수 있다. 일부 실시형태에서, 검정은 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함하는 변이체 PNPLA3 cDNA의 일부 또는 이에 인접한 일부에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함하는 변경-특이적 프로브 또는 변경-특이적 프라이머를 사용하는 것을 포함할 수 있다. 일부 실시형태에서, 검정은 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함하는 변이체 PNPLA3 cDNA의 일부 또는 이에 인접한 일부에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함하는 변경-특이적 프로브 또는 변경-특이적 프라이머를 사용하는 것을 포함할 수 있다.
일부 실시형태에서, 검정은 서열번호 1에 따른 12,667번 위치에 상응하는 위치에 아데닌을 포함하는 HSD17B13 게놈 DNA의 일부에, 또는 이에 인접한 일부에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함하는 변경-특이적 프로브 또는 변경-특이적 프라이머를 사용하는 것을 포함할 수 있다. 일부 실시형태에서, 검정은 서열번호 2에 따른 12,667번 위치에 상응하는 위치에 티민을 포함하는 HSD17B13 게놈 DNA의 일부에, 또는 이에 인접한 일부에 상보성이고/이거나 혼성화하거나 특이적으로 혼성화하는 핵산 서열을 포함하는 변경-특이적 프로브 또는 변경-특이적 프라이머를 사용하는 것을 포함할 수 있다.
일부 실시형태에서, 검정은 대상체로부터의 생물학적 샘플 중에 존재하는 본 명세서에 기재된 핵산 분자의 적어도 일부를 서열분석하는 것을 포함하며, 여기서 서열분석되는 일부는 본 명세서에 개시된 위치를 포함한다. 예를 들어, 서열분석되는 일부는 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하거나, 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함하는 PNPLA3 핵산 서열의 일부일 수 있다. 일부 실시형태에서, 서열분석되는 일부는 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함하는 변이체 PNPLA3 게놈 DNA의 일부일 수 있다. 일부 실시형태에서, 서열분석되는 일부는 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함하는 변이체 PNPLA3 mRNA의 일부일 수 있다. 일부 실시형태에서, 서열분석되는 일부는 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함하는 변이체 PNPLA3 mRNA의 일부일 수 있다. 일부 실시형태에서, 서열분석되는 일부는 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함하는 변이체 PNPLA3 cDNA의 일부일 수 있다. 일부 실시형태에서, 서열분석되는 일부는 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함하는 변이체 PNPLA3 cDNA의 일부일 수 있다.
일부 실시형태에서, 서열분석되는 일부는 서열번호 1에 따른 12,667번 위치에 상응하는 위치에 아데닌을 포함하는 HSD17B13 게놈 DNA의 일부일 수 있다. 일부 실시형태에서, 서열분석되는 일부는 서열번호 2에 따른 12,667번 위치에 상응하는 위치에 티민을 포함하는 HSD17B13 게놈 DNA의 일부일 수 있다.
일부 실시형태에서, 검정은 a) 생물학적 샘플을, 본 명세서에서 식별된 핵산 분자의 일부에 인접한(예를 들어, 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하거나, 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함하는 PNPLA3 핵산 서열의 일부에 인접하거나; 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함하는 변이체 PNPLA3 게놈 DNA의 일부에 인접하거나; 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함하는 변이체 PNPLA3 mRNA의 일부에 인접하거나; 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함하는 변이체 PNPLA3 mRNA의 일부에 인접하거나; 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함하는 변이체 PNPLA3 cDNA의 일부에 인접하거나; 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함하는 변이체 PNPLA3 cDNA의 일부에 인접하거나; 서열번호 1에 따른 12,667번 위치에 상응하는 위치에 아데닌을 포함하는 HSD17B13 게놈 DNA의 일부에 인접하거나; 또는 서열번호 2에 따른 12,667번 위치에 상응하는 위치에 티민을 포함하는 HSD17B13 게놈 DNA의 일부에 인접한) 영역에 혼성화하는 프라이머(또는 변경-특이적 프라이머)와 접촉시키는 단계; b) 프라이머를 적어도 뉴클레오타이드 위치에 상응하는 핵산 분자의 위치를 통해서 변경된 부위(예를 들어, 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하거나, 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함하는 PNPLA3 핵산 서열의 일부; 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함하는 변이체 PNPLA3 게놈 DNA의 일부; 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함하는 변이체 PNPLA3 mRNA의 일부; 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함하는 변이체 PNPLA3 mRNA의 일부; 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함하는 변이체 PNPLA3 cDNA의 일부; 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함하는 변이체 PNPLA3 cDNA의 일부; 서열번호 1에 따른 12,667번 위치에 상응하는 위치에 아데닌을 포함하는 HSD17B13 게놈 DNA의 일부; 또는 서열번호 2에 따른 12,667번 위치에 상응하는 위치에 티민을 포함하는 HSD17B13 게놈 DNA의 일부)를 지나서 연장시키는 단계; 및 c) 프라이머의 연장 산물이 본 명세서에 기재된 변이체 또는 야생형 PNPLA3 또는 HSD17B13 핵산 분자 중 임의의 것의 핵산 서열을 포함하는지의 여부를 결정하는 단계를 포함한다.
일부 실시형태에서, PNPLA3 게놈 DNA만 분석된다. 일부 실시형태에서, PNPLA3 mRNA만 분석된다. 일부 실시형태에서, PNPLA3 mRNA로부터 획득된 PNPLA3 cDNA만 분석된다. 일부 실시형태에서, HSD17B13 게놈 DNA만 분석된다. 일부 실시형태에서, HSD17B13 mRNA만 분석된다. 일부 실시형태에서, HSD17B13 mRNA로부터 획득된 HSD17B13 cDNA만 분석된다. 일부 실시형태에서, HSD17B13 RNA 전사물만 분석된다. 일부 실시형태에서, HSD17B13 RNA 전사물로부터 획득된 HSD17B13 cDNA만 분석된다.
일부 실시형태에서, 검정은 생물학적 샘플을 엄격한 조건 하에서 상응하는 기능성 핵산 분자가 아닌 본 명세서에 기재된 특정 변이체 PNPLA3 핵산 분자 또는 변이체 HSD17B13 핵산 분자 중 임의의 것(예를 들어, 변이체 게놈 DNA 분자, mRNA 분자, cDNA 분자, RNA 전사물 또는 cDNA 전사물 중 임의의 것)에 특이적으로 혼성화하는 프라이머 또는 프로브와 접촉시키는 단계, 및 혼성화가 일어났는지의 여부를 결정하는 단계를 포함한다.
일부 실시형태에서, 검정은 생물학적 샘플을 엄격한 조건 하에서 각각 야생형 PNPLA3 또는 변이체 HSD17B13을 암호화하는 상응하는 핵산 분자가 아닌 본 명세서에 기재된 특정 변이체 PNPLA3 핵산 분자 중 임의의 것(예를 들어, 변이체 게놈 DNA 분자, mRNA 분자, cDNA 분자, RNA 전사물 또는 cDNA 전사물 중 임의의 것) 또는 기능성 HSD17B13 단백질을 암호화하는 핵산 분자 중 임의의 것(예를 들어, 기능성 HSD17B13 단백질을 암호화하는 게놈 DNA 분자, mRNA 분자, cDNA 분자, RNA 전사물 또는 cDNA 전사물 중 임의의 것)에 특이적으로 혼성화하는 프라이머 또는 프로브와 접촉시키는 단계, 및 혼성화가 일어났는지의 여부를 결정하는 단계를 포함한다.
일부 실시형태에서, 검정은 RNA 서열분석(RNA-Seq)을 포함한다. 일부 실시형태에서, 검정은 또한 역 전사효소 중합효소 연쇄 반응(RT-PCR)을 통해서 mRNA를 cDNA로 역전사시키는 단계를 포함한다.
이러한 프로브 및 프라이머는 고도로 엄격한 혼성화 조건 하에 표적 서열에 특이적으로 혼성화할 수 있다. 비록 표적 핵산 서열과 상이하지만 표적 핵산 서열을 특이적으로 검출 및/또는 식별하는 능력을 보유하는 프로브가 종래의 방법에 의해 설계될 수 있지만, 프로브 및 프라이머는 인접 뉴클레오타이드와 표적 서열의 완전한 핵산 서열 동일성을 가질 수 있다. 따라서, 프로브 및 프라이머는 표적 핵산 분자와 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 100%의 서열 동일성 또는 상보성을 공유할 수 있다.
핵산 분자에 대한 프로브의 결합을 허용하는 조건 하에 생물학적 샘플에서 프로브가 핵산 분자와 혼성화되는 경우, 이러한 결합은 검출되고, 생물학적 샘플에서 특정 변이체 또는 야생형 PNPLA3 또는 변이체 또는 기능성 HSD17B13 유전자좌의 존재 또는 특정 변이체 또는 야생형 PNPLA3 또는 변이체 또는 기능성 HSD17B13 mRNA 또는 cDNA의 존재 또는 수준의 표시를 허용할 수 있다. 결합된 프로브의 이러한 식별은 기재되어 있다. 특정 프로브는 변이체 또는 야생형 PNPLA3 또는 변이체 또는 기능성 HSD17B13 유전자의 특정 영역과 적어도 약 80%, 약 80% 내지 약 85%, 약 85% 내지 약 90%, 약 90% 내지 약 95%, 및 약 95% 내지 약 100% 동일한(또는 상보적인) 서열을 포함할 수 있다. 특정 프로브는 변이체 또는 야생형 PNPLA3 또는 변이체 또는 기능성 HSD17B13 mRNA의 특정 영역과 적어도 약 80%, 약 80% 내지 약 85%, 약 85% 내지 약 90%, 약 90% 내지 약 95%, 및 약 95% 내지 약 100% 동일한(또는 상보적인) 서열을 포함할 수 있다. 특정 프로브는 변이체 또는 야생형 PNPLA3 또는 변이체 또는 기능성 HSD17B13 cDNA의 특정 영역과 적어도 약 80%, 약 80% 내지 약 85%, 약 85% 내지 약 90%, 약 90% 내지 약 95%, 및 약 95% 내지 약 100% 동일한(또는 상보적인) 서열을 포함할 수 있다.
일부 실시형태에서, 생물학적 샘플의 특정 핵산 상보체가 특정 기능성 또는 변이체 PNPLA3 단백질 또는 HSD17B13 단백질을 암호화하는 핵산 서열을 포함하는지의 여부를 결정하기 위해서, 생물학적 샘플은 관심대상 부위를 암호화하는 위치(예를 들어, 본 명세서에 기재된 위치 중 임의의 것)에 인접한 5' 측접 서열로부터 유래된 제1 프라이머, 및 관심대상의 동일한 부위를 암호화하는 위치에 인접한 3' 측접 서열로부터 유래된 제2 프라이머를 포함하는 프라이머 쌍을 사용하여 핵산 증폭 방법에 적용되어, 특정 기능성 또는 변이체 PNPLA3 단백질 또는 HSD17B13 단백질의 존재를 진단하는 앰플리콘을 생성시킬 수 있다. 예를 들어, PNPLA3과 관련하여 앰플리콘은 서열번호 42에 따른 148번 위치에 상응하는 위치를 암호화하는 뉴클레오타이드 서열을 포함할 수 있다. HSD17B13과 관련하여 앰플리콘은 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 뉴클레오타이드 서열을 포함할 수 있다. 일부 실시형태에서, 앰플리콘은 길이가 프라이머 쌍과 하나의 뉴클레오타이드 염기쌍을 합한 길이에서부터, DNA 증폭 프로토콜에 의해 생산 가능한 앰플리콘의 임의의 길이까지의 범위일 수 있다. 이러한 거리는 하나의 뉴클레오타이드 염기쌍에서부터, 증폭 반응의 한계치, 또는 약 2만 개 뉴클레오타이드 염기쌍까지의 범위일 수 있다. 선택적으로, 프라이머 쌍은 관심대상 부위를 암호화하는 위치 및 관심대상 부위를 암호화하는 위치의 각각의 측면 상의 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 뉴클레오타이드를 포함하는 영역에 측접한다. 유사한 앰플리콘은 mRNA 및/또는 cDNA 서열로부터 생성될 수 있다.
프로브 및 프라이머를 제조 및 사용하는 대표적인 방법은 예를 들어, 문헌[Molecular Cloning: A Laboratory Manual, 2nd Ed., Vol. 1-3, ed. Sambrook et al., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. 1989(이하, "Sambrook et al., 1989"); Current Protocols in Molecular Biology, ed. Ausubel et al., Greene Publishing and Wiley-Interscience, New York, 1992(정기적으로 업데이트됨) (이하, "Ausubel et al., 1992"); 및 Innis et al., PCR Protocols: A Guide to Methods and Applications, Academic Press: San Diego, 1990)]에 기재되어 있다. PCR 프라이머 쌍은 예를 들어, 이러한 목적을 위해서 의도된 컴퓨터 프로그램, 예컨대, Vector NTI 버전 10(인포맥스사(Informax Inc.), 미국 메릴랜드주 베데스다주 소재)에서의 PCR 프라이머 분석 툴; PrimerSelect(디엔에이스타사(DNASTAR Inc.), 미국 매디슨주 위스콘신 소재); 및 Primer3(Version 0.4.0.COPYRGT., 1991, 화이트헤드 생의학 연구소(Whitehead Institute for Biomedical Research), 미국 매사추세츠주 캠브리지 소재)을 이용함으로써, 공지된 서열로부터 유래될 수 있다. 추가로, 서열은 시각적으로 스캔될 수 있고, 프라이머는 가이드라인을 사용하여 수동으로 식별될 수 있다.
임의의 핵산 혼성화 또는 증폭 또는 서열분석 방법을 사용하여 기능성 또는 변이체 PNPLA3 또는 HSD17B13 유전자 유전자좌의 존재 및/또는 기능성 또는 변이체 PNPLA3 또는 HSD17B13 mRNA 또는 mRNA로부터 생산된 cDNA의 수준을 특이적으로 검출할 수 있다. 일부 실시형태에서, 핵산 분자를 프라이머로서 사용하여 기능성 또는 변이체 PNPLA3 또는 HSD17B13 핵산의 영역을 증폭시킬 수 있거나, 또는 핵산 분자를 예를 들어, 엄격한 조건 하에서, 기능성 또는 변이체 PNPLA3 또는 HSD17B13 유전자 유전자좌를 포함하는 핵산 분자 또는 기능성 또는 변이체 PNPLA3 또는 HSD17B13 mRNA 또는 mRNA로부터 생산된 cDNA를 포함하는 핵산 분자에 특이적으로 혼성화하는 프로브로서 사용할 수 있다.
예를 들어, 핵산 서열분석, 핵산 혼성화 및 핵산 증폭을 비롯한 다양한 기술이 입수 가능하다. 핵산 서열분석 기술의 예시적인 예는 쇄 종결인자(생어(Sanger)) 서열분석 및 염료 종결인자 서열분석을 포함하지만 이들로 제한되지 않는다.
다른 방법은 정제된 DNA, 증폭된 DNA 및 고정된 세포 제제에 대해서 지향되는 표지화된 프라이머 또는 프로브(형광 동일계 혼성화(fluorescence in situ hybridization: FISH))를 사용하는 것을 비롯하여, 서열분석 이외의 핵산 혼성화 방법을 포함한다. 일부 방법에서, 표적 핵산은 검출 이전에 또는 검출과 동시에 증폭될 수 있다. 핵산 증폭 기술의 예시적인 예는 중합효소 연쇄 반응(PCR), 리가제 연쇄 반응(LCR), 가닥 대체 증폭(strand displacement amplification: SDA) 및 핵산 서열 기반 증폭(NASBA)을 포함하지만 이들로 제한되지 않는다. 다른 방법은 리가제 연쇄 반응, 가닥 대체 증폭 및 고온성 SDA(thermophilic SDA: tSDA)를 포함하지만 이들로 제한되지 않는다.
예를 들어, 혼성화 보호 검정(Hybridization Protection Assay: HPA), 실시간 증폭 공정의 정량적 평가, 및 샘플 중에 초기에 존재하지만 실시간 증폭을 기초로 하지 않고 표적 서열의 양을 결정하는 것을 비롯한, 임의의 방법이 비-증폭된 또는 증폭된 폴리뉴클레오타이드를 검출하는데 사용될 수 있다.
서열 증폭을 반드시 필요로 하지는 않고, 예를 들어, 서던(DNA:DNA) 블롯 혼성화, 동일계 혼성화(ISH) 및 형광 동일계 혼성화(FISH) 방법을 기반으로 하는 핵산을 식별하기 위한 방법이 또한 제공된다. 서던 블로팅은 특정 핵산 서열을 검출하는 데 사용될 수 있다. 이러한 방법에서, 샘플로부터 추출되는 핵산은 단편화되고, 매트릭스 겔에서 전기이동적으로 분리되고, 막 필터로 전달된다. 필터 결합된 핵산은 관심대상 서열에 상보적인 표지된 프로브와의 혼성화에 적용된다. 필터에 결합된 혼성화된 프로브가 검출된다. 임의의 이러한 방법에서, 방법은 본 명세서에 기재되거나 또는 예시된 프로브 중 임의의 것을 사용한 혼성화를 포함할 수 있다.
혼성화 기술에서, 프로브 또는 프라이머가 이의 표적에 특이적으로 혼성화할 것이도록 엄격한 조건이 사용될 수 있다. 일부 실시형태에서, 엄격한 조건 하에서, 폴리뉴클레오타이드 프라이머 또는 프로브는 다른 서열(예를 들어, 상응하는 기능성 또는 변이체 PNPLA3 또는 HSD17B13 유전자좌, 기능성 또는 변이체 PNPLA3 또는 HSD17B13 mRNA, 또는 기능성 또는 변이체 PNPLA3 또는 HSD17B13 cDNA)보다 검출 가능하게 더 큰 정도로, 배경보다 10배를 초과하는 것을 비롯하여, 배경보다, 예컨대, 적어도 2배, 적어도 3배, 적어도 4배 또는 그 초과의 더 큰 정도로, 이의 표적 서열(예를 들어, 기능성 또는 변이체 PNPLA3 또는 HSD17B13 유전자좌, 기능성 또는 변이체 PNPLA3 또는 HSD17B13 mRNA, 또는 기능성 또는 변이체 PNPLA3 또는 HSD17B13 cDNA)에 혼성화할 것이다. 일부 실시형태에서, 엄격한 조건 하에서 폴리뉴클레오타이드 프라이머 또는 프로브는 다른 서열에 대한 것보다 적어도 2배만큼 검출 가능하게 큰 정도로 이의 표적 서열에 혼성화할 것이다. 일부 실시형태에서, 엄격한 조건 하에서 폴리뉴클레오타이드 프라이머 또는 프로브는 다른 서열에 대한 것보다 적어도 3배만큼 검출 가능하게 큰 정도로 이의 표적 서열에 혼성화할 것이다. 일부 실시형태에서, 엄격한 조건 하에서 폴리뉴클레오타이드 프라이머 또는 프로브는 다른 서열에 대한 것보다 적어도 4배만큼 검출 가능하게 큰 정도로 이의 표적 서열에 혼성화할 것이다. 일부 실시형태에서, 엄격한 조건 하에서 폴리뉴클레오타이드 프라이머 또는 프로브는 배경보다 10배를 초과하게 검출 가능하게 큰 정도로 다른 서열에 대한 것보다 이의 표적 서열에 혼성화할 것이다. 엄격한 조건은 서열 의존적이고, 상이한 상황에서 상이할 것이다. 혼성화의 엄격성 및/또는 세척 조건을 제어함으로써, 프로브에 100% 상보적인 표적 서열이 식별될 수 있다(상동성 프로빙). 대안으로, 엄격성 조건은 더 낮은 정도의 동일성이 검출되도록, 서열에서 일부 미스매치를 허용하도록 조정될 수 있다(이종성 프로빙).
일부 실시형태에서, 검출 단계는, 관심대상 부위(예를 들어, 본 명세서에 기재된 위치 중 임의의 것)를 암호화하는 핵산 분자의 적어도 일부를 증폭시키는 단계; 핵산 분자를 검출 가능한 표지로 표지하는 단계; 표지된 핵산을 프로브를 포함하는 지지체와 접촉시키는 단계로서, 프로브는 엄격한 조건 하에서 관심대상 부위(예를 들어, 본 명세서에 기재된 위치 중 임의의 것)를 암호화하는 핵산에 혼성화하는 핵산 서열을 포함하는, 상기 단계; 및 검출 가능한 표지를 검출하는 단계를 포함한다.
일부 실시형태에서, 검출 단계는, PNPLA3 또는 HSD17B13 단백질을 암호화하는 핵산 분자의 적어도 일부를 증폭시키는 단계로서, 증폭된 핵산 분자는 관심대상 부위(예를 들어, 본 명세서에 기재된 위치 중 임의의 것)를 포함하는 아미노산 서열을 암호화하는, 상기 단계; 핵산 분자를 검출 가능한 표지로 표지하는 단계; 표지된 핵산을 프로브를 포함하는 지지체와 접촉시키는 단계로서, 프로브는 엄격한 조건 하에서 관심대상 부위(예를 들어, 본 명세서에 기재된 위치 중 임의의 것)를 암호화하는 핵산에 혼성화하는 핵산 서열을 포함하는, 상기 단계; 및 검출 가능한 표지를 검출하는 단계를 포함한다. 본 명세서에 개시된 핵산 분자 중 임의의 것은 증폭될 수 있다. 예를 들어, 본 명세서에 개시된 게놈 DNA, cDNA 또는 mRNA 분자는 증폭될 수 있다. 일부 실시형태에서, 핵산 분자는 mRNA이고, 방법은 증폭 단계 이전에 mRNA를 cDNA로 역전사시키는 단계를 추가로 포함한다.
일부 실시형태에서, 검출 단계는 PNPLA3 또는 HSD17B13 단백질을 암호화하는 핵산 분자를 검출 가능한 표지를 포함하는 프로브와 접촉시키는 단계로서, 프로브는 엄격한 조건 하에서 변이체 PNPLA3 또는 HSD17B13 단백질을 암호화하는 핵산 서열에 혼성화하는 핵산 서열을 포함하는, 상기 단계, 및 검출 가능한 표지를 검출하는 단계를 포함한다. 일부 실시형태에서, 검출 단계는 PNPLA3 또는 HSD17B13 단백질을 암호화하는 핵산 분자를 검출 가능한 표지를 포함하는 프로브와 접촉시키는 단계로서, 프로브는 엄격한 조건 하에서 관심대상 부위(예를 들어, 본 명세서에 기재된 위치 중 임의의 것)를 암호화하는 핵산 서열에 혼성화하는 핵산 서열을 포함하는, 상기 단계, 및 검출 가능한 표지를 검출하는 단계를 포함한다. 일부 실시형태에서, 핵산 분자는 인간 대상체로부터 획득된 세포 내에 존재하여, 검출은 동일계 혼성화 기술에 따른다.
본 명세서에 개시된 방법에 사용될 수 있는 다른 검정은 예를 들어, 역전사 중합효소 연쇄 반응(RT-PCR) 또는 정량적 RT-PCR(qRT-PCR)을 포함한다. 본 명세서에 개시된 방법에 사용될 수 있는 추가의 다른 검정은 예를 들어, RNA 서열분석(RNA-Seq)에 이어서 생물학적 샘플에서 변이체 mRNA 또는 cDNA의 존재 또는 양의 검출을 포함한다.
일부 실시형태에서, 검출 단계는 특정 PNPLA3 또는 HSD17B13 단백질을 암호화하는 핵산 분자의 적어도 일부를 증폭시키는 단계, 증폭된 핵산 분자를 검출 가능한 표지로 표지하는 단계, 표지된 핵산 분자를 프로브를 포함하는 지지체와 접촉시키는 단계로서, 프로브는 예를 들어, 엄격한 조건 하에서 특정 PNPLA3 또는 HSD17B13 단백질을 암호화하는 핵산 서열에 특이적으로 혼성화하는 핵산 서열을 포함하는, 상기 단계, 및 검출 가능한 표지를 검출하는 단계를 포함한다. 일부 실시형태에서, 검출 단계는 특정 PNPLA3 또는 HSD17B13 단백질을 암호화하는 핵산 분자의 적어도 일부를 증폭시키는 단계, 증폭된 핵산 분자를 검출 가능한 표지로 표지하는 단계, 표지된 핵산 분자를 프로브를 포함하는 지지체와 접촉시키는 단계로서, 프로브는 예를 들어, 엄격한 조건 하에서, 관심대상 부위(예를 들어, 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 암호화하거나, 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 암호화하는 PNPLA3 핵산 서열의 일부; 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함하는 변이체 PNPLA3 게놈 DNA의 일부; 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함하는 변이체 PNPLA3 mRNA의 일부; 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함하는 변이체 PNPLA3 mRNA의 일부; 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함하는 변이체 PNPLA3 cDNA의 일부; 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함하는 변이체 PNPLA3 cDNA의 일부; 서열번호 1에 따른 12,667번 위치에 상응하는 위치에 아데닌을 포함하는 HSD17B13 게놈 DNA의 일부; 또는 서열번호 2에 따른 12,667번 위치에 상응하는 위치에 티민을 포함하는 HSD17B13 게놈 DNA의 일부)를 암호화하는 핵산 서열에 특이적으로 혼성화하는 핵산 서열을 포함하는, 상기 단계, 및 검출 가능한 표지를 검출하는 단계를 포함한다. 핵산이 mRNA를 포함하는 경우, 방법은 증폭 단계 이전에 mRNA를 cDNA로 역전사시키는 단계를 추가로 포함할 수 있다. 일부 실시형태에서, 결정 단계는 특정 PNPLA3 또는 HSD17B13 단백질을 암호화하는 핵산 분자를 검출 가능한 표지를 포함하는 프로브와 접촉시키는 단계 및 검출 가능한 표지를 검출하는 단계를 포함한다.
본 개시내용은 하이드록시스테로이드 17-베타 데하이드로게나제 13(HSD17B13)을 저해함으로써 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법을 제공하며, 이 방법은, 대상체로부터의 샘플이 I148M 변이를 포함하는 파타틴 유사 포스포리파제 도메인 함유 3(PNPLA3) 단백질을 암호화하는 제1 핵산, 및 기능성 HSD17B13 단백질을 암호화하는 제2 핵산, 및/또는 I148M 변이를 포함하는 PNPLA3 단백질 및 기능성 HSD17B13 단백질을 포함하는지의 여부를 결정하는 단계; 및 제1 핵산 및 제2 핵산 둘 다 및/또는 단백질 둘 다가 검출되는 경우 대상체를 HSD17B13을 저해함으로써 간 질환을 치료 또는 저해하기 위한 후보자로서 식별하는 단계를 포함한다. 일부 실시형태에서, 대상체는 비만이다. 일부 실시형태에서, 대상체는 지방간을 갖는다. 일부 실시형태에서, 제1 핵산 분자는 게놈 DNA를 포함한다. 일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, 제1 핵산 분자는 mRNA를 포함한다. 일부 실시형태에서, mRNA는 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함한다. 일부 실시형태에서, mRNA는 서열번호 34에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, mRNA는 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함한다. 일부 실시형태에서, mRNA는 서열번호 35에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, 제1 핵산 분자는 mRNA로부터 획득된 cDNA를 포함한다. 일부 실시형태에서, cDNA는 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, cDNA는 서열번호 38에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, cDNA는 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, cDNA는 서열번호 39에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, 제1 핵산을 검출하는 단계는 제1 핵산의 적어도 일부를 서열분석하는 단계를 포함하고, 일부는 I148M 변이를 암호화하는 코돈을 포함한다. 일부 실시형태에서, 제1 핵산을 검출하는 단계는 제1 핵산을 제1 핵산의 일부에 특이적으로 혼성화하는 프로브 또는 프라이머와 혼성화시키는 단계를 포함하며, 여기서 일부는 I148M 변이를 암호화하는 코돈을 포함한다. 일부 실시형태에서, 프로브 또는 프라이머는 대립유전자-특이적 프로브 또는 프라이머이다. 일부 실시형태에서, 프로브 또는 프라이머는 표지를 포함한다. 일부 실시형태에서, 방법은 대상체가 I148M 변이에 대해서 동형접합성인지 또는 이형접합성인지를 결정하는 단계를 추가로 포함한다.
일부 실시형태에서, 제2 핵산은 게놈 DNA를 포함한다. 일부 실시형태에서, 게놈 DNA는 서열번호 1에 따른 12,667번 위치에 상응하는 위치에 아데닌을 포함한다. 일부 실시형태에서, 게놈 DNA는 서열번호 1을 포함한다. 일부 실시형태에서, 제2 핵산 분자는 mRNA를 포함한다. 일부 실시형태에서, mRNA는 서열번호 3을 포함한다. 일부 실시형태에서, mRNA는 서열번호 4를 포함한다. 일부 실시형태에서, mRNA는 서열번호 7을 포함한다. 일부 실시형태에서, mRNA는 서열번호 11을 포함한다. 일부 실시형태에서, 제2 핵산 분자는 mRNA로부터 획득된 cDNA를 포함한다. 일부 실시형태에서, cDNA는 서열번호 12를 포함한다. 일부 실시형태에서, cDNA는 서열번호 13을 포함한다. 일부 실시형태에서, cDNA는 서열번호 16을 포함한다. 일부 실시형태에서, cDNA는 서열번호 20을 포함한다. 일부 실시형태에서, 제2 핵산을 검출하는 단계는 제2 핵산을 서열분석하는 단계를 포함한다. 일부 실시형태에서, 제2 핵산을 검출하는 단계는 제2 핵산을 제2 핵산에 특이적으로 혼성화하는 프로브 또는 프라이머와 혼성화시키는 단계를 포함한다. 일부 실시형태에서, 프로브 또는 프라이머는 대립유전자-특이적 프로브 또는 프라이머이다. 일부 실시형태에서, 프로브 또는 프라이머는 표지를 포함한다. 일부 실시형태에서, 방법은 대상체가 샘플에서 기능성 HSD17B13 단백질을 암호화하는 제2 핵산에 대해서 동형접합성인지 또는 이형접합성인지를 결정하는 단계를 추가로 포함한다.
본 개시내용은 HSD17B13 저해를 위한 후보자인 대상체를 식별하는 방법을 제공하며, 이 방법은 대상체로부터의 샘플이 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체를 암호화하는 핵산을 포함하는지의 여부를 결정하는 단계를 포함한다. 본 개시내용은 또한 HSD17B13을 저해함으로써 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법을 제공하며, 이 방법은, 대상체로부터의 샘플이 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 제1 핵산, 및 기능성 HSD17B13 단백질을 암호화하는 제2 핵산, 및/또는 I148M 변이를 포함하는 PNPLA3 단백질 및 기능성 HSD17B13 단백질을 포함하는지의 여부를 결정하는 단계; 및 제1 핵산 및 제2 핵산 둘 다 및/또는 단백질 둘 다가 검출되는 경우 대상체를 HSD17B13을 저해함으로써 간 질환을 치료 또는 저해하기 위한 후보자로서 식별하는 단계를 포함한다.
본 개시내용은 또한 HSD17B13 저해를 위한 후보자인 대상체를 분류하는 방법을 제공하며, 이 방법은 대상체로부터의 샘플이 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체를 암호화하는 핵산을 포함하는지의 여부를 결정하는 단계를 포함한다. 본 개시내용은 또한 HSD17B13을 저해함으로써 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 분류하는 방법을 제공하며, 이 방법은, 대상체로부터의 샘플이 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 제1 핵산, 및 기능성 HSD17B13 단백질을 암호화하는 제2 핵산, 및/또는 I148M 변이를 포함하는 PNPLA3 단백질 및 기능성 HSD17B13 단백질을 포함하는지의 여부를 결정하는 단계; 및 제1 핵산 및 제2 핵산 둘 다 및/또는 단백질 둘 다가 검출되는 경우 대상체를 HSD17B13을 저해함으로써 간 질환을 치료 또는 저해하기 위한 후보자로서 분류하는 단계를 포함한다.
변이체 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체는 본 명세서에 기재된 변이체 PNPLA3 Ile148Met 변이체 및 PNPLA3 Ile144Met 변이체 중 임의의 것일 수 있다. 변이체 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체는 본 명세서에 기재된 방법 중 임의의 것에 의해서 검출될 수 있다. 일부 실시형태에서, 방법은 대상체가 변이체 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체에 대해서 동형접합성인지 또는 이형접합성인지를 결정하는 단계를 추가로 포함한다. 일부 실시형태에서, 대상체는 변이체 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체에 대해서 동형접합성이다. 일부 실시형태에서, 대상체는 변이체 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체에 대해서 이형접합성이다. 일부 실시형태에서, 대상체는 변이체 PNPLA3 Ile148Met 변이체에 대해서 동형접합성이다. 일부 실시형태에서, 대상체는 변이체 PNPLA3 Ile148Met 변이체에 대해서 이형접합성이다. 일부 실시형태에서, 대상체는 변이체 PNPLA3 Ile144Met 변이체에 대해서 동형접합성이다. 일부 실시형태에서, 대상체는 변이체 PNPLA3 Ile144Met 변이체에 대해서 이형접합성이다.
바람직한 실시형태에서, 대상체는 HSD17B13 단백질 내에 기능 상실 변이를 암호화하는 어떠한 유전자도 포함하지 않는다. 본 명세서에 기재되거나 예시된 것을 비롯한 HSD17B13 단백질 내의 기능 상실 변이는 간 질환-보호 효과를 부여한다고 여겨지고, 추가로 이러한 보호 효과는 변이체 PNPLA3 Ile148M 변이의 존재 하에서 향상된다고 여겨진다. 따라서, HSD17B13 단백질을 암호화하는 (각각의 염색체로부터의) 유전자의 카피 모두가 기능 상실 변이를 암호화하는 대상체(예를 들어, PNPLA3 내에 I148M 변이를 포함하는 대상체)는 HSD17B13 저해 요법으로부터 이득을 얻지 못할 것이라고 여겨진다. 그럼에도 불구하고, 적어도 부분적인 기능성 HSD17B13 단백질을 발현하는 대상체는 HSD17B13 저해 요법으로부터 이득을 얻을 것이라고 여겨진다. 따라서, 방법은 유전자가 HSD17B13 단백질에서 기능 상실 변이를 암호화하는지의 여부, 뿐만 아니라, 대상체가 동형접합성인지 또는 이형접합성인지의 여부를 비롯하여, (하나 또는 두 염색체에서) HSD17B13을 암호화하는 유전자의 상태를 분류하는 단계를 포함할 수 있다.
일부 실시형태에서, 방법은 대상체로부터의 샘플에서 기능성 HSD17B13 단백질을 암호화하는 핵산 분자 또는 유전자의 존재를 검출하는 단계를 추가로 포함한다. 핵산 분자는 본 명세서에 기재된 기능성 HSD17B13 단백질 중 임의의 것을 암호화할 수 있다. HSD17B13 핵산 분자는 본 명세서에 기재된 방법 중 임의의 것에 의해서 검출될 수 있다. 일부 실시형태에서, 방법은 대상체가 기능성 HSD17B13 단백질을 암호화하는 유전자에 대해서 동형접합성인지 또는 이형접합성인지를 결정하는 단계를 추가로 포함한다. 일부 실시형태에서, 대상체는 기능성 HSD17B13 단백질을 암호화하는 유전자에 대해서 동형접합성이다. 일부 실시형태에서, 대상체는 기능성 HSD17B13을 암호화하는 유전자에 대해서 이형접합성이다.
본 개시내용은 또한 본 명세서에 개시된 프로브 중 임의의 하나 이상이 부착된 기질을 포함하는 지지체를 제공한다. 고체 지지체는 분자, 예컨대, 본 명세서에 개시된 프로브 중 임의의 것이 회합될 수 있는 고체-상태 기질 또는 지지체이다. 고체 지지체의 형태는 어레이이다. 고체 지지체의 또 다른 형태는 어레이 검출기이다. 어레이 검출기는 다수의 상이한 프로브가 어레이, 격자 또는 다른 조직화된 패턴으로 커플링된 고체 지지체이다.
고체 지지체에서 사용하기 위한 고체-상태 기질은 분자가 커플링될 수 있는 임의의 고체 물질을 포함할 수 있다. 이것은 아크릴아마이드, 아가로스, 셀룰로스, 나이트로셀룰로스, 유리, 폴리스타이렌, 폴리에틸렌 비닐 아세테이트, 폴리프로필렌, 플리메타크릴레이트, 폴리에틸렌, 폴리에틸렌 옥사이드, 폴리실리케이트, 폴리카보네이트, 테플론, 플루오로카본, 나일론, 규소(silicon) 고무, 폴리산무수물(polyanhydride), 폴리글리콜산, 폴리락트산, 폴리오쏘에스터, 폴리프로필퓨머레이트, 콜라겐, 글리코사미노글리칸 및 폴리아미노산과 같은 물질을 포함한다. 고체-상태 기질은 박막, 막, 병, 접시, 섬유, 제직 섬유, 성형 중합체, 입자, 비드, 마이크로입자 또는 조합물을 비롯한 임의의 유용한 형태를 가질 수 있다. 고체-상태 기질 및 고체 지지체는 다공성 또는 비다공성일 수 있다. 고체-상태 기질을 위한 형태는 마이크로역가 접시, 예컨대, 표준 96-웰 유형이다. 일부 실시형태에서, 일반적으로 웰당 하나의 어레이를 함유하는 멀티-웰 유리 슬라이드가 사용될 수 있다. 이러한 특징은 검정 재현성의 더 큰 제어, 증가된 산출량 및 샘플 조작 및 자동화 용이성을 가능하게 한다. 일부 실시형태에서, 지지체는 마이크로어레이이다.
일부 실시형태에서, 방법은 대상체가 비만인지의 여부를 결정하는 단계를 추가로 포함한다. 일부 실시형태에서, 체질량 지수(BMI)가 30㎏/㎡를 초과하면 대상체는 비만이다. 비만은 간 질환을 갖거나 또는 이의 발달 위험이 있는 대상체의 특징일 수 있다. 일부 실시형태에서, 방법은 대상체가 지방간을 갖는지의 여부를 결정하는 단계를 추가로 포함한다. 지방간은 간 질환을 갖거나 또는 이의 발달 위험이 있는 대상체의 특징일 수 있다. 일부 실시형태에서, 방법은 대상체가 비만이고, 지방간을 갖는지의 여부를 결정하는 단계를 추가로 포함한다.
일부 실시형태에서, 방법은 대상체에게 HSD17B13의 저해제를 투여하는 단계를 추가로 포함한다. HSD17B13의 저해제를 대상체에게 투여하는 방법을 본 명세서에 기재한다.
일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 분자는 본 명세서에 기재된 핵산 분자 중 임의의 것이다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 분자는 게놈 DNA이다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질을 암호화하는 게놈 DNA는 본 명세서에 기재된 게놈 DNA 분자 중 임의의 것이다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질을 암호화하는 핵산 분자는 게놈 DNA이다. 일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질을 암호화하는 게놈 DNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 검출된다. 일부 실시형태에서, ATG 코돈을 포함하는 변이체 PNPLA3 단백질을 암호화하는 게놈 DNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 검출된다.
일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 분자는 mRNA이다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질을 암호화하는 mRNA는 본 명세서에 기재된 mRNA 분자 중 임의의 것이다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질을 암호화하는 핵산 분자는 mRNA이다. 일부 실시형태에서, mRNA는 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함한다. 일부 실시형태에서, mRNA는 서열번호 34에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, mRNA는 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함한다. 일부 실시형태에서, mRNA는 서열번호 35에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질을 암호화하는 mRNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 검출된다. 일부 실시형태에서, AUG 코돈을 포함하는 변이체 PNPLA3 단백질을 암호화하는 mRNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 식별된다.
일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 분자는 cDNA이다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질을 암호화하는 cDNA는 본 명세서에 기재된 cDNA 분자 중 임의의 것이다. 일부 실시형태에서, PNPLA3 Ile148Met 단백질을 암호화하는 핵산 분자는 cDNA이다. 일부 실시형태에서, cDNA는 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, cDNA는 서열번호 38에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, cDNA는 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, cDNA는 서열번호 39에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질을 암호화하는 cDNA는 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 식별된다. 일부 실시형태에서, ATG 코돈을 포함하는 변이체 PNPLA3 단백질을 암호화하는 cDNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 식별된다.
일부 실시형태에서, 기능성 HSD17B13 단백질을 암호화하는 핵산 분자는 본 명세서에 기재된 핵산 분자 중 임의의 것이다. 일부 실시형태에서, 기능성 HSD17B13 단백질을 암호화하는 핵산 분자는 게놈 DNA이다. 일부 실시형태에서, 기능성 HSD17B13 단백질을 암호화하는 게놈 DNA는 본 명세서에 기재된 게놈 DNA 분자 중 임의의 것이다. 일부 실시형태에서, 게놈 DNA는 서열번호 1에 따른 12,667번 위치에 상응하는 위치에 아데닌을 포함한다. 일부 실시형태에서, 게놈 DNA는 서열번호 1을 포함한다. 일부 실시형태에서, 기능성 HSD17B13 게놈 DNA의 존재는 명세서에 기재된 바와 같은, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 검출된다.
일부 실시형태에서, 기능성 HSD17B13 단백질을 암호화하는 핵산 분자는 mRNA이다. 일부 실시형태에서, 기능성 HSD17B13 단백질을 암호화하는 mRNA는 본 명세서에 기재된 mRNA 분자 중 임의의 것이다. 일부 실시형태에서, 기능성 HSD17B13 핵산 분자는 mRNA이다. 일부 실시형태에서, mRNA는 서열번호 3을 포함한다. 일부 실시형태에서, mRNA는 서열번호 4를 포함한다. 일부 실시형태에서, mRNA는 서열번호 7을 포함한다. 일부 실시형태에서, mRNA는 서열번호 11을 포함한다. 일부 실시형태에서, 기능성 HSD17B13 mRNA의 존재는 명세서에 기재된 바와 같은, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 검출된다.
일부 실시형태에서, 기능성 HSD17B13 단백질을 암호화하는 핵산 분자는 cDNA이다. 일부 실시형태에서, 기능성 HSD17B13 단백질을 암호화하는 cDNA는 본 명세서에 기재된 cDNA 분자 중 임의의 것이다. 일부 실시형태에서, cDNA는 서열번호 12를 포함한다. 일부 실시형태에서, cDNA는 서열번호 13을 포함한다. 일부 실시형태에서, cDNA는 서열번호 16을 포함한다. 일부 실시형태에서, cDNA는 서열번호 20을 포함한다. 일부 실시형태에서, 기능성 HSD17B13 cDNA의 존재는 명세서에 기재된 바와 같은, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 검출된다.
일부 실시형태에서, 방법은 대상체로부터 샘플을 획득하는 단계를 추가로 포함한다. 일부 실시형태에서, HSD17B13 저해에 대한 후보자인 대상체는 간 질환을 갖거나 또는 간 질환의 발달에 민감성이다. 일부 실시형태에서, 간 질환은 만성 간 질환이다. 일부 바람직한 실시형태에서, 만성 간 질환은 비알코올성 지방간 질환(NAFLD), 알코올성 간 질환(ALD), 비알코올성 지방간염(NASH), 간경변, 지방증 또는 간세포 암종이다. 일부 바람직한 실시형태에서, 만성 간 질환은 비알코올성 지방간 질환(NAFLD), 알코올성 간 질환(ALD), 비알코올성 지방간염(NASH), 간경변 또는 지방증이다. 일부 실시형태에서, 간 질환은 알코올성 간 질환이다. 일부 실시형태에서, 알코올성 간 질환은 알코올 섭취로 인한 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함한다. 일부 실시형태에서, 간 질환은 비알코올성 간 질환이다. 일부 실시형태에서, 비알코올성 간 질환은 비알코올성 지방간 질환(NAFLD) 또는 비알코올성 지방간염(NASH)을 포함한다. 일부 실시형태에서, 비알코올성 간 질환은 알코올 섭취에 의해서 유발되지 않은 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함한다.
본 개시내용은 또한 대상체에서 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체 및 기능성 HSD17B13을 검출하는 방법을 제공하며, 이 방법은 대상체로부터의 샘플에서, PNPLA3 Ile148Met 단백질, 또는 PNPLA3 Ile148Met 단백질을 암호화하는 핵산 분자의 존재를 검출하는 단계, 또는 대상체로부터의 샘플에서, PNPLA3 Ile144Met 단백질 또는 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 분자의 존재를 검출하는 단계; 및 대상체로부터의 샘플에서 기능성 HSD17B13 단백질 또는 기능성 HSD17B13 단백질을 암호화하는 핵산 분자의 존재를 검출하는 단계를 포함한다. 변이체 PNPLA3 Ile148Met 변이체 단백질 또는 핵산 분자는 본 명세서에 기재된 변이체 PNPLA3 Ile148Met 변이체 단백질 또는 핵산 분자 중 임의의 것일 수 있다. 변이체 PNPLA3 Ile144Met 변이체 단백질 또는 핵산 분자는 본 명세서에 기재된 변이체 PNPLA3 Ile144Met 변이체 단백질 또는 핵산 분자 중 임의의 것일 수 있다. 기능성 HSD17B13 단백질 또는 핵산 분자는 본 명세서에 기재된 기능성 HSD17B13 단백질 또는 핵산 분자 중 임의의 것일 수 있다.
일부 실시형태에서, 방법은 대상체가 변이체 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체에 대해서 동형접합성인지 또는 이형접합성인지를 결정하는 단계를 추가로 포함한다. 일부 실시형태에서, 대상체는 변이체 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체에 대해서 동형접합성이다. 일부 실시형태에서, 대상체는 변이체 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체에 대해서 이형접합성이다. 일부 실시형태에서, 대상체는 변이체 PNPLA3 Ile148Met 변이체에 대해서 동형접합성이다. 일부 실시형태에서, 대상체는 변이체 PNPLA3 Ile148Met 변이체에 대해서 이형접합성이다. 일부 실시형태에서, 대상체는 변이체 PNPLA3 Ile144Met 변이체에 대해서 동형접합성이다. 일부 실시형태에서, 대상체는 변이체 PNPLA3 Ile144Met 변이체에 대해서 이형접합성이다.
일부 실시형태에서, 방법은 대상체가 기능성 HSD17B13에 대해서 동형접합성인지 또는 이형접합성인지를 결정하는 단계를 추가로 포함한다. 일부 실시형태에서, 대상체는 기능성 HSD17B13에 대해서 동형접합성이다. 일부 실시형태에서, 대상체는 기능성 HSD17B13에 대해서 이형접합성이다.
일부 실시형태에서, 기능성 HSD17B13 단백질의 존재를 샘플에서 검출한다. 기능성 HSD17B13 단백질은 본 명세서에 기재된 기능성 HSD17B13 단백질 중 임의의 것일 수 있다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 서열번호 21, 서열번호 22, 서열번호 25 또는 서열번호 29에 따른 아미노산 서열을 포함한다. 일부 실시형태에서, 기능성 HSD17B13 단백질은 본 명세서에 기재된 바와 같은 아미노산 서열분석 또는 면역검정에 의해서 검출된다.
일부 실시형태에서, 기능성 HSD17B13 핵산 분자의 존재를 샘플에서 검출한다. 기능성 HSD17B13 핵산 분자는 본 명세서에 기재된 기능성 HSD17B13 핵산 분자 중 임의의 것일 수 있다. 일부 실시형태에서, 기능성 HSD17B13 핵산 분자는 게놈 DNA이다. 기능성 HSD17B13 게놈 DNA 분자는 본 명세서에 기재된 기능성 HSD17B13 게놈 DNA 분자 중 임의의 것일 수 있다. 일부 실시형태에서, 게놈 DNA는 서열번호 1에 따른 12,667번 위치에 상응하는 위치에 아데닌을 포함한다. 일부 실시형태에서, 게놈 DNA는 서열번호 1을 포함한다. 일부 실시형태에서, 게놈 DNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 검출된다.
일부 실시형태에서, 기능성 HSD17B13 핵산 분자는 mRNA이다. 기능성 HSD17B13 mRNA 분자는 본 명세서에 기재된 기능성 HSD17B13 mRNA 분자 중 임의의 것일 수 있다. 일부 실시형태에서, mRNA는 서열번호 3을 포함한다. 일부 실시형태에서, mRNA는 서열번호 4를 포함한다. 일부 실시형태에서, mRNA는 서열번호 7을 포함한다. 일부 실시형태에서, mRNA는 서열번호 11을 포함한다. 일부 실시형태에서, mRNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 검출된다.
일부 실시형태에서, 기능성 HSD17B13 핵산 분자는 cDNA이다. 기능성 HSD17B13 cDNA 분자는 본 명세서에 기재된 기능성 HSD17B13 cDNA 분자 중 임의의 것일 수 있다. 일부 실시형태에서, cDNA는 서열번호 12를 포함한다. 일부 실시형태에서, cDNA는 서열번호 13을 포함한다. 일부 실시형태에서, cDNA는 서열번호 16을 포함한다. 일부 실시형태에서, cDNA는 서열번호 20을 포함한다. 일부 실시형태에서, cDNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 검출된다.
일부 실시형태에서, PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질의 존재를 샘플에서 검출한다. 변이체 PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질은 본 명세서에 기재된 변이체 PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질 중 임의의 것일 수 있다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질은 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하거나, 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질은 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 샘플 중의 변이체 PNPLA3 단백질은 서열번호 42에 따른 아미노산 서열을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질은 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 샘플 중의 변이체 PNPLA3 단백질은 서열번호 43에 따른 아미노산 서열을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질은 본 명세서에 기재된 바와 같은 아미노산 서열분석 또는 면역검정에 의해서 검출된다.
일부 실시형태에서, PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile148Met 단백질을 암호화하는 핵산 분자의 존재가 샘플에서 검출된다. PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile148Met 단백질을 암호화하는 핵산 분자는 본 명세서에 기재된 PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile148Met 단백질을 암호화하는 핵산 분자 중 임의의 것일 수 있다.
일부 실시형태에서, PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 분자는 게놈 DNA이다. PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질을 암호화하는 게놈 DNA는 본 명세서에 기재된 게놈 DNA 분자 중 임의의 것일 수 있다. 일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, ATG 코돈을 포함하는 변이체 PNPLA3 단백질을 암호화하는 게놈 DNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 검출된다.
일부 실시형태에서, PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile148Met 단백질을 암호화하는 핵산 분자는 mRNA이다. PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile148Met 단백질을 암호화하는 mRNA 분자는 본 명세서에 기재된 mRNA 분자 중 임의의 것일 수 있다. 일부 실시형태에서, mRNA는 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함한다. 일부 실시형태에서, mRNA는 서열번호 34에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, mRNA는 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함한다. 일부 실시형태에서, mRNA는 서열번호 35에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, AUG 코돈을 포함하는 변이체 PNPLA3 단백질을 암호화하는 mRNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 식별된다.
일부 실시형태에서, PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 분자는 cDNA이다. PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질을 암호화하는 cDNA는 본 명세서에 기재된 cDNA 분자 중 임의의 것일 수 있다. 일부 실시형태에서, cDNA는 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, cDNA는 서열번호 38에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, cDNA는 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, cDNA는 서열번호 39에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, ATG 코돈을 포함하는 변이체 PNPLA3 단백질을 암호화하는 cDNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 식별된다.
일부 실시형태에서, 방법은 대상체로부터 샘플을 획득하는 단계를 추가로 포함한다.
본 개시내용은 또한 간 질환에 대해서 보호 효과를 갖는 대상체를 식별하는 방법을 제공하며, 이 방법은 대상체로부터의 샘플에서 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체의 존재를 검출하는 단계; 및 대상체로부터의 샘플에서 HSD17B13 기능 상실 변이체의 존재를 검출하는 단계를 포함한다. 본 개시내용은 또한 간 질환에 대해서 보호 효과를 갖는 대상체를 분류하는 방법을 제공하며, 이 방법은 대상체로부터의 샘플에서 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체의 존재를 검출하는 단계; 및 대상체로부터의 샘플에서 HSD17B13 기능 상실 변이체의 존재를 검출하는 단계를 포함한다. 변이체 PNPLA3 Ile148Met 변이체 및 PNPLA3 Ile144Met 변이체는 본 명세서에 기재된 변이체 PNPLA3 Ile148Met 변이체 및 PNPLA3 Ile144Met 변이체 중 임의의 것일 수 있다. HSD17B13 기능 상실 변이체는 본 명세서에 기재된 HSD17B13 기능 상실 변이체 중 임의의 것일 수 있다.
일부 실시형태에서, 방법은 대상체가 변이체 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체에 대해서 동형접합성인지 또는 이형접합성인지를 결정하는 단계를 추가로 포함한다. 일부 실시형태에서, 대상체는 변이체 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체에 대해서 동형접합성이다. 일부 실시형태에서, 대상체는 변이체 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체에 대해서 이형접합성이다. 일부 실시형태에서, 대상체는 변이체 PNPLA3 Ile148Met 변이체에 대해서 동형접합성이다. 일부 실시형태에서, 대상체는 변이체 PNPLA3 Ile148Met 변이체에 대해서 이형접합성이다. 일부 실시형태에서, 대상체는 변이체 PNPLA3 Ile144Met 변이체에 대해서 동형접합성이다. 일부 실시형태에서, 대상체는 변이체 PNPLA3 Ile144Met 변이체에 대해서 이형접합성이다.
일부 실시형태에서, 방법은 대상체가 기능성 HSD17B13에 대해서 동형접합성인지 또는 이형접합성인지를 결정하는 단계를 추가로 포함한다. 일부 실시형태에서, 대상체는 기능성 HSD17B13에 대해서 동형접합성이다. 일부 실시형태에서, 대상체는 기능성 HSD17B13에 대해서 이형접합성이다.
일부 실시형태에서, 변이체 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체는 대상체로부터의 샘플에서 PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile148Met 단백질을 암호화하는 핵산 분자를 검출하거나 또는 대상체로부터의 샘플에서 PNPLA3 Ile144Met 단백질 또는 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 분자를 검출함으로써 대상체에서 검출되고; HSD17B13 기능 상실은 대상체로부터의 샘플에서 HSD17B13 기능 상실 변이체 단백질 또는 HSD17B13 기능 상실 변이체 단백질을 암호화하는 핵산 분자를 검출함으로써 대상체에서 검출된다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체는 대상체로부터의 샘플에서 PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile148Met 단백질을 암호화하는 핵산 분자를 검출함으로써 대상체에서 검출되고; HSD17B13 기능 상실은 대상체로부터의 샘플에서 HSD17B13 기능 상실 변이체 단백질 또는 HSD17B13 기능 상실 변이체 단백질을 암호화하는 핵산 분자를 검출함으로써 대상체에서 검출된다.
일부 실시형태에서, PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질의 존재를 샘플에서 검출한다. 변이체 PNPLA3 Ile148Met 단백질 및 PNPLA3 Ile144Met 단백질은 본 명세서에 기재된 변이체 PNPLA3 Ile148Met 단백질 및 PNPLA3 Ile144Met 단백질 중 임의의 것일 수 있다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질은 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하거나, 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질은 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 샘플 중의 변이체 PNPLA3 단백질은 서열번호 42에 따른 아미노산 서열을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질은 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 샘플 중의 변이체 PNPLA3 단백질은 서열번호 43에 따른 아미노산 서열을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질은 본 명세서에 기재된 바와 같은 아미노산 서열분석 또는 면역검정에 의해서 검출된다.
일부 실시형태에서, PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 분자를 샘플에서 검출한다. 변이체 PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 분자는 본 명세서에 기재된 변이체 PNPLA3 Ile148Met 단백질 및 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 분자 중 임의의 것일 수 있다.
일부 실시형태에서, 여기서 PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 분자는 게놈 DNA이다. 변이체 PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질을 암호화하는 게놈 DNA는 본 명세서에 기재된 변이체 PNPLA3 Ile148Met 단백질 및 PNPLA3 Ile144Met 단백질 중 임의의 것일 수 있다. 일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, ATG 코돈을 포함하는 변이체 PNPLA3 단백질을 암호화하는 게놈 DNA는 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 검출된다.
일부 실시형태에서, 변이체 PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile144Met 단백질을 암호화하는 핵산 분자는 mRNA이다. 변이체 PNPLA3 Ile148Met 단백질 및 PNPLA3 Ile144Met 단백질을 암호화하는 mRNA 분자는 본 명세서에 기재된 변이체 PNPLA3 Ile148Met 단백질 및 PNPLA3 Ile144Met 단백질 중 임의의 것일 수 있다. 일부 실시형태에서, mRNA는 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함한다. 일부 실시형태에서, mRNA는 서열번호 34에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, mRNA는 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함한다. 일부 실시형태에서, mRNA는 서열번호 35에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, AUG 코돈을 포함하는 변이체 PNPLA3 단백질을 암호화하는 mRNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 식별된다.
일부 실시형태에서, PNPLA3 Ile148Met 단백질 또는 PNPLA3 Ile148Met 단백질을 암호화하는 핵산 분자는 cDNA이다. 변이체 PNPLA3 Ile148Met 단백질 및 PNPLA3 Ile148Met 단백질을 암호화하는 cDNA는 본 명세서에 기재된 변이체 PNPLA3 Ile148Met 단백질 및 PNPLA3 Ile148Met 단백질 중 임의의 것일 수 있다. 일부 실시형태에서, cDNA는 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, cDNA는 서열번호 38에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, cDNA는 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, cDNA는 서열번호 39에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, ATG 코돈을 포함하는 변이체 PNPLA3 단백질을 암호화하는 cDNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 식별된다.
일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질의 존재를 샘플에서 검출한다. HSD17B13 기능 상실 변이체는 본 명세서에 기재된 HSD17B13 기능 상실 변이체 단백질 중 임의의 것일 수 있다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질은 서열번호 23에 따른 아미노산 서열을 포함한다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질은 서열번호 24에 따른 아미노산 서열을 포함한다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질은 서열번호 26에 따른 아미노산 서열을 포함한다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질은 서열번호 27에 따른 아미노산 서열을 포함한다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질은 서열번호 28에 따른 아미노산 서열을 포함한다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질은 본 명세서에 기재된 바와 같은 아미노산 서열분석 또는 면역검정에 의해서 검출된다.
일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 핵산 분자의 존재를 샘플에서 검출한다. HSD17B13 기능 상실 변이체 단백질을 암호화하는 핵산 분자는 본 명세서에 기재된 HSD17B13 기능 상실 변이체 단백질을 암호화하는 핵산 분자 중 임의의 것일 수 있다.
일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 핵산 분자는 게놈 DNA이다. HSD17B13 기능 상실 변이체 단백질을 암호화하는 게놈 DNA 분자는 본 명세서에 기재된 HSD17B13 기능 상실 변이체 단백질 중 임의의 것일 수 있다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 게놈 DNA는 서열번호 2에 따른 12,667번 위치에 상응하는 위치에 티민을 포함한다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 게놈 DNA는 서열번호 2를 포함한다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 게놈 DNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 검출된다.
일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 핵산 분자는 mRNA이다. HSD17B13 기능 상실 변이체 단백질을 암호화하는 mRNA 분자는 본 명세서에 기재된 HSD17B13 기능 상실 변이체 단백질을 암호화하는 mRNA 분자 중 임의의 것일 수 있다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 mRNA는 서열번호 5를 포함한다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 mRNA는 서열번호 6을 포함한다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 mRNA는 서열번호 8을 포함한다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 mRNA는 서열번호 9를 포함한다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 mRNA는 서열번호 10을 포함한다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 mRNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 검출된다.
일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 핵산 분자는 cDNA이다. HSD17B13 기능 상실 변이체 단백질을 암호화하는 cDNA 분자는 본 명세서에 기재된 HSD17B13 기능 상실 변이체 단백질을 암호화하는 cDNA 분자 중 임의의 것일 수 있다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 cDNA는 서열번호 5를 포함한다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 cDNA는 서열번호 6을 포함한다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 cDNA는 서열번호 8을 포함한다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 cDNA는 서열번호 9를 포함한다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 cDNA는 서열번호 10을 포함한다. 일부 실시형태에서, HSD17B13 기능 상실 변이체 단백질을 암호화하는 cDNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 검출된다.
일부 실시형태에서, 방법은 대상체로부터 샘플을 획득하는 단계를 추가로 포함한다. 일부 실시형태에서, 간 질환은 만성 간 질환이다. 일부 실시형태에서, 만성 간 질환은 비알코올성 지방간 질환(NAFLD), 알코올성 간 질환(ALD), 비알코올성 지방간염(NASH), 간경변, 지방증 또는 간세포 암종이다. 일부 실시형태에서, 간 질환은 알코올성 간 질환이다. 일부 실시형태에서, 알코올성 간 질환은 알코올 섭취로 인한 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함한다. 일부 실시형태에서, 간 질환은 비알코올성 간 질환이다. 일부 실시형태에서, 비알코올성 간 질환은 비알코올성 지방간 질환(NAFLD) 또는 비알코올성 지방간염(NASH)을 포함한다. 일부 실시형태에서, 비알코올성 간 질환은 알코올 섭취에 의해서 유발되지 않은 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함한다.
본 개시내용은 또한 대상체에게 HSD17B13의 저해제를 투여하는 단계를 추가로 포함하는 본 명세서에 기재된 방법 중 임의의 것을 제공한다. 일부 실시형태에서, HSD17B13의 저해제는 내인성 HSD17B13 게놈 DNA 또는 mRNA에 혼성화하고, 대상체 내의 세포에서 HSD17B13 폴리펩타이드의 발현을 감소시키는 기능성 폴리펩타이드, 안티센스 DNA, RNA, siRNA, 또는 shRNA를 포함한다. 일부 실시형태에서, HSD17B13 저해제는 또한 단쇄 데하이드로게나제/리덕타제(SDR) 패밀리 중 1종 이상의 추가 구성원을 저해할 수 있고, 이들 중에서 HSD17B13이 구성원이다. 이러한 다른 구성원은 HSD17B1, HSD17B2, HSD17B3, HSD17B4, HSD17B6, HSD17B7, HSD17B8, HSD17B10, HSD17B11, HSD17B12, HSD17B13, HSD17B14, HSD11B1, HSD11B2, HSD3B1, HSD3B2 및 HSD3B7, 뿐만 아니라 유사한 유사체 데하이드로게나제/리덕타제 3(DHRS3) 및 레티놀 데하이드로게나제10(RDH10)을 포함하지만 이들로 제한되지 않는다. 일부 실시형태에서, HSD17B13의 저해제는 대상체에서 간 질환을 저해하기 위해서 투여된다. 일부 실시형태에서, HSD17B13의 저해제는 대상체에서 간 질환을 치료하기 위해서 투여된다. 일부 실시형태에서, 간 질환은 만성 간 질환이다. 일부 실시형태에서, 만성 간 질환은 비알코올성 지방간 질환(NAFLD), 알코올성 간 질환(ALD), 비알코올성 지방간염(NASH), 간경변, 지방증 또는 간세포 암종 중 1종 이상이다. 일부 실시형태에서, 간 질환은 알코올성 간 질환이다. 일부 실시형태에서, 알코올성 간 질환은 알코올 섭취로 인한 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함한다. 일부 실시형태에서, 간 질환은 비알코올성 간 질환이다. 일부 실시형태에서, 비알코올성 간 질환은 비알코올성 지방간 질환(NAFLD) 또는 비알코올성 지방간염(NASH)을 포함한다. 일부 실시형태에서, 비알코올성 간 질환은 알코올 섭취에 의해서 유발되지 않은 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함한다. 일부 실시형태에서, 대상체는 I148M 변이를 암호화하는 유전자에 대해서 동형접합성이다. 일부 실시형태에서, 대상체는 I148M 변이를 암호화하는 유전자에 대해서 이형접합성이다. 일부 실시형태에서, 대상체는 추가로 기능성 HSD17B13 단백질을 암호화하는 유전자에 대해서 동형접합성이다. 일부 실시형태에서, 대상체는 추가로 기능성 HSD17B13 단백질을 암호화하는 유전자 및 HSD17B13의 기능 상실 변이체를 암호화하는 유전자에 대해서 이형접합성이다.
본 개시내용은 또한 간 질환을 치료 또는 저해하는 방법을 제공하며, 이 방법은 하이드록시스테로이드 17-베타 데하이드로게나제 13(HSD17B13)의 저해제를, I148M 변이를 포함하는 파타틴 유사 포스포리파제 도메인 함유 3(PNPLA3) 단백질을 발현하는 인간 간 질환 환자에게 투여하여 환자에서 간 질환을 치료 또는 저해하는 단계를 포함한다. 일부 실시형태에서, 간 질환은 만성 간 질환이다. 일부 실시형태에서, 간 질환은 비알코올성 지방간 질환(NAFLD), 알코올성 간 질환(ALD), 비알코올성 지방간염(NASH), 간경변, 지방증 또는 간세포 암종 중 1종 이상이다. 일부 실시형태에서, 간 질환은 알코올성 간 질환이다. 일부 실시형태에서, 알코올성 간 질환은 알코올 섭취로 인한 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함한다. 일부 실시형태에서, 간 질환은 비알코올성 간 질환이다. 일부 실시형태에서, 비알코올성 간 질환은 비알코올성 지방간 질환(NAFLD) 또는 비알코올성 지방간염(NASH)을 포함한다. 일부 실시형태에서, 비알코올성 간 질환은 알코올 섭취에 의해서 유발되지 않은 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함한다. 일부 실시형태에서, 환자는 비만이다. 일부 실시형태에서, 환자는 지방간을 갖는다. 일부 실시형태에서, 환자는 대상체로부터의 샘플에서 변이체 PNPLA3 단백질을 검출함으로써 변이체 PNPLA3 단백질(예를 들어, I148M 또는 I144M 변이를 포함하는 PNPLA3 단백질)을 발현하는 것으로 결정되었다. 일부 실시형태에서, 변이체 PNPLA3 단백질은 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 샘플 중의 변이체 PNPLA3 단백질은 서열번호 42에 따른 아미노산 서열을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질은 아미노산 서열분석에 의해서 또는 면역검정에 의해서 검출된다. 일부 실시형태에서, 대상체는 대상체로부터의 샘플에서 변이체 PNPLA3 단백질을 암호화하는 핵산 분자(예를 들어, I148M 또는 I144M 변이를 포함하는 PNPLA3 단백질을 암호화하는 변이체 PNPLA3 핵산 분자)를 검출함으로써 변이체 PNPLA3 단백질을 발현하는 것으로 결정되었다. 일부 실시형태에서, 변이체 PNPLA3 단백질은 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질은 서열번호 42에 따른 아미노산 서열을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질을 암호화하는 핵산 분자는 게놈 DNA, mRNA 또는 mRNA로부터 획득된 cDNA를 포함한다. 일부 실시형태에서, 핵산 분자는 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함하는 게놈 DNA를 포함한다. 일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, 핵산 분자는 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함하는 mRNA를 포함한다. 일부 실시형태에서, mRNA는 서열번호 34에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, 핵산 분자는 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함하는 mRNA를 포함한다. 일부 실시형태에서, mRNA는 서열번호 35에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, 핵산 분자는 mRNA로부터 획득된 cDNA를 포함하고, cDNA는 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, cDNA는 서열번호 38에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, 핵산 분자는 mRNA로부터 획득된 cDNA를 포함하고, cDNA는 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, cDNA는 서열번호 39에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, 핵산은 핵산의 적어도 일부를 서열분석함으로써 검출되고, 일부는 I148M 변이를 암호화한다. 일부 실시형태에서, 핵산은 핵산의 일부에 특이적으로 혼성화하는 프로브 또는 프라이머의 혼성화에 의해서 검출되며, 여기서 일부는 I148M 변이를 암호화하는 코돈을 포함한다. 일부 실시형태에서, 프로브 또는 프라이머는 대립유전자-특이적 프로브 또는 프라이머이다. 일부 실시형태에서, 프로브 또는 프라이머는 표지를 포함한다. 일부 실시형태에서, 환자는 변이체 PNPLA3 단백질을 암호화하는 유전자에 대해서 동형접합성이다. 일부 실시형태에서, 환자는 변이체 PNPLA3 단백질을 암호화하는 유전자에 대해서 이형접합성이다. 일부 실시형태에서, 환자는 기능성 HSD17B13 단백질을 암호화하는 유전자에 대해서 동형접합성이다. 일부 실시형태에서, 환자는 기능성 HSD17B13 단백질을 암호화하는 유전자에 대해서 이형접합성이다. 일부 실시형태에서, 환자는 기능성 HSD17B13 단백질을 암호화하는 유전자 및 HSD17B13의 기능 상실 변이체를 암호화하는 유전자에 대해서 이형접합성이다.
HSD17B13의 저해제는 I148M 변이를 포함하는 PNPLA3 단백질을 갖고, 기능성 HSD17B13 단백질을 갖는 인간 대상체에서 간 질환의 치료를 위해서 본 명세서에 기재된 바와 같이 사용될 수 있다. 일부 실시형태에서, 인간 대상체는 I148M 변이를 포함하는 PNPLA3 단백질 및 기능성 HSD17B13 단백질에 대해서 양성인 것으로 시험되었다. 일부 실시형태에서, 치료는 상기 인간 대상체가 I148M 변이를 포함하는 PNPLA3 단백질 및 기능성 HSD17B13 단백질을 갖는지의 여부를 결정하는 단계를 포함한다. 일부 실시형태에서, 인간 대상체는, 본 명세서에 정의된 바와 같은 방법 중 임의의 것을 사용하여 HSD17B13을 저해함으로써 간 질환을 치료 또는 저해하기 위한 후보자인 것으로 식별되었다. 일부 실시형태에서, 변이체 PNPLA3 단백질은 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질은 서열번호 42에 따른 아미노산 서열, 또는 서열번호 42와 적어도 90%의 서열 동일성을 갖고 I148M 변이를 포함하는 아미노산 서열을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질은 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질은 서열번호 43에 따른 아미노산 서열, 또는 서열번호 43과 적어도 90%의 서열 동일성을 갖고 I144M 변이를 포함하는 아미노산 서열을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질을 암호화하는 핵산 분자는 게놈 DNA이다. 일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 뉴클레오타이드 서열, 또는 서열번호 31과 적어도 90%의 서열 동일성을 갖고 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질을 암호화하는 핵산 분자는 mRNA이다. 일부 실시형태에서, mRNA는 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함한다. 일부 실시형태에서, mRNA는 서열번호 34에 따른 뉴클레오타이드 서열, 또는 서열번호 34와 적어도 90%의 서열 동일성을 갖고 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, mRNA는 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함한다. 일부 실시형태에서, mRNA는 서열번호 35에 따른 뉴클레오타이드 서열, 또는 서열번호 35과 적어도 90%의 서열 동일성을 갖고 I144M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질을 암호화하는 핵산 분자는 cDNA이다. 일부 실시형태에서, cDNA는 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, cDNA는 서열번호 38에 따른 뉴클레오타이드 서열, 또는 서열번호 38과 적어도 90%의 서열 동일성을 갖고 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, cDNA는 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, cDNA는 서열번호 39에 따른 뉴클레오타이드 서열, 또는 서열번호 39와 적어도 90%의 서열 동일성을 갖고 I144M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, 간 질환은 만성 간 질환이다. 일부 실시형태에서, 만성 간 질환은 비알코올성 지방간 질환(NAFLD), 알코올성 간 질환(ALD), 비알코올성 지방간염(NASH), 간경변, 지방증 또는 간세포 암종이다. 일부 실시형태에서, 간 질환은 알코올성 간 질환이다. 일부 실시형태에서, 알코올성 간 질환은 알코올 섭취로 인한 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함한다. 일부 실시형태에서, 간 질환은 비알코올성 간 질환이다. 일부 실시형태에서, 비알코올성 간 질환은 비알코올성 지방간 질환(NAFLD) 또는 비알코올성 지방간염(NASH)을 포함한다. 일부 실시형태에서, 비알코올성 간 질환은 알코올 섭취에 의해서 유발되지 않은 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함한다. 일부 실시형태에서, 인간 대상체는 기능성 HSD17B13에 대해서 동형접합성 또는 이형접합성이다.
일부 실시형태에서, HSD17B13의 저해제는 HSD17B13 유전자 발현 또는 HSD17B13 단백질의 기능을 감소 또는 저해한다. HSD17B13의 저해제는 자연 발생 리간드 및 합성 리간드, 길항제, 효능제, 항체, 펩타이드, 환식 펩타이드, 핵산, 기능성 폴리뉴클레오타이드, 작은 유기 분자 등을 포함하지만 이들로 제한되지 않는다. 기능성 폴리뉴클레오타이드는 특정 기능을 갖는, 예컨대, 표적 분자에 결합하거나 또는 특정 반응을 촉매작용하는 핵산 분자이다. 기능성 폴리뉴클레오타이드의 예는 안티센스 분자, 압타머, 리보자임 및 트라이플렉스 형성 분자를 포함하지만 이들로 제한되지 않는다. 기능성 폴리뉴클레오타이드는 표적 분자에 의해서 보유된 특이적 활성의 저해제로서 작용할 수 있다. 안티센스 분자는 정규 또는 비정규 염기 짝지움을 통해서 표적 핵산 분자와 상호작용하도록 설계된다. 안티센스 분자 및 표적 분자의 상호작용은 예를 들어, RNase-H-매개된 RNA-DNA 혼성 분해를 통해서 표적 분자의 파괴를 촉진시키도록 설계된다. 대체적으로, 안티센스 분자는 표적 분자 상에서 정상적으로 발생할 가공 기능, 예컨대, 전사 또는 복제를 방해하도록 설계된다. 안티센스 분자는 표적 분자의 서열을 기초로 설계될 수 있다. 표적 분자의 가장 접근 가능한 영역을 식별함으로써 안티센스 효율의 최적화를 위한 다양한 방법이 존재한다. 예시적인 방법은 시험관내 선택 실험, 및 DMS 및 DEPC를 사용한 DNA 변형 연구를 포함하지만 이들로 제한되지 않는다. 안티센스 분자는 일반적으로 약 10-6 이하, 약 10-8 이하, 약 10-10 이하 또는 약 10-12 이하의 해리 상수(kd)로 표적 분자에 결합한다. 안티센스 분자의 설계 및 사용을 보조하는 방법 및 기술의 대표적인 샘플, 및 안티센스 분자는 하기 비제한적인 미국 특허 목록에서 찾아볼 수 있다: 5,135,917; 5,294,533; 5,627,158; 5,641,754; 5,691,317; 5,780,607; 5,786,138; 5,849,903; 5,856,103; 5,919,772; 5,955,590; 5,990,088; 5,994,320; 5,998,602; 6,005,095; 6,007,995; 6,013,522; 6,017,898; 6,018,042; 6,025,198; 6,033,910; 6,040,296; 6,046,004; 6,046,319; 6,057,437; 및 미국 시리얼 번호 제62/645,941호(출원일 2018년 3월 21일)(이들 각각은 이들의 전문이 참조에 의해 본 명세서에 포함됨). 안티센스 분자의 예는 안티센스 RNA, 짧은 간섭 RNA(siRNA) 및 짧은 헤어핀 RNA(shRNA)를 포함하지만 이들로 제한되지 않는다. 예를 들어, 안티센스 RNA, siRNA 또는 shRNA는 HSD17B13 게놈 DNA 또는 mRNA의 고유한 영역을 표적화하도록 설계될 수 있다. 일부 실시형태에서, HSD17B13의 저해제는 안티센스 분자이다. 일부 실시형태에서, HSD17B13의 저해제는 shRNA 분자이다. 일부 실시형태에서, HSD17B13의 저해제는 siRNA 분자이다.
본 명세서에 기재된 방법 중 임의의 것에서, HSD17B13의 저해제의 투여는 간 질환의 특정 특징의 감소 또는 제거를 초래할 수 있다. 일부 실시형태에서, 간 질환의 특징은 염증 및 섬유증을 포함하지만 이들로 제한되지 않는다.
본 개시내용은 또한 PNPLA3 Ile148Met 양성(즉, "PNPLA3 Ile148Met+") 또는 PNPLA3 Ile144Met 양성(즉, "PNPLA3 Ile144Met+")인 대상체를 치료하는 방법을 제공하며, 이 방법은 HSD17B13의 저해제를 대상체에게 투여하는 단계를 포함한다. 본 개시내용은 또한 간 질환을 치료 또는 저해하는 방법을 제공하며, 이 방법은 HSD17B13의 저해제를, I148M 변이를 포함하는 PNPLA3 단백질을 발현하는 인간 간 질환 환자에게 투여하여 환자에서 간 질환을 치료 또는 저해하는 단계를 포함한다.
변이체 PNPLA3 Ile148Met 양성 또는 PNPLA3 Ile144Met 양성 대상체는 본 명세서에 기재된 변이체 PNPLA3 단백질 중 임의의 것을 가질 수 있다. 일부 실시형태에서, 대상체는 또한 기능성 HSD17B13에 대해서 동형접합성이거나 이형접합성이다. 일부 실시형태에서, 대상체는 기능성 HSD17B13에 대해서 동형접합성이다. 일부 실시형태에서, 대상체는 기능성 HSD17B13에 대해서 이형접합성이다. 일부 실시형태에서, 대상체는 HSD17B13 기능 상실 변이체에 대해서 동형접합성이다. 대상체는 본 명세서에 기재된 기능성 HSD17B13 단백질 중 임의의 것을 가질 수 있다.
일부 실시형태에서, PNPLA3 Ile148Met+ 또는 PNPLA3 Ile144Met+인 대상체는 대상체로부터의 샘플에서 PNPLA3 단백질을 검출함으로써 PNPLA3 Ile148Met+ 또는 PNPLA3 Ile144Met+인 것으로 결정되었고, 여기서 변이체 PNPLA3 단백질은 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하거나, 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 변이체 PNPLA3 Ile148Met 양성 또는 PNPLA3 Ile144Met 양성 대상체는 본 명세서에 기재된 변이체 PNPLA3 단백질 중 임의의 것을 가질 수 있다.
일부 실시형태에서, PNPLA3 Ile148Met+인 대상체는 대상체로부터의 샘플에서 PNPLA3 단백질을 검출함으로써 PNPLA3 Ile148Met+인 것으로 결정되었고, 여기서 변이체 PNPLA3 단백질은 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 샘플 중의 변이체 PNPLA3 단백질은 서열번호 42에 따른 아미노산 서열을 포함한다.
일부 실시형태에서, PNPLA3 Ile144Met+인 대상체는 대상체로부터의 샘플에서 PNPLA3 단백질을 검출함으로써 PNPLA3 Ile144Met+인 것으로 결정되었고, 여기서 변이체 PNPLA3 단백질은 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 샘플 중의 변이체 PNPLA3 단백질은 서열번호 43에 따른 아미노산 서열을 포함한다.
일부 실시형태에서, 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하거나, 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함하는 변이체 PNPLA3 단백질은 본 명세서에 기재된 바와 같은 아미노산 서열분석 또는 면역검정에 의해서 식별된다.
일부 실시형태에서, PNPLA3 Ile148Met+ 또는 PNPLA3 Ile144Met+인 대상체는 대상체로부터의 샘플에서 PNPLA3 단백질을 암호화하는 핵산을 검출함으로써 PNPLA3 Ile148Met+ 또는 PNPLA3 Ile144Met+인 것으로 결정되었고, 여기서 변이체 PNPLA3 단백질은 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하거나, 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 변이체 PNPLA3 Ile148Met 양성 또는 PNPLA3 Ile144Met 양성 대상체는 본 명세서에 기재된 변이체 PNPLA3 핵산 분자 중 임의의 것을 가질 수 있다.
일부 실시형태에서, PNPLA3 Ile148Met+인 대상체는 대상체로부터의 샘플에서 PNPLA3 단백질을 암호화하는 핵산 분자를 검출함으로써 PNPLA3 Ile148Met+인 것으로 결정되었고, 여기서 변이체 PNPLA3 단백질은 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 샘플 중의 변이체 PNPLA3 단백질은 서열번호 42에 따른 아미노산 서열을 포함한다.
일부 실시형태에서, PNPLA3 Ile144Met+인 대상체는 대상체로부터의 샘플에서 PNPLA3 단백질을 암호화하는 핵산 분자를 검출함으로써 PNPLA3 Ile144Met+인 것으로 결정되었고, 여기서 변이체 PNPLA3 단백질은 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 샘플 중의 변이체 PNPLA3 단백질은 서열번호 43에 따른 아미노산 서열을 포함한다.
일부 실시형태에서, 변이체 PNPLA3 단백질을 암호화하는 핵산 분자는 게놈 DNA, mRNA 또는 mRNA로부터 유래된 cDNA이다.
일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, ATG 코돈을 포함하는 변이체 PNPLA3 단백질을 암호화하는 게놈 DNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 식별된다.
일부 실시형태에서, mRNA는 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함한다. 일부 실시형태에서, mRNA는 서열번호 34에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, mRNA는 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함한다. 일부 실시형태에서, mRNA는 서열번호 35에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, AUG 코돈을 포함하는 변이체 PNPLA3 단백질을 암호화하는 mRNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 식별된다.
일부 실시형태에서, cDNA는 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, cDNA는 서열번호 38에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, cDNA는 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, cDNA는 서열번호 39에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, ATG 코돈을 포함하는 변이체 PNPLA3 단백질을 암호화하는 cDNA는 본 명세서에 기재된 바와 같이, 핵산 서열분석에 의해서 또는 프로브의 혼성화에 의해서 식별된다.
HSD17B13의 저해제의 투여는, 예를 들어, 비경구, 정맥내, 경구, 피하, 동맥내, 두개내, 척수강내, 복강내, 국소, 비강내, 또는 근육내를 포함하지만 이들로 제한되지 않는 임의의 적합한 경로에 의해서 일어날 수 있다. 약제학적 조성물은 바람직하게 무균성이고, 실질적으로 등장성이고, GMP 조건 하에 제조된다. 약제학적 조성물은 단위 투여 형태(즉, 단일 투여를 위한 투여량)로 제공될 수 있다. 약제학적 조성물은 1종 이상의 생리학적으로 그리고 약제학적으로 허용 가능한 담체, 희석제, 부형제 또는 보조제를 사용하여 제형화될 수 있다. 제형은 선택된 투여 경로에 좌우된다. 용어 "약제학적으로 허용 가능한"은 담체, 희석제, 부형제 또는 보조제가 제형의 다른 성분과 상용성이고, 이의 수용자에게 실질적으로 유해하지 않다는 것을 의미한다.
일부 실시형태에서, 대상체는 간 질환을 갖거나 간 질환의 발달에 민감성이다. 일부 실시형태에서, 간 질환은 만성 간 질환이다. 일부 실시형태에서, 만성 간 질환은 비알코올성 지방간 질환(NAFLD), 알코올성 간 질환(ALD), 비알코올성 지방간염(NASH), 간경변, 지방증 또는 간세포 암종이다. 일부 실시형태에서, 간 질환은 알코올성 간 질환이다. 일부 실시형태에서, 알코올성 간 질환은 알코올 섭취로 인한 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함한다. 일부 실시형태에서, 간 질환은 비알코올성 간 질환이다. 일부 실시형태에서, 비알코올성 간 질환은 비알코올성 지방간 질환(NAFLD) 또는 비알코올성 지방간염(NASH)을 포함한다. 일부 실시형태에서, 비알코올성 간 질환은 알코올 섭취에 의해서 유발되지 않은 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함한다.
본 개시내용은 또한 간 질환 치료제로 환자를 치료하는 방법을 제공하며, 여기서 환자는 간 질환을 앓고 있다. 방법은 대상체로부터의 샘플이 i) I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 제1 핵산, 및 기능성 HSD17B13 단백질을 암호화하는 제2 핵산, 및/또는 ii) I148M 변이를 포함하는 PNPLA3 단백질 및 기능성 HSD17B13 단백질을 포함하는지의 여부를 결정하는 단계를 포함한다. 일부 실시형태에서, 방법은 대상체로부터의 샘플이 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 제1 핵산, 및 기능성 HSD17B13 단백질을 암호화하는 제2 핵산을 포함하는지의 여부를 결정하는 단계를 포함한다. 일부 실시형태에서, 방법은 대상체로부터의 샘플이 I148M 변이를 포함하는 PNPLA3 단백질, 및 기능성 HSD17B13 단백질을 포함하는지의 여부를 결정하는 단계를 포함한다.
일부 실시형태에서, 이러한 결정은 환자로부터 생물학적 샘플을 획득하거나 획득함으로써 수행된다. 일부 실시형태에서, 방법은 생물학적 샘플에 대한 유전자형분석 검정을 수행하거나 수행하였어서 환자가 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 제1 핵산 및 기능성 HSD17B13 단백질을 암호화하는 제2 핵산을 갖는지를 결정하는 단계를 추가로 포함한다. 일부 실시형태에서, 방법은 생물학적 샘플에 대한 검정을 수행하거나 수행하였어서 환자가 I148M 변이를 포함하는 PNPLA3 단백질 및 기능성 HSD17B13 단백질을 갖는지를 결정하는 단계를 추가로 포함한다.
일부 실시형태에서, 환자가 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 핵산을 갖고/갖거나 I148M 변이를 포함하는 PNPLA3 단백질을 갖고, 기능성 HSD17B13 단백질을 암호화하는 핵산을 갖고/갖거나 기능성 HSD17B13 단백질을 갖는 경우, 방법은 환자에게 HSD17B13의 저해제를 투여하는 단계를 추가로 포함한다. 일부 실시형태에서, 환자가 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 핵산을 갖고/갖거나 I148M 변이를 포함하는 PNPLA3 단백질을 갖고, 기능성 HSD17B13 단백질을 암호화하는 핵산을 갖고/갖거나 기능성 HSD17B13 단백질을 갖는 경우, 방법은 환자에게 HSD17B13의 저해제를 투여하는 단계 및 환자에게 간 질환 치료제를 투여하는 단계를 추가로 포함한다. 일부 실시형태에서, 환자가 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 핵산을 갖고/갖거나 I148M 변이를 포함하는 PNPLA3 단백질을 갖지만, 기능성 HSD17B13 단백질을 암호화하는 핵산을 갖지 않고/않거나 기능성 HSD17B13 단백질을 갖는 경우, 방법은 환자에게 간 질환 치료제를 투여하는 단계를 추가로 포함한다.
간 질환 치료제의 예는 다이설피람, 날트렉손, 아캄프로세이트, 프레드니손, 아자티오프린, 페니실라민, 트라이엔틴, 데페록사민, 시프로플록사신, 노로플록사신, 세프트리악손, 오플록사신, 아목시실린-클라불라네이트, 파이토나다이온, 부메타나이드, 푸로세마이드, 하이드로클로로티아자이드, 클로로 티아자이드, 아밀로라이드, 트라이암테렌, 스피로놀락톤, 옥트레오타이드, 아테놀롤, 메토프롤롤, 나돌롤, 프로프라놀롤, 티몰롤 및 카르베딜롤을 포함하지만 이들로 제한되지 않는다.
(예를 들어, 만성 C형 간염의 치료에 사용하기 위한) 간 질환 치료제의 추가 예는 리바비린, 파리타프레비어, 시메프레비어(Olysio), 그라조프레비어, 레디파스비어, 옴비타스비어, 엘바스비어, 다클라타스비어(Daklinza), 다사부비어, 리토나비어, 소포스부비어, 벨파타스비어, 복실라프레비어, 글레카프레비어, 피브렌타스비어, 페그인터페론 알파-2a, 페그인터페론 알파-2b 및 인터페론 알파-2b를 포함하지만 이들로 제한되지 않는다.
(예를 들어, 비알코올성 지방간 질환에 사용하기 위한) 간 질환 치료제의 추가 예는 체중 감소 유도제, 예컨대, 오를리스타트 또는 시부트라민; 인슐린 반응 개선제(insulin sensitizing agent), 예컨대, 티아졸리딘다이온(TZD), 메트포민 및 메글리티나이드; 지질 저하제, 예컨대, 스타틴, 피브레이트 및 오메가-3 지방산; 항산화제, 예컨대, 비타민 E, 베타인, N-아세틸-시스테인, 레시틴, 실리마린 및 베타-카로텐; 항 TNF 작용제, 예컨대, 펜톡시필린; 프로바이오틱스, 예컨대, VSL#3; 및 세포보호제(cytoprotective agent), 예컨대, 우르소데옥시콜산(UDCA)을 포함하지만 이들로 제한되지 않는다. 다른 적합한 치료제는 ACE 저해제/ARB, 올리고프룩토스 및 인크레틴 유사체를 포함한다.
(예를 들어, NASH에 사용하기 위한) 간 질환 치료제의 예는 오베티콜산(Ocaliva(등록상표)), 셀론세르팁, 엘라피브라노어, 세니크리비로크, GR_MD_02, MGL_3196, IMM124E, 아라키딜 아미도 콜란산(Aramchol(상표명)), GS0976, 엠리카산, 볼릭시바트, NGM282, GS9674, 트로피펙서, MN_001, LMB763, BI_1467335, MSDC_0602, PF_05221304, DF102, 사로글리타자, BMS986036, 라니피브라노어(Lanifibranor), 세마글루타이드, 니타족사나이드, GRI_0621, EYP001, VK2809, 날메펜, LIK066, MT_3995, 엘로빅시바트, 나모데노손, 포랄루맙, SAR425899, 소타글리플로진, EDP_305, 아이소사부테이트, 젬카벤, TERN_101, KBP_042, PF_06865571, DUR928, PF_06835919, NGM313, BMS_986171, 나마시주맙, CER_209, ND_L02_s0201, RTU_1096, DRX_065, IONIS_DGAT2Rx, INT_767, NC_001, 셀라데파, PXL770, TERN_201, NV556, AZD2693, SP_1373, VK0214, 헤파스템, TGFTX4, RLBN1127, GKT_137831, RYI_018, CB4209-CB4211 및 JH_0920을 포함하지만 이들로 제한되지 않는다.
본 개시내용은 또한 PNPLA3 Ile148Met 양성 또는 PNPLA3 Ile144Met 양성이고, 또한 기능성 HSD17B13에 대해서 동형접합성이거나 이형접합성인 인간 대상체에서 간 질환을 치료하기 위한 의약의 제조에 사용하기 위한 HSD17B13의 저해제를 제공한다. 일부 실시형태에서, 대상체는 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체에 대해서 동형접합성이다. 일부 실시형태에서, 대상체는 PNPLA3 Ile148Met 변이체 또는 PNPLA3 Ile144Met 변이체에 대해서 이형접합성이다. 일부 실시형태에서, 대상체는 기능성 HSD17B13에 대해서 동형접합성이다. 일부 실시형태에서, 대상체는 기능성 HSD17B13에 대해서 이형접합성이다.
일부 실시형태에서, HSD17B13의 저해제는 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하는 PNPLA3 단백질, 또는 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하거나 또는 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함하는 PNPLA3 단백질을 암호화하는 핵산 분자, 또는 서열번호 43에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하는 PNPLA3 단백질을 암호화하는 핵산 분자를 갖는 인간 대상체에서 간 질환을 치료하는 데 사용된다. 일부 실시형태에서, 변이체 PNPLA3 단백질은 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질은 서열번호 42에 따른 아미노산 서열을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질은 서열번호 43에 따른 144번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질은 서열번호 43에 따른 아미노산 서열을 포함한다.
일부 실시형태에서, 변이체 PNPLA3 단백질을 암호화하는 핵산 분자는 게놈 DNA이다. 일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 뉴클레오타이드 서열을 포함한다.
일부 실시형태에서, 변이체 PNPLA3 단백질을 암호화하는 핵산 분자는 mRNA이다. 일부 실시형태에서, mRNA는 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함한다. 일부 실시형태에서, mRNA는 서열번호 34에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, mRNA는 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함한다. 일부 실시형태에서, mRNA는 서열번호 35에 따른 뉴클레오타이드 서열을 포함한다.
일부 실시형태에서, 변이체 PNPLA3 단백질을 암호화하는 핵산 분자는 cDNA이다. 일부 실시형태에서, cDNA는 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, cDNA는 서열번호 38에 따른 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, cDNA는 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, cDNA는 서열번호 39에 따른 뉴클레오타이드 서열을 포함한다.
일부 실시형태에서, 간 질환은 만성 간 질환이다. 일부 실시형태에서, 만성 간 질환은 비알코올성 지방간 질환(NAFLD), 알코올성 간 질환(ALD), 비알코올성 지방간염(NASH), 간경변, 지방증 또는 간세포 암종이다. 일부 실시형태에서, 간 질환은 알코올성 간 질환이다. 일부 실시형태에서, 알코올성 간 질환은 알코올 섭취로 인한 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함한다. 일부 실시형태에서, 간 질환은 비알코올성 간 질환이다. 일부 실시형태에서, 비알코올성 간 질환은 비알코올성 지방간 질환(NAFLD) 또는 비알코올성 지방간염(NASH)을 포함한다. 일부 실시형태에서, 비알코올성 간 질환은 알코올 섭취에 의해서 유발되지 않은 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함한다.
일부 실시형태에서, 인간 대상체는 기능성 HSD17B13에 대해서 동형접합성 또는 이형접합성이다. 일부 실시형태에서, 대상체는 기능성 HSD17B13에 대해서 동형접합성이다. 일부 실시형태에서, 대상체는 기능성 HSD17B13에 대해서 이형접합성이다.
본 명세서에 기재된 방법 중 임의의 것에서, 프로브 또는 프라이머 또는 변경-특이적 프로브 또는 변경-특이적 프라이머는 단일 핵산 종에 특이적으로 상보성이거나 또는 단일 핵산 종과 특이적으로 혼성화할 수 있다. 예를 들어, HSD17B13 전사물 A, 전사물 B, 전사물 E 또는 전사물 I에 대한 핵산(예를 들어, 본 명세서에 기재된 기능성 HSD17B13에 대한 mRNA, cDNA, RNA 전사물 또는 cDNA 전사물 중 임의의 것)에 특이적으로 상보성이거나 이것에 특이적으로 혼성화하는 프로브 또는 프라이머 또는 변경-특이적 프로브 또는 변경-특이적 프라이머는 변이체 HSD17B13에 대한 핵산 분자 중 임의의 것(예를 들어, HSD17B13의 변이체 C, D, F, G, H에 대한 mRNA, cDNA, RNA 전사물 또는 cDNA 전사물 중 임의의 것)에 상보성이 아니거나 이에 혼성화한다.
본 개시내용은 또한 I148M 변이를 포함하는 PNPLA3 단백질을 갖고, 그리고 기능성 HSD17B13 단백질을 갖는 인간 대상체에서 간 질환을 치료하는데 사용하기 위한 HSD17B13의 저해제를 제공한다. 일부 실시형태에서, 인간 대상체는 I148M 변이를 포함하는 PNPLA3 단백질 및 기능성 HSD17B13 단백질에 대해서 양성인 것으로 시험되었다. 일부 실시형태에서, 치료는 상기 인간 대상체가 I148M 변이를 포함하는 PNPLA3 단백질 및 기능성 HSD17B13 단백질을 갖는지의 여부를 결정하는 단계를 포함한다. 일부 실시형태에서, 인간 대상체는, 본 명세서에 정의된 바와 같은 방법 중 임의의 것을 사용하여 HSD17B13을 저해함으로써 간 질환을 치료 또는 저해하기 위한 후보자인 것으로 식별되었다.
일부 실시형태에서, 변이체 PNPLA3 단백질은 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질은 서열번호 42에 따른 아미노산 서열, 또는 서열번호 42와 적어도 90%의 서열 동일성을 갖고 I148M 변이를 포함하는 아미노산 서열을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질을 암호화하는 핵산 분자는 게놈 DNA이다. 일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, 게놈 DNA는 서열번호 31에 따른 뉴클레오타이드 서열, 또는 서열번호 31과 적어도 90%의 서열 동일성을 갖고 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질을 암호화하는 핵산 분자는 mRNA이다. 일부 실시형태에서, mRNA는 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함한다. 일부 실시형태에서, mRNA는 서열번호 34에 따른 뉴클레오타이드 서열, 또는 서열번호 34와 적어도 90%의 서열 동일성을 갖고 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, mRNA는 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함한다. 일부 실시형태에서, mRNA는 서열번호 35에 따른 뉴클레오타이드 서열, 또는 서열번호 35과 적어도 90%의 서열 동일성을 갖고 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, 변이체 PNPLA3 단백질을 암호화하는 핵산 분자는 cDNA이다. 일부 실시형태에서, cDNA는 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, cDNA는 서열번호 38에 따른 뉴클레오타이드 서열, 또는 서열번호 38과 적어도 90%의 서열 동일성을 갖고 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, cDNA는 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함한다. 일부 실시형태에서, cDNA는 서열번호 39에 따른 뉴클레오타이드 서열, 또는 서열번호 39와 적어도 90%의 서열 동일성을 갖고 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함한다.
일부 실시형태에서, 간 질환은 만성 간 질환이다. 일부 실시형태에서, 만성 간 질환은 비알코올성 지방간 질환(NAFLD), 알코올성 간 질환(ALD), 비알코올성 지방간염(NASH), 간경변, 지방증 또는 간세포 암종이다. 일부 실시형태에서, 간 질환은 알코올성 간 질환이다. 일부 실시형태에서, 알코올성 간 질환은 알코올 섭취로 인한 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함한다. 일부 실시형태에서, 간 질환은 비알코올성 간 질환이다. 일부 실시형태에서, 비알코올성 간 질환은 비알코올성 지방간 질환(NAFLD) 또는 비알코올성 지방간염(NASH)을 포함한다. 일부 실시형태에서, 비알코올성 간 질환은 알코올 섭취에 의해서 유발되지 않은 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함한다.
일부 실시형태에서, 인간 대상체는 기능성 HSD17B13에 대해서 동형접합성 또는 이형접합성이다.
상기 또는 하기에서 인용된 모든 특허 출원, 웹사이트, 기타 간행물, 등록 번호 등은, 각각의 개별적인 항목이 구체적으로 및 개별적으로 참고로 포함된 것으로 제시된 것과 동일한 정도로 모든 목적을 위해서 전문이 참조에 의해 포함된다. 상이한 버전의 서열이 상이한 시점에서의 등록 번호와 연관되는 경우, 본 출원의 유효한 출원일의 등록 번호와 연관된 버전이 의미가 있다. 유효한 출원일은 실제 출원일 이전이거나 해당되는 경우 등록 번호를 언급한 우선권 출원의 출원일을 의미한다. 마찬가지로, 상이한 버전의 간행물, 웹사이트 등이 상이한 시점에 공개되면, 달리 제시되지 않는 한 본 출원의 유효한 출원일에 가장 가깝게 공개된 버전을 의미한다. 본 개시내용의 임의의 특징, 단계, 요소, 실시형태 또는 양상은 구체적으로 달리 제시되지 않는 한 임의의 다른 것과 조합하여 사용될 수 있다. 본 발명이 명료성 및 이해를 목적으로 어느 정도 상세하게 설명 및 예에 의해서 기재되었지만, 특정 변화 및 변형이 첨부된 청구범위의 범주 내에서 실시될 수 있는 것이 명백할 것이다.
본 명세서에서 언급된 뉴클레오타이드 및 아미노산 서열은 뉴클레오타이드 염기에 대한 표준 문자 약어 및 아미노산에 대한 1-문자 암호를 사용하여 제시된다. 뉴클레오타이드 서열은 서열의 5' 단부에서 시작하여 3' 단부를 향해 진행하는(즉, 각 라인에서 좌측에서 우측으로) 표준 관례를 따른다. 각각의 뉴클레오타이드 서열의 단지 하나의 가닥이 제시되지만, 상보성 가닥은 표시된 가닥의 임의의 언급에 의해서 포함되는 것으로 이해된다. 아미노산 서열은 서열의 아미노 말단에서 시작하여 카복시 말단을 향해 진행하는(즉, 각각의 라인에서 좌측에서 우측으로) 표준 관례를 따른다.
하기 실시예는 실시형태를 보다 상세하게 기재하기 위해서 제공된다. 이것은 청구된 실시형태를 제한하는 것이 아니라, 설명하도록 의도된다.
실시예
하기 실시예는, 본 명세서에 청구된 화합물, 조성물, 물품, 디바이스 및/또는 방법이 제조 및 평가되는 방법의 완전한 개시 및 설명을 당업자에게 제공하도록 제시되며, 순수하게 예시적인 것으로 의도되며, 본 발명자들이 발명 주제로서 간주하는 것의 범주를 제한하도록 의도되지 않는다. 수치(예를 들어, 양, 온도 등)와 관련하여 정확성을 보장하기 위해서 노력하였지만, 일부 오류 및 편차가 고려되어야 한다. 달리 제시되지 않는 한, 부는 중량부이고, 온도는 ℃ 단위 또는 주변 온도이고, 압력은 대기압 또는 그 근처이다.
실시예 1: PNPLA3 rs738409(p.I148M)와 HSD17B13 rs72613567 간의 유전적 상호작용 - 연구 설계
본 연구에서, 엑솜 서열분석을 사용하여 혈청 알라닌 아미노트랜스퍼라제(ALT) 및 아스파테이트 아미노트랜스퍼라제(AST) 수준과 연관된 변이체를 식별하였는데, 이것은 DiscovEHR 인간 유전학 연구, 엑솜 서열 데이터를 전자 건강 기록(electronic health record: EHR)과 연결하는 코호트 그리고 3개의 추가 연구에서 간세포 손상의 마커이다. DiscovEHR 및 2개의 독립적인 코호트에서 연관된 유전자 변이체와 만성 간 질환의 임상적 진단 간의 연관성을 또한 연구하였다. 간 생검을 진행한 비만 수술 환자의 독립적인 코호트에서 이들 변이체 중 하나와 간 질환의 조직병리학적 중증도를 또한 연구하였다.
연구 설계 및 참여자
게놈 DNA 샘플 및 6개의 코호트로부터의 데이터를 사용하여 인간 유전학 연구를 수행하였다. 이들 연구는 GHS20의 MyCode(등록상표) 지역 건강 계획(Community Health Initiative)으로부터의 첫 번째 50,726명의 동의한 성인 참여자로부터 기원한 2개의 리제네런 유전학 센터(Regeneron Genetics Center) 및 가이싱거 헬쓰 시스템(Geisinger Health System: GHS) DiscovEHR 연구 집단을 포함하였다. GHS 발견 코호트는 비만 수술 코호트에 모집된 모든 사람을 제외하고, 2007년 내지 2016년 사이에 외래환자 1차 의료 및 전문 의료로부터 모집된 46,544명의 유럽인 개체로 이루어졌다. GHS 비만 수술 코호트는 비만 수술에 대해서 조회된 2,644명의 유럽인 개체로 이루어졌다. 간 트랜스아미나제와의 연관성의 반복 연구를 댈러스 심장 연구(Dallas Heart Study) 및 펜 메디슨 바이오뱅크(Penn Medicine Biobank)에서 수행하였는데, 이것은 각각 1,357명 및 8,527명의 유럽 혈통 개체를 포함하였다. 만성 간 질환과의 연관성의 반복 연구는 댈러스 간 연구(Dallas Liver Study: DLS)로부터의 517명의 개체 및 댈러스 소아 간 연구(Dallas Pediatric Liver Study: DPLS)로부터의 439명의 개체를 포함하였다. 전체 연구 설명 및 임상 표현형 및 질환 정의는 보충 부록의 방법 섹션에 기재되어 있다.
댈러스 간 연구 및 소아 간 연구로부터의 유전자형분석된 다민족 사례 및 대조군의 기준선 특징을 도 5에 나타낸다.
샘플 제조, 서열분석 및 유전자형분석
DiscovEHR 연구, 댈러스 심장 연구 및 펜 매디슨 바이오뱅크에서의 참여자에 대한 DNA 샘플 제조 및 전체 엑솜 서열분석을 이미 기재된 바와 같이 리제네런 유전학에서 수행하였다(Dewey et al., Science, 2016, In Press). HSD17B13 rs72613567을 댈러스 간 연구 및 델러스 소아 간 연구에서 태크맨(Taqman) 검정에 의해서 유전자형분석하였다(그리고 각각의 유전자형 중 5명의 개체에서 생어 서열분석에 의해서 검증하였다).
발견 코호트에서의 임상 측정치 및 만성 간 질환 정의
알라닌 아미노트랜스퍼라제(ALT) 및 아스파테이트 아미노트랜스퍼라제(AST)에 대한 임상 실험 측정치를 GHS 발견 코호트 및 비만 수술 코호트로부터의 참여자의 EHR로부터 얻었다. 중위 ALT 및 AST 값을 2회 이상의 측정치를 사용하여 모든 참여자에 대해서 계산하였고, 연관성 분석 이전에 log10-변환하여 분포를 정규화하였다.
국제 질환 분류, 제9차 개정(International Classification of Diseases, Ninth Revision)(ICD-9) 질환 진단 코드를 EHR로부터 얻었고, 비바이러스성 비알코올성(ICD-9 571.40, 571.41, 571.49, 571.5, 571.8, 571.9) 또는 알코올성(ICD-9 571.0, 571.1, 571.2, 571.3) 간 질환 사례 정의에 대한 임상 질환 카테고리로 나누었다. 단일 진단 코드에 기초한 추가 사례 정의는 알코올성 간경변(ICD-9 571.2), 비알코올성 간경변(ICD-9 571.5) 및 HCC(ICD-9 155.0)를 포함하였다. 이러한 사례 정의의 경우, 간 질환이 없는 일반적인 대조군("간 질환 없음")을 임의의 유형의 간 질환을 나타내는 사례 기준 또는 단일-충돌 또는 문제-목록 진단 코드가 없는 참여자로서 정의하였다.
HSD17B13 주변 영역에서 GHS 발견 코호트에서의 알라닌 아미노트랜스퍼라제(ALT; A) 및 아스파테이트 아미노트랜스퍼라제(AST; B)에 대한 영역 연관성 플롯을 도 6(패널 A 및 패널 B)에 나타낸다. 자색 다이아몬드는 스플라이스 변이체 rs72613567을 나타낸다. 각각의 원은 단일 뉴클레오타이드 변이체를 나타내는데, 원의 색상은 그 변이체와 rs72613567 간의 연관 비평형(linkage disequilibrium)(DiscovEHR 코호트에서 계산된 r2)을 나타낸다. 청색 선은 HapMap에서 예측된 재조합율을 나타낸다. 패널의 하단 부분은 유전자좌 내의 각각의 유전자의 상대적인 위치 및 전사 가닥을 나타낸다. 이웃하는 유전자 HSD17B11(ALT 및 AST에 대해서 각각 가장 유의한 P-값 1.4×10-1 및 4.3×10-2)에서 AST 또는 ALT와 암호 또는 스플라이스 영역 변이체 간에는 유의한 연관성이 존재하지 않았다.
비만 수술 코호트에서의 간 조직병리학적 표현형 정의
GHS 비만 수술 코호트는 2,644명의 유럽 혈통(European descent) 개체로 이루어졌으며, 이들 개체 중 2,391명으로부터 수술 중 간 생검 시편을 입수하였다. 간 생검 시편을 이미 기재된 바와 같이, 폼알린-고정시키고, 조직학을 위해서 헤마톡실린 및 에오신으로 염색하고, 섬유증의 평가를 위해서 매슨 트라이크롬 염색제(Masson's trichrome stain)로 염색하였다(Gerhard et al., Patient Saf. Surg., 2011, 5, 1). 이미 확립된 기준을 사용하여 간병리학자에 의해서 조직학 진단을 결정하였다(Brunt et al., Am. J. Gastroenterol., 1999, 94, 2467-74). 조직학 진단을 사용하여 하기 표현형을 정의하였다: 1) 정상: 지방증, NASH 또는 섬유증 증거 없음; 2) 단순 지방증: NASH 또는 섬유증의 증거가 없는 지방증(등급 무관); 3) NASH: 소엽 염증 또는 간세포 팽창(등급 무관)의 임의의 존재, 또는 섬유증(병기 무관)의 임의의 존재.
서열분석된 유럽 혈통 개체 발견 및 반복 코호트의 기준선 특징을 도 1에 나타낸다. 발견 코호트에서 1.0×10-7 미만의 P로 혈청 트랜스아미나제와 연관된 단일 뉴클레오타이드 변이체를 도 2에 나타낸다.
DNA 샘플 제조 및 서열분석
간략하면, 제조사의 제안된 프로토콜(로슈 님블젠사(Roche NimbleGen))에 따라서 NimbleGen 프로브를 사용하여 엑솜 캡처를 수행하였다. 캡처된 DNA를 PCR 증폭시키고, qRT-PCR(카파 바이오시스템즈사(Kapa Biosystems))에 의해서 정량하였다. 멀티플렉싱된 샘플을 Illumina v4 HiSeq 2500 상에서 75bp 페어드-엔드 서열분석을 사용하여 샘플의 96%에서 표적 염기의 85% 초과의 20x 초과의 반수체 판독 깊이를 제공하기에 충분한 커버리지 깊이(표적 염기의 대략 80x 평균 반수체 판독 깊이)까지 서열분석하였다. 각각의 Illumina Hiseq 2500 실시로부터의 원시 서열 데이터를 서열 판독 정렬 및 변이체 식별을 위해서 DNAnexus 플랫폼에 업로딩하였다(Reid et al., BMC Bioinformatics, 2014, 15, 30). 간략하면, 원시 서열 데이터를 BCL 파일로부터 샘플-특이적 FASTQ-파일로 변환하고, 이것을 BWA-mem을 사용하여 인간 참조 빌드 GRCh37.p13에 정렬하였다(Li et al., Bioinformatics, 2009, 25, 1754-60). 단일 뉴클레오타이드 변이체(SNV) 및 삽입/결실(indel) 서열 변이체를 Genome Analysis Toolkit를 사용하여 식별하였다(McKenna et al., Genome Res., 2010, 20, 1297-303).
간 효소 및 만성 간 질환 표현형의 엑솜-와이드 연관성 분석
1% 미만의 누락 데이터율(missing data rate), 1.0×10-6 초과의 하디-바인버그 평형(Hardy-Weinberg equilibrium) P-값 및 0.1% 초과의 부 대립유전자 빈도를 갖는 502,219개의 이대립유전자 변이체를 트랜스아미나제 수준과의 연관성에 대해서 조사하였다. Log10-변환된 중위 ALT 및 AST를 연령, 연령2, 성별, BMI 및 혈통의 제1의 4개의 주성분에 대해서 조정하였다. 연구 참여자에서의 관련성을 설명하기 위해서, 유전적 관련성 매트릭스는 무작위-효과 공변량(random-effects covariate)으로서 적합하였다. 주성분 및 유전적 관련성 매트릭스 둘 다를 대략적인 연관 평형(linkage equilibrium)에서 0.1% 초과의 부 대립 유전자 빈도로 39,858개의 비-MHC 마커로부터 구축하였다. 선형 혼합 모델을 GCTA 패키지에서 구현되는 바와 같이 사용하여(Yang et al., Am. J. Hum. Genet., 2011, 88, 76-82) 특질 잔차(trait residual)와 단일 뉴클레오타이드 변이체 간의 연관성에 대해서 시험하였다. 본문에 기록된 모든 P-값은 대립유전자 모델에 상응한다.
GHS 발견 코호트에서의 연관성 반복을 3개의 개별 유럽 혈통 코호트: GHS 비만 수술 코호트, 댈러스 심장 연구 및 펜 매디슨 바이오뱅크(상기에 기술됨)에서 시도하였다. GHS 비만 수술 코호트 및 펜 매디슨 바이오뱅크로부터의 ALT 및 AST 측정치를 log10-변환시키고, 연령, 연령2, 성별, BMI 및 혈통의 제1의 4개의 주성분에 대해서 조정하였다. 유전적 관련성 매트릭스를 무작위-효과 공변량으로서 포함시켰고, GCTA에서 선형 혼합 모델을 사용하여 분석을 수행하였다. 댈러스 심장 연구에서, log10-변환된 ALT 및 AST 측정치를 ALT 및 AST를 연령, 연령2, 성별, BMI 및 혈통의 제1의 10개의 주성분에 대해서 조정하고, PLINK로 구현되는 선형 회귀를 사용하여 분석을 수행하였다. 3개의 반복 코호트에 대한 통계 요약을 METAL을 사용하여 메타 분석하였다(Willer et al., Bioinformatics, 2010, 26, 2190-1)(반복 메타-분석). 발견 코호트 및 3개의 반복 코호트에 대한 통계 요약을 유사하게 메타 분석하였다(공동 메타-분석).
3개의 개별 유럽 혈통 코호트에서 발견 코호트로부터의 35개의 엑솜-와이드 유의한 뉴클레오타이드 변이체의 반복 및 공동 메타-분석을 도 3에 나타낸다.
GHS 발견 코호트에서 트랜스아미나제와 엑솜 와이드 유의한 연관성(p<1×10-7)을 갖는 변이체에 대해서, 본 명세서에 기재된 유럽 혈통 반복 연구로 본 명세서에 기재된 바와 같이 연관성 분석 및 메타 분석을 수행하였다. 시험된 변이체의 수에 의해서 결정된 본페로니 유의성 역치(Bonferroni significance threshold)를 사용하여 반복 연관성을 정의하였다. 발견 및 반복 연구의 메타 분석을 또한 수행하였다. 본문에 기록된 모든 P-값은 대립유전자 모델에 상응한다.
트랜스아미나제-연관된 단일 뉴클레오타이드 변이체를 또한 만성 간 질환 표현형과의 연관성에 대해서 조사하였다(본 명세서에 기재된 바와 같이 정의 및 분석됨). 시험된 변이체의 수 및 넓은 만성 간 질환 카테고리에 의해서 결정된 본페로니 유의성 역치를 사용하여 연관 유의성을 결정하였다. 반복된 신규 변이체를 GHS 비만 수술 코호트로부터 조직병리학적으로 정의된 간 표현형과의 연관성에 대해서 또한 조사하였다.
만성 간 질환 표현형과의 연관성 분석
간 효소 ExWAS로부터의 13개의 유의한 반복 단일 뉴클레오타이드 변이체를 상기에 기재된 바와 같이, GHS 발견 코호트로부터 정의된 만성 간 질환 표현형과의 연관성에 대해서 분석하였다. 0.05/26 미만의 P(1.92×10-3 미만의 P)의 본페로니 유의성 역치를 사용하여 13개의 변이체 및 시험된 2개의 넓은 만성 간 질환 카테고리(알코올성 및 비알코올성)를 설명하였다. HSD17B13 rs72613567 변이체를 상기에 기재된 바와 같이 GHS 비만 수술 코호트로부터 조직병리학적으로 정의된 간 표현형과의 연관성에 대해서 추가로 시험하였다. 연령, 연령2, 성별, BMI 및 혈통의 제1의 4개의 주성분에 대해서 조정한 후 승산비(odds ratio)를 퍼스의 로지스틱 회귀의 벌점 가능성 방법(Firth's penalized likelihood method of logistic regression)을 사용하여 에측하였다. 유전자형 승산비를 동일한 공변량을 사용하여 HSD17B13 rs72613567에 대해서 예측하였다.
연령, 연령2, 성별, BMI 및 자가-보고된 민족성에 대해서 조정된, 로지스틱 회귀에 의해서 DLS에서 간 질환에 대한 승산비를 예측하였다. 입수 가능한 rs72613567 유전자형을 갖는 댈러스 심장 연구로부터의 참여자를 정상 대조군으로서 사용하였다(n=4,279). DPLS에서의 승산비를 로지스틱 회귀에 의해서 예측하였다.
발견 코호트에서 간 질환 표현형을 갖는 13개의 엑솜-와이드의 유의한 반복 단일 뉴클레오타이드 변이체의 연관성을 도 4에 나타낸다.
PNPLA3 rs738409(p.I148M)와 HSD17B13 rs72613567 간의 유전적 상호작용 - 분석
PNPLA3 rs738409와 HSD17B13 rs72613567의 조합 효과를 평가하기 위해서, 각각 선형 회귀 및 로지스틱 회귀를 사용하여 정량적(ALT 및 AST) 및 2항(비알코올성 간 질환 및 알코올성 간 질환) 특질에 대한 연관성 분석을 수행하고, 상가적 유전자 모델(additive genetic model)을 가정하여 두 유전자 변이체뿐만 아니라 상호작용항(interaction term)에 대한 주요 효과를 모델링하였다. 모든 모델을 연령, 연령2, 성별, BMI 및 혈통의 제1의 4개의 주성분에 대해서 조정하였다. 염기 R에서 glm 함수를 사용하여 통계학적 분석을 수행하였다.
소프트웨어
GCTA 소프트웨어, 버전 1.25.0(Yang et al., Am. J. Hum. Genet., 2011, 88, 76-82) 및 PLINK, 버전 1.9.0을 사용하여 유전적 연관성 분석을 수행하였다. 분위수-분위수 및 맨허튼 플롯을 R 소프트웨어, 버전 3.2.1(R Project for Statistical Computing)을 사용하여 생성시켰다. LocusZoom(Pruim et al., Bioinformatics, 2010, 26, 2336-7)을 사용하여 영역 연관성 플롯을 생성시켰다.
RNA 서열분석 연구
Agilent RNA Nano Bioanalyzer 칩 상에서 전체 RNA를 시험함으로써 RNA 품질 및 농도를 평가하였는데; 모든 샘플은 8 초과의 RNA 온전성 값(RNA integrity number: RIN)을 가졌다. 폴리아데닐화된 RNA 전사물을 올리고(dT)25 비드(써모 피셔 사이언티픽사(Thermo Fisher Scientific))를 사용하여 2 라운드의 풍부화를 사용하여 단리시켰다. 샘플을 RNAclean XP 비드(베크만 쿨터사(Beckman Coulter))를 사용하여 정제 및 농축시키고, 대략 140 염기쌍으로 열 단편화시켰다. 무작위 육량체를 사용하여 SuperScript III 역전사효소(써모 피셔 사이언티픽사)로 제1-가닥 합성을 완결하였고; dTTP를 제2-가닥 합성 동안 dUTP로 대체하였다. 우라실 DNA-글리코실라제 단계를 추가하여 엑솜에 대해서 상기에 언급된 표준 DNA 라이브러리 제조 방법에 따라서 샘플을 처리하여 가닥-특이적 서열분석 라이브러리를 생성시켰다. 샘플을 풀링(pooling)시키고, Illumina v4 HiSeq 2500 상에서 75bp 페어드-엔드 서열분석을 사용하여 서열분석하였다.
신규 HSD17B13 전사물의 식별 및 검증
판독물을 2개의 미스매치를 허용하는 ArrayStudio(등록상표) 소프트웨어(OmicSoft(등록상표), 미국 노쓰캐롤라이나주 캐리 소재)를 사용하여 Human.B38에 대해서 맵핑하였다. 두 접근법을 사용하여 신규 HSD17B13 전사물을 식별하였다. 신규 엑손 접합부를 ArrayStudio를 사용하여 Gencode v24에 기초하여 발견하였다. Trinity(v2.2.0)를 디폴트 설정으로 사용하여 신생 전사물 조립을 수행하였다. 커스텀 유전자 모델을 구축하여 HSD17B13의 신규 전사물을 혼입하였고, 전사물 정량을 커스텀 유전자 모델에 대한 판독물 정렬에 의해서 예측하였다. 모든 식별된 HSD17B13 아이소폼의 단백질 서열 정렬을 결정하였다. Platinum(상표명) Taq DNA Polymerase(써모피셔사(Thermofisher))를 사용하는 SuperScript(상표명) One-Step RT-PCR을 사용하여 인간 간 샘플로부터의 전체 RNA에 대해서 RT-PCR을 수행하였다. 각각의 50㎕의 RT-PCR 반응은 1X 반응 믹스, 500nM(각각 정방향 프라이머 및 역방향 프라이머(PST516: ATGAACATCATCCTAGAAATCCTTC; 서열번호 62) 및 PST517: ATCATGCATACATCTCTGGCTGGAG; 서열번호 63)), 1㎕의 RT/Platinum Taq 및 75ng의 RNA를 함유하였다. 주기 조건은, 30분 동안 45℃의 1회 사이클; 2분 동안 94℃의 1회 사이클; 20초 동안 94℃, 30초 동안 53℃ 및 90초 동안 72℃의 40회 사이클; 5분 동안 72℃의 1회 사이클; 이어서 10℃ 유지였다. 생성물을 QIAquick PCR 정제 키트(퀴아젠사)를 사용하여 정제시키고, 프라이머 DE002(ATCAGAACTTC AGGCCTTGG; 서열번호 64)를 사용하여 직접 생어 서열분석에 적용하였다. B 전사물 및 C 전사물을 식별하기 위해서, RT-PCR 생성물을 SYBR GoldSYBR(등록상표) Gold Nucleic Acid Gel Stain(써모피셔사)로 염색된 2% 아가로스 겔 상에서 전개시키고, 예측된 분자량의 밴드를 절제하고, QIAquick Gel Extraction Kit(퀴아젠사)를 사용하여 정제시키고, 이어서 TOPO(등록상표) TA Cloning Kit(써모피셔사)를 사용하여 클로닝에 적용하였다. M13F 및 M13R 서열분석 프라이머를 사용하여 TOPO 클론의 서열분석을 수행하였다. Sequencher DNA 분석 소프트웨어(진 코즈사(Gene Codes Corporation))를 사용하여 서열 분석을 수행하였다.
제1 엑손(GCAAAGCCATGAACATCATCC; 서열번호 65) 및 마지막 엑손(TCTTGATGTAGTGGGAGTCGGATT; 서열번호 66)에서 유전자-특이적 프라이머를 사용하여 Platinum Taq High Fidelity가 구비된 SuperScript III One-step RT-PCR System(써모 피셔 사이언티픽사)으로 50ng의 전체 RNA로부터 직접 전장 HSD17B13 전사물을 증폭시켜 약 2.2kb의 앰플리콘(최대 예측된 크기의 전사물)을 생성시켰다. 앰플리콘을 Agilent Bioanalyzer 상에서 검증하였다. PacBio-호환성 바코드 어댑터를 앰플리콘에 결찰시키고, PacBio PB 비드(퍼시픽 바이오사이언시스사(Pacific Biosciences))로 세정하였다. 라이브러리를 동일한 양으로 풀링시키고, 하나의 SMRT 세포에 대해서 180분 동안 PacBio RSII 플랫폼 상에서 서열분석하였다. PacBio 소프트웨어 smrtanalysis v2.3 tool labelzmw을 사용하여 디멀티플렉싱(demultiplexing)하고, 이어서 ConsensusTools AmpliconAnalysis로 분석하였다. 생성된 앰플리콘을 HSD17B13 RefSeq 유전자와 비교하여 아이소폼 및 유전자형 상태를 결정하였다.
HSD17B13 아이소폼의 세포 이하 국지화
HepG2 세포에 HSD17B13 A 전사물 및 D 전사물을 보유하는 렌티바이러스를 감염시키고, 안정적인 세포주를 선택하고, HSD17B13 아이소폼, 지방 소립 및 소포체를 면역형광을 사용하여 가시화하였다. 간략하면, HepG2 세포를 10% 우태아 혈청이 보충된 이글 최소 필수 배지(Eagle's Minimum Essential Medium) 중에서 배양하였다. HSD17B13 전사물 A 및 D를 Myc-DDK 골격 렌티바이러스 작제물 내에 서브클로닝시키고, 렌티바이러스를 생성시켰다. HepG2 세포에 HSD17B13 전사물을 보유하는 렌티바이러스를 감염시켰다. 각각의 HSD17B13 전사물을 발현하는 안정적인 세포주를 완전 배양 배지 중에서 1 내지 3㎎/㎖의 Geneticin G-418 설페이트로 2주 동안 선택하였다. 고정 이후에, HSD17B13 아이소폼을 마우스 항-Myc 항체를 사용하여 검출하였다. 지방 소립을 BODIPY FL 염료(시그마사)로 표지하였다. 지질 코트 단백질 및 소포체를 토끼 항-PLIN 항체(시그마사) 및 토끼 항-칼넥신 항체(셀 시그널링 테크놀로지사)로 표지하였다. 면역형광을 위한 2차 항체는 Alexa Fluor 488 당나귀 항-토끼 IgG 및 Alexa Fluor 594 당나귀 항-마우스 IgG(잭슨 이뮤노리서치사)였다.
인간 간 생검 조직에서의 HSD171B3 단백질 발현의 정량
인간 간 및 세포 펠릿 샘플을 프로테아제 및 포스파타제 저해제 혼합물(써모피셔사)의 존재 하에서 얼음 냉각된 1× RIPA 용해 완충액(EMD 밀리포어사(EMD Millipore)) 중에서 균질화시켰다. 상청액을 수집하고, BCA 단백질 검정(써모피셔사)을 사용하여 단백질 농축을 위해서 사용하였다. 인간 조직 용해물을 30㎍/웰로 로딩하고, 안정적인 세포주를 9㎍/웰로 로딩하고, SDS/PAGE 겔(바이오래드사) 상에서 분리시키고, PVDF 막(바이오래드사)에 전달하였다. 막을 1시간 동안 0.1% Tween20(바이오래드사)이 보충된 1x TBS 중의 5%(wt/vol) 우유로 차단시켰다. 막을 항체와 함께 4℃에서 밤새 HSD17B13(1:200, 써모피셔사) 및 B-액틴(1:500, 셀 시그널링 테크놀로지사)에 대해서 인큐베이션시켰다. 결합된 항체를 HRP-접합된 항-토끼 항체(1:10,000, 잭슨 이뮤노리서치사)를 사용하여 검출하고, 화학발광 시약(써모피셔사)을 사용하여 증강시켰다. Image J 소프트웨어를 사용하여 밴드 강도를 정량하였다.
HSD17B13 효소 활성도의 시험관내 및 세포 특징규명
재조합 인간 HSD17B13 단백질을 HSD17B13 전사물 A 또는 전사물 D를 보유하는 플라스미드 DNA로 형질전환된 이. 콜라이(E. coli)(진스크립트사(Genscript))로부터 정제시켰다. HSD17B13 변이체는 C 말단에 10×His 태그를 함유하였고, Ni2+ 친화도 정제를 사용하여 가용성 분획으로부터 정제되었다. NAD(P)H-Glo 검출 시스템(프로메가사(Promega))을 사용한 NADH 생산의 측정을 통해서 효소 활성도를 결정하였다. 반응을 3시간 동안 25℃에서 0.2M tris-HCl, pH 7.5, 0.5mM NAD+, 75μM의 기질(시그마사) 및 500ng의 정제된 효소 중에서 100㎕의 최종 부피로 수행하였다. 인큐베이션 후, 20㎕의 반응을 20㎕의 루시퍼라제 시약(프로메가사)과 합하고, 1시간 동안 실온에서 인큐베이션시키고, Envision Plate Reader(퍼킨 엘머사) 상에서 판독하였다.
HSD17B13 전사물 A, 전사물 D 또는 녹색 형광 단백질(GFP, 대조군)을 과발현하는 HEK293 세포를 사용하여 세포-기반 검정에서 에스트라다이올에 대한 HSD17B13의 활성도를 조사하였다. 에스트라다이올을 각각의 세포 유형에 공급하였다. 48시간 후에, 배지를 수집하고, 에스트라다이올의 농도 및 이의 전환 생성물인 에스트론을 식별하고, LC-MS에 의해서 정량하였다. 하이드록시에스트라다이올(에스트라다이올로부터의 대사산물) 및 하이드록시에스트론(에스트론의 대사산물)을 LC-MS에 의해서 식별하였다.
실시예 2: 66개 인간 간 샘플에서 HSD17B13 및 PNPLA3의 유전자 발현 분석
HSD17B13 및 PNPLA3의 유전자 발현을 66개의 인간 간 샘플을 사용하여 분석하였다. 모든 샘플은 지방증, 소엽 염증 또는 섬유증이 없는 대조군 공여자로부터 유래되었다. HSD17B13 rs72613567(T/T, T/TA 및 TA/TA) 및 PNPLA3 rs738409(C/C, C/G 및 G/G) 유전자형의 분포를 표 1에 나타낸다.
PNPLA3의 발현은 HSD17B13 rs72613567 스플라이스 변이체의 동형접합성 대체 보유자에서 상당히 감소되었다(도 7 참고). mRNA 발현은 FPKM 단위로 나타낸다. FDR 0.0071을 갖는 T/T와 비교할 때 1.6배 감소가 관찰되었다. HSD17B13 TA/TA 유전자형을 갖는 변이체 PNPLA3 C/C 보유자는 HSD17B13 T/T 보유자와 비교할 때 상당히 감소된 발현을 가졌다: 1.7배(FDR 0.017) 감소. TA/TA 유전자형을 갖는 변이체 PNPLA3 C/G 보유자는 발현 감소를 나타내었지만, 통계학적으로 유의하지 않았다(1.4배, FDR 1). 도 8은 3개의 HSD17B13 rs72613567 유전자형(T/T, T/TA, TA/TA)에서의 63 PNPLA3 rs738409 보유자(C/C 및 C/G, 표 1 참고)의 발현 차이를 나타낸다.
변이체 PNPLA3 p.I148M 변이체는 NAFLD에 대해서 가장 널리 검증된 유전적 위험 인자이며, 148M 대립유전자는 혈통에 따라서 개체의 5 내지 25%에서 동형접합성 상태로 존재한다. HSD17B13 rs72613567:TA가 PNPLA3 p.I148M과 연관된 간 손상의 위험을 변경시키는지의 여부를 이해하기 위해서, DiscovEHR에서 ALT, AST 및 만성 간 질환 표현형과의 연관성에서 두 변이체 간의 상호작용의 분석을 수행하였다. 이러한 분석은 모든 참여자에서 그리고 비만(체질량 지수(BMI) > 30㎏/㎡) 및 비-비만(BMI ≤ 30㎏/㎡) 하위 집단에서 수행하였다. ALT(상호작용에 대해서 P=1.8×10-3) 및 AST(상호작용에 대해서 P=4.5×10-3) 수준의 연관성 분석에서 HSD17B13 rs72613567:TA와 PNPLA3 p.I148M 사이에 명목상 유의한 상호작용이 존재하였고; 이러한 연관성은 비만 개체에서의 연관성에 의해서 주로 기인된다(도 9 참고). 이러한 분석에서, rs72613567:TA 대립유전자는 ALT 및 AST 증가와 PNPLA3 148M 대립유전자의 대립유전자 용량-의존적 연관성을 완화시켰다(도 10 참고). 도 10을 참고하면, 패널 A는 각각의 PNPLA3 p.I148M 유전자형을 갖는 개체에서 HSD17B13 rs72613567와 ALT의 연관성을 나타내고, 패널 B는 각각의 PNPLA3 p.I148M 유전자형을 갖는 개체에서 HSD17B13 rs72613567과 AST의 연관성을 나타낸다. 효과 추정치(베타 및 95% CI)를 선형 회귀를 사용하여 계산하였고, 연령, 연령2, 성별, BMI 및 혈통의 4개의 주성분에 대해서 조정하였다. 도 11(패널 A 내지 패널 F)은 PNPLA3 rs738409(p.I148M) 및 HSD17B13 rs72613567 유전자형에 의한 원시 및 잔차 ALT 수준을 나타낸다. 연령, 연령2, 성별, BMI 및 4개의 주성분 1 내지 4에 대해서 조정된 선형 회귀에 의해서 잔차를 계산하였다. 도 12(패널 A 내지 패널 F)는 PNPLA3 rs738409(p.I148M) 및 HSD17B13 rs72613567 유전자형에 의한 원시 및 잔차 AST 수준을 나타낸다. 연령, 연령2, 성별, BMI 및 4개의 주성분 1 내지 4에 대해서 조정된 선현 회귀에 의해서 잔차를 계산하였다. 도 13(패널 A 내지 패널 F)은 HSD17B13 스플라이스 변이체의 동형접합성 참조군(T/T), 이형접합성(T/TA) 및 동형접합성 대체(TA/TA) 보유자에서의 4개의 추가적인 신규 HSD17B13 전사물(E-H)의 mRNA 발현을 나타낸다. 유전자 모델에서 암호 영역은 적색으로 나타내고, 비번역 영역은 흑색으로 나타낸다. 전사물 E 및 H는 엑손 3과 4 사이에 추가 엑손을 함유한다. 전사물 F는 엑손 6에서 인트론 6까지 리드-쓰루(read-through)를 포함한다. 청색 화살표는 rs72613567로부터의 A 삽입을 나타낸다. 전사물 G는 엑손 2가 없다. 전사물 G 및 H에서의 별표는 엑손 6의 3'-단부에서의 G의 삽입을 도시하며, 이것은 단백질의 조기 절두로 이어진다(전사물 D와 유사함). 전사물은 박스 플롯에 도시된 바와 같이 HSD17B13 유전자형에 따라서 차별적으로 발현된다. mRNA 발현을 FPKM 단위로 나타낸다.
이러한 데이터는, HSD17B13 rs72613567:TA 변이체가 변이체 PNPLA3 p.I148M 변이체에 의해서 지방증 간 질환에 유전적으로 취약한 개체에서 간 손상의 위험을 완화시킨다는 것을 시사한다. 이러한 발견은, HSD17B13의 치료 조절에 대한 중요한 하위 집단 - 변이체 PNPLA3 148M 대립유전자에 대해서 이형접합성이거나 동형접합성인 개체를 시사할 수 있다.
실시예 3: 66개 인간 간 샘플에서 HSD17B13 및 PNPLA3의 유전자 발현 분석
엑손 변이체와 아스파테이트 및 알라닌 아미노트랜스퍼라제의 연관성
502,219개의 이대립유전자 단일 유전자 변이체를 DiscovEHR 연구("GHS 발견 코호트"; 도 1의 기본 인구통계학)로부터의 유럽 혈통의 46,544명의 개체에서 혈청 ALT 또는 AST 수준과의 연관성에 대해서 조사하였다. 19개의 유전자에서 총 35개의 변이체가 1.0×10-7 미만의 P에서 ALT 또는 AST와 연관된 것을 발견하였다(도 14 및 도 2 참고). 도 14를 참고하면, GHS 발견 코호트에서 혈청 트랜스아미나제 수준과 단일 뉴클레오타이드 변이체 연관성의 맨허튼 플롯(좌측) 및 분위수-분위수 플롯(우측)을 나타낸다. 1.0×10-7 미만의 P에서 알라닌 아미노트랜스퍼라제(ALT) 수준과 상당히 연관된 16개 유전자에서의 31개 변이체가 존재하였다(패널 A 참고). 1.0×10-7 미만의 P에서 아스파테이트 아미노트랜스퍼라제(AST) 수준과 상당히 연관된 10개 유전자에서의 12개 변이체가 존재하였다(패널 B 참고). 모든 유의한 연관성을 도 2에 나타낸다. 3개의 개별 유럽 혈통 코호트의 반복 메타 분석에서 ALT 또는 AST와 유의하게 연관된, HSD17B13을 비롯한, 9개의 유전자(유전자 명칭에 의해서 본 명세서에 나타냄)에서 13개의 변이체가 존재하였다(도 3 참고). 엑솜-와이드 분위수-분위수 플롯 및 게놈 대조군 람다 값에 의해서 제시된 바와 같이, 연관성 시험을 널리 보정하였다.
유럽 혈통 개체의 3개의 코호트에서 반복 연구를 수행하였다: 1) DiscovEHR로부터의 비만 수술 환자(n=2,644)("GHS 비만 수술 코호트"); 2) 댈러스 심장 연구로부터의 1,357명의 개체; 및 3) 펜 매디슨 바이오뱅크로부터의 8,526명의 개체. 반복 코호트의 메타 분석에서, 9개의 유전자에서의 13개의 변이체가 ALT 또는 AST의 혈청 수준과 유의하게 연관되었다(시험된 35개 변이체에 대해서 1.43×10-3 미만의 P의 본페로니 유의성 역치)(도 3 참고). 이들은 증가된 트랜스아미나제 수준과 연관되어 있다고 이미 보고된 변이체, 예컨대, PNPLA3(Romeo et al., Nat. Genet., 2008, 40, 1461-5), TM6SF2(Kozlitina et al., Nat. Genet. 2014, 46, 352-6), SERPINA1(Brantly et al., Am. J. Med., 1988, 84, 13-31), SAMM50(Kitamoto et al., Hum. Genet., 2013, 132, 783-92) 및 ERLIN1(Feitosa et al., Atherosclerosis, 2013, 228, 175-80)을 포함하였다. SERPINA1은 알파-1-항트립신을 암호화하는데, 이의 기능성 결핍은 간 질환을 유발하며; SAMM50과의 연관성은 PNPLA3에서의 변이와의 연관 비평형을 통해서 매개되고, ERLIN1은 간 지방 침착에 연관되었다. 간 질환과 연관되어 있다고 이전에 보고되어 있지 않은 변이체를 또한 식별하였다. 이들은 각각 ALT 및 AST를 암호화하는 유전자인 GPT 및 GOT1, 및 용질 운반체 패밀리(solute carrier family) 39 구성원 12를 암호화하는 SLC39A12에서의 몇몇 변이체를 포함하였다.
17-베타 하이드록시스테로이드 데하이드로게나제 패밀리의 특징규명되지 않은 구성원인 하이드록시스테로이드 17-베타 데하이드로게나제 13을 암호화하는 유전자인 HSD17B13에서의 변이체와 ALT(발견 P=4.2×10-12, 반복 P=1.7×10-4) 및 AST(발견 P=6.2×10-10, 반복 P=1.7×10-4, 도 3 참고)의 감소된 수준 간의 재현 가능한 연관성이 또한 식별되었다. 연관된 변이체, rs72613567는 엑손 6(TA 대립유전자)의 공여자 스플라이스 부위에 인접한 아데닌의 삽입이고, GHS 발견 코호트에서 26.0%의 대립유전자 빈도를 가졌다. 이전에, Chambers 등은 ALT 수준과 연관된 4q22(rs6834314)의 인근 유전자좌를 식별하였고(Chambers et al., Nat. Genet., 2011, 43, 1131-8); rs72613567은 지금까지 트랜스아미나제 수준과 연관된다고 보고되지 않았다. HSD17B13은 동일한 유전자 패밀리의 또 다른 구성원인 HSD17B11의 30kb 상류에 존재한다. HSD17B11에서의 암호 또는 스플라이스 변이체와, 발견 코호트(도 6 참고) 또는 발견 코호트 및 3개의 반복 코호트의 공동 메타-분석에서의 트랜스아미나제 수준 사이에는 어떠한 엑솜-와이드 유의한 연관성도 관찰되지 않았다. 추가로, rs72613567과 HSD17B11에서의 변이체의 연관 비평형은 모든 혈통군에서 보통이었다(모든 혈통군의 HSD17B11에서의 모든 확인된 변이체에서 r2<0.4). 전체적으로, 이러한 발견은 HSD17B13이 트랜스아미나제 수준과 기능적으로 관련될 가능성이 가장 높은 게놈 영역의 유전자임을 시사한다.
엑손 변이체와 만성 간 질환의 임상적 진단의 연관성
발견 및 반복 코호트에서 발견되는 9개의 유전자 내의 13개의 트랜스아미나제-연관된 변이체와, 알코올성 간질환 및 비알코올성(비바이러스성) 간 질환을 비롯한 만성 간 질환, 뿐만 아니라 가장 진행된 형태의 만성 간 질환: 알코올성 간경변, 비알코올성 간경변 및 간세포 암종(HCC)을 비롯한 만성 간 질환 간의 관계를 또한 분석하였다. 시험된 13개의 변이체에 대해서 1.92×10-3 미만의 P의 본페로니 유의성 역치를 사용하여, 5개의 유전자(HSD17B13, SERPINA1, TM6SF2, PNPLA3 및 SAMM50) 내의 6개의 변이체와 만성 간 질환 표현형 간의 유의한 연관성을 발견하였다(도 4 참고). SERPINA1, TM6SF2, PNPLA3 및 SAMM50 연관성은 이미 보고된 연관성을 확인한다. 발견 코호트에서, HSD17B13 rs72613567:TA는 대립유전자 용량-의존적 방식으로 알코올성 간 질환 및 비알코올성 간 질환의 모든 EHR-유래된 카테고리의 더 낮은 승산과 연관되었다(도 15, 패널 A 참고): 알코올성 간 질환의 모든 카테고리, 이형접합성 승산비(ORhet)(95% 신뢰 구간) 0.58(0.42 내지 0.80), 동형접합성 OR(ORhom) 0.47(0.23 내지 0.97), 대립유전자 OR(OR대립유전자) 0.62(0.48 내지 0.81), P=1.8×10-4; 비알코올성 간 질환의 모든 카테고리, ORhet 0.83(0.75 내지 0.92), ORhom 0.70(0.57 내지 0.87), OR대립유전자 0.84(0.78 내지 0.91), P=1.3×10-5. HSD17B13 rs72613567:TA는 또한 알코올성 간경변 및 비알코올성 간경변의 더 낮은 승산과 연관되었는데, 각각 이형접합체 및 동형접합체에 대해서 알코올성 간경변의 더 낮은 승산은 42% 및 73%(ORhet 0.58(0.39 내지 0.86), ORhom 0.27(0.09 내지 0.85), OR대립유전자 0.56(0.41 내지 0.78), P=3.4×10-4)이고, 각각 이형접합체 및 동형접합체에 대해서 비알코올성 간경변의 더 낮은 승산은 26% 및 49%이다(ORhet 0.74 (0.60 내지 0.93), ORhom 0.51(0.31 내지 0.85), OR대립유전자 0.74(0.62 내지 0.88), P=4.5×10-4). HSD17B13 rs72613567:TA는 또한 명목상 HCC의 더 낮은 승산과 연관되었다.
이러한 발견은 다민족 댈러스 간 연구(DLS) 및 델러스 소아 간 연구(DPLS)에서 확인 및 확장되었다(도 5 참고). DLS에서, TA 대립유전자는 대립유전자-용량 의존적인 방식으로 임의의 간 질환의 더 낮은 승산과 연관되었다(ORhet 0.74(0.57 내지 0.97), ORhom 0.41(0.21 내지 0.83), OR대립유전자 0.70(0.5 내지 0.88), P=1.8×10-3, 도 15, 패널 B 참고). 후기 간경변 형태의 알코올성(OR대립유전자 0.72(0.53 내지 0.99), P=4.4×10-2) 및 비알코올성(OR대립유전자 0.65(0.40 내지 1.07), P=9.0×10-2) 간 질환과의 보호 연관성을 비롯한 EHR-유래된 간 질환 하위유형 전체에서 유사한 효과가 관찰되었다. 자가 보고된 민족성에 의해서 군집화된 개체의 하위세트 분석에서, 간 질환과의 연관성은 DLS의 히스패닉계 미국인(Hispanic Americans)에서 유의하였고(n=326 사례 및 722개 대조군, OR대립유전자 0.51(0.35 내지 0.74), P=4.0×10-4); 통계학적 유의성을 달성하지 않은 유사한 수치 경향이 또한 아프리카계 미국인(African American)(n=33 사례 및 2,291개의 대조군, OR대립유전자 0.74(0.25 내지 2.47), P=0.67) 및 유럽계 미국인(European American)(n=158 사례 및 1,266개 대조군, OR대립유전자 0.87(0.65 내지 1.15), P=0.32) 하위세트에서 또한 주목되었다. DPLS에서, 히스패닉계 미국 소아 간 질환 환자 및 비만 대조군의 개별 연구에서, TA 대립유전자는 또한 간 질환의 더 낮은 승산과 연관되었다(OR대립유전자 0.61(0.37 내지 0.99), P=4.6×10-2). 따라서, HSD17B13 rs72613567:TA는, 3개의 독립적인 집단에서, 성인 및 유아에서, 간경변을 비롯한 만성 간 질환의 다양한 형태의 감소된 승산과 연관되었다.
도 15를 참고하면, HSD17B13 rs72613567:TA는 도시된 바와 같이, 알코올성 간 질환 표현형 및 비알코올성 간 질환 표현형의 위험 감소와 연관된다. GHS 발견 코호트에서, HSD17B13 rs72613567은 대립유전자 용량-의존적인 방식으로 비알코올성 및 알코올성 간 질환, 간경변, 및 간세포 암종의 더 낮은 승산과 연관되었다(패널 A 참고). 승산비를 로지스틱 회귀를 사용하여 계산하였고, 연령, 연령2, 성별, BMI 및 혈통의 주성분에 대해서 조정하였다. 이형접합성(Het OR) 보유자 및 동형접합성(Hom OR) 보유자에 대한 유전자형 승산비를 또한 나타낸다. 댈러스 간 연구에서, HSD17B13 rs72613567은 대립유전자 용량-의존적인 방식으로 임의의 간 질환의 더 낮은 승산과 연관되었다(패널 B 참고). 유사한 대립유전자 용량-의존적 효과를 간 질환 하위유형 전체에서 관찰하였다. 승산비를 로지스틱 회귀를 사용하여 계산하였고, 연령, 연령2, 성별, BMI 및 자가 보고된 민족성에 대해서 조정하였다.
PNPLA3 rs738409(p.I148M)와 HSD17B13 rs72613567 간의 유전적 상호작용
변이체 PNPLA3 p.I148M 변이체는 NAFLD에 대해서 가장 널리 검증된 유전적 위험 인자이며, 148M 대립유전자는 혈통에 따라서 개체의 5 내지 25%에서 동형접합성 상태로 존재한다. HSD17B13 rs72613567:TA가 PNPLA3 p.I148M과 연관된 간 손상의 위험을 변경시키는지의 여부를 이해하기 위해서, DiscovEHR에서 ALT, AST 및 만성 간 질환 표현형과의 연관성에서 두 변이체 간의 상호작용의 분석을 수행하였다. 이러한 분석은 모든 참여자에서 그리고 비만(체질량 지수[BMI] ≥ 30㎏/㎡) 및 비-비만(BMI < 30㎏/㎡) 하위 집단에서 수행하였다. ALT(상호작용에 대해서 P=1.8×10-3) 및 AST(상호작용에 대해서 P=4.5×10-3) 수준의 연관성 분석에서 HSD17B13 rs72613567:TA와 PNPLA3 p.I148M 사이에 명목상 유의한 상호작용이 존재하였고; 이러한 연관성은 비만 개체에서의 연관성에 의해서 주로 기인된다(도 9 참고). 이러한 분석에서, rs72613567:TA 대립유전자는 ALT 및 AST 증가와 PNPLA3 148M 대립유전자의 대립유전자 용량-의존적 연관성을 완화시켰다(도 16, 도 11 및 도 12참고). RNA 서열분석-기반 발현 분석은, HSD17B13 rs72613567:TA가 대립유전자 용량-의존적인 방식으로 감소된 PNPLA3 mRNA 발현과 연관되었음을 나타내었다(도 7 참고). 이러한 데이터는, HSD17B13 rs72613567:TA 변이체가 변이체 PNPLA3 p.I148M 변이체에 의해서 지방증 간 질환에 유전적으로 취약한 개체에서 간 손상의 위험을 완화시킨다는 것을 시사한다.
도 16을 참고하면, HSD17B13 rs72613567:TA가 도시된 바와 같이, PNPLA3 p.I148M과 연관된 간 손상의 위험을 완화시킨다. 각각 PNPLA3 p.I148M 유전자형을 갖는 개체에서 HSD17B13 rs72613567과 ALT의 연관성(패널 A 참고). 각각 PNPLA3 p.I148M 유전자형을 갖는 개체에서 HSD17B13 rs72613567과 AST의 연관성(패널 B 참고). 효과 추정치(베타 및 95% CI)를 선형 회귀를 사용하여 계산하였고, 연령, 연령2, 성별, BMI 및 혈통의 4개의 주성분에 대해서 조정하였다. ALT 및 AST 수준의 연관성 분석에서 HSD17B13 rs72613567:TA와 PNPLA3 p.I148M 간의 상호작용에 대한 P 값은 각각 P=1.8×10-3 및 P=4.5×10-3이었다.
HSD17B13 rs72613567:TA와 간 병리학의 연관성
NAFLD는 상당한 염증의 증거가 없는 간 지방 축적(단순 지방증)에서부터 임상적으로 영향을 미치는 NASH까지의 범위의 질환 스펙트럼을 설명한다. HSD17B13 rs72613567:TA와 EHR-유래된 간 질환 진단 코드 간의 연관성을 확인하고, 지방증에서 NASH로의 조직병리학적 진행과의 연관성을 추가로 이해하기 위해서, GHS 비만 수술 코호트에서 연관성의 시험을 수행하였다. 비만 수술 시에 간 생검에 의해서 평가된 전체 엑솜 서열분석된 개체 중 2,391명의 이러한 코호트에서, 총 555명(23%)의 개체는 지방증, 지방간염 또는 섬유증의 증거가 없었고("정상"), 830명(35%)은 단순 지방증을 가졌고, 1006명(42%)은 NASH를 가졌다. 유전자형에 의한 정상 간, 단순 지방증 및 NASH의 유병률을 비교하는 경우, 각각의 TA 대립유전자에 대해서, 정상 간의 유병률은 유전자형에 의해서 달라지는 것으로 보이지 않았지만(T/T, T/TA 및 TA/TA 보유자에 대해서 각각 23%, 24%, 및 23%, 비율 경향에 대한 카이 제곱 검정(Chi-squared test)에 의해서 P = 0.5), NASH의 유병률은 감소되었고(T/T, T/TA 및 TA/TA 보유자에 대해서 각각 45%, 40% 및 31%, P = 1.6×10-4), 단순 지방증의 유병률은 증가되는 것을 관찰하였다(T/T, T/TA 및 TA/TA 보유자에 대해서 각각 33%, 35% 및 47%, P = 1.1×10-3)(도 17, 패널 A 참고). 지방증을 갖는 개체 중에서, TA 대립유전자는, 단순 지방증과 비교할 때, 대립유전자 용량-의존적인 방식으로, NASH의 유의하게 더 낮은 승산과 연관되었다(ORhet 0.87(0.71 내지 1.06), ORhom 0.48(0.33 내지 0.70), OR대립유전자 0.77(0.66 내지 0.90), P=6.5×10-4)(도 17, 패널 B 참고). 전체적으로, 이러한 데이터는, 단순 지방증에서 더 후기 병기의 NASH 및 섬유증으로의 NAFLD 진행을 매개하는 데 있어서의 HSD17B13에 대한 역할을 시사한다.
도 17을 참고하면, HSD17B13 rs72613567:TA는 도시된 바와 같이, 단순 지방증에서 지방간염 및 섬유증으로 진행되는 위험을 감소시키는 것과 연관된다. GHS 비만 수술 코호트로부터의 간 생검 진행된 2,391명의 개체에서 HSD17B13 rs72613567 유전자형에 따른 조직병리학적-특징규명된 간 질환의 유병률(패널 A 참고). 각각의 TA 대립유전자에 대해서, 정상 간의 유병률은 유전자형에 의해서 달라지는 것으로 보이지 않았지만(비율 경향에 대한 카이 제곱 검정에 의해서 P = 0.5), NASH의 유병률은 감소되었고(P = 1.6×10-4), 단순 지방증의 유병률은 증가되었다(P = 1.1×10-3). GHS 비만 수술 코호트에서, HSD17B13 rs72613567은 이형접합성 TA 보유자 및 동형접합성 TA 보유자 각각에서 13% 및 52%의 더 낮은 승산과 연관되었다(패널 B 참고). 승산비를 로지스틱 회귀를 사용하여 계산하였고, 연령, 연령2, 성별, BMI 및 혈통의 주성분에 대해서 조정하였다. 이형접합성(Het OR) 보유자 및 동형접합성(Hom OR) 보유자에 대한 유전자형 승산비를 또한 나타낸다.
HSD17B13 mRNA 및 HSD17B13 단백질 발현에 대한 rs72613567:TA의 효과
유전자의 공지된 전사물 및 신규 전사물의 발현에 대한 HSD17B13 rs72613567:TA 대립유전자의 효과를 조사하였다. RNA 서열분석을 사용하여 HSD17B13 rs72613567 스플라이스 변이체의 22명의 T/T 동형접합성 보유자, 30명의 T/TA 이형접합성 보유자 및 17명의 TA/TA 동형접합성 보유자로부터의 조직학적 정상 간 샘플에서 HSD17B13 mRNA 발현을 평가하였다. 2개의 HSD17B13 전사물, A 및 B에 더하여, 2개의 신규 전사물: 엑손 6이 결여된 전사물 C 및 엑손 6의 3' 단부에 구아닌 뉴클레오타이드의 삽입을 함유한 전사물 D를 식별하였는데, 이것은 단백질의 조기 절두를 초래한다고 예측될 것이다. 4개의 추가 전사물(E 내지 H)은 매우 낮은 수준으로 발현되었다(도 13 참고). 전사물을 RT-PCR 및 생어 서열분석에 의해서 검증하였다(데이터 나타내지 않음). D 전사물을 또한 긴 판독물 cDNA 서열분석을 사용하여 검증하였다. 이러한 전사물의 발현 수준은 HSD17B13 rs72613567 유전자형에 따라서 달라졌고; 각각의 TA 대립유전자에 대해서, 전사물 A 및 B의 수준은 감소되었지만, 전사물 C 및 D의 수준은 대립유전자 용량-의존적인 방식으로 증가하였다(도 18, 패널 A 및 패널 B). 전장 300개의 아미노산 단백질을 암호화하는 전사물 A는 T/T 동형접합체에서 우세한 전사물인 반면, 조기 절두된 단백질을 암호화하는 전사물 D는 TA/TA 동형접합체에서 우세한 전사물이었다. 인간 간 생검 조직에서, 절두된 아이소폼 D 단백질은 이형접합체 및 TA/TA 동형접합체에서 최소한으로 존재하였고, 아이소폼 A 단백질 존재비(abundance)는 대립유전자 용량-의존적인 방식으로 감소되었다(도 18, 패널 C 및 패널 D 참고). 이러한 데이터는 mRNA 스플라이스를 변경하여, 인간 간에서 실질적으로 감소된 발현을 갖는 절두된 단백질 형태의 합성을 초래하는 HSD17B13 rs72613567과 일치한다.
도 18을 참고하면, 신규 HSD17B13 전사물의 발현, 세포 이하 국지화 및 효소 활성도를 나타낸다. HSD17B13 rs72613567 스플라이스 변이체의 동형접합성 참조군(T/T), 이형접합성(T/TA) 및 동형접합성 대체(TA/TA) 보유자에서의 HSD17B13 전사물 A 및 D의 발현(패널 A 참고). HSD17B13 유전자 내의 암호 영역을 적색으로 나타내고, 비번역 영역을 두꺼운 흑색선으로 나타내고, 인트론을 얇은 흑색선으로 나타낸다. 전사물 D에서의 별표는 rs72613567로부터의 A 삽입을 나타낸다. mRNA 발현은 FPKM 단위로 나타낸다(단편/킬로베이스의 전사물/백만개의 맵핑된 판독물 단편). HSD17B13 전사물 A 및 D를 과발현하는 HepG2 세포로부터의 웨스턴 블롯. HSD17B13 전사물 D는 HSD17B13 전사물 A에 비해서 더 낮은 분자량을 갖는 절두된 단백질로 번역되었다(패널 B 참고). 새로 동결된 인간 간 및 HEK293 세포 샘플로부터의 HSD17B13 웨스턴 블롯(패널 C 참고). 인간 간 샘플은 HSD17B13 rs72613567 스플라이스 변이체의 동형접합성 참조군(T/T), 이형접합성(T/TA) 및 동형접합성 대체(TA/TA) 보유자로부터 기원한다. 세포 샘플은 비-태그화된 HSD17B13 전사물 A 및 D를 과발현하는 HEK293 세포로부터 기원한다. HSD17B13 전사물 D는 HSD17B13 아이소(Iso)A에 비해서 더 낮은 분자량을 갖는 절두된 단백질 아이소D로 번역되었다. HSD17B13 아이소D 단백질 수준은 인간 간(좌측) 및 세포(우측) 샘플로부터의 아이소A 단백질 수준보다 더 낮았다(패널 D 참고). 액틴에 정규화된 단백질 수준을 막대 칼럼으로 나타낸다; ** P<0.001, *P<0.05. HSD17B13 아이소폼 A 및 D 둘 다는 지방 소립막에 국지화되었다(패널 E 참고). HSD17B13 전사물 A 또는 D를 안정적으로 과발현하는 HepG2를, 지방 소립을 나타내기 위해서 BODIPY로 표지하고, HSD17B13 국지화를 나타내기 위해서 항-Myc로 표지하였다. 모든 도면을 동일한 정도로 확대한다. 척도 막대는 10㎛를 나타낸다. 삽도는 본래 영상의 4× 확대를 나타낸다. 17-베타 에스트라다이올(에스트라다이올), 류코트라이엔 B4(LTB4) 및 13-하이드록시옥타데카다이엔산(13(S)-HODE에 대한 HSD17B13 아이소폼 A 및 D의 효소 활성도(패널 F 참고). HSD17B13 아이소폼 D는 아이소폼 A에 대한 상응하는 값의 10% 미만의 효소 활성도를 나타낸다. G, HEK293 세포에서 과발현되는 경우 HSD17B13 아이소폼 D는 배양 배지에서 측정되는 경우 에스트라다이올(기질)에서 에스트론(산물)으로의 전환율이 크지 않았지만, 과발현된 HSD17B13 아이소폼 A는 강한 전환을 나타내었다.
인간 간 세포에서의 HSD17B13의 발현
HSD17B13은 간에서 주로 발현되고(Liu et al., Acta Biochim. Pol., 2007, 54, 213-8), 여기서 그것은 지방 소립에 국지화되는데(Su et al., Proc. Natl. Acad. Sci. USA, 2014, 111, 11437-42), 이는 지방간 질환의 발병기전에서의 역할과 일치한다. HSD171B3의 발현 및 이의 국지화를, HSD17B13 전사물 A 및 D를 발현하는 렌티바이러스가 안정적으로 형질도입된 불멸화된 인간 간 세포주에서 평가하였다. HSD17B13 아이소폼 A는 BODIPY-표지된 지방 소립 주변의 막 상에서 주로 검출되었다(도 18, 패널 E 참고). 유사한 세포 이하 국지화가 지방 소립 표면에서 HSD17B13 아이소폼 D에 대해서 관찰되었다(도 18, 패널 F 참고).
시험관내 및 세포 모델에서 HSD17B13 활성도에 대한 rs72613567:TA의 효과의 효과
rs72613567:TA로 인한 HSD17B13 단백질의 조기 절두의 기능성 결과를 이해하기 위해서, 아이소폼 A 및 D의 효소 활성도를 재조합 단백질을 사용하여 시험관내에서 평가하였다. 300개 초과의 추정 기질을 조사하였고, 이들 중 에스트라다이올, 류코트라이엔 B4, 및 13-하이드록시옥타데카다이엔산은 HSD17B13에 의해서 효소적으로 전환되어, 하이드록실의 케톤기로의 산화를 초래하였다. HSD17B13 아이소폼 D는 3개의 기질에 대해서 상당히 감소된 활성도를 나타내었다(도 18, 패널 F 참고).
GFP 대조군과 비교할 때, HSD17B13 전사물 A 과발현 세포는 세포 배양 배지 중에서 더 낮은 농도의 에스트라다이올 및 더 높은 농도의 에스트론을 가졌는데, 이는 에스트라다이올에 대한 효소 활성도를 시사한다(도 18, 패널 G 참고). HSD17B13 전사물 D 과발현 세포는 GFP 대조군 세포와 유사한 에스트론/에스트라다이올의 비를 가졌는데, 이는 HSD17B13 전사물 D가 유의한 기능 상실을 가짐을 시사한다. 질량 스펙 분석은, 소모된 에스트라다이올에 비해서 에스트론의 더 적은 축적을 고려할 때 에스트론의 하이드록시에스트론 및 다른 산물로의 신속한 전환을 나타내었다.
대규모 엑솜 서열분석을 통해서, HSD17B13에서의 스플라이스 변이체와, 감소된 혈청 트랜스아미나제 수준, 뿐만 아니라 후기 간경변 형태의 간 질환 및 HCC를 비롯한, 비알코올성 및 알코올성 형태의 간 질환 사이의 신규 연관성을 식별하였다. 본 발명자들이 아는 한, 이것은 간 질환과의 보호 연관성을 갖는 단백질-변경 변이체의 최초 보고이다. HSD17B13 rs72613567:TA 대립유전자는 단순 지방증과는 연관되지 않았고, NASH에 대한 진행 위험 감소와 연관되었다. 몇몇 상이한 간 질환 카테고리 및 민족성에 걸친 4개의 독립적인 코호트(DiscovEHR, DiscovEHR에서의 독립적인 비만 수술 코호트, DLS 및 DPLS)에서의 용량-의존적인 보호 연관성의 일관성은, 보고된 HSD17B13 변이체가 만성 간 질환의 보다 임상적으로 진전된 병기로 진행하는 것을 보호한다는 개념을 뒷받침한다. 관찰된 대립유전자 용량-의존성은 또한 HSD17B13 기능의 보다 강한 조절이 질환 위험 및 진행에 보다 강한 효과를 초래할 수 있다는 것을 입증한다. HSD17B13 rs72613567:TA 대립유전자는 또한 변이체 PNPLA3 p.I148M 변이체에 의해서 지방증 간 질환에 유전적으로 취약한 개체에서 간 손상의 위험을 완화시켰다. 이러한 발견은, HSD17B13의 치료 조절에 대한 중요한 하위 집단 - 변이체 PNPLA3 148M 대립유전자에 대해서 이형접합성이거나 동형접합성인 개체를 시사할 수 있다.
본 명세서에 기재된 연관성 발견은 주로 BMI가 높은 유럽계 및 히스패닉계 미국인에서의 관찰에 기초하였다. HSD17B13은 HSD17B13과 높은 서열 유사성을 갖지만 더 넓은 조직 분포를 갖는 동일한 유전자 패밀리의 구성원인 HSD17B11과 근접한다. 종합하면, 본 명세서에 제시된 데이터는 HSD17B13이 인간에서 지방간 질환의 예방 및 치료를 위한 잠재적인 치료 표적이라는 지위를 뒷받침한다. 본 명세서에 제시된 데이터는, HSD17B13의 표적화가 간 질환이 지방증에서 더 후기 병기의 NASH, 섬유증 및 간경변(이것은 심각한 이환율 및 사망률과 연관되며, 현재 효과적인 치료법이 없음)으로 진행하는 것을 감소시킬 수 있다는 것을 나타낸다.
실시예 4: HSD17B13 rs72613567:TA는 PNPLA3 I148M과 연관된 알코올성 간 질환 및 비알코올성 간 질환의 위험을 완화시킨다
지방증, 소엽 염증 또는 섬유증이 없는 대조군 공여자로부터의 29,928개의 인간 간 샘플의 HSD17B13 및 PNPLA3 유전자형을, 알코올성 간 질환을 갖는 환자로부터의 190개의 샘플 또는 비알코올성 간 질환을 갖는 1857명의 환자와 비교함으로써 HSD17B13 및 PNPLA3 유전자형과 간 질환의 연관성을 분석하였다. 95% 신뢰 구간을 갖는 HSD17B13 및 PNPLA3 유전자형의 각각의 조합에 대해서 (질환을 갖는 군의 발생률)/(대조군의 발생률)의 식에 의해서 승산비를 계산하였다. 도 19를 참고하면, 패널 A는 각각의 PNPLA3 p.I148M 유전자형을 갖는 개체에서 HSD17B13 rs72613567와 알코올성 간 질환의 연관성을 나타내고, 패널 B는 각각의 PNPLA3 p.I148M 유전자형을 갖는 개체에서 HSD17B13 rs72613567과 비알코올성 간 질환의 연관성을 나타낸다. 이러한 데이터는, PNPLA3 p.I148M이 알코올성 간 질환 및 비알코올성 간 질환 둘 다의 더 높은 발생률과 용량-의존적인 방식으로 연관됨을 입증한다. HSD17B13 rs72613567:TA 유전자형은 알코올성 간 질환 및 비알코올성 간 질환 둘 다에 대한 감소된 위험과 대립유전자 용량-의존적인 방식으로 연관되었다.
SEQUENCE LISTING
<110> Regeneron Pharmaceuticals, Inc.
<120> Inhibition Of HSD17B13 In The Treatment Of Liver Disease In
Patients Expressing The PNPLA3 I148M Variation
<130> WO/2019/075181
<140> PCT/US2018/055377
<141> 2018-10-11
<150> US 62/570,985
<151> 2017-10-11
<160> 66
<170> PatentIn version 3.5
<210> 1
<211> 19118
<212> DNA
<213> Homo sapien
<400> 1
agacagtacc tcctccctag gactacacaa ggactgaacc agaaggaaga ggacagagca 60
aagccatgaa catcatccta gaaatccttc tgcttctgat caccatcatc tactcctact 120
tggagtcgtt ggtgaagttt ttcattcctc agaggagaaa atctgtggct ggggagattg 180
ttctcattac tggagctggg catggaatag gcaggcagac tacttatgaa tttgcaaaac 240
gacagagcat attggttctg tgggatatta ataaggtaat gtatacatct tccaactttt 300
taaagtcaca gagtaagata tgtattttaa gaattatttg acttaccatc tacttatctt 360
tgtatttttg tttttcaaag tttgataaat tccctggtcc cttagtctgt atatgtgtca 420
ggttagttag atgaagggaa tgtaattaag aactaagcag cgatttttat gacatggtgt 480
gcaggttgat agaaagactc aggagccagt ctccttccaa gctgctaaat gaggcaagtc 540
acatattatc tctcagcctg ttttcttggc tctgaagtgg ggataataac ttaggggatg 600
ggcaagaacg ggatctgaaa attacagcta caaacaaaag tcaaacgaag aacttgcaac 660
agaaaccttt agtgcctccc ctcatgcaca agcaacacag ttctaaaata tttactgtct 720
gaccctttac agaaaatgtt tgccagtccg tagtcaaaag gattaaataa gtaatatttt 780
cagcacttag catatgataa acgatacgtg gcacatgata aacaataact gtgttaaata 840
aaatatgtgc gcagtgagtc aggcttttcc ttggacatta gtatttttcc tgtgttctta 900
cttgtaaaca ctacattaac aaccccaaat aaaactgaag gaactgaaat cttgtatcat 960
tttctctaaa cttgtaaatt ctggtaaggc catgaaaata tatgcagaga agtgtttaca 1020
ggattttagg attggaaaaa ttgtgaagta ctccttgaga atcacatttt ctgcaaatta 1080
cagtggtttt aattaccatt atattattac tttctcatgt tctttgctgt catgtttagt 1140
tgaaacctaa aatgtctctt acacttagag aactaattct tttctgtttt ttttctgaat 1200
agtgaagaat actatacaaa aaagctacta catttttatt taacagatat gagcatttat 1260
ataatagagg agttgatgta tataaaaatg atttgccatc tttttggtct ttgaagaaat 1320
tcgaatgaac tttctggaag atagcaagaa tttacaaata gagaaaattg ttgcctgctg 1380
ttctcaggca tttgtccaaa aatataaata agtataaatc tatgaaaagg gcttgatgaa 1440
atctaacctt caaatctctt tccagatgtg tatttttggg gaaagggcta tatttattaa 1500
gtttttttta aattttaaaa tttccagaga caagagaaaa gtaaattaga aggaagtcgt 1560
attaaaaatg acttaagggc gggtgcagtg gctcacacct gtaatcccag cactttggga 1620
gacggaggtg ggcagattgc tggagcccag gagttcaaga ccagcctggg cagcacagca 1680
aaacccccaa ctctacaaaa aatacaaaaa ttagctgggt gcgggggtgc acacccgtag 1740
tcccagctac tcgggaggct gaggtgggag gatcgtttca gttcaggaag ccaaggctgc 1800
aatgagctat gatggcatca ttgcactcca agctgggcaa tagagccagg ctctgtctca 1860
aaaaaaataa aaaaagactt aagaaaaata ggtaacccaa cctcaaaaat tctctttgaa 1920
tcattaaatt tcatggttaa acatttaagc tactgaatga ttcactctaa ggctgtaatg 1980
taactcagat ctcctttagg cgaggaagat gctggctgag ttttcatcat aactggctcc 2040
ttttgccctg tgagatgaga gacacagtag cagtttggct cttatgcaat ctaaactgtt 2100
gcgttgggaa tacggttcaa aaaacacatt ggagtttaag ctaaagcaag tgttttgcta 2160
acaaaaagac aaggcatcac attttgcaat tgtctagctc agttataaaa cagaagaata 2220
ggccggacgc ggtggctcac gcctgtaatc ccagcacttt gggaggccga gacgggcgga 2280
tcacgaggtc aggagatcga gaccatcctg gataacacag tgaaaccccg tctctactaa 2340
aaatacaaaa aaattagcca ggcgtagtgg cgggcgcctg tagtcccagc tactcgggag 2400
gctgaggcag gagaatggtg tgaacccggg aggcggagct tgcagtgagc cgagatgacg 2460
ccactgcact ccagcctggg cgacagagcg agactccgtc tcaaaaaaaa aaaaaaaaaa 2520
aaaactgaag aataattaat tcttcaatca aaacatctga tgaatgctct ggtaacttat 2580
gctctctact gacctagaaa caaatgagag agtatggtgt ggtttgtgca atctggcagt 2640
gagcaagcta ccaactaaat cagtgaaaga ctctcctatt ctttttttac tcttctgcaa 2700
tcccacaaaa ggctatttga ggggatactg actttgagac tgggtcctaa catccatgtt 2760
tggggagttc aggctgctgc tccagggttt agcctacagt agcgaaatac aaaggaccca 2820
gagaccactc attcaaggtt tgccctaaat agcagcaaca ccactgtcat ctcaatacac 2880
gaagaatagg gcttttcagg tatccttgcc tctttgtcac agagaagagt ttacagattg 2940
tgagacggaa aagtataatt tttaaaacct tataatattt tctataaaag tcacctgagg 3000
tgaaaacttg aaaagaatta taattttcca gaatgtgagt caagaaacat tagagcaatt 3060
ttatcttagg aaagaggtct ttgaatttag gctgaaagta aattgctctg tctccatgtc 3120
ctatggttat gggcaagttt ggtacataaa tgagaaatcc atccagtggc cttgcccatc 3180
tcactcccaa acacctgaag aatgtaatgt tatatctcct agagtagcag catggtctcc 3240
ctatgaaagt ccttcttctt taaggagact tctttccctt ccctcctagg aggatgagtc 3300
agaatcatca agaaaaatat gatgggcaga ggcatacagt ttaccattac cactagttta 3360
gaattactac ttagcacttt actgcctatt acatagttgg tgctcaacaa atgtatgata 3420
aattaatggt tgagtttttc tttcttctcc atattcatct tccatgacac cacgaagagc 3480
aatgtttttc aagaatgttc ttcaaggttt gaaagtagcc tgctttagag aaactgccta 3540
ctgtacagcc tccaaccaag aggaaaagct gaaaaaagca tgaagggatt ttgttttgtt 3600
ttgtttgttt tggttttaat atgagcattc cctggcagaa aagccagggg taatctcatt 3660
gcaactaggc aatcactctc aagaaatttt ctaacaaata aggaggccaa tttttatttt 3720
attttgagac gaagtcccac tctgtcaccc aggttggagt gcaatggaat gatttcagct 3780
cactgcaacc tccgcctccc gggttcaagt gattctcctg tctaaacttc ccgagtagct 3840
gggattacag gctcccacca ccacgcccag ctaatttttt gtatttttag tagagatggg 3900
gtttcaccat tttggccaga ctggtctcaa actcctgacc tcaagtgatc caccctcctc 3960
ggcctcctaa agtgctggga ttacaggcgt gagccaccac acctgaccca ggaggccaat 4020
ttttaaaagg ttaactaatc ttcatgtcca aaatgaatgt taattgttca ttttggacat 4080
gaatgttaat tttttttttt tttttttttg agacagagtc tcactctgtt gcccaggctg 4140
gagtccagtg gcactatctc cactcactgc aacttcctcc tcccaggttc aagcaattat 4200
cctgcctcag cctcccaagt agctgggatt acaggcccac accatcaggc ctggctaatt 4260
tttgtatttt tagtagagac ggggtttcac catgttggcc aggctggtct tgaactcctg 4320
acctcgtgat ccgccctcct cggccaacca aagtgctggg attacaggcg tgagccaccg 4380
cgcctagccg aatgttaatt gtctaaaaat ttttcttctc caatgtcttc tcctccactt 4440
ttttcggaat ttgtttcttc ctaattacag cgcggtgtgg aggaaactgc agctgagtgc 4500
cgaaaactag gcgtcactgc gcatgcgtat gtggtagact gcagcaacag agaagagatc 4560
tatcgctctc taaatcaggt gagactgcag gttcacaaat ttcttcagat tattttgttt 4620
cctaggacgc tgacgtggaa aatgagaaag gtctttatga ctgcctgatt taaattggat 4680
tttagctgct aactgaagta gttatgtcac caaggaagga tatatacttt ttttcttgta 4740
tgtaatccac tcagctctgc ccattattat tgttcatatt attaatcaat ttcattctga 4800
tcagaagtgt gagcagtggc acagagtgac tgacaaaaga tttatcatca gggaatatgg 4860
atcacttcct agttttgttt tagtcctatt aactttgcag taattccagc ttctctttaa 4920
ttatttccct tgtgagattt tattttggtg ttaatgtagt cttctgtaga aaatgtaata 4980
ttaataatta ttatcacaat tattttaaaa gagtaaatac caaataatca caatgaacta 5040
agcactctaa caaactttac attttttaat tcaatcccta caataactct gtaaacttca 5100
ttttacagat aagcaaatta tgactcagag aggttaagcc agacccaggt catgtagtta 5160
ttaggttatg aaaccaggat ttctcaacca gcactttaga ccaggtgcgg tggttcacac 5220
atgtaatccc agcactttgt gaggccaagg tggaaggatc acatgagacc aagagttcaa 5280
gaccagccca ggcaacatag tgagacccta tctctaaaaa aaaaaaaaaa aaaaaaaaaa 5340
aaagtttaaa gaaaaacaca tttttaaaaa atgaacactt taaaaatatt tggtcagaat 5400
ttatatagga atttatcaac ataaatgtta atttcacttt actgataaac ttgcaaaaca 5460
tgatgtgctg ggtactgaaa tttagatgtt aaaagaacag tttatcccac ctttatgaca 5520
gtgttccctt ggcctccacg atttgagctc aacagtctgt cttgcctgaa ctctgagaga 5580
cctcatacaa tagaagaaag actctcatct ttggattata ttggtcccaa aactttgagt 5640
ttgaataata cacccagtga aagtgttctt tcaatttcaa aaggtgaaga aagaagtggg 5700
tgatgtaaca atcgtggtga ataatgctgg gacagtatat ccagccgatc ttctcagcac 5760
caaggatgaa gagattacca agacatttga ggtcaacatc ctaggacatt tttgggtgag 5820
tgtgagtcag aaacatttct gatttgtgca ccttctctta agatacatga aacttataac 5880
ggagttcaca tacttctgga caggaaactg gccagatctt tgccttaatc aagaatcatt 5940
aaatttgttt gagtagaaga gccacagagt ctctgacaca aggacacaga attcaagtgg 6000
acacaacaca ccagaatgta agctacttgg tctgtcttgt ccaccagtat ctgacacaaa 6060
gcttggcatg taccaggagc tcaacaaatg tttgtggagg tttgttaagg gttgtcagtg 6120
tacatctttt caatgctgtc acttgtgact tcattttttt ccctccacac catgattttg 6180
taatgtgtcc tcattttgtg gaattttaga atggaaagga catcagaagt aattacttgg 6240
atgtatatag gatcgaggac acttttggac gagactctga ggcaagtgtt ctagatccat 6300
ggggtgctgg aactgagaaa tgcagctata cagacctcat ataattggtt agttttgtgg 6360
gagatggaaa tatcaacttc aactgccttt gtatagaaat ttttatgatt aatcttccag 6420
tgcctcaata ttagtgtaga atctagggca gatctggatt ctagaagaaa gaagaaaaaa 6480
aagagatgtg tcccccttac ctttaccagc tcttcacata tgtgaattgg ctcccatgcc 6540
caccaaacta cacggagacc tcatacatta gctacctata gctgcataac aaattataca 6600
aaacttagtg gtttaaagca acaatgtatg ttcactatcc tctcacagtt tctatgggtt 6660
gggaatttgg aggtagcttg ggttgggagt tctagttcta tgaatttgca taggatttat 6720
taaattctta taaaatttta ttgatgtttc tcacaaaaga ggtttttgga aaaaaagaaa 6780
gacttgtttt ctgtaacatc aacatataat atacaatatt acaaataggg agatagtgaa 6840
ttcaatcatg attcattagt gtggtgtaga actctcagct tacactactc aactgtctta 6900
atacagttac acaagatttc actcttttaa ttagaatgat aaagccccaa accaaaaaat 6960
tatatgacac caaattatca taaggaataa ttttagttct gaaaactctg aatttttccc 7020
ttaatattgt ttagatgaca tatccaaaaa aggatctatt tgattccttc tgaagggaag 7080
gagggggagt actgagatta gtgttggcat ggggcttacc ataccaataa atttgtatct 7140
ttatttctat catttgtaaa gaattaatca tggaatgctt ggaagtattt tatttcattg 7200
tataagttct ctcaaatgcc tttctgtctt aacaaaaata aaactacctg atttggaaac 7260
ctaacgtcta tgtcattgtc tttcttcttt ctgcaatgat ccttaagatc acaaaagcac 7320
ttcttccatc gatgatggag agaaatcatg gccacatcgt cacagtggct tcagtgtgcg 7380
gccacgaagg gattccttac ctcatcccat attggtaagt atcacatgcc agccatgtta 7440
tatattttta tactttgaag ggagcattac acttcaaatt gttaccactg gagagtcctg 7500
gttcttggca tcttgaacaa agaattggac aaaactcacc aacaaagcca ggaaagaatg 7560
aagcaacaaa agcagagatt tattgaaaat gaaagtacgc tttacagggt gggagtgggc 7620
ccaagcacag gggctcaaga gccaattaca gaattttctg gggtttaaat accccctaga 7680
ggtttccact ggttacttgg tgtacgccct atgtaaatga agaggatgaa ttaaagttac 7740
agagtcgttt actcagtgta caccatatgt aaatggagag gatatttcct gtcatagctg 7800
gagtgtttcc atttgattta gttctaggaa gtcagcatga atcggcctta tgttccctgc 7860
ctccagaccc tgttctcctg cctcaagatt acaatgctga gagcagagtg atttggattt 7920
acagaattta aatttatagt agtttagaat gattttttaa atgacttttt ctaaaacaat 7980
gaaaccaggt tgtaattata tttaagatat ttttagattt ctgcaaactc ctctgtagaa 8040
caatgagaga aaacagtaat gccaagcatg tttccattgt ttcctggaat aagaaacaga 8100
aaccccacag actgagaagc aaaacctaca gaagctaaaa tgaacacatg tctatgtcat 8160
ggccttggtg cccaagataa gacaatcaga gtggtccctg gatcaaaaca ttttacagtg 8220
tgcttgtgcc atgaaagtgt gtgtgtgtgt gtgtgtgtgt gtgtgagaga gagagagaga 8280
gagaaaacga ctctacctga ctaaaagttg cagataccac actccatgca ccaccaaaga 8340
cataaaggga aggaggtgag aggcgttaag gatgtactgc tgtatttgcc aaatatcctt 8400
tcctgtaaac tcttctccag atcctcataa taaaattaag aggccaaagt ggcaaccatt 8460
gtcaagagaa aaactatcaa ccattgtcaa gagaataact cagttattga gagagagagg 8520
agaaatgagc agagtcctac agaagtctgt caacacagat accagttttg tagaatttct 8580
aaatgtattt ttcctgattc atatttttca aaataaaagc agcaataaaa actgattaga 8640
aaacagtttg aagattcaat ggaaaaacct tacatgtagg atggaaaact gaacattaag 8700
ccaatcaata gagttatttt tgttcttttg ttatcattgt tgtttaagaa atgagatacg 8760
ttcacaattc tgcttaatca tgtaagaaaa tgaaaatgaa ttgccattta tactctcaga 8820
aaaatcacaa gtggctgatt tttggcttcc acttgttctt aagccaaatg ataccgcctt 8880
ctcacagaaa gctgaggatt ggtttcactc tcccttagct aacaatgctt aataattctc 8940
ttacagttcc agcaaatttg ccgctgttgg ctttcacaga ggtctgacat cagaacttca 9000
ggccttggga aaaactggta tcaaaacctc atgtctctgc ccagtttttg tgaatactgg 9060
gttcaccaaa aatccaagca caaggtaagg tcaaaatcaa gttagaatgg gtatgtggta 9120
tgataaattg atatgaaaac taatgagaaa tgtttaggca ggccaactaa tagaagaaaa 9180
tgaagaagga aaaataattt ttcttattat tattattatc ttgaaattaa aggaataaag 9240
ggggaaaaca cattagggac tagcaggaat gatcagccac cgatgaactg ggatatttat 9300
ttgtgtccgg gagaaagcac atacatttga tcaccgttac caccctgtct ttaaaatgca 9360
aatgttccaa ggaccagcaa ataaattgag tatctagctc cttagtcaag gtgaatttct 9420
gcaagaactc ttgtctctgg tgagacagga tttgagacca caagagaaga aaaattagtc 9480
ctgaaaggag aagaaaaaag caggaaggtg tggataagaa cccgaaaatt aagccatctg 9540
cttaacaaat ttttctaatc ctagtatata ttctgctgca ggttaacaaa atatactaag 9600
cttaatgatt cgaaaccaat tttttactgg aagggaatta atcctaaata tattcattca 9660
aaagaactaa acaattctct gttgagtgcc gcctcatttg aggatactga ctcttacagc 9720
ctgagttagc tatgtggtct ctgcagctgg aatcactccc tgccactgga gtccttcatg 9780
gtgttagacc ataggtactg ttgactaaag aaaaaaaaaa gtttttgttt ttatttttgt 9840
tttttttgag acagagtctc actctgtcac ccaggctgga gtacagtggc gcgatctcag 9900
ctcaccgcaa cctccgcctt tctgggttca agcaattctc cttcctcagc ctcctgagta 9960
tttggattac aggcgcccac caccacgcct ggctaatttt tgtattttta gtagagacgg 10020
ggtttcacca tgttggccag gctggtctca aactcctgac ctcaggtgtc ctacctgcct 10080
tggcctccta aaatgctggg attacaggag tgagccacca tgcccggcca aaaaaataag 10140
tttttaaaga attaaaggtc atcctggcta acacagtgaa accccgtctc tactaaaaaa 10200
cacaaaaaaa ttagccgggc gtggtggcgg gcgcctgtag tcccagctgc gcgggaggct 10260
gaggcaggag aatggcgtga acccgggagg cggagcttgc agtgagccga gatcgcgcca 10320
ctgcactcca gcctgggcga cagagcgaga ctccgtctca aaaaaaaaaa aaaaaaaaaa 10380
aaaaaaaaga attaaaggtg ttaattttat ttagaagcct tactgaagac tacagtcgga 10440
ggcctatagc ctgagagcag ccctttagag aggttcagtt gaactgttct gatagtgggg 10500
gccatgtgct ctatcctgta ttgtcttcaa agcatctttc cagagagctg cacattgtca 10560
cagagtcagg gactttgtga aattatgctg acaaccagaa gtgagtaaac gtggcttctt 10620
acatttgcta cgttgtctca cagtacttaa taagtatgca atatgtaagt aaatactata 10680
gtactattgc aactcctgat tgttttctta gacaaggaat tgggcccaat aaaaaccctc 10740
ttggtaggca ttcaggcttc gtgtaccatg agctttccta agggtatcct gccactcttg 10800
gggaaggcat gatagatgag gggagtaagg ataatggaac tctgggtaca gggttcctgg 10860
gggctaactt agaggtagac acaggcaatg ctaaatattt gggattgatt ttatagaggt 10920
tgctagattg tgaatttcct tagtaagggc taaggcattg atatgtaatg tcacacttgg 10980
ctccgaggct gggttgttgg atccatgtag atgaaatcag ggagagaaag ggcagaacgg 11040
agtaatttag aaatgtattg atttgtatta ctctctgttg gcttgctatt caaggcagtg 11100
gagaactcaa tcacataata atctgcagca aaccacagat catcccaggg aatgaagttt 11160
taacattcgc tggctcccta actcctcacc cagcctttac attcactggc tgttcagtcc 11220
atgcctggac atcttaattt gaatacaaca ttttaaatcc atttttctgt catcatcttg 11280
cactaacaga caattctaca ctaagcctat gtttatgaat atttctcaag agtacatgta 11340
cacagccttc agtataagga aaactggaag tatgacatac ctccagttgt catactcctt 11400
gggcccctct taaattctca ttaaactgca ggataggcaa gtcagaggtg aatctcaaat 11460
acgaaattct taccggaaag gggttccaat ccagacccca agagagggtt cttagatttc 11520
tcgcaagaaa taattcgggg caaggccaca gtgcaaagca aaagcaagtt tattaggaaa 11580
gtaaaggagt agagaacagc tactccatgg agaagaatgg cttgagctgc tccaccaagg 11640
gtatttagag ttacttcttg attatatgct aaacaagggg tggattattc atgagttttc 11700
cgggaaaagg gtgagcaatt cccagaactg agatttcctc ccctttttag gccatatagg 11760
gtaacttcct gccattgcca tggtatttgt aaactgtcat agtgctggtg gaagtgtctc 11820
ttagcttgct aatgtattat agttagctta taatgagcag tgaggacaac cagaggtcac 11880
tttcatcacc atcttggttt tggtgggttt tggccggctt ctttactgca ccctatttta 11940
tcaacaaggt ctttatgacc tgaatcttgt gccaacctcc tatctcatcc tgtgacaaag 12000
aatgccttaa cttcctggga atgcagccca gtaggtgtca gccttatttt acccagaccc 12060
tattcaagat ggagttgctc tgatttaaac gcctctgaca aaatgacgac ctcaaaacaa 12120
tccagcttta tggaatacct ccacaagaaa gaaagtatac ttagctatag aattttctcc 12180
ttgcatccaa caggctttga gatgtcagat gtttccttcc tgtcccatga ttaatcctag 12240
ccattcctct ttcttgtctg gctccactac tccttaccat ctaatgcctc gccaccattt 12300
tgatattttg actaagtgag ctatgaaaca cacctactgg atatgaaagt ataagtttct 12360
gataacaaaa catcaacatg ggatgtggag gaagtgggta gggtggcatt aatgcagcaa 12420
atcctggaat attttaaatc ttcattctaa atttagtaaa aatataggat aattttcctg 12480
ccatcattta cttataaaat taaaatttta gaaaataaaa ataatatttt cctcttttta 12540
atcacagatt atggcctgta ttggagacag atgaagtcgt aagaagtctg atagatggaa 12600
tacttaccaa taagaaaatg atttttgttc catcgtatat caatatcttt ctgagactac 12660
agaagtaagt acagcacaga acacccaaat actaaaacac caatagagct tttttttttg 12720
cttttttttt ttttagacag agtctcactc tgtcaccctg gctggattgc ggtggttgca 12780
gtggcatgat cttggctcac tgcaacctcc gcctcctggg ttcaagcaat tctcatgcct 12840
cagaccccca agtaactggg attataggtg tgtgctgcca cactacaccc agctaatttt 12900
tgtatttttt gatagagaca ggtttcccca tgttggccag gctggactcg aactcctgac 12960
ctcaagttat cctcctgtct cggcctccca aagtgctggg attacagtca tgagccacca 13020
tgcctggccc aatagagcta ttattatgga gcatctttca gttgtgaaaa ttggcatgga 13080
aactctccat ccctggggag aacagttatt tcctctgtta ttttcctacc cagtctataa 13140
aaagagagtg attcattttc tctaccaaat ctactgtctc tgcccaaact ttgctgaaga 13200
ctattctaac taaaggaaac acagtttaaa aagaatgcaa tatagtgaag tagttaataa 13260
taaagactcc atttttaaaa gtctgctgga agtttggttg ggattgcact gaatctatag 13320
agcaattggg gagtattgac atatcaacaa tattgagttt tctaatccaa gaacataata 13380
tctattttta aaatcttctt caaaatcttt aaatctttaa attgtatttt gtagtttttg 13440
gtgtttaagt cttgcacata ttttgtcaga tttattccaa agtatttcac gggttctttt 13500
tttttttttt tttttttttt ttgagacaga gtttcaccct tgttgcccag gctggagtgc 13560
agtggcgtga tcttggctca ctgcagcttc tgcctcctgg cttcaagtga ttctcctgcc 13620
tcagcctccc aagtagctgg gattacaggc acctgccccc tcgcccaact aactttttgt 13680
gtttgtagta gagacagggt ttcaccatgt tggccaggct ggtctcgaac tcctgacctc 13740
atgtgatcca cctgcctcag cctcccaaag tgctgggatt acaggcatga gccatcatgc 13800
ccagccctat ttgacggttt ttgacgctaa tgcaagtggc attttaaaaa attttatatt 13860
tcccattgtt tgttgtcagt atatattgga tttttgtaat ttgatctcat attttgcagt 13920
cttgctaaat tgctaaacct ctttttgcta aactcgataa gctttttttt ttttggtaga 13980
ttcctgggcc tctaattttc tttatgggaa agtttttaat tacaaattta atttctttaa 14040
tagctacatg gctattcaat ttacttatta attcttggta atgtgtgtct ttcaaggaat 14100
ttgtccattt catctaagtt gtagaatttc tttggcataa atttgtacat aacattccct 14160
tattatcctt ttaatgtctt tagaatgtct tatttattta tttatttatt tttattatat 14220
ttttttgaga cagagtctcg ctctgttgcc caggctggag tgcagtggca caatcttggc 14280
tcactgcaag ctccgccttc tgggttcatg ccattctcct gcctcagcct ccctagttgc 14340
tgggactaca ggcgcctgca accatgccca gcttattttt tttttttttt tttttttttt 14400
tttttttttt tttttttttt tagtagagac ggggtttcac cctgttagcc aggatggtct 14460
cgatctcctg acctggtgat ccgcccgcct cagcctccca aagtgctggg attacaggcg 14520
tgagccacca agcccagcct atttatttat ttagtagaga cagtctcact ttgctgccca 14580
ggcaacaaag gttttgaatg cctggcctca agcagtcctc ctgccttggc ctcccaaagt 14640
gctgggatta caggcatgag ccactgcacc tggccaaatg aatatgctga taatatcttc 14700
tttataagga tgacataaga ataaaataat gtaatacaaa caaagcccct gtcactgaaa 14760
atgtatagac ttcaaatgtt aaagtcttag agaacagaat ttatatgaaa tagcaacagc 14820
aacaatttcc cagaggaaat actctctcag ctttcttctg aggagcagtt tctaaattga 14880
aattgtatca gtgagaagat aactatacta acttcataag ccttgggcct ttttgaaaca 14940
aatccatata aactatgaac aaacttgaaa tagaacaatt tgagaacagg gtacaaactg 15000
cattggtgta tcaatttcag tatttggttt tagcttaaat agactgactt gagataacat 15060
aaggagaacc ttgaccccca agcaacatca tctcgcgagt tgactaggcc gggtgtggtg 15120
tctcacgcct gtaattccag cactttggga ggccacagca ggcagatcac ttgaggtcag 15180
gcattcgaga ccagcctggc caacatggtg aaacctcagc tctactaaag atacgaaaat 15240
tagcaggcat agtggcctgc acctgtaata ccaggcactc gcaggagaat cccttgaacc 15300
cggaaggcgg agattgcagt aaaccatgat tgtgccactg cactccagcc tgggcaacag 15360
gagactctgt ctcggaaaaa taaatttttt aaaaaaatga aaaaaaataa aagttgacta 15420
aattagtgtc ttggtactaa gcactgtagg aagtgagttt catggaaccc caactctctt 15480
ggggcccaaa gcaagtcata ttaatattga aaattacatg catatacatg catatgacca 15540
aggtgataaa aacaattatt ctgcctgagt tggagaatag tatcccagta aaataaacaa 15600
gagtctcaaa gtcttttgta tcctttgaag ctgtcatggt ggtttgtaac taggcaacag 15660
gtatatattg ttaatcttct ttgcatttaa ttccttttat agagagacac aattttacga 15720
gcagatgcaa ttactagcat gaaggtttct ttgtgagggt agttaaaagg cccacatgag 15780
ctctcttctt atccttgtcc ttctttcagc cagatcttcc ctgccccttt gctcattcca 15840
tctttcaccc acctaccccc aaaacaagga agtaaatctt gcattagtca acaataccaa 15900
agtgattttc aatatgactt tctctgcaga atgttattat ttctgcctct ttacattcac 15960
atactgtctt cctttttttt tttttttttt tttttttttt tagattgggt ctcactctgt 16020
tgcccaggct ggagtgcagt ggcttgatct cagctcactg taacctccac ctcctgagtt 16080
caagcaattc tcctgcctca gcctcctgag tagctgggat tacaggcatg tgccaccaca 16140
cctggctagt ttttttgtat ttttagtaga gacagggttt caccatgttg gtcaagctgg 16200
tctcgaactc ctgacctcat gatctgacca cctgtgcctc tcaaagtgct gggattacag 16260
gcgtgagcca ccgggccagc cactctcttc ctttcagttg cctactcatc tcttatgcat 16320
tcctggacat cagttgtcct tttgaagctt tcctccacta tcccagccca tgtgaatcct 16380
ccttccagtt atagccctta attctagatg gctgatattt ttcaataatt gttttaagat 16440
gaccatttta gcctatcagc taaacaatat caaagacaat agctattttt caagtacttt 16500
agtttacctt attatagagt gcataataga tattcagtaa atagtaaagg agaggtgaag 16560
gcttgcatag aatggattct ggtggtgtct cttggtgagc ttttagcatc aagattaatc 16620
agcagtttca gcaatgagct cagaccttca gttttagatc tttactcata tcagataaga 16680
gagtgagaag agtggtatgt atcagtgctt tatttatatt tgcatccaat ttgaactatg 16740
aatattacaa aggtgcacac ataggttcag acagattgat ttaaaatgac caaagatgac 16800
ctgtcgtaag caacctgggt atcttaagat gcactccttg gagagggaat gttcctaaaa 16860
acattttcag agggacgaac tgtatgaaat tcagtaaaac ataaatcatg aggaaaactg 16920
attactctct ttttgacatg aaatgagagt tttaatgcat ggttacgatt attaacgtac 16980
tccgctgcaa gacgttaata aagttactgt tttgcaggct agaatgtctt gatgctgtaa 17040
tcagaacaca ctttttcccc tttcttccag cttcaaatgc agattcataa ttgggctgac 17100
ttctaataac tgcaatgttt tctgccttgg gcttgcagca gaagcctgac aaaatagtgt 17160
ttgtttaggc aataatttat ttatttattt attgagatgg agtttcattc ttgtcgccca 17220
ggctggagtg caatggcgtg atctcggctc actgcaacct ctgtgttcag gcaataattt 17280
agactttacc ttacttgtga ttactatagc aattactata gccacaaggc ataattttac 17340
tgtctcattt caattttatg aatttgaatg tttttacact tttcctaatg aagtccacta 17400
tgaagttatg tcaaaaaaaa aaaagaaaaa gaaagatgca cacgtaaaag agaggtggtt 17460
gcaagagaag aaaagaacgg aggaaagtta aacgcaaacc agataactct cagcgtattc 17520
taaatgacca aaaacagaac tctgttgtca aagattttaa atggaaaatt tttcaatttt 17580
tttttctttt ttgtacaggt ttcttcctga acgcgcctca gcgattttaa atcgtatgca 17640
gaatattcaa tttgaagcag tggttggcca caaaatcaaa atgaaatgaa taaataagct 17700
ccagccagag atgtatgcat gataatgata tgaatagttt cgaatcaatg ctgcaaagct 17760
ttatttcaca ttttttcagt cctgataata ttaaaaacat tggtttggca ctagcagcag 17820
tcaaacgaac aagattaatt acctgtcttc ctgtttctca agaatattta cgtagttttt 17880
cataggtctg tttttccttt catgcctctt aaaaacttct gtgcttacat aaacatactt 17940
aaaaggtttt ctttaagata ttttattttt ccatttaaag gtggacaaaa gctacctccc 18000
taaaagtaaa tacaaagaga acttatttac acagggaagg tttaagactg ttcaagtagc 18060
attccaatct gtagccatgc cacagaatat caacaagaac acagaatgag tgcacagcta 18120
agagatcaag tttcagcagg cagctttatc tcaacctgga catattttaa gattcagcat 18180
ttgaaagatt tccctagcct cttccttttt cattagccca aaacggtgca actctattct 18240
ggactttatt acttgattct gtcttctgta taactctgaa gtccaccaaa agtggaccct 18300
ctatatttcc tcccttttta tagtcttata agatacatta tgaaaggtga ccgactctat 18360
tttaaatctc agaattttaa gttctagccc catgataacc tttttctttg taatttatgc 18420
tttcatatat ccttggtccc agagatgttt agacaatttt aggctcaaaa attaaagcta 18480
acacaggaaa aggaactgta ctggctatta cataagaaac aatggaccca agagaagaaa 18540
aggaagaaag aaaggttttt tggtttttgt tttgttttgt tttgtttttt gtttttttga 18600
gatggagtct cactctttcg cccaggctgg agtgcagtgg tatgatctca gctcactgca 18660
agctccacct cccgggttca cgccattctc ctgcctcagc ctcctgagta gctgggacta 18720
caggcgcccg ccaccacacc cggctaattt tttgtatttt ttgtagagac ggggtttcac 18780
catgttagcc aagatggtct cgatctcctg acctcgtgat ccacctgcct cggcctccca 18840
aagtgctggg attacgggtg tgagccaccg tgcccagcct tttttttttt aatagaaaaa 18900
ataatccgac tcccactaca tcaagactaa tcttgttttg tgtgtttttc acatgtatta 18960
tagaatgctt ttgcatggac tatcctcttg tttttattaa aaacaaatga tttttttaaa 19020
agtcacaaaa acaattcact aaaaataaat atgtcattgt gctttaaaaa aataacctct 19080
tgtagttata aaataaaacg tttgacttct aaactctg 19118
<210> 2
<211> 19119
<212> DNA
<213> Homo sapien
<400> 2
agacagtacc tcctccctag gactacacaa ggactgaacc agaaggaaga ggacagagca 60
aagccatgaa catcatccta gaaatccttc tgcttctgat caccatcatc tactcctact 120
tggagtcgtt ggtgaagttt ttcattcctc agaggagaaa atctgtggct ggggagattg 180
ttctcattac tggagctggg catggaatag gcaggcagac tacttatgaa tttgcaaaac 240
gacagagcat attggttctg tgggatatta ataaggtaat gtatacatct tccaactttt 300
taaagtcaca gagtaagata tgtattttaa gaattatttg acttaccatc tacttatctt 360
tgtatttttg tttttcaaag tttgataaat tccctggtcc cttagtctgt atatgtgtca 420
ggttagttag atgaagggaa tgtaattaag aactaagcag cgatttttat gacatggtgt 480
gcaggttgat agaaagactc aggagccagt ctccttccaa gctgctaaat gaggcaagtc 540
acatattatc tctcagcctg ttttcttggc tctgaagtgg ggataataac ttaggggatg 600
ggcaagaacg ggatctgaaa attacagcta caaacaaaag tcaaacgaag aacttgcaac 660
agaaaccttt agtgcctccc ctcatgcaca agcaacacag ttctaaaata tttactgtct 720
gaccctttac agaaaatgtt tgccagtccg tagtcaaaag gattaaataa gtaatatttt 780
cagcacttag catatgataa acgatacgtg gcacatgata aacaataact gtgttaaata 840
aaatatgtgc gcagtgagtc aggcttttcc ttggacatta gtatttttcc tgtgttctta 900
cttgtaaaca ctacattaac aaccccaaat aaaactgaag gaactgaaat cttgtatcat 960
tttctctaaa cttgtaaatt ctggtaaggc catgaaaata tatgcagaga agtgtttaca 1020
ggattttagg attggaaaaa ttgtgaagta ctccttgaga atcacatttt ctgcaaatta 1080
cagtggtttt aattaccatt atattattac tttctcatgt tctttgctgt catgtttagt 1140
tgaaacctaa aatgtctctt acacttagag aactaattct tttctgtttt ttttctgaat 1200
agtgaagaat actatacaaa aaagctacta catttttatt taacagatat gagcatttat 1260
ataatagagg agttgatgta tataaaaatg atttgccatc tttttggtct ttgaagaaat 1320
tcgaatgaac tttctggaag atagcaagaa tttacaaata gagaaaattg ttgcctgctg 1380
ttctcaggca tttgtccaaa aatataaata agtataaatc tatgaaaagg gcttgatgaa 1440
atctaacctt caaatctctt tccagatgtg tatttttggg gaaagggcta tatttattaa 1500
gtttttttta aattttaaaa tttccagaga caagagaaaa gtaaattaga aggaagtcgt 1560
attaaaaatg acttaagggc gggtgcagtg gctcacacct gtaatcccag cactttggga 1620
gacggaggtg ggcagattgc tggagcccag gagttcaaga ccagcctggg cagcacagca 1680
aaacccccaa ctctacaaaa aatacaaaaa ttagctgggt gcgggggtgc acacccgtag 1740
tcccagctac tcgggaggct gaggtgggag gatcgtttca gttcaggaag ccaaggctgc 1800
aatgagctat gatggcatca ttgcactcca agctgggcaa tagagccagg ctctgtctca 1860
aaaaaaataa aaaaagactt aagaaaaata ggtaacccaa cctcaaaaat tctctttgaa 1920
tcattaaatt tcatggttaa acatttaagc tactgaatga ttcactctaa ggctgtaatg 1980
taactcagat ctcctttagg cgaggaagat gctggctgag ttttcatcat aactggctcc 2040
ttttgccctg tgagatgaga gacacagtag cagtttggct cttatgcaat ctaaactgtt 2100
gcgttgggaa tacggttcaa aaaacacatt ggagtttaag ctaaagcaag tgttttgcta 2160
acaaaaagac aaggcatcac attttgcaat tgtctagctc agttataaaa cagaagaata 2220
ggccggacgc ggtggctcac gcctgtaatc ccagcacttt gggaggccga gacgggcgga 2280
tcacgaggtc aggagatcga gaccatcctg gataacacag tgaaaccccg tctctactaa 2340
aaatacaaaa aaattagcca ggcgtagtgg cgggcgcctg tagtcccagc tactcgggag 2400
gctgaggcag gagaatggtg tgaacccggg aggcggagct tgcagtgagc cgagatgacg 2460
ccactgcact ccagcctggg cgacagagcg agactccgtc tcaaaaaaaa aaaaaaaaaa 2520
aaaactgaag aataattaat tcttcaatca aaacatctga tgaatgctct ggtaacttat 2580
gctctctact gacctagaaa caaatgagag agtatggtgt ggtttgtgca atctggcagt 2640
gagcaagcta ccaactaaat cagtgaaaga ctctcctatt ctttttttac tcttctgcaa 2700
tcccacaaaa ggctatttga ggggatactg actttgagac tgggtcctaa catccatgtt 2760
tggggagttc aggctgctgc tccagggttt agcctacagt agcgaaatac aaaggaccca 2820
gagaccactc attcaaggtt tgccctaaat agcagcaaca ccactgtcat ctcaatacac 2880
gaagaatagg gcttttcagg tatccttgcc tctttgtcac agagaagagt ttacagattg 2940
tgagacggaa aagtataatt tttaaaacct tataatattt tctataaaag tcacctgagg 3000
tgaaaacttg aaaagaatta taattttcca gaatgtgagt caagaaacat tagagcaatt 3060
ttatcttagg aaagaggtct ttgaatttag gctgaaagta aattgctctg tctccatgtc 3120
ctatggttat gggcaagttt ggtacataaa tgagaaatcc atccagtggc cttgcccatc 3180
tcactcccaa acacctgaag aatgtaatgt tatatctcct agagtagcag catggtctcc 3240
ctatgaaagt ccttcttctt taaggagact tctttccctt ccctcctagg aggatgagtc 3300
agaatcatca agaaaaatat gatgggcaga ggcatacagt ttaccattac cactagttta 3360
gaattactac ttagcacttt actgcctatt acatagttgg tgctcaacaa atgtatgata 3420
aattaatggt tgagtttttc tttcttctcc atattcatct tccatgacac cacgaagagc 3480
aatgtttttc aagaatgttc ttcaaggttt gaaagtagcc tgctttagag aaactgccta 3540
ctgtacagcc tccaaccaag aggaaaagct gaaaaaagca tgaagggatt ttgttttgtt 3600
ttgtttgttt tggttttaat atgagcattc cctggcagaa aagccagggg taatctcatt 3660
gcaactaggc aatcactctc aagaaatttt ctaacaaata aggaggccaa tttttatttt 3720
attttgagac gaagtcccac tctgtcaccc aggttggagt gcaatggaat gatttcagct 3780
cactgcaacc tccgcctccc gggttcaagt gattctcctg tctaaacttc ccgagtagct 3840
gggattacag gctcccacca ccacgcccag ctaatttttt gtatttttag tagagatggg 3900
gtttcaccat tttggccaga ctggtctcaa actcctgacc tcaagtgatc caccctcctc 3960
ggcctcctaa agtgctggga ttacaggcgt gagccaccac acctgaccca ggaggccaat 4020
ttttaaaagg ttaactaatc ttcatgtcca aaatgaatgt taattgttca ttttggacat 4080
gaatgttaat tttttttttt tttttttttg agacagagtc tcactctgtt gcccaggctg 4140
gagtccagtg gcactatctc cactcactgc aacttcctcc tcccaggttc aagcaattat 4200
cctgcctcag cctcccaagt agctgggatt acaggcccac accatcaggc ctggctaatt 4260
tttgtatttt tagtagagac ggggtttcac catgttggcc aggctggtct tgaactcctg 4320
acctcgtgat ccgccctcct cggccaacca aagtgctggg attacaggcg tgagccaccg 4380
cgcctagccg aatgttaatt gtctaaaaat ttttcttctc caatgtcttc tcctccactt 4440
ttttcggaat ttgtttcttc ctaattacag cgcggtgtgg aggaaactgc agctgagtgc 4500
cgaaaactag gcgtcactgc gcatgcgtat gtggtagact gcagcaacag agaagagatc 4560
tatcgctctc taaatcaggt gagactgcag gttcacaaat ttcttcagat tattttgttt 4620
cctaggacgc tgacgtggaa aatgagaaag gtctttatga ctgcctgatt taaattggat 4680
tttagctgct aactgaagta gttatgtcac caaggaagga tatatacttt ttttcttgta 4740
tgtaatccac tcagctctgc ccattattat tgttcatatt attaatcaat ttcattctga 4800
tcagaagtgt gagcagtggc acagagtgac tgacaaaaga tttatcatca gggaatatgg 4860
atcacttcct agttttgttt tagtcctatt aactttgcag taattccagc ttctctttaa 4920
ttatttccct tgtgagattt tattttggtg ttaatgtagt cttctgtaga aaatgtaata 4980
ttaataatta ttatcacaat tattttaaaa gagtaaatac caaataatca caatgaacta 5040
agcactctaa caaactttac attttttaat tcaatcccta caataactct gtaaacttca 5100
ttttacagat aagcaaatta tgactcagag aggttaagcc agacccaggt catgtagtta 5160
ttaggttatg aaaccaggat ttctcaacca gcactttaga ccaggtgcgg tggttcacac 5220
atgtaatccc agcactttgt gaggccaagg tggaaggatc acatgagacc aagagttcaa 5280
gaccagccca ggcaacatag tgagacccta tctctaaaaa aaaaaaaaaa aaaaaaaaaa 5340
aaagtttaaa gaaaaacaca tttttaaaaa atgaacactt taaaaatatt tggtcagaat 5400
ttatatagga atttatcaac ataaatgtta atttcacttt actgataaac ttgcaaaaca 5460
tgatgtgctg ggtactgaaa tttagatgtt aaaagaacag tttatcccac ctttatgaca 5520
gtgttccctt ggcctccacg atttgagctc aacagtctgt cttgcctgaa ctctgagaga 5580
cctcatacaa tagaagaaag actctcatct ttggattata ttggtcccaa aactttgagt 5640
ttgaataata cacccagtga aagtgttctt tcaatttcaa aaggtgaaga aagaagtggg 5700
tgatgtaaca atcgtggtga ataatgctgg gacagtatat ccagccgatc ttctcagcac 5760
caaggatgaa gagattacca agacatttga ggtcaacatc ctaggacatt tttgggtgag 5820
tgtgagtcag aaacatttct gatttgtgca ccttctctta agatacatga aacttataac 5880
ggagttcaca tacttctgga caggaaactg gccagatctt tgccttaatc aagaatcatt 5940
aaatttgttt gagtagaaga gccacagagt ctctgacaca aggacacaga attcaagtgg 6000
acacaacaca ccagaatgta agctacttgg tctgtcttgt ccaccagtat ctgacacaaa 6060
gcttggcatg taccaggagc tcaacaaatg tttgtggagg tttgttaagg gttgtcagtg 6120
tacatctttt caatgctgtc acttgtgact tcattttttt ccctccacac catgattttg 6180
taatgtgtcc tcattttgtg gaattttaga atggaaagga catcagaagt aattacttgg 6240
atgtatatag gatcgaggac acttttggac gagactctga ggcaagtgtt ctagatccat 6300
ggggtgctgg aactgagaaa tgcagctata cagacctcat ataattggtt agttttgtgg 6360
gagatggaaa tatcaacttc aactgccttt gtatagaaat ttttatgatt aatcttccag 6420
tgcctcaata ttagtgtaga atctagggca gatctggatt ctagaagaaa gaagaaaaaa 6480
aagagatgtg tcccccttac ctttaccagc tcttcacata tgtgaattgg ctcccatgcc 6540
caccaaacta cacggagacc tcatacatta gctacctata gctgcataac aaattataca 6600
aaacttagtg gtttaaagca acaatgtatg ttcactatcc tctcacagtt tctatgggtt 6660
gggaatttgg aggtagcttg ggttgggagt tctagttcta tgaatttgca taggatttat 6720
taaattctta taaaatttta ttgatgtttc tcacaaaaga ggtttttgga aaaaaagaaa 6780
gacttgtttt ctgtaacatc aacatataat atacaatatt acaaataggg agatagtgaa 6840
ttcaatcatg attcattagt gtggtgtaga actctcagct tacactactc aactgtctta 6900
atacagttac acaagatttc actcttttaa ttagaatgat aaagccccaa accaaaaaat 6960
tatatgacac caaattatca taaggaataa ttttagttct gaaaactctg aatttttccc 7020
ttaatattgt ttagatgaca tatccaaaaa aggatctatt tgattccttc tgaagggaag 7080
gagggggagt actgagatta gtgttggcat ggggcttacc ataccaataa atttgtatct 7140
ttatttctat catttgtaaa gaattaatca tggaatgctt ggaagtattt tatttcattg 7200
tataagttct ctcaaatgcc tttctgtctt aacaaaaata aaactacctg atttggaaac 7260
ctaacgtcta tgtcattgtc tttcttcttt ctgcaatgat ccttaagatc acaaaagcac 7320
ttcttccatc gatgatggag agaaatcatg gccacatcgt cacagtggct tcagtgtgcg 7380
gccacgaagg gattccttac ctcatcccat attggtaagt atcacatgcc agccatgtta 7440
tatattttta tactttgaag ggagcattac acttcaaatt gttaccactg gagagtcctg 7500
gttcttggca tcttgaacaa agaattggac aaaactcacc aacaaagcca ggaaagaatg 7560
aagcaacaaa agcagagatt tattgaaaat gaaagtacgc tttacagggt gggagtgggc 7620
ccaagcacag gggctcaaga gccaattaca gaattttctg gggtttaaat accccctaga 7680
ggtttccact ggttacttgg tgtacgccct atgtaaatga agaggatgaa ttaaagttac 7740
agagtcgttt actcagtgta caccatatgt aaatggagag gatatttcct gtcatagctg 7800
gagtgtttcc atttgattta gttctaggaa gtcagcatga atcggcctta tgttccctgc 7860
ctccagaccc tgttctcctg cctcaagatt acaatgctga gagcagagtg atttggattt 7920
acagaattta aatttatagt agtttagaat gattttttaa atgacttttt ctaaaacaat 7980
gaaaccaggt tgtaattata tttaagatat ttttagattt ctgcaaactc ctctgtagaa 8040
caatgagaga aaacagtaat gccaagcatg tttccattgt ttcctggaat aagaaacaga 8100
aaccccacag actgagaagc aaaacctaca gaagctaaaa tgaacacatg tctatgtcat 8160
ggccttggtg cccaagataa gacaatcaga gtggtccctg gatcaaaaca ttttacagtg 8220
tgcttgtgcc atgaaagtgt gtgtgtgtgt gtgtgtgtgt gtgtgagaga gagagagaga 8280
gagaaaacga ctctacctga ctaaaagttg cagataccac actccatgca ccaccaaaga 8340
cataaaggga aggaggtgag aggcgttaag gatgtactgc tgtatttgcc aaatatcctt 8400
tcctgtaaac tcttctccag atcctcataa taaaattaag aggccaaagt ggcaaccatt 8460
gtcaagagaa aaactatcaa ccattgtcaa gagaataact cagttattga gagagagagg 8520
agaaatgagc agagtcctac agaagtctgt caacacagat accagttttg tagaatttct 8580
aaatgtattt ttcctgattc atatttttca aaataaaagc agcaataaaa actgattaga 8640
aaacagtttg aagattcaat ggaaaaacct tacatgtagg atggaaaact gaacattaag 8700
ccaatcaata gagttatttt tgttcttttg ttatcattgt tgtttaagaa atgagatacg 8760
ttcacaattc tgcttaatca tgtaagaaaa tgaaaatgaa ttgccattta tactctcaga 8820
aaaatcacaa gtggctgatt tttggcttcc acttgttctt aagccaaatg ataccgcctt 8880
ctcacagaaa gctgaggatt ggtttcactc tcccttagct aacaatgctt aataattctc 8940
ttacagttcc agcaaatttg ccgctgttgg ctttcacaga ggtctgacat cagaacttca 9000
ggccttggga aaaactggta tcaaaacctc atgtctctgc ccagtttttg tgaatactgg 9060
gttcaccaaa aatccaagca caaggtaagg tcaaaatcaa gttagaatgg gtatgtggta 9120
tgataaattg atatgaaaac taatgagaaa tgtttaggca ggccaactaa tagaagaaaa 9180
tgaagaagga aaaataattt ttcttattat tattattatc ttgaaattaa aggaataaag 9240
ggggaaaaca cattagggac tagcaggaat gatcagccac cgatgaactg ggatatttat 9300
ttgtgtccgg gagaaagcac atacatttga tcaccgttac caccctgtct ttaaaatgca 9360
aatgttccaa ggaccagcaa ataaattgag tatctagctc cttagtcaag gtgaatttct 9420
gcaagaactc ttgtctctgg tgagacagga tttgagacca caagagaaga aaaattagtc 9480
ctgaaaggag aagaaaaaag caggaaggtg tggataagaa cccgaaaatt aagccatctg 9540
cttaacaaat ttttctaatc ctagtatata ttctgctgca ggttaacaaa atatactaag 9600
cttaatgatt cgaaaccaat tttttactgg aagggaatta atcctaaata tattcattca 9660
aaagaactaa acaattctct gttgagtgcc gcctcatttg aggatactga ctcttacagc 9720
ctgagttagc tatgtggtct ctgcagctgg aatcactccc tgccactgga gtccttcatg 9780
gtgttagacc ataggtactg ttgactaaag aaaaaaaaaa gtttttgttt ttatttttgt 9840
tttttttgag acagagtctc actctgtcac ccaggctgga gtacagtggc gcgatctcag 9900
ctcaccgcaa cctccgcctt tctgggttca agcaattctc cttcctcagc ctcctgagta 9960
tttggattac aggcgcccac caccacgcct ggctaatttt tgtattttta gtagagacgg 10020
ggtttcacca tgttggccag gctggtctca aactcctgac ctcaggtgtc ctacctgcct 10080
tggcctccta aaatgctggg attacaggag tgagccacca tgcccggcca aaaaaataag 10140
tttttaaaga attaaaggtc atcctggcta acacagtgaa accccgtctc tactaaaaaa 10200
cacaaaaaaa ttagccgggc gtggtggcgg gcgcctgtag tcccagctgc gcgggaggct 10260
gaggcaggag aatggcgtga acccgggagg cggagcttgc agtgagccga gatcgcgcca 10320
ctgcactcca gcctgggcga cagagcgaga ctccgtctca aaaaaaaaaa aaaaaaaaaa 10380
aaaaaaaaga attaaaggtg ttaattttat ttagaagcct tactgaagac tacagtcgga 10440
ggcctatagc ctgagagcag ccctttagag aggttcagtt gaactgttct gatagtgggg 10500
gccatgtgct ctatcctgta ttgtcttcaa agcatctttc cagagagctg cacattgtca 10560
cagagtcagg gactttgtga aattatgctg acaaccagaa gtgagtaaac gtggcttctt 10620
acatttgcta cgttgtctca cagtacttaa taagtatgca atatgtaagt aaatactata 10680
gtactattgc aactcctgat tgttttctta gacaaggaat tgggcccaat aaaaaccctc 10740
ttggtaggca ttcaggcttc gtgtaccatg agctttccta agggtatcct gccactcttg 10800
gggaaggcat gatagatgag gggagtaagg ataatggaac tctgggtaca gggttcctgg 10860
gggctaactt agaggtagac acaggcaatg ctaaatattt gggattgatt ttatagaggt 10920
tgctagattg tgaatttcct tagtaagggc taaggcattg atatgtaatg tcacacttgg 10980
ctccgaggct gggttgttgg atccatgtag atgaaatcag ggagagaaag ggcagaacgg 11040
agtaatttag aaatgtattg atttgtatta ctctctgttg gcttgctatt caaggcagtg 11100
gagaactcaa tcacataata atctgcagca aaccacagat catcccaggg aatgaagttt 11160
taacattcgc tggctcccta actcctcacc cagcctttac attcactggc tgttcagtcc 11220
atgcctggac atcttaattt gaatacaaca ttttaaatcc atttttctgt catcatcttg 11280
cactaacaga caattctaca ctaagcctat gtttatgaat atttctcaag agtacatgta 11340
cacagccttc agtataagga aaactggaag tatgacatac ctccagttgt catactcctt 11400
gggcccctct taaattctca ttaaactgca ggataggcaa gtcagaggtg aatctcaaat 11460
acgaaattct taccggaaag gggttccaat ccagacccca agagagggtt cttagatttc 11520
tcgcaagaaa taattcgggg caaggccaca gtgcaaagca aaagcaagtt tattaggaaa 11580
gtaaaggagt agagaacagc tactccatgg agaagaatgg cttgagctgc tccaccaagg 11640
gtatttagag ttacttcttg attatatgct aaacaagggg tggattattc atgagttttc 11700
cgggaaaagg gtgagcaatt cccagaactg agatttcctc ccctttttag gccatatagg 11760
gtaacttcct gccattgcca tggtatttgt aaactgtcat agtgctggtg gaagtgtctc 11820
ttagcttgct aatgtattat agttagctta taatgagcag tgaggacaac cagaggtcac 11880
tttcatcacc atcttggttt tggtgggttt tggccggctt ctttactgca ccctatttta 11940
tcaacaaggt ctttatgacc tgaatcttgt gccaacctcc tatctcatcc tgtgacaaag 12000
aatgccttaa cttcctggga atgcagccca gtaggtgtca gccttatttt acccagaccc 12060
tattcaagat ggagttgctc tgatttaaac gcctctgaca aaatgacgac ctcaaaacaa 12120
tccagcttta tggaatacct ccacaagaaa gaaagtatac ttagctatag aattttctcc 12180
ttgcatccaa caggctttga gatgtcagat gtttccttcc tgtcccatga ttaatcctag 12240
ccattcctct ttcttgtctg gctccactac tccttaccat ctaatgcctc gccaccattt 12300
tgatattttg actaagtgag ctatgaaaca cacctactgg atatgaaagt ataagtttct 12360
gataacaaaa catcaacatg ggatgtggag gaagtgggta gggtggcatt aatgcagcaa 12420
atcctggaat attttaaatc ttcattctaa atttagtaaa aatataggat aattttcctg 12480
ccatcattta cttataaaat taaaatttta gaaaataaaa ataatatttt cctcttttta 12540
atcacagatt atggcctgta ttggagacag atgaagtcgt aagaagtctg atagatggaa 12600
tacttaccaa taagaaaatg atttttgttc catcgtatat caatatcttt ctgagactac 12660
agaagttaag tacagcacag aacacccaaa tactaaaaca ccaatagagc tttttttttt 12720
gctttttttt tttttagaca gagtctcact ctgtcaccct ggctggattg cggtggttgc 12780
agtggcatga tcttggctca ctgcaacctc cgcctcctgg gttcaagcaa ttctcatgcc 12840
tcagaccccc aagtaactgg gattataggt gtgtgctgcc acactacacc cagctaattt 12900
ttgtattttt tgatagagac aggtttcccc atgttggcca ggctggactc gaactcctga 12960
cctcaagtta tcctcctgtc tcggcctccc aaagtgctgg gattacagtc atgagccacc 13020
atgcctggcc caatagagct attattatgg agcatctttc agttgtgaaa attggcatgg 13080
aaactctcca tccctgggga gaacagttat ttcctctgtt attttcctac ccagtctata 13140
aaaagagagt gattcatttt ctctaccaaa tctactgtct ctgcccaaac tttgctgaag 13200
actattctaa ctaaaggaaa cacagtttaa aaagaatgca atatagtgaa gtagttaata 13260
ataaagactc catttttaaa agtctgctgg aagtttggtt gggattgcac tgaatctata 13320
gagcaattgg ggagtattga catatcaaca atattgagtt ttctaatcca agaacataat 13380
atctattttt aaaatcttct tcaaaatctt taaatcttta aattgtattt tgtagttttt 13440
ggtgtttaag tcttgcacat attttgtcag atttattcca aagtatttca cgggttcttt 13500
tttttttttt tttttttttt tttgagacag agtttcaccc ttgttgccca ggctggagtg 13560
cagtggcgtg atcttggctc actgcagctt ctgcctcctg gcttcaagtg attctcctgc 13620
ctcagcctcc caagtagctg ggattacagg cacctgcccc ctcgcccaac taactttttg 13680
tgtttgtagt agagacaggg tttcaccatg ttggccaggc tggtctcgaa ctcctgacct 13740
catgtgatcc acctgcctca gcctcccaaa gtgctgggat tacaggcatg agccatcatg 13800
cccagcccta tttgacggtt tttgacgcta atgcaagtgg cattttaaaa aattttatat 13860
ttcccattgt ttgttgtcag tatatattgg atttttgtaa tttgatctca tattttgcag 13920
tcttgctaaa ttgctaaacc tctttttgct aaactcgata agcttttttt tttttggtag 13980
attcctgggc ctctaatttt ctttatggga aagtttttaa ttacaaattt aatttcttta 14040
atagctacat ggctattcaa tttacttatt aattcttggt aatgtgtgtc tttcaaggaa 14100
tttgtccatt tcatctaagt tgtagaattt ctttggcata aatttgtaca taacattccc 14160
ttattatcct tttaatgtct ttagaatgtc ttatttattt atttatttat ttttattata 14220
tttttttgag acagagtctc gctctgttgc ccaggctgga gtgcagtggc acaatcttgg 14280
ctcactgcaa gctccgcctt ctgggttcat gccattctcc tgcctcagcc tccctagttg 14340
ctgggactac aggcgcctgc aaccatgccc agcttatttt tttttttttt tttttttttt 14400
tttttttttt tttttttttt ttagtagaga cggggtttca ccctgttagc caggatggtc 14460
tcgatctcct gacctggtga tccgcccgcc tcagcctccc aaagtgctgg gattacaggc 14520
gtgagccacc aagcccagcc tatttattta tttagtagag acagtctcac tttgctgccc 14580
aggcaacaaa ggttttgaat gcctggcctc aagcagtcct cctgccttgg cctcccaaag 14640
tgctgggatt acaggcatga gccactgcac ctggccaaat gaatatgctg ataatatctt 14700
ctttataagg atgacataag aataaaataa tgtaatacaa acaaagcccc tgtcactgaa 14760
aatgtataga cttcaaatgt taaagtctta gagaacagaa tttatatgaa atagcaacag 14820
caacaatttc ccagaggaaa tactctctca gctttcttct gaggagcagt ttctaaattg 14880
aaattgtatc agtgagaaga taactatact aacttcataa gccttgggcc tttttgaaac 14940
aaatccatat aaactatgaa caaacttgaa atagaacaat ttgagaacag ggtacaaact 15000
gcattggtgt atcaatttca gtatttggtt ttagcttaaa tagactgact tgagataaca 15060
taaggagaac cttgaccccc aagcaacatc atctcgcgag ttgactaggc cgggtgtggt 15120
gtctcacgcc tgtaattcca gcactttggg aggccacagc aggcagatca cttgaggtca 15180
ggcattcgag accagcctgg ccaacatggt gaaacctcag ctctactaaa gatacgaaaa 15240
ttagcaggca tagtggcctg cacctgtaat accaggcact cgcaggagaa tcccttgaac 15300
ccggaaggcg gagattgcag taaaccatga ttgtgccact gcactccagc ctgggcaaca 15360
ggagactctg tctcggaaaa ataaattttt taaaaaaatg aaaaaaaata aaagttgact 15420
aaattagtgt cttggtacta agcactgtag gaagtgagtt tcatggaacc ccaactctct 15480
tggggcccaa agcaagtcat attaatattg aaaattacat gcatatacat gcatatgacc 15540
aaggtgataa aaacaattat tctgcctgag ttggagaata gtatcccagt aaaataaaca 15600
agagtctcaa agtcttttgt atcctttgaa gctgtcatgg tggtttgtaa ctaggcaaca 15660
ggtatatatt gttaatcttc tttgcattta attcctttta tagagagaca caattttacg 15720
agcagatgca attactagca tgaaggtttc tttgtgaggg tagttaaaag gcccacatga 15780
gctctcttct tatccttgtc cttctttcag ccagatcttc cctgcccctt tgctcattcc 15840
atctttcacc cacctacccc caaaacaagg aagtaaatct tgcattagtc aacaatacca 15900
aagtgatttt caatatgact ttctctgcag aatgttatta tttctgcctc tttacattca 15960
catactgtct tccttttttt tttttttttt tttttttttt ttagattggg tctcactctg 16020
ttgcccaggc tggagtgcag tggcttgatc tcagctcact gtaacctcca cctcctgagt 16080
tcaagcaatt ctcctgcctc agcctcctga gtagctggga ttacaggcat gtgccaccac 16140
acctggctag tttttttgta tttttagtag agacagggtt tcaccatgtt ggtcaagctg 16200
gtctcgaact cctgacctca tgatctgacc acctgtgcct ctcaaagtgc tgggattaca 16260
ggcgtgagcc accgggccag ccactctctt cctttcagtt gcctactcat ctcttatgca 16320
ttcctggaca tcagttgtcc ttttgaagct ttcctccact atcccagccc atgtgaatcc 16380
tccttccagt tatagccctt aattctagat ggctgatatt tttcaataat tgttttaaga 16440
tgaccatttt agcctatcag ctaaacaata tcaaagacaa tagctatttt tcaagtactt 16500
tagtttacct tattatagag tgcataatag atattcagta aatagtaaag gagaggtgaa 16560
ggcttgcata gaatggattc tggtggtgtc tcttggtgag cttttagcat caagattaat 16620
cagcagtttc agcaatgagc tcagaccttc agttttagat ctttactcat atcagataag 16680
agagtgagaa gagtggtatg tatcagtgct ttatttatat ttgcatccaa tttgaactat 16740
gaatattaca aaggtgcaca cataggttca gacagattga tttaaaatga ccaaagatga 16800
cctgtcgtaa gcaacctggg tatcttaaga tgcactcctt ggagagggaa tgttcctaaa 16860
aacattttca gagggacgaa ctgtatgaaa ttcagtaaaa cataaatcat gaggaaaact 16920
gattactctc tttttgacat gaaatgagag ttttaatgca tggttacgat tattaacgta 16980
ctccgctgca agacgttaat aaagttactg ttttgcaggc tagaatgtct tgatgctgta 17040
atcagaacac actttttccc ctttcttcca gcttcaaatg cagattcata attgggctga 17100
cttctaataa ctgcaatgtt ttctgccttg ggcttgcagc agaagcctga caaaatagtg 17160
tttgtttagg caataattta tttatttatt tattgagatg gagtttcatt cttgtcgccc 17220
aggctggagt gcaatggcgt gatctcggct cactgcaacc tctgtgttca ggcaataatt 17280
tagactttac cttacttgtg attactatag caattactat agccacaagg cataatttta 17340
ctgtctcatt tcaattttat gaatttgaat gtttttacac ttttcctaat gaagtccact 17400
atgaagttat gtcaaaaaaa aaaaagaaaa agaaagatgc acacgtaaaa gagaggtggt 17460
tgcaagagaa gaaaagaacg gaggaaagtt aaacgcaaac cagataactc tcagcgtatt 17520
ctaaatgacc aaaaacagaa ctctgttgtc aaagatttta aatggaaaat ttttcaattt 17580
ttttttcttt tttgtacagg tttcttcctg aacgcgcctc agcgatttta aatcgtatgc 17640
agaatattca atttgaagca gtggttggcc acaaaatcaa aatgaaatga ataaataagc 17700
tccagccaga gatgtatgca tgataatgat atgaatagtt tcgaatcaat gctgcaaagc 17760
tttatttcac attttttcag tcctgataat attaaaaaca ttggtttggc actagcagca 17820
gtcaaacgaa caagattaat tacctgtctt cctgtttctc aagaatattt acgtagtttt 17880
tcataggtct gtttttcctt tcatgcctct taaaaacttc tgtgcttaca taaacatact 17940
taaaaggttt tctttaagat attttatttt tccatttaaa ggtggacaaa agctacctcc 18000
ctaaaagtaa atacaaagag aacttattta cacagggaag gtttaagact gttcaagtag 18060
cattccaatc tgtagccatg ccacagaata tcaacaagaa cacagaatga gtgcacagct 18120
aagagatcaa gtttcagcag gcagctttat ctcaacctgg acatatttta agattcagca 18180
tttgaaagat ttccctagcc tcttcctttt tcattagccc aaaacggtgc aactctattc 18240
tggactttat tacttgattc tgtcttctgt ataactctga agtccaccaa aagtggaccc 18300
tctatatttc ctcccttttt atagtcttat aagatacatt atgaaaggtg accgactcta 18360
ttttaaatct cagaatttta agttctagcc ccatgataac ctttttcttt gtaatttatg 18420
ctttcatata tccttggtcc cagagatgtt tagacaattt taggctcaaa aattaaagct 18480
aacacaggaa aaggaactgt actggctatt acataagaaa caatggaccc aagagaagaa 18540
aaggaagaaa gaaaggtttt ttggtttttg ttttgttttg ttttgttttt tgtttttttg 18600
agatggagtc tcactctttc gcccaggctg gagtgcagtg gtatgatctc agctcactgc 18660
aagctccacc tcccgggttc acgccattct cctgcctcag cctcctgagt agctgggact 18720
acaggcgccc gccaccacac ccggctaatt ttttgtattt tttgtagaga cggggtttca 18780
ccatgttagc caagatggtc tcgatctcct gacctcgtga tccacctgcc tcggcctccc 18840
aaagtgctgg gattacgggt gtgagccacc gtgcccagcc tttttttttt taatagaaaa 18900
aataatccga ctcccactac atcaagacta atcttgtttt gtgtgttttt cacatgtatt 18960
atagaatgct tttgcatgga ctatcctctt gtttttatta aaaacaaatg atttttttaa 19020
aagtcacaaa aacaattcac taaaaataaa tatgtcattg tgctttaaaa aaataacctc 19080
ttgtagttat aaaataaaac gtttgacttc taaactctg 19119
<210> 3
<211> 900
<212> DNA
<213> Homo sapien
<400> 3
augaacauca uccuagaaau ccuucugcuu cugaucacca ucaucuacuc cuacuuggag 60
ucguugguga aguuuuucau uccucagagg agaaaaucug uggcugggga gauuguucuc 120
auuacuggag cugggcaugg aauaggcagg cagacuacuu augaauuugc aaaacgacag 180
agcauauugg uucuguggga uauuaauaag cgcggugugg aggaaacugc agcugagugc 240
cgaaaacuag gcgucacugc gcaugcguau gugguagacu gcagcaacag agaagagauc 300
uaucgcucuc uaaaucaggu gaagaaagaa gugggugaug uaacaaucgu ggugaauaau 360
gcugggacag uauauccagc cgaucuucuc agcaccaagg augaagagau uaccaagaca 420
uuugagguca acauccuagg acauuuuugg aucacaaaag cacuucuucc aucgaugaug 480
gagagaaauc auggccacau cgucacagug gcuucagugu gcggccacga agggauuccu 540
uaccucaucc cauauuguuc cagcaaauuu gccgcuguug gcuuucacag aggucugaca 600
ucagaacuuc aggccuuggg aaaaacuggu aucaaaaccu caugucucug cccaguuuuu 660
gugaauacug gguucaccaa aaauccaagc acaagauuau ggccuguauu ggagacagau 720
gaagucguaa gaagucugau agauggaaua cuuaccaaua agaaaaugau uuuuguucca 780
ucguauauca auaucuuucu gagacuacag aaguuucuuc cugaacgcgc cucagcgauu 840
uuaaaucgua ugcagaauau ucaauuugaa gcagugguug gccacaaaau caaaaugaaa 900
<210> 4
<211> 792
<212> DNA
<213> Homo sapien
<400> 4
augaacauca uccuagaaau ccuucugcuu cugaucacca ucaucuacuc cuacuuggag 60
ucguugguga aguuuuucau uccucagagg agaaaaucug uggcugggga gauuguucuc 120
auuacuggag cugggcaugg aauaggcagg cagacuacuu augaauuugc aaaacgacag 180
agcauauugg uucuguggga uauuaauaag gugaagaaag aaguggguga uguaacaauc 240
guggugaaua augcugggac aguauaucca gccgaucuuc ucagcaccaa ggaugaagag 300
auuaccaaga cauuugaggu caacauccua ggacauuuuu ggaucacaaa agcacuucuu 360
ccaucgauga uggagagaaa ucauggccac aucgucacag uggcuucagu gugcggccac 420
gaagggauuc cuuaccucau cccauauugu uccagcaaau uugccgcugu uggcuuucac 480
agaggucuga caucagaacu ucaggccuug ggaaaaacug guaucaaaac cucaugucuc 540
ugcccaguuu uugugaauac uggguucacc aaaaauccaa gcacaagauu auggccugua 600
uuggagacag augaagucgu aagaagucug auagauggaa uacuuaccaa uaagaaaaug 660
auuuuuguuc caucguauau caauaucuuu cugagacuac agaaguuucu uccugaacgc 720
gccucagcga uuuuaaaucg uaugcagaau auucaauuug aagcaguggu uggccacaaa 780
aucaaaauga aa 792
<210> 5
<211> 783
<212> DNA
<213> Homo sapien
<400> 5
augaacauca uccuagaaau ccuucugcuu cugaucacca ucaucuacuc cuacuuggag 60
ucguugguga aguuuuucau uccucagagg agaaaaucug uggcugggga gauuguucuc 120
auuacuggag cugggcaugg aauaggcagg cagacuacuu augaauuugc aaaacgacag 180
agcauauugg uucuguggga uauuaauaag cgcggugugg aggaaacugc agcugagugc 240
cgaaaacuag gcgucacugc gcaugcguau gugguagacu gcagcaacag agaagagauc 300
uaucgcucuc uaaaucaggu gaagaaagaa gugggugaug uaacaaucgu ggugaauaau 360
gcugggacag uauauccagc cgaucuucuc agcaccaagg augaagagau uaccaagaca 420
uuugagguca acauccuagg acauuuuugg aucacaaaag cacuucuucc aucgaugaug 480
gagagaaauc auggccacau cgucacagug gcuucagugu gcggccacga agggauuccu 540
uaccucaucc cauauuguuc cagcaaauuu gccgcuguug gcuuucacag aggucugaca 600
ucagaacuuc aggccuuggg aaaaacuggu aucaaaaccu caugucucug cccaguuuuu 660
gugaauacug gguucaccaa aaauccaagc acaagguuuc uuccugaacg cgccucagcg 720
auuuuaaauc guaugcagaa uauucaauuu gaagcagugg uuggccacaa aaucaaaaug 780
aaa 783
<210> 6
<211> 822
<212> DNA
<213> Homo sapien
<400> 6
augaacauca uccuagaaau ccuucugcuu cugaucacca ucaucuacuc cuacuuggag 60
ucguugguga aguuuuucau uccucagagg agaaaaucug uggcugggga gauuguucuc 120
auuacuggag cugggcaugg aauaggcagg cagacuacuu augaauuugc aaaacgacag 180
agcauauugg uucuguggga uauuaauaag cgcggugugg aggaaacugc agcugagugc 240
cgaaaacuag gcgucacugc gcaugcguau gugguagacu gcagcaacag agaagagauc 300
uaucgcucuc uaaaucaggu gaagaaagaa gugggugaug uaacaaucgu ggugaauaau 360
gcugggacag uauauccagc cgaucuucuc agcaccaagg augaagagau uaccaagaca 420
uuugagguca acauccuagg acauuuuugg aucacaaaag cacuucuucc aucgaugaug 480
gagagaaauc auggccacau cgucacagug gcuucagugu gcggccacga agggauuccu 540
uaccucaucc cauauuguuc cagcaaauuu gccgcuguug gcuuucacag aggucugaca 600
ucagaacuuc aggccuuggg aaaaacuggu aucaaaaccu caugucucug cccaguuuuu 660
gugaauacug gguucaccaa aaauccaagc acaagauuau ggccuguauu ggagacagau 720
gaagucguaa gaagucugau agauggaaua cuuaccaaua agaaaaugau uuuuguucca 780
ucguauauca auaucuuucu gagacuacag aagguuucuu cc 822
<210> 7
<211> 972
<212> DNA
<213> Homo sapien
<400> 7
augaacauca uccuagaaau ccuucugcuu cugaucacca ucaucuacuc cuacuuggag 60
ucguugguga aguuuuucau uccucagagg agaaaaucug uggcugggga gauuguucuc 120
auuacuggag cugggcaugg aauaggcagg cagacuacuu augaauuugc aaaacgacag 180
agcauauugg uucuguggga uauuaauaag cgcggugugg aggaaacugc agcugagugc 240
cgaaaacuag gcgucacugc gcaugcguau gugguagacu gcagcaacag agaagagauc 300
uaucgcucuc uaaaucaggu gaagaaagaa gugggugaug uaacaaucgu ggugaauaau 360
gcugggacag uauauccagc cgaucuucuc agcaccaagg augaagagau uaccaagaca 420
uuugagguca acauccuagg acauuuuugg aauggaaagg acaucagaag uaauuacuug 480
gauguauaua ggaucgagga cacuuuugga cgagacucug agaucacaaa agcacuucuu 540
ccaucgauga uggagagaaa ucauggccac aucgucacag uggcuucagu gugcggccac 600
gaagggauuc cuuaccucau cccauauugu uccagcaaau uugccgcugu uggcuuucac 660
agaggucuga caucagaacu ucaggccuug ggaaaaacug guaucaaaac cucaugucuc 720
ugcccaguuu uugugaauac uggguucacc aaaaauccaa gcacaagauu auggccugua 780
uuggagacag augaagucgu aagaagucug auagauggaa uacuuaccaa uaagaaaaug 840
auuuuuguuc caucguauau caauaucuuu cugagacuac agaaguuucu uccugaacgc 900
gccucagcga uuuuaaaucg uaugcagaau auucaauuug aagcaguggu uggccacaaa 960
aucaaaauga aa 972
<210> 8
<211> 852
<212> DNA
<213> Homo sapien
<400> 8
augaacauca uccuagaaau ccuucugcuu cugaucacca ucaucuacuc cuacuuggag 60
ucguugguga aguuuuucau uccucagagg agaaaaucug uggcugggga gauuguucuc 120
auuacuggag cugggcaugg aauaggcagg cagacuacuu augaauuugc aaaacgacag 180
agcauauugg uucuguggga uauuaauaag cgcggugugg aggaaacugc agcugagugc 240
cgaaaacuag gcgucacugc gcaugcguau gugguagacu gcagcaacag agaagagauc 300
uaucgcucuc uaaaucaggu gaagaaagaa gugggugaug uaacaaucgu ggugaauaau 360
gcugggacag uauauccagc cgaucuucuc agcaccaagg augaagagau uaccaagaca 420
uuugagguca acauccuagg acauuuuugg aucacaaaag cacuucuucc aucgaugaug 480
gagagaaauc auggccacau cgucacagug gcuucagugu gcggccacga agggauuccu 540
uaccucaucc cauauuguuc cagcaaauuu gccgcuguug gcuuucacag aggucugaca 600
ucagaacuuc aggccuuggg aaaaacuggu aucaaaaccu caugucucug cccaguuuuu 660
gugaauacug gguucaccaa aaauccaagc acaagauuau ggccuguauu ggagacagau 720
gaagucguaa gaagucugau agauggaaua cuuaccaaua agaaaaugau uuuuguucca 780
ucguauauca auaucuuucu gagacuacag aaguuaagua cagcacagaa cacccaaaua 840
cuaaaacacc aa 852
<210> 9
<211> 714
<212> DNA
<213> Homo sapien
<400> 9
augaacauca uccuagaaau ccuucugcuu cugaucacca ucaucuacuc cuacuuggag 60
ucguugguga aguuuuucau uccucagagg agaaaaucug uggcugggga gauuguucuc 120
auuacuggag cugggcaugg aauaggcagg cagacuacuu augaauuugc aaaacgacag 180
agcauauugg uucuguggga uauuaauaag gugaagaaag aaguggguga uguaacaauc 240
guggugaaua augcugggac aguauaucca gccgaucuuc ucagcaccaa ggaugaagag 300
auuaccaaga cauuugaggu caacauccua ggacauuuuu ggaucacaaa agcacuucuu 360
ccaucgauga uggagagaaa ucauggccac aucgucacag uggcuucagu gugcggccac 420
gaagggauuc cuuaccucau cccauauugu uccagcaaau uugccgcugu uggcuuucac 480
agaggucuga caucagaacu ucaggccuug ggaaaaacug guaucaaaac cucaugucuc 540
ugcccaguuu uugugaauac uggguucacc aaaaauccaa gcacaagauu auggccugua 600
uuggagacag augaagucgu aagaagucug auagauggaa uacuuaccaa uaagaaaaug 660
auuuuuguuc caucguauau caauaucuuu cugagacuac agaagguuuc uucc 714
<210> 10
<211> 894
<212> DNA
<213> Homo sapien
<400> 10
augaacauca uccuagaaau ccuucugcuu cugaucacca ucaucuacuc cuacuuggag 60
ucguugguga aguuuuucau uccucagagg agaaaaucug uggcugggga gauuguucuc 120
auuacuggag cugggcaugg aauaggcagg cagacuacuu augaauuugc aaaacgacag 180
agcauauugg uucuguggga uauuaauaag cgcggugugg aggaaacugc agcugagugc 240
cgaaaacuag gcgucacugc gcaugcguau gugguagacu gcagcaacag agaagagauc 300
uaucgcucuc uaaaucaggu gaagaaagaa gugggugaug uaacaaucgu ggugaauaau 360
gcugggacag uauauccagc cgaucuucuc agcaccaagg augaagagau uaccaagaca 420
uuugagguca acauccuagg acauuuuugg aauggaaagg acaucagaag uaauuacuug 480
gauguauaua ggaucgagga cacuuuugga cgagacucug agaucacaaa agcacuucuu 540
ccaucgauga uggagagaaa ucauggccac aucgucacag uggcuucagu gugcggccac 600
gaagggauuc cuuaccucau cccauauugu uccagcaaau uugccgcugu uggcuuucac 660
agaggucuga caucagaacu ucaggccuug ggaaaaacug guaucaaaac cucaugucuc 720
ugcccaguuu uugugaauac uggguucacc aaaaauccaa gcacaagauu auggccugua 780
uuggagacag augaagucgu aagaagucug auagauggaa uacuuaccaa uaagaaaaug 840
auuuuuguuc caucguauau caauaucuuu cugagacuac agaagguuuc uucc 894
<210> 11
<211> 813
<212> DNA
<213> Homo sapien
<400> 11
augaacauca uccuagaaau ccuucugcuu cugaucacca ucaucuacuc cuacuuggag 60
ucguugguga aguuuuucau uccucagagg agaaaaucug uggcugggga gauuguucuc 120
auuacuggag cugggcaugg aauaggcagg cagacuacuu augaauuugc aaaacgacag 180
agcauauugg uucuguggga uauuaauaag cgcggugugg aggaaacugc agcugagugc 240
cgaaaacuag gcgucacugc gcaugcguau gugguagacu gcagcaacag agaagagauc 300
uaucgcucuc uaaaucaggu gaagaaagaa gugggugaug uaacaaucgu ggugaauaau 360
gcugggacag uauauccagc cgaucuucuc agcaccaagg augaagagau uaccaagaca 420
uuugagguca acauccuagg acauuuuugg aucacaaaag cacuucuucc aucgaugaug 480
gagagaaauc auggccacau cgucacagug gcuucagugu gcggccacga agggauuccu 540
uaccucaucc cauauuguuc cagcaaauuu gccgcuguug gcuuucacag aggucugaca 600
ucagaacuuc aggccuuggg aaaaacuggu aucaaaaccu caugucucug cccaguuuuu 660
gugaauacug gguucaccaa aaauccaagc acaagauuau ggccuguauu ggagacagau 720
gaagucguaa gaagucugau agauggaaua cuuaccaaua agaaaaugau uuuuguucca 780
ucguauauca auaucuuucu gagacuacag aag 813
<210> 12
<211> 900
<212> DNA
<213> Homo sapien
<400> 12
atgaacatca tcctagaaat ccttctgctt ctgatcacca tcatctactc ctacttggag 60
tcgttggtga agtttttcat tcctcagagg agaaaatctg tggctgggga gattgttctc 120
attactggag ctgggcatgg aataggcagg cagactactt atgaatttgc aaaacgacag 180
agcatattgg ttctgtggga tattaataag cgcggtgtgg aggaaactgc agctgagtgc 240
cgaaaactag gcgtcactgc gcatgcgtat gtggtagact gcagcaacag agaagagatc 300
tatcgctctc taaatcaggt gaagaaagaa gtgggtgatg taacaatcgt ggtgaataat 360
gctgggacag tatatccagc cgatcttctc agcaccaagg atgaagagat taccaagaca 420
tttgaggtca acatcctagg acatttttgg atcacaaaag cacttcttcc atcgatgatg 480
gagagaaatc atggccacat cgtcacagtg gcttcagtgt gcggccacga agggattcct 540
tacctcatcc catattgttc cagcaaattt gccgctgttg gctttcacag aggtctgaca 600
tcagaacttc aggccttggg aaaaactggt atcaaaacct catgtctctg cccagttttt 660
gtgaatactg ggttcaccaa aaatccaagc acaagattat ggcctgtatt ggagacagat 720
gaagtcgtaa gaagtctgat agatggaata cttaccaata agaaaatgat ttttgttcca 780
tcgtatatca atatctttct gagactacag aagtttcttc ctgaacgcgc ctcagcgatt 840
ttaaatcgta tgcagaatat tcaatttgaa gcagtggttg gccacaaaat caaaatgaaa 900
<210> 13
<211> 792
<212> DNA
<213> Homo sapien
<400> 13
atgaacatca tcctagaaat ccttctgctt ctgatcacca tcatctactc ctacttggag 60
tcgttggtga agtttttcat tcctcagagg agaaaatctg tggctgggga gattgttctc 120
attactggag ctgggcatgg aataggcagg cagactactt atgaatttgc aaaacgacag 180
agcatattgg ttctgtggga tattaataag gtgaagaaag aagtgggtga tgtaacaatc 240
gtggtgaata atgctgggac agtatatcca gccgatcttc tcagcaccaa ggatgaagag 300
attaccaaga catttgaggt caacatccta ggacattttt ggatcacaaa agcacttctt 360
ccatcgatga tggagagaaa tcatggccac atcgtcacag tggcttcagt gtgcggccac 420
gaagggattc cttacctcat cccatattgt tccagcaaat ttgccgctgt tggctttcac 480
agaggtctga catcagaact tcaggccttg ggaaaaactg gtatcaaaac ctcatgtctc 540
tgcccagttt ttgtgaatac tgggttcacc aaaaatccaa gcacaagatt atggcctgta 600
ttggagacag atgaagtcgt aagaagtctg atagatggaa tacttaccaa taagaaaatg 660
atttttgttc catcgtatat caatatcttt ctgagactac agaagtttct tcctgaacgc 720
gcctcagcga ttttaaatcg tatgcagaat attcaatttg aagcagtggt tggccacaaa 780
atcaaaatga aa 792
<210> 14
<211> 783
<212> DNA
<213> Homo sapien
<400> 14
atgaacatca tcctagaaat ccttctgctt ctgatcacca tcatctactc ctacttggag 60
tcgttggtga agtttttcat tcctcagagg agaaaatctg tggctgggga gattgttctc 120
attactggag ctgggcatgg aataggcagg cagactactt atgaatttgc aaaacgacag 180
agcatattgg ttctgtggga tattaataag cgcggtgtgg aggaaactgc agctgagtgc 240
cgaaaactag gcgtcactgc gcatgcgtat gtggtagact gcagcaacag agaagagatc 300
tatcgctctc taaatcaggt gaagaaagaa gtgggtgatg taacaatcgt ggtgaataat 360
gctgggacag tatatccagc cgatcttctc agcaccaagg atgaagagat taccaagaca 420
tttgaggtca acatcctagg acatttttgg atcacaaaag cacttcttcc atcgatgatg 480
gagagaaatc atggccacat cgtcacagtg gcttcagtgt gcggccacga agggattcct 540
tacctcatcc catattgttc cagcaaattt gccgctgttg gctttcacag aggtctgaca 600
tcagaacttc aggccttggg aaaaactggt atcaaaacct catgtctctg cccagttttt 660
gtgaatactg ggttcaccaa aaatccaagc acaaggtttc ttcctgaacg cgcctcagcg 720
attttaaatc gtatgcagaa tattcaattt gaagcagtgg ttggccacaa aatcaaaatg 780
aaa 783
<210> 15
<211> 822
<212> DNA
<213> Homo sapien
<400> 15
atgaacatca tcctagaaat ccttctgctt ctgatcacca tcatctactc ctacttggag 60
tcgttggtga agtttttcat tcctcagagg agaaaatctg tggctgggga gattgttctc 120
attactggag ctgggcatgg aataggcagg cagactactt atgaatttgc aaaacgacag 180
agcatattgg ttctgtggga tattaataag cgcggtgtgg aggaaactgc agctgagtgc 240
cgaaaactag gcgtcactgc gcatgcgtat gtggtagact gcagcaacag agaagagatc 300
tatcgctctc taaatcaggt gaagaaagaa gtgggtgatg taacaatcgt ggtgaataat 360
gctgggacag tatatccagc cgatcttctc agcaccaagg atgaagagat taccaagaca 420
tttgaggtca acatcctagg acatttttgg atcacaaaag cacttcttcc atcgatgatg 480
gagagaaatc atggccacat cgtcacagtg gcttcagtgt gcggccacga agggattcct 540
tacctcatcc catattgttc cagcaaattt gccgctgttg gctttcacag aggtctgaca 600
tcagaacttc aggccttggg aaaaactggt atcaaaacct catgtctctg cccagttttt 660
gtgaatactg ggttcaccaa aaatccaagc acaagattat ggcctgtatt ggagacagat 720
gaagtcgtaa gaagtctgat agatggaata cttaccaata agaaaatgat ttttgttcca 780
tcgtatatca atatctttct gagactacag aaggtttctt cc 822
<210> 16
<211> 972
<212> DNA
<213> Homo sapien
<400> 16
atgaacatca tcctagaaat ccttctgctt ctgatcacca tcatctactc ctacttggag 60
tcgttggtga agtttttcat tcctcagagg agaaaatctg tggctgggga gattgttctc 120
attactggag ctgggcatgg aataggcagg cagactactt atgaatttgc aaaacgacag 180
agcatattgg ttctgtggga tattaataag cgcggtgtgg aggaaactgc agctgagtgc 240
cgaaaactag gcgtcactgc gcatgcgtat gtggtagact gcagcaacag agaagagatc 300
tatcgctctc taaatcaggt gaagaaagaa gtgggtgatg taacaatcgt ggtgaataat 360
gctgggacag tatatccagc cgatcttctc agcaccaagg atgaagagat taccaagaca 420
tttgaggtca acatcctagg acatttttgg aatggaaagg acatcagaag taattacttg 480
gatgtatata ggatcgagga cacttttgga cgagactctg agatcacaaa agcacttctt 540
ccatcgatga tggagagaaa tcatggccac atcgtcacag tggcttcagt gtgcggccac 600
gaagggattc cttacctcat cccatattgt tccagcaaat ttgccgctgt tggctttcac 660
agaggtctga catcagaact tcaggccttg ggaaaaactg gtatcaaaac ctcatgtctc 720
tgcccagttt ttgtgaatac tgggttcacc aaaaatccaa gcacaagatt atggcctgta 780
ttggagacag atgaagtcgt aagaagtctg atagatggaa tacttaccaa taagaaaatg 840
atttttgttc catcgtatat caatatcttt ctgagactac agaagtttct tcctgaacgc 900
gcctcagcga ttttaaatcg tatgcagaat attcaatttg aagcagtggt tggccacaaa 960
atcaaaatga aa 972
<210> 17
<211> 852
<212> DNA
<213> Homo sapien
<400> 17
atgaacatca tcctagaaat ccttctgctt ctgatcacca tcatctactc ctacttggag 60
tcgttggtga agtttttcat tcctcagagg agaaaatctg tggctgggga gattgttctc 120
attactggag ctgggcatgg aataggcagg cagactactt atgaatttgc aaaacgacag 180
agcatattgg ttctgtggga tattaataag cgcggtgtgg aggaaactgc agctgagtgc 240
cgaaaactag gcgtcactgc gcatgcgtat gtggtagact gcagcaacag agaagagatc 300
tatcgctctc taaatcaggt gaagaaagaa gtgggtgatg taacaatcgt ggtgaataat 360
gctgggacag tatatccagc cgatcttctc agcaccaagg atgaagagat taccaagaca 420
tttgaggtca acatcctagg acatttttgg atcacaaaag cacttcttcc atcgatgatg 480
gagagaaatc atggccacat cgtcacagtg gcttcagtgt gcggccacga agggattcct 540
tacctcatcc catattgttc cagcaaattt gccgctgttg gctttcacag aggtctgaca 600
tcagaacttc aggccttggg aaaaactggt atcaaaacct catgtctctg cccagttttt 660
gtgaatactg ggttcaccaa aaatccaagc acaagattat ggcctgtatt ggagacagat 720
gaagtcgtaa gaagtctgat agatggaata cttaccaata agaaaatgat ttttgttcca 780
tcgtatatca atatctttct gagactacag aagttaagta cagcacagaa cacccaaata 840
ctaaaacacc aa 852
<210> 18
<211> 714
<212> DNA
<213> Homo sapien
<400> 18
atgaacatca tcctagaaat ccttctgctt ctgatcacca tcatctactc ctacttggag 60
tcgttggtga agtttttcat tcctcagagg agaaaatctg tggctgggga gattgttctc 120
attactggag ctgggcatgg aataggcagg cagactactt atgaatttgc aaaacgacag 180
agcatattgg ttctgtggga tattaataag gtgaagaaag aagtgggtga tgtaacaatc 240
gtggtgaata atgctgggac agtatatcca gccgatcttc tcagcaccaa ggatgaagag 300
attaccaaga catttgaggt caacatccta ggacattttt ggatcacaaa agcacttctt 360
ccatcgatga tggagagaaa tcatggccac atcgtcacag tggcttcagt gtgcggccac 420
gaagggattc cttacctcat cccatattgt tccagcaaat ttgccgctgt tggctttcac 480
agaggtctga catcagaact tcaggccttg ggaaaaactg gtatcaaaac ctcatgtctc 540
tgcccagttt ttgtgaatac tgggttcacc aaaaatccaa gcacaagatt atggcctgta 600
ttggagacag atgaagtcgt aagaagtctg atagatggaa tacttaccaa taagaaaatg 660
atttttgttc catcgtatat caatatcttt ctgagactac agaaggtttc ttcc 714
<210> 19
<211> 894
<212> DNA
<213> Homo sapien
<400> 19
atgaacatca tcctagaaat ccttctgctt ctgatcacca tcatctactc ctacttggag 60
tcgttggtga agtttttcat tcctcagagg agaaaatctg tggctgggga gattgttctc 120
attactggag ctgggcatgg aataggcagg cagactactt atgaatttgc aaaacgacag 180
agcatattgg ttctgtggga tattaataag cgcggtgtgg aggaaactgc agctgagtgc 240
cgaaaactag gcgtcactgc gcatgcgtat gtggtagact gcagcaacag agaagagatc 300
tatcgctctc taaatcaggt gaagaaagaa gtgggtgatg taacaatcgt ggtgaataat 360
gctgggacag tatatccagc cgatcttctc agcaccaagg atgaagagat taccaagaca 420
tttgaggtca acatcctagg acatttttgg aatggaaagg acatcagaag taattacttg 480
gatgtatata ggatcgagga cacttttgga cgagactctg agatcacaaa agcacttctt 540
ccatcgatga tggagagaaa tcatggccac atcgtcacag tggcttcagt gtgcggccac 600
gaagggattc cttacctcat cccatattgt tccagcaaat ttgccgctgt tggctttcac 660
agaggtctga catcagaact tcaggccttg ggaaaaactg gtatcaaaac ctcatgtctc 720
tgcccagttt ttgtgaatac tgggttcacc aaaaatccaa gcacaagatt atggcctgta 780
ttggagacag atgaagtcgt aagaagtctg atagatggaa tacttaccaa taagaaaatg 840
atttttgttc catcgtatat caatatcttt ctgagactac agaaggtttc ttcc 894
<210> 20
<211> 813
<212> DNA
<213> Homo sapien
<400> 20
atgaacatca tcctagaaat ccttctgctt ctgatcacca tcatctactc ctacttggag 60
tcgttggtga agtttttcat tcctcagagg agaaaatctg tggctgggga gattgttctc 120
attactggag ctgggcatgg aataggcagg cagactactt atgaatttgc aaaacgacag 180
agcatattgg ttctgtggga tattaataag cgcggtgtgg aggaaactgc agctgagtgc 240
cgaaaactag gcgtcactgc gcatgcgtat gtggtagact gcagcaacag agaagagatc 300
tatcgctctc taaatcaggt gaagaaagaa gtgggtgatg taacaatcgt ggtgaataat 360
gctgggacag tatatccagc cgatcttctc agcaccaagg atgaagagat taccaagaca 420
tttgaggtca acatcctagg acatttttgg atcacaaaag cacttcttcc atcgatgatg 480
gagagaaatc atggccacat cgtcacagtg gcttcagtgt gcggccacga agggattcct 540
tacctcatcc catattgttc cagcaaattt gccgctgttg gctttcacag aggtctgaca 600
tcagaacttc aggccttggg aaaaactggt atcaaaacct catgtctctg cccagttttt 660
gtgaatactg ggttcaccaa aaatccaagc acaagattat ggcctgtatt ggagacagat 720
gaagtcgtaa gaagtctgat agatggaata cttaccaata agaaaatgat ttttgttcca 780
tcgtatatca atatctttct gagactacag aag 813
<210> 21
<211> 300
<212> PRT
<213> Homo sapien
<400> 21
Met Asn Ile Ile Leu Glu Ile Leu Leu Leu Leu Ile Thr Ile Ile Tyr
1 5 10 15
Ser Tyr Leu Glu Ser Leu Val Lys Phe Phe Ile Pro Gln Arg Arg Lys
20 25 30
Ser Val Ala Gly Glu Ile Val Leu Ile Thr Gly Ala Gly His Gly Ile
35 40 45
Gly Arg Gln Thr Thr Tyr Glu Phe Ala Lys Arg Gln Ser Ile Leu Val
50 55 60
Leu Trp Asp Ile Asn Lys Arg Gly Val Glu Glu Thr Ala Ala Glu Cys
65 70 75 80
Arg Lys Leu Gly Val Thr Ala His Ala Tyr Val Val Asp Cys Ser Asn
85 90 95
Arg Glu Glu Ile Tyr Arg Ser Leu Asn Gln Val Lys Lys Glu Val Gly
100 105 110
Asp Val Thr Ile Val Val Asn Asn Ala Gly Thr Val Tyr Pro Ala Asp
115 120 125
Leu Leu Ser Thr Lys Asp Glu Glu Ile Thr Lys Thr Phe Glu Val Asn
130 135 140
Ile Leu Gly His Phe Trp Ile Thr Lys Ala Leu Leu Pro Ser Met Met
145 150 155 160
Glu Arg Asn His Gly His Ile Val Thr Val Ala Ser Val Cys Gly His
165 170 175
Glu Gly Ile Pro Tyr Leu Ile Pro Tyr Cys Ser Ser Lys Phe Ala Ala
180 185 190
Val Gly Phe His Arg Gly Leu Thr Ser Glu Leu Gln Ala Leu Gly Lys
195 200 205
Thr Gly Ile Lys Thr Ser Cys Leu Cys Pro Val Phe Val Asn Thr Gly
210 215 220
Phe Thr Lys Asn Pro Ser Thr Arg Leu Trp Pro Val Leu Glu Thr Asp
225 230 235 240
Glu Val Val Arg Ser Leu Ile Asp Gly Ile Leu Thr Asn Lys Lys Met
245 250 255
Ile Phe Val Pro Ser Tyr Ile Asn Ile Phe Leu Arg Leu Gln Lys Phe
260 265 270
Leu Pro Glu Arg Ala Ser Ala Ile Leu Asn Arg Met Gln Asn Ile Gln
275 280 285
Phe Glu Ala Val Val Gly His Lys Ile Lys Met Lys
290 295 300
<210> 22
<211> 264
<212> PRT
<213> Homo sapien
<400> 22
Met Asn Ile Ile Leu Glu Ile Leu Leu Leu Leu Ile Thr Ile Ile Tyr
1 5 10 15
Ser Tyr Leu Glu Ser Leu Val Lys Phe Phe Ile Pro Gln Arg Arg Lys
20 25 30
Ser Val Ala Gly Glu Ile Val Leu Ile Thr Gly Ala Gly His Gly Ile
35 40 45
Gly Arg Gln Thr Thr Tyr Glu Phe Ala Lys Arg Gln Ser Ile Leu Val
50 55 60
Leu Trp Asp Ile Asn Lys Val Lys Lys Glu Val Gly Asp Val Thr Ile
65 70 75 80
Val Val Asn Asn Ala Gly Thr Val Tyr Pro Ala Asp Leu Leu Ser Thr
85 90 95
Lys Asp Glu Glu Ile Thr Lys Thr Phe Glu Val Asn Ile Leu Gly His
100 105 110
Phe Trp Ile Thr Lys Ala Leu Leu Pro Ser Met Met Glu Arg Asn His
115 120 125
Gly His Ile Val Thr Val Ala Ser Val Cys Gly His Glu Gly Ile Pro
130 135 140
Tyr Leu Ile Pro Tyr Cys Ser Ser Lys Phe Ala Ala Val Gly Phe His
145 150 155 160
Arg Gly Leu Thr Ser Glu Leu Gln Ala Leu Gly Lys Thr Gly Ile Lys
165 170 175
Thr Ser Cys Leu Cys Pro Val Phe Val Asn Thr Gly Phe Thr Lys Asn
180 185 190
Pro Ser Thr Arg Leu Trp Pro Val Leu Glu Thr Asp Glu Val Val Arg
195 200 205
Ser Leu Ile Asp Gly Ile Leu Thr Asn Lys Lys Met Ile Phe Val Pro
210 215 220
Ser Tyr Ile Asn Ile Phe Leu Arg Leu Gln Lys Phe Leu Pro Glu Arg
225 230 235 240
Ala Ser Ala Ile Leu Asn Arg Met Gln Asn Ile Gln Phe Glu Ala Val
245 250 255
Val Gly His Lys Ile Lys Met Lys
260
<210> 23
<211> 261
<212> PRT
<213> Homo sapien
<400> 23
Met Asn Ile Ile Leu Glu Ile Leu Leu Leu Leu Ile Thr Ile Ile Tyr
1 5 10 15
Ser Tyr Leu Glu Ser Leu Val Lys Phe Phe Ile Pro Gln Arg Arg Lys
20 25 30
Ser Val Ala Gly Glu Ile Val Leu Ile Thr Gly Ala Gly His Gly Ile
35 40 45
Gly Arg Gln Thr Thr Tyr Glu Phe Ala Lys Arg Gln Ser Ile Leu Val
50 55 60
Leu Trp Asp Ile Asn Lys Arg Gly Val Glu Glu Thr Ala Ala Glu Cys
65 70 75 80
Arg Lys Leu Gly Val Thr Ala His Ala Tyr Val Val Asp Cys Ser Asn
85 90 95
Arg Glu Glu Ile Tyr Arg Ser Leu Asn Gln Val Lys Lys Glu Val Gly
100 105 110
Asp Val Thr Ile Val Val Asn Asn Ala Gly Thr Val Tyr Pro Ala Asp
115 120 125
Leu Leu Ser Thr Lys Asp Glu Glu Ile Thr Lys Thr Phe Glu Val Asn
130 135 140
Ile Leu Gly His Phe Trp Ile Thr Lys Ala Leu Leu Pro Ser Met Met
145 150 155 160
Glu Arg Asn His Gly His Ile Val Thr Val Ala Ser Val Cys Gly His
165 170 175
Glu Gly Ile Pro Tyr Leu Ile Pro Tyr Cys Ser Ser Lys Phe Ala Ala
180 185 190
Val Gly Phe His Arg Gly Leu Thr Ser Glu Leu Gln Ala Leu Gly Lys
195 200 205
Thr Gly Ile Lys Thr Ser Cys Leu Cys Pro Val Phe Val Asn Thr Gly
210 215 220
Phe Thr Lys Asn Pro Ser Thr Arg Phe Leu Pro Glu Arg Ala Ser Ala
225 230 235 240
Ile Leu Asn Arg Met Gln Asn Ile Gln Phe Glu Ala Val Val Gly His
245 250 255
Lys Ile Lys Met Lys
260
<210> 24
<211> 274
<212> PRT
<213> Homo sapien
<400> 24
Met Asn Ile Ile Leu Glu Ile Leu Leu Leu Leu Ile Thr Ile Ile Tyr
1 5 10 15
Ser Tyr Leu Glu Ser Leu Val Lys Phe Phe Ile Pro Gln Arg Arg Lys
20 25 30
Ser Val Ala Gly Glu Ile Val Leu Ile Thr Gly Ala Gly His Gly Ile
35 40 45
Gly Arg Gln Thr Thr Tyr Glu Phe Ala Lys Arg Gln Ser Ile Leu Val
50 55 60
Leu Trp Asp Ile Asn Lys Arg Gly Val Glu Glu Thr Ala Ala Glu Cys
65 70 75 80
Arg Lys Leu Gly Val Thr Ala His Ala Tyr Val Val Asp Cys Ser Asn
85 90 95
Arg Glu Glu Ile Tyr Arg Ser Leu Asn Gln Val Lys Lys Glu Val Gly
100 105 110
Asp Val Thr Ile Val Val Asn Asn Ala Gly Thr Val Tyr Pro Ala Asp
115 120 125
Leu Leu Ser Thr Lys Asp Glu Glu Ile Thr Lys Thr Phe Glu Val Asn
130 135 140
Ile Leu Gly His Phe Trp Ile Thr Lys Ala Leu Leu Pro Ser Met Met
145 150 155 160
Glu Arg Asn His Gly His Ile Val Thr Val Ala Ser Val Cys Gly His
165 170 175
Glu Gly Ile Pro Tyr Leu Ile Pro Tyr Cys Ser Ser Lys Phe Ala Ala
180 185 190
Val Gly Phe His Arg Gly Leu Thr Ser Glu Leu Gln Ala Leu Gly Lys
195 200 205
Thr Gly Ile Lys Thr Ser Cys Leu Cys Pro Val Phe Val Asn Thr Gly
210 215 220
Phe Thr Lys Asn Pro Ser Thr Arg Leu Trp Pro Val Leu Glu Thr Asp
225 230 235 240
Glu Val Val Arg Ser Leu Ile Asp Gly Ile Leu Thr Asn Lys Lys Met
245 250 255
Ile Phe Val Pro Ser Tyr Ile Asn Ile Phe Leu Arg Leu Gln Lys Val
260 265 270
Ser Ser
<210> 25
<211> 324
<212> PRT
<213> Homo sapien
<400> 25
Met Asn Ile Ile Leu Glu Ile Leu Leu Leu Leu Ile Thr Ile Ile Tyr
1 5 10 15
Ser Tyr Leu Glu Ser Leu Val Lys Phe Phe Ile Pro Gln Arg Arg Lys
20 25 30
Ser Val Ala Gly Glu Ile Val Leu Ile Thr Gly Ala Gly His Gly Ile
35 40 45
Gly Arg Gln Thr Thr Tyr Glu Phe Ala Lys Arg Gln Ser Ile Leu Val
50 55 60
Leu Trp Asp Ile Asn Lys Arg Gly Val Glu Glu Thr Ala Ala Glu Cys
65 70 75 80
Arg Lys Leu Gly Val Thr Ala His Ala Tyr Val Val Asp Cys Ser Asn
85 90 95
Arg Glu Glu Ile Tyr Arg Ser Leu Asn Gln Val Lys Lys Glu Val Gly
100 105 110
Asp Val Thr Ile Val Val Asn Asn Ala Gly Thr Val Tyr Pro Ala Asp
115 120 125
Leu Leu Ser Thr Lys Asp Glu Glu Ile Thr Lys Thr Phe Glu Val Asn
130 135 140
Ile Leu Gly His Phe Trp Asn Gly Lys Asp Ile Arg Ser Asn Tyr Leu
145 150 155 160
Asp Val Tyr Arg Ile Glu Asp Thr Phe Gly Arg Asp Ser Glu Ile Thr
165 170 175
Lys Ala Leu Leu Pro Ser Met Met Glu Arg Asn His Gly His Ile Val
180 185 190
Thr Val Ala Ser Val Cys Gly His Glu Gly Ile Pro Tyr Leu Ile Pro
195 200 205
Tyr Cys Ser Ser Lys Phe Ala Ala Val Gly Phe His Arg Gly Leu Thr
210 215 220
Ser Glu Leu Gln Ala Leu Gly Lys Thr Gly Ile Lys Thr Ser Cys Leu
225 230 235 240
Cys Pro Val Phe Val Asn Thr Gly Phe Thr Lys Asn Pro Ser Thr Arg
245 250 255
Leu Trp Pro Val Leu Glu Thr Asp Glu Val Val Arg Ser Leu Ile Asp
260 265 270
Gly Ile Leu Thr Asn Lys Lys Met Ile Phe Val Pro Ser Tyr Ile Asn
275 280 285
Ile Phe Leu Arg Leu Gln Lys Phe Leu Pro Glu Arg Ala Ser Ala Ile
290 295 300
Leu Asn Arg Met Gln Asn Ile Gln Phe Glu Ala Val Val Gly His Lys
305 310 315 320
Ile Lys Met Lys
<210> 26
<211> 284
<212> PRT
<213> Homo sapien
<400> 26
Met Asn Ile Ile Leu Glu Ile Leu Leu Leu Leu Ile Thr Ile Ile Tyr
1 5 10 15
Ser Tyr Leu Glu Ser Leu Val Lys Phe Phe Ile Pro Gln Arg Arg Lys
20 25 30
Ser Val Ala Gly Glu Ile Val Leu Ile Thr Gly Ala Gly His Gly Ile
35 40 45
Gly Arg Gln Thr Thr Tyr Glu Phe Ala Lys Arg Gln Ser Ile Leu Val
50 55 60
Leu Trp Asp Ile Asn Lys Arg Gly Val Glu Glu Thr Ala Ala Glu Cys
65 70 75 80
Arg Lys Leu Gly Val Thr Ala His Ala Tyr Val Val Asp Cys Ser Asn
85 90 95
Arg Glu Glu Ile Tyr Arg Ser Leu Asn Gln Val Lys Lys Glu Val Gly
100 105 110
Asp Val Thr Ile Val Val Asn Asn Ala Gly Thr Val Tyr Pro Ala Asp
115 120 125
Leu Leu Ser Thr Lys Asp Glu Glu Ile Thr Lys Thr Phe Glu Val Asn
130 135 140
Ile Leu Gly His Phe Trp Ile Thr Lys Ala Leu Leu Pro Ser Met Met
145 150 155 160
Glu Arg Asn His Gly His Ile Val Thr Val Ala Ser Val Cys Gly His
165 170 175
Glu Gly Ile Pro Tyr Leu Ile Pro Tyr Cys Ser Ser Lys Phe Ala Ala
180 185 190
Val Gly Phe His Arg Gly Leu Thr Ser Glu Leu Gln Ala Leu Gly Lys
195 200 205
Thr Gly Ile Lys Thr Ser Cys Leu Cys Pro Val Phe Val Asn Thr Gly
210 215 220
Phe Thr Lys Asn Pro Ser Thr Arg Leu Trp Pro Val Leu Glu Thr Asp
225 230 235 240
Glu Val Val Arg Ser Leu Ile Asp Gly Ile Leu Thr Asn Lys Lys Met
245 250 255
Ile Phe Val Pro Ser Tyr Ile Asn Ile Phe Leu Arg Leu Gln Lys Leu
260 265 270
Ser Thr Ala Gln Asn Thr Gln Ile Leu Lys His Gln
275 280
<210> 27
<211> 238
<212> PRT
<213> Homo sapien
<400> 27
Met Asn Ile Ile Leu Glu Ile Leu Leu Leu Leu Ile Thr Ile Ile Tyr
1 5 10 15
Ser Tyr Leu Glu Ser Leu Val Lys Phe Phe Ile Pro Gln Arg Arg Lys
20 25 30
Ser Val Ala Gly Glu Ile Val Leu Ile Thr Gly Ala Gly His Gly Ile
35 40 45
Gly Arg Gln Thr Thr Tyr Glu Phe Ala Lys Arg Gln Ser Ile Leu Val
50 55 60
Leu Trp Asp Ile Asn Lys Val Lys Lys Glu Val Gly Asp Val Thr Ile
65 70 75 80
Val Val Asn Asn Ala Gly Thr Val Tyr Pro Ala Asp Leu Leu Ser Thr
85 90 95
Lys Asp Glu Glu Ile Thr Lys Thr Phe Glu Val Asn Ile Leu Gly His
100 105 110
Phe Trp Ile Thr Lys Ala Leu Leu Pro Ser Met Met Glu Arg Asn His
115 120 125
Gly His Ile Val Thr Val Ala Ser Val Cys Gly His Glu Gly Ile Pro
130 135 140
Tyr Leu Ile Pro Tyr Cys Ser Ser Lys Phe Ala Ala Val Gly Phe His
145 150 155 160
Arg Gly Leu Thr Ser Glu Leu Gln Ala Leu Gly Lys Thr Gly Ile Lys
165 170 175
Thr Ser Cys Leu Cys Pro Val Phe Val Asn Thr Gly Phe Thr Lys Asn
180 185 190
Pro Ser Thr Arg Leu Trp Pro Val Leu Glu Thr Asp Glu Val Val Arg
195 200 205
Ser Leu Ile Asp Gly Ile Leu Thr Asn Lys Lys Met Ile Phe Val Pro
210 215 220
Ser Tyr Ile Asn Ile Phe Leu Arg Leu Gln Lys Val Ser Ser
225 230 235
<210> 28
<211> 298
<212> PRT
<213> Homo sapien
<400> 28
Met Asn Ile Ile Leu Glu Ile Leu Leu Leu Leu Ile Thr Ile Ile Tyr
1 5 10 15
Ser Tyr Leu Glu Ser Leu Val Lys Phe Phe Ile Pro Gln Arg Arg Lys
20 25 30
Ser Val Ala Gly Glu Ile Val Leu Ile Thr Gly Ala Gly His Gly Ile
35 40 45
Gly Arg Gln Thr Thr Tyr Glu Phe Ala Lys Arg Gln Ser Ile Leu Val
50 55 60
Leu Trp Asp Ile Asn Lys Arg Gly Val Glu Glu Thr Ala Ala Glu Cys
65 70 75 80
Arg Lys Leu Gly Val Thr Ala His Ala Tyr Val Val Asp Cys Ser Asn
85 90 95
Arg Glu Glu Ile Tyr Arg Ser Leu Asn Gln Val Lys Lys Glu Val Gly
100 105 110
Asp Val Thr Ile Val Val Asn Asn Ala Gly Thr Val Tyr Pro Ala Asp
115 120 125
Leu Leu Ser Thr Lys Asp Glu Glu Ile Thr Lys Thr Phe Glu Val Asn
130 135 140
Ile Leu Gly His Phe Trp Asn Gly Lys Asp Ile Arg Ser Asn Tyr Leu
145 150 155 160
Asp Val Tyr Arg Ile Glu Asp Thr Phe Gly Arg Asp Ser Glu Ile Thr
165 170 175
Lys Ala Leu Leu Pro Ser Met Met Glu Arg Asn His Gly His Ile Val
180 185 190
Thr Val Ala Ser Val Cys Gly His Glu Gly Ile Pro Tyr Leu Ile Pro
195 200 205
Tyr Cys Ser Ser Lys Phe Ala Ala Val Gly Phe His Arg Gly Leu Thr
210 215 220
Ser Glu Leu Gln Ala Leu Gly Lys Thr Gly Ile Lys Thr Ser Cys Leu
225 230 235 240
Cys Pro Val Phe Val Asn Thr Gly Phe Thr Lys Asn Pro Ser Thr Arg
245 250 255
Leu Trp Pro Val Leu Glu Thr Asp Glu Val Val Arg Ser Leu Ile Asp
260 265 270
Gly Ile Leu Thr Asn Lys Lys Met Ile Phe Val Pro Ser Tyr Ile Asn
275 280 285
Ile Phe Leu Arg Leu Gln Lys Val Ser Ser
290 295
<210> 29
<211> 271
<212> PRT
<213> Homo sapien
<400> 29
Met Asn Ile Ile Leu Glu Ile Leu Leu Leu Leu Ile Thr Ile Ile Tyr
1 5 10 15
Ser Tyr Leu Glu Ser Leu Val Lys Phe Phe Ile Pro Gln Arg Arg Lys
20 25 30
Ser Val Ala Gly Glu Ile Val Leu Ile Thr Gly Ala Gly His Gly Ile
35 40 45
Gly Arg Gln Thr Thr Tyr Glu Phe Ala Lys Arg Gln Ser Ile Leu Val
50 55 60
Leu Trp Asp Ile Asn Lys Arg Gly Val Glu Glu Thr Ala Ala Glu Cys
65 70 75 80
Arg Lys Leu Gly Val Thr Ala His Ala Tyr Val Val Asp Cys Ser Asn
85 90 95
Arg Glu Glu Ile Tyr Arg Ser Leu Asn Gln Val Lys Lys Glu Val Gly
100 105 110
Asp Val Thr Ile Val Val Asn Asn Ala Gly Thr Val Tyr Pro Ala Asp
115 120 125
Leu Leu Ser Thr Lys Asp Glu Glu Ile Thr Lys Thr Phe Glu Val Asn
130 135 140
Ile Leu Gly His Phe Trp Ile Thr Lys Ala Leu Leu Pro Ser Met Met
145 150 155 160
Glu Arg Asn His Gly His Ile Val Thr Val Ala Ser Val Cys Gly His
165 170 175
Glu Gly Ile Pro Tyr Leu Ile Pro Tyr Cys Ser Ser Lys Phe Ala Ala
180 185 190
Val Gly Phe His Arg Gly Leu Thr Ser Glu Leu Gln Ala Leu Gly Lys
195 200 205
Thr Gly Ile Lys Thr Ser Cys Leu Cys Pro Val Phe Val Asn Thr Gly
210 215 220
Phe Thr Lys Asn Pro Ser Thr Arg Leu Trp Pro Val Leu Glu Thr Asp
225 230 235 240
Glu Val Val Arg Ser Leu Ile Asp Gly Ile Leu Thr Asn Lys Lys Met
245 250 255
Ile Phe Val Pro Ser Tyr Ile Asn Ile Phe Leu Arg Leu Gln Lys
260 265 270
<210> 30
<211> 23830
<212> DNA
<213> Homo sapien
<400> 30
atggtccgag gggggcgggg ctgacgtcgc gctgggaatg ccctggccga gacactgagg 60
cagggtagag agcgcttgcg ggcgccgggc ggagctgctg cggatcagga cccgagccga 120
ttcccgatcc cgacccagat cctaacccgc gcccccgccc cgccgccgcc gccatgtacg 180
acgcagagcg cggctggagc ttgtccttcg cgggctgcgg cttcctgggc ttctaccacg 240
tcggggcgac ccgctgcctg agcgagcacg ccccgcacct cctccgcgac gcgcgcatgt 300
tgttcggcgc ttcggccggg gcgttgcact gcgtcggcgt cctctccggt atcccgctgg 360
gtgcgtctgg ggacgctgcc cgggctccac gtgcggagtg ggtgccccct aggccgggga 420
gcgggggatc cccaggggtc gcggggccct ggaggagcgg gcatcggacg cggacacggc 480
ggggtgcatc ccgagggccc cctccgaggc agatgcttcc tgcgggggcg ctgttcctgg 540
gcccgggaag ggggcgttgg aaccccgagc ggtccgggcc gaagcctggg actctcgtgc 600
gtccccaccc ctacccccat caggcgcccg tgcatgaagg gagaccctca cctccggact 660
gagagtcgga gcgtctcgga gcgacgggga gtagggagcg ggacccgggg cggagggtag 720
tgctggcccc tgcggactcc gggtcccctg tgtcctctcg ggaggggctg gacgggctga 780
gctgccgagg ggccgatttg ccctgggccg gacaaagagt ggggctttgg ccggtccccc 840
acggtgggct ccttccctct ggggattgag ggactcaaga caccccgcgc ctgcgctttt 900
cttttctttt tttctttttt tttttttgag acggagtttc gctcagtcgc ccaggctgga 960
gtgcagtggc gtgatctcaa ctcactgcaa gctccacctc ccaggttcac gccattctcc 1020
tgcctcagcc tcccgagtag ctgggactac aggcgccagc caccaagccc ggctaatttt 1080
ttgtattttt tagtagagac ggggtttcac cgtgttagcc aggatggtct cgatctcctg 1140
acctcgtgat ctgcccacct cggcctccca gaatgctggg gttacaggcg tgagccactg 1200
ctccctgctg cctacgctct ctgggtcgca gcccagcctt ctgggggctg ggtagcctcc 1260
cagaagggca accctgggca tcctccaggg caggctaact ggagtctagt ggggaggggt 1320
accttgaaag aggaaagttg tttcctcctc ctcctcctcc tccagtgttt gggacccttc 1380
ctgggggctg gagtgcatcc ctggacaccc cccaatccca tcctcttctc tagtttccac 1440
tgacctaggc ccaccctccc ctctccggct cagtactcct ggaaatgaga ttccgtacat 1500
ttgaatcttg tcctaatgaa atatttgtcc atgtgggtac ctgtgtgtgt gtggtggggg 1560
tgcagacgga gggtttgttt ctcactagct ggaactactg gggtgtggta tgcttcctgg 1620
gaatttgtgt gccacagtcc tggaggcgag gagggggttg tgagccagta ggcaggggct 1680
ggggcaagta gcattgtgaa gctattgaca cccagacgtc cccaggcagg agattatgcc 1740
cccattagcc cccttttatc tgggcttcct taacaatgga ctctttgccc tgcctgccag 1800
agccagcagg gagtgactgt tcagtggtga ggaagcgggc agaggaagcc ctgccattgg 1860
gtaggagcag tgggcagccc ctgggctgac tgggaggtgg ggattaggga ttagacagtc 1920
ctggctgtct gccttcccct aagccagggg gagaggagca aagggcacga aatgtggcct 1980
ccaggaggat tagaccgcca catgatcatt tgcacaccct ggggtttagc aacaataaaa 2040
gtcagctttt ttgtatccca aggtggcctg tggacaccca catggacaaa tgtttacact 2100
gggacagaat tcaaatgcag aggtcccagg agcctaaagt acactcactc tggtatagaa 2160
aggattcctt actgggcaga ggacaggtgc agcctggggc tttcccaggc aggacacagg 2220
gaggctcagg aaccaccaag tccctggaag gtggatctgg aggcgttggc aggagccact 2280
ccctgggttc cagggctcca ggttcctgct ttaaccccct gtctcacaga gggctgtgca 2340
cttgggggct gctgagcatg tcccagaggc tgcatcctgg acacagcacc tcagtgcatc 2400
tgagctgagg ctaacttggc aggagggaca ggcagaacct gccagccacg tgcaattcca 2460
cccctctggc cactcaggga aggagagctg tgagtcaaga tcagatttgg gtcaggacag 2520
gctggggcct gcctgtccct gtgcatccca agatttatgg ctggccaggg gttgggctgg 2580
gaggggtggt cttgcatgcc aggagagtgc agatcagcct gagaggccag gccagtaagt 2640
gaggtcagat ctcctgcacc tgatagcatt aaggccatct acaccaaagc tctaatgctg 2700
atatgttcct ggcctctatg tggggcatgg aggtggggca tggaggtgag gcctgctcgc 2760
ctgggcttct ggaagtggga gactcattcc tgtggctgag gcctacagca gtgctgtgtg 2820
gtaggaatac actggaagcc atgatgtcat tgtgcatttt ctagaagcca cattgaataa 2880
agtaaaagac acaggtagaa ttaatttcat tgagcccaat atatccaaaa taatatcatt 2940
ttcacatcta ttcaatataa aaatttacta atgagatatt tcatactaag ccactgaaat 3000
ccagtttgta tcttacacat ctcagttttg acgagccaca tttcaagggc gtgatagcca 3060
catgtggctc ccatagtaga cagtactggt ctagagaaat gttggtggca tccttgctgt 3120
ctggtttctg gccttgccaa aagtattacc atcccagtgt ggtacattct ttcatgtatt 3180
tgtctcctgt ccccagagca gactctgcag gtcctctcag atcttgtgcg gaaggccagg 3240
agtcggaaca ttggcatctt ccatccatcc ttcaacttaa gcaagttcct ccgacagggt 3300
ctctgcaaat gcctcccggc caatgtccac cagctcatct ccggcaaaat aggcatctct 3360
cttaccagag tgtctgatgg ggaaaacgtt ctggtgtctg actttcggtc caaagacgaa 3420
gtcgtggatg taagcagttt gcttatctgg acgttgtcaa gttagaaaag ctgttttggg 3480
atgggtgtgg tggctcatgc ctgtcatccc ggcactttgg gaggccgaag cgggtgggtt 3540
gcttgagccc aggagctcga gaccaacatg atgaaaccca gtctctacaa aaattacaga 3600
aaaattagct aggcatggtg ttgtgggccc atagtcccag ctactaggga ggctgaggca 3660
ggagaattgc ttgagcctgg gaggtggagg ttgcagtaag tcatgatcat gccactgtac 3720
tccagcccgg gtgacagtga gatgctgtct ggaaaaaaaa aaaaaagaaa gactgttttg 3780
ttttggaagc aacacaggca gttgtaggcc ccctgtgcca gagtgacata aactctgtac 3840
acctccagtg atttggtcca tgtttgtaaa ccctgaatgt tccagggcag tttcttttct 3900
tcacttttta tctctttttt ttgggtgggg gggcggggta cagagtcttg ctctgtctcc 3960
caggctggag tgcagtggcg caatctcaac ctcccgagga gctgggacta caggcacagg 4020
ccatcacacc ttgctaatgt ttgtactttt tgtagagacg gggttttgcc ctgttgccca 4080
ggctggtccc aaactcctgc acccaagtaa tctgcccacc tctgcctggc agttacaatt 4140
tcaaataatt cctccctttc cttcaacact tggctcatga ccgtccagtc caaggaacct 4200
gtcctgcagg tgtgcctctc ccgagcttcc tctatgcatc ttccataatg aagatgcctt 4260
ctcactggaa accctacaag ggtgggaacg tgccttattt gcctgtatcc tcagggtcta 4320
gcagagagaa gataatttgt aataccaaaa caccattaaa ttcagctgat gctttcataa 4380
gcgctccttg gaggaaggac tccatttact tgacagatct gtgcaagaca gcagcctggc 4440
gcgtctaacc tgcagccagt tgcatcctct gtttaacctt gtttgcggaa gctttctcta 4500
aacagccagc acttgtctgt tcccacatgg gtccgttctc ccagtgaatc accgtggtgc 4560
ctgctgactg ctctgtagca cagtgcttcg caaagtgtga tcctgggacc agcagagcag 4620
cagctccttt gagcttattg gaatggcaga ccctcaggtc ccacctctga cctgctgcat 4680
gggaattctg gggagggacg cagaatctct ggttccacag gctctccggt gatgctaatg 4740
aataccggca tttgaacagc accgatctag cccctttcag tccatgagcc aacaaccctt 4800
ggtcctgtct gtggtgaccc agtgtgactc tcatggggag caaggagagg aagttgaagt 4860
tcactgacag ggttgttaag gggattatgc aatagatgag acccatgggc ctgaagtccg 4920
agggtgtatg ttagttcccc gttcttttga cccatggatt aacctactct gtgcaaaggg 4980
cattttcaag tttgttgccc tgctcacttg gagaaagctt atgaaggatc aggaaaatta 5040
aaagggtgct ctcgcctata acttctctct cctttgcttt cacaggcctt ggtatgttcc 5100
tgcttcatcc ccttctacag tggccttatc cctccttcct tcagaggcgt ggtaagtcgg 5160
ctttctctgc tagcgctgag tcctgggggc ctctgaagtg tgctcacaca tctcctgcct 5220
gcagggcact ggtgtcgggc acctcagggt ctgtcccatg gtggagcccc atgcctcact 5280
gcctttcaga cagagtagcc acagctggcc ctatttccag gctacccggg cagcaaaact 5340
tactgcatgt gtaattaatt atttggctat ctgtaaggta aactggctgg ttcacttaat 5400
ctgcacctta agcatcagat agcttctcag tgatctagtt aaactatatg atgttggcca 5460
ggcgcggtgg ctcatgtctg taatcccagc actttgggag cctgaagcag gcagatcact 5520
tgaggtcagg agttcgagac cagcctggcc aacagtgtga aactctgtct ctcctaaaaa 5580
tacaaaaatt agctgggcat ggtggtgtgc acctgtaatc ccagctgctc gggaggctga 5640
ggcaggagaa ttgcttgaac ttgggaggcg gaagttgcag tgagccaaga tcgcaccact 5700
gcactccatc ctgggtgaca gagcgagact ctatctcaaa aagaaaaaaa aaaaaaaggt 5760
aaataaagta tatgacactg aagaatctgt tacccctgga aggtggagct ttactcttag 5820
ggggaactat aacagtcata tatatatatt tttttctttt cttttttttt ttttttgaga 5880
tggagtctgg ctctgtcgcc caggctggag tgcagtggtg caatctcggc tcactgcaac 5940
ctccacctca caggttcagg caattctcct gcctcaacct cccgagtagc tgggattaca 6000
ggtgcctgcc gtcacgccaa gctaattttt gtatttttag tagagacagg gtttcatcat 6060
attggccagg ctggtctcca actcctgacc tcaggtgatc cgcccgcctt ggcctcccaa 6120
agtgctgaga ttacaggcgt gagccatggt gcccggccaa caatcacatg tgttgtaaac 6180
aacaacaaaa atctgtcagc ctggtctaac ctagatttgt gctttgtttt gttttgccac 6240
tttgtgatgc acaggaggaa gtttaggctg taaaatacta gccttttagg gtaatttttg 6300
aactcacaag agcagcagcg gaacctttga tgcaatcctg tatgtagcac cagcagagcc 6360
acgtggcaga gggactcgca ttaggagcct cccattacag actacgtgct cctgtgcgtt 6420
atcttatagg gtccccacaa ccaaggggag atgtgattat tcatcctgtg tggctgtggg 6480
gaacttgaga gtcatacttg cccaaagagc acggccagcg agcttgcacc caggtcactc 6540
tctgctcctc tgtcagaaca gggcatgtct tggttcactg cagggcggct cttctcattc 6600
tctgtagttt ggggtccagg atagtggtcc acggagccac tggagtgccc agctactgag 6660
tgaccaaagc atattttgga tttccgacat tgccacagca tggttgggca tcagcaggac 6720
cccaacccct tgttatgctg gtggctttat gtggttattt gatcttcccc agaactcagc 6780
aggagtgcac ccagcagcac cgtagtgatg ctctctggct ccccagtgca cggttctggc 6840
tttccttcct ggtcgagagt ttcaagccct ctgggtccta ctctgtcctt ttcagcccat 6900
agctttgttc aaaagctgct ggcagtgttc agatttggct gagttcagtg aatatgtgca 6960
ttggctgatt tctgagccat gccaggggga tggagaagcc gaagcaggag tgtttgttct 7020
gcaggctctg gagtaggcat tgggtctgtg ccggctcact tgctagtctt gcatccttcc 7080
ccaaccccct ctggggatgt ctggccacat cagaagacag tttgggttgt cagaactggg 7140
ggagtaccag gccgaggtgg gtggatcatg aggtcaggag atcgagacca tcctggctaa 7200
cacagtgaaa cctcatctct actaaacata cgaaaaaaat tagctgggcg tggtggcggg 7260
cgcctgtagt cccagctact cgggaggctg aggcaggaga atggtgtgaa cccggggggc 7320
ggagcttgca gtgagctgag atcctgccac tgcactccag cctgggcaac aaagcgagac 7380
tccgtctcac aaacaaaaca aaacaaaaca aaacaaaatc tgggggagtg ccactggcat 7440
ctgatgtata gaggcccgag atgctgtgtc atcacccgtt gagtgcgctc ataggcatct 7500
tcctgacaat tagaacccat tattcttcaa attcaatgca agcaaattca aagcattact 7560
gtgtacatac cgcatgctaa tcaattgcac cactggagct cctaaattca aaacattact 7620
ataaaaaagt tcaaaatgca tggaaaagtt gtacatggca ggagaatatt tgggcttctg 7680
actacccctt gaatgaagat gatccaccag ccgccttcct ccttggtctt cactccagat 7740
tcctagcatt tcattctgtg tctctttatg cagtgaggtt tttgtttgtt ttttgagaca 7800
gagtctcact gtatcaccta ggcctggagt gcagtggcgc gatctcagct cactgcaacc 7860
ctcggctcct gggtttaagc gattctcctg cctcagcctc ccgagcagct gagattacaa 7920
gcacacatcc ccatgcccag ctaatttttg tatttttagc agagacaggg tttcaccatg 7980
ttgcccaggc tggtctcgaa ctcctggcct caagtgatcc atgtgcctca gccttccaaa 8040
gtgctgggat tacaggcgtg agccaccatg cccagctcct agtgaggttt ttgatgcctt 8100
gctacatctg ccctagaaat tgtgtgacta cgattttgga aatgttgctg tgtaaacttg 8160
tgatcatttc tggactccag gcaagaatct tgatggctaa ggtgtggctg aacatgtctg 8220
attctctcct ggacctgttt taggccaaac tctgctctga aattcctccg tgtggaaggg 8280
cgggctgggg agagcctccc agctggaatc ttttggatgc ctttctctgt gggtatctga 8340
tggctggctc tgatggctgg ctgtgatggc tgtggctgga aatcattgtt gacatgagtt 8400
tcacagatgc aggctctgtc caaattgtag caaaagctgc ctgccccagc cgagctatgg 8460
gcaataaggt ggtttaagga tatagatgaa ggaaaactca cccttagaat aatttatcca 8520
aaatgctgct gtgttgtggg ttagaggaca ttttctgagg tcccaggttc attgtttcat 8580
ttaagtctca aaagtccctc caggtgttgg ttctaattgt caaagcatgg ggggagatgg 8640
gctcatgggt taaaggtctt atcccagatt tctgtatcct ccttgcaagc agcaaagggg 8700
tctggatttg aatccatgac catgtttctc ctttgggttt ccatcacact ctgtccccgt 8760
gcactgagca ccctttagtt catatgaccc ccttaggcat gttacatggg cactcctata 8820
ggtgcccatc tggccctagg acttggccaa cacaacatgg actccagttt ccatctgcct 8880
ctttgccagg cacttttgtg cagtgcacac actgtacaac agtagacggc aaccctgaga 8940
gccagagtag agcctgtcct agcaccggaa tgctcggtaa ggatttgtcg caggagtgat 9000
tccaaagcca atgtcctccc tccatatcag cctgtttgtg gctctgagaa gctctgccca 9060
catgtgaaag cttgttaagc acttaagcac taacccagag cttcagacag tgccagtcct 9120
ttttcccctt ctttaaaagc gatatgtgga tggaggagtg agtgacaacg tacccttcat 9180
tgatgccaaa acaaccatca ccgtgtcccc cttctatggg gagtacgaca tctgccctaa 9240
agtcaagtcc acgaactttc ttcatgtgga catcaccaag ctcagtctac gcctctgcac 9300
agggaacctc taccttctct cgagagcttt tgtccccccg gatctcaagg tgagttggtg 9360
gtgagggggc aggtgttctg gggtgcagct cttctttgcc tccctgattg ccaggagcta 9420
ccagttactg tctgcacaat caaacagaaa tagacctgtc cttgatggtt aacggaaata 9480
aaaggcgctt gtcccagaag ctcaggtgag gcaccaccct gattatggga atcacctggg 9540
aacatatacc cagacctaaa actcagatcc acttcccagg ctgtggttat atagtcaggg 9600
gggtgcagta tgggtattag gattttttat tttttagtta taaagatttt tttttggttt 9660
gtttttgaga cagggtcttg ctctgccgct taggctggag tgcagtggtg caatcatagc 9720
tcactgaagc ctcagactcc tgggttcaag cagtcctccc acctcagcct cctaaggagc 9780
tgggacccac aggcatgcag caccacacct ggctaatttt taaaaatttt gtggagtgtt 9840
gcccaggctg gtctcacact cctggcctca agcgatcctc ccaccccagc ctcccaatgt 9900
gttgggatta caggcatgag ccattgtacc cagccactaa gatgattctt atttggaaac 9960
acggtcaaga acaactgcgt tcggtagttt aacctttttt gattgtggtg gttttagtat 10020
gccttaccac tctaccatag taagaaattt gcagaccatg tacaccaacc tttggtgctc 10080
ctggggagaa agaaagaagg ctatgcaatg caatgcatgc tcacagtcca agggagaggg 10140
aaagctgtct aacaggattg gttttcccgt gtgctttata agcagatgag tagaggagac 10200
agctcttatt gtcctagtgg caattgggat aggctgcaaa gtttgttagg gtggaggctt 10260
attccgggac caagggagcc caaagaaaca agctcctgcc aggcgcggtg gctcacgcct 10320
gtaatcccag cactttggga ggctgaggca ggtggatcac ctgaggtcag gagtttgaga 10380
ccagcctggc caacatggtg aaaccccgtc tccatgaaaa atacaaaaat tacccgggca 10440
tggtggcggg cacctgtaat cccagctact agggaggctg aggcaggaaa atggcttgaa 10500
cctcggaagt ggaggtggcc gttagccgag atcacgccac tgcactccag cctgggcaac 10560
agagcaagac tctgccttaa aaaaaaaaaa aaaaaaaaga aaagtaaaag gaaaaaaaag 10620
aggctctggc ctgctggggt gcctgcaaag tctccgtgga agggtgacat tcaagccgag 10680
acctccaggg aactgtctcc tgggagcaca gagccctttg ctcagccccc aggtggctca 10740
gtgcccccag ccagcagact cagagcttgc atgattcttt ggtgctctct gcggtcttcc 10800
aatgatgctg aaataaatgg tgcttggtgt ctccctgctg tagtcccctt gcttgctttg 10860
ctcacaggtg ctgggagaga tatgccttcg aggatatttg gatgcattca ggttcttgga 10920
agagaagggt atgtatgggc tgggaggatc agccatgccc ttttgacaag catttactag 10980
cggtcttggt aaagacttga gatttgcctt agttctaaca cttagtgccc aacgccttcc 11040
ttgtgttgct caacctactc atgagcccag gagataggaa atctccgtcc cattgtacag 11100
atggggaaac agaattttgg aaaggagagc caagcagcac acacccctcc ctgaggggca 11160
gagccgagat ttgaactggg atgtcatgac tccagggccc tctccctccc cagggtcccc 11220
ttatctgaag gcggtttttc tttccagctc gacctcttgt gacccttagt ttaacaaggg 11280
ccgaagttaa agagtttctg cgcctggacc ccaaatgaag caatcagatt tctcatctcc 11340
agtcaggtgt gggtccaagc ccactagaca agtttgctct tcccagagca catttctgcc 11400
ttcaagtcat cctggcttgt cagggctggg ggagttctgc tgtagaaata ttagagtgga 11460
aggaaaaaga tgtgttggga gctatttttc tttaatacta aaagttggtt gatgaatttg 11520
tcgttggcca agaccaagga gactgcattt ttaaggacat atgtgtattt atctgctcag 11580
aaaatgttca ttgctgtgtg ctagggatac tgcagtgaac acagaggtgt gacccttgcc 11640
agccttgtga gagaagtgag cagataagta agcagaaggg tgatgctgtg tcgatgggaa 11700
agtacaggtg ccaatgagaa ggcacaggtg tcaaggagaa gacacaggat gctggaggct 11760
catgcaggat ggatctccaa ggcccagggg aagaagggcc tctcggagga cgtgaatcca 11820
cattaagact ttggggataa gtaggagcgc cttaggcatg gggacccatg gatgcgaggc 11880
ctgtaggaca cagacaggat ggcatgaagg cctgtgcaac tggaggggtg gggatgggga 11940
cactaagaga tggctggaag tgtgggggtg gggacactaa gagatgactg gagaagaggg 12000
ggtcaggagt ggtgaaaaat gggagaggag ggcaggctgg gccttttgga tacaggggga 12060
ttgcatcctg cagtggtagg gagccactga gggctgctgc agtaggagtg aggggatcag 12120
aggagagctt tggaagcccc ctggatgcgg gacaggaagc gagataccag tgtctaggag 12180
gccagtgagg cagccacagg ctccaccagg atcagggctg cgagggtcat gaggaggaaa 12240
ccaatttgaa ggagtccagg ggaataggac ttggaaatga ccgatgggac atttgggaag 12300
aggaagacag aagagcgcag tcccggcttc tggctttagc agttgggcaa ggggagatgg 12360
ggagatgtgc ccatgggttg agggttgagg acattaggag ggagccggta tggcaggaag 12420
agctggtgtg ccagagatgc tggaagcagc atctgcctga gaacagatac ctggcaatat 12480
tcctaaggga aagtgacatc tcggagggtg aggagggcat ctgatagggc ctggaaagag 12540
ccggggcaag catgaatgtg aggttatctt ggggggcaag gctcaggcgt tgaggagcag 12600
cccctggtct cttcagcctg aagttggaag ccagagttgg gccaggtgca gctgtggttg 12660
tctgaagtcc ccctccccca gcccagtgtg ccaatgctgt aagagcaagg gccgctcact 12720
ggtgctggtg gctgagtccc agcacccagg acagggcctg gcacatactg gtgcccaatc 12780
ctcccttctg ggtgcttctt ccaaggcctt gtgatggaag tgagtaccct cttcgacatc 12840
agacccagct tcaaatcctg gctctgctat gtattggctg cgtggcttta gacaagtctt 12900
ttaaccttgc tgtgcttctg atttctcagc tgaaaaatgg agatgatgat agtggtttct 12960
gtaaggcctt atggtgaagc acctagctca gggcctggaa ggcaggtgta accagtggtt 13020
cagttgttat aaaccaacac taaccctcgc ctttgcacct catgaaacca gatatgtaga 13080
tggagcccac aaagctagca ggagccaagc tcacgtgtgt cctgctttaa agccccatac 13140
ccctttctcc gggtgacaaa cacctgtgct cgttctcttc ccttcccctc ttccccttgc 13200
atttggctaa taacaggcca gctgcctgcc tccctgcagt ttggtagatg ggtgggtaac 13260
gaccaccact cccacgttcg cctgatgggc ttgttttccg tgcccttcac aggcatctgc 13320
aacaggcccc agccaggcct gaagtcatcc tcagaaggga tggatcctga ggtcgccatg 13380
cccagctggg caaacatgag tctggattct tccccggagt cggctgcctt ggctgtgagg 13440
ctggagggag atgagctgct agaccacctg cgtctcagca tcctgccctg ggatgagagc 13500
atcctggaca ccctctcgcc caggctcgct acaggtaccc actcctcggg gtgagcacgg 13560
gcagcacctt gttttctttc ttgtgcatta tggaggaaga tggtactgcc acatgggagc 13620
gatagggtga ggcaaccatg acaggtggtt gggaacatct ccttccatgt gtacagcctg 13680
ggctgctgcc atcactccca gcacagcccc caaccccccc aatcctggaa ccttgccaag 13740
tctcccttcc catggggtca tgaccaggag gaaaacaaac tccagctgag ccccttgggg 13800
ttccccatat aggctcctgc ctgtggcagc tgggccctct gtaccccttt ccaactctgt 13860
ctccctaaca tggcacctga gctcctgcca tcctggattt catggacccc aaggatgggg 13920
gtcctgcatc tgggacttgg cctattactc ggagctcctt ttcagccgcc tccctccacc 13980
tgtccaccca cctcaaggct cctttcttga gacctctcct aatttctccc ttcccctaaa 14040
cccacaattt tgaacctcca tcgaatggtg ctgtatttta taatgtcatc aaatatcaaa 14100
tggagacagt gctatggtcc aaatgattgt gtacccccca gaatttgtct tttgaaatcc 14160
taacccccaa catgatggtc ttaggaggtg gggcctttgg gaggagatta ggtcatgagg 14220
aaagggctgt catgaatggg attggtgccc ttattaaaca gacccaagag aggtcccttg 14280
tcccttctac tgtgtgagga ctcagaaggt ggtgtctatg aagaagcagg ccctcaccag 14340
acaccaacat gtctgctgcc ccttgatctg ggaccttgca gcctctagaa ctctgaaaaa 14400
tcgatgtttg ttgttttata agccactcag ttggtggcat tttgttagag tagcctgaac 14460
acggactaag tcaaacagaa gaacccacaa accagctaca gagttgggca tttggagaaa 14520
ttcaaaaatg agtcagacat aactccttat tcttgaggtg ccctaagaga tgggacacag 14580
cagctgccca ggtgcattag tttgttctca cattgctata aagaaatacc tgagactggg 14640
taactcataa agaaagaggt tgaattggct cacagttgca caggctggac aggaagcatg 14700
gtgctggcat ctgctcagct tctggggagg cctcaggaaa cttacaatca tggcagaagg 14760
tgaacgggaa gcatgcacat cccatgactg gagcaggagt gagagagaga gggaaataga 14820
gggaaggtgc catacacttt taaacaacca gatctcatga gaacacattc actatcaaga 14880
gaacagcacc agtggggaaa tccgccccca tgatccaatc acctcccatc aggctccgcc 14940
tccaacactg ggaattacaa tttgacatga gatgtgggca gggacacaga tccaaaccat 15000
atgaccagat taatacgatt tgaggcatca cgaggtcatt aaagagaggg aataaaagac 15060
tggggctcca ggaagaaggc tctggaatcc agcagagggt caaggaccag cttgtaaagc 15120
tggtggtgcc tgagaagtac ctaggagaac atagatgctg tgacgtttga tgtagctgtt 15180
ttttgttttg tgttttggtt tttgagacag agtctcactc tgttgcccag gctggagtgt 15240
gcagtggcgt gatcttggct cactggagcc tccatctccc aggttcaaat gatcctcatg 15300
cctcagcctc ctgagttgct gggattacag gtgcacacca ccacgcctgg ctaatttttg 15360
tgttttcagt agagacaggg tttcaccatg ttggccaggc tggtcttgaa ctcctgacct 15420
caagtgatcc aacaacttca gcctcccaaa gtgctgggat gacaggcatg agccaccatg 15480
cccagcctga tgtagctgtt tctgtgcaca ttatttgctg tggggtatat tcagatttct 15540
taatacaaga tgattctttg cctcatgact tacacaccat tttctattta atttcagcta 15600
tgatattgga aatggacatg tcttttcaag gaaaataaaa gcaggctttc tggaatggcg 15660
acttccaaac atatttgtca atttaaagga gctgggagtg gggaccctat gctccgtaag 15720
cactctctta gctgttcttg gctgtgctcc ccgcttcagc ttcacactgc ccttgctgtg 15780
aagggagcag cctgggccgg gcgcggtggc ttacacctgt aatcctagca ctttgggagg 15840
ccgaggtggg tggatcacct gaggtcagga gttcaagacc agcctggcca acatggtgaa 15900
actccatctc tactaaaaat acaaaaaatt agctgggcat ggtggcaggt gcctgtaatc 15960
ccagctactt gggaggctga ggcagaagaa tcgcttgaac ccaggaggcg gaggttgcag 16020
tgagccgaga ttgcgccatt gcactccagc ctgggggcaa caagagcaaa actctgtctg 16080
gaaaaaaaag aaaggagcag cttggcaaac cccaccttgt cgcttttgtg agtgcctctg 16140
accctttggc tgccaggacg ggcgtatttt atggaaatgc taagcaccaa cagagtaaag 16200
tggtttggtt tttcacagtg gtgggagata atagctccaa attgtctttt tcagcactga 16260
gtgaagaaat gaaagacaaa ggtggataca tgagcaagat ttgcaacttg ctacccatta 16320
ggataatgtc ttatgtaatg ctgccctgta ccctgcctgt ggaatctgcc attgcgattg 16380
tccagaggtg agcattttag gtggctccgt gtcttcctca cagggttgat atgaggatga 16440
aacaagatga tagatcatgg tggcatgtag tctgggacct ggattgtcgt gccacagatc 16500
acagctcaca gtctatgtgc aatgcccctg aatgttgccc acctgtcctc aagccacaca 16560
tgcacctgta actcagtgca agcccagaaa ctccccgtgg ggactcctag agctgtcagt 16620
ggcctcacat agcagctggt ccagtctctt gtgattgccc aaggaaactg aggcctggag 16680
agcttggggt cactgctctg aggccataga gatgcctagt agaagggcca ggcctagaag 16740
caggatcctt gctgcccctc tgagctgttt ccatttaaaa tcacatgaag gccggcgccg 16800
tggctcacgg ctgtaatccc agcattttgg gaggccaagg tgggtggatc atgtgaggtc 16860
aggagtttga gaccagcttg gccaacatgg tgaaatgcca tctgtactaa aaatacaaaa 16920
attagtggag catggtggca cgtgcctgta ctcccagcta cttggaaggc tggggcagaa 16980
gaatcgcttg agcctgggag gcagaggttg tagtgagcca agattgtacc actgcactcc 17040
agcctgggtg acaggagaga aaccctatct caaaataaaa tgaaaggtaa tgaaatgaat 17100
aaaataataa atcaagtcac ggccgggcac ggtggctcac acctgtaatc ccagcgcttt 17160
gggaggccga ggtgggtgga taatgaggtc aggagttcaa gaccagcctg gccaacatgg 17220
tgaaaccatg tctctactaa aaatacaaaa attagctggg catggtggtg catgcctgta 17280
atcccagcta ctccggaggc taaggcagga gaattgcttg aagcaggacc taggaggcgg 17340
aggttggttg cagtgagccg agatcatgcc actgcactct agcctgggct acagagcgaa 17400
actccgactc aaaaaaaaaa aaaaaaaaaa atcaaatcac atgaaagtag aacataggga 17460
attccatctt tcgttctagg catagtttgt taatatgatt cagagccagc agttaggaga 17520
acacagtgtg actctcctag aacttcttga ttgggcttcc tctgattggg tttcctctga 17580
ttgggcttcc tctgaaagtg ggggggatgg ggggtgggga gcagaatggt cagagcttgg 17640
ctcagcagtc agactgctct tcttcaaatc ctggctgcat tgcttactac agctgtgtga 17700
ctccagatga ctgaatccac ctctctgtgc tgcagcttcc cgtctagaga gatcacctgg 17760
agcagagggt ggtcaggaga ctcaatctgg ttactgactc acagtgcagg agtactcatc 17820
ccatagtaag catccagcta gagatgttga tttctatttt caggtaataa tgatgatcgt 17880
aaaattagag acagataaaa ggtatgggca ttaggccagg gcactgcaat ttctaagctg 17940
tgtgacctca ggcaagttac tcgacttctc tgagcctcag cggtttcatc cgcaatatat 18000
ggataggaaa accgacctca gtgggttgtc tgacagtgga gggcacttga ttaaaaaaaa 18060
aaaaattacc ctggtctgaa tattaccctg gactgaaaga aaaatattga gctaatacag 18120
gcatcaggaa tggggctgca gggagtccag ggaagggaga acgaagagcc tgaaggtgtg 18180
aggaggtgcg agtgctgatc tgtctgctac aaagaggctg ctgagcctcc tgtggatgtg 18240
gccctggact tggcagttta atacctgagc tgttaaaata acctcagatg ctgtgttctt 18300
taaggggtag gattcagatt cctgctgaaa tgcttctgaa agggagggaa tgagccagcc 18360
catccccagt tgctttttaa gatcattggg aagttctggt cttgccattt gtccctggac 18420
cactcttagg tcctcctgcc ccacttccat ctgggtgtgt gccctgggct gtccaccaca 18480
cagctacatc ctgccatctt ccctcctgga gccactgtgc catgcatgga tctgtagctt 18540
catttttctt ggcttttccc tggtttttct ggagcagagt ctctagtaaa ctcccaagga 18600
agaaaacgtt tgactttatg tgtgttggga aacgtgcttt ttttctatta catctcagtg 18660
ataggttggc catgtctaga attgcaggtt gaaaatcatt tcctctcagt atattggtta 18720
gtgagaagcc tgggactgag acagtcacat tctcacttct ttgcaggtga gtgctcttag 18780
gactgtcttt ttatccctta tactctgaaa tgtcatatgt cttggtgtaa gtccttattt 18840
cagttattga gctggacaag tactggagac cccttcagtc aaagccttct gtcattctcc 18900
agctctagga aattatcttc tattgttatt tctgttattc cttcccttcc attttctttt 18960
ttcttttttt tttttttttt ttgagacagg gtcttactct ggtgcccagg ctggaatgca 19020
gtgacctgat catggtacac tgcagcctga acctcccaga ctcaagtgat cctcccacct 19080
caacctccta agtagctggg actgcaagca cacatcacca cacccaacaa atatttttta 19140
aaaattttgt aagatgggat cttactatgt tgcccagact ttttcttcct cttcctgggg 19200
ctcttattag gaagatgttt gacttcctgg gttggattcc tgtctccgtg tctgactttc 19260
tctctttgtc atatttttca tcactcgttg tctttttgcg tctgctctga cagatttcct 19320
caaattttgt cttctagtcc tatcctacag tttttacttt cagcaaatat aatttaatct 19380
ccaagagtac tctcttgttc ttttttctta gcattctgtt cttgttttat ggatgtaaca 19440
ttctcttgga atatttgctg tcctctagat catcccttct ccatttcttc ttgggctagt 19500
ttttctgttt cttcatcttt ctcttttatg ctacttattc tgggcgtgtt cttggtgggt 19560
tttttcccat atagcaacag aggacttgga gctcagggag aaaagggtag gtgcatcacc 19620
tggcagagct cccagacagt gacaggcagg ctgcgggaag gatgtctact tggcggtgct 19680
accgctttcc tagaaaccct ttccctggag ctggttgaac tgttgggttt tgccctggtg 19740
gtgaacgctg gctccccgtg ctctgcctgt ttcatcacca gccccctccc cttctgcctg 19800
gggtccagta atctgttgaa atatatatct tgctcattgg tgagctcctg ctccttcctc 19860
gttgctcttg cagatttatc acttctcgta aggctgcgct tgtacttcgg gattttctct 19920
gtgccacact gggaaacata gggtggttgc atgctgcagt cctgagcact tatttcactc 19980
acatctttac acgaagattt ggtgggtgtt tactttgttt ttagtaagtt agtctgtcat 20040
gtcctttgat cctttttttt tgttttttga gatggagtct ctctgtgtcc tccaggctgg 20100
agtgcaatgt cgcgatctca gctcactgca acctccacct cctgggctca agagattctc 20160
ctgcttcagt ctcctgagta gctgggatta caggcatgtg ccaccacacc tggctaattt 20220
ttgtattttt agtagaggtg gggtttggca tgttggccag cctggtctca aactcctgac 20280
ctcctgacct gcctgccttg gcctcccaaa gtgctgggat tacaggtgtg agccaccaca 20340
cctggccctg attaatcttt taatgcccag tctctccttc aaaagccggc tcctttctct 20400
ccctcgcctt cctagattcc ttctccactc cccaggatca gcctcctcct ccccacccca 20460
ccactgccgg ggggatgtct gtggtcaggc atttatcaga gaccctgagg tgggggtcct 20520
ttatgtgtct gggggatgga gagtctagag gaggtagcgt tcagacctct ccatggtgcc 20580
tctgctgggc tcacatgtga ccaagcacag caaaccatga ggcaggggat ggtcttgacc 20640
atgagagccc ttgcagcagc tgccatgggc ctcagctcct ctccaagctg ggaagagccc 20700
tgaaaagcca aggtgttttt ttttccctct ttatttcagt gtaagtccct tgagctttct 20760
tgaaccagaa gtgggctcat tttgctttag agatttcagg tgggcttgtc cttgtcctag 20820
catcccagat ccaccttctg ggaagtcatc agattggagg tgatgttggc agcttttgta 20880
aacaaagggt agtgttgtaa gctgttgtgt ctgcctatgt gtgtgtttgt gtacttggtc 20940
tcatctctgc agactggtga catggcttcc agatatgccc gacgatgtcc tgtggttgca 21000
gtgggtgacc tcacaggtgt tcactcgagt gctgatgtgt ctgctccccg cctccaggta 21060
aatactttgg ctgtgggtgt gtgggccgga cgggcacctc tctcatctga tgaggcctca 21120
cacgacattc tagaaacagc tggctgaaca ccaagcaagg agcttgccct tgggtgtggg 21180
gaccctgtct catgggaggc agctgagtca gtcagaggtc ctggcacacc tgctgagagc 21240
tgccacccag gccaacctga accggagcct gggaagactt cccgtcggat gagtctcttt 21300
gagtgcagca ttgatggtgg aagagcagag aggccccaga taagcaggga aaggtgcttc 21360
agacagagtg gctgggatga ggactgggga gtgtcagata gcgctggcgt gtctgagcga 21420
aggagctctg gcacccatgg cacaggaagg aggtgggacc ctggaggggc agggctagca 21480
gagctcctcg gagcgtgtgg ctaggtgcct ggtaatgcaa gccccctgtc ctccaccctc 21540
tgttgtactg agtcacagtc tccggggtga agcctagcag tctgcgttga caggccccag 21600
gggatgccgc tacttcctga attctgaatt ctggaaactg agccggagtt cagggcctgg 21660
ctcccattac cagggttggg cgttatcctg aaaatcatag gccttggttt cctcacttgg 21720
ctaacagggg tgatccccat cccctcaatg ggtttccgtg agctcctgag agcccgtagc 21780
atggtacttg gcacatgctg ggcatcagga ggtatggcct ctcttgctat tgttgttatt 21840
ggtagacaca gaaggattta aaagtagggg aatgcaaaga tccgatttgc tagggaagag 21900
ggcagtagtg gccaagtaga gggtggatcc tgggccctgg ctggcagcag gcagcaaggg 21960
gggctgccag ggcccaggca gggacgatct gtagaccgag aggcttccta aggctcttgg 22020
acaggaggag gtgtcggttc caagcctaag gagtggggca gccctggtga ctggtggtca 22080
gtggtgccag gcggtgggtg gtaggacacc ctggcaggca agtaggtttg tgtgggggaa 22140
actgataggc ccctccaggg attcgttggt ggacaacacc tgtgatgtcc agtgggaggt 22200
gtccaggtag ctgggagggc cacaggcttg gaagacctag gtggtgacat cagcccagca 22260
ctgagggcta gaagaagctg tgtctctggc tgtgacggca ccctagagtg tgtgtggtgc 22320
cctctactgg ccggcaatgt gggtccaccg tagctcagac tgcacactgc agcagcggga 22380
acggcctcta agccaacttc ctccatgtgt ttcaggtccc aaatgccagt gagcagccaa 22440
caggcctccc catgcacacc tgagcaggac tggccctgct ggactccctg ctcccccaag 22500
ggctgtccag cagagaccaa agcagaggcc accccgcggt ccatcctcag gtccagcctg 22560
aacttcttct tgggcaataa agtacctgct ggtgctgagg ggctctccac ctttcccagt 22620
ttttcactag agaagagtct gtgagtcact tgaggaggcg agtctagcag attctttcag 22680
aggtgctaaa gtttcccatc tttgtgcagc tacctccgca ttgctgtgta gtgacccctg 22740
cctgtgacgt ggaggatccc agcctctgag ctgagttggt tttatgaaaa gctaggaagc 22800
aacctttcgc ctgtgcagcg gtccagcact taactctaat acatcagcat gcgttaattc 22860
agctggttgg gaaatgacac caggaagccc agtgcagagg gtcccttact gactgtttcg 22920
tggccctatt aatggtcaga ctgttccagc atgaggttct tagaatgaca ggtgtttgga 22980
tgggtggggg ccttgtgatg gggggtaggc tggcccatgt gtgatcttgt ggggtggagg 23040
gaagagaata gcatgatccc acttccccat gctgtgggaa ggggtgcagt tcgtccccaa 23100
gaacgacact gcctgtcagg tggtctgcaa agatgataac cttgactact aaaaacgtct 23160
ccatggcggg ggtaacaaga tgataatcta cttaatttta gaacaccttt ttcacctaac 23220
taaaataatg tttaaagagt tttgtataaa aatgtaagga agcgttgtta cctgttgaat 23280
tttgtattat gtgaatcagt gagatgttag tagaataagc cttaaaaaaa aaaaaatcgg 23340
ttgggtgcag tggcacacgg ctgtaatccc agcactttgg gaggccaagg ttggcagatc 23400
acctgaggtc aggagttcaa gaccagtctg gccaacatag caaaaccctg tctctactaa 23460
aaatacaaaa attatctggg catggtggtg catgcctgta atcccagcta ttcggaaggc 23520
tgaggcagga gaatcacttg aacccaggag gcggaggttg cggtgagctg agattgcacc 23580
atttcattcc agcctgggca acatgagtga aagtctgact caaaaaaaaa aaatttaaaa 23640
aacaaaataa tctagtgtgc agggcattca cctcagcccc ccaggcagga gccaagcaca 23700
gcaggagctt ccgcctcctc tccactggag cacacaactt gaacctggct tattttctgc 23760
agggaccagc cccacatggt cagtgagttt ctccccatgt gtggcgatga gagagtgtag 23820
aaataaagac 23830
<210> 31
<211> 23830
<212> DNA
<213> Homo sapien
<400> 31
atggtccgag gggggcgggg ctgacgtcgc gctgggaatg ccctggccga gacactgagg 60
cagggtagag agcgcttgcg ggcgccgggc ggagctgctg cggatcagga cccgagccga 120
ttcccgatcc cgacccagat cctaacccgc gcccccgccc cgccgccgcc gccatgtacg 180
acgcagagcg cggctggagc ttgtccttcg cgggctgcgg cttcctgggc ttctaccacg 240
tcggggcgac ccgctgcctg agcgagcacg ccccgcacct cctccgcgac gcgcgcatgt 300
tgttcggcgc ttcggccggg gcgttgcact gcgtcggcgt cctctccggt atcccgctgg 360
gtgcgtctgg ggacgctgcc cgggctccac gtgcggagtg ggtgccccct aggccgggga 420
gcgggggatc cccaggggtc gcggggccct ggaggagcgg gcatcggacg cggacacggc 480
ggggtgcatc ccgagggccc cctccgaggc agatgcttcc tgcgggggcg ctgttcctgg 540
gcccgggaag ggggcgttgg aaccccgagc ggtccgggcc gaagcctggg actctcgtgc 600
gtccccaccc ctacccccat caggcgcccg tgcatgaagg gagaccctca cctccggact 660
gagagtcgga gcgtctcgga gcgacgggga gtagggagcg ggacccgggg cggagggtag 720
tgctggcccc tgcggactcc gggtcccctg tgtcctctcg ggaggggctg gacgggctga 780
gctgccgagg ggccgatttg ccctgggccg gacaaagagt ggggctttgg ccggtccccc 840
acggtgggct ccttccctct ggggattgag ggactcaaga caccccgcgc ctgcgctttt 900
cttttctttt tttctttttt tttttttgag acggagtttc gctcagtcgc ccaggctgga 960
gtgcagtggc gtgatctcaa ctcactgcaa gctccacctc ccaggttcac gccattctcc 1020
tgcctcagcc tcccgagtag ctgggactac aggcgccagc caccaagccc ggctaatttt 1080
ttgtattttt tagtagagac ggggtttcac cgtgttagcc aggatggtct cgatctcctg 1140
acctcgtgat ctgcccacct cggcctccca gaatgctggg gttacaggcg tgagccactg 1200
ctccctgctg cctacgctct ctgggtcgca gcccagcctt ctgggggctg ggtagcctcc 1260
cagaagggca accctgggca tcctccaggg caggctaact ggagtctagt ggggaggggt 1320
accttgaaag aggaaagttg tttcctcctc ctcctcctcc tccagtgttt gggacccttc 1380
ctgggggctg gagtgcatcc ctggacaccc cccaatccca tcctcttctc tagtttccac 1440
tgacctaggc ccaccctccc ctctccggct cagtactcct ggaaatgaga ttccgtacat 1500
ttgaatcttg tcctaatgaa atatttgtcc atgtgggtac ctgtgtgtgt gtggtggggg 1560
tgcagacgga gggtttgttt ctcactagct ggaactactg gggtgtggta tgcttcctgg 1620
gaatttgtgt gccacagtcc tggaggcgag gagggggttg tgagccagta ggcaggggct 1680
ggggcaagta gcattgtgaa gctattgaca cccagacgtc cccaggcagg agattatgcc 1740
cccattagcc cccttttatc tgggcttcct taacaatgga ctctttgccc tgcctgccag 1800
agccagcagg gagtgactgt tcagtggtga ggaagcgggc agaggaagcc ctgccattgg 1860
gtaggagcag tgggcagccc ctgggctgac tgggaggtgg ggattaggga ttagacagtc 1920
ctggctgtct gccttcccct aagccagggg gagaggagca aagggcacga aatgtggcct 1980
ccaggaggat tagaccgcca catgatcatt tgcacaccct ggggtttagc aacaataaaa 2040
gtcagctttt ttgtatccca aggtggcctg tggacaccca catggacaaa tgtttacact 2100
gggacagaat tcaaatgcag aggtcccagg agcctaaagt acactcactc tggtatagaa 2160
aggattcctt actgggcaga ggacaggtgc agcctggggc tttcccaggc aggacacagg 2220
gaggctcagg aaccaccaag tccctggaag gtggatctgg aggcgttggc aggagccact 2280
ccctgggttc cagggctcca ggttcctgct ttaaccccct gtctcacaga gggctgtgca 2340
cttgggggct gctgagcatg tcccagaggc tgcatcctgg acacagcacc tcagtgcatc 2400
tgagctgagg ctaacttggc aggagggaca ggcagaacct gccagccacg tgcaattcca 2460
cccctctggc cactcaggga aggagagctg tgagtcaaga tcagatttgg gtcaggacag 2520
gctggggcct gcctgtccct gtgcatccca agatttatgg ctggccaggg gttgggctgg 2580
gaggggtggt cttgcatgcc aggagagtgc agatcagcct gagaggccag gccagtaagt 2640
gaggtcagat ctcctgcacc tgatagcatt aaggccatct acaccaaagc tctaatgctg 2700
atatgttcct ggcctctatg tggggcatgg aggtggggca tggaggtgag gcctgctcgc 2760
ctgggcttct ggaagtggga gactcattcc tgtggctgag gcctacagca gtgctgtgtg 2820
gtaggaatac actggaagcc atgatgtcat tgtgcatttt ctagaagcca cattgaataa 2880
agtaaaagac acaggtagaa ttaatttcat tgagcccaat atatccaaaa taatatcatt 2940
ttcacatcta ttcaatataa aaatttacta atgagatatt tcatactaag ccactgaaat 3000
ccagtttgta tcttacacat ctcagttttg acgagccaca tttcaagggc gtgatagcca 3060
catgtggctc ccatagtaga cagtactggt ctagagaaat gttggtggca tccttgctgt 3120
ctggtttctg gccttgccaa aagtattacc atcccagtgt ggtacattct ttcatgtatt 3180
tgtctcctgt ccccagagca gactctgcag gtcctctcag atcttgtgcg gaaggccagg 3240
agtcggaaca ttggcatctt ccatccatcc ttcaacttaa gcaagttcct ccgacagggt 3300
ctctgcaaat gcctcccggc caatgtccac cagctcatct ccggcaaaat aggcatctct 3360
cttaccagag tgtctgatgg ggaaaacgtt ctggtgtctg actttcggtc caaagacgaa 3420
gtcgtggatg taagcagttt gcttatctgg acgttgtcaa gttagaaaag ctgttttggg 3480
atgggtgtgg tggctcatgc ctgtcatccc ggcactttgg gaggccgaag cgggtgggtt 3540
gcttgagccc aggagctcga gaccaacatg atgaaaccca gtctctacaa aaattacaga 3600
aaaattagct aggcatggtg ttgtgggccc atagtcccag ctactaggga ggctgaggca 3660
ggagaattgc ttgagcctgg gaggtggagg ttgcagtaag tcatgatcat gccactgtac 3720
tccagcccgg gtgacagtga gatgctgtct ggaaaaaaaa aaaaaagaaa gactgttttg 3780
ttttggaagc aacacaggca gttgtaggcc ccctgtgcca gagtgacata aactctgtac 3840
acctccagtg atttggtcca tgtttgtaaa ccctgaatgt tccagggcag tttcttttct 3900
tcacttttta tctctttttt ttgggtgggg gggcggggta cagagtcttg ctctgtctcc 3960
caggctggag tgcagtggcg caatctcaac ctcccgagga gctgggacta caggcacagg 4020
ccatcacacc ttgctaatgt ttgtactttt tgtagagacg gggttttgcc ctgttgccca 4080
ggctggtccc aaactcctgc acccaagtaa tctgcccacc tctgcctggc agttacaatt 4140
tcaaataatt cctccctttc cttcaacact tggctcatga ccgtccagtc caaggaacct 4200
gtcctgcagg tgtgcctctc ccgagcttcc tctatgcatc ttccataatg aagatgcctt 4260
ctcactggaa accctacaag ggtgggaacg tgccttattt gcctgtatcc tcagggtcta 4320
gcagagagaa gataatttgt aataccaaaa caccattaaa ttcagctgat gctttcataa 4380
gcgctccttg gaggaaggac tccatttact tgacagatct gtgcaagaca gcagcctggc 4440
gcgtctaacc tgcagccagt tgcatcctct gtttaacctt gtttgcggaa gctttctcta 4500
aacagccagc acttgtctgt tcccacatgg gtccgttctc ccagtgaatc accgtggtgc 4560
ctgctgactg ctctgtagca cagtgcttcg caaagtgtga tcctgggacc agcagagcag 4620
cagctccttt gagcttattg gaatggcaga ccctcaggtc ccacctctga cctgctgcat 4680
gggaattctg gggagggacg cagaatctct ggttccacag gctctccggt gatgctaatg 4740
aataccggca tttgaacagc accgatctag cccctttcag tccatgagcc aacaaccctt 4800
ggtcctgtct gtggtgaccc agtgtgactc tcatggggag caaggagagg aagttgaagt 4860
tcactgacag ggttgttaag gggattatgc aatagatgag acccatgggc ctgaagtccg 4920
agggtgtatg ttagttcccc gttcttttga cccatggatt aacctactct gtgcaaaggg 4980
cattttcaag tttgttgccc tgctcacttg gagaaagctt atgaaggatc aggaaaatta 5040
aaagggtgct ctcgcctata acttctctct cctttgcttt cacaggcctt ggtatgttcc 5100
tgcttcatgc ccttctacag tggccttatc cctccttcct tcagaggcgt ggtaagtcgg 5160
ctttctctgc tagcgctgag tcctgggggc ctctgaagtg tgctcacaca tctcctgcct 5220
gcagggcact ggtgtcgggc acctcagggt ctgtcccatg gtggagcccc atgcctcact 5280
gcctttcaga cagagtagcc acagctggcc ctatttccag gctacccggg cagcaaaact 5340
tactgcatgt gtaattaatt atttggctat ctgtaaggta aactggctgg ttcacttaat 5400
ctgcacctta agcatcagat agcttctcag tgatctagtt aaactatatg atgttggcca 5460
ggcgcggtgg ctcatgtctg taatcccagc actttgggag cctgaagcag gcagatcact 5520
tgaggtcagg agttcgagac cagcctggcc aacagtgtga aactctgtct ctcctaaaaa 5580
tacaaaaatt agctgggcat ggtggtgtgc acctgtaatc ccagctgctc gggaggctga 5640
ggcaggagaa ttgcttgaac ttgggaggcg gaagttgcag tgagccaaga tcgcaccact 5700
gcactccatc ctgggtgaca gagcgagact ctatctcaaa aagaaaaaaa aaaaaaaggt 5760
aaataaagta tatgacactg aagaatctgt tacccctgga aggtggagct ttactcttag 5820
ggggaactat aacagtcata tatatatatt tttttctttt cttttttttt ttttttgaga 5880
tggagtctgg ctctgtcgcc caggctggag tgcagtggtg caatctcggc tcactgcaac 5940
ctccacctca caggttcagg caattctcct gcctcaacct cccgagtagc tgggattaca 6000
ggtgcctgcc gtcacgccaa gctaattttt gtatttttag tagagacagg gtttcatcat 6060
attggccagg ctggtctcca actcctgacc tcaggtgatc cgcccgcctt ggcctcccaa 6120
agtgctgaga ttacaggcgt gagccatggt gcccggccaa caatcacatg tgttgtaaac 6180
aacaacaaaa atctgtcagc ctggtctaac ctagatttgt gctttgtttt gttttgccac 6240
tttgtgatgc acaggaggaa gtttaggctg taaaatacta gccttttagg gtaatttttg 6300
aactcacaag agcagcagcg gaacctttga tgcaatcctg tatgtagcac cagcagagcc 6360
acgtggcaga gggactcgca ttaggagcct cccattacag actacgtgct cctgtgcgtt 6420
atcttatagg gtccccacaa ccaaggggag atgtgattat tcatcctgtg tggctgtggg 6480
gaacttgaga gtcatacttg cccaaagagc acggccagcg agcttgcacc caggtcactc 6540
tctgctcctc tgtcagaaca gggcatgtct tggttcactg cagggcggct cttctcattc 6600
tctgtagttt ggggtccagg atagtggtcc acggagccac tggagtgccc agctactgag 6660
tgaccaaagc atattttgga tttccgacat tgccacagca tggttgggca tcagcaggac 6720
cccaacccct tgttatgctg gtggctttat gtggttattt gatcttcccc agaactcagc 6780
aggagtgcac ccagcagcac cgtagtgatg ctctctggct ccccagtgca cggttctggc 6840
tttccttcct ggtcgagagt ttcaagccct ctgggtccta ctctgtcctt ttcagcccat 6900
agctttgttc aaaagctgct ggcagtgttc agatttggct gagttcagtg aatatgtgca 6960
ttggctgatt tctgagccat gccaggggga tggagaagcc gaagcaggag tgtttgttct 7020
gcaggctctg gagtaggcat tgggtctgtg ccggctcact tgctagtctt gcatccttcc 7080
ccaaccccct ctggggatgt ctggccacat cagaagacag tttgggttgt cagaactggg 7140
ggagtaccag gccgaggtgg gtggatcatg aggtcaggag atcgagacca tcctggctaa 7200
cacagtgaaa cctcatctct actaaacata cgaaaaaaat tagctgggcg tggtggcggg 7260
cgcctgtagt cccagctact cgggaggctg aggcaggaga atggtgtgaa cccggggggc 7320
ggagcttgca gtgagctgag atcctgccac tgcactccag cctgggcaac aaagcgagac 7380
tccgtctcac aaacaaaaca aaacaaaaca aaacaaaatc tgggggagtg ccactggcat 7440
ctgatgtata gaggcccgag atgctgtgtc atcacccgtt gagtgcgctc ataggcatct 7500
tcctgacaat tagaacccat tattcttcaa attcaatgca agcaaattca aagcattact 7560
gtgtacatac cgcatgctaa tcaattgcac cactggagct cctaaattca aaacattact 7620
ataaaaaagt tcaaaatgca tggaaaagtt gtacatggca ggagaatatt tgggcttctg 7680
actacccctt gaatgaagat gatccaccag ccgccttcct ccttggtctt cactccagat 7740
tcctagcatt tcattctgtg tctctttatg cagtgaggtt tttgtttgtt ttttgagaca 7800
gagtctcact gtatcaccta ggcctggagt gcagtggcgc gatctcagct cactgcaacc 7860
ctcggctcct gggtttaagc gattctcctg cctcagcctc ccgagcagct gagattacaa 7920
gcacacatcc ccatgcccag ctaatttttg tatttttagc agagacaggg tttcaccatg 7980
ttgcccaggc tggtctcgaa ctcctggcct caagtgatcc atgtgcctca gccttccaaa 8040
gtgctgggat tacaggcgtg agccaccatg cccagctcct agtgaggttt ttgatgcctt 8100
gctacatctg ccctagaaat tgtgtgacta cgattttgga aatgttgctg tgtaaacttg 8160
tgatcatttc tggactccag gcaagaatct tgatggctaa ggtgtggctg aacatgtctg 8220
attctctcct ggacctgttt taggccaaac tctgctctga aattcctccg tgtggaaggg 8280
cgggctgggg agagcctccc agctggaatc ttttggatgc ctttctctgt gggtatctga 8340
tggctggctc tgatggctgg ctgtgatggc tgtggctgga aatcattgtt gacatgagtt 8400
tcacagatgc aggctctgtc caaattgtag caaaagctgc ctgccccagc cgagctatgg 8460
gcaataaggt ggtttaagga tatagatgaa ggaaaactca cccttagaat aatttatcca 8520
aaatgctgct gtgttgtggg ttagaggaca ttttctgagg tcccaggttc attgtttcat 8580
ttaagtctca aaagtccctc caggtgttgg ttctaattgt caaagcatgg ggggagatgg 8640
gctcatgggt taaaggtctt atcccagatt tctgtatcct ccttgcaagc agcaaagggg 8700
tctggatttg aatccatgac catgtttctc ctttgggttt ccatcacact ctgtccccgt 8760
gcactgagca ccctttagtt catatgaccc ccttaggcat gttacatggg cactcctata 8820
ggtgcccatc tggccctagg acttggccaa cacaacatgg actccagttt ccatctgcct 8880
ctttgccagg cacttttgtg cagtgcacac actgtacaac agtagacggc aaccctgaga 8940
gccagagtag agcctgtcct agcaccggaa tgctcggtaa ggatttgtcg caggagtgat 9000
tccaaagcca atgtcctccc tccatatcag cctgtttgtg gctctgagaa gctctgccca 9060
catgtgaaag cttgttaagc acttaagcac taacccagag cttcagacag tgccagtcct 9120
ttttcccctt ctttaaaagc gatatgtgga tggaggagtg agtgacaacg tacccttcat 9180
tgatgccaaa acaaccatca ccgtgtcccc cttctatggg gagtacgaca tctgccctaa 9240
agtcaagtcc acgaactttc ttcatgtgga catcaccaag ctcagtctac gcctctgcac 9300
agggaacctc taccttctct cgagagcttt tgtccccccg gatctcaagg tgagttggtg 9360
gtgagggggc aggtgttctg gggtgcagct cttctttgcc tccctgattg ccaggagcta 9420
ccagttactg tctgcacaat caaacagaaa tagacctgtc cttgatggtt aacggaaata 9480
aaaggcgctt gtcccagaag ctcaggtgag gcaccaccct gattatggga atcacctggg 9540
aacatatacc cagacctaaa actcagatcc acttcccagg ctgtggttat atagtcaggg 9600
gggtgcagta tgggtattag gattttttat tttttagtta taaagatttt tttttggttt 9660
gtttttgaga cagggtcttg ctctgccgct taggctggag tgcagtggtg caatcatagc 9720
tcactgaagc ctcagactcc tgggttcaag cagtcctccc acctcagcct cctaaggagc 9780
tgggacccac aggcatgcag caccacacct ggctaatttt taaaaatttt gtggagtgtt 9840
gcccaggctg gtctcacact cctggcctca agcgatcctc ccaccccagc ctcccaatgt 9900
gttgggatta caggcatgag ccattgtacc cagccactaa gatgattctt atttggaaac 9960
acggtcaaga acaactgcgt tcggtagttt aacctttttt gattgtggtg gttttagtat 10020
gccttaccac tctaccatag taagaaattt gcagaccatg tacaccaacc tttggtgctc 10080
ctggggagaa agaaagaagg ctatgcaatg caatgcatgc tcacagtcca agggagaggg 10140
aaagctgtct aacaggattg gttttcccgt gtgctttata agcagatgag tagaggagac 10200
agctcttatt gtcctagtgg caattgggat aggctgcaaa gtttgttagg gtggaggctt 10260
attccgggac caagggagcc caaagaaaca agctcctgcc aggcgcggtg gctcacgcct 10320
gtaatcccag cactttggga ggctgaggca ggtggatcac ctgaggtcag gagtttgaga 10380
ccagcctggc caacatggtg aaaccccgtc tccatgaaaa atacaaaaat tacccgggca 10440
tggtggcggg cacctgtaat cccagctact agggaggctg aggcaggaaa atggcttgaa 10500
cctcggaagt ggaggtggcc gttagccgag atcacgccac tgcactccag cctgggcaac 10560
agagcaagac tctgccttaa aaaaaaaaaa aaaaaaaaga aaagtaaaag gaaaaaaaag 10620
aggctctggc ctgctggggt gcctgcaaag tctccgtgga agggtgacat tcaagccgag 10680
acctccaggg aactgtctcc tgggagcaca gagccctttg ctcagccccc aggtggctca 10740
gtgcccccag ccagcagact cagagcttgc atgattcttt ggtgctctct gcggtcttcc 10800
aatgatgctg aaataaatgg tgcttggtgt ctccctgctg tagtcccctt gcttgctttg 10860
ctcacaggtg ctgggagaga tatgccttcg aggatatttg gatgcattca ggttcttgga 10920
agagaagggt atgtatgggc tgggaggatc agccatgccc ttttgacaag catttactag 10980
cggtcttggt aaagacttga gatttgcctt agttctaaca cttagtgccc aacgccttcc 11040
ttgtgttgct caacctactc atgagcccag gagataggaa atctccgtcc cattgtacag 11100
atggggaaac agaattttgg aaaggagagc caagcagcac acacccctcc ctgaggggca 11160
gagccgagat ttgaactggg atgtcatgac tccagggccc tctccctccc cagggtcccc 11220
ttatctgaag gcggtttttc tttccagctc gacctcttgt gacccttagt ttaacaaggg 11280
ccgaagttaa agagtttctg cgcctggacc ccaaatgaag caatcagatt tctcatctcc 11340
agtcaggtgt gggtccaagc ccactagaca agtttgctct tcccagagca catttctgcc 11400
ttcaagtcat cctggcttgt cagggctggg ggagttctgc tgtagaaata ttagagtgga 11460
aggaaaaaga tgtgttggga gctatttttc tttaatacta aaagttggtt gatgaatttg 11520
tcgttggcca agaccaagga gactgcattt ttaaggacat atgtgtattt atctgctcag 11580
aaaatgttca ttgctgtgtg ctagggatac tgcagtgaac acagaggtgt gacccttgcc 11640
agccttgtga gagaagtgag cagataagta agcagaaggg tgatgctgtg tcgatgggaa 11700
agtacaggtg ccaatgagaa ggcacaggtg tcaaggagaa gacacaggat gctggaggct 11760
catgcaggat ggatctccaa ggcccagggg aagaagggcc tctcggagga cgtgaatcca 11820
cattaagact ttggggataa gtaggagcgc cttaggcatg gggacccatg gatgcgaggc 11880
ctgtaggaca cagacaggat ggcatgaagg cctgtgcaac tggaggggtg gggatgggga 11940
cactaagaga tggctggaag tgtgggggtg gggacactaa gagatgactg gagaagaggg 12000
ggtcaggagt ggtgaaaaat gggagaggag ggcaggctgg gccttttgga tacaggggga 12060
ttgcatcctg cagtggtagg gagccactga gggctgctgc agtaggagtg aggggatcag 12120
aggagagctt tggaagcccc ctggatgcgg gacaggaagc gagataccag tgtctaggag 12180
gccagtgagg cagccacagg ctccaccagg atcagggctg cgagggtcat gaggaggaaa 12240
ccaatttgaa ggagtccagg ggaataggac ttggaaatga ccgatgggac atttgggaag 12300
aggaagacag aagagcgcag tcccggcttc tggctttagc agttgggcaa ggggagatgg 12360
ggagatgtgc ccatgggttg agggttgagg acattaggag ggagccggta tggcaggaag 12420
agctggtgtg ccagagatgc tggaagcagc atctgcctga gaacagatac ctggcaatat 12480
tcctaaggga aagtgacatc tcggagggtg aggagggcat ctgatagggc ctggaaagag 12540
ccggggcaag catgaatgtg aggttatctt ggggggcaag gctcaggcgt tgaggagcag 12600
cccctggtct cttcagcctg aagttggaag ccagagttgg gccaggtgca gctgtggttg 12660
tctgaagtcc ccctccccca gcccagtgtg ccaatgctgt aagagcaagg gccgctcact 12720
ggtgctggtg gctgagtccc agcacccagg acagggcctg gcacatactg gtgcccaatc 12780
ctcccttctg ggtgcttctt ccaaggcctt gtgatggaag tgagtaccct cttcgacatc 12840
agacccagct tcaaatcctg gctctgctat gtattggctg cgtggcttta gacaagtctt 12900
ttaaccttgc tgtgcttctg atttctcagc tgaaaaatgg agatgatgat agtggtttct 12960
gtaaggcctt atggtgaagc acctagctca gggcctggaa ggcaggtgta accagtggtt 13020
cagttgttat aaaccaacac taaccctcgc ctttgcacct catgaaacca gatatgtaga 13080
tggagcccac aaagctagca ggagccaagc tcacgtgtgt cctgctttaa agccccatac 13140
ccctttctcc gggtgacaaa cacctgtgct cgttctcttc ccttcccctc ttccccttgc 13200
atttggctaa taacaggcca gctgcctgcc tccctgcagt ttggtagatg ggtgggtaac 13260
gaccaccact cccacgttcg cctgatgggc ttgttttccg tgcccttcac aggcatctgc 13320
aacaggcccc agccaggcct gaagtcatcc tcagaaggga tggatcctga ggtcgccatg 13380
cccagctggg caaacatgag tctggattct tccccggagt cggctgcctt ggctgtgagg 13440
ctggagggag atgagctgct agaccacctg cgtctcagca tcctgccctg ggatgagagc 13500
atcctggaca ccctctcgcc caggctcgct acaggtaccc actcctcggg gtgagcacgg 13560
gcagcacctt gttttctttc ttgtgcatta tggaggaaga tggtactgcc acatgggagc 13620
gatagggtga ggcaaccatg acaggtggtt gggaacatct ccttccatgt gtacagcctg 13680
ggctgctgcc atcactccca gcacagcccc caaccccccc aatcctggaa ccttgccaag 13740
tctcccttcc catggggtca tgaccaggag gaaaacaaac tccagctgag ccccttgggg 13800
ttccccatat aggctcctgc ctgtggcagc tgggccctct gtaccccttt ccaactctgt 13860
ctccctaaca tggcacctga gctcctgcca tcctggattt catggacccc aaggatgggg 13920
gtcctgcatc tgggacttgg cctattactc ggagctcctt ttcagccgcc tccctccacc 13980
tgtccaccca cctcaaggct cctttcttga gacctctcct aatttctccc ttcccctaaa 14040
cccacaattt tgaacctcca tcgaatggtg ctgtatttta taatgtcatc aaatatcaaa 14100
tggagacagt gctatggtcc aaatgattgt gtacccccca gaatttgtct tttgaaatcc 14160
taacccccaa catgatggtc ttaggaggtg gggcctttgg gaggagatta ggtcatgagg 14220
aaagggctgt catgaatggg attggtgccc ttattaaaca gacccaagag aggtcccttg 14280
tcccttctac tgtgtgagga ctcagaaggt ggtgtctatg aagaagcagg ccctcaccag 14340
acaccaacat gtctgctgcc ccttgatctg ggaccttgca gcctctagaa ctctgaaaaa 14400
tcgatgtttg ttgttttata agccactcag ttggtggcat tttgttagag tagcctgaac 14460
acggactaag tcaaacagaa gaacccacaa accagctaca gagttgggca tttggagaaa 14520
ttcaaaaatg agtcagacat aactccttat tcttgaggtg ccctaagaga tgggacacag 14580
cagctgccca ggtgcattag tttgttctca cattgctata aagaaatacc tgagactggg 14640
taactcataa agaaagaggt tgaattggct cacagttgca caggctggac aggaagcatg 14700
gtgctggcat ctgctcagct tctggggagg cctcaggaaa cttacaatca tggcagaagg 14760
tgaacgggaa gcatgcacat cccatgactg gagcaggagt gagagagaga gggaaataga 14820
gggaaggtgc catacacttt taaacaacca gatctcatga gaacacattc actatcaaga 14880
gaacagcacc agtggggaaa tccgccccca tgatccaatc acctcccatc aggctccgcc 14940
tccaacactg ggaattacaa tttgacatga gatgtgggca gggacacaga tccaaaccat 15000
atgaccagat taatacgatt tgaggcatca cgaggtcatt aaagagaggg aataaaagac 15060
tggggctcca ggaagaaggc tctggaatcc agcagagggt caaggaccag cttgtaaagc 15120
tggtggtgcc tgagaagtac ctaggagaac atagatgctg tgacgtttga tgtagctgtt 15180
ttttgttttg tgttttggtt tttgagacag agtctcactc tgttgcccag gctggagtgt 15240
gcagtggcgt gatcttggct cactggagcc tccatctccc aggttcaaat gatcctcatg 15300
cctcagcctc ctgagttgct gggattacag gtgcacacca ccacgcctgg ctaatttttg 15360
tgttttcagt agagacaggg tttcaccatg ttggccaggc tggtcttgaa ctcctgacct 15420
caagtgatcc aacaacttca gcctcccaaa gtgctgggat gacaggcatg agccaccatg 15480
cccagcctga tgtagctgtt tctgtgcaca ttatttgctg tggggtatat tcagatttct 15540
taatacaaga tgattctttg cctcatgact tacacaccat tttctattta atttcagcta 15600
tgatattgga aatggacatg tcttttcaag gaaaataaaa gcaggctttc tggaatggcg 15660
acttccaaac atatttgtca atttaaagga gctgggagtg gggaccctat gctccgtaag 15720
cactctctta gctgttcttg gctgtgctcc ccgcttcagc ttcacactgc ccttgctgtg 15780
aagggagcag cctgggccgg gcgcggtggc ttacacctgt aatcctagca ctttgggagg 15840
ccgaggtggg tggatcacct gaggtcagga gttcaagacc agcctggcca acatggtgaa 15900
actccatctc tactaaaaat acaaaaaatt agctgggcat ggtggcaggt gcctgtaatc 15960
ccagctactt gggaggctga ggcagaagaa tcgcttgaac ccaggaggcg gaggttgcag 16020
tgagccgaga ttgcgccatt gcactccagc ctgggggcaa caagagcaaa actctgtctg 16080
gaaaaaaaag aaaggagcag cttggcaaac cccaccttgt cgcttttgtg agtgcctctg 16140
accctttggc tgccaggacg ggcgtatttt atggaaatgc taagcaccaa cagagtaaag 16200
tggtttggtt tttcacagtg gtgggagata atagctccaa attgtctttt tcagcactga 16260
gtgaagaaat gaaagacaaa ggtggataca tgagcaagat ttgcaacttg ctacccatta 16320
ggataatgtc ttatgtaatg ctgccctgta ccctgcctgt ggaatctgcc attgcgattg 16380
tccagaggtg agcattttag gtggctccgt gtcttcctca cagggttgat atgaggatga 16440
aacaagatga tagatcatgg tggcatgtag tctgggacct ggattgtcgt gccacagatc 16500
acagctcaca gtctatgtgc aatgcccctg aatgttgccc acctgtcctc aagccacaca 16560
tgcacctgta actcagtgca agcccagaaa ctccccgtgg ggactcctag agctgtcagt 16620
ggcctcacat agcagctggt ccagtctctt gtgattgccc aaggaaactg aggcctggag 16680
agcttggggt cactgctctg aggccataga gatgcctagt agaagggcca ggcctagaag 16740
caggatcctt gctgcccctc tgagctgttt ccatttaaaa tcacatgaag gccggcgccg 16800
tggctcacgg ctgtaatccc agcattttgg gaggccaagg tgggtggatc atgtgaggtc 16860
aggagtttga gaccagcttg gccaacatgg tgaaatgcca tctgtactaa aaatacaaaa 16920
attagtggag catggtggca cgtgcctgta ctcccagcta cttggaaggc tggggcagaa 16980
gaatcgcttg agcctgggag gcagaggttg tagtgagcca agattgtacc actgcactcc 17040
agcctgggtg acaggagaga aaccctatct caaaataaaa tgaaaggtaa tgaaatgaat 17100
aaaataataa atcaagtcac ggccgggcac ggtggctcac acctgtaatc ccagcgcttt 17160
gggaggccga ggtgggtgga taatgaggtc aggagttcaa gaccagcctg gccaacatgg 17220
tgaaaccatg tctctactaa aaatacaaaa attagctggg catggtggtg catgcctgta 17280
atcccagcta ctccggaggc taaggcagga gaattgcttg aagcaggacc taggaggcgg 17340
aggttggttg cagtgagccg agatcatgcc actgcactct agcctgggct acagagcgaa 17400
actccgactc aaaaaaaaaa aaaaaaaaaa atcaaatcac atgaaagtag aacataggga 17460
attccatctt tcgttctagg catagtttgt taatatgatt cagagccagc agttaggaga 17520
acacagtgtg actctcctag aacttcttga ttgggcttcc tctgattggg tttcctctga 17580
ttgggcttcc tctgaaagtg ggggggatgg ggggtgggga gcagaatggt cagagcttgg 17640
ctcagcagtc agactgctct tcttcaaatc ctggctgcat tgcttactac agctgtgtga 17700
ctccagatga ctgaatccac ctctctgtgc tgcagcttcc cgtctagaga gatcacctgg 17760
agcagagggt ggtcaggaga ctcaatctgg ttactgactc acagtgcagg agtactcatc 17820
ccatagtaag catccagcta gagatgttga tttctatttt caggtaataa tgatgatcgt 17880
aaaattagag acagataaaa ggtatgggca ttaggccagg gcactgcaat ttctaagctg 17940
tgtgacctca ggcaagttac tcgacttctc tgagcctcag cggtttcatc cgcaatatat 18000
ggataggaaa accgacctca gtgggttgtc tgacagtgga gggcacttga ttaaaaaaaa 18060
aaaaattacc ctggtctgaa tattaccctg gactgaaaga aaaatattga gctaatacag 18120
gcatcaggaa tggggctgca gggagtccag ggaagggaga acgaagagcc tgaaggtgtg 18180
aggaggtgcg agtgctgatc tgtctgctac aaagaggctg ctgagcctcc tgtggatgtg 18240
gccctggact tggcagttta atacctgagc tgttaaaata acctcagatg ctgtgttctt 18300
taaggggtag gattcagatt cctgctgaaa tgcttctgaa agggagggaa tgagccagcc 18360
catccccagt tgctttttaa gatcattggg aagttctggt cttgccattt gtccctggac 18420
cactcttagg tcctcctgcc ccacttccat ctgggtgtgt gccctgggct gtccaccaca 18480
cagctacatc ctgccatctt ccctcctgga gccactgtgc catgcatgga tctgtagctt 18540
catttttctt ggcttttccc tggtttttct ggagcagagt ctctagtaaa ctcccaagga 18600
agaaaacgtt tgactttatg tgtgttggga aacgtgcttt ttttctatta catctcagtg 18660
ataggttggc catgtctaga attgcaggtt gaaaatcatt tcctctcagt atattggtta 18720
gtgagaagcc tgggactgag acagtcacat tctcacttct ttgcaggtga gtgctcttag 18780
gactgtcttt ttatccctta tactctgaaa tgtcatatgt cttggtgtaa gtccttattt 18840
cagttattga gctggacaag tactggagac cccttcagtc aaagccttct gtcattctcc 18900
agctctagga aattatcttc tattgttatt tctgttattc cttcccttcc attttctttt 18960
ttcttttttt tttttttttt ttgagacagg gtcttactct ggtgcccagg ctggaatgca 19020
gtgacctgat catggtacac tgcagcctga acctcccaga ctcaagtgat cctcccacct 19080
caacctccta agtagctggg actgcaagca cacatcacca cacccaacaa atatttttta 19140
aaaattttgt aagatgggat cttactatgt tgcccagact ttttcttcct cttcctgggg 19200
ctcttattag gaagatgttt gacttcctgg gttggattcc tgtctccgtg tctgactttc 19260
tctctttgtc atatttttca tcactcgttg tctttttgcg tctgctctga cagatttcct 19320
caaattttgt cttctagtcc tatcctacag tttttacttt cagcaaatat aatttaatct 19380
ccaagagtac tctcttgttc ttttttctta gcattctgtt cttgttttat ggatgtaaca 19440
ttctcttgga atatttgctg tcctctagat catcccttct ccatttcttc ttgggctagt 19500
ttttctgttt cttcatcttt ctcttttatg ctacttattc tgggcgtgtt cttggtgggt 19560
tttttcccat atagcaacag aggacttgga gctcagggag aaaagggtag gtgcatcacc 19620
tggcagagct cccagacagt gacaggcagg ctgcgggaag gatgtctact tggcggtgct 19680
accgctttcc tagaaaccct ttccctggag ctggttgaac tgttgggttt tgccctggtg 19740
gtgaacgctg gctccccgtg ctctgcctgt ttcatcacca gccccctccc cttctgcctg 19800
gggtccagta atctgttgaa atatatatct tgctcattgg tgagctcctg ctccttcctc 19860
gttgctcttg cagatttatc acttctcgta aggctgcgct tgtacttcgg gattttctct 19920
gtgccacact gggaaacata gggtggttgc atgctgcagt cctgagcact tatttcactc 19980
acatctttac acgaagattt ggtgggtgtt tactttgttt ttagtaagtt agtctgtcat 20040
gtcctttgat cctttttttt tgttttttga gatggagtct ctctgtgtcc tccaggctgg 20100
agtgcaatgt cgcgatctca gctcactgca acctccacct cctgggctca agagattctc 20160
ctgcttcagt ctcctgagta gctgggatta caggcatgtg ccaccacacc tggctaattt 20220
ttgtattttt agtagaggtg gggtttggca tgttggccag cctggtctca aactcctgac 20280
ctcctgacct gcctgccttg gcctcccaaa gtgctgggat tacaggtgtg agccaccaca 20340
cctggccctg attaatcttt taatgcccag tctctccttc aaaagccggc tcctttctct 20400
ccctcgcctt cctagattcc ttctccactc cccaggatca gcctcctcct ccccacccca 20460
ccactgccgg ggggatgtct gtggtcaggc atttatcaga gaccctgagg tgggggtcct 20520
ttatgtgtct gggggatgga gagtctagag gaggtagcgt tcagacctct ccatggtgcc 20580
tctgctgggc tcacatgtga ccaagcacag caaaccatga ggcaggggat ggtcttgacc 20640
atgagagccc ttgcagcagc tgccatgggc ctcagctcct ctccaagctg ggaagagccc 20700
tgaaaagcca aggtgttttt ttttccctct ttatttcagt gtaagtccct tgagctttct 20760
tgaaccagaa gtgggctcat tttgctttag agatttcagg tgggcttgtc cttgtcctag 20820
catcccagat ccaccttctg ggaagtcatc agattggagg tgatgttggc agcttttgta 20880
aacaaagggt agtgttgtaa gctgttgtgt ctgcctatgt gtgtgtttgt gtacttggtc 20940
tcatctctgc agactggtga catggcttcc agatatgccc gacgatgtcc tgtggttgca 21000
gtgggtgacc tcacaggtgt tcactcgagt gctgatgtgt ctgctccccg cctccaggta 21060
aatactttgg ctgtgggtgt gtgggccgga cgggcacctc tctcatctga tgaggcctca 21120
cacgacattc tagaaacagc tggctgaaca ccaagcaagg agcttgccct tgggtgtggg 21180
gaccctgtct catgggaggc agctgagtca gtcagaggtc ctggcacacc tgctgagagc 21240
tgccacccag gccaacctga accggagcct gggaagactt cccgtcggat gagtctcttt 21300
gagtgcagca ttgatggtgg aagagcagag aggccccaga taagcaggga aaggtgcttc 21360
agacagagtg gctgggatga ggactgggga gtgtcagata gcgctggcgt gtctgagcga 21420
aggagctctg gcacccatgg cacaggaagg aggtgggacc ctggaggggc agggctagca 21480
gagctcctcg gagcgtgtgg ctaggtgcct ggtaatgcaa gccccctgtc ctccaccctc 21540
tgttgtactg agtcacagtc tccggggtga agcctagcag tctgcgttga caggccccag 21600
gggatgccgc tacttcctga attctgaatt ctggaaactg agccggagtt cagggcctgg 21660
ctcccattac cagggttggg cgttatcctg aaaatcatag gccttggttt cctcacttgg 21720
ctaacagggg tgatccccat cccctcaatg ggtttccgtg agctcctgag agcccgtagc 21780
atggtacttg gcacatgctg ggcatcagga ggtatggcct ctcttgctat tgttgttatt 21840
ggtagacaca gaaggattta aaagtagggg aatgcaaaga tccgatttgc tagggaagag 21900
ggcagtagtg gccaagtaga gggtggatcc tgggccctgg ctggcagcag gcagcaaggg 21960
gggctgccag ggcccaggca gggacgatct gtagaccgag aggcttccta aggctcttgg 22020
acaggaggag gtgtcggttc caagcctaag gagtggggca gccctggtga ctggtggtca 22080
gtggtgccag gcggtgggtg gtaggacacc ctggcaggca agtaggtttg tgtgggggaa 22140
actgataggc ccctccaggg attcgttggt ggacaacacc tgtgatgtcc agtgggaggt 22200
gtccaggtag ctgggagggc cacaggcttg gaagacctag gtggtgacat cagcccagca 22260
ctgagggcta gaagaagctg tgtctctggc tgtgacggca ccctagagtg tgtgtggtgc 22320
cctctactgg ccggcaatgt gggtccaccg tagctcagac tgcacactgc agcagcggga 22380
acggcctcta agccaacttc ctccatgtgt ttcaggtccc aaatgccagt gagcagccaa 22440
caggcctccc catgcacacc tgagcaggac tggccctgct ggactccctg ctcccccaag 22500
ggctgtccag cagagaccaa agcagaggcc accccgcggt ccatcctcag gtccagcctg 22560
aacttcttct tgggcaataa agtacctgct ggtgctgagg ggctctccac ctttcccagt 22620
ttttcactag agaagagtct gtgagtcact tgaggaggcg agtctagcag attctttcag 22680
aggtgctaaa gtttcccatc tttgtgcagc tacctccgca ttgctgtgta gtgacccctg 22740
cctgtgacgt ggaggatccc agcctctgag ctgagttggt tttatgaaaa gctaggaagc 22800
aacctttcgc ctgtgcagcg gtccagcact taactctaat acatcagcat gcgttaattc 22860
agctggttgg gaaatgacac caggaagccc agtgcagagg gtcccttact gactgtttcg 22920
tggccctatt aatggtcaga ctgttccagc atgaggttct tagaatgaca ggtgtttgga 22980
tgggtggggg ccttgtgatg gggggtaggc tggcccatgt gtgatcttgt ggggtggagg 23040
gaagagaata gcatgatccc acttccccat gctgtgggaa ggggtgcagt tcgtccccaa 23100
gaacgacact gcctgtcagg tggtctgcaa agatgataac cttgactact aaaaacgtct 23160
ccatggcggg ggtaacaaga tgataatcta cttaatttta gaacaccttt ttcacctaac 23220
taaaataatg tttaaagagt tttgtataaa aatgtaagga agcgttgtta cctgttgaat 23280
tttgtattat gtgaatcagt gagatgttag tagaataagc cttaaaaaaa aaaaaatcgg 23340
ttgggtgcag tggcacacgg ctgtaatccc agcactttgg gaggccaagg ttggcagatc 23400
acctgaggtc aggagttcaa gaccagtctg gccaacatag caaaaccctg tctctactaa 23460
aaatacaaaa attatctggg catggtggtg catgcctgta atcccagcta ttcggaaggc 23520
tgaggcagga gaatcacttg aacccaggag gcggaggttg cggtgagctg agattgcacc 23580
atttcattcc agcctgggca acatgagtga aagtctgact caaaaaaaaa aaatttaaaa 23640
aacaaaataa tctagtgtgc agggcattca cctcagcccc ccaggcagga gccaagcaca 23700
gcaggagctt ccgcctcctc tccactggag cacacaactt gaacctggct tattttctgc 23760
agggaccagc cccacatggt cagtgagttt ctccccatgt gtggcgatga gagagtgtag 23820
aaataaagac 23830
<210> 32
<211> 1443
<212> DNA
<213> Homo sapien
<400> 32
auguacgacg cagagcgcgg cuggagcuug uccuucgcgg gcugcggcuu ccugggcuuc 60
uaccacgucg gggcgacccg cugccugagc gagcacgccc cgcaccuccu ccgcgacgcg 120
cgcauguugu ucggcgcuuc ggccggggcg uugcacugcg ucggcguccu cuccgguauc 180
ccgcuggagc agacucugca gguccucuca gaucuugugc ggaaggccag gagucggaac 240
auuggcaucu uccauccauc cuucaacuua agcaaguucc uccgacaggg ucucugcaaa 300
ugccucccgg ccaaugucca ccagcucauc uccggcaaaa uaggcaucuc ucuuaccaga 360
gugucugaug gggaaaacgu ucuggugucu gacuuucggu ccaaagacga agucguggau 420
gccuugguau guuccugcuu cauccccuuc uacaguggcc uuaucccucc uuccuucaga 480
ggcgugcgau auguggaugg aggagugagu gacaacguac ccuucauuga ugccaaaaca 540
accaucaccg ugucccccuu cuauggggag uacgacaucu gcccuaaagu caaguccacg 600
aacuuucuuc auguggacau caccaagcuc agucuacgcc ucugcacagg gaaccucuac 660
cuucucucga gagcuuuugu ccccccggau cucaaggugc ugggagagau augccuucga 720
ggauauuugg augcauucag guucuuggaa gagaagggca ucugcaacag gccccagcca 780
ggccugaagu cauccucaga agggauggau ccugaggucg ccaugcccag cugggcaaac 840
augagucugg auucuucccc ggagucggcu gccuuggcug ugaggcugga gggagaugag 900
cugcuagacc accugcgucu cagcauccug cccugggaug agagcauccu ggacacccuc 960
ucgcccaggc ucgcuacagc acugagugaa gaaaugaaag acaaaggugg auacaugagc 1020
aagauuugca acuugcuacc cauuaggaua augucuuaug uaaugcugcc cuguacccug 1080
ccuguggaau cugccauugc gauuguccag agacugguga cauggcuucc agauaugccc 1140
gacgaugucc ugugguugca gugggugacc ucacaggugu ucacucgagu gcugaugugu 1200
cugcuccccg ccuccagguc ccaaaugcca gugagcagcc aacaggccuc cccaugcaca 1260
ccugagcagg acuggcccug cuggacuccc ugcuccccca agggcugucc agcagagacc 1320
aaagcagagg ccaccccgcg guccauccuc agguccagcc ugaacuucuu cuugggcaau 1380
aaaguaccug cuggugcuga ggggcucucc accuuuccca guuuuucacu agagaagagu 1440
cug 1443
<210> 33
<211> 1431
<212> DNA
<213> Homo sapien
<400> 33
auguacgacg cagagcgcgg cuggagcuug uccuucgcgg gcugcggcuu ccugggcuuc 60
uaccacgucg gggcgacccg cugccugagc gagcacgccc cgcaccuccu ccgcgacgcg 120
cgcauguugu ucggcgcuuc ggccggggcg uugcacugcg ucggcguccu cuccgagcag 180
acucugcagg uccucucaga ucuugugcgg aaggccagga gucggaacau uggcaucuuc 240
cauccauccu ucaacuuaag caaguuccuc cgacaggguc ucugcaaaug ccucccggcc 300
aauguccacc agcucaucuc cggcaaaaua ggcaucucuc uuaccagagu gucugauggg 360
gaaaacguuc uggugucuga cuuucggucc aaagacgaag ucguggaugc cuugguaugu 420
uccugcuuca uccccuucua caguggccuu aucccuccuu ccuucagagg cgugcgauau 480
guggauggag gagugaguga caacguaccc uucauugaug ccaaaacaac caucaccgug 540
ucccccuucu auggggagua cgacaucugc ccuaaaguca aguccacgaa cuuucuucau 600
guggacauca ccaagcucag ucuacgccuc ugcacaggga accucuaccu ucucucgaga 660
gcuuuugucc ccccggaucu caaggugcug ggagagauau gccuucgagg auauuuggau 720
gcauucaggu ucuuggaaga gaagggcauc ugcaacaggc cccagccagg ccugaaguca 780
uccucagaag ggauggaucc ugaggucgcc augcccagcu gggcaaacau gagucuggau 840
ucuuccccgg agucggcugc cuuggcugug aggcuggagg gagaugagcu gcuagaccac 900
cugcgucuca gcauccugcc cugggaugag agcauccugg acacccucuc gcccaggcuc 960
gcuacagcac ugagugaaga aaugaaagac aaagguggau acaugagcaa gauuugcaac 1020
uugcuaccca uuaggauaau gucuuaugua augcugcccu guacccugcc uguggaaucu 1080
gccauugcga uuguccagag acuggugaca uggcuuccag auaugcccga cgauguccug 1140
ugguugcagu gggugaccuc acagguguuc acucgagugc ugaugugucu gcuccccgcc 1200
uccagguccc aaaugccagu gagcagccaa caggccuccc caugcacacc ugagcaggac 1260
uggcccugcu ggacucccug cucccccaag ggcuguccag cagagaccaa agcagaggcc 1320
accccgcggu ccauccucag guccagccug aacuucuucu ugggcaauaa aguaccugcu 1380
ggugcugagg ggcucuccac cuuucccagu uuuucacuag agaagagucu g 1431
<210> 34
<211> 1443
<212> DNA
<213> Homo sapien
<400> 34
auguacgacg cagagcgcgg cuggagcuug uccuucgcgg gcugcggcuu ccugggcuuc 60
uaccacgucg gggcgacccg cugccugagc gagcacgccc cgcaccuccu ccgcgacgcg 120
cgcauguugu ucggcgcuuc ggccggggcg uugcacugcg ucggcguccu cuccgguauc 180
ccgcuggagc agacucugca gguccucuca gaucuugugc ggaaggccag gagucggaac 240
auuggcaucu uccauccauc cuucaacuua agcaaguucc uccgacaggg ucucugcaaa 300
ugccucccgg ccaaugucca ccagcucauc uccggcaaaa uaggcaucuc ucuuaccaga 360
gugucugaug gggaaaacgu ucuggugucu gacuuucggu ccaaagacga agucguggau 420
gccuugguau guuccugcuu caugcccuuc uacaguggcc uuaucccucc uuccuucaga 480
ggcgugcgau auguggaugg aggagugagu gacaacguac ccuucauuga ugccaaaaca 540
accaucaccg ugucccccuu cuauggggag uacgacaucu gcccuaaagu caaguccacg 600
aacuuucuuc auguggacau caccaagcuc agucuacgcc ucugcacagg gaaccucuac 660
cuucucucga gagcuuuugu ccccccggau cucaaggugc ugggagagau augccuucga 720
ggauauuugg augcauucag guucuuggaa gagaagggca ucugcaacag gccccagcca 780
ggccugaagu cauccucaga agggauggau ccugaggucg ccaugcccag cugggcaaac 840
augagucugg auucuucccc ggagucggcu gccuuggcug ugaggcugga gggagaugag 900
cugcuagacc accugcgucu cagcauccug cccugggaug agagcauccu ggacacccuc 960
ucgcccaggc ucgcuacagc acugagugaa gaaaugaaag acaaaggugg auacaugagc 1020
aagauuugca acuugcuacc cauuaggaua augucuuaug uaaugcugcc cuguacccug 1080
ccuguggaau cugccauugc gauuguccag agacugguga cauggcuucc agauaugccc 1140
gacgaugucc ugugguugca gugggugacc ucacaggugu ucacucgagu gcugaugugu 1200
cugcuccccg ccuccagguc ccaaaugcca gugagcagcc aacaggccuc cccaugcaca 1260
ccugagcagg acuggcccug cuggacuccc ugcuccccca agggcugucc agcagagacc 1320
aaagcagagg ccaccccgcg guccauccuc agguccagcc ugaacuucuu cuugggcaau 1380
aaaguaccug cuggugcuga ggggcucucc accuuuccca guuuuucacu agagaagagu 1440
cug 1443
<210> 35
<211> 1431
<212> DNA
<213> Homo sapien
<400> 35
auguacgacg cagagcgcgg cuggagcuug uccuucgcgg gcugcggcuu ccugggcuuc 60
uaccacgucg gggcgacccg cugccugagc gagcacgccc cgcaccuccu ccgcgacgcg 120
cgcauguugu ucggcgcuuc ggccggggcg uugcacugcg ucggcguccu cuccgagcag 180
acucugcagg uccucucaga ucuugugcgg aaggccagga gucggaacau uggcaucuuc 240
cauccauccu ucaacuuaag caaguuccuc cgacaggguc ucugcaaaug ccucccggcc 300
aauguccacc agcucaucuc cggcaaaaua ggcaucucuc uuaccagagu gucugauggg 360
gaaaacguuc uggugucuga cuuucggucc aaagacgaag ucguggaugc cuugguaugu 420
uccugcuuca ugcccuucua caguggccuu aucccuccuu ccuucagagg cgugcgauau 480
guggauggag gagugaguga caacguaccc uucauugaug ccaaaacaac caucaccgug 540
ucccccuucu auggggagua cgacaucugc ccuaaaguca aguccacgaa cuuucuucau 600
guggacauca ccaagcucag ucuacgccuc ugcacaggga accucuaccu ucucucgaga 660
gcuuuugucc ccccggaucu caaggugcug ggagagauau gccuucgagg auauuuggau 720
gcauucaggu ucuuggaaga gaagggcauc ugcaacaggc cccagccagg ccugaaguca 780
uccucagaag ggauggaucc ugaggucgcc augcccagcu gggcaaacau gagucuggau 840
ucuuccccgg agucggcugc cuuggcugug aggcuggagg gagaugagcu gcuagaccac 900
cugcgucuca gcauccugcc cugggaugag agcauccugg acacccucuc gcccaggcuc 960
gcuacagcac ugagugaaga aaugaaagac aaagguggau acaugagcaa gauuugcaac 1020
uugcuaccca uuaggauaau gucuuaugua augcugcccu guacccugcc uguggaaucu 1080
gccauugcga uuguccagag acuggugaca uggcuuccag auaugcccga cgauguccug 1140
ugguugcagu gggugaccuc acagguguuc acucgagugc ugaugugucu gcuccccgcc 1200
uccagguccc aaaugccagu gagcagccaa caggccuccc caugcacacc ugagcaggac 1260
uggcccugcu ggacucccug cucccccaag ggcuguccag cagagaccaa agcagaggcc 1320
accccgcggu ccauccucag guccagccug aacuucuucu ugggcaauaa aguaccugcu 1380
ggugcugagg ggcucuccac cuuucccagu uuuucacuag agaagagucu g 1431
<210> 36
<211> 1443
<212> DNA
<213> Homo sapien
<400> 36
atgtacgacg cagagcgcgg ctggagcttg tccttcgcgg gctgcggctt cctgggcttc 60
taccacgtcg gggcgacccg ctgcctgagc gagcacgccc cgcacctcct ccgcgacgcg 120
cgcatgttgt tcggcgcttc ggccggggcg ttgcactgcg tcggcgtcct ctccggtatc 180
ccgctggagc agactctgca ggtcctctca gatcttgtgc ggaaggccag gagtcggaac 240
attggcatct tccatccatc cttcaactta agcaagttcc tccgacaggg tctctgcaaa 300
tgcctcccgg ccaatgtcca ccagctcatc tccggcaaaa taggcatctc tcttaccaga 360
gtgtctgatg gggaaaacgt tctggtgtct gactttcggt ccaaagacga agtcgtggat 420
gccttggtat gttcctgctt catccccttc tacagtggcc ttatccctcc ttccttcaga 480
ggcgtgcgat atgtggatgg aggagtgagt gacaacgtac ccttcattga tgccaaaaca 540
accatcaccg tgtccccctt ctatggggag tacgacatct gccctaaagt caagtccacg 600
aactttcttc atgtggacat caccaagctc agtctacgcc tctgcacagg gaacctctac 660
cttctctcga gagcttttgt ccccccggat ctcaaggtgc tgggagagat atgccttcga 720
ggatatttgg atgcattcag gttcttggaa gagaagggca tctgcaacag gccccagcca 780
ggcctgaagt catcctcaga agggatggat cctgaggtcg ccatgcccag ctgggcaaac 840
atgagtctgg attcttcccc ggagtcggct gccttggctg tgaggctgga gggagatgag 900
ctgctagacc acctgcgtct cagcatcctg ccctgggatg agagcatcct ggacaccctc 960
tcgcccaggc tcgctacagc actgagtgaa gaaatgaaag acaaaggtgg atacatgagc 1020
aagatttgca acttgctacc cattaggata atgtcttatg taatgctgcc ctgtaccctg 1080
cctgtggaat ctgccattgc gattgtccag agactggtga catggcttcc agatatgccc 1140
gacgatgtcc tgtggttgca gtgggtgacc tcacaggtgt tcactcgagt gctgatgtgt 1200
ctgctccccg cctccaggtc ccaaatgcca gtgagcagcc aacaggcctc cccatgcaca 1260
cctgagcagg actggccctg ctggactccc tgctccccca agggctgtcc agcagagacc 1320
aaagcagagg ccaccccgcg gtccatcctc aggtccagcc tgaacttctt cttgggcaat 1380
aaagtacctg ctggtgctga ggggctctcc acctttccca gtttttcact agagaagagt 1440
ctg 1443
<210> 37
<211> 1431
<212> DNA
<213> Homo sapien
<400> 37
atgtacgacg cagagcgcgg ctggagcttg tccttcgcgg gctgcggctt cctgggcttc 60
taccacgtcg gggcgacccg ctgcctgagc gagcacgccc cgcacctcct ccgcgacgcg 120
cgcatgttgt tcggcgcttc ggccggggcg ttgcactgcg tcggcgtcct ctccgagcag 180
actctgcagg tcctctcaga tcttgtgcgg aaggccagga gtcggaacat tggcatcttc 240
catccatcct tcaacttaag caagttcctc cgacagggtc tctgcaaatg cctcccggcc 300
aatgtccacc agctcatctc cggcaaaata ggcatctctc ttaccagagt gtctgatggg 360
gaaaacgttc tggtgtctga ctttcggtcc aaagacgaag tcgtggatgc cttggtatgt 420
tcctgcttca tccccttcta cagtggcctt atccctcctt ccttcagagg cgtgcgatat 480
gtggatggag gagtgagtga caacgtaccc ttcattgatg ccaaaacaac catcaccgtg 540
tcccccttct atggggagta cgacatctgc cctaaagtca agtccacgaa ctttcttcat 600
gtggacatca ccaagctcag tctacgcctc tgcacaggga acctctacct tctctcgaga 660
gcttttgtcc ccccggatct caaggtgctg ggagagatat gccttcgagg atatttggat 720
gcattcaggt tcttggaaga gaagggcatc tgcaacaggc cccagccagg cctgaagtca 780
tcctcagaag ggatggatcc tgaggtcgcc atgcccagct gggcaaacat gagtctggat 840
tcttccccgg agtcggctgc cttggctgtg aggctggagg gagatgagct gctagaccac 900
ctgcgtctca gcatcctgcc ctgggatgag agcatcctgg acaccctctc gcccaggctc 960
gctacagcac tgagtgaaga aatgaaagac aaaggtggat acatgagcaa gatttgcaac 1020
ttgctaccca ttaggataat gtcttatgta atgctgccct gtaccctgcc tgtggaatct 1080
gccattgcga ttgtccagag actggtgaca tggcttccag atatgcccga cgatgtcctg 1140
tggttgcagt gggtgacctc acaggtgttc actcgagtgc tgatgtgtct gctccccgcc 1200
tccaggtccc aaatgccagt gagcagccaa caggcctccc catgcacacc tgagcaggac 1260
tggccctgct ggactccctg ctcccccaag ggctgtccag cagagaccaa agcagaggcc 1320
accccgcggt ccatcctcag gtccagcctg aacttcttct tgggcaataa agtacctgct 1380
ggtgctgagg ggctctccac ctttcccagt ttttcactag agaagagtct g 1431
<210> 38
<211> 1443
<212> DNA
<213> Homo sapien
<400> 38
atgtacgacg cagagcgcgg ctggagcttg tccttcgcgg gctgcggctt cctgggcttc 60
taccacgtcg gggcgacccg ctgcctgagc gagcacgccc cgcacctcct ccgcgacgcg 120
cgcatgttgt tcggcgcttc ggccggggcg ttgcactgcg tcggcgtcct ctccggtatc 180
ccgctggagc agactctgca ggtcctctca gatcttgtgc ggaaggccag gagtcggaac 240
attggcatct tccatccatc cttcaactta agcaagttcc tccgacaggg tctctgcaaa 300
tgcctcccgg ccaatgtcca ccagctcatc tccggcaaaa taggcatctc tcttaccaga 360
gtgtctgatg gggaaaacgt tctggtgtct gactttcggt ccaaagacga agtcgtggat 420
gccttggtat gttcctgctt catgcccttc tacagtggcc ttatccctcc ttccttcaga 480
ggcgtgcgat atgtggatgg aggagtgagt gacaacgtac ccttcattga tgccaaaaca 540
accatcaccg tgtccccctt ctatggggag tacgacatct gccctaaagt caagtccacg 600
aactttcttc atgtggacat caccaagctc agtctacgcc tctgcacagg gaacctctac 660
cttctctcga gagcttttgt ccccccggat ctcaaggtgc tgggagagat atgccttcga 720
ggatatttgg atgcattcag gttcttggaa gagaagggca tctgcaacag gccccagcca 780
ggcctgaagt catcctcaga agggatggat cctgaggtcg ccatgcccag ctgggcaaac 840
atgagtctgg attcttcccc ggagtcggct gccttggctg tgaggctgga gggagatgag 900
ctgctagacc acctgcgtct cagcatcctg ccctgggatg agagcatcct ggacaccctc 960
tcgcccaggc tcgctacagc actgagtgaa gaaatgaaag acaaaggtgg atacatgagc 1020
aagatttgca acttgctacc cattaggata atgtcttatg taatgctgcc ctgtaccctg 1080
cctgtggaat ctgccattgc gattgtccag agactggtga catggcttcc agatatgccc 1140
gacgatgtcc tgtggttgca gtgggtgacc tcacaggtgt tcactcgagt gctgatgtgt 1200
ctgctccccg cctccaggtc ccaaatgcca gtgagcagcc aacaggcctc cccatgcaca 1260
cctgagcagg actggccctg ctggactccc tgctccccca agggctgtcc agcagagacc 1320
aaagcagagg ccaccccgcg gtccatcctc aggtccagcc tgaacttctt cttgggcaat 1380
aaagtacctg ctggtgctga ggggctctcc acctttccca gtttttcact agagaagagt 1440
ctg 1443
<210> 39
<211> 1431
<212> DNA
<213> Homo sapien
<400> 39
atgtacgacg cagagcgcgg ctggagcttg tccttcgcgg gctgcggctt cctgggcttc 60
taccacgtcg gggcgacccg ctgcctgagc gagcacgccc cgcacctcct ccgcgacgcg 120
cgcatgttgt tcggcgcttc ggccggggcg ttgcactgcg tcggcgtcct ctccgagcag 180
actctgcagg tcctctcaga tcttgtgcgg aaggccagga gtcggaacat tggcatcttc 240
catccatcct tcaacttaag caagttcctc cgacagggtc tctgcaaatg cctcccggcc 300
aatgtccacc agctcatctc cggcaaaata ggcatctctc ttaccagagt gtctgatggg 360
gaaaacgttc tggtgtctga ctttcggtcc aaagacgaag tcgtggatgc cttggtatgt 420
tcctgcttca tgcccttcta cagtggcctt atccctcctt ccttcagagg cgtgcgatat 480
gtggatggag gagtgagtga caacgtaccc ttcattgatg ccaaaacaac catcaccgtg 540
tcccccttct atggggagta cgacatctgc cctaaagtca agtccacgaa ctttcttcat 600
gtggacatca ccaagctcag tctacgcctc tgcacaggga acctctacct tctctcgaga 660
gcttttgtcc ccccggatct caaggtgctg ggagagatat gccttcgagg atatttggat 720
gcattcaggt tcttggaaga gaagggcatc tgcaacaggc cccagccagg cctgaagtca 780
tcctcagaag ggatggatcc tgaggtcgcc atgcccagct gggcaaacat gagtctggat 840
tcttccccgg agtcggctgc cttggctgtg aggctggagg gagatgagct gctagaccac 900
ctgcgtctca gcatcctgcc ctgggatgag agcatcctgg acaccctctc gcccaggctc 960
gctacagcac tgagtgaaga aatgaaagac aaaggtggat acatgagcaa gatttgcaac 1020
ttgctaccca ttaggataat gtcttatgta atgctgccct gtaccctgcc tgtggaatct 1080
gccattgcga ttgtccagag actggtgaca tggcttccag atatgcccga cgatgtcctg 1140
tggttgcagt gggtgacctc acaggtgttc actcgagtgc tgatgtgtct gctccccgcc 1200
tccaggtccc aaatgccagt gagcagccaa caggcctccc catgcacacc tgagcaggac 1260
tggccctgct ggactccctg ctcccccaag ggctgtccag cagagaccaa agcagaggcc 1320
accccgcggt ccatcctcag gtccagcctg aacttcttct tgggcaataa agtacctgct 1380
ggtgctgagg ggctctccac ctttcccagt ttttcactag agaagagtct g 1431
<210> 40
<211> 481
<212> PRT
<213> Homo sapien
<400> 40
Met Tyr Asp Ala Glu Arg Gly Trp Ser Leu Ser Phe Ala Gly Cys Gly
1 5 10 15
Phe Leu Gly Phe Tyr His Val Gly Ala Thr Arg Cys Leu Ser Glu His
20 25 30
Ala Pro His Leu Leu Arg Asp Ala Arg Met Leu Phe Gly Ala Ser Ala
35 40 45
Gly Ala Leu His Cys Val Gly Val Leu Ser Gly Ile Pro Leu Glu Gln
50 55 60
Thr Leu Gln Val Leu Ser Asp Leu Val Arg Lys Ala Arg Ser Arg Asn
65 70 75 80
Ile Gly Ile Phe His Pro Ser Phe Asn Leu Ser Lys Phe Leu Arg Gln
85 90 95
Gly Leu Cys Lys Cys Leu Pro Ala Asn Val His Gln Leu Ile Ser Gly
100 105 110
Lys Ile Gly Ile Ser Leu Thr Arg Val Ser Asp Gly Glu Asn Val Leu
115 120 125
Val Ser Asp Phe Arg Ser Lys Asp Glu Val Val Asp Ala Leu Val Cys
130 135 140
Ser Cys Phe Ile Pro Phe Tyr Ser Gly Leu Ile Pro Pro Ser Phe Arg
145 150 155 160
Gly Val Arg Tyr Val Asp Gly Gly Val Ser Asp Asn Val Pro Phe Ile
165 170 175
Asp Ala Lys Thr Thr Ile Thr Val Ser Pro Phe Tyr Gly Glu Tyr Asp
180 185 190
Ile Cys Pro Lys Val Lys Ser Thr Asn Phe Leu His Val Asp Ile Thr
195 200 205
Lys Leu Ser Leu Arg Leu Cys Thr Gly Asn Leu Tyr Leu Leu Ser Arg
210 215 220
Ala Phe Val Pro Pro Asp Leu Lys Val Leu Gly Glu Ile Cys Leu Arg
225 230 235 240
Gly Tyr Leu Asp Ala Phe Arg Phe Leu Glu Glu Lys Gly Ile Cys Asn
245 250 255
Arg Pro Gln Pro Gly Leu Lys Ser Ser Ser Glu Gly Met Asp Pro Glu
260 265 270
Val Ala Met Pro Ser Trp Ala Asn Met Ser Leu Asp Ser Ser Pro Glu
275 280 285
Ser Ala Ala Leu Ala Val Arg Leu Glu Gly Asp Glu Leu Leu Asp His
290 295 300
Leu Arg Leu Ser Ile Leu Pro Trp Asp Glu Ser Ile Leu Asp Thr Leu
305 310 315 320
Ser Pro Arg Leu Ala Thr Ala Leu Ser Glu Glu Met Lys Asp Lys Gly
325 330 335
Gly Tyr Met Ser Lys Ile Cys Asn Leu Leu Pro Ile Arg Ile Met Ser
340 345 350
Tyr Val Met Leu Pro Cys Thr Leu Pro Val Glu Ser Ala Ile Ala Ile
355 360 365
Val Gln Arg Leu Val Thr Trp Leu Pro Asp Met Pro Asp Asp Val Leu
370 375 380
Trp Leu Gln Trp Val Thr Ser Gln Val Phe Thr Arg Val Leu Met Cys
385 390 395 400
Leu Leu Pro Ala Ser Arg Ser Gln Met Pro Val Ser Ser Gln Gln Ala
405 410 415
Ser Pro Cys Thr Pro Glu Gln Asp Trp Pro Cys Trp Thr Pro Cys Ser
420 425 430
Pro Lys Gly Cys Pro Ala Glu Thr Lys Ala Glu Ala Thr Pro Arg Ser
435 440 445
Ile Leu Arg Ser Ser Leu Asn Phe Phe Leu Gly Asn Lys Val Pro Ala
450 455 460
Gly Ala Glu Gly Leu Ser Thr Phe Pro Ser Phe Ser Leu Glu Lys Ser
465 470 475 480
Leu
<210> 41
<211> 477
<212> PRT
<213> Homo sapien
<400> 41
Met Tyr Asp Ala Glu Arg Gly Trp Ser Leu Ser Phe Ala Gly Cys Gly
1 5 10 15
Phe Leu Gly Phe Tyr His Val Gly Ala Thr Arg Cys Leu Ser Glu His
20 25 30
Ala Pro His Leu Leu Arg Asp Ala Arg Met Leu Phe Gly Ala Ser Ala
35 40 45
Gly Ala Leu His Cys Val Gly Val Leu Ser Glu Gln Thr Leu Gln Val
50 55 60
Leu Ser Asp Leu Val Arg Lys Ala Arg Ser Arg Asn Ile Gly Ile Phe
65 70 75 80
His Pro Ser Phe Asn Leu Ser Lys Phe Leu Arg Gln Gly Leu Cys Lys
85 90 95
Cys Leu Pro Ala Asn Val His Gln Leu Ile Ser Gly Lys Ile Gly Ile
100 105 110
Ser Leu Thr Arg Val Ser Asp Gly Glu Asn Val Leu Val Ser Asp Phe
115 120 125
Arg Ser Lys Asp Glu Val Val Asp Ala Leu Val Cys Ser Cys Phe Ile
130 135 140
Pro Phe Tyr Ser Gly Leu Ile Pro Pro Ser Phe Arg Gly Val Arg Tyr
145 150 155 160
Val Asp Gly Gly Val Ser Asp Asn Val Pro Phe Ile Asp Ala Lys Thr
165 170 175
Thr Ile Thr Val Ser Pro Phe Tyr Gly Glu Tyr Asp Ile Cys Pro Lys
180 185 190
Val Lys Ser Thr Asn Phe Leu His Val Asp Ile Thr Lys Leu Ser Leu
195 200 205
Arg Leu Cys Thr Gly Asn Leu Tyr Leu Leu Ser Arg Ala Phe Val Pro
210 215 220
Pro Asp Leu Lys Val Leu Gly Glu Ile Cys Leu Arg Gly Tyr Leu Asp
225 230 235 240
Ala Phe Arg Phe Leu Glu Glu Lys Gly Ile Cys Asn Arg Pro Gln Pro
245 250 255
Gly Leu Lys Ser Ser Ser Glu Gly Met Asp Pro Glu Val Ala Met Pro
260 265 270
Ser Trp Ala Asn Met Ser Leu Asp Ser Ser Pro Glu Ser Ala Ala Leu
275 280 285
Ala Val Arg Leu Glu Gly Asp Glu Leu Leu Asp His Leu Arg Leu Ser
290 295 300
Ile Leu Pro Trp Asp Glu Ser Ile Leu Asp Thr Leu Ser Pro Arg Leu
305 310 315 320
Ala Thr Ala Leu Ser Glu Glu Met Lys Asp Lys Gly Gly Tyr Met Ser
325 330 335
Lys Ile Cys Asn Leu Leu Pro Ile Arg Ile Met Ser Tyr Val Met Leu
340 345 350
Pro Cys Thr Leu Pro Val Glu Ser Ala Ile Ala Ile Val Gln Arg Leu
355 360 365
Val Thr Trp Leu Pro Asp Met Pro Asp Asp Val Leu Trp Leu Gln Trp
370 375 380
Val Thr Ser Gln Val Phe Thr Arg Val Leu Met Cys Leu Leu Pro Ala
385 390 395 400
Ser Arg Ser Gln Met Pro Val Ser Ser Gln Gln Ala Ser Pro Cys Thr
405 410 415
Pro Glu Gln Asp Trp Pro Cys Trp Thr Pro Cys Ser Pro Lys Gly Cys
420 425 430
Pro Ala Glu Thr Lys Ala Glu Ala Thr Pro Arg Ser Ile Leu Arg Ser
435 440 445
Ser Leu Asn Phe Phe Leu Gly Asn Lys Val Pro Ala Gly Ala Glu Gly
450 455 460
Leu Ser Thr Phe Pro Ser Phe Ser Leu Glu Lys Ser Leu
465 470 475
<210> 42
<211> 481
<212> PRT
<213> Homo sapien
<400> 42
Met Tyr Asp Ala Glu Arg Gly Trp Ser Leu Ser Phe Ala Gly Cys Gly
1 5 10 15
Phe Leu Gly Phe Tyr His Val Gly Ala Thr Arg Cys Leu Ser Glu His
20 25 30
Ala Pro His Leu Leu Arg Asp Ala Arg Met Leu Phe Gly Ala Ser Ala
35 40 45
Gly Ala Leu His Cys Val Gly Val Leu Ser Gly Ile Pro Leu Glu Gln
50 55 60
Thr Leu Gln Val Leu Ser Asp Leu Val Arg Lys Ala Arg Ser Arg Asn
65 70 75 80
Ile Gly Ile Phe His Pro Ser Phe Asn Leu Ser Lys Phe Leu Arg Gln
85 90 95
Gly Leu Cys Lys Cys Leu Pro Ala Asn Val His Gln Leu Ile Ser Gly
100 105 110
Lys Ile Gly Ile Ser Leu Thr Arg Val Ser Asp Gly Glu Asn Val Leu
115 120 125
Val Ser Asp Phe Arg Ser Lys Asp Glu Val Val Asp Ala Leu Val Cys
130 135 140
Ser Cys Phe Met Pro Phe Tyr Ser Gly Leu Ile Pro Pro Ser Phe Arg
145 150 155 160
Gly Val Arg Tyr Val Asp Gly Gly Val Ser Asp Asn Val Pro Phe Ile
165 170 175
Asp Ala Lys Thr Thr Ile Thr Val Ser Pro Phe Tyr Gly Glu Tyr Asp
180 185 190
Ile Cys Pro Lys Val Lys Ser Thr Asn Phe Leu His Val Asp Ile Thr
195 200 205
Lys Leu Ser Leu Arg Leu Cys Thr Gly Asn Leu Tyr Leu Leu Ser Arg
210 215 220
Ala Phe Val Pro Pro Asp Leu Lys Val Leu Gly Glu Ile Cys Leu Arg
225 230 235 240
Gly Tyr Leu Asp Ala Phe Arg Phe Leu Glu Glu Lys Gly Ile Cys Asn
245 250 255
Arg Pro Gln Pro Gly Leu Lys Ser Ser Ser Glu Gly Met Asp Pro Glu
260 265 270
Val Ala Met Pro Ser Trp Ala Asn Met Ser Leu Asp Ser Ser Pro Glu
275 280 285
Ser Ala Ala Leu Ala Val Arg Leu Glu Gly Asp Glu Leu Leu Asp His
290 295 300
Leu Arg Leu Ser Ile Leu Pro Trp Asp Glu Ser Ile Leu Asp Thr Leu
305 310 315 320
Ser Pro Arg Leu Ala Thr Ala Leu Ser Glu Glu Met Lys Asp Lys Gly
325 330 335
Gly Tyr Met Ser Lys Ile Cys Asn Leu Leu Pro Ile Arg Ile Met Ser
340 345 350
Tyr Val Met Leu Pro Cys Thr Leu Pro Val Glu Ser Ala Ile Ala Ile
355 360 365
Val Gln Arg Leu Val Thr Trp Leu Pro Asp Met Pro Asp Asp Val Leu
370 375 380
Trp Leu Gln Trp Val Thr Ser Gln Val Phe Thr Arg Val Leu Met Cys
385 390 395 400
Leu Leu Pro Ala Ser Arg Ser Gln Met Pro Val Ser Ser Gln Gln Ala
405 410 415
Ser Pro Cys Thr Pro Glu Gln Asp Trp Pro Cys Trp Thr Pro Cys Ser
420 425 430
Pro Lys Gly Cys Pro Ala Glu Thr Lys Ala Glu Ala Thr Pro Arg Ser
435 440 445
Ile Leu Arg Ser Ser Leu Asn Phe Phe Leu Gly Asn Lys Val Pro Ala
450 455 460
Gly Ala Glu Gly Leu Ser Thr Phe Pro Ser Phe Ser Leu Glu Lys Ser
465 470 475 480
Leu
<210> 43
<211> 477
<212> PRT
<213> Homo sapien
<400> 43
Met Tyr Asp Ala Glu Arg Gly Trp Ser Leu Ser Phe Ala Gly Cys Gly
1 5 10 15
Phe Leu Gly Phe Tyr His Val Gly Ala Thr Arg Cys Leu Ser Glu His
20 25 30
Ala Pro His Leu Leu Arg Asp Ala Arg Met Leu Phe Gly Ala Ser Ala
35 40 45
Gly Ala Leu His Cys Val Gly Val Leu Ser Glu Gln Thr Leu Gln Val
50 55 60
Leu Ser Asp Leu Val Arg Lys Ala Arg Ser Arg Asn Ile Gly Ile Phe
65 70 75 80
His Pro Ser Phe Asn Leu Ser Lys Phe Leu Arg Gln Gly Leu Cys Lys
85 90 95
Cys Leu Pro Ala Asn Val His Gln Leu Ile Ser Gly Lys Ile Gly Ile
100 105 110
Ser Leu Thr Arg Val Ser Asp Gly Glu Asn Val Leu Val Ser Asp Phe
115 120 125
Arg Ser Lys Asp Glu Val Val Asp Ala Leu Val Cys Ser Cys Phe Met
130 135 140
Pro Phe Tyr Ser Gly Leu Ile Pro Pro Ser Phe Arg Gly Val Arg Tyr
145 150 155 160
Val Asp Gly Gly Val Ser Asp Asn Val Pro Phe Ile Asp Ala Lys Thr
165 170 175
Thr Ile Thr Val Ser Pro Phe Tyr Gly Glu Tyr Asp Ile Cys Pro Lys
180 185 190
Val Lys Ser Thr Asn Phe Leu His Val Asp Ile Thr Lys Leu Ser Leu
195 200 205
Arg Leu Cys Thr Gly Asn Leu Tyr Leu Leu Ser Arg Ala Phe Val Pro
210 215 220
Pro Asp Leu Lys Val Leu Gly Glu Ile Cys Leu Arg Gly Tyr Leu Asp
225 230 235 240
Ala Phe Arg Phe Leu Glu Glu Lys Gly Ile Cys Asn Arg Pro Gln Pro
245 250 255
Gly Leu Lys Ser Ser Ser Glu Gly Met Asp Pro Glu Val Ala Met Pro
260 265 270
Ser Trp Ala Asn Met Ser Leu Asp Ser Ser Pro Glu Ser Ala Ala Leu
275 280 285
Ala Val Arg Leu Glu Gly Asp Glu Leu Leu Asp His Leu Arg Leu Ser
290 295 300
Ile Leu Pro Trp Asp Glu Ser Ile Leu Asp Thr Leu Ser Pro Arg Leu
305 310 315 320
Ala Thr Ala Leu Ser Glu Glu Met Lys Asp Lys Gly Gly Tyr Met Ser
325 330 335
Lys Ile Cys Asn Leu Leu Pro Ile Arg Ile Met Ser Tyr Val Met Leu
340 345 350
Pro Cys Thr Leu Pro Val Glu Ser Ala Ile Ala Ile Val Gln Arg Leu
355 360 365
Val Thr Trp Leu Pro Asp Met Pro Asp Asp Val Leu Trp Leu Gln Trp
370 375 380
Val Thr Ser Gln Val Phe Thr Arg Val Leu Met Cys Leu Leu Pro Ala
385 390 395 400
Ser Arg Ser Gln Met Pro Val Ser Ser Gln Gln Ala Ser Pro Cys Thr
405 410 415
Pro Glu Gln Asp Trp Pro Cys Trp Thr Pro Cys Ser Pro Lys Gly Cys
420 425 430
Pro Ala Glu Thr Lys Ala Glu Ala Thr Pro Arg Ser Ile Leu Arg Ser
435 440 445
Ser Leu Asn Phe Phe Leu Gly Asn Lys Val Pro Ala Gly Ala Glu Gly
450 455 460
Leu Ser Thr Phe Pro Ser Phe Ser Leu Glu Lys Ser Leu
465 470 475
<210> 44
<211> 2397
<212> DNA
<213> Homo sapien
<400> 44
agacaguacc uccucccuag gacuacacaa ggacugaacc agaaggaaga ggacagagca 60
aagccaugaa caucauccua gaaauccuuc ugcuucugau caccaucauc uacuccuacu 120
uggagucguu ggugaaguuu uucauuccuc agaggagaaa aucuguggcu ggggagauug 180
uucucauuac uggagcuggg cauggaauag gcaggcagac uacuuaugaa uuugcaaaac 240
gacagagcau auugguucug ugggauauua auaagcgcgg uguggaggaa acugcagcug 300
agugccgaaa acuaggcguc acugcgcaug cguauguggu agacugcagc aacagagaag 360
agaucuaucg cucucuaaau caggugaaga aagaaguggg ugauguaaca aucgugguga 420
auaaugcugg gacaguauau ccagccgauc uucucagcac caaggaugaa gagauuacca 480
agacauuuga ggucaacauc cuaggacauu uuuggaucac aaaagcacuu cuuccaucga 540
ugauggagag aaaucauggc cacaucguca caguggcuuc agugugcggc cacgaaggga 600
uuccuuaccu caucccauau uguuccagca aauuugccgc uguuggcuuu cacagagguc 660
ugacaucaga acuucaggcc uugggaaaaa cugguaucaa aaccucaugu cucugcccag 720
uuuuugugaa uacuggguuc accaaaaauc caagcacaag auuauggccu guauuggaga 780
cagaugaagu cguaagaagu cugauagaug gaauacuuac caauaagaaa augauuuuug 840
uuccaucgua uaucaauauc uuucugagac uacagaaguu ucuuccugaa cgcgccucag 900
cgauuuuaaa ucguaugcag aauauucaau uugaagcagu gguuggccac aaaaucaaaa 960
ugaaaugaau aaauaagcuc cagccagaga uguaugcaug auaaugauau gaauaguuuc 1020
gaaucaaugc ugcaaagcuu uauuucacau uuuuucaguc cugauaauau uaaaaacauu 1080
gguuuggcac uagcagcagu caaacgaaca agauuaauua ccugucuucc uguuucucaa 1140
gaauauuuac guaguuuuuc auaggucugu uuuuccuuuc augccucuua aaaacuucug 1200
ugcuuacaua aacauacuua aaagguuuuc uuuaagauau uuuauuuuuc cauuuaaagg 1260
uggacaaaag cuaccucccu aaaaguaaau acaaagagaa cuuauuuaca cagggaaggu 1320
uuaagacugu ucaaguagca uuccaaucug uagccaugcc acagaauauc aacaagaaca 1380
cagaaugagu gcacagcuaa gagaucaagu uucagcaggc agcuuuaucu caaccuggac 1440
auauuuuaag auucagcauu ugaaagauuu cccuagccuc uuccuuuuuc auuagcccaa 1500
aacggugcaa cucuauucug gacuuuauua cuugauucug ucuucuguau aacucugaag 1560
uccaccaaaa guggacccuc uauauuuccu cccuuuuuau agucuuauaa gauacauuau 1620
gaaaggugac cgacucuauu uuaaaucuca gaauuuuaag uucuagcccc augauaaccu 1680
uuuucuuugu aauuuaugcu uucauauauc cuugguccca gagauguuua gacaauuuua 1740
ggcucaaaaa uuaaagcuaa cacaggaaaa ggaacuguac uggcuauuac auaagaaaca 1800
auggacccaa gagaagaaaa ggaagaaaga aagguuuuuu gguuuuuguu uuguuuuguu 1860
uuguuuuuug uuuuuuugag auggagucuc acucuuucgc ccaggcugga gugcaguggu 1920
augaucucag cucacugcaa gcuccaccuc ccggguucac gccauucucc ugccucagcc 1980
uccugaguag cugggacuac aggcgcccgc caccacaccc ggcuaauuuu uuguauuuuu 2040
uguagagacg ggguuucacc auguuagcca agauggucuc gaucuccuga ccucgugauc 2100
caccugccuc ggccucccaa agugcuggga uuacgggugu gagccaccgu gcccagccuu 2160
uuuuuuuuua auagaaaaaa uaauccgacu cccacuacau caagacuaau cuuguuuugu 2220
guguuuuuca cauguauuau agaaugcuuu ugcauggacu auccucuugu uuuuauuaaa 2280
aacaaaugau uuuuuuaaaa gucacaaaaa caauucacua aaaauaaaua ugucauugug 2340
cuuuaaaaaa auaaccucuu guaguuauaa aauaaaacgu uugacuucua aacucug 2397
<210> 45
<211> 2289
<212> RNA
<213> Homo sapien
<400> 45
agacaguacc uccucccuag gacuacacaa ggacugaacc agaaggaaga ggacagagca 60
aagccaugaa caucauccua gaaauccuuc ugcuucugau caccaucauc uacuccuacu 120
uggagucguu ggugaaguuu uucauuccuc agaggagaaa aucuguggcu ggggagauug 180
uucucauuac uggagcuggg cauggaauag gcaggcagac uacuuaugaa uuugcaaaac 240
gacagagcau auugguucug ugggauauua auaaggugaa gaaagaagug ggugauguaa 300
caaucguggu gaauaaugcu gggacaguau auccagccga ucuucucagc accaaggaug 360
aagagauuac caagacauuu gaggucaaca uccuaggaca uuuuuggauc acaaaagcac 420
uucuuccauc gaugauggag agaaaucaug gccacaucgu cacaguggcu ucagugugcg 480
gccacgaagg gauuccuuac cucaucccau auuguuccag caaauuugcc gcuguuggcu 540
uucacagagg ucugacauca gaacuucagg ccuugggaaa aacugguauc aaaaccucau 600
gucucugccc aguuuuugug aauacugggu ucaccaaaaa uccaagcaca agauuauggc 660
cuguauugga gacagaugaa gucguaagaa gucugauaga uggaauacuu accaauaaga 720
aaaugauuuu uguuccaucg uauaucaaua ucuuucugag acuacagaag uuucuuccug 780
aacgcgccuc agcgauuuua aaucguaugc agaauauuca auuugaagca gugguuggcc 840
acaaaaucaa aaugaaauga auaaauaagc uccagccaga gauguaugca ugauaaugau 900
augaauaguu ucgaaucaau gcugcaaagc uuuauuucac auuuuuucag uccugauaau 960
auuaaaaaca uugguuuggc acuagcagca gucaaacgaa caagauuaau uaccugucuu 1020
ccuguuucuc aagaauauuu acguaguuuu ucauaggucu guuuuuccuu ucaugccucu 1080
uaaaaacuuc ugugcuuaca uaaacauacu uaaaagguuu ucuuuaagau auuuuauuuu 1140
uccauuuaaa gguggacaaa agcuaccucc cuaaaaguaa auacaaagag aacuuauuua 1200
cacagggaag guuuaagacu guucaaguag cauuccaauc uguagccaug ccacagaaua 1260
ucaacaagaa cacagaauga gugcacagcu aagagaucaa guuucagcag gcagcuuuau 1320
cucaaccugg acauauuuua agauucagca uuugaaagau uucccuagcc ucuuccuuuu 1380
ucauuagccc aaaacggugc aacucuauuc uggacuuuau uacuugauuc ugucuucugu 1440
auaacucuga aguccaccaa aaguggaccc ucuauauuuc cucccuuuuu auagucuuau 1500
aagauacauu augaaaggug accgacucua uuuuaaaucu cagaauuuua aguucuagcc 1560
ccaugauaac cuuuuucuuu guaauuuaug cuuucauaua uccuuggucc cagagauguu 1620
uagacaauuu uaggcucaaa aauuaaagcu aacacaggaa aaggaacugu acuggcuauu 1680
acauaagaaa caauggaccc aagagaagaa aaggaagaaa gaaagguuuu uugguuuuug 1740
uuuuguuuug uuuuguuuuu uguuuuuuug agauggaguc ucacucuuuc gcccaggcug 1800
gagugcagug guaugaucuc agcucacugc aagcuccacc ucccggguuc acgccauucu 1860
ccugccucag ccuccugagu agcugggacu acaggcgccc gccaccacac ccggcuaauu 1920
uuuuguauuu uuuguagaga cgggguuuca ccauguuagc caagaugguc ucgaucuccu 1980
gaccucguga uccaccugcc ucggccuccc aaagugcugg gauuacgggu gugagccacc 2040
gugcccagcc uuuuuuuuuu uaauagaaaa aauaauccga cucccacuac aucaagacua 2100
aucuuguuuu guguguuuuu cacauguauu auagaaugcu uuugcaugga cuauccucuu 2160
guuuuuauua aaaacaaaug auuuuuuuaa aagucacaaa aacaauucac uaaaaauaaa 2220
uaugucauug ugcuuuaaaa aaauaaccuc uuguaguuau aaaauaaaac guuugacuuc 2280
uaaacucug 2289
<210> 46
<211> 2280
<212> RNA
<213> Homo sapien
<400> 46
agacaguacc uccucccuag gacuacacaa ggacugaacc agaaggaaga ggacagagca 60
aagccaugaa caucauccua gaaauccuuc ugcuucugau caccaucauc uacuccuacu 120
uggagucguu ggugaaguuu uucauuccuc agaggagaaa aucuguggcu ggggagauug 180
uucucauuac uggagcuggg cauggaauag gcaggcagac uacuuaugaa uuugcaaaac 240
gacagagcau auugguucug ugggauauua auaagcgcgg uguggaggaa acugcagcug 300
agugccgaaa acuaggcguc acugcgcaug cguauguggu agacugcagc aacagagaag 360
agaucuaucg cucucuaaau caggugaaga aagaaguggg ugauguaaca aucgugguga 420
auaaugcugg gacaguauau ccagccgauc uucucagcac caaggaugaa gagauuacca 480
agacauuuga ggucaacauc cuaggacauu uuuggaucac aaaagcacuu cuuccaucga 540
ugauggagag aaaucauggc cacaucguca caguggcuuc agugugcggc cacgaaggga 600
uuccuuaccu caucccauau uguuccagca aauuugccgc uguuggcuuu cacagagguc 660
ugacaucaga acuucaggcc uugggaaaaa cugguaucaa aaccucaugu cucugcccag 720
uuuuugugaa uacuggguuc accaaaaauc caagcacaag guuucuuccu gaacgcgccu 780
cagcgauuuu aaaucguaug cagaauauuc aauuugaagc agugguuggc cacaaaauca 840
aaaugaaaug aauaaauaag cuccagccag agauguaugc augauaauga uaugaauagu 900
uucgaaucaa ugcugcaaag cuuuauuuca cauuuuuuca guccugauaa uauuaaaaac 960
auugguuugg cacuagcagc agucaaacga acaagauuaa uuaccugucu uccuguuucu 1020
caagaauauu uacguaguuu uucauagguc uguuuuuccu uucaugccuc uuaaaaacuu 1080
cugugcuuac auaaacauac uuaaaagguu uucuuuaaga uauuuuauuu uuccauuuaa 1140
agguggacaa aagcuaccuc ccuaaaagua aauacaaaga gaacuuauuu acacagggaa 1200
gguuuaagac uguucaagua gcauuccaau cuguagccau gccacagaau aucaacaaga 1260
acacagaaug agugcacagc uaagagauca aguuucagca ggcagcuuua ucucaaccug 1320
gacauauuuu aagauucagc auuugaaaga uuucccuagc cucuuccuuu uucauuagcc 1380
caaaacggug caacucuauu cuggacuuua uuacuugauu cugucuucug uauaacucug 1440
aaguccacca aaaguggacc cucuauauuu ccucccuuuu uauagucuua uaagauacau 1500
uaugaaaggu gaccgacucu auuuuaaauc ucagaauuuu aaguucuagc cccaugauaa 1560
ccuuuuucuu uguaauuuau gcuuucauau auccuugguc ccagagaugu uuagacaauu 1620
uuaggcucaa aaauuaaagc uaacacagga aaaggaacug uacuggcuau uacauaagaa 1680
acaauggacc caagagaaga aaaggaagaa agaaagguuu uuugguuuuu guuuuguuuu 1740
guuuuguuuu uuguuuuuuu gagauggagu cucacucuuu cgcccaggcu ggagugcagu 1800
gguaugaucu cagcucacug caagcuccac cucccggguu cacgccauuc uccugccuca 1860
gccuccugag uagcugggac uacaggcgcc cgccaccaca cccggcuaau uuuuuguauu 1920
uuuuguagag acgggguuuc accauguuag ccaagauggu cucgaucucc ugaccucgug 1980
auccaccugc cucggccucc caaagugcug ggauuacggg ugugagccac cgugcccagc 2040
cuuuuuuuuu uuaauagaaa aaauaauccg acucccacua caucaagacu aaucuuguuu 2100
uguguguuuu ucacauguau uauagaaugc uuuugcaugg acuauccucu uguuuuuauu 2160
aaaaacaaau gauuuuuuua aaagucacaa aaacaauuca cuaaaaauaa auaugucauu 2220
gugcuuuaaa aaaauaaccu cuuguaguua uaaaauaaaa cguuugacuu cuaaacucug 2280
<210> 47
<211> 2398
<212> RNA
<213> Homo sapien
<400> 47
agacaguacc uccucccuag gacuacacaa ggacugaacc agaaggaaga ggacagagca 60
aagccaugaa caucauccua gaaauccuuc ugcuucugau caccaucauc uacuccuacu 120
uggagucguu ggugaaguuu uucauuccuc agaggagaaa aucuguggcu ggggagauug 180
uucucauuac uggagcuggg cauggaauag gcaggcagac uacuuaugaa uuugcaaaac 240
gacagagcau auugguucug ugggauauua auaagcgcgg uguggaggaa acugcagcug 300
agugccgaaa acuaggcguc acugcgcaug cguauguggu agacugcagc aacagagaag 360
agaucuaucg cucucuaaau caggugaaga aagaaguggg ugauguaaca aucgugguga 420
auaaugcugg gacaguauau ccagccgauc uucucagcac caaggaugaa gagauuacca 480
agacauuuga ggucaacauc cuaggacauu uuuggaucac aaaagcacuu cuuccaucga 540
ugauggagag aaaucauggc cacaucguca caguggcuuc agugugcggc cacgaaggga 600
uuccuuaccu caucccauau uguuccagca aauuugccgc uguuggcuuu cacagagguc 660
ugacaucaga acuucaggcc uugggaaaaa cugguaucaa aaccucaugu cucugcccag 720
uuuuugugaa uacuggguuc accaaaaauc caagcacaag auuauggccu guauuggaga 780
cagaugaagu cguaagaagu cugauagaug gaauacuuac caauaagaaa augauuuuug 840
uuccaucgua uaucaauauc uuucugagac uacagaaggu uucuuccuga acgcgccuca 900
gcgauuuuaa aucguaugca gaauauucaa uuugaagcag ugguuggcca caaaaucaaa 960
augaaaugaa uaaauaagcu ccagccagag auguaugcau gauaaugaua ugaauaguuu 1020
cgaaucaaug cugcaaagcu uuauuucaca uuuuuucagu ccugauaaua uuaaaaacau 1080
ugguuuggca cuagcagcag ucaaacgaac aagauuaauu accugucuuc cuguuucuca 1140
agaauauuua cguaguuuuu cauaggucug uuuuuccuuu caugccucuu aaaaacuucu 1200
gugcuuacau aaacauacuu aaaagguuuu cuuuaagaua uuuuauuuuu ccauuuaaag 1260
guggacaaaa gcuaccuccc uaaaaguaaa uacaaagaga acuuauuuac acagggaagg 1320
uuuaagacug uucaaguagc auuccaaucu guagccaugc cacagaauau caacaagaac 1380
acagaaugag ugcacagcua agagaucaag uuucagcagg cagcuuuauc ucaaccugga 1440
cauauuuuaa gauucagcau uugaaagauu ucccuagccu cuuccuuuuu cauuagccca 1500
aaacggugca acucuauucu ggacuuuauu acuugauucu gucuucugua uaacucugaa 1560
guccaccaaa aguggacccu cuauauuucc ucccuuuuua uagucuuaua agauacauua 1620
ugaaagguga ccgacucuau uuuaaaucuc agaauuuuaa guucuagccc caugauaacc 1680
uuuuucuuug uaauuuaugc uuucauauau ccuugguccc agagauguuu agacaauuuu 1740
aggcucaaaa auuaaagcua acacaggaaa aggaacugua cuggcuauua cauaagaaac 1800
aauggaccca agagaagaaa aggaagaaag aaagguuuuu ugguuuuugu uuuguuuugu 1860
uuuguuuuuu guuuuuuuga gauggagucu cacucuuucg cccaggcugg agugcagugg 1920
uaugaucuca gcucacugca agcuccaccu cccggguuca cgccauucuc cugccucagc 1980
cuccugagua gcugggacua caggcgcccg ccaccacacc cggcuaauuu uuuguauuuu 2040
uuguagagac gggguuucac cauguuagcc aagauggucu cgaucuccug accucgugau 2100
ccaccugccu cggccuccca aagugcuggg auuacgggug ugagccaccg ugcccagccu 2160
uuuuuuuuuu aauagaaaaa auaauccgac ucccacuaca ucaagacuaa ucuuguuuug 2220
uguguuuuuc acauguauua uagaaugcuu uugcauggac uauccucuug uuuuuauuaa 2280
aaacaaauga uuuuuuuaaa agucacaaaa acaauucacu aaaaauaaau augucauugu 2340
gcuuuaaaaa aauaaccucu uguaguuaua aaauaaaacg uuugacuucu aaacucug 2398
<210> 48
<211> 2469
<212> RNA
<213> Homo sapien
<400> 48
agacaguacc uccucccuag gacuacacaa ggacugaacc agaaggaaga ggacagagca 60
aagccaugaa caucauccua gaaauccuuc ugcuucugau caccaucauc uacuccuacu 120
uggagucguu ggugaaguuu uucauuccuc agaggagaaa aucuguggcu ggggagauug 180
uucucauuac uggagcuggg cauggaauag gcaggcagac uacuuaugaa uuugcaaaac 240
gacagagcau auugguucug ugggauauua auaagcgcgg uguggaggaa acugcagcug 300
agugccgaaa acuaggcguc acugcgcaug cguauguggu agacugcagc aacagagaag 360
agaucuaucg cucucuaaau caggugaaga aagaaguggg ugauguaaca aucgugguga 420
auaaugcugg gacaguauau ccagccgauc uucucagcac caaggaugaa gagauuacca 480
agacauuuga ggucaacauc cuaggacauu uuuggaaugg aaaggacauc agaaguaauu 540
acuuggaugu auauaggauc gaggacacuu uuggacgaga cucugagauc acaaaagcac 600
uucuuccauc gaugauggag agaaaucaug gccacaucgu cacaguggcu ucagugugcg 660
gccacgaagg gauuccuuac cucaucccau auuguuccag caaauuugcc gcuguuggcu 720
uucacagagg ucugacauca gaacuucagg ccuugggaaa aacugguauc aaaaccucau 780
gucucugccc aguuuuugug aauacugggu ucaccaaaaa uccaagcaca agauuauggc 840
cuguauugga gacagaugaa gucguaagaa gucugauaga uggaauacuu accaauaaga 900
aaaugauuuu uguuccaucg uauaucaaua ucuuucugag acuacagaag uuucuuccug 960
aacgcgccuc agcgauuuua aaucguaugc agaauauuca auuugaagca gugguuggcc 1020
acaaaaucaa aaugaaauga auaaauaagc uccagccaga gauguaugca ugauaaugau 1080
augaauaguu ucgaaucaau gcugcaaagc uuuauuucac auuuuuucag uccugauaau 1140
auuaaaaaca uugguuuggc acuagcagca gucaaacgaa caagauuaau uaccugucuu 1200
ccuguuucuc aagaauauuu acguaguuuu ucauaggucu guuuuuccuu ucaugccucu 1260
uaaaaacuuc ugugcuuaca uaaacauacu uaaaagguuu ucuuuaagau auuuuauuuu 1320
uccauuuaaa gguggacaaa agcuaccucc cuaaaaguaa auacaaagag aacuuauuua 1380
cacagggaag guuuaagacu guucaaguag cauuccaauc uguagccaug ccacagaaua 1440
ucaacaagaa cacagaauga gugcacagcu aagagaucaa guuucagcag gcagcuuuau 1500
cucaaccugg acauauuuua agauucagca uuugaaagau uucccuagcc ucuuccuuuu 1560
ucauuagccc aaaacggugc aacucuauuc uggacuuuau uacuugauuc ugucuucugu 1620
auaacucuga aguccaccaa aaguggaccc ucuauauuuc cucccuuuuu auagucuuau 1680
aagauacauu augaaaggug accgacucua uuuuaaaucu cagaauuuua aguucuagcc 1740
ccaugauaac cuuuuucuuu guaauuuaug cuuucauaua uccuuggucc cagagauguu 1800
uagacaauuu uaggcucaaa aauuaaagcu aacacaggaa aaggaacugu acuggcuauu 1860
acauaagaaa caauggaccc aagagaagaa aaggaagaaa gaaagguuuu uugguuuuug 1920
uuuuguuuug uuuuguuuuu uguuuuuuug agauggaguc ucacucuuuc gcccaggcug 1980
gagugcagug guaugaucuc agcucacugc aagcuccacc ucccggguuc acgccauucu 2040
ccugccucag ccuccugagu agcugggacu acaggcgccc gccaccacac ccggcuaauu 2100
uuuuguauuu uuuguagaga cgggguuuca ccauguuagc caagaugguc ucgaucuccu 2160
gaccucguga uccaccugcc ucggccuccc aaagugcugg gauuacgggu gugagccacc 2220
gugcccagcc uuuuuuuuuu uaauagaaaa aauaauccga cucccacuac aucaagacua 2280
aucuuguuuu guguguuuuu cacauguauu auagaaugcu uuugcaugga cuauccucuu 2340
guuuuuauua aaaacaaaug auuuuuuuaa aagucacaaa aacaauucac uaaaaauaaa 2400
uaugucauug ugcuuuaaaa aaauaaccuc uuguaguuau aaaauaaaac guuugacuuc 2460
uaaacucug 2469
<210> 49
<211> 1715
<212> RNA
<213> Homo sapien
<400> 49
agacaguacc uccucccuag gacuacacaa ggacugaacc agaaggaaga ggacagagca 60
aagccaugaa caucauccua gaaauccuuc ugcuucugau caccaucauc uacuccuacu 120
uggagucguu ggugaaguuu uucauuccuc agaggagaaa aucuguggcu ggggagauug 180
uucucauuac uggagcuggg cauggaauag gcaggcagac uacuuaugaa uuugcaaaac 240
gacagagcau auugguucug ugggauauua auaagcgcgg uguggaggaa acugcagcug 300
agugccgaaa acuaggcguc acugcgcaug cguauguggu agacugcagc aacagagaag 360
agaucuaucg cucucuaaau caggugaaga aagaaguggg ugauguaaca aucgugguga 420
auaaugcugg gacaguauau ccagccgauc uucucagcac caaggaugaa gagauuacca 480
agacauuuga ggucaacauc cuaggacauu uuuggaucac aaaagcacuu cuuccaucga 540
ugauggagag aaaucauggc cacaucguca caguggcuuc agugugcggc cacgaaggga 600
uuccuuaccu caucccauau uguuccagca aauuugccgc uguuggcuuu cacagagguc 660
ugacaucaga acuucaggcc uugggaaaaa cugguaucaa aaccucaugu cucugcccag 720
uuuuugugaa uacuggguuc accaaaaauc caagcacaag auuauggccu guauuggaga 780
cagaugaagu cguaagaagu cugauagaug gaauacuuac caauaagaaa augauuuuug 840
uuccaucgua uaucaauauc uuucugagac uacagaaguu aaguacagca cagaacaccc 900
aaauacuaaa acaccaauag agcuuuuuuu uuugcuuuuu uuuuuuuuag acagagucuc 960
acucugucac ccuggcugga uugcgguggu ugcaguggca ugaucuuggc ucacugcaac 1020
cuccgccucc uggguucaag caauucucau gccucagacc cccaaguaac ugggauuaua 1080
ggugugugcu gccacacuac acccagcuaa uuuuuguauu uuuugauaga gacagguuuc 1140
cccauguugg ccaggcugga cucgaacucc ugaccucaag uuauccuccu gucucggccu 1200
cccaaagugc ugggauuaca gucaugagcc accaugccug gcccaauaga gcuauuauua 1260
uggagcaucu uucaguugug aaaauuggca uggaaacucu ccaucccugg ggagaacagu 1320
uauuuccucu guuauuuucc uacccagucu auaaaaagag agugauucau uuucucuacc 1380
aaaucuacug ucucugccca aacuuugcug aagacuauuc uaacuaaagg aaacacaguu 1440
uaaaaagaau gcaauauagu gaaguaguua auaauaaaga cuccauuuuu aaaagucugc 1500
uggaaguuug guugggauug cacugaaucu auagagcaau uggggaguau ugacauauca 1560
acaauauuga guuuucuaau ccaagaacau aauaucuauu uuuaaaaucu ucuucaaaau 1620
cuuuaaaucu uuaaauugua uuuuguaguu uuugguguuu aagucuugca cauauuuugu 1680
cagauuuauu ccaaaguauu ucacggguuc uuuuu 1715
<210> 50
<211> 2290
<212> RNA
<213> Homo sapien
<400> 50
agacaguacc uccucccuag gacuacacaa ggacugaacc agaaggaaga ggacagagca 60
aagccaugaa caucauccua gaaauccuuc ugcuucugau caccaucauc uacuccuacu 120
uggagucguu ggugaaguuu uucauuccuc agaggagaaa aucuguggcu ggggagauug 180
uucucauuac uggagcuggg cauggaauag gcaggcagac uacuuaugaa uuugcaaaac 240
gacagagcau auugguucug ugggauauua auaaggugaa gaaagaagug ggugauguaa 300
caaucguggu gaauaaugcu gggacaguau auccagccga ucuucucagc accaaggaug 360
aagagauuac caagacauuu gaggucaaca uccuaggaca uuuuuggauc acaaaagcac 420
uucuuccauc gaugauggag agaaaucaug gccacaucgu cacaguggcu ucagugugcg 480
gccacgaagg gauuccuuac cucaucccau auuguuccag caaauuugcc gcuguuggcu 540
uucacagagg ucugacauca gaacuucagg ccuugggaaa aacugguauc aaaaccucau 600
gucucugccc aguuuuugug aauacugggu ucaccaaaaa uccaagcaca agauuauggc 660
cuguauugga gacagaugaa gucguaagaa gucugauaga uggaauacuu accaauaaga 720
aaaugauuuu uguuccaucg uauaucaaua ucuuucugag acuacagaag guuucuuccu 780
gaacgcgccu cagcgauuuu aaaucguaug cagaauauuc aauuugaagc agugguuggc 840
cacaaaauca aaaugaaaug aauaaauaag cuccagccag agauguaugc augauaauga 900
uaugaauagu uucgaaucaa ugcugcaaag cuuuauuuca cauuuuuuca guccugauaa 960
uauuaaaaac auugguuugg cacuagcagc agucaaacga acaagauuaa uuaccugucu 1020
uccuguuucu caagaauauu uacguaguuu uucauagguc uguuuuuccu uucaugccuc 1080
uuaaaaacuu cugugcuuac auaaacauac uuaaaagguu uucuuuaaga uauuuuauuu 1140
uuccauuuaa agguggacaa aagcuaccuc ccuaaaagua aauacaaaga gaacuuauuu 1200
acacagggaa gguuuaagac uguucaagua gcauuccaau cuguagccau gccacagaau 1260
aucaacaaga acacagaaug agugcacagc uaagagauca aguuucagca ggcagcuuua 1320
ucucaaccug gacauauuuu aagauucagc auuugaaaga uuucccuagc cucuuccuuu 1380
uucauuagcc caaaacggug caacucuauu cuggacuuua uuacuugauu cugucuucug 1440
uauaacucug aaguccacca aaaguggacc cucuauauuu ccucccuuuu uauagucuua 1500
uaagauacau uaugaaaggu gaccgacucu auuuuaaauc ucagaauuuu aaguucuagc 1560
cccaugauaa ccuuuuucuu uguaauuuau gcuuucauau auccuugguc ccagagaugu 1620
uuagacaauu uuaggcucaa aaauuaaagc uaacacagga aaaggaacug uacuggcuau 1680
uacauaagaa acaauggacc caagagaaga aaaggaagaa agaaagguuu uuugguuuuu 1740
guuuuguuuu guuuuguuuu uuguuuuuuu gagauggagu cucacucuuu cgcccaggcu 1800
ggagugcagu gguaugaucu cagcucacug caagcuccac cucccggguu cacgccauuc 1860
uccugccuca gccuccugag uagcugggac uacaggcgcc cgccaccaca cccggcuaau 1920
uuuuuguauu uuuuguagag acgggguuuc accauguuag ccaagauggu cucgaucucc 1980
ugaccucgug auccaccugc cucggccucc caaagugcug ggauuacggg ugugagccac 2040
cgugcccagc cuuuuuuuuu uuaauagaaa aaauaauccg acucccacua caucaagacu 2100
aaucuuguuu uguguguuuu ucacauguau uauagaaugc uuuugcaugg acuauccucu 2160
uguuuuuauu aaaaacaaau gauuuuuuua aaagucacaa aaacaauuca cuaaaaauaa 2220
auaugucauu gugcuuuaaa aaaauaaccu cuuguaguua uaaaauaaaa cguuugacuu 2280
cuaaacucug 2290
<210> 51
<211> 2470
<212> RNA
<213> Homo sapien
<400> 51
agacaguacc uccucccuag gacuacacaa ggacugaacc agaaggaaga ggacagagca 60
aagccaugaa caucauccua gaaauccuuc ugcuucugau caccaucauc uacuccuacu 120
uggagucguu ggugaaguuu uucauuccuc agaggagaaa aucuguggcu ggggagauug 180
uucucauuac uggagcuggg cauggaauag gcaggcagac uacuuaugaa uuugcaaaac 240
gacagagcau auugguucug ugggauauua auaagcgcgg uguggaggaa acugcagcug 300
agugccgaaa acuaggcguc acugcgcaug cguauguggu agacugcagc aacagagaag 360
agaucuaucg cucucuaaau caggugaaga aagaaguggg ugauguaaca aucgugguga 420
auaaugcugg gacaguauau ccagccgauc uucucagcac caaggaugaa gagauuacca 480
agacauuuga ggucaacauc cuaggacauu uuuggaaugg aaaggacauc agaaguaauu 540
acuuggaugu auauaggauc gaggacacuu uuggacgaga cucugagauc acaaaagcac 600
uucuuccauc gaugauggag agaaaucaug gccacaucgu cacaguggcu ucagugugcg 660
gccacgaagg gauuccuuac cucaucccau auuguuccag caaauuugcc gcuguuggcu 720
uucacagagg ucugacauca gaacuucagg ccuugggaaa aacugguauc aaaaccucau 780
gucucugccc aguuuuugug aauacugggu ucaccaaaaa uccaagcaca agauuauggc 840
cuguauugga gacagaugaa gucguaagaa gucugauaga uggaauacuu accaauaaga 900
aaaugauuuu uguuccaucg uauaucaaua ucuuucugag acuacagaag guuucuuccu 960
gaacgcgccu cagcgauuuu aaaucguaug cagaauauuc aauuugaagc agugguuggc 1020
cacaaaauca aaaugaaaug aauaaauaag cuccagccag agauguaugc augauaauga 1080
uaugaauagu uucgaaucaa ugcugcaaag cuuuauuuca cauuuuuuca guccugauaa 1140
uauuaaaaac auugguuugg cacuagcagc agucaaacga acaagauuaa uuaccugucu 1200
uccuguuucu caagaauauu uacguaguuu uucauagguc uguuuuuccu uucaugccuc 1260
uuaaaaacuu cugugcuuac auaaacauac uuaaaagguu uucuuuaaga uauuuuauuu 1320
uuccauuuaa agguggacaa aagcuaccuc ccuaaaagua aauacaaaga gaacuuauuu 1380
acacagggaa gguuuaagac uguucaagua gcauuccaau cuguagccau gccacagaau 1440
aucaacaaga acacagaaug agugcacagc uaagagauca aguuucagca ggcagcuuua 1500
ucucaaccug gacauauuuu aagauucagc auuugaaaga uuucccuagc cucuuccuuu 1560
uucauuagcc caaaacggug caacucuauu cuggacuuua uuacuugauu cugucuucug 1620
uauaacucug aaguccacca aaaguggacc cucuauauuu ccucccuuuu uauagucuua 1680
uaagauacau uaugaaaggu gaccgacucu auuuuaaauc ucagaauuuu aaguucuagc 1740
cccaugauaa ccuuuuucuu uguaauuuau gcuuucauau auccuugguc ccagagaugu 1800
uuagacaauu uuaggcucaa aaauuaaagc uaacacagga aaaggaacug uacuggcuau 1860
uacauaagaa acaauggacc caagagaaga aaaggaagaa agaaagguuu uuugguuuuu 1920
guuuuguuuu guuuuguuuu uuguuuuuuu gagauggagu cucacucuuu cgcccaggcu 1980
ggagugcagu gguaugaucu cagcucacug caagcuccac cucccggguu cacgccauuc 2040
uccugccuca gccuccugag uagcugggac uacaggcgcc cgccaccaca cccggcuaau 2100
uuuuuguauu uuuuguagag acgggguuuc accauguuag ccaagauggu cucgaucucc 2160
ugaccucgug auccaccugc cucggccucc caaagugcug ggauuacggg ugugagccac 2220
cgugcccagc cuuuuuuuuu uuaauagaaa aaauaauccg acucccacua caucaagacu 2280
aaucuuguuu uguguguuuu ucacauguau uauagaaugc uuuugcaugg acuauccucu 2340
uguuuuuauu aaaaacaaau gauuuuuuua aaagucacaa aaacaauuca cuaaaaauaa 2400
auaugucauu gugcuuuaaa aaaauaaccu cuuguaguua uaaaauaaaa cguuugacuu 2460
cuaaacucug 2470
<210> 52
<211> 1714
<212> RNA
<213> Homo sapien
<400> 52
agacaguacc uccucccuag gacuacacaa ggacugaacc agaaggaaga ggacagagca 60
aagccaugaa caucauccua gaaauccuuc ugcuucugau caccaucauc uacuccuacu 120
uggagucguu ggugaaguuu uucauuccuc agaggagaaa aucuguggcu ggggagauug 180
uucucauuac uggagcuggg cauggaauag gcaggcagac uacuuaugaa uuugcaaaac 240
gacagagcau auugguucug ugggauauua auaagcgcgg uguggaggaa acugcagcug 300
agugccgaaa acuaggcguc acugcgcaug cguauguggu agacugcagc aacagagaag 360
agaucuaucg cucucuaaau caggugaaga aagaaguggg ugauguaaca aucgugguga 420
auaaugcugg gacaguauau ccagccgauc uucucagcac caaggaugaa gagauuacca 480
agacauuuga ggucaacauc cuaggacauu uuuggaucac aaaagcacuu cuuccaucga 540
ugauggagag aaaucauggc cacaucguca caguggcuuc agugugcggc cacgaaggga 600
uuccuuaccu caucccauau uguuccagca aauuugccgc uguuggcuuu cacagagguc 660
ugacaucaga acuucaggcc uugggaaaaa cugguaucaa aaccucaugu cucugcccag 720
uuuuugugaa uacuggguuc accaaaaauc caagcacaag auuauggccu guauuggaga 780
cagaugaagu cguaagaagu cugauagaug gaauacuuac caauaagaaa augauuuuug 840
uuccaucgua uaucaauauc uuucugagac uacagaagua aguacagcac agaacaccca 900
aauacuaaaa caccaauaga gcuuuuuuuu uugcuuuuuu uuuuuuuaga cagagucuca 960
cucugucacc cuggcuggau ugcggugguu gcaguggcau gaucuuggcu cacugcaacc 1020
uccgccuccu ggguucaagc aauucucaug ccucagaccc ccaaguaacu gggauuauag 1080
gugugugcug ccacacuaca cccagcuaau uuuuguauuu uuugauagag acagguuucc 1140
ccauguuggc caggcuggac ucgaacuccu gaccucaagu uauccuccug ucucggccuc 1200
ccaaagugcu gggauuacag ucaugagcca ccaugccugg cccaauagag cuauuauuau 1260
ggagcaucuu ucaguuguga aaauuggcau ggaaacucuc caucccuggg gagaacaguu 1320
auuuccucug uuauuuuccu acccagucua uaaaaagaga gugauucauu uucucuacca 1380
aaucuacugu cucugcccaa acuuugcuga agacuauucu aacuaaagga aacacaguuu 1440
aaaaagaaug caauauagug aaguaguuaa uaauaaagac uccauuuuua aaagucugcu 1500
ggaaguuugg uugggauugc acugaaucua uagagcaauu ggggaguauu gacauaucaa 1560
caauauugag uuuucuaauc caagaacaua auaucuauuu uuaaaaucuu cuucaaaauc 1620
uuuaaaucuu uaaauuguau uuuguaguuu uugguguuua agucuugcac auauuuuguc 1680
agauuuauuc caaaguauuu cacggguucu uuuu 1714
<210> 53
<211> 2397
<212> DNA
<213> Homo sapien
<400> 53
agacagtacc tcctccctag gactacacaa ggactgaacc agaaggaaga ggacagagca 60
aagccatgaa catcatccta gaaatccttc tgcttctgat caccatcatc tactcctact 120
tggagtcgtt ggtgaagttt ttcattcctc agaggagaaa atctgtggct ggggagattg 180
ttctcattac tggagctggg catggaatag gcaggcagac tacttatgaa tttgcaaaac 240
gacagagcat attggttctg tgggatatta ataagcgcgg tgtggaggaa actgcagctg 300
agtgccgaaa actaggcgtc actgcgcatg cgtatgtggt agactgcagc aacagagaag 360
agatctatcg ctctctaaat caggtgaaga aagaagtggg tgatgtaaca atcgtggtga 420
ataatgctgg gacagtatat ccagccgatc ttctcagcac caaggatgaa gagattacca 480
agacatttga ggtcaacatc ctaggacatt tttggatcac aaaagcactt cttccatcga 540
tgatggagag aaatcatggc cacatcgtca cagtggcttc agtgtgcggc cacgaaggga 600
ttccttacct catcccatat tgttccagca aatttgccgc tgttggcttt cacagaggtc 660
tgacatcaga acttcaggcc ttgggaaaaa ctggtatcaa aacctcatgt ctctgcccag 720
tttttgtgaa tactgggttc accaaaaatc caagcacaag attatggcct gtattggaga 780
cagatgaagt cgtaagaagt ctgatagatg gaatacttac caataagaaa atgatttttg 840
ttccatcgta tatcaatatc tttctgagac tacagaagtt tcttcctgaa cgcgcctcag 900
cgattttaaa tcgtatgcag aatattcaat ttgaagcagt ggttggccac aaaatcaaaa 960
tgaaatgaat aaataagctc cagccagaga tgtatgcatg ataatgatat gaatagtttc 1020
gaatcaatgc tgcaaagctt tatttcacat tttttcagtc ctgataatat taaaaacatt 1080
ggtttggcac tagcagcagt caaacgaaca agattaatta cctgtcttcc tgtttctcaa 1140
gaatatttac gtagtttttc ataggtctgt ttttcctttc atgcctctta aaaacttctg 1200
tgcttacata aacatactta aaaggttttc tttaagatat tttatttttc catttaaagg 1260
tggacaaaag ctacctccct aaaagtaaat acaaagagaa cttatttaca cagggaaggt 1320
ttaagactgt tcaagtagca ttccaatctg tagccatgcc acagaatatc aacaagaaca 1380
cagaatgagt gcacagctaa gagatcaagt ttcagcaggc agctttatct caacctggac 1440
atattttaag attcagcatt tgaaagattt ccctagcctc ttcctttttc attagcccaa 1500
aacggtgcaa ctctattctg gactttatta cttgattctg tcttctgtat aactctgaag 1560
tccaccaaaa gtggaccctc tatatttcct ccctttttat agtcttataa gatacattat 1620
gaaaggtgac cgactctatt ttaaatctca gaattttaag ttctagcccc atgataacct 1680
ttttctttgt aatttatgct ttcatatatc cttggtccca gagatgttta gacaatttta 1740
ggctcaaaaa ttaaagctaa cacaggaaaa ggaactgtac tggctattac ataagaaaca 1800
atggacccaa gagaagaaaa ggaagaaaga aaggtttttt ggtttttgtt ttgttttgtt 1860
ttgttttttg tttttttgag atggagtctc actctttcgc ccaggctgga gtgcagtggt 1920
atgatctcag ctcactgcaa gctccacctc ccgggttcac gccattctcc tgcctcagcc 1980
tcctgagtag ctgggactac aggcgcccgc caccacaccc ggctaatttt ttgtattttt 2040
tgtagagacg gggtttcacc atgttagcca agatggtctc gatctcctga cctcgtgatc 2100
cacctgcctc ggcctcccaa agtgctggga ttacgggtgt gagccaccgt gcccagcctt 2160
ttttttttta atagaaaaaa taatccgact cccactacat caagactaat cttgttttgt 2220
gtgtttttca catgtattat agaatgcttt tgcatggact atcctcttgt ttttattaaa 2280
aacaaatgat ttttttaaaa gtcacaaaaa caattcacta aaaataaata tgtcattgtg 2340
ctttaaaaaa ataacctctt gtagttataa aataaaacgt ttgacttcta aactctg 2397
<210> 54
<211> 2289
<212> DNA
<213> Homo sapien
<400> 54
agacagtacc tcctccctag gactacacaa ggactgaacc agaaggaaga ggacagagca 60
aagccatgaa catcatccta gaaatccttc tgcttctgat caccatcatc tactcctact 120
tggagtcgtt ggtgaagttt ttcattcctc agaggagaaa atctgtggct ggggagattg 180
ttctcattac tggagctggg catggaatag gcaggcagac tacttatgaa tttgcaaaac 240
gacagagcat attggttctg tgggatatta ataaggtgaa gaaagaagtg ggtgatgtaa 300
caatcgtggt gaataatgct gggacagtat atccagccga tcttctcagc accaaggatg 360
aagagattac caagacattt gaggtcaaca tcctaggaca tttttggatc acaaaagcac 420
ttcttccatc gatgatggag agaaatcatg gccacatcgt cacagtggct tcagtgtgcg 480
gccacgaagg gattccttac ctcatcccat attgttccag caaatttgcc gctgttggct 540
ttcacagagg tctgacatca gaacttcagg ccttgggaaa aactggtatc aaaacctcat 600
gtctctgccc agtttttgtg aatactgggt tcaccaaaaa tccaagcaca agattatggc 660
ctgtattgga gacagatgaa gtcgtaagaa gtctgataga tggaatactt accaataaga 720
aaatgatttt tgttccatcg tatatcaata tctttctgag actacagaag tttcttcctg 780
aacgcgcctc agcgatttta aatcgtatgc agaatattca atttgaagca gtggttggcc 840
acaaaatcaa aatgaaatga ataaataagc tccagccaga gatgtatgca tgataatgat 900
atgaatagtt tcgaatcaat gctgcaaagc tttatttcac attttttcag tcctgataat 960
attaaaaaca ttggtttggc actagcagca gtcaaacgaa caagattaat tacctgtctt 1020
cctgtttctc aagaatattt acgtagtttt tcataggtct gtttttcctt tcatgcctct 1080
taaaaacttc tgtgcttaca taaacatact taaaaggttt tctttaagat attttatttt 1140
tccatttaaa ggtggacaaa agctacctcc ctaaaagtaa atacaaagag aacttattta 1200
cacagggaag gtttaagact gttcaagtag cattccaatc tgtagccatg ccacagaata 1260
tcaacaagaa cacagaatga gtgcacagct aagagatcaa gtttcagcag gcagctttat 1320
ctcaacctgg acatatttta agattcagca tttgaaagat ttccctagcc tcttcctttt 1380
tcattagccc aaaacggtgc aactctattc tggactttat tacttgattc tgtcttctgt 1440
ataactctga agtccaccaa aagtggaccc tctatatttc ctcccttttt atagtcttat 1500
aagatacatt atgaaaggtg accgactcta ttttaaatct cagaatttta agttctagcc 1560
ccatgataac ctttttcttt gtaatttatg ctttcatata tccttggtcc cagagatgtt 1620
tagacaattt taggctcaaa aattaaagct aacacaggaa aaggaactgt actggctatt 1680
acataagaaa caatggaccc aagagaagaa aaggaagaaa gaaaggtttt ttggtttttg 1740
ttttgttttg ttttgttttt tgtttttttg agatggagtc tcactctttc gcccaggctg 1800
gagtgcagtg gtatgatctc agctcactgc aagctccacc tcccgggttc acgccattct 1860
cctgcctcag cctcctgagt agctgggact acaggcgccc gccaccacac ccggctaatt 1920
ttttgtattt tttgtagaga cggggtttca ccatgttagc caagatggtc tcgatctcct 1980
gacctcgtga tccacctgcc tcggcctccc aaagtgctgg gattacgggt gtgagccacc 2040
gtgcccagcc tttttttttt taatagaaaa aataatccga ctcccactac atcaagacta 2100
atcttgtttt gtgtgttttt cacatgtatt atagaatgct tttgcatgga ctatcctctt 2160
gtttttatta aaaacaaatg atttttttaa aagtcacaaa aacaattcac taaaaataaa 2220
tatgtcattg tgctttaaaa aaataacctc ttgtagttat aaaataaaac gtttgacttc 2280
taaactctg 2289
<210> 55
<211> 2280
<212> DNA
<213> Homo sapien
<400> 55
agacagtacc tcctccctag gactacacaa ggactgaacc agaaggaaga ggacagagca 60
aagccatgaa catcatccta gaaatccttc tgcttctgat caccatcatc tactcctact 120
tggagtcgtt ggtgaagttt ttcattcctc agaggagaaa atctgtggct ggggagattg 180
ttctcattac tggagctggg catggaatag gcaggcagac tacttatgaa tttgcaaaac 240
gacagagcat attggttctg tgggatatta ataagcgcgg tgtggaggaa actgcagctg 300
agtgccgaaa actaggcgtc actgcgcatg cgtatgtggt agactgcagc aacagagaag 360
agatctatcg ctctctaaat caggtgaaga aagaagtggg tgatgtaaca atcgtggtga 420
ataatgctgg gacagtatat ccagccgatc ttctcagcac caaggatgaa gagattacca 480
agacatttga ggtcaacatc ctaggacatt tttggatcac aaaagcactt cttccatcga 540
tgatggagag aaatcatggc cacatcgtca cagtggcttc agtgtgcggc cacgaaggga 600
ttccttacct catcccatat tgttccagca aatttgccgc tgttggcttt cacagaggtc 660
tgacatcaga acttcaggcc ttgggaaaaa ctggtatcaa aacctcatgt ctctgcccag 720
tttttgtgaa tactgggttc accaaaaatc caagcacaag gtttcttcct gaacgcgcct 780
cagcgatttt aaatcgtatg cagaatattc aatttgaagc agtggttggc cacaaaatca 840
aaatgaaatg aataaataag ctccagccag agatgtatgc atgataatga tatgaatagt 900
ttcgaatcaa tgctgcaaag ctttatttca cattttttca gtcctgataa tattaaaaac 960
attggtttgg cactagcagc agtcaaacga acaagattaa ttacctgtct tcctgtttct 1020
caagaatatt tacgtagttt ttcataggtc tgtttttcct ttcatgcctc ttaaaaactt 1080
ctgtgcttac ataaacatac ttaaaaggtt ttctttaaga tattttattt ttccatttaa 1140
aggtggacaa aagctacctc cctaaaagta aatacaaaga gaacttattt acacagggaa 1200
ggtttaagac tgttcaagta gcattccaat ctgtagccat gccacagaat atcaacaaga 1260
acacagaatg agtgcacagc taagagatca agtttcagca ggcagcttta tctcaacctg 1320
gacatatttt aagattcagc atttgaaaga tttccctagc ctcttccttt ttcattagcc 1380
caaaacggtg caactctatt ctggacttta ttacttgatt ctgtcttctg tataactctg 1440
aagtccacca aaagtggacc ctctatattt cctccctttt tatagtctta taagatacat 1500
tatgaaaggt gaccgactct attttaaatc tcagaatttt aagttctagc cccatgataa 1560
cctttttctt tgtaatttat gctttcatat atccttggtc ccagagatgt ttagacaatt 1620
ttaggctcaa aaattaaagc taacacagga aaaggaactg tactggctat tacataagaa 1680
acaatggacc caagagaaga aaaggaagaa agaaaggttt tttggttttt gttttgtttt 1740
gttttgtttt ttgttttttt gagatggagt ctcactcttt cgcccaggct ggagtgcagt 1800
ggtatgatct cagctcactg caagctccac ctcccgggtt cacgccattc tcctgcctca 1860
gcctcctgag tagctgggac tacaggcgcc cgccaccaca cccggctaat tttttgtatt 1920
ttttgtagag acggggtttc accatgttag ccaagatggt ctcgatctcc tgacctcgtg 1980
atccacctgc ctcggcctcc caaagtgctg ggattacggg tgtgagccac cgtgcccagc 2040
cttttttttt ttaatagaaa aaataatccg actcccacta catcaagact aatcttgttt 2100
tgtgtgtttt tcacatgtat tatagaatgc ttttgcatgg actatcctct tgtttttatt 2160
aaaaacaaat gattttttta aaagtcacaa aaacaattca ctaaaaataa atatgtcatt 2220
gtgctttaaa aaaataacct cttgtagtta taaaataaaa cgtttgactt ctaaactctg 2280
<210> 56
<211> 2398
<212> DNA
<213> Homo sapien
<400> 56
agacagtacc tcctccctag gactacacaa ggactgaacc agaaggaaga ggacagagca 60
aagccatgaa catcatccta gaaatccttc tgcttctgat caccatcatc tactcctact 120
tggagtcgtt ggtgaagttt ttcattcctc agaggagaaa atctgtggct ggggagattg 180
ttctcattac tggagctggg catggaatag gcaggcagac tacttatgaa tttgcaaaac 240
gacagagcat attggttctg tgggatatta ataagcgcgg tgtggaggaa actgcagctg 300
agtgccgaaa actaggcgtc actgcgcatg cgtatgtggt agactgcagc aacagagaag 360
agatctatcg ctctctaaat caggtgaaga aagaagtggg tgatgtaaca atcgtggtga 420
ataatgctgg gacagtatat ccagccgatc ttctcagcac caaggatgaa gagattacca 480
agacatttga ggtcaacatc ctaggacatt tttggatcac aaaagcactt cttccatcga 540
tgatggagag aaatcatggc cacatcgtca cagtggcttc agtgtgcggc cacgaaggga 600
ttccttacct catcccatat tgttccagca aatttgccgc tgttggcttt cacagaggtc 660
tgacatcaga acttcaggcc ttgggaaaaa ctggtatcaa aacctcatgt ctctgcccag 720
tttttgtgaa tactgggttc accaaaaatc caagcacaag attatggcct gtattggaga 780
cagatgaagt cgtaagaagt ctgatagatg gaatacttac caataagaaa atgatttttg 840
ttccatcgta tatcaatatc tttctgagac tacagaaggt ttcttcctga acgcgcctca 900
gcgattttaa atcgtatgca gaatattcaa tttgaagcag tggttggcca caaaatcaaa 960
atgaaatgaa taaataagct ccagccagag atgtatgcat gataatgata tgaatagttt 1020
cgaatcaatg ctgcaaagct ttatttcaca ttttttcagt cctgataata ttaaaaacat 1080
tggtttggca ctagcagcag tcaaacgaac aagattaatt acctgtcttc ctgtttctca 1140
agaatattta cgtagttttt cataggtctg tttttccttt catgcctctt aaaaacttct 1200
gtgcttacat aaacatactt aaaaggtttt ctttaagata ttttattttt ccatttaaag 1260
gtggacaaaa gctacctccc taaaagtaaa tacaaagaga acttatttac acagggaagg 1320
tttaagactg ttcaagtagc attccaatct gtagccatgc cacagaatat caacaagaac 1380
acagaatgag tgcacagcta agagatcaag tttcagcagg cagctttatc tcaacctgga 1440
catattttaa gattcagcat ttgaaagatt tccctagcct cttccttttt cattagccca 1500
aaacggtgca actctattct ggactttatt acttgattct gtcttctgta taactctgaa 1560
gtccaccaaa agtggaccct ctatatttcc tcccttttta tagtcttata agatacatta 1620
tgaaaggtga ccgactctat tttaaatctc agaattttaa gttctagccc catgataacc 1680
tttttctttg taatttatgc tttcatatat ccttggtccc agagatgttt agacaatttt 1740
aggctcaaaa attaaagcta acacaggaaa aggaactgta ctggctatta cataagaaac 1800
aatggaccca agagaagaaa aggaagaaag aaaggttttt tggtttttgt tttgttttgt 1860
tttgtttttt gtttttttga gatggagtct cactctttcg cccaggctgg agtgcagtgg 1920
tatgatctca gctcactgca agctccacct cccgggttca cgccattctc ctgcctcagc 1980
ctcctgagta gctgggacta caggcgcccg ccaccacacc cggctaattt tttgtatttt 2040
ttgtagagac ggggtttcac catgttagcc aagatggtct cgatctcctg acctcgtgat 2100
ccacctgcct cggcctccca aagtgctggg attacgggtg tgagccaccg tgcccagcct 2160
tttttttttt aatagaaaaa ataatccgac tcccactaca tcaagactaa tcttgttttg 2220
tgtgtttttc acatgtatta tagaatgctt ttgcatggac tatcctcttg tttttattaa 2280
aaacaaatga tttttttaaa agtcacaaaa acaattcact aaaaataaat atgtcattgt 2340
gctttaaaaa aataacctct tgtagttata aaataaaacg tttgacttct aaactctg 2398
<210> 57
<211> 2469
<212> DNA
<213> Homo sapien
<400> 57
agacagtacc tcctccctag gactacacaa ggactgaacc agaaggaaga ggacagagca 60
aagccatgaa catcatccta gaaatccttc tgcttctgat caccatcatc tactcctact 120
tggagtcgtt ggtgaagttt ttcattcctc agaggagaaa atctgtggct ggggagattg 180
ttctcattac tggagctggg catggaatag gcaggcagac tacttatgaa tttgcaaaac 240
gacagagcat attggttctg tgggatatta ataagcgcgg tgtggaggaa actgcagctg 300
agtgccgaaa actaggcgtc actgcgcatg cgtatgtggt agactgcagc aacagagaag 360
agatctatcg ctctctaaat caggtgaaga aagaagtggg tgatgtaaca atcgtggtga 420
ataatgctgg gacagtatat ccagccgatc ttctcagcac caaggatgaa gagattacca 480
agacatttga ggtcaacatc ctaggacatt tttggaatgg aaaggacatc agaagtaatt 540
acttggatgt atataggatc gaggacactt ttggacgaga ctctgagatc acaaaagcac 600
ttcttccatc gatgatggag agaaatcatg gccacatcgt cacagtggct tcagtgtgcg 660
gccacgaagg gattccttac ctcatcccat attgttccag caaatttgcc gctgttggct 720
ttcacagagg tctgacatca gaacttcagg ccttgggaaa aactggtatc aaaacctcat 780
gtctctgccc agtttttgtg aatactgggt tcaccaaaaa tccaagcaca agattatggc 840
ctgtattgga gacagatgaa gtcgtaagaa gtctgataga tggaatactt accaataaga 900
aaatgatttt tgttccatcg tatatcaata tctttctgag actacagaag tttcttcctg 960
aacgcgcctc agcgatttta aatcgtatgc agaatattca atttgaagca gtggttggcc 1020
acaaaatcaa aatgaaatga ataaataagc tccagccaga gatgtatgca tgataatgat 1080
atgaatagtt tcgaatcaat gctgcaaagc tttatttcac attttttcag tcctgataat 1140
attaaaaaca ttggtttggc actagcagca gtcaaacgaa caagattaat tacctgtctt 1200
cctgtttctc aagaatattt acgtagtttt tcataggtct gtttttcctt tcatgcctct 1260
taaaaacttc tgtgcttaca taaacatact taaaaggttt tctttaagat attttatttt 1320
tccatttaaa ggtggacaaa agctacctcc ctaaaagtaa atacaaagag aacttattta 1380
cacagggaag gtttaagact gttcaagtag cattccaatc tgtagccatg ccacagaata 1440
tcaacaagaa cacagaatga gtgcacagct aagagatcaa gtttcagcag gcagctttat 1500
ctcaacctgg acatatttta agattcagca tttgaaagat ttccctagcc tcttcctttt 1560
tcattagccc aaaacggtgc aactctattc tggactttat tacttgattc tgtcttctgt 1620
ataactctga agtccaccaa aagtggaccc tctatatttc ctcccttttt atagtcttat 1680
aagatacatt atgaaaggtg accgactcta ttttaaatct cagaatttta agttctagcc 1740
ccatgataac ctttttcttt gtaatttatg ctttcatata tccttggtcc cagagatgtt 1800
tagacaattt taggctcaaa aattaaagct aacacaggaa aaggaactgt actggctatt 1860
acataagaaa caatggaccc aagagaagaa aaggaagaaa gaaaggtttt ttggtttttg 1920
ttttgttttg ttttgttttt tgtttttttg agatggagtc tcactctttc gcccaggctg 1980
gagtgcagtg gtatgatctc agctcactgc aagctccacc tcccgggttc acgccattct 2040
cctgcctcag cctcctgagt agctgggact acaggcgccc gccaccacac ccggctaatt 2100
ttttgtattt tttgtagaga cggggtttca ccatgttagc caagatggtc tcgatctcct 2160
gacctcgtga tccacctgcc tcggcctccc aaagtgctgg gattacgggt gtgagccacc 2220
gtgcccagcc tttttttttt taatagaaaa aataatccga ctcccactac atcaagacta 2280
atcttgtttt gtgtgttttt cacatgtatt atagaatgct tttgcatgga ctatcctctt 2340
gtttttatta aaaacaaatg atttttttaa aagtcacaaa aacaattcac taaaaataaa 2400
tatgtcattg tgctttaaaa aaataacctc ttgtagttat aaaataaaac gtttgacttc 2460
taaactctg 2469
<210> 58
<211> 1715
<212> DNA
<213> Homo sapien
<400> 58
agacagtacc tcctccctag gactacacaa ggactgaacc agaaggaaga ggacagagca 60
aagccatgaa catcatccta gaaatccttc tgcttctgat caccatcatc tactcctact 120
tggagtcgtt ggtgaagttt ttcattcctc agaggagaaa atctgtggct ggggagattg 180
ttctcattac tggagctggg catggaatag gcaggcagac tacttatgaa tttgcaaaac 240
gacagagcat attggttctg tgggatatta ataagcgcgg tgtggaggaa actgcagctg 300
agtgccgaaa actaggcgtc actgcgcatg cgtatgtggt agactgcagc aacagagaag 360
agatctatcg ctctctaaat caggtgaaga aagaagtggg tgatgtaaca atcgtggtga 420
ataatgctgg gacagtatat ccagccgatc ttctcagcac caaggatgaa gagattacca 480
agacatttga ggtcaacatc ctaggacatt tttggatcac aaaagcactt cttccatcga 540
tgatggagag aaatcatggc cacatcgtca cagtggcttc agtgtgcggc cacgaaggga 600
ttccttacct catcccatat tgttccagca aatttgccgc tgttggcttt cacagaggtc 660
tgacatcaga acttcaggcc ttgggaaaaa ctggtatcaa aacctcatgt ctctgcccag 720
tttttgtgaa tactgggttc accaaaaatc caagcacaag attatggcct gtattggaga 780
cagatgaagt cgtaagaagt ctgatagatg gaatacttac caataagaaa atgatttttg 840
ttccatcgta tatcaatatc tttctgagac tacagaagtt aagtacagca cagaacaccc 900
aaatactaaa acaccaatag agcttttttt tttgcttttt ttttttttag acagagtctc 960
actctgtcac cctggctgga ttgcggtggt tgcagtggca tgatcttggc tcactgcaac 1020
ctccgcctcc tgggttcaag caattctcat gcctcagacc cccaagtaac tgggattata 1080
ggtgtgtgct gccacactac acccagctaa tttttgtatt ttttgataga gacaggtttc 1140
cccatgttgg ccaggctgga ctcgaactcc tgacctcaag ttatcctcct gtctcggcct 1200
cccaaagtgc tgggattaca gtcatgagcc accatgcctg gcccaataga gctattatta 1260
tggagcatct ttcagttgtg aaaattggca tggaaactct ccatccctgg ggagaacagt 1320
tatttcctct gttattttcc tacccagtct ataaaaagag agtgattcat tttctctacc 1380
aaatctactg tctctgccca aactttgctg aagactattc taactaaagg aaacacagtt 1440
taaaaagaat gcaatatagt gaagtagtta ataataaaga ctccattttt aaaagtctgc 1500
tggaagtttg gttgggattg cactgaatct atagagcaat tggggagtat tgacatatca 1560
acaatattga gttttctaat ccaagaacat aatatctatt tttaaaatct tcttcaaaat 1620
ctttaaatct ttaaattgta ttttgtagtt tttggtgttt aagtcttgca catattttgt 1680
cagatttatt ccaaagtatt tcacgggttc ttttt 1715
<210> 59
<211> 2290
<212> DNA
<213> Homo sapien
<400> 59
agacagtacc tcctccctag gactacacaa ggactgaacc agaaggaaga ggacagagca 60
aagccatgaa catcatccta gaaatccttc tgcttctgat caccatcatc tactcctact 120
tggagtcgtt ggtgaagttt ttcattcctc agaggagaaa atctgtggct ggggagattg 180
ttctcattac tggagctggg catggaatag gcaggcagac tacttatgaa tttgcaaaac 240
gacagagcat attggttctg tgggatatta ataaggtgaa gaaagaagtg ggtgatgtaa 300
caatcgtggt gaataatgct gggacagtat atccagccga tcttctcagc accaaggatg 360
aagagattac caagacattt gaggtcaaca tcctaggaca tttttggatc acaaaagcac 420
ttcttccatc gatgatggag agaaatcatg gccacatcgt cacagtggct tcagtgtgcg 480
gccacgaagg gattccttac ctcatcccat attgttccag caaatttgcc gctgttggct 540
ttcacagagg tctgacatca gaacttcagg ccttgggaaa aactggtatc aaaacctcat 600
gtctctgccc agtttttgtg aatactgggt tcaccaaaaa tccaagcaca agattatggc 660
ctgtattgga gacagatgaa gtcgtaagaa gtctgataga tggaatactt accaataaga 720
aaatgatttt tgttccatcg tatatcaata tctttctgag actacagaag gtttcttcct 780
gaacgcgcct cagcgatttt aaatcgtatg cagaatattc aatttgaagc agtggttggc 840
cacaaaatca aaatgaaatg aataaataag ctccagccag agatgtatgc atgataatga 900
tatgaatagt ttcgaatcaa tgctgcaaag ctttatttca cattttttca gtcctgataa 960
tattaaaaac attggtttgg cactagcagc agtcaaacga acaagattaa ttacctgtct 1020
tcctgtttct caagaatatt tacgtagttt ttcataggtc tgtttttcct ttcatgcctc 1080
ttaaaaactt ctgtgcttac ataaacatac ttaaaaggtt ttctttaaga tattttattt 1140
ttccatttaa aggtggacaa aagctacctc cctaaaagta aatacaaaga gaacttattt 1200
acacagggaa ggtttaagac tgttcaagta gcattccaat ctgtagccat gccacagaat 1260
atcaacaaga acacagaatg agtgcacagc taagagatca agtttcagca ggcagcttta 1320
tctcaacctg gacatatttt aagattcagc atttgaaaga tttccctagc ctcttccttt 1380
ttcattagcc caaaacggtg caactctatt ctggacttta ttacttgatt ctgtcttctg 1440
tataactctg aagtccacca aaagtggacc ctctatattt cctccctttt tatagtctta 1500
taagatacat tatgaaaggt gaccgactct attttaaatc tcagaatttt aagttctagc 1560
cccatgataa cctttttctt tgtaatttat gctttcatat atccttggtc ccagagatgt 1620
ttagacaatt ttaggctcaa aaattaaagc taacacagga aaaggaactg tactggctat 1680
tacataagaa acaatggacc caagagaaga aaaggaagaa agaaaggttt tttggttttt 1740
gttttgtttt gttttgtttt ttgttttttt gagatggagt ctcactcttt cgcccaggct 1800
ggagtgcagt ggtatgatct cagctcactg caagctccac ctcccgggtt cacgccattc 1860
tcctgcctca gcctcctgag tagctgggac tacaggcgcc cgccaccaca cccggctaat 1920
tttttgtatt ttttgtagag acggggtttc accatgttag ccaagatggt ctcgatctcc 1980
tgacctcgtg atccacctgc ctcggcctcc caaagtgctg ggattacggg tgtgagccac 2040
cgtgcccagc cttttttttt ttaatagaaa aaataatccg actcccacta catcaagact 2100
aatcttgttt tgtgtgtttt tcacatgtat tatagaatgc ttttgcatgg actatcctct 2160
tgtttttatt aaaaacaaat gattttttta aaagtcacaa aaacaattca ctaaaaataa 2220
atatgtcatt gtgctttaaa aaaataacct cttgtagtta taaaataaaa cgtttgactt 2280
ctaaactctg 2290
<210> 60
<211> 2470
<212> DNA
<213> Homo sapien
<400> 60
agacagtacc tcctccctag gactacacaa ggactgaacc agaaggaaga ggacagagca 60
aagccatgaa catcatccta gaaatccttc tgcttctgat caccatcatc tactcctact 120
tggagtcgtt ggtgaagttt ttcattcctc agaggagaaa atctgtggct ggggagattg 180
ttctcattac tggagctggg catggaatag gcaggcagac tacttatgaa tttgcaaaac 240
gacagagcat attggttctg tgggatatta ataagcgcgg tgtggaggaa actgcagctg 300
agtgccgaaa actaggcgtc actgcgcatg cgtatgtggt agactgcagc aacagagaag 360
agatctatcg ctctctaaat caggtgaaga aagaagtggg tgatgtaaca atcgtggtga 420
ataatgctgg gacagtatat ccagccgatc ttctcagcac caaggatgaa gagattacca 480
agacatttga ggtcaacatc ctaggacatt tttggaatgg aaaggacatc agaagtaatt 540
acttggatgt atataggatc gaggacactt ttggacgaga ctctgagatc acaaaagcac 600
ttcttccatc gatgatggag agaaatcatg gccacatcgt cacagtggct tcagtgtgcg 660
gccacgaagg gattccttac ctcatcccat attgttccag caaatttgcc gctgttggct 720
ttcacagagg tctgacatca gaacttcagg ccttgggaaa aactggtatc aaaacctcat 780
gtctctgccc agtttttgtg aatactgggt tcaccaaaaa tccaagcaca agattatggc 840
ctgtattgga gacagatgaa gtcgtaagaa gtctgataga tggaatactt accaataaga 900
aaatgatttt tgttccatcg tatatcaata tctttctgag actacagaag gtttcttcct 960
gaacgcgcct cagcgatttt aaatcgtatg cagaatattc aatttgaagc agtggttggc 1020
cacaaaatca aaatgaaatg aataaataag ctccagccag agatgtatgc atgataatga 1080
tatgaatagt ttcgaatcaa tgctgcaaag ctttatttca cattttttca gtcctgataa 1140
tattaaaaac attggtttgg cactagcagc agtcaaacga acaagattaa ttacctgtct 1200
tcctgtttct caagaatatt tacgtagttt ttcataggtc tgtttttcct ttcatgcctc 1260
ttaaaaactt ctgtgcttac ataaacatac ttaaaaggtt ttctttaaga tattttattt 1320
ttccatttaa aggtggacaa aagctacctc cctaaaagta aatacaaaga gaacttattt 1380
acacagggaa ggtttaagac tgttcaagta gcattccaat ctgtagccat gccacagaat 1440
atcaacaaga acacagaatg agtgcacagc taagagatca agtttcagca ggcagcttta 1500
tctcaacctg gacatatttt aagattcagc atttgaaaga tttccctagc ctcttccttt 1560
ttcattagcc caaaacggtg caactctatt ctggacttta ttacttgatt ctgtcttctg 1620
tataactctg aagtccacca aaagtggacc ctctatattt cctccctttt tatagtctta 1680
taagatacat tatgaaaggt gaccgactct attttaaatc tcagaatttt aagttctagc 1740
cccatgataa cctttttctt tgtaatttat gctttcatat atccttggtc ccagagatgt 1800
ttagacaatt ttaggctcaa aaattaaagc taacacagga aaaggaactg tactggctat 1860
tacataagaa acaatggacc caagagaaga aaaggaagaa agaaaggttt tttggttttt 1920
gttttgtttt gttttgtttt ttgttttttt gagatggagt ctcactcttt cgcccaggct 1980
ggagtgcagt ggtatgatct cagctcactg caagctccac ctcccgggtt cacgccattc 2040
tcctgcctca gcctcctgag tagctgggac tacaggcgcc cgccaccaca cccggctaat 2100
tttttgtatt ttttgtagag acggggtttc accatgttag ccaagatggt ctcgatctcc 2160
tgacctcgtg atccacctgc ctcggcctcc caaagtgctg ggattacggg tgtgagccac 2220
cgtgcccagc cttttttttt ttaatagaaa aaataatccg actcccacta catcaagact 2280
aatcttgttt tgtgtgtttt tcacatgtat tatagaatgc ttttgcatgg actatcctct 2340
tgtttttatt aaaaacaaat gattttttta aaagtcacaa aaacaattca ctaaaaataa 2400
atatgtcatt gtgctttaaa aaaataacct cttgtagtta taaaataaaa cgtttgactt 2460
ctaaactctg 2470
<210> 61
<211> 1714
<212> DNA
<213> Homo sapien
<400> 61
agacagtacc tcctccctag gactacacaa ggactgaacc agaaggaaga ggacagagca 60
aagccatgaa catcatccta gaaatccttc tgcttctgat caccatcatc tactcctact 120
tggagtcgtt ggtgaagttt ttcattcctc agaggagaaa atctgtggct ggggagattg 180
ttctcattac tggagctggg catggaatag gcaggcagac tacttatgaa tttgcaaaac 240
gacagagcat attggttctg tgggatatta ataagcgcgg tgtggaggaa actgcagctg 300
agtgccgaaa actaggcgtc actgcgcatg cgtatgtggt agactgcagc aacagagaag 360
agatctatcg ctctctaaat caggtgaaga aagaagtggg tgatgtaaca atcgtggtga 420
ataatgctgg gacagtatat ccagccgatc ttctcagcac caaggatgaa gagattacca 480
agacatttga ggtcaacatc ctaggacatt tttggatcac aaaagcactt cttccatcga 540
tgatggagag aaatcatggc cacatcgtca cagtggcttc agtgtgcggc cacgaaggga 600
ttccttacct catcccatat tgttccagca aatttgccgc tgttggcttt cacagaggtc 660
tgacatcaga acttcaggcc ttgggaaaaa ctggtatcaa aacctcatgt ctctgcccag 720
tttttgtgaa tactgggttc accaaaaatc caagcacaag attatggcct gtattggaga 780
cagatgaagt cgtaagaagt ctgatagatg gaatacttac caataagaaa atgatttttg 840
ttccatcgta tatcaatatc tttctgagac tacagaagta agtacagcac agaacaccca 900
aatactaaaa caccaataga gctttttttt ttgctttttt tttttttaga cagagtctca 960
ctctgtcacc ctggctggat tgcggtggtt gcagtggcat gatcttggct cactgcaacc 1020
tccgcctcct gggttcaagc aattctcatg cctcagaccc ccaagtaact gggattatag 1080
gtgtgtgctg ccacactaca cccagctaat ttttgtattt tttgatagag acaggtttcc 1140
ccatgttggc caggctggac tcgaactcct gacctcaagt tatcctcctg tctcggcctc 1200
ccaaagtgct gggattacag tcatgagcca ccatgcctgg cccaatagag ctattattat 1260
ggagcatctt tcagttgtga aaattggcat ggaaactctc catccctggg gagaacagtt 1320
atttcctctg ttattttcct acccagtcta taaaaagaga gtgattcatt ttctctacca 1380
aatctactgt ctctgcccaa actttgctga agactattct aactaaagga aacacagttt 1440
aaaaagaatg caatatagtg aagtagttaa taataaagac tccattttta aaagtctgct 1500
ggaagtttgg ttgggattgc actgaatcta tagagcaatt ggggagtatt gacatatcaa 1560
caatattgag ttttctaatc caagaacata atatctattt ttaaaatctt cttcaaaatc 1620
tttaaatctt taaattgtat tttgtagttt ttggtgttta agtcttgcac atattttgtc 1680
agatttattc caaagtattt cacgggttct tttt 1714
<210> 62
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> forward primer
<400> 62
atgaacatca tcctagaaat ccttc 25
<210> 63
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> reverse primer
<400> 63
atcatgcata catctctggc tggag 25
<210> 64
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 64
atcagaactt caggccttgg 20
<210> 65
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> first exon
<400> 65
gcaaagccat gaacatcatc c 21
<210> 66
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> last exon
<400> 66
tcttgatgta gtgggagtcg gatt 24
Claims (81)
- 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법으로서,
상기 대상체로부터의 샘플이,
i) I148M 변이를 포함하는 파타틴 유사 포스포리파제 도메인 함유 3(patatin like phospholipase domain containing 3: PNPLA3) 단백질을 암호화하는 제1 핵산 및 기능성 HSD17B13 단백질을 암호화하는 제2 핵산; 및
ii) I148M 변이를 포함하는 PNPLA3 단백질 및 기능성 HSD17B13 단백질 중 적어도 하나를 포함하는지의 여부를 결정하는 단계; 및
i)에 정의된 바와 같은 상기 제1 핵산 및 제2 핵산 둘 다 및 ii)에 정의된 바와 같은 상기 단백질 둘 다 중 적어도 하나가 검출되는 경우 상기 대상체를 HSD17B13을 저해함으로써 간 질환을 치료 또는 저해하기 위한 후보자로서 식별하는 단계
를 포함하는, 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법. - 제1항에 있어서,
상기 제1 핵산 분자는 게놈 DNA, mRNA 또는 mRNA로부터 획득된 cDNA를 포함하는, 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법. - 제2항에 있어서,
상기 게놈 DNA는 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함하거나,
상기 mRNA는 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함하거나;
상기 mRNA는 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함하거나;
상기 cDNA는 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함하거나; 또는
상기 cDNA는 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함하는, 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법. - 제2항 또는 제3항에 있어서,
상기 게놈 DNA는 서열번호 31에 따른 뉴클레오타이드 서열, 또는 서열번호 31과 적어도 90%의 서열 동일성을 갖고 상기 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나;
상기 mRNA는 서열번호 34에 따른 뉴클레오타이드 서열, 또는 서열번호 34와 적어도 90%의 서열 동일성을 갖고 상기 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나;
상기 mRNA는 서열번호 35에 따른 뉴클레오타이드 서열, 또는 서열번호 35과 적어도 90%의 서열 동일성을 갖고 상기 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나;
상기 cDNA는 서열번호 38에 따른 뉴클레오타이드 서열, 또는 서열번호 38과 적어도 90%의 서열 동일성을 갖고 상기 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나;
상기 cDNA는 서열번호 39에 따른 뉴클레오타이드 서열, 또는 서열번호 39와 적어도 90%의 서열 동일성을 갖고 상기 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하는, 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법. - 제1항 내지 제3항 중 어느 한 항에 있어서,
상기 제1 핵산을 검출하는 단계는,
상기 제1 핵산의 적어도 일부를 서열분석하는 단계로서, 상기 일부는 상기 I148M 변이를 암호화하는 코돈을 포함하는, 상기 서열분석하는 단계; 또는
상기 제1 핵산을 상기 제1 핵산의 일부에 특이적으로 혼성화하는 프로브 또는 프라이머와 혼성화시키는 단계로서, 상기 일부는 상기 I148M 변이를 암호화하는 상기 코돈을 포함하는, 상기 혼성화시키는 단계
를 포함하는, 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법. - 제5항에 있어서,
상기 프로브 또는 프라이머는 대립유전자-특이적(allele-specific) 프로브 또는 프라이머이되, 상기 프로브 또는 프라이머는 표지를 선택적으로 포함하는, 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법. - 제1항 내지 제3항 중 어느 한 항에 있어서,
상기 대상체가 상기 I148M 변이에 대해서 동형접합성(homozygous)인지 또는 이형접합성(heterozygous)인지를 결정하는 단계를 더 포함하는, 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법. - 제1항 내지 제3항 중 어느 한 항에 있어서,
상기 제2 핵산은 게놈 DNA, mRNA 또는 mRNA로부터 획득된 cDNA를 포함하는, 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법. - 제8항에 있어서,
상기 게놈 DNA는 서열번호 1에 따른 12,667번 위치에 상응하는 위치에 아데닌을 포함하거나;
상기 게놈 DNA는 서열번호 1에 따른 뉴클레오타이드 서열, 또는 서열번호 1과 적어도 90%의 서열 동일성을 갖고 기능성 HSD17B13 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나;
상기 mRNA는 서열번호 3에 따른 뉴클레오타이드 서열, 또는 서열번호 3과 적어도 90%의 서열 동일성을 갖고 기능성 HSD17B13 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나;
상기 mRNA는 서열번호 4에 따른 뉴클레오타이드 서열, 또는 서열번호 4와 적어도 90%의 서열 동일성을 갖고 기능성 HSD17B13 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나;
상기 mRNA는 서열번호 7에 따른 뉴클레오타이드 서열, 또는 서열번호 7과 적어도 90%의 서열 동일성을 갖고 기능성 HSD17B13 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나;
상기 mRNA는 서열번호 11에 따른 뉴클레오타이드 서열, 또는 서열번호 11과 적어도 90%의 서열 동일성을 갖고 기능성 HSD17B13 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나;
상기 cDNA는 서열번호 12에 따른 뉴클레오타이드 서열, 또는 서열번호 12와 적어도 90%의 서열 동일성을 갖고 기능성 HSD17B13 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나;
상기 cDNA는 서열번호 13에 따른 뉴클레오타이드 서열, 또는 서열번호 13과 적어도 90%의 서열 동일성을 갖고 기능성 HSD17B13 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나;
상기 cDNA는 서열번호 16에 따른 뉴클레오타이드 서열, 또는 서열번호 16과 적어도 90%의 서열 동일성을 갖고 기능성 HSD17B13 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나; 또는
상기 cDNA는 서열번호 20에 따른 뉴클레오타이드 서열, 또는 서열번호 20과 적어도 90%의 서열 동일성을 갖고 기능성 HSD17B13 단백질을 암호화하는 뉴클레오타이드 서열을 포함하는, 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법. - 제1항 내지 제3항 중 어느 한 항에 있어서,
상기 제2 핵산을 검출하는 단계는,
상기 제2 핵산을 서열분석하는 단계; 또는
상기 제2 핵산을 상기 제2 핵산의 일부에 특이적으로 혼성화하는 프로브 또는 프라이머와 혼성화시키는 단계로서, 상기 일부는 서열번호 1에 따른 12,667번 위치에 상응하는 위치에 아데닌을 포함하는, 상기 혼성화시키는 단계
를 포함하는, 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법. - 제10항에 있어서,
상기 프로브 또는 프라이머는 대립유전자-특이적 프로브 또는 프라이머이되, 상기 프로브 또는 프라이머는 표지를 선택적으로 포함하는, 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법. - 제1항 내지 제3항 중 어느 한 항에 있어서,
상기 대상체가 상기 샘플에서 기능성 HSD17B13 단백질을 암호화하는 상기 제2 핵산에 대해서 동형접합성인지 또는 이형접합성인지를 결정하는 단계를 더 포함하는, 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법. - 제1항 내지 제3항 중 어느 한 항에 있어서,
HSD17B13의 저해제를 상기 대상체에게 투여하는 단계를 더 포함하는, 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법. - 제1항 내지 제3항 중 어느 한 항에 있어서,
상기 간 질환은 알코올성 간 질환인, 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법. - 제14항에 있어서,
상기 알코올성 간 질환은 알코올 섭취로 인한 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함하는, 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법. - 제1항 내지 제3항 중 어느 한 항에 있어서,
상기 간 질환은 비알코올성 간 질환인, 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법. - 제16항에 있어서,
상기 비알코올성 간 질환은 비알코올성 지방간 질환(nonalcoholic fatty liver disease: NAFLD) 또는 비알코올성 지방간염(non-alcoholic steatohepatitis: NASH)을 포함하는, 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법. - 제16항에 있어서,
상기 비알코올성 간 질환은 알코올 섭취에 의해서 유발되지 않은 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함하는, 간 질환을 치료 또는 저해하기 위한 후보자로서 인간 대상체를 식별하는 방법. - 간 질환을 치료 또는 저해하는 방법으로서,
하이드록시스테로이드 17-베타 데하이드로게나제 13(hydroxysteroid 17-beta dehydrogenase 13: HSD17B13)의 저해제를, I148M 변이를 포함하는 파타틴 유사 포스포리파제 도메인 함유 3(PNPLA3) 단백질을 발현하는 인간 간 질환 환자에게 투여하여 상기 환자에서 상기 간 질환을 치료 또는 저해하는 단계를 포함하는, 간 질환을 치료 또는 저해하는 방법 - 제19항에 있어서,
상기 간 질환은 알코올성 간 질환인, 간 질환을 치료 또는 저해하는 방법. - 제20항에 있어서,
상기 알코올성 간 질환은 알코올 섭취로 인한 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제19항에 있어서,
상기 간 질환은 비알코올성 간 질환인, 간 질환을 치료 또는 저해하는 방법. - 제22항에 있어서,
상기 비알코올성 간 질환은 비알코올성 지방간 질환(NAFLD) 또는 비알코올성 지방간염(NASH)을 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제22항에 있어서,
상기 비알코올성 간 질환은 알코올 섭취에 의해서 유발되지 않은 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제19항 내지 제24항 중 어느 한 항에 있어서,
상기 환자는 비만인, 간 질환을 치료 또는 저해하는 방법. - 제19항 내지 제24항 중 어느 한 항에 있어서,
상기 환자는 지방간인, 간 질환을 치료 또는 저해하는 방법. - 제19항 내지 제24항 중 어느 한 항에 있어서,
상기 환자는 상기 대상체로부터의 샘플에서 상기 변이체 PNPLA3 단백질을 검출함으로써 상기 변이체 PNPLA3 단백질을 발현하는 것으로 결정된, 간 질환을 치료 또는 저해하는 방법. - 제19항 내지 제24항 중 어느 한 항에 있어서,
상기 변이체 PNPLA3 단백질은 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제26항에 있어서,
상기 샘플 중의 상기 변이체 PNPLA3 단백질은 서열번호 42에 따른 아미노산 서열 또는 서열번호 42와 적어도 90%의 서열 동일성을 갖고 상기 I148M 변이를 포함하는 아미노산 서열을 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제27항에 있어서,
상기 변이체 PNPLA3 단백질은 아미노산 서열분석에 의해서 또는 면역검정에 의해서 검출되는, 간 질환을 치료 또는 저해하는 방법. - 제19항 내지 제24항 중 어느 한 항에 있어서,
상기 대상체는 상기 대상체로부터의 샘플에서 상기 변이체 PNPLA3 단백질을 암호화하는 핵산 분자를 검출함으로써 상기 변이체 PNPLA3 단백질을 발현하는 것으로 결정된, 간 질환을 치료 또는 저해하는 방법. - 제31항에 있어서,
상기 변이체 PNPLA3 단백질은 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제32항에 있어서,
상기 변이체 PNPLA3 단백질은 서열번호 42에 따른 아미노산 서열 또는 서열번호 42와 적어도 90%의 서열 동일성을 갖고 상기 I148M 변이를 포함하는 아미노산 서열을 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제31항에 있어서,
상기 변이체 PNPLA3 단백질을 암호화하는 상기 핵산 분자는 게놈 DNA, mRNA 또는 mRNA로부터 획득된 cDNA를 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제31항에 있어서,
상기 핵산 분자는 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함하는 게놈 DNA를 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제34항에 있어서,
상기 게놈 DNA는 서열번호 31에 따른 뉴클레오타이드 서열 또는 서열번호 31과 적어도 90%의 서열 동일성을 갖고 상기 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제31항에 있어서,
상기 핵산 분자는 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함하는 mRNA를 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제34항에 있어서,
상기 mRNA는 서열번호 34에 따른 뉴클레오타이드 서열 또는 서열번호 34와 적어도 90%의 서열 동일성을 갖고 상기 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제31항에 있어서,
상기 핵산 분자는 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함하는 mRNA를 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제34항에 있어서,
상기 mRNA는 서열번호 35에 따른 뉴클레오타이드 서열 또는 서열번호 35와 적어도 90%의 서열 동일성을 갖고 상기 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제31항에 있어서,
상기 핵산 분자는 mRNA로부터 획득된 cDNA를 포함하되, 상기 cDNA는 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제34항에 있어서,
상기 cDNA는 서열번호 38에 따른 뉴클레오타이드 서열 또는 서열번호 38과 적어도 90%의 서열 동일성을 갖고 상기 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제31항에 있어서,
상기 핵산 분자는 mRNA로부터 획득된 cDNA를 포함하되, 상기 cDNA는 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제34항에 있어서,
상기 cDNA는 서열번호 39에 따른 뉴클레오타이드 서열 또는 서열번호 39와 적어도 90%의 서열 동일성을 갖고 상기 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제31항에 있어서,
상기 핵산은 상기 핵산의 적어도 일부를 서열분석함으로써 검출되되, 상기 일부는 상기 I148M 변이를 암호화하는 코돈을 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제31항에 있어서,
상기 핵산은 상기 핵산을 상기 핵산의 일부에 특이적으로 혼성화하는 프로브 또는 프라이머와 혼성화시킴으로써 검출되되, 상기 일부는 상기 I148M 변이를 암호화하는 코돈을 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제46항에 있어서,
상기 프로브 또는 프라이머는 대립유전자-특이적 프로브 또는 프라이머인, 간 질환을 치료 또는 저해하는 방법. - 제46항에 있어서,
상기 프로브 또는 프라이머는 표지를 포함하는, 간 질환을 치료 또는 저해하는 방법. - 제19항 내지 제24항 중 어느 한 항에 있어서,
상기 환자는 상기 변이체 PNPLA3 단백질을 암호화하는 유전자에 대해서 동형접합성인, 간 질환을 치료 또는 저해하는 방법. - 제19항 내지 제24항 중 어느 한 항에 있어서,
상기 환자는 상기 변이체 PNPLA3 단백질을 암호화하는 유전자에 대해서 이형접합성인, 간 질환을 치료 또는 저해하는 방법. - 제49항에 있어서,
상기 환자는 추가로 기능성 HSD17B13 단백질을 암호화하는 유전자에 대해서 동형접합성인, 간 질환을 치료 또는 저해하는 방법. - 제49항에 있어서,
상기 환자는 추가로 기능성 HSD17B13 단백질을 암호화하는 유전자에 대해서 이형접합성인, 간 질환을 치료 또는 저해하는 방법. - 제51항에 있어서,
상기 기능성 HSD17B13 단백질은 야생형 HSD17B13 단백질의 활성도의 적어도 10%를 갖는 HSD17B13 단백질인, 간 질환을 치료 또는 저해하는 방법. - 제52항에 있어서,
상기 환자는 상기 기능성 HSD17B13 단백질을 암호화하는 상기 유전자 및 HSD17B13의 기능 상실 변이체(loss of function variant)를 암호화하는 유전자에 대해서 이형접합성인, 간 질환을 치료 또는 저해하는 방법. - 제54항에 있어서,
상기 기능성 HSD17B13 단백질은 야생형 HSD17B13 단백질의 활성도의 적어도 10%를 갖는 HSD17B13 단백질인, 간 질환을 치료 또는 저해하는 방법. - 제19항 내지 제24항 중 어느 한 항에 있어서,
상기 HSD17B13저해제는 HSD17B1, HSD17B2, HSD17B3, HSD17B4, HSD17B6, HSD17B7, HSD17B8, HSD17B10, HSD17B11, HSD17B12, HSD17B13, HSD17B14, DHRS3 또는 RDH10 중 하나 이상을 더 저해할 수 있는, 간 질환을 치료 또는 저해하는 방법. - I148M 변이를 포함하는 PNPLA3 단백질을 갖고, 그리고 기능성 HSD17B13 단백질을 갖는 인간 대상체에서 간 질환을 치료하는데 사용하기 위한, HSD17B13의 저해제.
- 제57항에 있어서,
상기 인간 대상체는 I148M 변이를 포함하는 PNPLA3 단백질 및 기능성 HSD17B13 단백질에 대해서 양성인 것으로 시험된, HSD17B13의 저해제. - 제57항 또는 제58항에 있어서,
상기 치료는 상기 인간 대상체가 I148M 변이를 포함하는 PNPLA3 단백질 및 기능성 HSD17B13 단백질을 갖는지의 여부를 결정하는 단계를 포함하는, HSD17B13의 저해제. - 제57항 또는 제58항에 있어서,
상기 인간 대상체는, 제1항 내지 제18항 중 어느 한 항에 정의된 바와 같은 방법을 사용하여 HSD17B13을 저해함으로써 간 질환을 치료 또는 저해하기 위한 후보자인 것으로 식별된, HSD17B13의 저해제. - 제57항 또는 제58항에 있어서,
상기 변이체 PNPLA3 단백질은 서열번호 42에 따른 148번 위치에 상응하는 위치에 메티오닌을 포함하는, HSD17B13의 저해제. - 제61항에 있어서,
상기 변이체 PNPLA3 단백질은 서열번호 42에 따른 아미노산 서열 또는 서열번호 42와 적어도 90%의 서열 동일성을 갖고 상기 I148M 변이를 포함하는 아미노산 서열을 포함하는, HSD17B13의 저해제. - 제57항 또는 제58항에 있어서,
상기 변이체 PNPLA3 단백질을 암호화하는 상기 핵산 분자는 게놈 DNA인, HSD17B13의 저해제. - 제63항에 있어서,
상기 게놈 DNA는 서열번호 31에 따른 5107 내지 5109번 위치에 상응하는 위치에 ATG 코돈을 포함하는, HSD17B13의 저해제. - 제64항에 있어서,
상기 게놈 DNA는 서열번호 31에 따른 뉴클레오타이드 서열 또는 서열번호 31과 적어도 90%의 서열 동일성을 갖고 상기 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하는, HSD17B13의 저해제. - 제57항 또는 제58항에 있어서,
상기 변이체 PNPLA3 단백질을 암호화하는 상기 핵산 분자는 mRNA인, HSD17B13의 저해제. - 제66항에 있어서,
상기 mRNA는 서열번호 34에 따른 442 내지 444번 위치에 상응하는 위치에 AUG 코돈을 포함하는, HSD17B13의 저해제. - 제67항에 있어서,
상기 mRNA는 서열번호 34에 따른 뉴클레오타이드 서열 또는 서열번호 34와 적어도 90%의 서열 동일성을 갖고 상기 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하는, HSD17B13의 저해제. - 제66항에 있어서,
상기 mRNA는 서열번호 35에 따른 430 내지 432번 위치에 상응하는 위치에 AUG 코돈을 포함하는, HSD17B13의 저해제. - 제69항에 있어서,
상기 mRNA는 서열번호 35에 따른 뉴클레오타이드 서열 또는 서열번호 35와 적어도 90%의 서열 동일성을 갖고 상기 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하는, HSD17B13의 저해제. - 제57항 또는 제58항에 있어서,
상기 변이체 PNPLA3 단백질을 암호화하는 상기 핵산 분자는 cDNA인, HSD17B13의 저해제. - 제71항에 있어서,
상기 cDNA는 서열번호 38에 따른 442 내지 444번 위치에 상응하는 위치에 ATG 코돈을 포함하는, HSD17B13의 저해제. - 제72항에 있어서,
상기 cDNA는 서열번호 38에 따른 뉴클레오타이드 서열 또는 서열번호 38과 적어도 90%의 서열 동일성을 갖고 상기 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하는, HSD17B13의 저해제. - 제71항에 있어서,
상기 cDNA는 서열번호 39에 따른 430 내지 432번 위치에 상응하는 위치에 ATG 코돈을 포함하는, HSD17B13의 저해제. - 제74항에 있어서,
상기 cDNA는 서열번호 39에 따른 뉴클레오타이드 서열 또는 서열번호 39와 적어도 90%의 서열 동일성을 갖고 상기 I148M 변이를 포함하는 PNPLA3 단백질을 암호화하는 뉴클레오타이드 서열을 포함하는, HSD17B13의 저해제. - 제57항 또는 제58항에 있어서,
상기 간 질환은 알코올성 간 질환인, HSD17B13의 저해제. - 제76항에 있어서,
상기 알코올성 간 질환은 알코올 섭취로 인한 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함하는, HSD17B13의 저해제. - 제57항 또는 제58항에 있어서,
상기 간 질환은 비알코올성 간 질환인, HSD17B13의 저해제. - 제78항에 있어서,
상기 비알코올성 간 질환은 비알코올성 지방간 질환(NAFLD) 또는 비알코올성 지방간염(NASH)을 포함하는, HSD17B13의 저해제. - 제78항에 있어서,
상기 비알코올성 간 질환은 알코올 섭취에 의해서 유발되지 않은 간경변, 지방증 또는 간세포 암종 중 하나 이상을 포함하는, HSD17B13의 저해제. - 제57항 또는 제58항에 있어서,
상기 인간 대상체는 기능성 HSD17B13에 대해서 동형접합성 또는 이형접합성인, HSD17B13의 저해제.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762570985P | 2017-10-11 | 2017-10-11 | |
US62/570,985 | 2017-10-11 | ||
PCT/US2018/055377 WO2019075181A1 (en) | 2017-10-11 | 2018-10-11 | INHIBITION OF HSD17B13 IN THE TREATMENT OF HEPATIC DISEASE IN PATIENTS EXPRESSING PNPLA3 I148M VARIATION |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20200062314A true KR20200062314A (ko) | 2020-06-03 |
Family
ID=64316974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207013128A KR20200062314A (ko) | 2017-10-11 | 2018-10-11 | Pnpla3 i148m 변이를 발현하는 환자의 간 질환의 치료에서의 hsd17b13의 저해 |
Country Status (12)
Country | Link |
---|---|
US (3) | US10961583B2 (ko) |
EP (2) | EP4234719A3 (ko) |
JP (2) | JP7434151B2 (ko) |
KR (1) | KR20200062314A (ko) |
CN (1) | CN111183234A (ko) |
AU (1) | AU2018348195A1 (ko) |
CA (1) | CA3078883A1 (ko) |
IL (1) | IL273550A (ko) |
MX (1) | MX2020003561A (ko) |
RU (1) | RU2020115526A (ko) |
SG (1) | SG11202003254SA (ko) |
WO (1) | WO2019075181A1 (ko) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3571301A1 (en) | 2017-01-23 | 2019-11-27 | Regeneron Pharmaceuticals, Inc. | Hsd17b13 variants and uses thereof |
WO2019075181A1 (en) * | 2017-10-11 | 2019-04-18 | Regeneron Pharmaceuticals, Inc. | INHIBITION OF HSD17B13 IN THE TREATMENT OF HEPATIC DISEASE IN PATIENTS EXPRESSING PNPLA3 I148M VARIATION |
EP3899024A4 (en) | 2018-12-21 | 2023-05-31 | Ionis Pharmaceuticals, Inc. | HSD17B13 EXPRESSION MODULATORS |
MA56457A (fr) | 2019-07-02 | 2022-05-11 | Regeneron Pharma | Modulateurs de hsd17b13 et leurs procédés d'utilisation |
WO2021211959A2 (en) * | 2020-04-18 | 2021-10-21 | Inipharm, Inc. | Methods and compositions for treating drug induced steatohepatitis |
WO2021211981A1 (en) * | 2020-04-18 | 2021-10-21 | Inipharm, Inc. | Substrate selective hsd17b13 inhibitors and uses thereof |
AU2021410768A1 (en) * | 2020-12-23 | 2023-06-22 | Regeneron Pharmaceuticals, Inc. | Treatment of liver diseases with cell death inducing dffa like effector b (cideb) inhibitors |
CN112626199A (zh) * | 2021-01-04 | 2021-04-09 | 杭州艾迪康医学检验中心有限公司 | 检测慢性肝炎转化为肝硬化的风险预测位点的引物和方法 |
WO2023122531A2 (en) | 2021-12-20 | 2023-06-29 | Regeneron Pharmaceuticals, Inc. | Methods of identifying and evaluating liver inflammation and liver fibrosis in a subject by determining a stratified score based on gene expression |
CN114262738B (zh) * | 2021-12-31 | 2023-03-31 | 吉林大学第一医院 | Hsd17b13基因多态性在中重度mafld诊断中的应用 |
TW202400791A (zh) * | 2022-05-06 | 2024-01-01 | 大陸商蘇州瑞博生物技術股份有限公司 | 一種核酸、含有該核酸的組合物與綴合物及製備方法和用途 |
WO2024075051A1 (en) * | 2022-10-07 | 2024-04-11 | Pfizer Inc. | Hsd17b13 inhibitors and/or degraders |
Family Cites Families (135)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US38170A (en) | 1863-04-14 | Improvement in lamps | ||
US5294533A (en) | 1988-07-05 | 1994-03-15 | Baylor College Of Medicine | Antisense oligonucleotide antibiotics complementary to the macromolecular synthesis operon, methods of treating bacterial infections and methods for identification of bacteria |
US5135917A (en) | 1990-07-12 | 1992-08-04 | Nova Pharmaceutical Corporation | Interleukin receptor expression inhibiting antisense oligonucleotides |
US5271941A (en) | 1990-11-02 | 1993-12-21 | Cho Chung Yoon S | Antisense oligonucleotides of human regulatory subunit RI.sub.α of cAMP-dependent protein kinases |
US5786138A (en) | 1993-01-29 | 1998-07-28 | Board Of Supervisors Of Louisiana State University And Agricultural And Mechanical College | Hyperstabilizing antisense nucleic acid binding agents |
AU693097B2 (en) | 1993-06-04 | 1998-06-25 | Government Of The United States Of America, As Represented By The Secretary Of The Department Of Health And Human Services, The | Method for treating kaposi's sarcoma with antisense oligonucleotides |
US5578716A (en) | 1993-12-01 | 1996-11-26 | Mcgill University | DNA methyltransferase antisense oligonucleotides |
US5641754A (en) | 1994-01-10 | 1997-06-24 | The Board Of Regents Of The University Of Nebraska | Antisense oligonucleotide compositions for selectively killing cancer cells |
US5624813A (en) | 1994-04-21 | 1997-04-29 | Mahant; Vijay K. | NAD(P)+ /NAD(P)H based chemiluminescent diagnostics |
AU3222795A (en) | 1994-08-09 | 1996-03-07 | Ciba-Geigy Ag | Antitumor antisense oligonucleotides |
US5856103A (en) | 1994-10-07 | 1999-01-05 | Board Of Regents The University Of Texas | Method for selectively ranking sequences for antisense targeting |
US5994320A (en) | 1995-02-06 | 1999-11-30 | Regents Of The University Of Minnesota | Antisense oligonucleotides and methods for treating central nervous system tumors |
IT1275862B1 (it) | 1995-03-03 | 1997-10-24 | Consiglio Nazionale Ricerche | Trascritto antisenso associato ad alcuni tipi di cellule tumorali ed oligodeossinucleotidi sintetici utili nella diagnosi e nel trattamento |
US6040296A (en) | 1995-06-07 | 2000-03-21 | East Carolina University | Specific antisense oligonucleotide composition & method for treatment of disorders associated with bronchoconstriction and lung inflammation |
FR2739029B1 (fr) | 1995-09-21 | 1997-11-21 | Roussel Uclaf | Nouvelle application therapeutique des composes antimineralo-corticoides |
WO1997014709A1 (en) | 1995-10-13 | 1997-04-24 | F. Hoffmann-La Roche Ag | Antisense oligomers |
WO1997019097A1 (en) | 1995-11-21 | 1997-05-29 | Icn Pharmaceuticals, Inc. | Inhibition of tumor growth by antisense oligonucleotides for il-8 and il-8 receptor |
AU1067697A (en) | 1995-12-05 | 1997-06-27 | Jouko Antero Oikarinen | Hsd17b1 promoter, enhancer, silencer and use thereof |
CN1215994A (zh) | 1996-02-15 | 1999-05-05 | 国家健康学会 | 对治疗rsv感染有效的rna酶l激活剂和反义寡核苷酸 |
US5955590A (en) | 1996-07-15 | 1999-09-21 | Worcester Foundation For Biomedical Research | Conjugates of minor groove DNA binders with antisense oligonucleotides |
US6046004A (en) | 1997-02-27 | 2000-04-04 | Lorne Park Research, Inc. | Solution hybridization of nucleic acids with antisense probes having modified backbones |
JPH1142091A (ja) | 1997-07-25 | 1999-02-16 | Toagosei Co Ltd | アンチセンス核酸化合物 |
US6391311B1 (en) | 1998-03-17 | 2002-05-21 | Genentech, Inc. | Polypeptides having homology to vascular endothelial cell growth factor and bone morphogenetic protein 1 |
CA2248762A1 (en) | 1997-10-22 | 1999-04-22 | University Technologies International, Inc. | Antisense oligodeoxynucleotides regulating expression of tnf-.alpha. |
NZ507435A (en) | 1998-03-10 | 2003-12-19 | Genentech Inc | Novel polypeptides and nucleic acids with homology to cornichon |
WO1999046279A2 (en) | 1998-03-11 | 1999-09-16 | Endorecherche, Inc. | INHIBITORS OF TYPE 5 AND TYPE 3 17β-HYDROXYSTEROID DEHYDROGENASE AND METHODS FOR THEIR USE |
US6007995A (en) | 1998-06-26 | 1999-12-28 | Isis Pharmaceuticals Inc. | Antisense inhibition of TNFR1 expression |
US6013522A (en) | 1999-02-23 | 2000-01-11 | Isis Pharmaceuticals Inc. | Antisense inhibition of human Smad1 expression |
US6025198A (en) | 1999-06-25 | 2000-02-15 | Isis Pharmaceuticals Inc. | Antisense modulation of Ship-2 expression |
US6033910A (en) | 1999-07-19 | 2000-03-07 | Isis Pharmaceuticals Inc. | Antisense inhibition of MAP kinase kinase 6 expression |
FR2801218B1 (fr) | 1999-11-23 | 2001-12-28 | Hoechst Marion Roussel Inc | Compositions pharmaceutiques comprenant de la trimegestone, leurs procedes de preparation ainsi que le conditionnement primaire les renfermant |
US7754709B2 (en) | 2003-06-10 | 2010-07-13 | Solvay Pharmaceuticals Bv | Tetracyclic thiophenepyrimidinone compounds as inhibitors of 17β hydroxysteroid dehydrogenase compounds |
US20090169585A1 (en) | 2003-10-23 | 2009-07-02 | Resveratrol Partners, Llc | Resveratrol-Containing Compositions And Their Use In Modulating Gene Product Concentration Or Activity |
US20050158376A1 (en) | 2003-10-23 | 2005-07-21 | Sardi William F. | Dietary supplement and method of processing same |
US20080299042A1 (en) | 2004-04-30 | 2008-12-04 | Biogen Idec Ma Inc. | Membrane Associated Molecules |
US7820380B2 (en) | 2004-05-07 | 2010-10-26 | Celera Corporation | Genetic polymorphisms associated with liver fibrosis |
FR2904000A1 (fr) | 2006-07-19 | 2008-01-25 | Galderma Res & Dev S N C Snc | Modulateurs de hsd17b7 dans le traitement de l'acne ou de l'hyperseborrhee |
US7951776B2 (en) | 2006-09-01 | 2011-05-31 | American Type Culture Collection | Methods for treatment of type 1 diabetes |
US20100267052A1 (en) | 2006-09-01 | 2010-10-21 | American Type Culture Collection | Compositions and methods for diagnosis and treatment of type 2 diabetes |
US20090203602A1 (en) | 2006-09-01 | 2009-08-13 | Cohava Gelber | Compositions and methods for diagnosis and treatment of type 2 diabetes |
US20080300170A1 (en) | 2006-09-01 | 2008-12-04 | Cohava Gelber | Compositions and methods for diagnosis and treatment for type 2 diabetes |
WO2008091873A2 (en) | 2007-01-24 | 2008-07-31 | Dana-Farber Cancer Institute, Inc. | Compositions and methods for the identification, assessment, prevention and therapy of thymic lymphoma or hamartomatous tumours |
EP2197434A4 (en) | 2007-09-20 | 2011-08-10 | Resveratrol Partners Llc | COMPOSITIONS CONTAINING RESVERATROL FOR MODULATING THE CONCENTRATION OR ACTIVITY OF A GENE PRODUCT |
US20110130442A1 (en) | 2008-06-04 | 2011-06-02 | Kyowa Hakko Kirin Co., Ltd. | Nucleic acid capable of controlling degranulation of mast cell |
US20100056384A1 (en) | 2008-09-04 | 2010-03-04 | Board Of Regents, The University Of Texas System | Sequence Variations in PNPLA3 Associated with Hepatic Steatosis |
US20100209427A1 (en) | 2008-09-24 | 2010-08-19 | Yu Li | Lysine acetylation sites |
EP2177615A1 (en) | 2008-10-10 | 2010-04-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for a genome wide identification of expression regulatory sequences and use of genes and molecules derived thereof for the diagnosis and therapy of metabolic and/or tumorous diseases |
WO2010064702A1 (ja) | 2008-12-05 | 2010-06-10 | 国立大学法人 東京大学 | 癌の予後を予測するためのバイオマーカー |
US20100266618A1 (en) | 2009-03-18 | 2010-10-21 | Children's Hospital Of Eastern Ontario Research Institute | Compositions and methods for augmenting activity of oncolytic viruses |
WO2010120526A2 (en) | 2009-03-31 | 2010-10-21 | Emory University | Methods and systems for screening for and diagnosing dna methylation associated with autism spectrum disorders |
US9051567B2 (en) | 2009-06-15 | 2015-06-09 | Tekmira Pharmaceuticals Corporation | Methods for increasing efficacy of lipid formulated siRNA |
RU2562868C2 (ru) | 2009-07-15 | 2015-09-10 | Кэлиммьюн Инк. | Двойной вектор для подавления вируса иммунодефицита человека |
WO2011006214A1 (en) | 2009-07-16 | 2011-01-20 | Peter Maccallum Cancer Institute | Method of detecting radiation exposure and adverse toxicity thereto |
JP2013511988A (ja) | 2009-11-25 | 2013-04-11 | ネステク ソシエテ アノニム | 過敏性腸症候群診断用の新規なゲノムバイオマーカー |
WO2011084747A2 (en) | 2009-12-21 | 2011-07-14 | The Johns Hopkins University | Compositions and methods for somatic tissue induced pluripotent stem cells having an endoderm origin |
CA2795901A1 (en) | 2010-04-12 | 2011-10-20 | University Health Network | Methods and compositions for diagnosing pulmonary fibrosis subtypes and assessing the risk of primary graft dysfunction after lung transplantation |
WO2011128096A1 (en) | 2010-04-16 | 2011-10-20 | Roche Diagnostics Gmbh | Polymorphism markers for predicting response to interleukin-6 receptor-inhibiting monoclonal antibody drug treatment |
AU2011253481A1 (en) | 2010-05-12 | 2013-01-10 | Steven E. Schutzer | Diagnostic markers for neuropsychiatric disease |
US8945847B2 (en) | 2010-05-24 | 2015-02-03 | Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. | Methods and kits for ascertaining biosafety of an agent |
US20120058088A1 (en) | 2010-06-28 | 2012-03-08 | Resveratrol Partners, Llc | Resveratrol-Containing Compositions And Methods Of Use |
EP2593566B1 (en) | 2010-07-14 | 2018-01-24 | The Regents of The University of California | Biomarkers for diagnosis of transient ischemic attacks |
WO2012031008A2 (en) | 2010-08-31 | 2012-03-08 | The General Hospital Corporation | Cancer-related biological materials in microvesicles |
WO2012052953A1 (en) | 2010-10-20 | 2012-04-26 | Fondazione Centro San Raffaele Del Monte Tabor | MiRNA |
US9617514B2 (en) | 2010-10-26 | 2017-04-11 | Buck Institute For Research On Aging | Downregulation of SINE/ALU retrotransposon transcription to induce or restore proliferative capacity and/or pluripotency to a stem cell |
US9920317B2 (en) | 2010-11-12 | 2018-03-20 | The General Hospital Corporation | Polycomb-associated non-coding RNAs |
CA2817256A1 (en) | 2010-11-12 | 2012-05-18 | The General Hospital Corporation | Polycomb-associated non-coding rnas |
WO2012070014A2 (en) | 2010-11-26 | 2012-05-31 | Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. | Identification of novel cell surface markers for pancreatic progenitor cells and definite endodermal cells |
WO2012080816A2 (en) | 2010-12-16 | 2012-06-21 | Norwegian University Of Science And Technology (Ntnu) | Single nucleotide polymorphism associated with risk of insulin resistance development |
EP2655621B1 (en) | 2010-12-20 | 2018-05-23 | The General Hospital Corporation | Polycomb-associated non-coding rnas |
WO2012151346A1 (en) | 2011-05-03 | 2012-11-08 | Dermachip Inc. | Expression signatures of genes and gene networks associated with skin aging |
GB201112246D0 (en) | 2011-07-15 | 2011-08-31 | Univ Birmingham | Diagnosis of alzheimer's disease |
US20130079241A1 (en) | 2011-09-15 | 2013-03-28 | Jianhua Luo | Methods for Diagnosing Prostate Cancer and Predicting Prostate Cancer Relapse |
WO2013126565A1 (en) | 2012-02-24 | 2013-08-29 | Lunyak Victoria V | Downregulation of sine/alu retrotransposon transcription to induce or restore proliferative capacity and/or pluripotency to a stem cell |
WO2013166264A2 (en) | 2012-05-02 | 2013-11-07 | University Of Georgia Research Foundation, Inc. | Methods for altering virus replication |
WO2013177060A2 (en) | 2012-05-20 | 2013-11-28 | Trustees Of Boston University | Methods and systems for monitoring, diagnosing, and treating chronic obstructive polmonary disease |
PE20190843A1 (es) | 2012-05-25 | 2019-06-17 | Emmanuelle Charpentier | Arn de direccion a adn generico |
EP2864791A2 (en) | 2012-06-20 | 2015-04-29 | Leibniz - Institut für Analytische Wissenschaften - ISAS - E.V. | Specific biomarkers for hepatocellular carcinoma (hcc) |
US20140004153A1 (en) | 2012-07-02 | 2014-01-02 | Lancell, L.L.C. | Use of somatic mutations in the extracellular domain of transmembrane proteins in a patient's tumor as immunogens for active humoral immunotherapy of cancer |
WO2014028946A2 (en) | 2012-08-17 | 2014-02-20 | The Broad Institute, Inc. | Modulators of hepatic lipoprotein metabolism |
WO2014049071A1 (en) | 2012-09-26 | 2014-04-03 | Tangent Reprofiling Limited | Modulators of androgen synthesis |
US9375433B2 (en) | 2012-09-26 | 2016-06-28 | Tangent Reprofiling Limited | Modulators of androgen synthesis |
ES2657608T3 (es) | 2012-12-05 | 2018-03-06 | Alnylam Pharmaceuticals, Inc. | Composiciones de arni de pcsk9 y métodos de uso de las mismas |
EP2929035A1 (en) | 2012-12-07 | 2015-10-14 | Shire Human Genetic Therapies, Inc. | Lipidic nanoparticles for mrna delivering |
EP2971174A4 (en) | 2013-03-14 | 2017-06-14 | Genomedx Biosciences Inc. | Cancer biomarkers and classifiers and uses thereof |
EP2970940B1 (en) | 2013-03-14 | 2018-07-25 | Translate Bio, Inc. | Mrna therapeutic compositions and use to treat diseases and disorders |
WO2014144564A2 (en) | 2013-03-15 | 2014-09-18 | Veracyte, Inc. | Biomarkers for diagnosis of lung diseases and methods of use thereof |
US20140329704A1 (en) | 2013-03-28 | 2014-11-06 | President And Fellows Of Harvard College | Markers for mature beta-cells and methods of using the same |
GB201306536D0 (en) | 2013-04-10 | 2013-05-22 | Gt Biolog Ltd | Polypeptide and immune modulation |
WO2014196957A1 (en) | 2013-06-03 | 2014-12-11 | Nestec Sa | Methods for diagnosing chronic valvular disease |
US9574241B2 (en) | 2013-06-03 | 2017-02-21 | The Trustees Of Columbia University In The City Of New York | Recurrent mutations in epigenetic regulators, RHOA and FYN kinase in peripheral T-cell lymphomas |
ES2767318T3 (es) | 2013-06-17 | 2020-06-17 | Broad Inst Inc | Suministro, modificación y optimización de sistemas, métodos y composiciones para generar modelos y actuar sobre enfermedades y trastornos de células posmitóticas |
DK3011031T3 (da) | 2013-06-17 | 2020-12-21 | Broad Inst Inc | Fremføring og anvendelse af crispr-cas-systemerne, vektorer og sammensætninger til levermålretning og -terapi |
US20150079062A1 (en) | 2013-07-12 | 2015-03-19 | Patrick J. Casey | Method for harvesting, processing, and storage of proteins from the mammalian feto-placental unit and use of such proteins in compositions and medical treatment |
CA2918114A1 (en) | 2013-07-12 | 2015-01-22 | Patrick J. Casey | Method for the harvesting, processing, and storage of proteins from the mammalian feto-placental unit and use of such proteins in compositions and medical treatment |
RU2545990C2 (ru) | 2013-07-16 | 2015-04-10 | Государственное бюджетное учреждение здравоохранения города Москвы Московский клинический научно-практический центр Департамента здравоохранения города Москвы | Способ дифференциальной диагностики стеатоза печени и стеатогепатита |
CN112618732A (zh) | 2013-10-22 | 2021-04-09 | 夏尔人类遗传性治疗公司 | 用于递送信使rna的脂质制剂 |
CN103520724B (zh) * | 2013-10-23 | 2016-05-25 | 江苏美迪森生物医药有限公司 | Hsd17b13蛋白或其编码基因的抑制剂的新用途 |
GB201320061D0 (en) | 2013-11-13 | 2013-12-25 | Electrophoretics Ltd | Materials nad methods for diagnosis and prognosis of liver cancer |
EP3139923B1 (en) | 2014-05-09 | 2023-09-27 | Tangent Reprofiling Limited | Composition for treating pancreatic adenocarcinoma |
EP3155116A4 (en) | 2014-06-10 | 2017-12-27 | Massachusetts Institute Of Technology | Method for gene editing |
US10588980B2 (en) | 2014-06-23 | 2020-03-17 | Novartis Ag | Fatty acids and their use in conjugation to biomolecules |
WO2016004387A1 (en) | 2014-07-02 | 2016-01-07 | H. Lee Moffitt Cancer Center And Research Institute, Inc. | Gene expression signature for cancer prognosis |
EP3169339A1 (en) | 2014-07-14 | 2017-05-24 | Patrick J. Casey | Method for the harvesting, processing, and storage of proteins from the mammalian feto-placental unit and use of such proteins in compositions and medical treatment |
WO2016028638A1 (en) | 2014-08-18 | 2016-02-25 | Drexel University | Methods, computer-readable media, and systems for assessing samples and wounds, predicting whether a wound will heal, and monitoring effectiveness of a treatment |
CN107206043A (zh) | 2014-11-05 | 2017-09-26 | 维拉赛特股份有限公司 | 使用机器学习和高维转录数据在经支气管活检上诊断特发性肺纤维化的系统和方法 |
WO2016130806A2 (en) | 2015-02-13 | 2016-08-18 | Alnylam Pharmaceuticals, Inc. | Patatin-like phospholipase domain containing 3 (pnpla3) irna compositions and methods of use thereof |
CN104698108B (zh) | 2015-03-26 | 2016-11-09 | 中国药科大学 | 一种利用固定化酶筛选I型17β羟类固醇脱氢酶抑制剂的方法 |
EP3350328A1 (en) | 2015-09-14 | 2018-07-25 | Alnylam Pharmaceuticals, Inc. | Polynucleotide agents targeting patatin-like phospholipase domain containing 3 (pnpla3) and methods of use thereof |
EP3159407A1 (en) | 2015-10-23 | 2017-04-26 | Silence Therapeutics (London) Ltd | Guide rnas, methods and uses |
EP3387129A1 (en) | 2015-12-10 | 2018-10-17 | Alnylam Pharmaceuticals, Inc. | STEROL REGULATORY ELEMENT BINDING PROTEIN (SREBP) CHAPERONE (SCAP) iRNA COMPOSITIONS AND METHODS OF USE THEREOF |
CA3005254A1 (en) | 2015-12-14 | 2017-06-22 | Cold Spring Harbor Laboratory | Compositions and methods for treatment of retinitis pigmentosa 18 and retinitis pigmentosa 13 |
CA3005246A1 (en) | 2015-12-14 | 2017-06-22 | Cold Spring Harbor Laboratory | Compositions and methods for treatment of central nervous system diseases |
JP7036723B2 (ja) | 2015-12-14 | 2022-03-15 | コールド スプリング ハーバー ラボラトリー | 眼疾患の処置のための組成物および方法 |
CA3005245A1 (en) | 2015-12-14 | 2017-06-22 | Cold Spring Harbor Laboratory | Antisense oligomers for treatment of alagille syndrome |
EP3390635A4 (en) | 2015-12-14 | 2019-05-01 | Cold Spring Harbor Laboratory | Antisense oligomers for the treatment of a tuberous sclerosis complex |
CA3005249A1 (en) | 2015-12-14 | 2017-06-22 | Cold Spring Harbor Laboratory | Compositions and methods for treatment of kidney diseases |
CA3005090A1 (en) | 2015-12-14 | 2017-06-22 | Cold Spring Harbor Laboratory | Compositions and methods for treatment of liver diseases |
WO2017156310A1 (en) | 2016-03-09 | 2017-09-14 | Molecular Stethoscope, Inc. | Methods and systems for detecting tissue conditions |
AU2017233034B2 (en) | 2016-03-16 | 2021-09-30 | Spogen Biotech Inc. | Methods for promoting plant health using free enzymes and microorganisms that overexpress enzymes |
US11078247B2 (en) | 2016-05-04 | 2021-08-03 | Curevac Ag | RNA encoding a therapeutic protein |
US10036024B2 (en) | 2016-06-03 | 2018-07-31 | Purdue Research Foundation | siRNA compositions that specifically downregulate expression of a variant of the PNPLA3 gene and methods of use thereof for treating a chronic liver disease or alcoholic liver disease (ALD) |
US10767175B2 (en) | 2016-06-08 | 2020-09-08 | Agilent Technologies, Inc. | High specificity genome editing using chemically modified guide RNAs |
GB201609977D0 (en) | 2016-06-08 | 2016-07-20 | Cancer Rec Tech Ltd | Chemosensitivity predictive biomarkers |
CN110291198A (zh) | 2016-12-08 | 2019-09-27 | 因特利亚治疗公司 | 经修饰的指导rna |
EP3551169A4 (en) | 2016-12-09 | 2020-09-09 | Sangamo Therapeutics, Inc. | ADMINISTRATION OF TARGET-SPECIFIC NUCLEASES |
CN110582302A (zh) | 2016-12-14 | 2019-12-17 | 利甘达尔股份有限公司 | 用于核酸和/或蛋白有效负载递送的组合物和方法 |
EP3571301A1 (en) | 2017-01-23 | 2019-11-27 | Regeneron Pharmaceuticals, Inc. | Hsd17b13 variants and uses thereof |
US20220090127A1 (en) | 2017-06-02 | 2022-03-24 | Institut National De La Sante Et De La Recherche Medicale (Inserm | Viral vector combining gene therapy and genome editing approaches for gene therapy of genetic disorders |
WO2019075181A1 (en) * | 2017-10-11 | 2019-04-18 | Regeneron Pharmaceuticals, Inc. | INHIBITION OF HSD17B13 IN THE TREATMENT OF HEPATIC DISEASE IN PATIENTS EXPRESSING PNPLA3 I148M VARIATION |
WO2019183164A1 (en) | 2018-03-21 | 2019-09-26 | Regeneron Pharmaceuticals, Inc. | 17β-HYDROXYSTEROID DEHYDROGENASE TYPE 13 (HSD17B13) iRNA COMPOSITIONS AND METHODS OF USE THEREOF |
CA3093547A1 (en) | 2018-03-21 | 2019-09-26 | Ionis Pharmaceuticals, Inc. | Modulation of hsd17b13 expression |
US11690921B2 (en) | 2018-05-18 | 2023-07-04 | Sangamo Therapeutics, Inc. | Delivery of target specific nucleases |
JP2021526804A (ja) | 2018-06-08 | 2021-10-11 | インテリア セラピューティクス,インコーポレイテッド | 遺伝子編集のための修飾されたガイドrna |
GB2596224B (en) | 2018-06-19 | 2022-09-07 | Univ Texas | Lipid nanoparticle compositions for delivery of mRNA and long nucleic acids |
MA56457A (fr) | 2019-07-02 | 2022-05-11 | Regeneron Pharma | Modulateurs de hsd17b13 et leurs procédés d'utilisation |
-
2018
- 2018-10-11 WO PCT/US2018/055377 patent/WO2019075181A1/en unknown
- 2018-10-11 CN CN201880065116.XA patent/CN111183234A/zh active Pending
- 2018-10-11 JP JP2020520550A patent/JP7434151B2/ja active Active
- 2018-10-11 RU RU2020115526A patent/RU2020115526A/ru unknown
- 2018-10-11 AU AU2018348195A patent/AU2018348195A1/en active Pending
- 2018-10-11 EP EP23160111.3A patent/EP4234719A3/en active Pending
- 2018-10-11 CA CA3078883A patent/CA3078883A1/en active Pending
- 2018-10-11 US US16/157,503 patent/US10961583B2/en active Active
- 2018-10-11 KR KR1020207013128A patent/KR20200062314A/ko active IP Right Grant
- 2018-10-11 MX MX2020003561A patent/MX2020003561A/es unknown
- 2018-10-11 SG SG11202003254SA patent/SG11202003254SA/en unknown
- 2018-10-11 EP EP18803806.1A patent/EP3695012B1/en active Active
-
2020
- 2020-03-24 IL IL273550A patent/IL273550A/en unknown
-
2021
- 2021-02-18 US US17/178,420 patent/US11702700B2/en active Active
-
2023
- 2023-05-30 US US18/325,500 patent/US20230383353A1/en active Pending
-
2024
- 2024-02-07 JP JP2024017035A patent/JP2024045454A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2018348195A1 (en) | 2020-04-23 |
CA3078883A1 (en) | 2019-04-18 |
US20230383353A1 (en) | 2023-11-30 |
MX2020003561A (es) | 2020-08-03 |
IL273550A (en) | 2020-05-31 |
CN111183234A (zh) | 2020-05-19 |
RU2020115526A3 (ko) | 2021-11-26 |
US20210246508A1 (en) | 2021-08-12 |
RU2020115526A (ru) | 2021-11-12 |
JP7434151B2 (ja) | 2024-02-20 |
US20190106749A1 (en) | 2019-04-11 |
EP4234719A2 (en) | 2023-08-30 |
JP2024045454A (ja) | 2024-04-02 |
EP3695012B1 (en) | 2023-03-08 |
JP2020536560A (ja) | 2020-12-17 |
SG11202003254SA (en) | 2020-05-28 |
EP4234719A3 (en) | 2023-10-18 |
EP3695012A1 (en) | 2020-08-19 |
US10961583B2 (en) | 2021-03-30 |
WO2019075181A1 (en) | 2019-04-18 |
US11702700B2 (en) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20200062314A (ko) | Pnpla3 i148m 변이를 발현하는 환자의 간 질환의 치료에서의 hsd17b13의 저해 | |
KR102657306B1 (ko) | 전립선암의 진단 및 치료에서 필라민을 포함하는 마커의 용도 | |
CA2566256C (en) | Genetic polymorphisms associated with liver fibrosis methods of detection and uses thereof | |
AU2023202663A1 (en) | Hydroxysteroid 17-beta dehydrogenase 13 (HSD17B13) variants and uses thereof | |
CN101874120B (zh) | 作为用于乳腺癌风险评估、诊断、预后和治疗的标记的chr2和chr16的遗传性变型 | |
CN101687050A (zh) | 用于鉴别原发起源不明的癌的起源的方法和材料 | |
TW201632629A (zh) | 用於癌症診斷與預後的方法 | |
KR20150023904A (ko) | 전립선암의 진단 및 치료에서의 마커의 용도 | |
KR102613599B1 (ko) | 뇌경색 발증 리스크 예측 방법 | |
KR20230124915A (ko) | 세포 사멸 유도 dffa 유사 이펙터 b(cideb) 억제제를 이용한 간 질환의 치료 | |
WO2015114146A1 (en) | Method for predicting the response to an anti-her2 containing therapy and/or chemotherapy in patients with breast cancer | |
WO2006022629A1 (en) | Methods of identifying risk of type ii diabetes and treatments thereof | |
CN102459645B (zh) | 作为前列腺癌标记的磷酸二酯酶9a | |
TW202309298A (zh) | 大動脈動脈粥樣硬化症的缺血性腦中風的發病時期預測方法 | |
DK2951317T3 (en) | PROCEDURE FOR PREDICTING THE BENEFIT OF INCLUSING TAXAN IN A CHEMOTHERAPY PLAN FOR BREAST CANCER PATIENTS | |
WO2006022633A1 (en) | Methods for identifying a risk of type ii diabetes and treatments thereof | |
AU2017209307A1 (en) | Compositions and methods for screening and identifying clinically aggressive prostate cancer | |
WO2006022638A1 (en) | Methods for identifying risk of type ii diabetes and treatments thereof | |
CN113825839A (zh) | 用固醇调节元件结合蛋白切割激活蛋白(scap)抑制剂治疗脂质水平升高 | |
KR101114033B1 (ko) | 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 분석방법 | |
CN114450591A (zh) | 基于确定fgfr的分类样本的方法 | |
US20090258344A1 (en) | Methods for identifying risk of breast cancer and treatments thereof | |
KR20050008644A (ko) | 위암에서의 유전자 발현 프로파일 | |
KR101090742B1 (ko) | Her-2 유전자를 이용한 폐암 감수성 진단용 마커 및 이를 이용한 폐암 감수성 진단 방법 | |
RU2812362C2 (ru) | Компонент 1 механочувствительного ионного канала пьезотипа (piezo1) и его применение |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) |