KR20230150973A - 폴리시스틴 발현과 관련된 병태 및 질환의 치료용 조성물 - Google Patents

폴리시스틴 발현과 관련된 병태 및 질환의 치료용 조성물 Download PDF

Info

Publication number
KR20230150973A
KR20230150973A KR1020237029596A KR20237029596A KR20230150973A KR 20230150973 A KR20230150973 A KR 20230150973A KR 1020237029596 A KR1020237029596 A KR 1020237029596A KR 20237029596 A KR20237029596 A KR 20237029596A KR 20230150973 A KR20230150973 A KR 20230150973A
Authority
KR
South Korea
Prior art keywords
nucleotides
mrna
agent
nucleobases
polycystin
Prior art date
Application number
KR1020237029596A
Other languages
English (en)
Inventor
이사벨 아즈나레즈
제이콥 알버트 카흐
Original Assignee
스톡 테라퓨틱스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 스톡 테라퓨틱스, 인크. filed Critical 스톡 테라퓨틱스, 인크.
Publication of KR20230150973A publication Critical patent/KR20230150973A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1138Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/313Phosphorodithioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/314Phosphoramidates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/315Phosphorothioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/3212'-O-R Modification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/3222'-R Modification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/11Protein-serine/threonine kinases (2.7.11)
    • C12Y207/11001Non-specific serine/threonine protein kinase (2.7.11.1), i.e. casein kinase or checkpoint kinase

Abstract

유전자의 대체 스플라이싱 이벤트는 비정상적인 단백질 발현을 초래할 수 있는 비-생산적인 mRNA 전사체로 이어질 수 있으며, 유전자의 대체 스플라이싱 이벤트를 표적으로 할 수 있는 치료제는 환자의 기능성 단백질의 발현 수준을 조절하고/하거나 비정상적인 단백질 발현을 억제할 수 있다. 이러한 치료제는 단백질 결핍에 의해 야기된 병태 또는 질환을 치료하는 데 사용될 수 있다.

Description

폴리시스틴 발현과 관련된 병태 및 질환의 치료용 조성물
상호 참조
본 출원은 2021년 2월 3일에 출원된 미국 가출원 제63/145,288호의 이익을 주장하며, 전체 내용이 참조로 본원에 포함된다.
서열 목록
본 출원은 ASCII 형식으로 전자적으로 제출된 서열 목록을 포함하며, 이는 전체 내용이 참고로 포함된다. 2022년 3월 11일에 생성된 해당 ASCII 복사본의 이름은 47991-732_601_SL.txt이고 크기는 331,023바이트이다.
유전자의 대체 스플라이싱 이벤트(alternative splicing event)는 비정상적인 단백질 발현을 초래할 수 있는 비-생산적인 mRNA 전사체로 이어질 수 있으며, 유전자의 대체 스플라이싱 이벤트를 표적으로 할 수 있는 치료제는 환자의 기능성 단백질의 발현 수준을 조절하고/하거나 비정상적인 단백질 발현을 억제할 수 있다. 이러한 치료제는 단백질 결핍에 의해 야기된 병태 또는 질환을 치료하는 데 사용될 수 있다.
특정 구현예에서, 표적 유전자로부터 전사되고 넌센스 매개 RNA 붕괴 유도 엑손(NMD 엑손)을 포함하는 프리-mRNA를 갖는 세포에서 표적 단백질의 발현을 조절하는 방법이 본원에 기재되어 있고, 방법은 제제 또는 제제를 인코딩하는 벡터를 세포에 접촉시켜, 제제는 프리-mRNA로부터 NMD 엑손의 스플라이싱을 조절함으로써, 프리-mRNA로부터 처리되는 프로세싱된 mRNA의 수준을 조절하는 단계, 및 세포에서 표적 단백질의 발현을 조절하는 단계로서, 표적 단백질은 PKD2 유전자에 의해 인코딩되는 단계를 포함한다.
특정 구현예에서, 대상체의 세포에서 표적 단백질의 발현을 조절함으로써 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되어 있고, 방법은 제제 또는 제제를 인코딩하는 벡터를 대상체의 세포에 접촉시켜, 제제는 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터의 넌센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 처리되는 프로세싱된 mRNA의 수준을 조절 단계, 및 세포에서 표적 단백질의 발현을 조절하는 단계로서, 표적 단백질은 PKD2 유전자에 의해 인코딩되는 단계를 포함한다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
일부 구현예에서, 질환 또는 병태는 폴리시스틴 2의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다. 일부 구현예에서, 질환 또는 병태는 폴리시스틴 1의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다.
일부 구현예에서, 질환 또는 병태는 폴리시스틴 2가 기능적으로 증강, 보상, 대체 또는 기능적으로 상호작용하는 단백질의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다.
일부 구현예에서, 제제는 (a) 프리-mRNA의 표적화 부분에 결합하고; (b) NMD 엑손의 스플라이싱에 관여하는 인자의 결합을 조절하거나; 또는 (c) (a)와 (b)의 조합이다.
일부 구현예에서, 제제는 NMD 엑손의 표적화 부분의 영역에 대한 스플라이싱에 관여하는 인자의 결합을 방해한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손에 근접한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 5' 말단의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 5' 5' 말단의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 3' 말단 다운스트림의 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 3' 말단 다운스트림의 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031085의 게놈 부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031085의 게놈 부위의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031140의 게놈 부위 다운스트림의 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031140의 게놈 부위 다운스트림의 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 프리-mRNA의 2개의 정규 엑손 영역 사이의 인트론 영역에 위치하고, 인트론 영역은 NMD 엑손을 함유한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손과 적어도 부분적으로 중첩된다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 업스트림 또는 다운스트림 인트론과 적어도 부분적으로 중첩된다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 5' NMD 엑손-인트론 접합부 또는 3' NMD 엑손-인트론 접합부를 포함한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손 내에 있다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 또는 그 초과 개의 연속 뉴클레오티드를 포함한다.
일부 구현예에서, NMD 엑손은 표 2에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80%, 적어도 90% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, NMD 엑손은 표 2에 열거된 서열로 이루어진 군으로부터 선택된 서열을 포함한다.
일부 구현예에서, 프리-mRNA는 표 2 또는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, 프리-mRNA는 표 2 또는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 유전자 서열에 의해 인코딩된다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 표 2 또는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고, ASO는 표 4에 열거된 서열로 이루어진 군으로부터 선택된 서열의 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 또는 18개의 연속 핵산에 대해 적어도 약 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성인 서열을 포함한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085-88031140 내에 있다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085-88031140의 업스트림 또는 다운스트림이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085 88031140의 엑손-인트론 접합부를 포함한다.
일부 구현예에서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 전장 폴리시스틴 2 또는 야생형 폴리시스틴 2이다.
일부 구현예에서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 야생형 폴리시스틴 2에 비해 적어도 부분적으로 기능적이다.
일부 구현예에서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 전장 야생형 폴리시스틴 2에 비해 적어도 부분적으로 기능적이다.
일부 구현예에서, 제제는 프리-mRNA로부터 NMD 엑손의 배제를 촉진함으로써, 프리-mRNA로부터 프로세싱되고 NMD 엑손이 결여된 프로세싱된 mRNA의 수준을 조절한다.
일부 구현예에서, 제제와 접촉된 세포에서 프리-mRNA로부터의 NMD 엑손의 배제는 대조군 세포에서 프리-mRNA로부터의 NMD 엑손의 배제에 비해 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다.
일부 구현예에서, 방법은 세포에서 프로세싱된 mRNA의 수준을 증가시킨다.
일부 구현예에서, 제제와 접촉된 세포에서 프로세싱된 mRNA의 수준은 대조군 세포에서 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다.
일부 구현예에서, 제제는 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 표적 단백질의 수준은 대조군 세포에서 생산된 표적 단백질의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다.
일부 구현예에서, NMD 엑손을 함유하는 프로세싱된 mRNA는 조기 종결 코돈(PTC)을 포함한다. 일부 구현예에서, 조기 종결 코돈(PTC)은 NMD 엑손의 다운스트림이다. 일부 구현예에서, NMD 엑손은 조기 종결 코돈(PTC)을 포함한다.
일부 구현예에서, 질환 또는 병태는 표적 유전자 또는 표적 단백질의 기능 상실 돌연변이와 연관된다.
일부 구현예에서, 질환 또는 병태는 표적 유전자의 반가불충분성과 연관되고, 대상체는 기능성 폴리시스틴 2를 인코딩하는 제1 대립유전자 및 폴리시스틴 2가 생산되지 않거나 감소된 수준으로 생산되는 제2 대립유전자, 또는 비기능성 폴리시스틴 2 또는 부분적 기능성 폴리시스틴 2를 인코딩하는 제2 대립유전자를 가지고 있다.
일부 구현예에서, 하나 또는 둘 모두의 대립유전자는 하이포모르프이거나 부분적으로 기능적이다.
일부 구현예에서, 질환 또는 병태는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 및 두개내 동맥류로 이루어진 군으로부터 선택된다.
일부 구현예에서, 질환 또는 병태는 PKD1 또는 PKD2 유전자의 돌연변이와 연관되며, 여기서 대상체는 제 (i) 표적 단백질은 생산되지 않거나 야생형 대립유전자에 비해 감소된 수준으로 생산되거나; 또는 (ii) 생산된 표적 단백질은 야생형 대립유전자에 비해 비기능적이거나 부분적으로 기능적인 제1 대립유전자 인코딩, 및 (iii) 표적 단백질은 야생형 대립유전자에 비해 감소된 수준으로 생산되고 생산된 표적 단백질은 야생형 대립유전자에 비해 적어도 부분적으로 기능적임; 또는 (iv) 생산된 표적 단백질은 야생형 대립유전자에 비해 부분적으로 기능적인 제2 대립유전자를 갖는다.
일부 구현예에서, 질환 또는 병태는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 및 두개내 동맥류로 이루어진 군으로부터 선택된다.
일부 구현예에서, 돌연변이는 하이포모르픽 돌연변이이다.
일부 구현예에서, 제제는 프리-mRNA로부터 NMD 엑손의 배제를 촉진함으로써, 프리-mRNA로부터 프로세싱되고 NMD 엑손이 결여된 프로세싱된 mRNA의 수준을 조절하고 세포의 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고 안티센스 올리고머는 포스포로티오에이트 연결 또는 포스포로디아미데이트 연결을 포함하는 백본 변형을 포함한다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 포스포로디아미데이트 모폴리노, 잠금 핵산, 펩티드 핵산, 2'-O-메틸, 2'-플루오로, 또는 2'-O-메톡시에틸 모이어티를 포함한다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고 안티센스 올리고머는 적어도 하나의 변형된 당 모이어티를 포함한다.
일부 구현예에서, 각각의 당 모이어티는 변형된 당 모이어티이다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 또는 12 내지 15개의 핵염기로 이루어진다.
일부 구현예에서, 제제가 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 프리-mRNA의 표적화 부분에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 상보적이다.
일부 구현예에서, 방법은 제제를 인코딩하는 벡터를 세포에 접촉시키는 것을 포함한다.
일부 구현예에서, 제제는 안티센스 올리고머를 포함하는 폴리뉴클레오티드이다.
일부 구현예에서, 벡터는 바이러스 벡터이다.
일부 구현예에서, 바이러스 벡터는 아데노바이러스 연관 바이러스 벡터이다.
일부 구현예에서, 폴리뉴클레오티드는 변형된 snRNA를 추가로 포함한다.
일부 구현예에서, 변형된 인간 snRNA는 변형된 U1 snRNA 또는 변형된 U7 snRNA이다.
일부 구현예에서, 변형된 인간 snRNA는 변형된 U7 snRNA이고 안티센스 올리고머는 표 4 또는 표 5에 열거된 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 갖는다.
일부 구현예에서, 표적 단백질의 프로세싱된 mRNA 수준 또는 발현 수준을 평가하는 것을 추가로 포함한다.
일부 구현예에서, 대상체는 인간이다.
한 구현예에서, 대상체는 비-인간 동물이다.
일부 구현예에서, 대상체는 태아, 배아 또는 아동이다.
일부 구현예에서, 세포는 생체 외의 것이다.
일부 구현예에서, 제제는 대상체의 척수강내 주사, 뇌실심내 주사, 복강내 주사, 근육내 주사, 피하 주사, 유리체내 또는 정맥내 주사에 의해 투여된다.
일부 구현예에서, 방법은 대상체에게 제2 치료제를 투여하는 것을 추가로 포함한다.
특정 구현예에서, 제2 치료제는 소분자이다.
일부 구현예에서, 제2 치료제는 안티센스 올리고머이다.
일부 구현예에서, 제2 치료제는 인트론 체류를 수정한다.
일부 구현예에서, 방법은 질환 또는 병태를 치료한다.
특정 구현예에서, 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터 넌센스 매개 RNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 프로세싱되는 프로세싱된 mRNA의 수준을 조절하고, 프리-mRNA를 갖는 세포에서 표적 단백질의 발현을 조절하는, 제제 또는 상기 제제를 인코딩하는 벡터를 포함하는 조성물로서, 표적 단백질은 PKD2 유전자에 의해 인코딩되는 조성물이 본원에 기재된다.
특정 구현예에서, 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터 넌센스 매개 RNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 프로세싱되는 프로세싱된 mRNA의 수준을 조절하고 대상체의 세포에서 표적 단백질의 발현을 조절함으로써 필요한 대상체에서 질환 또는 병태를 치료하는, 제제 또는 상기 제제를 인코딩하는 벡터를 포함하는 조성물로서, 표적 단백질은 PKD2 유전자에 의해 인코딩되는 조성물이 본원에 기재된다.
특정 구현예에서, 본원에 기재된 바와 같은 조성물; 및 약제학적으로 허용되는 부형제 및/또는 전달 비히클을 포함하는 약제학적 조성물이 본원에 기재된다.
특정 구현예에서, 넌센스 매개된 RNA 붕괴 대체 스플라이스 부위(NSASS) 조절제 또는 제제를 인코딩하는 바이러스 벡터를 포함하는 조성물이 본원에 기재되고, 제제는 표적 유전자로부터 전사되고 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하고, 프리-mRNA는 정규 5' 스플라이스-부위의 다운스트림에 대체 5' 스플라이스-부위를 포함하고, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산되는 프로세싱된 mRNA는 넌센스 매개 RNA 붕괴를 거치고, 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 조절하여 프리-mRNA의 프로세싱을 조절하고; 그리고 표적 유전자는 PKD2이다.
일부 구현예에서, 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 방지하거나 감소시킴으로써 프리-RNA의 프로세싱을 조절한다.
일부 구현예에서, 제제는 정규 5' 스플라이스-부위에서 스플라이싱을 촉진하거나 증가시킴으로써 프리-RNA의 프로세싱을 조절한다.
일부 구현예에서, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱을 조절하는 것은 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산된 프로세싱된 mRNA는 조기 종결 코돈(PTC)을 포함한다.
다양한 구현예에서, 제제는 소분자이다.
일부 구현예에서, 제제는 폴리펩티드이다.
일부 구현예에서, 폴리펩티드는 핵산 결합 단백질이다.
일부 구현예에서, 핵산 결합 단백질은 TAL-이펙터 또는 징크 핑거 결합 도메인을 함유한다.
일부 구현예에서, 핵산 결합 단백질은 Cas 계열 단백질이다.
일부 구현예에서, 폴리펩티드는 하나 이상의 핵산 분자와 동반되거나 복합화된다.
일부 구현예에서, 제제는 프리-mRNA의 표적화 영역에 상보적인 안티센스 올리고머(ASO)이다.
일부 구현예에서, 제제는 표적 단백질을 인코딩하는 프리-mRNA의 표적화 영역에 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 상보적이다.
일부 구현예에서, 제제는 포스포로티오에이트 연결 또는 포스포로디아미데이트 연결을 포함하는 백본 변형을 포함한다.
일부 구현예에서, 제제는 포스포로디아미데이트 모폴리노를 포함한다.
일부 구현예에서, 제제는 잠금 핵산을 포함한다.
일부 구현예에서, 제제는 펩티드 핵산을 포함한다.
일부 구현예에서, 제제는 2'-O-메틸을 포함한다.
일부 구현예에서, 제제는 2'-플루오로 또는 2'-O-메톡시에틸 모이어티를 포함한다.
일부 구현예에서, 제제는 적어도 하나의 변형된 당 모이어티를 포함한다.
일부 구현예에서, 각각의 당 모이어티는 변형된 당 모이어티이다.
일부 구현예에서, 제제는 안티센스 올리고머이고, 여기서 제제는 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 또는 12 내지 15개의 핵염기로 이루어진다.
일부 구현예에서, 조성물은 제제를 인코딩하는 벡터를 포함한다.
일부 구현예에서, 제제는 안티센스 올리고머를 포함하는 폴리뉴클레오티드이다.
일부 구현예에서, 벡터는 바이러스 벡터이다.
일부 구현예에서, 바이러스 벡터는 아데노바이러스 연관 바이러스 벡터이다.
일부 구현예에서, 폴리뉴클레오티드는 변형된 snRNA를 추가로 포함한다.
일부 구현예에서, 변형된 인간 snRNA는 변형된 U1 snRNA 또는 변형된 U7 snRNA이다.
일부 구현예에서, 변형된 인간 snRNA는 변형된 U7 snRNA이고 안티센스 올리고머는 표 4 또는 표 5에 열거된 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 갖는다.
특정 구현예에서, 본원에 기재된 바와 같은 조성물에 따른 제제를 인코딩하는 핵산 분자를 포함하는 조성물이 본원에 기재된다.
일부 구현예에서, 핵산 분자는 바이러스 전달 시스템에 통합된다.
일부 구현예에서, 바이러스 전달 시스템은 아데노바이러스 연관 벡터이다.
일부 구현예에서, 바이러스 벡터는 아데노바이러스 연관 바이러스 벡터이다.
특정 구현예에서, 표적 유전자로부터 전사되고 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하는 방법이 본원에 기재되고, 상기 방법은 넌센스 매개 RNA 붕괴 대체 스플라이스 부위(NSASS) 조절제 또는 제제를 인코딩하는 바이러스 벡터를 세포에 접촉시키는 것을 포함하고, 프리-mRNA는 정규 5' 스플라이스 부위의 다운스트림에 대체 5' 스플라이스-부위를 포함하고, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산되는 프로세싱된 mRNA는 넌센스 매개 RNA 붕괴를 거치고, 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 조절하여 표적 단백질의 발현을 조절함으로써 프리-mRNA의 프로세싱을 조절하고; 표적 유전자는 PKD2이다.
일부 구현예에서, 제제는 (a) 프리-mRNA의 표적화 부분에 결합하고; (b) 대체 5' 스플라이스-부위에서 스플라이싱에 관여하는 인자의 결합을 조절하거나; 또는 (c) (a)와 (b)의 조합이다.
일부 구현예에서, 제제는 대체 5' 스플라이스-부위에서 스플라이싱에 관여하는 인자가 표적화 부분의 영역에 결합하는 것을 방해한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에 근접한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 다운스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 다운스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4 88036480의 게놈 부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88036480의 게놈 부위의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88036480의 게놈 부위의 다운스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88036480의 게놈 부위의 다운스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 정규 5' 스플라이스-부위와 대체 5' 스플라이스-부위 사이의 영역에 위치한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에서 스플라이싱에 의해 연장된 엑손 영역에 위치한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위와 적어도 부분적으로 중첩된다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 업스트림 또는 다운스트림 영역과 적어도 부분적으로 중첩된다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에서 스플라이싱에 의해 연장된 엑손 영역 내에 있다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에서 스플라이싱에 의해 연장된 엑손 영역의 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 또는 그 초과 개의 연속 뉴클레오티드를 포함한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 2개의 정규 엑손 사이의 인트론 영역에 위치한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 2개의 정규 엑손 중 하나에 위치한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 인트론 및 정규 엑손 모두에 걸쳐 있는 영역에 위치한다.
일부 구현예에서, 세포 내 표적 단백질의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 프리-mRNA의 스플라이싱의 조정은 표적 단백질을 인코딩하는 프로세싱된 mRNA의 생산을 증가시킨다.
일부 구현예에서, 제제와 접촉된 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 표적 단백질은 단백질의 정규 동형이다.
일부 구현예에서, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산된 프로세싱된 mRNA는 조기 종결 코돈(PTC)을 포함한다.
일부 구현예에서, NSASS 조절제는 본원에 기재된 바와 같은 조성물이다.
특정 구현예에서, 본원에 기재된 바와 같은 조성물; 및 약제학적으로 허용되는 부형제 및/또는 전달 비히클을 포함하는 약제학적 조성물이 본원에 기재된다.
특정 구현예에서, 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되어 있고, 방법은 감소가 필요한 대상체에게 약제학적 조성물을 투여하는 것을 포함하고, 약제학적 조성물은 넌센스 매개된 RNA 붕괴 대체 스플라이스 부위(NSASS) 조절제 또는 이 제제를 인코딩하는 바이러스 벡터로서, 제제는 표적 유전자로부터 전사되고 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하고, 프리-mRNA는 정규 5' 스플라이스-부위의 다운스트림에 대체 5' 스플라이스-부위를 포함하고, 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱은 대안적으로 스플라이싱된 mRNA의 넌센스 매개된 RNA 붕괴를 초래하고, 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 조절하여 프리-mRNA의 프로세싱을 조절하고; 그리고 표적 유전자는 PKD2인, 바이러스 벡터 및 약제학적으로 허용되는 부형제를 포함한다.
특정 구현예에서, 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되어 있고, 방법은 본원에 기재된 약제학적 조성물을 대상체에게 투여하는 단계를 포함한다.
일부 구현예에서, 질환은 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 또는 두개내 동맥류로 이루어진 군으로부터 선택된다.
일부 구현예에서, 질환 또는 병태는 폴리시스틴 2 또는 폴리시스틴 1의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다.
일부 구현예에서, 질환 또는 병태는 폴리시스틴 2가 기능적으로 증강, 보상, 대체 또는 기능적으로 상호작용하는 단백질의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다.
일부 구현예에서, 질환 또는 병태는 표적 단백질의 결핍된 양 또는 활성에 의해 야기된다.
일부 구현예에서, 제제는 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준을 증가시킨다.
일부 구현예에서, 제제와 접촉된 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 제제는 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 세포 내 표적 단백질의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 표적 단백질의 mRNA 수준 또는 발현 수준을 평가하는 것을 추가로 포함한다.
일부 구현예에서, 방법은 질환과 연관된 적어도 하나의 유전적 돌연변이에 대해 대상체의 게놈을 평가하는 것을 추가로 포함한다.
일부 구현예에서, 적어도 하나의 유전적 돌연변이는 질환과 연관된 유전자의 유전자좌 내에 있다.
일부 구현예에서, 적어도 하나의 유전적 돌연변이는 질환과 연관된 유전자의 발현과 연관된 유전자좌 내에 있다.
일부 구현예에서, 적어도 하나의 유전적 돌연변이는 PKD2 유전자 좌 내에 있다.
일부 구현예에서, 적어도 하나의 유전적 돌연변이는 PKD2 유전자 발현과 연관된 유전자좌 내에 있다.
일부 구현예에서, 대상체는 인간이다.
한 구현예에서, 대상체는 비-인간 동물이다.
일부 구현예에서, 대상체는 태아, 배아 또는 아동이다.
일부 구현예에서, 세포 또는 세포들은 생체외, 또는 생체외 조직 또는 기관에 있다.
일부 구현예에서, 제제는 뇌심실내 주사, 복강내 주사, 근육내 주사, 척추강내 주사, 피하 주사, 경구 투여, 활막 주사, 유리체내 투여, 망막하 주사, 국소 적용, 이식, 또는 정맥내 주사에 의해 대상체에게 투여된다.
일부 구현예에서, 방법은 질환 또는 병태를 치료한다.
특정 구현예에서, 본원에 기재된 바와 같은 방법에 사용하기 위한 치료제가 본원에 기재된다.
특정 구현예에서, 본원에 기재된 바와 같은 치료제 및 약제학적으로 허용되는 부형제를 포함하는 약제학적 조성물이 본원에 기재된다.
특정 구현예에서, 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되고, 방법은 뇌심실내 주사, 복강내 주사, 근육내 주사, 척추강내 주사, 피하 주사, 경구 투여, 활막 주사, 유리체내 투여, 망막하 주사, 국소 적용, 이식, 또는 정맥내 주사에 의해 대상체에게 본원에 기재된 약제학적 조성물을 투여하는 것을 포함한다.
일부 구현예에서, 방법은 대상체를 치료한다.
특정 구현예에서, 폴리시스틴 2 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하는 프로세싱된 mRNA를 갖는 세포에서 폴리시스틴 2 단백질의 발현을 증가시키는 방법이 본원에 기재되고, 방ㅂ1ㅓㅂ은 제제 또는 이 제제를 인코딩하는 벡터를 세포에 접촉시키는 것을 포함하며, 제제는 번역 조절 요소의 구조를 조절함으로써 세포에서 폴리시스틴 2 단백질의 발현을 증가시킨다.
특정 구현예에서, 폴리시스틴 2 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하는 프로세싱된 mRNA를 갖는 세포에서 폴리시스틴 2 단백질의 발현을 증가시키는 방법이 본원에 기재되었고, 방법은 제제 또는 제제를 인코딩하는 벡터를 세포에 접촉시키는 단계, 이로써 세포에서 폴리시스틴 2 단백질의 발현을 증가하는 단계를 포함하며, 제제는 (a) 프로세싱된 mRNA의 표적화 부분에 결합하고; (b) 프로세싱된 mRNA의 번역에 관여하는 인자와 번역 조절 요소의 상호작용을 조절하거나; 또는 (c) (a)와 (b)의 조합이다.
특정 구현예에서, 세포에서 폴리시스틴 2 단백질의 발현을 조절하는 방법이 본원에 기재되고, 방법은 제제 또는 이 제제를 인코딩하는 벡터를 세포에 접촉시키는 것을 포함하며, 제제는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는 안티센스 올리고머를 포함한다.
특정 구현예에서, 제제 또는 이 제제를 인코딩하는 벡터를 포함하는 조성물이 본원에 기재되고, 제제는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는 안티센스 올리고머를 포함한다.
특정 구현예에서, 제제를 인코딩하는 벡터를 포함하는 조성물이 본원에 기재되고, 제제는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 다핵산을 포함한다.
특정 구현예에서, 제제를 포함하는 조성물이 본원에 기재되고, 제제는 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 표적화 부분에 결합하는 안티센스 올리고머를 포함하고, 프로세싱된 mRNA의 표적화 부분은 프로세싱된 mRNA의 주요 시작 코돈의 적어도 하나의 뉴클레오티드를 포함하고, 프로세싱된 mRNA의 5' UTR 내에 있다.
특정 구현예에서, 제제를 인코딩하는 벡터를 포함하는 조성물이 본원에 기재되고, 제제는 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 표적화 부분에 결합하는 서열을 포함하는 다핵산을 포함하고, 프로세싱된 mRNA의 표적화 부분은 프로세싱된 mRNA의 주요 시작 코돈의 적어도 하나의 뉴클레오티드를 포함하고, 프로세싱된 mRNA의 5' UTR 내에 있다.
특정 구현예에서, 제제를 포함하는 조성물이 본원에 기재되고, 제제는 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 번역 조절 요소의 구조를 조절함으로써 폴리시스틴 2 단백질의 발현을 증가시키고, 번역 조절 요소는 프로세싱된 mRNA의 번역을 억제한다.
특정 구현예에서, 제제를 인코딩하는 벡터를 포함하는 조성물이 본원에 기재되고, 제제는 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 번역 조절 요소의 구조를 조절함으로써 폴리시스틴 2 단백질의 발현을 증가시키고, 번역 조절 요소는 프로세싱된 mRNA의 번역을 억제한다.
특정 구현예에서, 제제를 포함하는 조성물이 본원에 기재되고, 제제는 세포에서 프로세싱된 mRNA의 번역을 증가시키고, 프로세싱된 mRNA는 폴리시스틴 2 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하고, 제제는 번역 조절 요소의 구조를 조절함으로써 번역 효율성 및/또는 프로세싱된 mRNA의 번역 속도를 증가시키고, 제제는 (a) 프로세싱된 mRNA의 표적화 부분에 결합하고; (b) 프로세싱된 mRNA의 번역에 관여하는 인자와 번역 조절 요소의 상호작용을 조절하거나; 또는 (c) (a)와 (b)의 조합이다.
특정 구현예에서, 제제를 인코딩하는 벡터를 포함하는 조성물이 본원에 기재되고, 제제는 세포에서 프로세싱된 mRNA의 번역을 증가시키고, 프로세싱된 mRNA는 폴리시스틴 2 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하고, 제제는 번역 조절 요소의 구조를 조절함으로써 번역 효율성 및/또는 프로세싱된 mRNA의 번역 속도를 증가시키고, 제제는 (a) 프로세싱된 mRNA의 표적화 부분에 결합하고; (b) 프로세싱된 mRNA의 번역에 관여하는 인자와 번역 조절 요소의 상호작용을 조절하거나; 또는 (c) (a)와 (b)의 조합이다.
특정 구현예에서, 표적 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하는 프로세싱된 mRNA를 갖는 세포에서 표적 단백질의 발현을 증가시키는 방법이 본 명세서 기재되고, 방법은 세포 내로 (1) 제1 제제 또는 이 제1 제제를 인코딩하는 제1 핵산 서열, 및 (2) 제2 제제 또는 이 제2 제제를 인코딩하는 제2 핵산 서열을 전달하는 단계 및 이로써 세포에서 표적 단백질의 발현을 증가시키는 단계를 포함하며, 제1 제제는 표적 단백질을 인코딩하는 표적 유전자로부터 전사되는 프리-mRNA의 스플라이싱을 조절하고, 제2 제제는 표적 단백질을 인코딩하는 프로세싱된 mRNA의 번역 조절 요소의 구조를 조절하며, 표적 단백질은 폴리시스틴 2이다.
특정 구현예에서, 표적 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하는 프로세싱된 mRNA를 갖는 세포에서 표적 단백질의 발현을 증가시키는 방법이 본 명세서 기재되고, 방법은 세포 내로 (1) 제1 제제 또는 이 제1 제제를 인코딩하는 제1 핵산 서열, 및 (2) 제2 제제 또는 이 제2 제제를 인코딩하는 제2 핵산 서열을 전달하는 단계, 이로써 세포에서 표적 단백질의 발현을 증가시키는 단계를 포함하며, 제1 제제는 표적 단백질을 인코딩하는 표적 유전자로부터 전사되는 프리-mRNA의 스플라이싱을 조절하고, 제2 제제는 (a) 프로세싱된 mRNA의 표적 부분에 결합하고; (b) 프로세싱된 mRNA의 번역에 관여하는 인자와 번역 조절 요소의 상호작용을 조절하는 제2 제제; 또는 (c) (a)와 (b)의 조합이며, 표적 단백질은 폴리시스틴 2이다. 일부 구현예에서, 제제는 번역 조절 요소의 구조를 조절한다. 일부 구현예에서, 제제는 (a) 프로세싱된 mRNA의 표적화 부분에 결합하고; (b) 프로세싱된 mRNA의 번역에 관여하는 인자와 번역 조절 요소의 상호작용을 조절하거나; 또는 (c) (a)와 (b)의 조합이다. 일부 구현예에서, 번역 조절 요소는 프로세싱된 mRNA의 5' 비번역 영역(5' UTR)에 있다. 일부 구현예에서, 번역 조절 요소는 프로세싱된 mRNA의 5' UTR의 적어도 일부를 포함한다. 일부 구현예에서, 번역 조절 요소는 프로세싱된 mRNA의 주요 시작 코돈의 적어도 하나의 뉴클레오티드와의 염기쌍 형성을 수반하는 이차 mRNA 구조를 포함한다. 일부 구현예에서, 제제는 프로세싱된 mRNA의 주요 시작 코돈의 적어도 하나의 뉴클레오티드와의 염기쌍 형성을 억제한다. 일부 구현예에서, mRNA 이차 구조는 스템, 스템 루프, 구아닌 사중체, 또는 이들의 임의의 조합을 포함한다. 일부 구현예에서, 제제는 주요 시작 코돈에 결합하지 않는다. 일부 구현예에서, 제제는 주요 시작 코돈의 적어도 하나의 뉴클레오티드에 결합한다. 일부 구현예에서, 제제는 프로세싱된 mRNA의 주요 시작 코돈의 적어도 하나의 뉴클레오티드를 포함하는 이차 mRNA 구조의 형성을 억제하거나 감소시킨다. 일부 구현예에서, 제제는 프로세싱된 mRNA의 주요 시작 코돈의 적어도 하나의 뉴클레오티드와 프로세싱된 mRNA의 또 다른 뉴클레오티드과의 염기쌍 형성을 억제하거나 감시시킬 수 있고, 임의로 또 다른 뉴클레오티드는 프로세싱된 mRNA의 5' UTR의 또 다른 뉴클레오티드이다. 일부 구현예에서, 번역 조절 요소는 업스트림 열린 해독틀(uORF)의 적어도 일부를 포함한다. 일부 구현예에서, 제제는 uORF의 적어도 일부를 수반하는 이차 mRNA 구조의 형성을 촉진한다. 일부 구현예에서, 번역 조절 요소는 업스트림 시작 코돈을 포함한다. 일부 구현예에서, 제제는 업스트림 시작 코돈의 적어도 하나의 뉴클레오티드와의 염기쌍 형성을 수반하는 이차 mRNA 구조의 형성을 촉진한다. 일부 구현예에서, 제제는 업스트림 시작 코돈에 결합하지 않는다. 일부 구현예에서, 제제는 업스트림 시작 코돈에 결합한다. 일부 구현예에서, 제제는 업스트림 시작 코돈의 적어도 하나의 뉴클레오티드를 포함하는 이차 mRNA 구조의 형성을 촉진하거나 증가시킨다. 일부 구현예에서, 제제는 업스트림 시작 코돈의 적어도 하나의 뉴클레오티드와 프로세싱된 mRNA의 또 다른 뉴클레오티드와의 염기쌍 형성을 촉진하거나 증가시키고, 임의로 또 다른 뉴클레오티드는 프로세싱된 mRNA의 5' UTR의 또 다른 뉴클레오티드이다. 일부 구현예에서, 번역 조절 요소는 프로세싱된 mRNA의 G 풍부 서열에 의해 형성된 구아닌 사중체를 포함한다. 일부 구현예에서, 제제는 구아닌 사중체의 형성을 억제한다. 일부 구현예에서, G 풍부 서열은 프로세싱된 mRNA의 5' 비번역 영역(5' UTR)의 적어도 일부를 포함한다. 일부 구현예에서, G 풍부 서열은 프로세싱된 mRNA의 5' 비번역 영역(5' UTR)에 존재한다. 일부 구현예에서, G 풍부 서열은 식 Gx-N1-7-Gx-N1-7-Gx-N1-7-Gx(서열번호: 227)에 따른 서열을 포함하며, 여기서 x ≥ 3이고 N은 A, C, G 또는 U이다. 일부 구현예에서, G 풍부 서열은 서열 GGGAGCCGGGCUGGGGCUCACACGGGGG(서열번호: 228)를 포함한다. 일부 구현예에서, Gx 서열의 적어도 1개, 2개, 3개 또는 4개 모두는 구조화되거나, 이차 구조로 존재하거나, 또 다른 뉴클레오티드와 염기 쌍을 이루며, 임의로 또 다른 뉴클레오티드는 C 또는 U이다. 일부 구현예에서, 제제는 구아닌 사중체를 완화하거나, 변형을 촉진하거나, 형성을 억제 또는 감소시킨다. 일부 구현예에서, 제제는 구아닌 사중체의 Gx 서열 중 적어도 1개, 2개, 3개 또는 4개 모두의 염기쌍 형성 또는 구조를 완화하거나, 변형을 촉진하거나, 억제 또는 감소시킨다. 일부 구현예에서, 프로세싱된 mRNA의 표적화 부분은 프로세싱된 mRNA의 5' UTR 내에 있다. 일부 구현예에서, 프로세싱된 mRNA의 표적화 부분은 표 3의 서열로 이루어진 군으로부터 선택된 서열의 적어도 8개의 연속 뉴클레오티드에 대해 적어도 80% 서열 동일성을 갖는 서열을 갖는다. 일부 구현예에서, 프로세싱된 mRNA의 표적화 부분은 프로세싱된 mRNA의 주요 시작 코돈으로부터 바로 다운스트림인 코돈의 업스트림에 적어도 하나의 뉴클레오티드를 포함한다. 일부 구현예에서, 프로세싱된 mRNA의 표적화 부분은 프로세싱된 mRNA의 주요 시작 코돈의 업스트림에 있는 적어도 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 150, 160, 180, 또는 200개의 뉴클레오티드이다. 일부 구현예에서, 프로세싱된 mRNA의 표적화 부분은 주요 시작 코돈의 업스트림에 있는 약 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 150, 160, 180, 200, 또는 220개의 뉴클레오티드이다. 일부 구현예에서, 프로세싱된 mRNA는 표 3의 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는 서열을 갖는다. 일부 구현예에서, 제제는 안티센스 올리고머를 포함한다. 일부 구현예에서, 안티센스 올리고머는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는다. 일부 구현예에서, 번역 조절 요소는 프로세싱된 mRNA의 번역 효율 및/또는 번역 속도를 억제함으로써 프로세싱된 mRNA의 번역을 억제한다. 일부 구현예에서, 제제는 프로세싱된 mRNA의 번역 효율 및/또는 번역 속도를 증가시킴으로써 세포에서 폴리시스틴 2 단백질의 발현을 증가시킨다. 일부 구현예에서, 안티센스 올리고머는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 약 100% 서열 동일성을 갖는다. 일부 구현예에서, 안티센스 올리고머는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는다. 일부 구현예에서, 안티센스 올리고머는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 약 100% 서열 동일성을 갖는다. 일부 구현예에서, 제제는 프로세싱된 mRNA의 번역을 조절하는 하나 이상의 인자의 결합을 조절한다. 일부 구현예에서, 안티센스 올리고머는 포스포로티오에이트 연결 또는 포스포로디아미데이트 연결을 포함하는 백본 변형을 포함한다. 일부 구현예에서, 안티센스 올리고머는 포스포로디아미데이트 모폴리노, 잠금 핵산, 펩티드 핵산, 2'-O-메틸 모이어티, 2'-플루오로 모이어티, 또는 2'-O-메톡시에틸 모이어티를 포함한다. 일부 구현예에서, 안티센스 올리고머는 적어도 하나의 변형된 당 모이어티를 포함한다. 일부 구현예에서, 각각의 당 모이어티는 변형된 당 모이어티이다. 일부 구현예에서, 안티센스 올리고머는 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 또는 12 내지 15개의 핵염기로 이루어진다. 일부 구현예에서, 벡터는 제제를 인코딩하는 바이러스 벡터를 포함한다. 일부 구현예에서, 바이러스 벡터는 아데노바이러스 벡터, 아데노 연관 바이러스 (AAV) 벡터, 렌티바이러스 벡터, 단순 포진 바이러스 (HSV) 바이러스 벡터, 또는 레트로바이러스 벡터를 포함한다. 일부 구현예에서, 제제는 세포 침투 펩티드를 추가로 포함한다. 일부 구현예에서, 제제는 안티센스 올리고머에 접합된 세포 침투 펩티드를 포함한다. 일부 구현예에서, 안티센스 올리고머는 포스포로디아미데이트 모폴리노 올리고머이다. 일부 구현예에서, 제제는 유전자 편집 분자 또는 게놈 편집 분자를 인코딩하는 폴리뉴클레오티드를 포함한다. 일부 구현예에서, 제제는 (i) 프로세싱된 mRNA 전사체, (ii) 프로세싱된 mRNA 전사체가 프로세싱된 프리-mRNA, 또는 (iii) 프리-mRNA를 인코딩하는 유전자의 표적 모티프에 결합하는 다핵산 폴리머를 포함한다. 일부 구현예에서, 유전자 편집 분자는 CRISPR-Cas9 또는 이의 기능성 등가물, 및/또는 (i) 프로세싱된 mRNA 전사체, (ii) 프로세싱된 mRNA 전사체가 프로세싱된 프리-mRNA, 또는 (iii) 프리-mRNA를 인코딩하는 유전자의 표적 모티프에 결합하는 다핵산 폴리머를 포함한다. 일부 구현예에서, 표적 모티프에 결합하는 다핵산 폴리머는 가이드 RNA(gRNA)를 포함한다. 일부 구현예에서, 제제는 세포에서 폴리시스틴 2 단백질의 발현을 증가시킨다. 일부 구현예에서, 세포에서 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 번역 효율 및/또는 번역 속도가 증가된다. 일부 구현예에서, 제제 또는 이 제제를 인코딩하는 벡터와 접촉된 세포에서 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 번역 효율 및/또는 번역 속도는 제제 또는 이 제제를 인코딩하는 벡터와 접촉하지 않은 대조군 세포에서 프로세싱된 mRNA의 번역 효율 및/또는 번역 속도에 비해 증가된다. 일부 구현예에서, 제제 또는 이 제제를 인코딩하는 벡터와 접촉한 세포에서 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 번역 효율 및/또는 번역 속도는 제제 또는 이 제제를 인코딩하는 벡터와 접촉하지 않은 대조군 세포에서 프로세싱된 mRNA의 번역 효율 및/또는 번역 속도와 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다. 일부 구현예에서, 제제 또는 이 제제를 인코딩하는 벡터와 접촉한 세포에서 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 번역 효율 및/또는 번역 속도는 제제의 부재와 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다. 일부 구현예에서, 제제 또는 이 제제를 인코딩하는 벡터와 접촉된 세포에서 발현된 폴리시스틴 2 단백질의 수준은 제제 또는 이 제제를 인코딩하는 벡터와 접촉하지 않은 대조군 세포에서 폴리시스틴 2 단백질의 수준과 비교하여 증가된다. 일부 구현예에서, 제제 또는 이 제제를 인코딩하는 벡터와 접촉된 세포에서 발현되는 폴리시스틴 2 단백질의 수준은 제제 또는 이 제제를 인코딩하는 벡터와 접촉하지 않은 대조군 세포에서 폴리시스틴 2 단백질의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다. 일부 구현예에서, 제제 또는 이 제제를 인코딩하는 벡터와 접촉된 세포에서 발현되는 폴리시스틴 2 단백질의 수준은 제제의 부재와 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다. 일부 구현예에서, 프로세싱된 mRNA로부터 번역된 폴리시스틴 2 단백질은 기능성 폴리시스틴 2 단백질이다. 일부 구현예에서, 폴리시스틴 2 단백질은 완전히 기능적이다. 일부 구현예에서, 프로세싱된 mRNA로부터 번역된 폴리시스틴 2 단백질은 야생형 폴리시스틴 2 단백질이다. 일부 구현예에서, 프로세싱된 mRNA로부터 번역된 폴리시스틴 2 단백질은 전장 폴리시스틴 2 단백질이다. 일부 구현예에서, 프로세싱된 mRNA 전사체는 돌연변이체 프로세싱된 mRNA 전사체이다. 일부 구현예에서, 프로세싱된 mRNA 전사체는 돌연변이체 프로세싱된 mRNA 전사체가 아니다. 일부 구현예에서, 프로세싱된 mRNA는 돌연변이체 프리-mRNA인 프리-mRNA로부터 프로세싱된다. 일부 구현예에서, 프로세싱된 mRNA는 돌연변이체 프리-mRNA가 아닌 프리-mRNA로부터 프로세싱된다. 일부 구현예에서, 제제는 치료제이다.
일부 구현예에서, 세포에서 발현되는 표적 단백질의 수준은 (1) 제1 제제 또는 이 제1 제제를 인코딩하는 제1 핵산 서열, 및 (2) 제2 제제 또는 이 제2 제제를 인코딩하는 제2 핵산 서열의 전달에 의해 증가된다. 일부 구현예에서, 세포에서 발현되는 표적 단백질의 수준은 대조군 세포에 비해 증가된다. 일부 구현예에서, 대조군 세포는 제1 제제와 접촉하지 않고 제2 제제와 접촉하지 않은 세포이거나, 또는 여기서 대조군 세포는 제1 제제를 인코딩하는 제1 핵산 서열이 전달되지 않았고 제2 제제를 인코딩하는 제2 핵산 서열이 전달되지 않은 세포이다. 일부 구현예에서, 대조군 세포는 제1 제제와 접촉하지 않고 제2 제제와 접촉하지 않은 세포이거나, 또는 여기서 대조군 세포는 제1 제제를 인코딩하는 제1 핵산 서열이 전달되었고 제2 제제를 인코딩하는 제2 핵산 서열이 전달된 세포이다. 일부 구현예에서, 대조군 세포는 제2 제제와 접촉하지 않고 제1 제제와 접촉하지 않은 세포이거나, 또는 여기서 대조군 세포는 제2 제제를 인코딩하는 제2 핵산 서열이 전달되었고 제1 제제를 인코딩하는 제1 핵산 서열이 전달된 세포이다. 일부 구현예에서, 세포에서 발현되는 표적 단백질의 수준은 대조군 세포와 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다. 일부 구현예에서, (1) 제1 제제 또는 이 제1 제제를 인코딩하는 제1 핵산 서열, 및 (2) 제2 제제 또는 이 제2 제제를 인코딩하는 제2 핵산 서열이 전달되는 세포에서 발현되는 표적 단백질의 수준은 제1 제제 또는 제2 제제의 부재와 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다. 일부 구현예에서, 일부 구현예에서, (1) 제1 제제 또는 이 제1 제제를 인코딩하는 제1 핵산 서열, 및 (2) 제2 제제 또는 이 제2 제제를 인코딩하는 제2 핵산 서열이 전달되는 세포에서 발현되는 표적 단백질의 수준은 제1 제제 또는 제2 제제의 부재와 비교하여 적어도 약 1.5배까지 증가된다.
또한 본원에 개시된 치료제 및 약제학적으로 허용되는 담체 또는 부형제를 포함하는 약제학적 조성물이 본원에 제공된다.
또한 본원에 개시된 치료제를 인코딩하는 벡터 및 약제학적으로 허용되는 담체 또는 부형제를 포함하는 약제학적 조성물이 본원에 제공된다.
또한 본원에 개시된 조성물 및 약제학적으로 허용되는 담체 또는 부형제를 포함하는 약제학적 조성물이 본원에 제공된다.
참고에 의한 포함
본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은 각각의 개별 간행물, 특허 또는 특허 출원이 구체적이고 개별적으로 참고로 포함되는 것으로 표시된 것과 동일한 정도로 본원에 참조로 포함된다.
본 발명의 새로운 특징은 특히 첨부된 청구범위에 기재되어 있다. 본 발명의 특징 및 장점에 대한 더 나은 이해는 본 발명의 원리가 활용되는 예시적인 구현예를 설명하는 다음의 상세한 설명 및 첨부된 도면을 참조함으로써 얻어질 것이다:
도 1a도 1b는 넌센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손) 및 기능성 RNA 또는 전장 표적 단백질의 발현을 증가시키기 위한 넌센스 매개 mRNA 붕괴 유도 엑손의 치료제 매개 배제를 함유하는 표적 프리-mRNA의 도식적 표현을 도시한다. 도 1a는 핵 구획과 세포질 구획으로 나누어진 세포를 보여준다. 핵에서, 표적 유전자의 프리-mRNA 전사체는 스플라이싱을 거쳐 mRNA를 생성하고, 이 mRNA는 세포질로 내보내지고 표적 단백질로 번역된다. 이 표적 유전자의 경우, mRNA의 일부 분획에는 세포질에서 분해되는 넌센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손 mRNA)이 함유되어 있어 표적 단백질 생산이 이루어지지 않는다. 도 1b는 핵 및 세포질 구획으로 나누어진 동일한 세포의 예를 보여준다. 안티센스 올리고머(ASO)와 같은 치료제로 치료하면 넌센스 매개 mRNA 붕괴 유도 엑손의 배제를 촉진하고 기능적(생산적) mRNA를 증가시키고, 이는 더 높은 수준의 표적 단백질로 번역된다.
도 2PKD2 NMD(넌센스 매개 mRNA 붕괴) 유도 엑손 포함 이벤트를 도시한다. NMD 유도 엑손 포함 이벤트: NMD 유도 엑손 포함 이벤트(chr4:88031085-88031140)를 함유하는 PKD2 유전자(엑손은 직사각형이고 인트론은 화살촉이 있는 선) 영역의 UCSC 게놈 브라우저 스냅샷은 음영 영역과 상단의 검은색 막대로 표시된다. 4개의 대표적인 인간 신장 샘플 및 사이클로헥시미드(CHX) 또는 DMSO 대조군으로 처리된 혼합 신장 상피 세포의 RNA 시퀀싱 흔적이 표시된다.
도 3PKD2 NMD 유도 alt 5'ss 이벤트를 도시한다. NMD 유도 alt 5'ss의 이벤트: NMD 유도 대체 5' 스플라이스 부위 이벤트(chr4:88036355-88036480)를 함유하는 PKD2 유전자(엑손은 직사각형이고 인트론은 화살촉이 있는 선) 영역의 UCSC 게놈 브라우저 스냅샷은 음영 영역과 상단의 검은색 막대로 표시된다. 4개의 대표적인 인간 신장 샘플 및 사이클로헥시미드(CHX) 또는 DMSO 대조군으로 처리된 혼합 신장 상피 세포의 RNA 시퀀싱 흔적이 표시된다. *alt_5 ss는 대체 5' 스플라이스 부위를 지칭한다.
도 4a 내지 도 4c는 NMD 유도 이벤트의 검정을 도시한다. 도 4a는 NMD 유도 엑손(chr4 88031085 88031140) 이벤트의 도식적 표현을 보여준다. 도 4b는 대체 5' 스플라이스 부위(Alt 5'ss)(chr4 88036354 88036480) 이벤트의 도식적 표현을 보여준다. *alt_5 ss는 대체 5' 스플라이스 부위를 지칭한다. 이 예에서, 대체 5' 스플라이스-부위(alt 5' ss)에서 스플라이싱으로 인해 생성된 엑손은 정규 엑손 3 (검은색 막대) 외에 대체 5' 스플라이스-부위(회색 막대)에서 스플라이싱에 의해 연장된 엑손 영역을 함유하고, 따라서 해당 정규 엑손 3(검은색 막대)보다 길다. 일관되게 대체 5' 스플라이스-부위(alt 5' ss)에서 스플라이싱으로 인한 인트론은 해당 정규 인트론 3보다 짧다. 도 4c는 DMSO(-) 또는 시클로헥시미드(CHX)(+)로 처리된 인간 신장 혼합 상피 세포 및 인간 신장 피질 상피 세포로부터의 RNA를 사용한 RT-PCR을 보여준다. 프라이머는 엑손 2와 4에 위치하였다.
도 5는 NMD 엑손 포함 이벤트에 대한 ASO 워크 디자인(walk design)을 도시한다. 음영 처리된 뉴클레오티드는 NMD 유도 엑손 2X에 해당한다. 도 5는 출현 순서대로 각각 서열 번호 263-265를 개시한다.
도 6a 및 6b는 Alt 5'ss 이벤트에 대한 ASO 워크 디자인을 도시한다. 음영 처리된 뉴클레오티드는 표시된 Alt 5'ss의 선택으로 인해 발생하는 연장된 엑손 3의 일부에 해당한다. *alt_5 ss는 대체 5' 스플라이스 부위를 지칭한다. 도 6은 출현 순서대로 각각 서열 번호 266-270를 개시한다.
도 7a는 80nM에서 표시된 ASO로 24시간 동안 형질감염된 일차 신장 혼합 상피 세포를 사용하여 생산적인 PKD2 mRNA의 변화를 도시한다(도 6a 및 6b의 매크로워크 참조).
도 7b는 80nM에서 표시된 ASO로 24시간 동안 형질감염된 일차 신장 혼합 상피 세포를 사용하여 비생산적인 PKD2 mRNA의 변화를 도시한다(도 6a 및 6b의 매크로워크 참조).
도 8a는 80nM에서 표시된 ASO로 24시간 동안 형질감염된 일차 신장 혼합 상피 세포를 사용하여 생산적인 PKD2 mRNA의 변화를 도시한다(도 5의 매크로워크 참조).
도 8b는 80nM에서 표시된 ASO로 24시간 동안 형질감염된 일차 신장 혼합 상피 세포를 사용하여 비생산적인 PKD2 mRNA의 변화를 도시한다(도 5의 매크로워크 참조).
도 9a 내지 도 9e는 생산적인 mRNA 및 단백질 생산을 증가시키기 위해 2개의 이벤트를 표적으로 하는 ASO를 예시한다. 도 9a는 비생산적 엑손 포함 NMD 이벤트 활용에 대한 ASO 조합의 효과를 도시한다. 도 9b는 ASO 조합을 사용한 EX2-EX3 생산적인 mRNA의 발현을 도시한다. 도 9c는 비생산적인 대체 5'ss NMD 이벤트 활용에 대한 ASO 조합의 효과를 도시한다. 도 9d는 ASO 조합을 사용한 EX3-EX4 생산적인 mRNA의 발현을 도시한다. 도 9e는 ASO 조합으로 처리한 후 폴리시스틴 2(PKD2) 단백질 웨스턴 블롯의 정량화를 도시한다.
도 10은 PKD2의 업스트림 열린 해독틀 매크로워크를 예시한다. 음영 처리된 뉴클레오티드는 각각 업스트림 열린 해독틀과 표준 시작 코돈에 해당한다. 도10은 서열번호: 271을 개시한다.
다양한 구현예에 대한 철저한 이해를 제공하기 위해 이 설명의 특정 세부 사항이 제시된다. 그러나, 당업자는 본 발명이 이러한 세부사항 없이 실시될 수 있음을 이해할 것이다. 다른 경우에, 구현예의 설명을 불필요하게 모호하게 하는 것을 피하기 위해 잘 알려진 구조는 상세하게 도시되거나 기재되지 않았다. 문맥상 달리 요구되지 않는 한, 명세서 및 청구범위 전체에 걸쳐 단어 "포함하다(comprise)" 및 그의 변형, 예컨대, "포함하다(comprises)" 및 "포함하는(comprising)"은 개방적이고 포괄적인 의미로 해석되어야 하지만 이에 제한되지 않는다. 또한, 여기에 제공된 제목은 편의를 위한 것이며 청구된 개시 내용의 범위 또는 의미를 해석하지 않는다.
본 명세서 및 첨부된 청구범위에 사용된 바와 같이, 단수형 "a", "an" 및 "the"는 내용이 달리 명백하게 지시하지 않는 한 복수의 지시 대상을 포함한다. 또한 "또는"이라는 용어는 전형적으로 내용이 달리 명시하지 않는 한 "및/또는"을 포함하는 의미로 사용된다는 점에 유의해야 한다.
본원에서 사용되는 좌표는 Hg38(인간 게놈 빌드 38)로도 알려진 게놈 참조 어셈블리 GRCh38(Genome Research Consortium 인간 빌드 38)의 좌표를 지칭한다.
달리 정의되지 않는 한, 본원에 사용되는 모든 기술 및 과학 용어는 본 개시내용이 속하는 기술분야에 통상의 지식을 갖는 사람에 의해 전형적으로 이해되는 것과 동일한 의미를 갖는다. 본원에 기재된 것과 유사하거나 동등한 방법 및 물질이 본 개시내용의 실시 또는 테스트에 사용될 수 있지만, 적합한 방법 및 물질이 하기에 기재되어 있다.
PKD2 유전자의 대체 스플라이싱 이벤트는 감소된 단백질 발현을 초래할 수 있는 비-생산적인 mRNA 전사체로 이어질 수 있으며, PKD2 유전자의 대체 스플라이싱 이벤트를 표적으로 할 수 있는 치료제는 환자의 기능성 단백질의 발현 수준을 조절(예를 들어, 증가)할 수 있다. 이러한 치료제는 폴리시스틴 2 또는 폴리시스틴 1 결핍에 의해 야기된 병태를 치료하는 데 사용될 수 있다.
비생산적인 mRNA 전사체로 이어질 수 있는 대체 스플라이싱 이벤트 중 하나는 넌센스 매개 mRNA 붕괴를 유도할 수 있는 mRNA 전사체에 여분의 엑손을 포함하는 것이다. 본 개시내용은 또한 PKD2 프리-mRNA로부터 여분의 엑손의 스플라이싱을 조절하여 단백질 코딩 성숙 mRNA의 생산, 따라서 번역된 기능성 폴리시스틴 2의 생산을 증가시키기 위한 조성물 및 방법을 제공한다. 예를 들어, 본원에서 제공되는 조성물 및 방법은 PKD2 프리-mRNA로부터 여분의 엑손의 배제를 촉진할 수 있고, 이로써 프리-mRNA로부터 프로세싱되고 여분의 엑손이 결여된 프로세싱된 mRNA의 수준을 조절할 수 있다.
비생산적인 mRNA 전사체로 이어질 수 있는 또 다른 대체 스플라이싱 이벤트는 대체 5' 스플라이스 부위 이벤트이다. 예를 들어, 대체 5' 스플라이스-부위(예를 들어, 정규 5' ss의 다운스트림)에서 스플라이싱으로 인해 발생하는 엑손은 해당 정규 엑손보다 더 긴 엑손을 초래할 수 있다. 예를 들어, 대체 5' 스플라이스-부위에서 스플라이싱으로 인한 인트론은 해당 정규 인트론보다 짧을 수 있다. 본 개시내용은 PKD2 프리-mRNA의 대체 스플라이싱을 조정하여 단백질 코딩 성숙 mRNA의 생산, 따라서 번역된 기능성 폴리시스틴 2를 증가시키기 위한 조성물 및 방법을 제공한다. 예를 들어, 본원에서 제공되는 조성물 및 방법은 대체 5' 스플라이스-부위에서 스플라이싱을 방지하거나 감소시킴으로써 PKD2 프리-mRNA의 프로세싱을 조절할 수 있다.
이들 조성물 및 방법은 PKD2 프리-mRNA의 구성적 스플라이싱을 촉진할 수 있는 안티센스 올리고머(ASO)를 포함한다. 다양한 구현예에서, 기능성 폴리시스틴 2는 폴리시스틴 2 또는 폴리시스틴 1 결핍에 의해 야기된 병태를 치료하기 위해 개시내용의 방법을 사용하여 증가될 수 있다.
본원에서 언급된 바와 같이 APC2, PKD4, Pc-2, TRPP2, 다낭성 신장 질환 2, 일시적 수용체 전위 양이온 채널로도 알려진 "폴리시스틴 2"는 폴리시스틴 2 활성을 갖거나 유지하는 임의의 재조합 또는 자연 발생 형태의 폴리시스틴 2 또는 이의 변이체 또는 동형체를 포함한다 (예를 들어, 적어도 40% 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 활성). 일부 양태에서, 변이체 또는 동형체는 자연 발생 폴리시스틴 2에 비해 전체 서열 또는 서열의 일부(예를 들어, 50, 100, 150 또는 200개의 연속 아미노산 부분)에 걸쳐 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 아미노산 서열 동일성을 갖는다. 일부 구현예에서, 폴리시스틴 2는 UniProt 참조 번호 Q13563으로 확인되는 단백질 또는 실질적 동일성을 갖는 변이체 또는 동형체와 실질적으로 동일하다.
상염색체 우성 다낭성 신장 질환(ADPKD)은 말기 신장 질환의 8~10%를 차지하는 흔한 유전 질환이다. ADPKD는 염색체 16p13.3(PKD1)(1) 및 염색체 4q21-23(PKD2)에 맵핑된 유전자좌를 가진 유 전적으로 이질적이다. 폴리시스틴 1(PKD1에 의해 인코딩됨) 및 폴리시스틴 2(PKD2에 의해 인코딩됨)의 예측된 구조 및 유사한 질환 프로파일은 세포외 접착 이벤트를 이온 수송의 변경과 연결하는 공통 신호전달 경로에 관여함을 시사한다. 폴리시스틴 1과 폴리시스틴 2는 C 말단 세포질 꼬리를 통해 상호 작용하는 것으로 입증되었다. 이 상호작용은 폴리시스틴 1의 상향 조절을 초래했지만 폴리시스틴 2는 상향 조절하지 않았다. 폴리시스틴 1이 아닌 폴리시스틴 2의 세포질 꼬리는 폴리시스틴 1과의 상호 작용에 필요한 도메인과 다른 영역을 통해 동종이량체를 형성하였다. 이러한 결과는 폴리시스틴 2의 돌연변이는 폴리시스틴 1의 기능을 방해하여 정상적인 세뇨관생성에서 작동하는 공통 신호전달 전달 경로의 뚜렷한 분자 병변을 통해 폴리시스틴 1과 유사한 질환 발현을 초래할 수 있는 메커니즘과 일치한다. 데이터는 폴리시스틴 1과 폴리시스틴 2가 낭종 형성을 방지하는 공통 신호전달 경로에 참여한다는 생각을 뒷받침한다(Tsiokas 등, PNAS, Jun 1997, 94(13) 6965-6970, 이의 전체 내용은 참조로 본원에 포함됨). 데이터는 또한 폴리시스틴 1과 폴리시스틴 2 발현이 자가포식이 하향 조절되고 세포사가 증가하는 더 긴 기아 기간 동안 전형적으로 발생하는 전이를 조절하는 공통 신호전달 경로에 참여한다는 생각을 뒷받침하고; 폴리시스틴 1 및 폴리시스틴 2는 생존에서 사망까지의 mIMCD에서 생존에서 사망 기아로의 이러한 전이를 조절할 수 있다(Decuypere, 등, Int. J. Mol. Sci. 2021, 22, 13511). 또한, PKD1/PKD2의 복용량 변화가 ADPKD 병인에 중요한 것으로 알려져 있지만, PKD1/PKD2 발현이 어떻게 조절되는지는 잘 이해되지 않고 있지만; PKD2 번역을 억제할 수 있는 PKD2의 업스트림 열린 해독틀(uORF)에 대한 증거가 있다(Tang, 등, FASEB J. 2013 Dec; 27(12):4998-5009).
용어 "넌센스 매개 RNA 붕괴 엑손"(또는 "NSE" 또는 "NMD 엑손") 및 "NMD 유도 엑손"(또는 NIE)은 상호교환적으로 사용되며 성숙 RNA 전사체에 존재하는 경우 NMD 경로를 활성화할 수 있는 엑손 (예를 들어, 비정규 엑손)을 지칭할 수 있다. 구성적 스플라이싱 이벤트에서, NIE를 함유하는 인트론은 전형적으로 스플라이싱되지만, 인트론 또는 그 일부(예를 들어, NIE)는 대체 또는 비정상적인 스플라이싱 이벤트 동안 유지될 수 있다. NIE를 함유하는 성숙 mRNA 전사체는 예를 들어 NMD 경로를 유도하는 프레임 이동으로 인해 비-생산적일 수 있다. 일부 구현예에서, NMD 엑손은 조기 종결 코돈(또는 조기 종결 코돈(PTC)) 또는 NMD 엑손을 함유하는 성숙 RNA 전사체의 분해를 촉진하는 다른 서열을 함유하는 엑손이다. 성숙 RNA 전사체에 NIE를 포함시키면 유전자 발현이 하향 조절될 수 있다. 일부 구현예에서, NMD 엑손은 대체 스플라이싱 이벤트로부터 생성된 엑손이다. 예를 들어, NMD 엑손은 대체 5' 스플라이스 부위 이벤트에서 생성된 엑손일 수 있다. 예를 들어, NMD 엑손은 정규 엑손 및 정규 엑손에 인접한 인트론의 적어도 일부를 함유하는 엑손일 수 있다. 예를 들어, NMD 엑손은 전체 정규 엑손 및 정규 엑손 바로 다운스트림 인트론의 적어도 일부를 함유하는 엑손일 수 있다. 일부 구현예에서 NMD 엑손은 인트론(예를 들어, 정규 인트론) 내의 영역이다.
대체 스플라이싱은 성숙 mRNA 전사체에 적어도 하나의 NSE를 포함시킬 수 있다. 용어 "성숙 mRNA" 및 "완전히 스플라이싱된 mRNA"는 완전히 프로세싱된 mRNA를 설명하기 위해 본원에서 상호교환적으로 사용된다. NMD 엑손을 함유하는 성숙 mRNA는 비-생산적인 mRNA일 수 있고 성숙 mRNA의 NMD로 이어질 수 있다. NIE 함유 성숙 mRNA는 때때로 NIE를 함유하지 않는 상응하는 성숙 mRNA로부터의 단백질 발현과 비교하여 감소된 단백질 발현을 야기할 수 있다.
가짜(pseudo) 스플라이스 부위는 진정한 스플라이스 부위와 동일한 스플라이싱 인식 서열을 갖지만 스플라이싱 반응에는 사용되지 않는다. 그들은 인간 게놈의 진정항 스플라이스 부위보다 훨씬 더 많으며 전형적으로 지금까지 제대로 이해되지 않은 분자 메커니즘에 의해 억제된다. 숨겨진 5' 스플라이스 부위는 공통 NNN/GUNNNN 또는 NNN/GCNNNN을 가지며, 여기서 N은 임의의 뉴클레오티드이고/이거나 엑손-인트론 경계이다. 숨겨진 3' 스플라이스 부위에는 공통 NAG/N이 있다. 이들의 활성화는 M이 C 또는 A, R이 G 또는 A, Y가 C 또는 U인 각각 MAG/GURAGU 및 YAG/G와 같은 진본 스플라이스 부위의 최적 공통과 더 유사하게 만드는 주변 뉴클레오티드에 의해 긍정적으로 영향을 받는다.
스플라이스 부위 및 그 조절 서열은 예를 들어 문헌[Kralovicova, J. and Vorechovsky, I. (2007) Global control of aberrant splice site activation by auxiliary splicing sequences: evidence for a gradient in exon and intron definition. Nucleic Acids Res., 35, 6399-6413, (ncbi.nlm.nih.gov/pmc/articles/PMC2095810/pdf/gkm680.pdf)]에 나열된 공개적으로 이용 가능한 적합한 알고리즘을 사용하여 당업자에 의해 쉽게 식별될 수 있다.
스플라이싱 및 넌센스 매개 mRNA 붕괴
개재 서열 또는 인트론은 일차 전사체, 작은 핵 RNA(snRNA) 및 다수의 단백질 사이의 복잡한 상호 작용을 조율하는 스플라이세오좀(spliceosome)이라고 하는 크고 매우 동적 RNA-단백질 복합체에 의해 제거된다. 스플라이세오좀은 U2가 분기점 서열(BPS)에 결합하는 것을 촉진하기 위해 U2 보조 인자(U2AF)를 3'ss 영역에 결합하는 것을 수반하는, U1 snRNA에 의한 5' 스플라이스 부위(5'ss) 또는 U2 경로에 의한 3' 스플라이스 부위(3'ss)의 인식으로 시작으로 정렬된 방식으로 각 인트론에 즉석 조립된다. U2AF는 폴리피리미딘 트랙(PPT)에 결합하는 U2AF2로 인코딩된 65-kD 서브유닛(U2AF65) 및 3'ss에서 고도로 보존된 AG 디뉴클레오티드와 상호 작용하고 U2AF65 결합을 안정화하는 U2AF1로 인코딩된 35-kD 서브유닛(U2AF35)으로 구성된 안정적인 이종이량체이다. BPS/PPT 장치 및 3'ss/5'ss 외에도, 정확한 스플라이싱에는 인트론 또는 엑손 스플라이싱 인핸서 또는 사일런서로 알려진 스플라이스 부위 인식을 활성화하거나 억제하는 보조 서열 또는 구조가 필요하다. 이러한 요소를 통해 진정한 스플라이스 부위가 동일한 서열을 갖지만 크기 순서로 진본 부위보다 훨씬 더 많은 고등 진핵생물의 게놈에 있는 숨겨진 또는 가짜 부위의 엄청난 과잉 중에서 인식될 수 있다. 종종 조절 기능이 있지만 활성화 또는 억제의 정확한 메커니즘은 잘 알려져 있지 않다.
스플라이싱할지 여부에 대한 결정은 전형적으로 가장 정의된 스플라이싱 신호조차도 때때로 부정확하게 스플라이싱할 수 있는 결정론적 프로세스가 아닌 확률론적 프로세스로 모델링될 수 있다. 그러나 정상적인 조건에서, 프리-mRNA 스플라이싱은 놀라울 정도로 높은 충실도로 진행된다. 이는 부분적으로 인접한 시스 작용 보조 엑손 및 인트론 스플라이싱 조절 요소(ESR 또는 ISR)의 활동에 기인한다. 전형적으로 이러한 기능성 요소는 각각 스플라이싱을 자극하거나 억제하는 능력에 따라 엑손 또는 인트론 스플라이싱 인핸서(ESE 또는 ISE) 또는 사일런서(ESS 또는 ISS)로 분류된다. 일부 보조 시스-작용 요소가 U1 snRNP와 5'ss 사이의 복합체 배열과 같은 스플라이세오좀 어셈블리의 동역학에 영향을 미침으로써 작용할 수 있다는 증거가 있지만, 많은 요소가 트랜스-작용 RNA-결합 단백질(RBP)과 함께 기능할 가능성이 매우 높는 것으로 보인다. 예를 들어, 세린- 및 아르기닌 풍부 계열의 RBP (SR 단백질)은 엑손을 정의하는 데 중요한 역할을 하는 보존된 단백질 계열이다. SR 단백질은 프리-스플라이세오좀의 구성 요소를 인접한 스플라이스 부위로 동원하거나 부근에서 ESS의 효과를 길항함으로써 엑손 인식을 촉진한다. ESS의 억제 효과는 이종 핵 리보핵단백질(hnRNP) 계열의 구성원에 의해 매개될 수 있으며 인접한 스플라이스 부위에 대한 코어 스플라이싱 인자의 동원을 변경할 수 있다. 스플라이싱 조절에서의 역할 외에도, 사일런서 요소는 엑손의 전형적인 간격을 갖지만 기능성 열린 해독틀이 없는 미끼 인트론 스플라이스 부위 세트인 가짜 엑손을 억제하는 역할을 하는 것으로 제안된다. ESE 및 ESS는 동족 트랜스 작용 RBP와 협력하여 mRNA가 전구체에서 조립되는 방법, 위치 및 시기를 지정하는 일련의 스플라이싱 제어에서 중요한 구성 요소를 나타낸다.
엑손-인트론 경계를 표시하는 서열은 인간 유전자 내에서 높은 빈도로 발생할 수 있는 다양한 강도의 축퇴 신호이다. 다중 엑손 유전자에서, 상이한 쌍의 스플라이스 부위는 다양한 조합으로 함께 연결되어 단일 유전자에서 다양한 전사체 배열을 생성할 수 있다. 이것은 전형적으로 대체 프리-mRNA 스플라이싱이라고 한다. 대체 스플라이싱에 의해 생산된 대부분의 mRNA 동형은 핵에서 내보내져 기능성 폴리펩티드로 번역될 수 있지만, 단일 유전자의 상이한 mRNA 동형은 번역 효율이 크게 다를 수 있다. 조기 종료 코돈(PTC) 또는 엑손 접합 복합체의 최소 50bp 업스트림에 있는 조기 정지 코돈을 갖는 mRNA 동형은 넌센스 매개 mRNA 붕괴(NMD) 경로에 의한 분해의 표적이 될 가능성이 높다. 기존의 (BPS/PPT/3'ss/5'ss) 및 보조 스플라이싱 모티프의 돌연변이는 엑손 스킵핑 또는 숨겨진(또는 가짜) 엑손 포함 또는 스플라이스-부위 활성화와 같은 비정상적인 스플라이싱을 야기할 수 있으며 인간의 이환을과 사망률에 크게 기여할 수 있다. 비정상적인 및 대체 스플라이싱 패턴 모두 엑손 및 인트론의 천연 DNA 변이체에 의해 영향을 받을 수 있다.
엑손-인트론 경계가 코돈의 세 위치 중 어느 곳에서나 발생할 수 있다는 점을 감안할 때, 대체 스플라이싱 이벤트의 서브세트만이 정규 열린 해독틀을 유지할 수 있음이 분명하다. 예를 들어, 3으로 균등하게 나눌 수 있는 엑손만 스킵핑하거나 해독틀의 변경 없이 mRNA에 포함할 수 있다. 호환 가능한 단계가 없는 스플라이싱 이벤트는 프레임 이동을 유도한다. 다운스트림 이벤트에 의해 역전되지 않는 한, 프레임 이동은 확실히 하나 이상의 PTC로 이어질 수 있으며, 아마도 NMD에 의한 후속 분해로 이어질 수 있다. NMD는 PTC를 함유하는 mRNA를 제거하는 번역 커플링 메커니즘이다. NMD는 모든 진핵생물에 존재하는 감시 경로로 기능할 수 있다. NMD는 조기 정지 코돈 또는 PTC를 함유하는 mRNA 전사체을 제거하여 유전자 발현 오류를 줄일 수 있다. 이러한 비정상적인 mRNA의 번역은 어떤 경우에는 생성된 단백질의 유해한 기능 획득 또는 우세한 음성 활성으로 이어질 수 있다. NMD는 PTC가 있는 전사체뿐만 아니라 많은 내인성 유전자에서 발현되는 광범위한 mRNA 동형을 대상으로 하며, 이는 NMD가 세포의 정상 상태 RNA 수준에서 미세 조정과 조립 조정을 모두 유도하는 마스터 조절자임을 시사한다.
표적 유전자
본 개시내용은 기능성 단백질 코딩 성숙 mRNA의 생산을 조절하고 따라서 기능성 표적 단백질을 번역하기 위해 표적의 대체 스플라이싱을 조절하기 위한 조성물 및 방법을 제공하고, 여기서 표적은 PKD2이다. 이들 조성물 및 방법은 표적 프리-mRNA의 정규 스플라이싱을 촉진할 수 있는 안티센스 올리고머(ASO)를 포함하며, 표적은 PKD2이다. 다양한 구체예에서, 기능성 표적 단백질은 표적 단백질 결핍에 의해 야기된 병태를 치료하기 위해 본 개시내용의 방법을 사용하여 증가될 수 있으며, 여기서 표적은 PKD2로 구성된 군으로부터 선택된다.
일부 구현예에서, 본 발명의 방법은 필요로 하는 대상체에서 병태를 치료하기 위해 기능성 표적 단백질 생산을 증가시키는데 사용되며, 여기서 표적은 PKD2이다. 일부 구현예에서, 대상체는 표적 단백질이 야생형에 비해 반드시 결핍되지는 않지만 그럼에도 불구하고 표적 단백질의 증가가 병태를 완화시키는 병태를 가지며, 여기서 표적은 PKD2이다. 일부 구현예에서, 병태는 산발적 돌연변이에 의해 야기된다. 일부 구현예에서, 본 발명의 방법은 기능성 표적 단백질 생산을 감소시켜 이를 필요로 하는 대상체에서 병태를 치료하는데 사용되며, 여기서 표적은 PKD2이다. 일부 구현예에서, 본 발명의 방법은 기능성 표적 단백질 생산을 조절하여 이를 필요로 하는 대상체에서 병태를 치료하는데 사용되며, 여기서 표적은 PKD2이다.
표적 전사체
일부 구현예에서, 본 개시내용의 방법은 PKD2 유전자로부터 전사된 프리-mRNA에서 NIE의 존재를 활용한다. 기능성 성숙 PKD2 mRNA를 생성하기 위한 확인된 PKD2 NIE 프리-mRNA 종의 스플라이싱은 NIE의 스킵핑을 자극하는 ASO와 같은 치료제를 사용하여 유도될 수 있다. 생성된 성숙 PKD2 mRNA는 NMD 경로를 활성화하지 않고 정상적으로 번역될 수 있으므로 환자의 세포에서 폴리시스틴 2의 양이 증가하고 PKD2 결핍과 관련된 병태 또는 질환, 예를 들어 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환, 및 두개내 동맥류의 증상을 완화한다.
기능적이고 성숙 표적 mRNA를 생산하기 위한 확인된 표적 NSE 프리-mRNA 전사체의 정규 스플라이싱은 정규 스플라이스 부위에서 표적 NSE 프리-mRNA의 구성적 스플라이싱을 촉진하는 ASO와 같은 치료제를 사용하여 유도될 수 있다. 일부 구현예에서, 생성된 기능성 성숙 표적 mRNA는 정상적으로 번역될 수 있고, 이로써 환자의 세포에서 기능성 표적 단백질의 양을 증가시키고 표적 연관 질환의 증상을 예방할 수 있다.
다양한 구현예에서, 본 개시내용은 스플라이싱 또는 단백질 발현 수준을 조절하기 위해 PKD2 프리-mRNA를 표적화할 수 있는 치료제를 제공한다. 치료제는 소분자, 핵산 올리고머 또는 폴리펩티드일 수 있다. 일부 구현예에서, 치료제는 ASO이다. PKD2 프리-mRNA에 대한 다양한 영역 또는 서열은 ASO와 같은 치료제에 의해 표적화될 수 있다. 일부 구현예에서, ASO는 PKD2 유전자로부터 전사된 PKD2 NSE 프리-mRNA를 표적으로 한다. 일부 구현예에서, ASO는 넌센스 매개 RNA 붕괴 엑손(NSE)을 포함하는 PKD2 유전자로부터 전사된 PKD2 NSE 프리-mRNA를 표적으로 한다. 일부 구현예에서, NSE는 PKD2 프리-mRNA 전사체의 정규 인트론 3의 일부(PKD2 프리-mRNA 전사체의 정규 엑손 3의 다운스트림 인트론)를 포함한다. 일부 구현예에서, NSE는 PKD2 프리-mRNA 전사체의 전체 정규 엑손 3을 포함한다. 일부 구현예에서, NSE는 PKD2 프리-mRNA 전사체의 정규 인트론 3의 일부와 PKD2 프리-mRNA 전사체의 전체 정규 엑손 3만을 포함한다. 일부 구현예에서, NSE는 비정상적인 스플라이싱으로 인해 PKD2 프리-mRNA 전사체에 포함된다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 NSE 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 엑손 3 또는 4 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 엑손 3 다음 인트론 3의 5' 스플라이스 부위로부터 업스트림(또는 5')의 엑손 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 엑손 3 앞에 있는 인트론 2의 3' 스플라이스 부위로부터 다운스트림 (또는 3')의 엑손 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 NSE의 3' 말단에 측접하는 인트론 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 인트론 2 또는 3 또는 4 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 인트론 2 또는 3 또는 4의 3' 스플라이스 부위로부터 업스트림 (또는 5')의 인트론 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 인트론 2 또는 3 또는 4의 5' 스플라이스 부위로부터 다운스트림 (또는 3')의 인트론 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 NSE의 5' 말단에 측접하는 인트론 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 인트론 2 또는 3 또는 4 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 인트론 2 또는 3 또는 4 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 인트론 2 또는 3 또는 4의 3' 스플라이스 부위로부터 업스트림 (또는 5')의 인트론 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 인트론 2 또는 3 또는 4의 5' 스플라이스 부위로부터 다운스트림 (또는 3')의 인트론 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 엑손-인트론 경계를 포함하는 서열을 표적으로 한다. 일부 구현예에서, 엑손은 NSE이다. 엑손-인트론 경계는 엑손 서열과 인트론 서열의 접합부를 지칭할 수 있다. 일부 구현예에서, 인트론 서열은 NSE의 5' 말단 또는 엑손의 3' 말단에 측접할 수 있다. 일부 구현예에서, ASO는 인트론의 일부와 엑손의 일부를 모두 포함하는 서열을 표적으로 한다.
일부 구현예에서, 본원에 개시된 방법 또는 조성물을 사용하여 치료 또는 개선될 수 있는 질환 또는 병태는 치료제가 표적으로 하는 표적 단백질(유전자)과 직접적으로 연관되지 않는다. 일부 구현예에서, 본원에서 제공되는 치료제는 질환 또는 병태와 직접적으로 연관되지 않은 단백질(유전자)을 표적으로 할 수 있지만, 표적 단백질(유전자)의 발현 조절은 질환 또는 병태를 치료 또는 개선할 수 있다. 예를 들어, 본원에서 제공되는 치료제에 의한 PKD2와 같은 유전자의 표적화는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우세한 다낭성 신장 질환, 또는 두개내 동맥류을 치료 또는 개선할 수 있다. 일부 구현예에서, PKD2와 같은 이러한 표적 유전자는 경로(신장)에 대해 지시된다고 한다. 일부 구현예에서, PKD2와 같은 이러한 표적 유전자는 경로(다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 또는 상염색체 우성 다낭성 신장 질환)에 대해 지시된다고 한다. 일부 구현예에서, PKD2와 같은 이러한 표적 유전자는 경로(두개내 동맥류)에 대해 지시된다고 한다.
다양한 구현예에서, 본 개시내용은 스플라이싱 또는 단백질 발현 수준을 조절하기 위해 PKD2 프리-mRNA 전사체를 표적화할 수 있는 치료제를 제공한다. 치료제는 소분자, 폴리뉴클레오티드 또는 폴리펩티드일 수 있다. 일부 구현예에서, 치료제는 ASO이다. PKD2 프리-mRNA에 대한 다양한 영역 또는 서열은 ASO와 같은 치료제에 의해 표적화될 수 있다. 일부 구현예에서, ASO는 NIE를 함유하는 PKD2 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 NIE 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 NIE의 5' 말단으로부터 업스트림(또는 5')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 NIE의 3' 말단으로부터 다운스트림(또는 3')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 NIE의 5' 말단에 측접하는 인트론 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 NIE의 3' 말단에 측접하는 인트론 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 NIE-인트론 경계를 포함하는 서열을 표적으로 한다. NIE-인트론 경계는 인트론 서열과 NIE 영역의 접합부를 의미할 수 있다. 인트론 서열은 NIE의 5' 말단 또는 NIE의 3' 말단에 측접할 수 있다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 엑손 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 인트론 내의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 전사체의 인트론의 일부와 엑손의 일부를 모두 포함하는 서열을 표적으로 한다.
일부 구현예에서, ASO는 NIE의 5' 말단으로부터 업스트림(또는 5')에 있는 약 4 내지 약 300개의 뉴클레오티드의 서열을 표적으로 한다. 일부 구현예에서, ASO는 NIE 영역의 5' 말단으로부터 업스트림(또는 5')에 있는 약 1 내지 약 20개의 뉴클레오티드, 약 20 내지 약 50개의 뉴클레오티드, 약 50 내지 약 100개의 뉴클레오티드, 약 100 내지 약 150개의 뉴클레오티드, 약 150 내지 약 200개의 뉴클레오티드, 약 200 내지 약 250개의 뉴클레오티드, 또는 약 250 내지 약 300개의 뉴클레오티드의 서열을 표적으로 한다. 일부 구현예에서, ASO는 NIE의 5' 말단으로부터 업스트림에 있는 300개 초과의 뉴클레오티드의 서열을 표적으로 할 수 있다. 일부 구현예에서, ASO는 NIE의 3' 말단으로부터 다운스트림(또는 3')에 있는 약 4 내지 약 300개의 뉴클레오티드의 서열을 표적으로 한다. 일부 구현예에서, ASO는 NIE의 3' 말단으로부터 다운스트림에 있는 약 1 내지 약 20개의 뉴클레오티드, 약 20 내지 약 50개의 뉴클레오티드, 약 50 내지 약 100개의 뉴클레오티드, 약 100 내지 약 150개의 뉴클레오티드, 약 150 내지 약 200개의 뉴클레오티드, 약 200 내지 약 250개의 뉴클레오티드, 또는 약 250 내지 약 300개의 뉴클레오티드의 서열을 표적으로 한다. 일부 구현예에서, ASO는 NIE의 3' 말단으로부터 다운스트림에 있는 300개 초과의 뉴클레오티드의 서열을 표적으로 한다.
일부 구현예에서, 본원에 개시된 ASO는 PKD2 게놈 서열로부터 전사된 NSE 프리-mRNA를 표적으로 한다. 일부 구현예에서, ASO는 PKD2 게놈 서열의 NSE를 포함하는 게놈 서열로부터의 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 PKD2 게놈 서열의 NSE의 3' 말단에 측접하는 인트론 및 NSE의 5' 말단에 측접하는 인트론을 포함하는 게놈 서열로부터의 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 표 3의 프리-mRNA 전사체로 이루어진 군으로부터 선택된 서열을 포함하는 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 서열의 NSE를 포함하는 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 서열의 NSE의 3' 말단에 측접하는 인트론을 포함하는 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA 서열의 NSE의 5' 말단에 측접하는 인트론을 포함하는 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, 전사체는 표 3의 전사체로 이루어진 군으로부터 선택된다.
일부 구현예에서, PKD2 NIE 함유 프리-mRNA 전사체는 표 2 또는 표 3에 열거된 서열 중 어느 하나와 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 유전자 서열에 의해 인코딩된다. 일부 구현예에서, PKD2 NIE 프리-mRNA 전사체는 표 2 또는 표 3에 열거된 서열 중 어느 하나와 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, PKD2 NIE 함유 프리-mRNA 전사체는 표 2 또는 표 3에 열거된 서열 중 어느 하나와 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, PKD2 NIE 함유 프리-mRNA 전사체는 표 2 또는 표 3에 열거된 서열 중 어느 하나와 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열에 의해 인코딩된다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 표 2 또는 표 3에 열거된 서열 중 어느 하나의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, 프리-mRNA 전사체는 본원에 기재된 PKD2 프리-mRNA 전사체의 프리-mRNA 전사체 또는 이의 보체에 대해 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, PKD2 프리-mRNA로 이루어진 군으로부터 선택된 프리-mRNA의 표적화 부분은 표 2 또는 표 3의 프리-mRNA 전사체 또는 이의 보체의 서열의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, PKD2 프리-mRNA의 프리-mRNA의 표적화 부분은 표 2 또는 표 3의 서열의 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20 연속 핵산 또는 이의 보체에 상보적인 서열을 포함한다.
일부 구현예에서, 본원에 개시된 ASO는 PKD2 게놈 서열로부터 전사된 NSE 프리-mRNA를 표적으로 한다. 일부 구현예에서, ASO는 NSE를 포함하는 PKD2 게놈 서열로부터의 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서 NSE는 엑손 3을 포함한다. 일부 구현예에서 NSE는 PKD2 전사체의 제3 엑손이다. 일부 구현예에서, ASO는 엑손 3 또는 4를 포함하는 PKD2 게놈 서열로부터의 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 NSE의 3' 말단에 측접하는 인트론 및 NSE의 5' 말단에 측접하는 인트론을 포함하는 PKD2 게놈 서열로부터의 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, NSE의 3' 말단에 측접하는 인트론은 인트론 3이고 NSE의 5' 말단에 측접하는 인트론은 인트론 2이다. 일부 구현예에서, ASO는 인트론 2, 엑손 3 및 인트론 3을 포함하는 PKD2 게놈 서열로부터의 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 엑손 3 및 엑손 4를 포함하는 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 NSE를 포함하는 PKD2 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, ASO는 엑손 3을 포함하는 PKD2 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, ASO는 NSE의 3' 말단에 측접하는 인트론을 포함하는 PKD2 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, ASO는 인트론 3을 포함하는 PKD2 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, ASO는 NSE의 5' 말단에 측접하는 인트론을 포함하는 PKD2 프리-mRNA 서열을 표적으로 한다.
일부 구현예에서, PKD2 프리-mRNA 전사체는 Ensembl 참조 번호 ENSG00000118762.8 또는 이의 보체에 대해 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 유전자 서열에 의해 인코딩된다. 일부 구현예에서, PKD2 프리-mRNA 전사체는 본원에 기재된 PKD2 프리-mRNA 전사체 또는 이의 보체에 대해 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, PKD2 프리-mRNA의 표적화 부분은 표 3의 서열 또는 이의 보체의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, PKD2 프리-mRNA의 표적화 부분은 표 2 또는 표 3에 열거된 서열 또는 이의 보체로 이루어진 군으로부터 선택된 서열의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, ASO는 표 4의 서열 또는 이의 보체 중 어느 하나와 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 동일한 서열을 포함한다.
일부 구현예에서, 본원에 개시된 ASO는 표적 게놈 서열로부터 전사된 NSE 프리-mRNA를 표적으로 한다. 일부 구현예에서, ASO는 NSE를 포함하는 표적 게놈 서열로부터의 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 NSE의 3' 말단에 측접하는 인트론 및 NSE의 5' 말단에 측접하는 인트론을 포함하는 표적 게놈 서열로부터의 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 표 3의 프리-mRNA 전사체 서열로부터 선택된 서열을 포함하는 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 Ensembl 참조 번호로 제시되는 표 3의 프리-mRNA 전사체 서열로부터 선택된 서열을 포함하는 NSE 프리-mRNA 전사체를 표적으로 한다. 일부 구현예에서, ASO는 NSE를 포함하는 표적 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, ASO는 NSE의 3' 말단에 측접하는 인트론을 포함하는 표적 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, ASO는 NSE의 5' 말단에 측접하는 인트론을 포함하는 표적 프리-mRNA 서열을 표적으로 한다. 일부 구현예에서, 전사체는 표 3의 전사체 서열로 이루어진 군으로부터 선택된다. 일부 구현예에서, 전사체는 Ensembl 참조 번호에 의해 제시된 바와 같이 표 3의 전사체 서열로 이루어진 군으로부터 선택된다.
일부 구현예에서, 표적 프리-mRNA 전사체는 Ensembl 참조 번호에 의해 제시된 바와 같은 유전자 서열 또는 이의 보체에 대해 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 유전자 서열에 의해 인코딩된다. 일부 구현예에서, 표적 프리-mRNA 전사체는 본원에 기재된 표적 프리-mRNA 전사체 또는 이의 보체에 대해 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, 표적 프리-mRNA의 표적화 부분은 표 2의 서열 또는 표 3의 서열 또는 이의 보체의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 표적 프리-mRNA의 표적화 부분은 Ensembl 참조 번호에 의해 제시된 바와 같은 표 3의 서열 또는 표 2의 서열 또는 이의 보체의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 표적 프리-mRNA의 표적화 부분은 표 2 또는 표 3의 서열의 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20 연속 핵산 또는 이의 보체에 상보적인 서열을 포함한다.
일부 구현예에서, ASO는 NSE를 포함하는 PKD2 프리-mRNA의 엑손 3을 표적으로 한다. 일부 구현예에서, ASO는 인트론 3의 5' 스플라이스 부위로부터 약 2개의 뉴클레오티드 다운스트림(또는 3') 내지 인트론 2의 3' 스플라이스 부위로부터 약 4개의 뉴클레오티드 업스트림(또는 5')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 인트론 3의 5' 스플라이스 부위로부터 약 2개의 뉴클레오티드 업스트림(또는 5') 내지 인트론 2의 3' 스플라이스 부위로부터 약 4개의 뉴클레오티드 다운스트림(또는 3')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 표 4에 열거된 서열 중 어느 하나 또는 이의 보체에 따른 서열을 갖는다.
일부 구현예에서, ASO는 NSE를 포함하는 PKD2 프리-mRNA의 인트론 3을 표적으로 한다. 일부 구현예에서, ASO는 인트론 3의 3' 스플라이스 부위로부터 약 4 내지 약 300개의 뉴클레오티드 업스트림(또는 5')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 인트론 3의 3' 스플라이스 부위로부터 약 4 내지 약 300개의 뉴클레오티드 다운스트림(또는 3')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 인트론 3의 5' 스플라이스 부위로부터 약 4 내지 약 300개의 뉴클레오티드 업스트림(또는 5')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 인트론 3의 5' 스플라이스 부위로부터 약 4 내지 약 300개의 뉴클레오티드 다운스트림(또는 3')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 인트론 2의 3' 스플라이스 부위로부터 약 6 내지 약 100개의 뉴클레오티드 업스트림(또는 5')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 인트론 2의 3' 스플라이스 부위로부터 약 4 내지 약 300개의 뉴클레오티드 다운스트림(또는 3')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 인트론 2의 5' 스플라이스 부위로부터 약 6 내지 약 100개의 뉴클레오티드 업스트림(또는 5')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 인트론 2의 5' 스플라이스 부위로부터 약 4 내지 약 300개의 뉴클레오티드 다운스트림(또는 3')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 표 4의 임의의 서열 또는 이의 보체에 따른 서열을 갖는다.
일부 구현예에서, PKD2 프리-mRNA의 표적화 부분은 인트론 2, 3 또는 4에 있다. 일부 구현예에서, PKD2 프리-mRNA의 표적화 부분은 엑손 2, 3, 4 또는 5에 있다. 일부 구현예에서, NSE 프리-mRNA의 표적화 부분에 대한 ASO의 혼성화는 정규 엑손 3의 포함을 초래하고, 이어서 폴리시스틴 2 생산을 증가시킨다. 일부 구현예에서, NSE 프리-mRNA의 표적화 부분에 대한 ASO의 혼성화는 정규 엑손의 배제를 초래하고, 이어서 폴리시스틴 2 생산을 감소시킨다. 일부 구현예에서, NSE 프리-mRNA의 표적화 부분에 대한 ASO의 혼성화는 정규 엑손의 포함 또는 배제를 초래하고, 이어서 폴리시스틴 2 생산을 조절한다. 일부 구현예에서, PKD2 프리-mRNA의 표적화 부분은 엑손 3 또는 4에 있다. 일부 구현예에서, PKD2 프리-mRNA의 표적화 부분은 인트론 2에 있다. 일부 구현예에서, PKD2 프리-mRNA의 표적화 부분은 인트론 3에 있다.
일부 구현예에서, ASO는 NIE 엑손 2를 포함하는 PKD2 NIE 함유 프리-mRNA의 엑손 2x를 표적으로 한다.
일부 구현예에서, ASO는 PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140)을 표적으로 한다.
일부 구현예에서, ASO는 PKD2의 엑손 2x의 5' 말단으로부터 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드 업스트림 (또는 5')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2의 GRCh38/ hg38: chr4:88031085 88031140으로부터 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드 업스트림 (또는 5')의 서열을 표적으로 한다.
일부 구현예에서, ASO는 PKD2의 엑손 2x의 5' 말단으로부터 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드 업스트림 (또는 5')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2의 GRCh38/ hg38: chr4:88031085 88031140으로부터 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드 업스트림 (또는 5')의 서열을 표적으로 한다.
일부 구현예에서, ASO는 PKD2의 엑손 2x의 3' 말단으로부터 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드 다운스트림 (또는 3')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2의 GRCh38/ hg38: chr4:88031085 88031140으로부터 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드 다운스트림 (또는 3')의 서열을 표적으로 한다.
일부 구현예에서, ASO는 PKD2의 엑손 2x의 3' 말단으로부터 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드 다운스트림 (또는 3')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2의 GRCh38/ hg38: chr4:88031085 88031140으로부터 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드 다운스트림 (또는 3')의 서열을 표적으로 한다.
일부 구현예에서, ASO는 표 2 또는 표 3에 열거된 서열 중 임의의 하나에 따른 프리-mRNA의 표적화 부분에 상보적인 서열을 갖는다.
일부 구현예에서, ASO는 NIE의 5' 말단으로부터 업스트림의 서열을 표적으로 한다. 예를 들어, NIE(예를 들어, PKD2의 엑손 2x)의 5' 말단으로부터 업스트림의 서열을 표적으로 하는 ASO는 표 2 또는 표 3에 열거된 서열 중 어느 하나의 적어도 8개의 연속 핵산에 대해 적어도 약 80%, 85%, 90%, 95%, 97%, 또는 100% 상보적인 서열을 포함한다. 예를 들어, NIE(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 5' 말단으로부터 업스트림의 서열을 표적으로 하는 ASO는 표 2 또는 표 3에 열거된 서열 중 어느 하나에 대해 적어도 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성을 갖는 서열을 포함할 수 있다.
일부 구현예에서, ASO는 엑손-인트론 경계(또는 접합부)를 함유하는 서열을 표적으로 한다. 예를 들어, 엑손-인트론 경계를 함유하는 서열을 표적으로 하는 ASO는 표 2 또는 표 3에 열거된 서열 중 어느 하나의 적어도 8개의 연속 핵산에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 상보적인 서열을 포함할 수 있다. 일부 구현예에서, ASO는 NIE의 3' 말단으로부터 다운스트림의 서열을 표적으로 한다. 예를 들어, NIE(예를 들어, PKD2의 엑손 2x)의 3' 말단으로부터 다운스트림의 서열을 표적으로 하는 ASO는 표 2 또는 표 3에 열거된 서열 중 어느 하나에 대해 적어도 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성을 갖는 서열을 포함할 수 있다. 예를 들어, NIE(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 3' 말단으로부터 다운스트림의 서열을 표적으로 하는 ASO는 표 2 또는 표 3에 열거된 서열 중 어느 하나에 대해 적어도 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성을 갖는 서열을 포함할 수 있다. 일부 구현예에서, ASO는 NIE 내의 서열을 표적으로 한다.
일부 구현예에서, ASO는 NIE 엑손 2를 포함하는 PKD2 NIE 함유 프리-mRNA의 엑손 2x를 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA의 엑손 2x의 5' 말단으로부터 다운스트림 (또는 3')의 서열을 표적으로 한다. 일부 구현예에서, ASO는 PKD2 프리-mRNA의 엑손 2x의 3' 말단으로부터 업스트림(또는 5')의 엑손 2x 서열을 표적으로 한다.
일부 구현예에서, PKD2 NIE 함유 프리-mRNA의 표적화 부분은 인트론 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50에 있다. 일부 구현예에서, NIE 프리-mRNA의 표적화 부분에 대한 ASO의 혼성화는 인트론 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50 내의 NIE 중 적어도 하나의 엑손 스킵핑을 초래하고, 그리고 이후에 폴리시스틴 2 생산을 증가시킨다. 일부 구현예에서, PKD2 NIE 함유 프리-mRNA의 표적화 부분은 PKD2의 인트론 2에 있다. 일부 구현예에서, PKD2 NIE 함유 프리-mRNA의 표적화 부분은 PKD2의 인트론(GRCh38/ hg38:chr4 88019572 88036219)에 있다.
일부 구현예에서, 본 개시내용의 방법 및 조성물은 PKD2 NIE 함유 프리-mRNA의 NIE의 엑손 스킵핑을 유도함으로써 PKD2의 발현을 증가시키는데 사용된다. 일부 구현예에서, NIE는 인트론 1-50 중 임의의 것 내의 서열이다. 일부 구현예에서, NIE는 인트론 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50 중 임의의 것 내의 서열이다. 일부 구현예에서, NIE는 임의의 PKD2 인트론 또는 이의 일부일 수 있다. 일부 구현예에서, NIE는 PKD2의 인트론 2 내에 있다. 일부 구현예에서, NIE는 PKD2의 인트론(GRCh38/ hg38:chr4 88019572 88036219) 내에 있다.
단백질 발현
일부 구현예에서, 돌연변이는 2개의 대립유전자 모두에서 발생한다. 일부 구현예에서, 돌연변이는 2개의 대립유전자 중 하나에서 발생한다. 일부 구현예에서, 추가 돌연변이는 2개의 대립유전자 중 하나에서 발생한다. 일부 구현예에서, 추가 돌연변이는 제1 돌연변이와 동일한 대립유전자에서 발생한다. 다른 구현예에서, 발생하는 추가적인 돌연변이는 트랜스 돌연변이이다.
일부 구현예에서, 본원에 기재된 방법은 기능성 폴리시스틴 2 단백질 또는 RNA의 생산을 증가시키기 위해 사용된다. 본원에서 사용되는 바와 같이, 용어 "기능적"은 치료된 병태 또는 질환, 예를 들어 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우세한 다낭성 신장 질환, 및 두개내 동맥류의 임의의 하나 이상의 증상을 제거하는데 필요한 폴리시스틴 2 단백질 또는 RNA의 활성 또는 기능의 양을 지칭한다. 일부 구현예에서, 방법은 부분적으로 기능적인 폴리시스틴 2 단백질 또는 RNA의 생산을 증가시키기 위해 사용된다. 본원에서 사용되는 바와 같이, "부분적으로 기능적인"이라는 용어는 질환 또는 병태의 임의의 하나 이상의 증상을 제거하거나 예방하는 데 필요한 활성 또는 기능의 양보다 적은 폴리시스틴 2 단백질 또는 RNA의 활성 또는 기능의 양을 지칭한다. 일부 구현예에서, 부분적으로 기능적인 단백질 또는 RNA는 완전 기능성 단백질 또는 RNA에 비해 활성이 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 적을 것이다.
일부 구현예에서, 방법은 폴리시스틴 2를 인코딩하는 NIE 함유 프리-mRNA를 갖는 대상체의 세포에 의한 폴리시스틴 2의 발현을 증가시키는 방법이며, 여기서 대상체는 폴리시스틴 2의 결핍된 양에 의해 야기되는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우세한 다낭성 신장 질환, 또는 두개내 동맥류을 가지고 있고, 여기서 폴리시스틴 2의 결핍된 양은 폴리시스틴 2의 반가불충분성에 의해 야기된다. 이러한 구현예에서, 대상체는 기능성 폴리시스틴 2를 인코딩하는 제1 대립유전자 및 폴리시스틴 2가 생산되지 않는 제2 대립유전자를 갖는다. 또 다른 이러한 구현예에서, 대상체는 기능성 폴리시스틴 2를 인코딩하는 제1 대립유전자 및 비기능성 폴리시스틴 2를 인코딩하는 제2 대립유전자을 갖는다. 또 다른 이러한 구현예에서, 대상체는 기능성 폴리시스틴 2를 인코딩하는 제1 대립유전자 및 부분적 기능성 폴리시스틴 2를 인코딩하는 제2 대립유전자을 갖는다. 임의의 이들 구현예에서, 안티센스 올리고머는 제2 대립유전자로부터 전사된 NIE 함유 프리-mRNA의 표적화 부분에 결합하여, 프리-mRNA로부터 NIE의 엑손 스킵핑을 유도하고 기능성 폴리시스틴 2를 인코딩하는 성숙 mRNA 수준의 증가를 유발하고 대상체의 세포에서 폴리시스틴 2의 발현을 증가시킨다.
일부 구현예에서, 방법은 표적 단백질을 인코딩하는 NSE 프리-mRNA를 갖는 대상체의 세포에 의한 표적 단백질의 발현을 감소시키는 방법이며, 여기서 대상체는 표적 단백질의 과잉량의 활성에 의해 발생하는 질환을 갖고 있고, 표적 단백질의 과잉량의 발현은 돌연변이에 의해 발생하고, 표적은 PKD2로 이루어진 군에서 선택되는 어느 하나이다. 일부 구현예에서, 안티센스 올리고머는 돌연변이를 수반하는 대립유전자로부터 전사된 NSE 프리-mRNA의 표적화 부분에 결합하여, 프리-mRNA로의 NSE의 교대 스플라이싱을 증가시키고, 기능성 표적 단백질을 인코딩하는 성숙 mRNA 수준의 감소 및 대상체의 세포 내 표적 단백질의 발현 감소를 유발한다. 관련 구현예에서, 방법은 기능성 단백질 또는 기능성 RNA의 발현을 감소시키기 위해 ASO를 사용하는 방법이다. 일부 구현예에서, ASO는 표적 단백질을 인코딩하는 NSE 프리-mRNA를 갖는 대상체의 세포에서 표적 단백질의 발현을 감소시키기 위해 사용되며, 여기서 대상체는 표적 단백질의 양 또는 기능이 과량이다.
일부 구현예에서, 방법은 표적 단백질을 인코딩하는 NSE 프리-mRNA를 갖는 대상체의 세포에 의한 표적 단백질의 발현을 조절하는 방법이며, 여기서 대상체는 표적 단백질의 결핍 또는 과잉 양의 활성에 의해 발생하는 질환을 갖고 있고, 표적 단백질의 결핍 또는 과잉 양의 발현은 돌연변이에 의해 발생하고, 표적은 PKD2로 이루어진 군에서 선택되는 어느 하나이다. 일부 구현예에서, 안티센스 올리고머는 돌연변이를 수반하는 대립유전자로부터 전사된 NSE 프리-mRNA의 표적화 부분에 결합하여, 프리-mRNA로의 NSE의 교대 스플라이싱을 조절하고, 기능성 표적 단백질을 인코딩하는 성숙 mRNA 수준의 조절 및 대상체의 세포 내 표적 단백질의 발현 조절을 유발한다. 관련 구현예에서, 방법은 기능성 단백질 또는 기능성 RNA의 발현을 조절하기 위해 ASO를 사용하는 방법이다. 일부 구현예에서, ASO는 표적 단백질을 인코딩하는 NSE 프리-mRNA를 갖는 대상체의 세포에서 표적 단백질의 발현을 조절하기 위해 사용되며, 여기서 대상체는 표적 단백질의 양 또는 기능이 비정상적인 양이다.
일부 구현예에서, 방법은 폴리시스틴 2를 인코딩하는 NIE 함유 프리-mRNA를 갖는 대상체의 세포에 의한 폴리시스틴 2의 발현을 증가시키는 방법이며, 여기서 대상체는 폴리시스틴 2의 결핍된 양에 의해 야기되는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우세한 다낭성 신장 질환, 또는 두개내 동맥류을 가지고 있고, 여기서 폴리시스틴 2의 결핍된 양은 상염색체 열성 유전에 의해 야기된다.
일부 구현예에서, 방법은 폴리시스틴 2를 인코딩하는 NIE 함유 프리-mRNA를 갖는 대상체의 세포에 의한 폴리시스틴 2의 발현을 증가시키는 방법이며, 여기서 대상체는 폴리시스틴 2의 결핍된 양에 의해 야기되는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우세한 다낭성 신장 질환, 또는 두개내 동맥류을 가지고 있고, 여기서 폴리시스틴 2의 결핍된 양은 상염색체 우성 유전에 의해 야기된다.
일부 구현예에서, 방법은 폴리시스틴 2를 인코딩하는 NIE 함유 프리-mRNA를 갖는 대상체의 세포에 의한 폴리시스틴 2의 발현을 증가시키는 방법이며, 여기서 대상체는 폴리시스틴 2의 결핍된 양에 의해 야기되는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우세한 다낭성 신장 질환, 또는 두개내 동맥류을 가지고 있고, 여기서 폴리시스틴 2의 결핍된 양은 X 연관 우성 유전에 의해 야기된다.
관련 구현예에서, 방법은 단백질 또는 기능성 RNA의 발현을 증가시키기 위해 ASO를 사용하는 방법이다. 일부 구현예에서, ASO는 폴리시스틴 2를 인코딩하는 NIE 함유 프리-mRNA를 갖는 대상체의 세포에서 폴리시스틴 2의 발현을 증가시키기 위해 사용될 수 있으며, 여기서 대상체는 폴리시스틴 2의 양 또는 기능에서 결핍, 예를 들어, 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우세한 다낭성 신장 질환, 또는 두개내 동맥류을 갖는다.
일부 구현예에서, 질환 또는 병태의 원인이 되는 단백질을 인코딩하는 NIE 함유 프리-mRNA 전사체는 본원에 기재된 ASO에 의해 표적화된다. 일부 구현예에서, 질환의 원인이 아닌 단백질을 인코딩하는 NIE 함유 프리-mRNA 전사체는 ASO에 의해 표적화된다. 예를 들어, 특정 경로에서 제1 단백질의 돌연변이 또는 결핍의 결과인 질환은 제2 단백질을 인코딩하는 NIE 함유 프리-mRNA를 표적으로 하여 제2 단백질의 생산을 증가시킴으로써 개선될 수 있다. 일부 구현예에서, 제2 단백질의 기능은 제1 단백질의 돌연변이 또는 결핍(질환 또는 병태의 원인임)을 보상할 수 있다. 일부 구현예에서, 대상체는 (a) 야생형인 제1 대립유전자, 및 (b) (i) 폴리시스틴 2가 야생형 대립유전자로부터의 생산에 비해 감소된 수준으로 생산되고, (ii) 폴리시스틴 2가 동등한 야생형 단백질에 비해 기능이 감소된 형태로 생산되거나, 또는 (iii) 폴리시스틴 2 또는 기능성 RNA가 생산되지 않는 돌연변이 대립유전자인 제2 대립유전자를 갖는다.
일부 구현예에서, 대상체는 하기를 갖는다:
(a) 하기인 제1 돌연변이 대립유전자
(i) 폴리시스틴 2는 야생형 대립유전자로부터의 생산에 비해 감소된 수준으로 생산되며,
(ii) 폴리시스틴 2는 동등한 야생형 단백질에 비해 기능이 감소된 형태로 생산되거나,
(iii) 폴리시스틴 2 또는 기능성 RNA가 생산되지 않음; 그리고
(b) 하기인 제2 돌연변이 대립유전자
(i) 폴리시스틴 2는 야생형 대립유전자로부터의 생산에 비해 감소된 수준으로 생산되며,
(ii) 폴리시스틴 2는 동등한 야생형 단백질에 비해 기능이 감소된 형태로 생산되거나,
(iii) 폴리시스틴 2는 생산되지 않음
NIE 함유 프리-mRNA는 제1 대립유전자 및/또는 제2 대립유전자로부터 전사되고, 대상체가 제1 돌연변이 대립유전자 (a)(iii)를 가질 때 제2 돌연변이 대립유전자는 (b)(iii)가 아니며, 대상체가 제2 돌연변이 대립유전자 (b)(iii)를 가질 때 제1 돌연변이 대립유전자는 (a)(iii)가 아니다. 이들 구현예에서, ASO는 제1 대립유전자 또는 제2 대립유전자로부터 전사된 NIE 함유 프리-mRNA의 표적화 부분에 결합하여, NIE 함유 프리-mRNA로부터 NIE의 엑손 스킵핑을 유도하고 대상체의 세포에서 폴리시스틴 2를 인코딩하는 mRNA의 수준 증가 및 표적 단백질 또는 기능성 RNA의 발현 증가를 유발한다. 이들 구현예에서, NIE 함유 프리-mRNA로부터 NIE의 엑손 스킵핑(exon skipping)으로 인해 발현 수준이 증가된 표적 단백질 또는 기능성 RNA는 동등한 야생형 단백질에 비해 기능(부분적 기능성)이 감소된 형태, 또는 동등한 야생형 단백질과 비교하여 전체 기능(완전한 기능)을 갖는 형태일 수 있다.
일부 구현예에서, 폴리시스틴 2를 인코딩하는 mRNA의 수준은 대조군 세포, 예를 들어 안티센스 올리고머로 처리되지 않은 것 또는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 결합하지 않는 안티센스 올리고머로 처리된 것에서 생산되는 폴리시스틴 2를 인코딩하는 mRNA의 양과 비교할 때 1.1 내지 10배 증가된다.
일부 구현예에서, 본 개시내용의 방법을 사용하여 치료된 대상체는 하나의 대립유전자로부터 부분적 기능성 폴리시스틴 2를 발현하며, 여기서 부분적 기능성 폴리시스틴 2는 틀이동 돌연변이, 넌센스 돌연변이, 미스센스 돌연변이 또는 부분 유전자 결실에 의해 야기될 수 있다. 일부 구현예에서, 본 개시내용의 방법을 사용하여 치료된 대상체는 하나의 대립유전자로부터 비기능성 폴리시스틴 2를 발현하며, 여기서 비기능성 폴리시스틴 2는 하나의 대립유전자에서 틀이동 돌연변이, 넌센스 돌연변이, 미스센스 돌연변이, 부분 유전자 결실에 의해 야기될 수 있다. 일부 구현예에서, 본 개시내용의 방법을 사용하여 치료된 대상체는 하나의 대립유전자에서 PKD2 전체 유전자 결실을 갖는다.
엑손 포함
일부 구현예에서, 포함된 NIE는 세포에서 표적 단백질을 인코딩하는 유전자로부터 전사된 NIE 함유 프리-mRNA의 집단에서 가장 풍부한 NIE이다. 일부 구현예에서, 포함된 NIE는 세포에서 표적 단백질을 인코딩하는 유전자로부터 전사된 NIE 함유 프리-mRNA의 집단에서 가장 풍부한 NIE이고, NIE 함유 프리-mRNA의 집단은 2개 이상의 포함된 NIE를 함유한다. 일부 구현예에서, 표적 단백질을 인코딩하는 NIE 함유 프리-mRNA의 집단에서 가장 풍부한 NIE를 표적으로 하는 안티센스 올리고머는 안티센스 올리고머가 표적이 되거나 결합되는 NIE를 포함하여 집단에서 하나 또는 둘 이상의 NIE의 엑손 스킵핑을 유도한다. 일부 구현예에서, 표적화된 영역은 폴리시스틴 2를 인코딩하는 NIE 함유 프리-mRNA에서 가장 풍부한 NIE인 NIE에 있다.
엑손 포함 정도는 엑손 포함 백분율, 예를 들어 주어진 NIE가 포함된 전사체의 백분율로 표현될 수 있다. 요컨대, 엑손 포함 백분율은 엑손 포함 RNA 전사체 양의 평균과 엑손 제외 RNA 전사체 양의 평균의 합에 대한 엑손 포함 RNA 전사체 양의 백분율로 계산할 수 있다.
NSE는 추가 염기 쌍의 스플라이싱의 결과로 생성될 수 있다.
대체 스플라이싱의 정도는 대체 스플라이싱의 백분율, 예를 들어 주어진 NSE가 포함된 전사체의 백분율-나이로 표현될 수 있다. 요약하면 퍼센트 대체 스플라이싱은 NSE가 있는 RNA 전사체 양의 평균과 정규 엑손만 있는 RNA 전사체 양의 평균의 합에 대해 NSE가 있는 RNA 전사체의 양의 퍼센트로 계산할 수 있다.
일부 구현예에서, 포함된 NIE는 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 또는 적어도 약 50% 포함의 결정에 기초한 포함된 NIE로 확인되는 엑손이다. 구현예에서, 포함된 NIE는 약 5% 내지 약 100%, 약 5% 내지 약 95%, 약 5% 내지 약 90%, 약 5% 내지 약 85%, 약 5% 내지 약 80%, 약 5% 내지 약 75%, 약 5% 내지 약 70%, 약 5% 내지 약 65%, 약 5% 내지 약 60%, 약 5% 내지 약 55%, 약 5% 내지 약 50%, 약 5% 내지 약 45%, 약 5% 내지 약 40%, 약 5% 내지 약 35%, 약 5% 내지 약 30%, 약 5% 내지 약 25%, 약 5% 내지 약 20%, 약 5% 내지 약 15%, 약 10% 내지 약 100%, 약 10% 내지 약 95%, 약 10% 내지 약 90%, 약 10% 내지 약 85%, 약 10% 내지 약 80%, 약 10% 내지 약 75%, 약 10% 내지 약 70%, 약 10% 내지 약 65%, 약 10% 내지 약 60%, 약 10% 내지 약 55%, 약 10% 내지 약 50%, 약 10% 내지 약 45%, 약 10% 내지 약 40%, 약 10% 내지 약 35%, 약 10% 내지 약 30%, 약 10% 내지 약 25%, 약 10% 내지 약 20%, 약 15% 내지 약 100%, 약 15% 내지 약 95%, 약 15% 내지 약 90%, 약 15% 내지 약 85%, 약 15% 내지 약 80%, 약 15% 내지 약 75%, 약 15% 내지 약 70%, 약 15% 내지 약 65%, 약 15% 내지 약 60%, 약 15% 내지 약 55%, 약 15% 내지 약 50%, 약 15% 내지 약 45%, 약 15% 내지 약 40%, 약 15% 내지 약 35%, 약 15% 내지 약 30%, 약 15% 내지 약 25%, 약 20% 내지 약 100%, 약 20% 내지 약 95%, 약 20% 내지 약 90%, 약 20% 내지 약 85%, 약 20% 내지 약 80%, 약 20% 내지 약 75%, 약 20% 내지 약 70%, 약 20% 내지 약 65%, 약 20% 내지 약 60%, 약 20% 내지 약 55%, 약 20% 내지 약 50%, 약 20% 내지 약 45%, 약 20% 내지 약 40%, 약 20% 내지 약 35%, 약 20% 내지 약 30%, 약 25% 내지 약 100%, 약 25% 내지 약 95%, 약 25% 내지 약 90%, 약 25% 내지 약 85%, 약 25% 내지 약 80%, 약 25% 내지 약 75%, 약 25% 내지 약 70%, 약 25% 내지 약 65%, 약 25% 내지 약 60%, 약 25% 내지 약 55%, 약 25% 내지 약 50%, 약 25% 내지 약 45%, 약 25% 내지 약 40%, 또는 약 25% 내지 약 35% 포함의 결정에 기초한 포함된 NIE로 확인되는 엑손이다. ENCODE 데이터(예를 들어, 문헌[Tilgner, 등, 2012, "Deep sequencing of subcellular RNA fractions shows splicing to be predominantly co-transcriptional in the human genome but inefficient for lncRNAs," Genome Research 22(9):1616-25]에 기재됨)는 엑손 포함을 확인하는 데 도움을 주기 위해 사용할 수 있다.
일부 구현예에서, 세포를 PKD2 프리-mRNA 전사체의 표적화 부분에 상보적인 ASO와 접촉시키는 것은 ASO 부재/처리 부재 시 세포에 의해 생성된 단백질의 양과 비교하여 적어도 10, 20, 30, 40, 50, 60, 80, 100, 150, 200, 250, 300, 350, 400, 450, 500, 또는 1000%까지 생성된 폴리시스틴 2의 양을 증가시킨다. 일부 구현예에서, 안티센스 올리고머는 접촉되는 세포에 의해 생산된 폴리시스틴 2의 총량은 대조군 화합물에 의해 생성된 표적 단백질의 양과 비교하여 약 20% 내지 약 300%, 약 50% 내지 약 300%, 약 100% 내지 약 300%, 약 150% 내지 약 300%, 약 20% 내지 약 50%, 약 20% 내지 약 100%, 약 20% 내지 약 150%, 약 20% 내지 약 200%, 약 20% 내지 약 250%, 약 50% 내지 약 100%, 약 50% 내지 약 150%, 약 50% 내지 약 200%, 약 50% 내지 약 250%, 약 100% 내지 약 150%, 약 100% 내지 약 200%, 약 100% 내지 약 250%, 약 150% 내지 약 200%, 약 150% 내지 약 250%, 약 200% 내지 약 250%, 적어도 약 10%, 적어도 약 20%, 적어도 약 50%, 적어도 약 100%, 적어도 약 150%, 적어도 약 200%, 적어도 약 250%, 또는 적어도 약 300% 증가된다. 일부 구현예에서, 안티센스 올리고머는 접촉되는 세포에 의해 생성된 폴리시스틴 2의 총량은 대조군 화합물에 의해 생성된 표적 단백질의 양과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다. 대조군 화합물은 예를 들어 프리-mRNA의 표적화 부분에 상보적이지 않은 올리고뉴클레오티드일 수 있다.
일부 구현예에서, 세포를 PKD2 프리-mRNA 전사체의 표적화 부분에 상보적인 ASO와 접촉시키는 것은 표적 단백질을 인코딩하는 성숙 mRNA를 포함하여 PKD2를 인코딩하는 mRNA의 양을 증가시킨다. 일부 구현예에서, 폴리시스틴 2를 인코딩하는 mRNA, 또는 폴리시스틴 2를 인코딩하는 성숙 mRNA의 양은 ASO 부재/처리 부재 시 세포에 의해 생성된 단백질의 양과 비교하여 적어도 10, 20, 30, 40, 50, 60, 80, 100, 150, 200, 250, 300, 350, 400, 450, 500, 또는 1000%까지 증가된다. 일부 구현예에서, 폴리시스틴 2를 인코딩하는 mRNA, 또는 안티센스 올리고머는 접촉되는 세포에서 생산된 폴리시스틴 2를 인코딩하는 성숙 mRNA의 총량은 처리되지 않은 세포, 예를 들어, 처리되지 않은 세포 또는 대조군 화합물로 처리된 세포에서 생산된 성숙 RNA의 양과 비교하여 약 20% 내지 약 300%, 약 50% 내지 약 300%, 약 100% 내지 약 300%, 약 150% 내지 약 300%, 약 20% 내지 약 50%, 약 20% 내지 약 100%, 약 20% 내지 약 150%, 약 20% 내지 약 200%, 약 20% 내지 약 250%, 약 50% 내지 약 100%, 약 50% 내지 약 150%, 약 50% 내지 약 200%, 약 50% 내지 약 250%, 약 100% 내지 약 150%, 약 100% 내지 약 200%, 약 100% 내지 약 250%, 약 150% 내지 약 200%, 약 150% 내지 약 250%, 약 200% 내지 약 250%, 적어도 약 10%, 적어도 약 20%, 적어도 약 50%, 적어도 약 100%, 적어도 약 150%, 적어도 약 200%, 적어도 약 250%, 또는 적어도 약 300% 증가된다. 일부 구현예에서, 폴리시스틴 2를 인코딩하는 mRNA, 또는 안티센스 올리고머는 접촉되는 세포에서 생산된 폴리시스틴 2를 인코딩하는 성숙 mRNA의 총량은 처리되지 않은 세포, 예를 들어, 처리되지 않은 세포 또는 대조군 화합물로 처리된 세포에서 생산된 성숙 RNA의 양과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다 대조군 화합물은 예를 들어 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적이지 않은 올리고뉴클레오티드일 수 있다.
일부 구현예에서, 세포를 PKD2 프리-mRNA 전사체의 표적화 부분에 상보적인 ASO와 접촉시키는 것은 ASO 부재/처리 부재 시 세포에 의해 생성된 단백질의 양과 비교하여 적어도 10, 20, 30, 40, 50, 60, 80, 100%까지 생성된 폴리시스틴 2의 양을 증가시킨다. 일부 구현예에서, 일부 구현예에서, 안티센스 올리고머는 접촉되는 세포에 의해 생성된 폴리시스틴 2의 총량은 대조군 화합물에 의해 생성된 표적 단백질의 양과 비교하여 약 20% 내지 약 100%, 약 50% 내지 약 100%, 약 20% 내지 약 50%, 또는 약 20% 내지 약 100% 감소된다. 일부 구현예에서, 안티센스 올리고머는 접촉되는 세포에 의해 생성된 폴리시스틴 2의 총량은 대조군 화합물에 의해 생성된 표적 단백질의 양과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 감소된다. 대조군 화합물은 예를 들어 프리-mRNA의 표적화 부분에 상보적이지 않은 올리고뉴클레오티드일 수 있다.
일부 구현예에서, 폴리시스틴 2를 인코딩하는 mRNA의 수준은 대조군 세포, 예를 들어 안티센스 올리고머로 처리되지 않은 것 또는 PKD2 함유 프리-mRNA의 표적화 부분에 결합하지 않는 안티센스 올리고머로 처리된 것에서 생산되는 폴리시스틴 2를 인코딩하는 mRNA의 양과 비교할 때 1.1 내지 10배 감소된다.
일부 구현예에서, 폴리시스틴 2를 인코딩하는 mRNA의 수준은 대조군 세포, 예를 들어 안티센스 올리고머로 처리되지 않은 것 또는 PKD2 프리-mRNA의 표적화 부분에 결합하지 않는 안티센스 올리고머로 처리된 것에서 생산되는 폴리시스틴 2를 인코딩하는 mRNA의 양과 비교할 때 1.1 내지 10배 감소된다.
본 발명의 일부 구현예에서, 대상체는 PKD2에서 돌연변이를 가질 수 있다. 미스센스 변이체, 넌센스 변이체, 단일- 및 이중-뉴클레오티드 삽입 및 결실, 복합 삽입/결실, 및 스플라이스 부위 변이체를 비롯한 다양한 병원성 변이가 PKD2 결핍을 야기하는 것으로 보고되었다. 이 병원성 변이체가 존재하는 경우, 전사체의 약 2%-5%가 올바르게 스플라이싱되어 잔류 효소 활성이 허용된다. 일부 구현예에서, 질환은 절단된 단백질 또는 입체형태가 변경되거나 활성이 감소된 단백질을 생성하는 PKD2 병원성 변이체에 의해 야기되는 PKD2 기능의 손실로부터 발생한다.
일부 구현예에서, 당업계에 공지되고 상기 기재된 임의의 PKD2 돌연변이를 갖는 대상체는 본원에 기재된 방법 및 조성물을 사용하여 치료될 수 있다. 일부 구현예에서, 돌연변이는 임의의 PKD2 인트론 또는 엑손 내에 있다. 일부 구현예에서, 돌연변이는 PKD2 엑손 2, 3 또는 4 내에 있다.
NIE는 임의의 길이일 수 있다. 일부 구현예에서, NIE는 인트론의 전체 서열을 포함하지 않는다. 일부 구현예에서, NIE는 인트론의 전체 서열 및 인트론 업스트림의 엑손의 전체 서열 및 인트론 다운스트림의 엑손의 전체 서열을 포함한다. 일부 구현예에서, NIE는 인트론의 일부일 수 있다. 일부 구현예에서, NIE는 정규 인트론 서열의 5' 말단 부분을 포함할 수 있다. 일부 구현예에서, NIE는 정규 인트론의 정규 5'ss 서열을 포함할 수 있다. 일부 구현예에서, NIE는 정규 인트론의 3' 말단 부분을 포함할 수 있다. 일부 구현예에서, NIE는 정규 인트론의 정규 3'ss 서열을 포함할 수 있다. 일부 구현예에서, NIE는 인트론의 정규 5'ss 서열을 포함하지 않고 인트론 내의 부분일 수 있다. 일부 구현예에서, NIE는 인트론의 정규 3'ss 서열을 포함하지 않고 인트론 내의 부분일 수 있다. 일부 구현예에서, NIE는 인트론의 정규 5'ss 서열 또는 표준 3'ss 서열을 포함하지 않는 인트론 내의 부분일 수 있다. 일부 구현예에서, NIE는 길이가 5개의 뉴클레오티드 내지 10개의 뉴클레오티드, 10개의 뉴클레오티드 내지 15개의 뉴클레오티드, 15개의 뉴클레오티드 내지 20개의 뉴클레오티드, 20개의 뉴클레오티드 내지 25개의 뉴클레오티드, 25개의 뉴클레오티드 내지 30개의 뉴클레오티드, 30개의 뉴클레오티드 내지 35개의 뉴클레오티드, 35개의 뉴클레오티드 내지 40개의 뉴클레오티드, 40개의 뉴클레오티드 내지 45개의 뉴클레오티드, 45개의 뉴클레오티드 내지 50개의 뉴클레오티드, 50개의 뉴클레오티드 내지 55개의 뉴클레오티드, 55개의 뉴클레오티드 내지 60개의 뉴클레오티드, 60개의 뉴클레오티드 내지 65개의 뉴클레오티드, 65개의 뉴클레오티드 내지 70개의 뉴클레오티드, 70개의 뉴클레오티드 내지 75개의 뉴클레오티드, 75개의 뉴클레오티드 내지 80개의 뉴클레오티드, 80개의 뉴클레오티드 내지 85개의 뉴클레오티드, 85개의 뉴클레오티드 내지 90개의 뉴클레오티드, 90개의 뉴클레오티드 내지 95개의 뉴클레오티드, 또는 95개의 뉴클레오티드 내지 100개의 뉴클레오티드일 수 있다. 일부 구현예에서, NIE는 길이가 적어도 10개의 뉴클레오티드, 적어도 20개의 뉴클레오티드, 적어도 30개의 뉴클레오티드, 적어도 40개의 뉴클레오티드, 적어도 50개의 뉴클레오티드, 적어도 60개의 뉴클레오티드, 적어도 70개의 뉴클레오티드, 적어도 80개의 뉴클레오티드, 적어도 90개의 뉴클레오티드, 또는 적어도 100개의 뉴클레오티드일 수 있다. 일부 구현예에서, NIE는 길이가 100 내지 200개의 뉴클레오티드, 200 내지 300개의 뉴클레오티드, 300 내지 400개의 뉴클레오티드, 400 내지 500개의 뉴클레오티드, 500 내지 600개의 뉴클레오티드, 600 내지 700개의 뉴클레오티드, 700 내지 800개의 뉴클레오티드, 800 내지 900개의 뉴클레오티드, 900 내지 1,000개의 뉴클레오티드일 수 있다. 일부 구현예에서, NIE는 길이가 1,000개 초과의 뉴클레오티드일 수 있다.
NIE의 포함은 전사체를 NMD의 표적으로 만드는 성숙 mRNA 전사체에서 틀이동 및 조기 종결 코돈(PTC)(또는 조기 종결 코돈)의 도입으로 이어질 수 있다. NIE를 함유하는 성숙 mRNA 전사체는 단백질 발현을 일으키지 않는 비-생산적인 mRNA 전사체일 수 있다. PTC는 NIE의 다운스트림 위치에 존재할 수 있다. 일부 구현예에서, PTC는 NIE의 임의의 엑손 다운스트림에 존재할 수 있다. 일부 구현예에서, PTC는 NIE 내에 존재할 수 있다. 예를 들어, PKD2 유전자에 의해 인코딩된 mRNA 전사체에 PKD2 프리-mRNA의 엑손 2x가 포함되면 mRNA 전사체에서 PTC를 유도할 수 있다. 예를 들어, PKD2에 의해 인코딩된 mRNA 전사체에 PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140)이 포함된다.
치료제
일부 구현예에서, 본원에 사용된 제제는 치료제를 지칭한다. 일부 구현예에서, 본원에 사용된 치료제는 제제를 지칭한다.
본 개시내용의 다양한 구현예에서, PKD2의 단백질 발현 수준을 조절하기 위해 치료제를 포함하는 조성물 및 방법이 제공된다. 일부 구현예에서, PKD2 프리-mRNA의 대체 스플라이싱을 조절하기 위한 조성물 및 방법이 본원에 제공된다. 일부 구현예에서, PKD2 프리-mRNA의 스플라이싱에서 엑손 스킵핑을 유도하기 위한, 예를 들어, PKD2 프리-mRNA의 스플라이싱 동안 NMD 엑손의 스킵핑을 유도하기 위한 조성물 및 방법이 본원에서 제공된다. 다른 구현예에서, 치료제는 단백질 발현 수준을 감소시키기 위해 엑손의 포함을 유도하는데 사용될 수 있다.
본원에 개시된 치료제는 NIE 억제제일 수 있다. 치료제는 다핵산 폴리머를 포함할 수 있다. 본원에 개시된 치료제는 대체 스플라이싱 억제제일 수 있다. 일부 구현예에서, 치료제는 다핵산 폴리머를 포함할 수 있다. 다른 구현예에서, 치료제는 소분자를 포함할 수 있다. 다른 구현예에서, 치료제는 폴리펩티드를 포함할 수 있다. 일부 구현예에서, 치료제는 핵산 분자와 복합체를 형성하거나 복합체를 형성하지 않는 핵산 결합 단백질이다. 다른 구현예에서, 치료제는 또 다른 치료제를 인코딩하는 핵산 분자이다. 추가 구현예에서, 치료제는 아데노바이러스 연관 벡터와 같은 바이러스 전달 시스템에 통합된다.
본 발명의 한 양태에 따르면, 기능성 폴리시스틴 2 또는 폴리시스틴 1 결핍과 연관된 병태 또는 질환의 치료 또는 예방 방법이 본원에 제공되며, 방법은 기능성 폴리시스틴 2의 수준을 증가시키기 위해 대상체에게 NIE 억제제를 투여하는 것을 포함하고, 여기서 제제는 성숙 전사체에서 NIE의 포함을 감소시키기 위해 프리-mRNA 전사체의 영역에 결합한다. 예를 들어, 기능성 폴리시스틴 2 또는 폴리시스틴 1 결핍과 연관된 병태의 치료 또는 예방 방법이 본원에 제공되며, 방법은 기능성 폴리시스틴 2의 수준을 증가시키기 위해 대상체에게 NIE 억제제를 투여하는 것을 포함하고, 여기서 제제는 프리-mRNA 전사체의 NIE(예를 들어, PKD2의 엑손 2x)를 함유하는 인트론의 영역 또는 동일한 인트론 내의 NIE-활성화 조절 서열에 결합한다. 예를 들어, 기능성 폴리시스틴 2 또는 폴리시스틴 1 결핍과 연관된 병태의 치료 또는 예방 방법이 본원에 제공되며, 방법은 기능성 폴리시스틴 2의 수준을 증가시키기 위해 대상체에게 NIE 억제제를 투여하는 것을 포함하고, 여기서 제제는 프리-mRNA 전사체의 NIE(예를 들어, PKD2의 엑손 (GRCh38/ hg38: chr4:88031085 88031140))를 함유하는 인트론의 영역 또는 동일한 인트론 내의 NIE-활성화 조절 서열에 결합한다. 추가로 예를 들어, 기능성 폴리시스틴 2 또는 폴리시스틴 1 결핍과 연관된 병태의 치료 또는 예방 방법이 본원에 제공되며, 방법은 기능성 폴리시스틴 2의 수준을 증가시키기 위해 대상체에게 대체 스플라이싱 억제제를 투여하는 것을 포함하고, 여기서 제제는 프리-mRNA 전사체의 엑손 또는 인트론(예를 들어, 인간 PKD2 유전자의 엑손 3 또는 4, 인트론 2, 3 또는 4)의 영역에 결합한다.
본 발명의 한 양태에 따르면, 기능성 폴리시스틴 2 또는 폴리시스틴 1 결핍과 연관된 병태의 치료 또는 예방 방법이 본원에 제공되며, 방법은 기능성 폴리시스틴 2의 수준을 증가시키기 위해 대상체에게 대체 스플라이싱 억제제를 투여하는 것을 포함하고, 여기서 제제는 성숙 전사체에서 NSE의 포함을 감소시키기 위해 프리-mRNA 전사체의 영역에 결합한다.
대안적으로, 기능성 표적 단백질 과발현과 연관된 병태의 치료 또는 예방 방법이 본원에 제공되며, 방법은 기능성 표적 단백질의 수준을 감소시키기 위해 대상체에게 대체 스플라이싱 억제제를 투여하는 것을 포함하고, 여기서 제제는 프리-mRNA 전사체의 엑손 또는 인트론 영역에 결합하며, 표적 단백질은 폴리시스틴 2이다.
성숙 mRNA에서 NIE 포함을 감소시키는 것을 언급하는 경우, 감소는 완전할 수 있고, 예를 들어 100%일 수 있거나 부분적일 수 있다. 감소는 임상적으로 유의적일 수 있다. 감소/보정은 치료를 받지 않은 대상체에서 NIE 포함 수준에 상대적이거나 유사한 대상체의 집단에서 NIE 포함의 양에 상대적일 수 있다. 감소/보정은 평균 대상체 또는 치료 전 대상체에 비해 NIE 포함이 적어도 10% 더 적을 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 NIE 포함이 적어도 20% 적을 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 NIE 포함이 적어도 40% 적을 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 NIE 포함이 적어도 50% 적을 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 NIE 포함이 적어도 60% 적을 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 NIE 포함이 적어도 80% 적을 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 NIE 포함이 적어도 90% 적을 수 있다.
활성 폴리시스틴 2 수치 증가에 대한 언급이 있는 경우, 증가는 임상적으로 유의적일 수 있다. 증가는 치료를 받지 않은 대상체에서 활성 폴리시스틴 2의 수준에 상대적이거나 유사한 대상체의 집단에서 활성 폴리시스틴 2의 양에 상대적일 수 있다. 증가는 평균 대상체 또는 치료 전 대상체에 비해 적어도 10% 초과 활성의 폴리시스틴 2일 수 있다. 증가는 평균 대상체 또는 치료 전 대상체에 비해 적어도 20% 초과 활성의 폴리시스틴 2일 수 있다. 증가는 평균 대상체 또는 치료 전 대상체에 비해 적어도 40% 초과 활성의 폴리시스틴 2일 수 있다. 증가는 평균 대상체 또는 치료 전 대상체에 비해 적어도 50% 초과 활성의 폴리시스틴 2일 수 있다. 증가는 평균 대상체 또는 치료 전 대상체에 비해 적어도 80% 초과 활성의 폴리시스틴 2일 수 있다. 증가는 평균 대상체 또는 치료 전 대상체에 비해 적어도 100% 초과 활성의 폴리시스틴 2일 수 있다. 증가는 평균 대상체 또는 치료 전 대상체에 비해 적어도 200% 초과 활성의 폴리시스틴 2일 수 있다. 증가는 평균 대상체 또는 치료 전 대상체에 비해 적어도 500% 초과 활성의 폴리시스틴 2일 수 있다.
기능성 폴리시스틴 2 수준의 감소에 대해 언급한 경우, 그 감소는 임상적으로 유의적일 수 있다. 감소는 치료를 받지 않은 대상체에서 기능성 폴리시스틴 2의 수준에 상대적이거나 유사한 대상체의 집단에서 기능성 폴리시스틴 2의 양에 상대적일 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 적어도 10% 적은 기능성 폴리시스틴 2일 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 적어도 20% 적은 기능성 폴리시스틴 2일 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 적어도 40% 적은 기능성 폴리시스틴 2일 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 적어도 50% 적은 기능성 폴리시스틴 2일 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 적어도 80% 적은 기능성 폴리시스틴 2일 수 있다. 감소는 평균 대상체 또는 치료 전 대상체에 비해 적어도 100% 적은 기능성 폴리시스틴 2일 수 있다.
NIE 억제제가 다핵산 폴리머를 포함하는 구현예에서, 다핵산 폴리머는 길이가 약 50개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 45개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 40개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 35개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 30개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 24개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 25개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 20개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 19개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 18개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 17개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 16개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 15개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 14개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 13개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 12개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 11개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 50개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 45개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 40개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 35개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 30개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10 내지 약 25개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 20개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 15개 내지 약 25개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 15개 내지 약 30개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 12개 내지 약 30개의 뉴클레오티드일 수 있다.
대체 스플라이싱 억제제가 다핵산 폴리머를 포함하는 구현예에서, 다핵산 폴리머는 길이가 약 50개의 뉴클레오티드일 수 있다. 대체 스플라이싱 조절제가 다핵산 폴리머를 포함하는 구현예에서, 다핵산 폴리머는 길이가 약 50개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 45개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 40개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 35개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 30개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 24개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 25개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 20개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 19개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 18개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 17개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 16개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 15개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 14개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 13개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 12개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 11개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 50개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 45개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 40개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 35개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 30개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10 내지 약 25개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 10개 내지 약 20개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 15개 내지 약 25개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 15개 내지 약 30개의 뉴클레오티드일 수 있다. 다핵산 폴리머는 길이가 약 12개 내지 약 30개의 뉴클레오티드일 수 있다.
다핵산 폴리머의 서열은 mRNA 전사체, 예를 들어 부분적으로 프로세싱된 mRNA 전사체의 표적 서열에 대해 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.5% 상보적이다. 다핵산 폴리머의 서열은 프리-mRNA 전사체의 표적 서열에 100% 상보적일 수 있다.
다핵산 폴리머의 서열은 프리-mRNA 전사체의 표적 서열에 대해 4개 이하의 미스매치를 가질 수 있다. 다핵산 폴리머의 서열은 프리-mRNA 전사체의 표적 서열에 대해 3개 이하의 미스매치를 가질 수 있다. 다핵산 폴리머의 서열은 프리-mRNA 전사체의 표적 서열에 대해 2개 이하의 미스매치를 가질 수 있다. 다핵산 폴리머의 서열은 프리-mRNA 전사체의 표적 서열에 대해 1개 이하의 미스매치를 가질 수 있다. 다핵산 폴리머의 서열은 프리-mRNA 전사체의 표적 서열에 대한 미스매치를 갖지 않을 수 있다.
다핵산 폴리머는 프리-mRNA 전사체의 표적 서열에 특이적으로 혼성화할 수 있다. 예를 들어, 다핵산 폴리머는 프리-mRNA 전사체의 표적 서열에 대해 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5% 또는 100% 서열 상보성을 가질 수 있다. 혼성화는 매우 엄격한 혼성화 조건 하에서 이루어질 수 있다.
다핵산 폴리머는 표 4에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.5% 서열 동일성을 갖는 서열을 포함한다. 다핵산 폴리머는 표 4에 열거된 서열로 이루어진 군으로부터 선택된 서열과 100% 서열 동일성을 갖는 서열을 포함할 수 있다. 다핵산 폴리머는 표 4에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.5% 서열 동일성을 갖는 서열이다. 다핵산 폴리머는 표 4에 열거된 서열로 이루어진 군으로부터 선택된 서열과 100% 서열 동일성을 갖는 서열이다.
다핵산 폴리머 서열에 대한 언급이 있는 경우, 당업자는 하나 이상의 치환이 허용될 수 있고, 임의로 2개의 치환이 표적 서열에 혼성화하는 능력을 유지하도록 서열에서 허용될 수 있거나; 또는 치환이 표적 서열에 있는 경우, 능력은 표적 서열로 인식됨을 이해할 것이다. 서열 동일성에 대한 참조는 표준/디폴트 매개변수를 사용하여 BLAST 서열 정렬에 의해 결정될 수 있다. 예를 들어, 서열은 99% 동일성을 가질 수 있고 여전히 본 개시내용에 따라 기능할 수 있다. 다른 구현예에서, 서열은 98% 동일성을 가질 수 있고 여전히 본 개시내용에 따라 기능할 수 있다. 또 다른 구현예에서, 서열은 95% 동일성을 가질 수 있고 여전히 본 개시내용에 따라 기능할 수 있다. 또 다른 구현예에서, 서열은 90% 동일성을 가질 수 있고 여전히 본 개시내용에 따라 기능할 수 있다.
안티센스 올리고머
PKD2 NIE 함유 프리-mRNA의 표적화 부분에 결합함으로써 엑손 스킵핑을 유도하는 안티센스 올리고머를 포함하는 조성물이 본원에서 제공된다. 본원에서 사용되는 용어 "ASO" 및 "안티센스 올리고머"는 상호교환적으로 사용되며 왓슨-크릭 염기쌍 형성 또는 워블 염기쌍 형성 (G-U)에 의해 표적 핵산(예를 들어, PKD2 NIE 함유 프리-mRNA) 서열에 혼성화하는 핵염기를 포함하는 폴리뉴클레오티드와 같은 올리고머를 지칭한다. ASO는 표적 서열에 상보적인 정확한 서열 또는 거의 상보성(예를 들어, 표적 서열에 결합하고 스플라이스 부위에서 스플라이싱을 향상시키기에 충분한 상보성)을 가질 수 있다. ASO는 표적 핵산(예를 들어, 프리-mRNA 전사체의 표적화 부분)에 결합(혼성화)하고 생리학적 조건 하에서 혼성화된 상태를 유지하도록 설계된다. 전형적으로 의도한 (표적화된) 핵산 서열이 아닌 다른 부위에 혼성화되면 표적 핵산이 아닌 제한된 수의 서열(표적 핵산 이외의 일부 부위)에 혼성화한다. ASO의 설계는 프리-mRNA 전사체의 표적화 부분의 핵산 서열 또는 게놈 또는 세포 프리-mRNA 또는 전사체의 다른 위치에서 충분히 유사한 핵산 서열의 발생을 고려할 수 있고, 이로써 ASO가 다른 부위에 결합하여 "표적외" 효과를 유발할 가능성은 제한된다. 예를 들어 WO 2015/035091로 공개된 "Reducing Nonsense-Mediated mRNA Decay"라는 제목의 PCT 출원 번호 PCT/US2014/054151에서 당업계에 공지된 임의의 안티센스 올리고머는 본원에 참조로 포함되며 본원에서 기재된 방법을 실시하는 데 사용될 수 있다.
일부 구현예에서, ASO는 표적 핵산 또는 NIE 함유 프리-mRNA의 표적화 부분에 "특이적으로 혼성화"하거나 "특이적"이다. 전형적으로, 이러한 혼성화는 실질적으로 37℃ 초과, 바람직하게는 적어도 50℃, 전형적으로 60℃ 내지 약 90℃ 사이의 Tm으로 발생한다. 이러한 혼성화는 바람직하게는 엄격한 혼성화 조건에 해당한다. 주어진 이온 강도 및 pH에서, Tm은 표적 서열의 50%가 상보적인 올리고뉴클레오티드에 혼성화되는 온도이다.
올리고뉴클레오티드와 같은 올리고머는 혼성화가 2개의 단일 가닥 폴리뉴클레오티드 사이에 역평행 배열로 발생할 때 서로 "상보적"이다. 이중 가닥 폴리뉴클레오티드는 제1 폴리뉴클레오티드의 가닥 중 하나와 제2 가닥 사이에 혼성화가 발생할 수 있는 경우 다른 폴리뉴클레오티드에 대해 "상보적"일 수 있다. 상보성(하나의 폴리뉴클레오티드가 다른 폴리뉴클레오티드와 상보적인 정도)은 일반적으로 허용되는 염기쌍 형성 규칙에 따라 서로 수소 결합을 형성할 것으로 예상되는 대향 가닥의 염기 비율(예를 들어, 백분율)로 정량화할 수 있다. 안티센스 올리고머(ASO)의 서열은 혼성화하기 위해 표적 핵산의 서열에 100% 상보적일 필요는 없다. 특정 구현예에서, ASO는 표적화되는 표적 핵산 서열 내의 표적 영역에 대한 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 상보성을 갖는다. 예를 들어, 올리고머 화합물의 20개 핵염기 중 18개가 표적 영역에 상보적이어서 특이적으로 혼성화되는 ASO는 90% 상보성을 나타낼 것이다. 이 예에서, 나머지 비-상보적 핵염기는 함께 클러스터링되거나 상보적 핵염기와 산재될 수 있으며 서로 또는 상보적 핵염기에 연속할 필요는 없다. 표적 핵산 영역과 ASO의 퍼센트 상보성은 당업계에 공지된 BLAST 프로그램(기본 로컬 정렬 검색 도구) 및 PowerBLAST 프로그램을 사용하여 일상적으로 결정될 수 있다(Altschul, 등, J. Mol. Biol., 1990, 215, 403-410; Zhang and Madden, Genome Res., 1997, 7, 649-656).
ASO는 표적 서열의 모든 핵염기에 혼성화할 필요는 없으며 혼성화하는 핵염기는 연속하거나 비연속적일 수 있다. ASO는 프리-mRNA 전사체의 하나 이상의 세그먼트에 걸쳐 혼성화할 수 있으므로, 개재 또는 인접 세그먼트가 혼성화 이벤트에 관여하지 않는다(예를 들어, 루프 구조 또는 헤어핀 구조가 형성될 수 있음). 특정 구현예에서, ASO는 표적 프리-mRNA 전사체에서 비연속적 핵염기에 혼성화한다. 예를 들어, ASO는 ASO가 혼성화하지 않는 하나 이상의 핵염기(들)에 의해 분리된 프리-mRNA 전사체의 핵염기에 혼성화할 수 있다.
본원에 기재된 ASO는 NIE 함유 프리-mRNA의 표적화 부분에 존재하는 핵염기에 상보적인 핵염기를 포함한다. 용어 ASO는 표적 mRNA 상의 상보적 핵염기에 혼성화할 수 있는 핵염기를 포함하지만 펩티드 핵산(PNA)과 같은 당 모이어티를 포함하지 않는 임의의 다른 올리고머 분자 올리고뉴클레오티드 및를 구현한다. ASO는 자연 발생 뉴클레오티드, 뉴클레오티드 유사체, 변형된 뉴클레오티드, 또는 이들 중 2개 또는 3개의 임의의 조합을 포함할 수 있다. "자연 발생 뉴클레오티드"라는 용어는 데옥시리보뉴클레오티드 및 리보뉴클레오티드를 포함한다. 용어 "변형된 뉴클레오티드"는 변형되거나 치환된 당 그룹 및/또는 변형된 백본을 갖는 뉴클레오티드를 포함한다. 일부 구현예에서, ASO의 모든 뉴클레오티드는 변형된 뉴클레오티드이다. 본원에 기재된 방법 및 조성물과 상용성인 ASO 또는 ASO의 성분의 화학적 변형은 당업자에게 명백할 것이며, 예를 들어 본원에 그 전문이 참조로 포함된 문헌[미국 특허 제8,258,109 B2호, 미국 특허 제5,656,612호, 미국 특허 공개 제2012/0190728호, 및 Dias and Stein, Mol. Cancer Ther. 2002, 347-355]에 찾을 수 있다.
ASO의 하나 이상의 핵염기는 아데닌, 구아닌, 시토신, 티민 및 우라실과 같은 임의의 자연 발생 비변형 핵염기, 또는 표적 프리-mRNA에 존재하는 핵염기와 수소 결합할 수 있도록 변형되지 않은 핵염기와 충분히 유사한 임의의 합성 또는 변형된 핵염기일 수 있다. 변형된 핵염기의 예는 하이포크산틴, 크산틴, 7-메틸구아닌, 5,6-디하이드로유라실, 5-메틸시토신 및 5-하이드록시메토일시토신을 포함하나 이에 제한되지 않는다.
본원에 기재된 ASO는 또한 올리고머의 성분을 연결하는 백본 구조를 포함한다. "백본 구조" 및 "올리고머 연결"이라는 용어는 상호교환적으로 사용될 수 있으며 ASO의 모노머 사이의 연결을 지칭한다. 자연 발생 올리고뉴클레오티드에서, 백본은 올리고머의 당 모이어티를 연결하는 3'-5' 포스포디에스테르 연결을 포함한다. 본원에 기재된 ASO의 백본 구조 또는 올리고머 연결은 포스포로티오에이트, 포스포로디티오에이트, 포스포로셀레노에이트, 포스포로디셀레노에이트, 포스포로아닐로티오에이트, 포스포라닐라데이트, 포스포르아미데이트 등을 (비제한적으로) 포함할 수 있다. 예를 들어, 문헌[LaPlanche, 등, Nucleic Acids Res. 14:9081 (1986); Stec, 등, J. Am. Chem. Soc. 106:6077 (1984), Stein, 등, Nucleic Acids Res. 16:3209 (1988), Zon, 등, Anti-Cancer Drug Design 6:539 (1991); Zon, 등, Oligonucleotides and Analogues: A Practical Approach, pp. 87-108 (F. Eckstein, Ed., Oxford University Press, Oxford England (1991)); Stec, 등, 미국 특허 제5,151,510호; Uhlmann 및 Peyman, Chemical Reviews 90:543 (1990)] 참조. 일부 구현예에서, ASO의 백본 구조는 인을 함유하지 않고 오히려 예를 들어 펩티드 핵산(PNA)에서 펩티드 결합, 또는 카바메이트, 아미드, 선형 및 고리형 탄화수소 기를 포함하는 연결기를 함유한다. 일부 구현예에서, 백본 변형은 포스포로티오에이트 연결이다. 일부 구현예에서, 백본 변형은 포스포르아미데이트 연결이다.
일부 구현예에서, ASO 백본의 각각의 인 뉴클레오티드간 연결에서의 입체화학은 무작위적이다. 일부 구현예에서, ASO 백본의 각각의 인 뉴클레오티드간 연결에서의 입체화학은 조절되며 랜덤하지 않다. 예를 들어, 미국 특허 출원 공개 제2014/0194610호, "Methods for the Synthesis of Functionalized Nucleic Acids"(본원에 참조로 포함됨)는 핵산 올리고머의 각 인 원자에서 키랄성의 손잡이(handedness)를 독립적으로 선택하는 방법을 기재한다. 일부 구현예에서, 본원의 표 5 및 6에 기재된 임의의 ASO를 포함하나 이에 제한되지 않는 본 개시내용의 방법에 사용되는 ASO는 무작위가 아닌 인 뉴클레오티드간 연결을 갖는 ASO를 포함한다. 일부 구현예에서, 본 발명의 방법에 사용되는 조성물은 순수한 부분입체이성질체 ASO를 포함한다. 일부 구현예에서, 본 개시내용의 방법에 사용되는 조성물은 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 약 100%, 약 90% 내지 약 100%, 약 91% 내지 약 100%, 약 92% 내지 약 100%, 약 93% 내지 약 100%, 약 94% 내지 약 100%, 약 95% 내지 약 100%, 약 96% 내지 약 100%, 약 97% 내지 약 100%, 약 98% 내지 약 100%, 또는 약 99% 내지 약 100%의 부분입체이성질체 순도를 갖는 ASO를 포함한다.
일부 구현예에서, ASO는 그의 인 뉴클레오티드간 연결에서 Rp 및 Sp 배열의 비무작위 혼합물을 갖는다. 예를 들어, 양호한 활성과 뉴클레아제 안정성 사이의 균형을 달성하기 위해 안티센스 올리고뉴클레오티드에 Rp와 Sp의 혼합이 필요하다는 것이 제안되었다(문헌[Wan, 등, 2014, "Synthesis, biophysical properties and biological activity of second-generation antisense oligonucleotides containing chiral phosphorothioate linkages," Nucleic Acids Research 42(22): 13456-13468], 이는 본원에 참조로 포함됨). 일부 구현예에서, 본원의 서열번호: 60-191에 기재된 임의의 ASO를 포함하지만 이에 제한되지 않는 본 개시내용의 방법에 사용되는 ASO는 약 5 내지 100% Rp, 적어도 약 5% Rp, 적어도 약 10% Rp, 적어도 약 15% Rp, 적어도 약 20% Rp, 적어도 약 25% Rp, 적어도 약 30% Rp, 적어도 약 35% Rp, 적어도 약 40% Rp, 적어도 약 45% Rp, 적어도 약 50% Rp, 적어도 약 55% Rp, 적어도 약 60% Rp, 적어도 약 65% Rp, 적어도 약 70% Rp, 적어도 약 75% Rp, 적어도 약 80% Rp, 적어도 약 85% Rp, 적어도 약 90% Rp, 또는 적어도 약 95% Rp을 나머지 Sp, 또는 약 100% Rp와 함께 포함한다. 일부 구현예에서, 본원에 제시된 임의의 ASO를 포함하나 이에 제한되지 않는 본 개시내용의 방법에 사용되는 ASO는 서열번호: 60-191 중 어느 하나의 적어도 8개의 인접한 핵산을 포함하는 영역에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함하고, 약 10% 내지 약 100% Rp, 약 15% 내지 약 100% Rp, 약 20% 내지 약 100% Rp, 약 25% 내지 약 100% Rp, 약 30% 내지 약 100% Rp, 약 35% 내지 약 100% Rp, 약 40% 내지 약 100% Rp, 약 45% 내지 약 100% Rp, 약 50% 내지 약 100% Rp, 약 55% 내지 약 100% Rp, 약 60% 내지 약 100% Rp, 약 65% 내지 약 100% Rp, 약 70% 내지 약 100% Rp, 약 75% 내지 약 100% Rp, 약 80% 내지 약 100% Rp, 약 85% 내지 약 100% Rp, 약 90% 내지 약 100% Rp, 또는 약 95% 내지 약 100% Rp, 약 20% 내지 약 80% Rp, 약 25% 내지 약 75% Rp, 약 30% 내지 약 70% Rp, 약 40% 내지 약 60% Rp, 또는 약 45% 내지 약 55% Rp을, 나머지 Sp와 함께 포함한다.
일부 구현예에서, 본원에 제시된 임의의 ASO를 포함하나 이에 제한되지 않는 본 개시내용의 방법에 사용되는 ASO는 서열번호: 60-191 중 어느 하나의 적어도 8개의 인접한 핵산을 포함하는 영역에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함하고 약 5 내지 100% Sp, 적어도 약 5% Sp, 적어도 약 10% Sp, 적어도 약 15% Sp, 적어도 약 20% Sp, 적어도 약 25% Sp, 적어도 약 30% Sp, 적어도 약 35% Sp, 적어도 약 40% Sp, 적어도 약 45% Sp, 적어도 약 50% Sp, 적어도 약 55% Sp, 적어도 약 60% Sp, 적어도 약 65% Sp, 적어도 약 70% Sp, 적어도 약 75% Sp, 적어도 약 80% Sp, 적어도 약 85% Sp, 적어도 약 90% Sp, 또는 적어도 약 95% Sp를 나머지 Rp, 또는 약 100% Sp와 함께 포함한다. 구현예에서, 본원에 제시된 임의의 ASO를 포함하나 이에 제한되지 않는 본 개시내용의 방법에 사용되는 ASO는 약 10% 내지 약 100% Sp, 약 15% 내지 약 100% Sp, 약 20% 내지 약 100% Sp, 약 25% 내지 약 100% Sp, 약 30% 내지 약 100% Sp, 약 35% 내지 약 100% Sp, 약 40% 내지 약 100% Sp, 약 45% 내지 약 100% Sp, 약 50% 내지 약 100% Sp, 약 55% 내지 약 100% Sp, 약 60% 내지 약 100% Sp, 약 65% 내지 약 100% Sp, 약 70% 내지 약 100% Sp, 약 75% 내지 약 100% Sp, 약 80% 내지 약 100% Sp, 약 85% 내지 약 100% Sp, 약 90% 내지 약 100% Sp, 또는 약 95% 내지 약 100% Sp, 약 20% 내지 약 80% Sp, 약 25% 내지 약 75% Sp, 약 30% 내지 약 70% Sp, 약 40% 내지 약 60% Sp, 또는 약 45% 내지 약 55% Sp를 나머지 Rp와 함께 포함한다.
본원에 기재된 임의의 ASO는 자연 발생 뉴클레오티드에 존재하는 리보스 또는 데옥시리보스를 포함하는 당 모이어티, 또는 모폴린 고리를 포함하는 변형된 당 모이어티 또는 당 유사체를 함유할 수 있다. 변형된 당 모이어티의 비제한적 예는 2' 치환 예컨대 2'-O-메틸 (2'-O-Me), 2'-O-메톡시에틸 (2'MOE), 2'-O-아미노에틸, 2'F; N3'->P5' 포스포르아미데이트, 2'디메틸아미노옥시에톡시, 2'디메틸아미노에톡시에톡시, 2'-구아니디니듐, 2'-O-구아니디늄 에틸, 카바메이트 변형된 당, 및 바이사이클릭 변형된 당을 포함한다. 일부 구현예에서, 당 모이어티 변형은 2'-O-Me, 2'F 및 2'MOE로부터 선택된다. 일부 구현예에서, 당 모이어티 변형은 잠금 핵산(LNA)에서와 같은 여분의 다리 결합이다. 일부 구체예에서 당 유사체는 포스포로디아미데이트 모폴리노(PMO)와 같은 모폴린 고리를 함유한다. 일부 구현예에서, 당 모이어티는 리보푸란실 또는 2'데옥시리보푸란실 변형을 포함한다. 일부 구현예에서, 당 모이어티는 2'4'-구속된 2'O-메틸옥시에틸(cMOE) 변형을 포함한다. 일부 구현예에서, 당 모이어티는 cEt 2',4' 구속된 2'-O 에틸 BNA 변형을 포함한다. 일부 구현예에서, 당 모이어티는 트리사이클로DNA(tcDNA) 변형을 포함한다. 일부 구현예에서, 당 모이어티는 에틸렌 핵산(ENA) 변형을 포함한다. 일부 구현예에서, 당 모이어티는 MCE 변형을 포함한다. 변형은 당업계에 공지되어 있고 예를 들어 이 목적을 위해 본원에 참조로 포함되는 문헌[Jarver, 등, 2014, "A Chemical View of Oligonucleotides for Exon Skipping and Related Drug Applications," Nucleic Acid Therapeutics 24(1): 37-47]에 기재되어 있다.
일부 구현예에서, ASO의 각각의 모노머는 동일한 방식으로 변형되는데, 예를 들어 ASO 백본의 각각의 연결은 포스포로티오에이트 연결을 포함하거나 각각의 리보스 당 모이어티는 2'O-메틸 변형을 포함한다. ASO의 각 모노머 성분에 존재하는 이러한 변형을 "균일한 변형"이라고 한다. 일부 예에서, 상이한 변형의 조합이 바람직할 수 있는데, 예를 들어 ASO는 포스포로디아미데이트 연결 및 모폴린 고리(모폴리노)를 포함하는 당 모이어티의 조합을 포함할 수 있다. ASO에 대한 다양한 변형의 조합을 "혼합 변형" 또는 "혼합 화학"이라고 한다.
일부 구현예에서, ASO는 하나 이상의 백본 변형을 포함한다. 일부 구현예에서, ASO는 하나 이상의 당 모이어티 변형을 포함한다. 일부 구현예에서, ASO는 하나 이상의 백본 변형 및 하나 이상의 당 모이어티 변형을 포함한다. 일부 구현예에서, ASO는 2'MOE 변형 및 포스포로티오에이트 백본을 포함한다. 일부 구현예에서, ASO는 포스포로디아미데이트 모폴리노(PMO)를 포함한다. 일부 구현예에서, ASO는 펩티드 핵산(PNA)을 포함한다. 본원에 기재된 임의의 ASO 또는 ASO의 임의의 성분(예를 들어, 핵염기, 당 모이어티, 백본)은 ASO의 원하는 특성 또는 활성을 달성하거나 ASO의 바람직하지 않은 특성 또는 활성을 감소시키기 위해 변형될 수 있다. 예를 들어, ASO 또는 임의의 ASO의 하나 이상의 성분은 프리-mRNA 전사체 상의 표적 서열에 대한 결합 친화도를 향상시키고; 임의의 비-표적 서열에 대한 결합을 감소시키고; 세포 뉴클레아제(즉, RNase H)에 의한 분해를 감소시키고; ASO의 세포 및/또는 세포 핵으로의 흡수를 개선하고; ASO의 약동학 또는 약력학을 변경시키고/거나; ASO의 반감기를 조절하기 위해 변형될 수 있다.
일부 구현예에서, ASO는 2'-O-(2-메톡시에틸)(MOE) 포스포로티오에이트 변형 뉴클레오티드로 구성된다. 이러한 뉴클레오티드로 구성된 ASO는 특히 본원에 개시된 방법에 매우 적합하며; 이러한 변형을 갖는 올리고머는 뉴클레아제 분해에 대한 상당히 향상된 저항성 및 증가된 생체이용률을 갖는 것으로 나타났으며, 예를 들어 본원에 기재된 일부 구현예에서 경구 전달에 적합하도록 한다. 예를 들어, 문헌[Geary, 등, J Pharmacol Exp Ther. 2001; 296(3):890-7; Geary, 등, J Pharmacol Exp Ther. 2001; 296(3):898-904] 참조.
ASO를 합성하는 방법은 당업자에게 공지될 것이다. 대안으로 또는 추가로 ASO는 상업적 공급원으로부터 얻을 수 있다.
달리 명시되지 않는 한, 단일 가닥 핵산(예를 들어, 프리-mRNA 전사체, 올리고뉴클레오티드, ASO 등) 서열의 왼쪽 말단은 5' 말단이고, 단일 또는 이중 가닥 핵산의 왼쪽 방향은 5' 방향으로 지칭된다. 마찬가지로, 핵산 서열(단일 또는 이중 가닥)의 오른쪽 말단 또는 방향은 3' 말단 또는 방향이다. 전형적으로, 핵산의 기준점에 대해 5'인 영역 또는 서열은 "업스트림"로 지칭되고, 핵산의 기준점에 대해 3'인 영역 또는 서열은 "다운스트림"으로 지칭된다. " 전형적으로 mRNA의 5' 방향 또는 말단은 개시 또는 시작 코돈이 있는 곳이고 3' 말단 또는 방향은 종료 코돈이 있는 곳이다. 일부 양태에서, 핵산에서 기준점의 업스트림에 있는 뉴클레오티드는 음수로 지정될 수 있는 반면, 기준점의 다운스트림에 있는 뉴클레오티드는 양수로 지정될 수 있다. 예를 들어, 기준점(예를 들어, mRNA의 엑손-엑손 접합부)은 "제로" 부위로 지정될 수 있고, 기준점의 바로 인접하고 업스트림에 있는 뉴클레오티드는 "마이너스 1", 예를 들어 "-1"이고, 기준점에 직접 인접하고 다운스트림에 있는 뉴클레오티드는 "플러스 1", 예를 들어 "+1"로 지정된다.
일부 구현예에서, ASO는 PKD2 NIE 함유 프리-mRNA에 포함된 엑손 다음 인트론의 5' 스플라이스 부위의 다운스트림(3' 방향)에 있는 PKD2 NIE 함유 프리-mRNA의 표적 부분에 상보적이고(그리고 결합한다) (예를 들어, 5' 스플라이스 부위를 기준으로 양수로 지정된 방향). 일부 구현예에서, ASO는 포함된 엑손 다음의 인트론의 5' 스플라이스 부위에 비해 약 +1 내지 약 +500의 영역 내에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적이다. 일부 구현예에서, ASO는 포함된 엑손 다음의 인트론의 5' 스플라이스 부위에 비해 뉴클레오티드 +6과 +40,000 사이의 영역 내에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적일 수 있다. 일부 양태에서, ASO는 포함된 엑손 다음의 인트론의 5' 스플라이스 부위에 대해 약 +1 내지 약 +40,000, 약 +1 내지 약 +30,000, 약 +1 내지 약 +20,000, 약 +1 내지 약 +15,000, 약 +1 내지 약 +10,000, 약 +1 내지 약 +5,000, 약 +1 내지 약 +4,000, 약 +1 내지 약 +3,000, 약 +1 내지 약 +2,000, 약 +1 내지 약 +1,000, 약 +1 내지 약 +500, 약 +1 내지 약 +490, 약 +1 내지 약 +480, 약 +1 내지 약 +470, 약 +1 내지 약 +460, 약 +1 내지 약 +450, 약 +1 내지 약 +440, 약 +1 내지 약 +430, 약 +1 내지 약 +420, 약 +1 내지 약 +410, 약 +1 내지 약 +400, 약 +1 내지 약 +390, 약 +1 내지 약 +380, 약 +1 내지 약 +370, 약 +1 내지 약 +360, 약 +1 내지 약 +350, 약 +1 내지 약 +340, 약 +1 내지 약 +330, 약 +1 내지 약 +320, 약 +1 내지 약 +310, 약 +1 내지 약 +300, 약 +1 내지 약 +290, 약 +1 내지 약 +280, 약 +1 내지 약 +270, 약 +1 내지 약 +260, 약 +1 내지 약 +250, 약 +1 내지 약 +240, 약 +1 내지 약 +230, 약 +1 내지 약 +220, 약 +1 내지 약 +210, 약 +1 내지 약 +200, 약 +1 내지 약 +190, 약 +1 내지 약 +180, 약 +1 내지 약 +170, 약 +1 내지 약 +160, 약 +1 내지 약 +150, 약 +1 내지 약 +140, 약 +1 내지 약 +130, 약 +1 내지 약 +120, 약 +1 내지 약 +110, 약 +1 내지 약 +100, 약 +1 내지 약 +90, 약 +1 내지 약 +80, 약 +1 내지 약 +70, 약 +1 내지 약 +60, 약 +1 내지 약 +50, 약 +1 내지 약 +40, 약 +1 내지 약 +30, 또는 약 +1 내지 약 +20의 영역 내에 있는 표적화 부분에 상보적이다. 일부 양태에서, ASO는 포함된 엑손 다음의 인트론의 5' 스플라이스 부위에 대해 약 +1 내지 약 +100, 약 +100 내지 약 +200, 약 +200 내지 약 +300, 약 +300 내지 약 +400, 또는 약 +400 내지 약 +500의 영역 내에 있는 표적화 부분에 상보적이다.
일부 구현예에서, ASO는 (예를 들어, 5' 스플라이스 부위를 기준으로 음수로 지정된 방향)으로 PKD2 NIE 함유 프리-mRNA에 포함된 엑손 다음 인트론의 5' 스플라이스 부위의 다운스트림(5' 방향)에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적이고(그리고 결합한다). 일부 구현예에서, ASO는 내포된 엑손 다음의 인트론의 5' 스플라이스 부위에 비해 약 약 -4 내지 약 -270의 영역 내에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적이다. 일부 구현예에서, ASO는 포함된 엑손 다음의 인트론의 5' 스플라이스 부위에 비해 뉴클레오티드 -1과 -40,000 사이의 영역 내에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적일 수 있다. 일부 양태에서, ASO는 포함된 엑손 다음의 인트론의 5' 스플라이스 부위에 대해 약 -1 내지 약 -40,000, 약 -1 내지 약 -30,000, 약 -1 내지 약 -20,000, 약 -1 내지 약 -15,000, 약 -1 내지 약 -10,000, 약 -1 내지 약 -5,000, 약 -1 내지 약 -4,000, 약 -1 내지 약 -3,000, 약 -1 내지 약 -2,000, 약 -1 내지 약 -1,000, 약 -1 내지 약 -500, 약 -1 내지 약 -490, 약 -1 내지 약 -480, 약 -1 내지 약 -470, 약 -1 내지 약 -460, 약 -1 내지 약 -450, 약 -1 내지 약 -440, 약 -1 내지 약 -430, 약 -1 내지 약 -420, 약 -1 내지 약 -410, 약 -1 내지 약 -400, 약 -1 내지 약 -390, 약 -1 내지 약 -380, 약 -1 내지 약 -370, 약 -1 내지 약 -360, 약 -1 내지 약 -350, 약 -1 내지 약 -340, 약 -1 내지 약 -330, 약 -1 내지 약 -320, 약 -1 내지 약 -310, 약 -1 내지 약 -300, 약 -1 내지 약 -290, 약 -1 내지 약 -280, 약 -1 내지 약 -270, 약 -1 내지 약 -260, 약 -1 내지 약 -250, 약 -1 내지 약 -240, 약 -1 내지 약 -230, 약 -1 내지 약 -220, 약 -1 내지 약 -210, 약 -1 내지 약 -200, 약 -1 내지 약 -190, 약 -1 내지 약 -180, 약 -1 내지 약 -170, 약 -1 내지 약 -160, 약 -1 내지 약 -150, 약 -1 내지 약 -140, 약 -1 내지 약 -130, 약 -1 내지 약 -120, 약 -1 내지 약 -110, 약 -1 내지 약 -100, 약 -1 내지 약 -90, 약 -1 내지 약 -80, 약 -1 내지 약 -70, 약 -1 내지 약 -60, 약 -1 내지 약 -50, 약 -1 내지 약 -40, 약 -1 내지 약 -30, 또는 약 -1 내지 약 -20의 영역 내에 있는 표적화 부분에 상보적이다.
일부 구현예에서, ASO는 (예를 들어, 음수로 지정된 방향)으로 PKD2 NIE 함유 프리-mRNA에 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위의 업스트림(5' 방향)에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 영역에 상보적이다. 일부 구현예에서, ASO는 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 비해 약 -1 내지 약 -500의 영역 내에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적이다. 일부 구현예에서, ASO는 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 비해 -1 내지 -40,000의 영역 내에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적이다. 일부 양태에서, ASO는 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 대해 약 -1 내지 약 -40,000, 약 -1 내지 약 -30,000, 약 -1 내지 약 -20,000, 약 -1 내지 약 -15,000, 약 -1 내지 약 -10,000, 약 -1 내지 약 -5,000, 약 -1 내지 약 -4,000, 약 -1 내지 약 -3,000, 약 -1 내지 약 -2,000, 약 -1 내지 약 -1,000, 약 -1 내지 약 -500, 약 -1 내지 약 -490, 약 -1 내지 약 -480, 약 -1 내지 약 -470, 약 -1 내지 약 -460, 약 -1 내지 약 -450, 약 -1 내지 약 -440, 약 -1 내지 약 -430, 약 -1 내지 약 -420, 약 -1 내지 약 -410, 약 -1 내지 약 -400, 약 -1 내지 약 -390, 약 -1 내지 약 -380, 약 -1 내지 약 -370, 약 -1 내지 약 -360, 약 -1 내지 약 -350, 약 -1 내지 약 -340, 약 -1 내지 약 -330, 약 -1 내지 약 -320, 약 -1 내지 약 -310, 약 -1 내지 약 -300, 약 -1 내지 약 -290, 약 -1 내지 약 -280, 약 -1 내지 약 -270, 약 -1 내지 약 -260, 약 -1 내지 약 -250, 약 -1 내지 약 -240, 약 -1 내지 약 -230, 약 -1 내지 약 -220, 약 -1 내지 약 -210, 약 -1 내지 약 -200, 약 -1 내지 약 -190, 약 -1 내지 약 -180, 약 -1 내지 약 -170, 약 -1 내지 약 -160, 약 -1 내지 약 -150, 약 -1 내지 약 -140, 약 -1 내지 약 -130, 약 -1 내지 약 -120, 약 -1 내지 약 -110, 약 -1 내지 약 -100, 약 -1 내지 약 -90, 약 -1 내지 약 -80, 약 -1 내지 약 -70, 약 -1 내지 약 -60, 약 -1 내지 약 -50, 약 -1 내지 약 -40, 약 -1 내지 약 -30, 또는 약 -1 내지 약 -20의 영역 내에 있는 표적화 부분에 상보적이다. 일부 양태에서, ASO는 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 대해 약 -1 내지 약 -100, 약 -100 내지 약 -200, 약 -200 내지 약 -300, 약 -300 내지 약 -400, 또는 약 -400 내지 약 -500의 영역 내에 있는 표적화 부분에 상보적이다.
일부 구현예에서, ASO는 (예를 들어, 양수로 지정된 방향)으로 PKD2 NIE 함유 프리-mRNA에 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위의 다운스트림(3' 방향)에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 영역에 상보적이다. 일부 구현예에서, ASO는 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 비해 약 +1 내지 약 +40,000의 영역 내에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적이다. 일부 양태에서, ASO는 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 대해 약 +1 내지 약 +40,000, 약 +1 내지 약 +30,000, 약 +1 내지 약 +20,000, 약 +1 내지 약 +15,000, 약 +1 내지 약 +10,000, 약 +1 내지 약 +5,000, 약 +1 내지 약 +4,000, 약 +1 내지 약 +3,000, 약 +1 내지 약 +2,000, 약 +1 내지 약 +1,000, 약 +1 내지 약 +500, 약 +1 내지 약 +490, 약 +1 내지 약 +480, 약 +1 내지 약 +470, 약 +1 내지 약 +460, 약 +1 내지 약 +450, 약 +1 내지 약 +440, 약 +1 내지 약 +430, 약 +1 내지 약 +420, 약 +1 내지 약 +410, 약 +1 내지 약 +400, 약 +1 내지 약 +390, 약 +1 내지 약 +380, 약 +1 내지 약 +370, 약 +1 내지 약 +360, 약 +1 내지 약 +350, 약 +1 내지 약 +340, 약 +1 내지 약 +330, 약 +1 내지 약 +320, 약 +1 내지 약 +310, 약 +1 내지 약 +300, 약 +1 내지 약 +290, 약 +1 내지 약 +280, 약 +1 내지 약 +270, 약 +1 내지 약 +260, 약 +1 내지 약 +250, 약 +1 내지 약 +240, 약 +1 내지 약 +230, 약 +1 내지 약 +220, 약 +1 내지 약 +210, 약 +1 내지 약 +200, 약 +1 내지 약 +190, 약 +1 내지 약 +180, 약 +1 내지 약 +170, 약 +1 내지 약 +160, 약 +1 내지 약 +150, 약 +1 내지 약 +140, 약 +1 내지 약 +130, 약 +1 내지 약 +120, 약 +1 내지 약 +110, 약 +1 내지 약 +100, 약 +1 내지 약 +90, 약 +1 내지 약 +80, 약 +1 내지 약 +70, 약 +1 내지 약 +60, 약 +1 내지 약 +50, 약 +1 내지 약 +40, 약 +1 내지 약 +30, 또는 약 +1 내지 약 +20, 또는 약 +1 내지 약 +10의 영역 내에 있는 표적화 부분에 상보적이다.
일부 구현예에서, PKD2 프리-mRNA의 표적화 부분은 NSE의 5' 말단에 대해 -4e 내지 NSE의 3' 말단에 대해 +2e의 영역 내에 있다.
일부 구현예에서, ASO는 (예를 들어, 양수로 지정된 방향)으로 PKD2 NIE 함유 프리-mRNA에 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위의 업스트림(5' 방향)에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 영역에 상보적이다. 일부 구현예에서, ASO는 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 비해 약 +1 내지 약 +40,000의 영역 내에 있는 PKD2 NIE 함유 프리-mRNA의 표적화 부분에 상보적이다. 일부 양태에서, ASO는 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 대해 약 +1 내지 약 +40,000, 약 +1 내지 약 +30,000, 약 +1 내지 약 +20,000, 약 +1 내지 약 +15,000, 약 +1 내지 약 +10,000, 약 +1 내지 약 +5,000, 약 +1 내지 약 +4,000, 약 +1 내지 약 +3,000, 약 +1 내지 약 +2,000, 약 +1 내지 약 +1,000, 약 +1 내지 약 +500, 약 +1 내지 약 +490, 약 +1 내지 약 +480, 약 +1 내지 약 +470, 약 +1 내지 약 +460, 약 +1 내지 약 +450, 약 +1 내지 약 +440, 약 +1 내지 약 +430, 약 +1 내지 약 +420, 약 +1 내지 약 +410, 약 +1 내지 약 +400, 약 +1 내지 약 +390, 약 +1 내지 약 +380, 약 +1 내지 약 +370, 약 +1 내지 약 +360, 약 +1 내지 약 +350, 약 +1 내지 약 +340, 약 +1 내지 약 +330, 약 +1 내지 약 +320, 약 +1 내지 약 +310, 약 +1 내지 약 +300, 약 +1 내지 약 +290, 약 +1 내지 약 +280, 약 +1 내지 약 +270, 약 +1 내지 약 +260, 약 +1 내지 약 +250, 약 +1 내지 약 +240, 약 +1 내지 약 +230, 약 +1 내지 약 +220, 약 +1 내지 약 +210, 약 +1 내지 약 +200, 약 +1 내지 약 +190, 약 +1 내지 약 +180, 약 +1 내지 약 +170, 약 +1 내지 약 +160, 약 +1 내지 약 +150, 약 +1 내지 약 +140, 약 +1 내지 약 +130, 약 +1 내지 약 +120, 약 +1 내지 약 +110, 약 +1 내지 약 +100, 약 +1 내지 약 +90, 약 +1 내지 약 +80, 약 +1 내지 약 +70, 약 +1 내지 약 +60, 약 +1 내지 약 +50, 약 +1 내지 약 +40, 약 +1 내지 약 +30, 또는 약 +1 내지 약 +20, 또는 약 +1 내지 약 +10의 영역 내에 있는 표적화 부분에 상보적이다.
일부 구현예에서, PKD2 NIE 함유 프리-mRNA의 표적화 부분은 포함된 엑손 다음의 인트론의 5' 스플라이스 부위에 대해 +100 내지 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 대해 -100의 영역 내에 있다. 일부 구현예에서, PKD2 NIE 함유 프리-mRNA의 표적화 부분은 NIE 내에 있다. 일부 구현예에서, PKD2 NIE 함유 프리-mRNA의 표적화 부분은 NIE 및 인트론 경계를 포함한다.
ASO는 특이적 결합 및 스플라이싱의 효과적인 향상에 적합한 임의의 길이일 수 있다. 일부 구현예에서, ASO는 8 내지 50개의 핵염기로 구성된다. 예를 들어, ASO는 길이가 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 40, 45, 또는 50개의 핵염기일 수 있다. 일부 구현예에서, ASO는 50개 초과의 핵염기로 구성된다. 일부 구현예에서, ASO는 길이가 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 12 내지 15개의 핵염기, 13 내지 50개의 핵염기, 13 내지 40개의 핵염기, 13 내지 35개의 핵염기, 13 내지 30개의 핵염기, 13 내지 25개의 핵염기, 13 내지 20개의 핵염기, 14 내지 50개의 핵염기, 14 내지 40개의 핵염기, 14 내지 35개의 핵염기, 14 내지 30개의 핵염기, 14 내지 25개의 핵염기, 14 내지 20개의 핵염기, 15 내지 50개의 핵염기, 15 내지 40개의 핵염기, 15 내지 35개의 핵염기, 15 내지 30개의 핵염기, 15 내지 25개의 핵염기, 15 내지 20개의 핵염기, 20 내지 50개의 핵염기, 20 내지 40개의 핵염기, 20 내지 35개의 핵염기, 20 내지 30개의 핵염기, 20 내지 25개의 핵염기, 25 내지 50개의 핵염기, 25 내지 40개의 핵염기, 25 내지 35개의 핵염기, 또는 25 내지 30개의 핵염기이다. 일부 구현예에서, ASO는 길이가 18개의 뉴클레오티드이다. 일부 구현예에서, ASO는 길이가 15개의 뉴클레오티드이다. 일부 구현예에서, ASO는 길이가 25개의 뉴클레오티드이다.
일부 구현예에서, 화학적 성질은 다르지만 프리-NIE 함유 프리-mRNA의 동일한 표적화 부분에 대해 상보적인 2개 이상의 ASO가 사용된다. 일부 구현예에서, NIE 함유 프리-mRNA의 상이한 표적화 부분에 상보적인 2개 이상의 ASO가 사용된다.
일부 구현예에서, 본 개시내용의 안티센스 올리고뉴클레오티드는 하나 이상의 모이어티 또는 접합체, 예를 들어 올리고뉴클레오티드의 활성 또는 세포 흡수를 향상시키는 표적화 모이어티 또는 다른 접합체에 화학적으로 연결된다. 이러한 모이어티는 지질 모이어티, 예를 들어 콜레스테롤 모이어티, 콜레스테릴 모이어티, 지방족 사슬, 예를 들어 도데칸디올 또는 운데실 잔기, 폴리아민 또는 폴리에틸렌 글리콜 사슬 또는 아다만탄 아세트산을 포함하지만 이에 제한되지 않는다. 친유성 모이어티를 포함하는 올리고뉴클레오티드 및 제조 방법은 공개된 문헌에 기술되어 있다. 구현예에서, 안티센스 올리고뉴클레오티드는 무염기성 뉴클레오티드, 폴리에테르, 폴리아민, 폴리아미드, 펩티드, 탄수화물, 예를 들어, N-아세틸갈락토사민 (GalNAc), N-Ac-글루코사민 (GluNAc), 또는 만노스 (예를 들어, 만노스-6-포스페이트), 지질, 또는 다탄화수소 화합물을 포함하지만 이에 제한되지 않는 모이어티와 접합된다. 접합체는 예를 들어 링커를 사용하여 관련 기술분야에서 이해되고 문헌에 기재된 바와 같이 당, 염기 또는 포스페이트 기 상의 임의의 여러 위치에서 안티센스 올리고뉴클레오티드를 포함하는 임의의 뉴클레오티드 중 하나 이상에 연결될 수 있다. 링커는 2가 또는 3가 분지형 링커를 포함할 수 있다. 구현예에서, 접합체는 안티센스 올리고뉴클레오티드의 3' 말단에 부착된다. 올리고뉴클레오티드 접합체를 제조하는 방법은 예를 들어 본원에 참조로 포함된 문헌[미국 특허 제8,450,467호의 "Carbohydrate conjugates as delivery agents for oligonucleotides"]에 기재되어 있다.
일부 구현예에서, ASO에 의해 표적화되는 핵산은 진핵 세포와 같은 세포에서 발현되는 PKD2 NIE 함유 프리-mRNA이다. 일부 구현예에서, 용어 "세포"는 세포의 개체군을 의미할 수 있다. 일부 구현예에서, 세포는 대상체에 있다. 일부 구현예에서, 세포는 대상체로부터 단리된다. 일부 구현예에서, 세포는 생체 외의 것이다. 일부 구현예에서, 세포는 병태 또는 질환 관련 세포 또는 세포주이다. 일부 구현예에서, 세포는 시험관 내(예를 들어, 세포 배양물)의 것이다.
일부 구현예에서, 본원에 개시된 프리-mRNA를 표적으로 하는 ASO는 표 4에 열거된 서열로 이루어진 군으로부터 선택된다.
약제학적 조성물
기재된 조성물의 제제, 예를 들어 안티센스 올리고뉴클레오티드를 포함하고 임의의 기재된 방법에 사용하기 위한 약제학적 조성물 또는 제형은 약제학적 산업에 잘 알려져 있고 공개된 문헌에 기재된 통상적인 기술에 따라 제조될 수 있다. 구현예에서, 대상체를 치료하기 위한 약제학적 조성물 또는 제형은 본원에 기재된 바와 같은 임의의 안티센스 올리고머, 또는 이의 약제학적으로 허용되는 염, 용매화물, 수화물 또는 에스테르의 유효량을 포함한다. 안티센스 올리고머를 포함하는 약제학적 제형은 약제학적으로 허용되는 부형제, 희석제 또는 담체를 추가로 포함할 수 있다.
약제학적으로 허용되는 염은 과도한 독성, 자극, 알레르기 반응 등 없이 인간 및 하등 동물의 조직과 접촉하여 사용하기에 적합하며 합리적인 유익/위험 비율에 상응한다. (예를 들어, 이러한 목적을 위해 본원에 참조로 포함된 문헌[S. M. Berge, 등, J. Pharmaceutical Sciences, 66: 1-19 (1977)]를 참조한다. 염은 화합물의 최종 단리 및 정제 동안 또는 유리 염기 형태를 적절한 유기산과 반응시켜 별도로 제조된 수 있다. 약제학적으로 허용 가능한 무독성 산 부가 염의 예는 무기 산 예컨대 염산, 브롬화수소산, 인산, 황산 및 과염소산으로 형성되거나 또는 유기 산 예컨대 아세트산, 옥살산, 말레산, 타르타르산, 시트르산, 석신산 또는 말론산으로 또는 다른 문서로 기록된 방법 예컨대 이온 교환을 사용하여 형성된 아미노 기의 염이다. 다른 약제학적으로 허용되는 염은 아디페이트, 알기네이트, 아스코르베이트, 아스파르테이트, 벤젠설포네이트, 벤조에이트, 바이설페이트, 보레이트, 부티레이트, 캄포레이트, 캄포르설포네이트, 시트레이트, 사이클로펜탄프로피오네이트, 디글루코네이트, 도데실설페이트, 에탄설포네이트, 포르메이트, 푸마레이트, 글루코헵토네이트, 글리세로포스페이트, 글루코네이트, 헤미설페이트, 헵타노에이트, 헥사노에이트, 하이드로아이오다이드, 2-하이드록시-에탄설포네이트, 락토바이오네이트, 락테이트, 라우레이트, 라우릴 설페이트, 말레이트, 말레에이트, 말로네이트, 메탄설포네이트, 2-나프탈렌설포네이트, 니코티네이트, 니트레이트, 올레에이트, 옥살레이트, 팔미테이트, 파모에이트, 펙티네이트, 퍼설페이트, 3-페닐프로피오네이트, 포스페이트, 피크레이트, 피발레이트, 프로피오네이트, 스테아레이트, 석시네이트, 설페이트, 타르트레이트, 티오시아네이트, p-톨루엔설포네이트, 운데카노에이트, 발레레이트 염, 등을 포함한다. 대표적인 알칼리 또는 알칼리 토금속 염은 나트륨, 리튬, 칼륨, 칼슘, 마그네슘 등을 포함한다. 추가의 약제학적으로 허용되는 염은 적절한 경우 무독성 암모늄, 사차 암모늄, 및 할라이드, 수산화물, 카복실레이트, 설페이트, 포스페이트, 니트레이트, 저급 알킬 설포네이트 및 아릴 설포네이트와 같은 반대이온을 사용하여 형성된 아민 양이온을 포함한다.
일부 구현예에서, 조성물은 정제, 캡슐, 겔 캡슐, 액체 시럽, 연질 겔, 좌약, 및 관장제와 같으나 이에 제한되지 않는 임의의 많은 가능한 복용 형태로 제형화된다. 구현예에서, 조성물은 수성, 비-수성 또는 혼합 매질에서 현탁액으로 제형화된다. 수성 현탁액은 예를 들어 나트륨 카복시메틸셀룰로오스, 소르비톨 및/또는 덱스트란을 비롯한 현탁액의 점도를 증가시키는 물질을 추가로 함유할 수 있다. 현탁액에는 안정화제가 함유될 수도 있다. 구현예에서, 본 개시내용의 약제학적 제형 또는 조성물은 용액, 에멀젼, 마이크로에멀젼, 포움 또는 리포솜-함유 제형 (예를 들어, 양이온성 또는 비-양이온성 리포솜)을 함유하지만 이에 제한되지 않는다.
본원에 기재된 약제학적 조성물 또는 제형은 하나 이상의 침투 증진제, 담체, 부형제 또는 적절하고 당업자에게 잘 알려져 있거나 공개된 문헌에 기재된 다른 활성 또는 불활성 성분을 포함할 수 있다. 구현예에서, 리포솜은 또한 입체적으로 안정화된 리포솜, 예를 들어, 하나 이상의 특화된 지질을 포함하는 리포솜을 포함한다. 이러한 특화된 지질은 순환 수명이 향상된 리포솜을 생성한다. 구현예에서, 입체적으로 안정화된 리포솜은 하나 이상의 당지질을 포함하거나 폴리에틸렌 글리콜(PEG) 모이어티와 같은 하나 이상의 친수성 폴리머로 유도체화된다. 일부 구현예에서, 계면활성제는 약제학적 제형 또는 조성물에 포함된다. 의약품, 제형 및 에멀젼 내의 계면활성제의 사용은 당업계에 잘 알려져 있다. 구현예에서, 본 개시내용은 안티센스 올리고뉴클레오티드의 효율적인 전달에 영향을 미치기 위해, 예를 들어, 세포막을 통한 확산을 돕고/하거나 친유성 약물의 투과성을 향상시키기 위해 침투 증진제를 사용한다. 일부 구현예에서, 침투 증진제는 계면활성제, 지방산, 담즙산염, 킬레이트제, 또는 비-킬레이트 비-계면활성제이다.
일부 구현예에서, 약제학적 제형은 다수의 안티센스 올리고뉴클레오티드를 포함한다. 구현예에서, 안티센스 올리고뉴클레오티드는 다른 약물 또는 치료제와 함께 투여된다.
병용 요법
일부 구현예에서, 1개 이상의 NSE 조절 제제를 포함하는 조성물이 본명세서에 제공된다. 일부 구현예에서, 2개 이상의 NSE 조절 제제를 포함하는 조성물이 본명세서에 제공된다. 일부 구현예에서, PKD2 프리-mRNA의 표적화 영역에 상보적인 1개 이상의 ASO를 포함하는 조성물이 본원에 제공된다. 일부 구현예에서, PKD2 프리-mRNA의 표적화 영역에 상보적인 2개 이상의 ASO를 포함하는 조성물이 본원에 제공된다. 일부 구현예에서, PKD2 프리-mRNA의 동일한 표적화 영역에 상보적인 1개 이상의 ASO를 포함하는 조성물이 본원에 제공된다. 일부 구현예에서, PKD2 프리-mRNA의 동일한 표적화 영역에 상보적인 2개 이상의 ASO를 포함하는 조성물이 본원에 제공된다. 일부 구현예에서, PKD2 프리-mRNA의 상이한 표적화 영역에 상보적인 1개 이상의 ASO를 포함하는 조성물이 본원에 제공된다. 일부 구현예에서, PKD2 프리-mRNA의 상이한 표적화 영역에 상보적인 2개 이상의 ASO를 포함하는 조성물이 본원에 제공된다. 일부 구현예에서, 표 4의 1개 이상의 ASO를 포함하는 조성물이 본원에 제공된다. 일부 구현예에서, 표 4의 2개 이상의 ASO를 포함하는 조성물이 본원에 제공된다.
일부 구현예에서, 본 개시내용에 개시된 치료제(예를 들어, ASO)는 하나 이상의 추가 치료제와 함께 사용될 수 있다. 일부 구현예에서, 하나 이상의 추가 치료제는 소분자를 포함할 수 있다. 예를 들어, 하나 이상의 추가 치료제는 WO2016128343A1, WO2017053982A1, WO2016196386A1, WO201428459A1, WO201524876A2, WO2013119916A2, 및 WO2014209841A2에 기재된 소분자를 포함할 수 있으며, 이들은 그 전체가 본원에 참조로 포함된다 일부 구현예에서, 하나 이상의 추가 치료제는 톨밥탄(Jynarque®, Samsca)을 포함할 수 있다. 일부 구현예에서, 하나 이상의 추가 치료제는 인트론 체류를 수정하기 위해 사용될 수 있는 ASO를 포함한다.
대상체의 치료
본원에 제공된 임의의 조성물은 개체에게 투여될 수 있다. "개체"는 "대상체" 또는 "환자"와 상호교환가능하게 사용될 수 있다. 개체는 포유동물, 예를 들어 인간 또는 비-인간 영장류, 설치류, 토끼, 랫트, 마우스, 말, 당나귀, 염소, 고양이, 소, 돼지, 또는 양과 같은 동물일 수 있다. 실시예에서, 개체는 인간이다. 실시예에서, 개체는 태아, 배아 또는 아동이다. 다른 구체예에서, 개체는 식물과 같은 또 다른 진핵 유기체일 수 있다. 일부 구현예에서, 본원에 제공된 조성물은 생체 외 세포에 투여된다.
일부 구현예에서, 본원에 제공된 조성물은 질환 또는 장애를 치료하는 방법으로서 개체에게 투여된다. 일부 구현예에서, 개체는 본원에 기재된 임의의 질환과 같은 유전적 질환을 갖는다. 일부 구현예에서, 개체는 본원에 기재된 임의의 질환과 같은 질환을 가질 위험이 있다. 일부 구현예에서, 개체는 불충분한 양의 단백질 또는 불충분한 단백질 활성에 의해 야기되는 질환 또는 장애를 가질 위험이 증가된다. 개체가 불충분한 양의 단백질 또는 불충분한 단백질 활성을 야기하는 질환 또는 장애를 가질 "위험이 증가된" 경우, 이 방법은 예방적(preventative) 또는 예방적(prophylactic) 치료를 포함한다. 예를 들어, 개체는 질환의 가족력으로 인해 그러한 질환 또는 장애를 가질 위험이 증가할 수 있다. 전형적으로, 그러한 질환 또는 장애를 가질 위험이 증가된 개체는 (예를 들어, 질환 또는 장애의 개시 또는 진행을 예방하거나 지연시킴으로써) 예방적 치료로부터 이익을 얻는다. 구현예에서, 태아는 예를 들어 ASO 조성물을 태아에게 직접적으로 또는 간접적으로(예를 들어, 산모를 통해) 투여함으로써 자궁 내에서 치료된다.
본 발명의 ASO의 투여에 적합한 경로는 ASO의 전달이 요구되는 세포 유형에 따라 달라질 수 있다. 본 개시내용의 ASO는 비경구적으로, 예를 들어 척수강내 주사, 뇌실심내 주사, 복강내 주사, 근육내 주사, 피하 주사 또는 정맥내 주사에 의해 환자에게 투여될 수 있다.
구현예에서, 안티센스 올리고뉴클레오티드는 당업계에 공지된 임의의 방법에 의해 혈액-뇌 장벽을 가로지르는 대상 안티센스 올리고뉴클레오티드의 침투를 촉진할 수 있는 하나 이상의 제제와 함께 투여된다. 예를 들어, 근육 조직의 운동 뉴런에 대한 아데노바이러스 벡터의 투여에 의한 제제의 전달은 문헌[미국 특허 제6,632,427호, "Adenoviral-vector-mediated gene transfer into medullary motor neurons"]에 기재되어 있고, 이는 본원에 참조로 포함된다. 뇌, 예를 들어 선조체, 시상, 해마 또는 흑질로의 직접 벡터 전달은 예를 들어 문헌[미국 특허 제6,756,523호, "Adenovirus vectors for the transfer of foreign genes into cells of the central nervous system particularly in brain]에 기재되어 있고, 이는 본원에 참조로 포함된다.
일부 구현예에서, 안티센스 올리고뉴클레오티드는 바람직한 약제학적 또는 약력학적 특성을 제공하는 제제와 연결되거나 접합된다. 구현예에서, 안티센스 올리고뉴클레오티드는 혈액-뇌 장벽을 가로질러 침투 또는 수송을 촉진하는 것으로 당업계에 공지된 물질, 예를 들어 트랜스페린 수용체에 대한 항체에 커플링된다. 구현예에서, 안티센스 올리고뉴클레오티드는 바이러스 벡터와 연결되어, 예를 들어 안티센스 화합물을 더 효과적으로 만들거나 혈액-뇌 장벽을 가로지르는 수송을 증가시킨다. 구현예에서, 삼투성 혈액 뇌 장벽 파괴는 당, 예를 들어, 메소 에리트리톨, 자일리톨, D(+) 갈락토스, D(+) 락토스, D(+) 자일로스, 둘시톨, 미오-이노시톨, L(-) 푸룩토스, D(-) 만니톨, D(+) 글루코스, D(+) 아라비노오스, D(-) 아라비노오스, 셀로비오스, D(+) 말토스, D(+) 라피노스, L(+) 람노오스, D(+) 멜리바이오스, D(-) 리보스, 아도니톨, D(+) 아라비톨, L(-) 아라비톨, D(+) 푸코스, L(-) 푸코스, D(-) 릭소스, L(+) 릭소스, 및 L(-) 릭소스, 또는 아미노산, 예를 들어, 글루타민, 라이신, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루탐산, 글리신, 히스티딘, 류신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 티로신, 발린, 및 타우린의 주입에 의해 지원된다. 혈액 뇌 장벽 침투를 향상시키기 위한 방법 및 물질은 예를 들어 문헌[미국 특허 제9,193,969호, "Compositions and methods for selective delivery of oligonucleotide molecules to specific neuron types", 미국 특허 제4,866,042호, "Method for the delivery of genetic material across the blood brain barrier", 미국 특허 제6,294,520호, "Material for passage through the blood-brain barrier", 및 미국 특허 제6,936,589호, "Parenteral delivery systems"]에 기재되어 있고, 각각 본원에 참조로 포함된다.
일부 구현예에서, 본 개시내용의 ASO는 예를 들어, 본원에 참조로 포함된 미국 특허 제9,193,969호에 기재된 방법을 사용하여 도파민 재흡수 억제제 (DRI), 선택적 세로토닌 재흡수 억제제 (SSRI), 노르아드레날린 재흡수 억제제 (NRI), 노르에피네프린-도파민 재흡수 억제제 (NDRI), 및 세로토닌-노르에피네프린-도파민 재흡수 억제제 (SNDRI)에 커플링된다.
일부 구현예에서, 방법 및 조성물을 사용하여 치료된 대상체는 당업계에 공지되고 기재된 임의의 방법을 사용하여 병태 개선에 대해 평가된다.
일부 경우에, 치료제는 변형된 인간 snRNA와 같은 변형된 snRNA를 포함한다. 일부 경우에, 치료제는 변형된 snRNA를 인코딩하는 바이러스 벡터와 같은 벡터를 포함한다. 일부 구현예에서, 변형된 snRNA는 변형된 U1 snRNA이다(예를 들어, 문헌[Alanis 등, Human Molecular Genetics, 2012, Vol. 21, No. 11 2389-2398] 참조). 일부 구현예에서, 변형된 snRNA는 변형된 U7 snRNA이다(예를 들어, 문헌[Gadgil 등, J Gene Med. 2021;23:e3321] 참조). 변형된 U7 snRNA는 전체 내용이 참조로 여기에 포함된 문헌[Meyer, K.; (2012), Antisense Derivatives of U7 Small Nuclear RNA as Modulators of Pre-mRNA Splicing. In: Stamm, Stefan; Smith, Christopher W. J.; (eds.) Alternative Pre-mRNA Splicing: Theory and Protocols (pp. 481-494), Chichester: John Wiley & Sons 10.1002/9783527636778.ch45]에 기재된 방법을 포함하는 당업계에 공지된 임의의 방법으로 만들 수 있다. 일부 구현예에서, 변형된 U7(smOPT)은 WT U7과 경쟁하지 않는다(Stefanovic 등, 1995).
일부 구현예에서, 변형된 snRNA는 smOPT 변형을 포함한다. 예를 들어, 변형된 snRNA는 서열 AAUUUUUGGAG(서열번호: 229)를 포함할 수 있다. 예를 들어, 서열 AAUUUUUGGAG(서열번호: 229)는 야생형 U7 snRNA의 서열 AAUUUGUCUAG(서열번호: 230)를 대체하여 변형된 U& snRNA(smOPT)를 생성할 수 있다. 일부 구현예에서, U7 snRNA의 smOPT 변형은 입자를 히스톤 프리-mRNA 프로세싱에서 기능적으로 불활성으로 만든다(Stefanovic 등, 1995). 일부 구현예에서, 변형된 U7(smOPT)은 WT U7보다 더 높은 수준으로 핵에서 안정적으로 발현된다(Stefanovic 등, 1995). 일부 구현예에서, snRNA는 U1 snRNP 표적화 서열을 포함한다. 일부 구현예에서, snRNA는 U7 snRNP 표적화 서열을 포함한다. 일부 구현예에서, snRNA는 변형된 U7 snRNP 표적화 서열을 포함하고 여기서 변형된 U7 snRNP 표적화 서열은 smOPT를 포함한다. 일부 구현예에서, 변형된 snRNA는 PKD2 프리-mRNA에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형되었다. 일부 구현예에서, 변형된 snRNA는 PKD2 mRNA에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형되었다.
일부 구현예에서, 변형된 snRNA는 PKD2 프리-mRNA 또는 프로세싱된 PKD2 mRNA의 표적 영역, 예컨대 NMD 엑손의 배제를 조절하는 PKD2 프리-mRNA의 표적 영역, 대체 5' ss에서 스플라이싱을 조절하는 PKD2 프리-mRNA의 표적 영역, 또는 5' UTR 표적 영역과 같은 PKD2 mRNA의 번역을 조절하는 프로세싱된 PKD2 mRNA의 표적 영역에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형되었다. 일부 구현예에서, 변형된 snRNA는 본원에 개시된 ASO의 1 또는 2 또는 그 초과 개의 서열을 포함하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형되었다. 일부 구현예에서, 변형된 snRNA는 돌연변이를 갖는 PKD2 NMD 엑손 함유 프리-mRNA와 같은 돌연변이를 갖는 PKD2 프리-mRNA의 서열에 혼성화하는 단일 가닥 뉴클레오티드 서열을 함유하도록 변형되었다. 일부 구현예에서, 변형된 snRNA는 PKD2 NMD 엑손 함유 프리-mRNA의 2개 이상의 표적 영역에 혼성화하는 2개 이상의 서열을 함유하는 단일 가닥 뉴클레오티드 서열을 함유하도록 변형되었다. 예를 들어, 변형된 snRNA는 PKD2 NMD 엑손 함유 프리-mRNA의 적어도 8개의 연연 핵산에 혼성화하는 단일 가닥 뉴클레오티드 서열을 함유하도록 변형될 수 있다. 일부 구현예에서, 변형된 snRNA는 본원에 개시된 PKD2 NMD 엑손 함유 프리-mRNA의 임의의 표적 영역에 혼성화하는 단일 가닥 뉴클레오티드 서열을 함유하도록 변형되었다. 일부 구현예에서, 변형된 snRNA는 PKD2 NMD 엑손 함유 프리-mRNA의 2개 이상의 표적 영역에 혼성화하는 2개 이상의 서열을 함유하는 단일 가닥 뉴클레오티드 서열을 함유하도록 변형되었다. 예를 들어, 변형된 snRNA는 프리-mRNA 전사체의 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))을 함유하는 인트론의 1 또는 2 또는 그 초과 개의 서열의 서열 또는 동일한 인트론에서 NMD 엑손 활성화 조절 서열에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 NMD 엑손 내의 영역 또는 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 업스트림 또는 다운스트림에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 일부 구현예에서, 변형된 snRNA는 PKD2 NMD 엑손 함유 프리-mRNA에 혼성화하는 단일 가닥 뉴클레오티드 서열을 함유하도록 변형된 5' 영역을 갖는다. 일부 구현예에서, 변형된 snRNA는 PKD2 NMD 엑손 함유 프리-mRNA에 혼성화하는 단일 가닥 뉴클레오티드 서열을 함유하도록 변형된 3' 영역을 갖는다.
일부 구현예에서, 변형된 snRNA는 NMD 엑손의 배제를 조정하는 PKD2 프리-mRNA의 표적 영역에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형되었다. 예를 들어, 예를 들어, 변형된 snRNA는 NMD 엑손 및 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))) 업스트림의 인트론과 겹치는 영역에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 예를 들어, 변형된 snRNA는 NMD 엑손 및 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))) 다운스트림의 인트론과 겹치는 영역에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 다운스트림에 있는 인트론 서열에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 다운스트림에 있는 인트론 서열의 3' 스플라이스 부위에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 다운스트림에 있는 인트론 서열의 5' 스플라이스 부위에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 업스트림에 있는 인트론 서열에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 업스트림에 있는 인트론 서열의 스플라이스 부위에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 업스트림에 있는 인트론 서열의 3' 스플라이스 부위에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 NMD 엑손(예를 들어, PKD2의 엑손 2x(예를 들어, PKD2의 엑손(GRCh38/ hg38: chr4:88031085 88031140))의 업스트림에 있는 인트론 서열의 5' 스플라이스 부위에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다.
일부 구현예에서, 변형된 snRNA는 대체 5' ss에서 스플라이싱을 조절하는 PKD2 프리-mRNA의 표적 영역에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형되었다. 예를 들어, 변형된 snRNA는 PKD2 프리-mRNA의 인트론(예를 들어, PKD2의 인트론 3의 대체 5' ss(예를 들어, PKD2의 GRCh38/ hg38: chr4 88036480))의 대체 5' ss와 중첩되는 영역에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 PKD2 프리-mRNA의 인트론의 대체 5' ss 및 대체 5' ss의 NMD 엑손 업스트림(예를 들어, PKD2의 인트론 3의 대체 5' ss(예를 들어, PKD2의 GRCh38/ hg38: chr4 88036480) 및 대체 5' ss의 NMD 엑손 업스트림(예를 들어, 엑손 2))과 중첩되는 영역에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 PKD2 프리-mRNA의 인트론의 대체 5' ss의 다운스트림에 있는 인트론 서열의 대체 5' ss(예를 들어, PKD2의 인트론 3(예를 들어, PKD2의 GRCh38/ hg38: chr4 88036480)의 다운스트림에 있는 인트론 서열)에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 PKD2 프리-mRNA의 인트론의 대체 5' ss의 업스트림에 있는 NMD 엑손(예를 들어, 선택적 엑손)의 서열(예를 들어, PKD2의 인트론 3의 대체 5' ss(예를 들어, PKD2의 GRCh38/ hg38: chr4 88036480))의 업스트림에 있는 NMD 엑손(예를 들어, 선택적 엑손)의 서열)에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 NMD 엑손(예를 들어, 선택적 엑손)의 다운스트림에 있는 인트론의 대체 5' 스플라이스 부위(예를 들어, NMD 엑손(예를 들어, 선택적 엑손)의 다운스트림에 있는 PKD2의 인트론 3(예를 들어, GRCh38/ hg38: chr4 88036480)의 대체 5' 스플라이스 부위)에 상보적인 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다.
일부 구현예에서, 변형된 snRNA는 프로세싱된 PKD2 mRNA의 번역을 조절하는 PKD2 mRNA의 표적 영역, 예컨대 5' UTR 표적 영역에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형되었다. 예를 들어, 변형된 snRNA는 프로세싱된 PKD2 mRNA의 5' UTR 서열에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 프로세싱된 PKD2 mRNA의 업스트림 열린 해독틀 시작 코돈에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 프로세싱된 PKD2 mRNA의 업스트림 열린 해독틀 시작 코돈의 서열 업스트림에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 프로세싱된 PKD2 mRNA의 업스트림 열린 해독틀 시작 코돈의 서열 다운스트림에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 프로세싱된 PKD2 mRNA의 정규 열린 해독틀 시작 코돈의 서열 업스트림에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 프로세싱된 PKD2 mRNA의 제1 업스트림 열린 해독틀 시작 코돈의 서열 다운스트림 및 프로세싱된 PKD2 mRNA의 제2 업스트림 열린 해독틀 시작 코돈의 업스트림에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 프로세싱된 PKD2 mRNA의 제1 업스트림 열린 해독틀 시작 코돈의 서열 업스트림 및 프로세싱된 PKD2 mRNA의 제2 업스트림 열린 해독틀 시작 코돈의 업스트림에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다. 예를 들어, 변형된 snRNA는 프로세싱된 PKD2 mRNA의 제1 업스트림 열린 해독틀 시작 코돈의 서열 업스트림, 프로세싱된 PKD2 mRNA의 제2 업스트림 열린 해독틀 시작 코돈의 업스트림 및 프로세싱된 PKD2 mRNA의 정식 열린 해독틀 시작 코돈의 업스트림에 혼성화하는 단일 가닥 뉴클레오티드 서열을 포함하도록 변형될 수 있다.
엑손 스킵핑을 유도하는 추가 ASO를 확인하는 방법
또한 PKD2 NIE 함유 프리-mRNA의 엑손 스킵핑을 유도하는 ASO를 확인하거나 결정하는 방법은 본 개시내용의 범위 내에 있다. 예를 들어, 방법은 PKD2 NIE 함유 프리-mRNA의 NIE 스킵핑을 유도하는 ASO를 확인하거나 결정하는 것을 포함할 수 있다. 프리-mRNA의 표적 영역 내의 상이한 뉴클레오티드에 특이적으로 혼성화하는 ASO는 표적 인트론의 스플라이싱 속도 및/또는 정도를 개선하는 ASO를 확인하거나 결정하기 위해 스크리닝될 수 있다. 일부 구현예에서, ASO는 스플라이싱 억제제(들)/사일런서의 결합 부위(들)를 차단하거나 방해할 수 있다. 당업계에 공지된 임의의 방법을 사용하여 엑손의 표적 영역에 혼성화될 때 원하는 효과(예를 들어, NIE 스킵핑, 단백질 또는 기능성 RNA 생산)를 초래하는 ASO를 확인(결정)할 수 있다. 이들 방법은 또한 포함된 엑손에 측접하는 인트론 또는 포함되지 않은 엑손에서 표적화 영역에 결합함으로써 포함된 엑손의 엑손 스킵핑을 유도하는 ASO를 확인하기 위해 사용될 수 있다. 사용할 수 있는 방법의 예는 아래에 제공된다.
ASO "워크(walk)"라고 하는 한 라운드의 스크리닝은 프리-mRNA의 표적 영역에 혼성화하도록 설계된 ASO를 사용하여 수행될 수 있다. 예를 들어, ASO 워크에 사용되는 ASO는 포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위의 약 100개 뉴클레오티드 업스트림(예를 들어, 표적/포함된 엑손의 업스트림에 위치한 인트론 서열의 일부)에서 표적/포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위의 약 100개 뉴클레오티드 다운스트림 및/또는 포함된 엑손 다음 인트론의 5' 스플라이스 부위의 약 100개 뉴클레오티드 업스트림에서 표적/포함된 엑손 다음 인트론의 5' 스플라이스 부위의 약 100개 뉴클레오티드 다운스트림(예를 들어, 표적/포함된 엑손의 다운스트림에 위치한 인트론 서열의 일부)의 5개의 뉴클레오티드마다 타일링될 수 있다. 예를 들어, 길이가 15개의 뉴클레오티드인 제1 ASO는 표적/포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 비해 +6 내지 +20개의 뉴클레오티드에 특이적으로 혼성화하도록 설계될 수 있다. 제2 ASO는 표적/포함된 엑손 앞에 있는 인트론의 3' 스플라이스 부위에 비해 +11 내지 +25개의 뉴클레오티드에 특이적으로 혼성화하도록 설계될 수 있다. ASO는 프리-mRNA의 표적 영역에 걸치는 것과 같이 설계된다. 실시예에서, ASO는 예를 들어 1, 2, 3 또는 4개의 뉴클레오티드마다 더 가깝게 타일링될 수 있다. 또한, ASO는 5' 스플라이스 부위의 다운스트림에 있는 100개의 뉴클레오티드에서 3' 스플라이스 부위의 업스트림에 있는 100개의 뉴클레오티드까지 타일링될 수 있다. 일부 구현예에서, ASO는 3' 스플라이스 부위의 약 1,160개의 뉴클레오티드 업스트림에서 5' 스플라이스 부위의 약 500개의 뉴클레오티드 다운스트림까지 타일링될 수 있다. 일부 구현예에서, ASO는 3' 스플라이스 부위의 업스트림에 있는 약 500개의 뉴클레오티드에서 3' 스플라이스 부위의 다운스트림에 있는 약 1,920개의 뉴클레오티드까지 타일링될 수 있다.
하나 이상의 ASO, 또는 대조군 ASO(표적 영역에 혼성화할 것으로 예상되지 않는 스크램블된 서열을 갖는 ASO)는 예를 들어 형질감염에 의해 표적 프리-mRNA(예를 들어, NIE 함유 프리-mRNA)를 발현하는 질환 관련 세포주로 전달된다. 각각의 ASO의 엑손 스킵핑 효과는 당업계에 공지된 임의의 방법, 예를 들어 실시예 4에 기재된 바와 같이 스플라이스 접합부에 걸치는 프라이머를 사용하는 역전사효소(RT)-PCR에 의해 평가될 수 있다. 대조군 ASO 처리 세포에 비해 ASO 처리 세포에서 포함된 엑손(예를 들어, NIE의 측접 엑손 포함)을 함유하는 영역에 걸친 프라이머를 사용하여 생산된 더 긴 RT-PCR 생성물의 감소 또는 부재는 표적 NIE의 스플라이싱이 향상되었음을 나타낸다. 일부 구현예에서, 엑손 스킵핑 효율(또는 NIE를 함유하는 인트론을 스플라이싱하기 위한 스플라이싱 효율), 스플라이싱된 대 스플라이싱되지 않은 프리-mRNA의 비율, 스플라이싱 속도 또는 스플라이싱 정도는 본원에 기재된 ASO를 사용하여 개선될 수 있다. 표적 프리-mRNA에 의해 인코딩되는 단백질 또는 기능성 RNA의 양은 또한 각각의 ASO가 원하는 효과(예를 들어, 향상된 기능성 단백질 생산)를 달성했는지 여부를 결정하기 위해 평가될 수 있다. 단백질 생산을 평가 및/또는 정량화하기 위해 당업계에 공지된 임의의 방법, 예를 들어 웨스턴 블롯팅, 유동 세포측정법, 면역형광 현미경검사 및 ELISA가 사용될 수 있다.
ASO "마이크로-워크(micro-walk)"라고 하는 제2 라운드의 스크리닝은 프리-mRNA의 표적 영역에 혼성화하도록 설계된 ASO를 사용하여 수행될 수 있다. ASO 마이크로 워크에 사용되는 ASO는 ASO와 혼성화될 때 엑손 스킵핑(또는 NIE의 향상된 스플라이싱)를 초래하는 프리-mRNA의 뉴클레오티드 산 서열을 추가로 정제하기 위해 1개의 뉴클레오티드마다 타일링된다.
표적 인트론의 스플라이싱을 촉진하는 ASO에 의해 정의된 영역은 ASO "마이크로 워크"를 통해 1-nt 간격으로 배치된 ASO와 더 긴 ASO, 전형적으로 18-25 nt를 포함하여 더 자세히 조사된다.
상기 ASO 워크에 대해 기재된 바와 같이, ASO 마이크로 워크는 예를 들어 하나 이상의 ASO 또는 대조군 ASO(표적 영역에 혼성화될 것으로 예상되지 않는 스크램블된 서열을 갖는 ASO)를 전달함으로써, 예를 들어 표적 프리-mRNA를 발현하는 질환 관련 세포주로의 형질감염시킴으로써 수행된다. 각각의 ASO의 스플라이싱 유도 효과는 당업계에 공지된 임의의 방법, 예를 들어 본원에 기재된 바와 같이 NIE에 걸친 프라이머를 사용하는 역전사효소(RT)-PCR에 의해 평가될 수 있다(예를 들어, 실시예 4 참조). 대조군 ASO 처리 세포에 비해 ASO 처리 세포에서 NIE에 걸친 프라이머를 사용하여 생성된 더 긴 RT-PCR 생성물의 감소 또는 부재는 엑손 스킵핑(또는 NIE를 함유하는 표적 인트론의 스플라이싱)이 향상되었음을 나타낸다. 일부 구현예에서, 엑손 스킵핑 효율(또는 NIE를 함유하는 인트론을 스플라이싱하기 위한 스플라이싱 효율), 스플라이싱된 대 스플라이싱되지 않은 프리-mRNA의 비율, 스플라이싱 속도 또는 스플라이싱 정도는 본원에 기재된 ASO를 사용하여 개선될 수 있다. 표적 프리-mRNA에 의해 인코딩되는 단백질 또는 기능성 RNA의 양은 또한 각각의 ASO가 원하는 효과(예를 들어, 향상된 기능성 단백질 생산)를 달성했는지 여부를 결정하기 위해 평가될 수 있다. 단백질 생산을 평가 및/또는 정량화하기 위해 당업계에 공지된 임의의 방법, 예를 들어 웨스턴 블롯팅, 유동 세포측정법, 면역형광 현미경검사 및 ELISA가 사용될 수 있다.
프리-mRNA의 영역에 혼성화될 때 엑손 스킵핑(또는 NIE를 함유하는 인트론의 강화된 스플라이싱) 및 증가된 단백질 생산을 초래하는 ASO는 동물 모델, 예를 들어 전장 인간 유전자가 노크인된 형질전환 마우스 모델 또는 질환의 인간화 마우스 모델을 사용하여 생체내 시험될 수 있다. ASO의 적절한 투여 경로는 ASO의 전달이 요구되는 질환 및/또는 세포 유형에 따라 달라질 수 있다. ASO는 예를 들어 척수강내 주사, 뇌실심내 주사, 복강내 주사, 근육내 주사, 피하 주사 또는 정맥내 주사에 의해 투여될 수 있다. 투여 후, 모델 동물의 세포, 조직 및/또는 기관은 예를 들어 당업계에 공지되고 본원에 기재된 방법에 의해 스플라이싱(예를 들어, 효율, 속도, 정도) 및 단백질 생산을 평가함으로써 ASO 치료의 효과를 결정하기 위해 평가될 수 있다. 동물 모델은 또한 질환 또는 질환 중증도의 표현형 또는 행동 지표일 수 있다.
또한 본 개시내용의 범위 내에는 NMD 억제제, 예를 들어 시클로헥시미드의 존재 하에 NMD 유도 엑손을 확인하거나 입증하는 방법이 있다. 예시적인 방법이 실시예 2에 제공된다.
예시적인 유전자는 표 1에 요약되어 있다. 각 인트론의 서열은 표 2에 요약되어 있다.
실시예
본 개시는 하기 실시예에 의해 더욱 구체적으로 예시될 것이다. 그러나, 본 개시는 임의의 방식으로 이러한 실시예에 의해 제한되지 않는 것으로 이해되어야 한다.
실시예 1: 차세대 시퀀싱을 이용한 RNAseq에 의한 전사체에서의 NMD 유도 엑손 포함 이벤트의 확인
NIE 포함 이벤트를 확인하기 위해 본원에 기재된 유전자에 의해 생산된 전사체의 스냅샷(snapshot)을 나타내기 위해 차세대 시퀀싱을 사용하여 전체 전사체 샷건 시퀀싱을 수행하였다. 이러한 목적을 위해, 인간 세포의 핵 및 세포질 분획으로부터의 폴리A+ RNA를 단리하고, Illumina의 TruSeq Stranded mRNA 라이브러리 Prep Kit를 사용하여 cDNA 라이브러리를 작제하였다. 라이브러리를 페어-말단 시퀀싱하여(pair-end sequenced) 인간 게놈(Grch38/ hg38 어셈블리)에 맵핑된 100-뉴클레오티드 리드를 생성하였다. 도 2는 PKD2 유전자에서 상이한 예시적인 넌센스-매개 mRNA 붕괴(NMD) 유도 엑손의 확인을 도시한다.
실시예 2: 사이클로헥시미드 처리를 통한 NIE의 확인
DMSO-처리 또는 사이클로헥시미드-처리된 인간 신장 혼합 상피 세포 및 인간 신장 피질 상피 세포 및 엑손의 프라이머로부터의 세포질 RNA를 사용한 RT-PCR 분석은 NMD 유도 엑손에 상응하는 밴드의 존재를 확인할 수 있다. 생성물의 동일성을 시퀀싱에 의해 확인하였다. 밴드의 밀도측정 분석을 수행하여 총 전사체의 NMD 엑손 포함 백분율을 계산하였다. NMD를 억제하기 위해 사이클로헥시미드로 세포를 처리하면 세포질 분획에서 NMD 유도 엑손에 상응하는 생성물이 증가할 수 있다. 도 4b는 각각 사이클로헥시미드 처리를 사용한 다양한 유전자 전사체에서 예시적인 NIE 엑손의 확인을 도시한다.
실시예 3: NMD 엑손 영역 ASO 워크
ASO를 사용하여 3' 스플라이스 부위의 바로 업스트림에, 3' 스플라이스 부위에 걸쳐, NMD 엑손에 걸쳐, 5' 스플라이스 부위에 걸쳐, 및 5' 스플라이스 부위의 다운스트림에 있는 NMD 엑손 영역 표적화 서열에 대해 ASO 워크(walk)를 수행하였다. 한 번에 5개의 뉴클레오티드를 이동시킴으로써 이러한 영역을 덮도록 ASO를 설계하였다. 도 5는 예시적인 NIE 엑손 영역에 대한 ASO 워크를 도시한다.
실시예 4: RT-PCR에 의해 평가된 NMD 엑손 영역 ASO 워크
ASO 워크 서열을 예를 들어, RT-PCR에 의해 평가할 수 있다. 짐노틱 섭취(gymnotic uptake), 트랜스펙션 또는 뉴클레오펙션에 의해 인간 세포에서 본원에 기재된 바와 같은 NMD 엑손 영역을 표적화하는 ASO로 처리된 인간 세포의 SYBR-안전하게 염색된 RT-PCR 생성물을 나타내기 위해 PAGE를 사용할 수 있다. NMD 엑손 포함 및 전장에 상응하는 생성물을 정량화하고, NMD 엑손 포함 백분율을 플롯팅하였다. 전장 생성물을 내부 mRNA 대조군으로 정규화할 수 있으며, 대조군에 대한 배수-변화를 플롯팅할 수 있다. 도 7a는 80 nM에서 명시된 ASO로 24시간 동안 트랜스펙션된 일차 신장 혼합 상피 세포를 사용하여 프로브-기반 RT-qPCR(실시예 5 참조, RPL32로 정규화됨)에 의해 평가된 바와 같은 생산적인 PKD2 mRNA의 변화를 도시한다(도 6a 및 6b의 매크로워크(macrowalk) 참조). 도 7b는 80 nM에서 명시된 ASO로 24시간 동안 트랜스펙션된 일차 신장 혼합 상피 세포를 사용하여 프로브-기반 RT-qPCR(실시예 5 참조, RPL32로 정규화됨)에 의해 평가된 바와 같은 비생산적인 PKD2 mRNA의 변화를 도시한다(도 6a 및 6b의 매크로워크 참조). 도 8a는 80 nM에서 명시된 ASO로 24시간 동안 트랜스펙션된 일차 신장 혼합 상피 세포를 사용하여 프로브-기반 RT-qPCR(실시예 5 참조, RPL32로 정규화됨)에 의해 평가된 바와 같은 생산적인 PKD2 mRNA의 변화를 도시한다(도 5의 매크로워크 참조). 도 8b는 80 nM에서 명시된 ASO로 24시간 동안 트랜스펙션된 일차 신장 혼합 상피 세포를 사용하여 프로브-기반 RT-qPCR(실시예 5 참조, RPL32로 정규화됨)에 의해 평가된 바와 같은 비생산적인 PKD2 mRNA의 변화를 도시한다(도 5의 매크로워크 참조).
실시예 5: RT-qPCR에 의해 평가된 NMD 엑손 영역 ASO 워크
내부 mRNA 대조군으로 정규화된 SYBR-그린 또는 임의의 프로브-기반 RT-qPCR 증폭 결과를, RT-qPCR에 의해 평가될 수 있고 RT-qPCR 결과를 확인하기 위해 Sham에 대한 배수 변화로서 플롯팅될 수 있는 동일한 ASO 섭취 실험을 사용하여, 획득할 수 있다.
실시예 6: CXH-처리된 세포에서 선택된 ASO의 용량-의존적 효과
RNAiMAX 트랜스펙션에 의해 마우스 또는 인간 세포에서 모의-처리된(Sham, RNAiMAX 단독), 또는 30 nM, 80 nM, 및 200 nM 농도에서 NMD 엑손을 표적화하는 ASO로 처리된 SYBR-안전하게 염색된 RT-PCR 생성물을 나타내기 위해 PAGE를 사용할 수 있다. NMD 엑손 포함 및 전장에 상응하는 생성물을 정량화하고, NMD 엑손 포함 백분율을 플롯팅할 수 있다. 전장 생성물을 또한 HPRT 내부 대조군으로 정규화할 수 있으며, Sham에 대한 배수-변화를 플롯팅할 수 있다.
실시예 7: 선택된 ASO의 주입
다양한 농도에서 PBS-주사된(1 ㎕)(-) 또는 ASO 또는 Cep290(음성 대조군 ASO; Gerard et al, Mol. Ther. Nuc. Ac., 2015) 2'-ASO-주사된(1 ㎕)(+) 것으로부터의 마우스의 SYBR-안전하게 염색된 RT-PCR 생성물의 PAGE를 수행하였다. NMD 엑손 포함 및 전장에 상응하는 생성물을 정량화하고, NMD 엑손 포함 백분율을 플롯팅할 수 있다. 전장 생성물을 GAPDH 내부 대조군으로 정규화할 수 있으며, PBS-주사된 것에 비해 ASO-주사된 것의 배수-변화를 플롯팅할 수 있다.
실시예 8: 차세대 시퀀싱을 이용한 RNAseq에 의한 전사체에서 NMD 유도 대안적인 스플라이싱 이벤트의 확인
ASO에 의해 접근 가능한 것으로 알려진 장기에서의 비생산적인 AS 이벤트를, 인간 간, 신장, 중추 신경계(CNS), 및 안구 조직으로부터의 83개의 공개적으로 이용 가능한 RNA-시퀀싱(RNA-seq) 데이터세트를 분석함으로써 확인하였다. 전산 분석은 다양한 유형의 총 13,121개의 비생산적인 AS 이벤트를 함유하는 7,819개의 고유 유전자를 발견하였다. 이러한 유전자를 Orphanet(www.orpha.net/)와 같은 유전 질환 데이터베이스와 상호-참조함으로써, 비생산적인 AS 이벤트를 갖는 1,265개의 질환-관련 유전자를 확인하였다. 많은 NMD-민감성 전사체는 분석된 조직에서 효율적으로 분해되고 RNAseq에 의해 검출할 수 없기 때문에, 지금까지 확인된 것보다 비생산적인 AS 이벤트를 갖는 유전자가 더 많이 존재한다. 도 3은 PKD2 유전자에서 상이한 예시적인 넌센스-매개 mRNA 붕괴(NMD) 유도 대안적인 스플라이싱 이벤트의 확인을 도시한다.
실시예 9: 사이클로헥시미드 처리를 통한 대안적 스플라이싱의 확인
인-실리코 예측을 검증하고 잠재적으로 표적화 가능한 비생산적인 AS 이벤트의 존재비를 정량화하기 위해, 세포를 NMD를 억제하는 것으로 알려진 번역 억제제인 사이클로헥시미드(CHX)로 처리하였다. 예상대로, 역전사효소(RT)-PCR 분석은 DMSO-처리된 세포와 비교하여 CHX 처리시 다양한 세포주에서 예측된 비생산적인 PKD2 스플라이싱 이벤트의 일관된 증가를 나타내었다. 증가는 이러한 비생산적인 AS 이벤트가 NMD에 의한 전사체 분해를 초래한다는 것을 나타낸다. 도 4b는 각각 사이클로헥시미드 처리를 사용한 다양한 유전자 전사체에서 예시적인 NIE 엑손의 확인을 도시한다.
실시예 10: PKD2 엑손, 대안적인 5' ss 및 5'UTR 영역 ASO 워크
비생산적인 AS 이벤트를 방지하고/하거나 PKD2 mRNA 전사체의 번역을 조절할 수 있는 ASO를 확인하기 위해, 관심 AS 이벤트 또는 PKD2의 5' UTR을 따라 5-nt 단계로 초기 체계적인 ASO 워크를 수행하였다. 도 5는 PKD2 프리-mRNA의 NMD 엑손 AS 이벤트를 따른 체계적인 ASO 워크를 도시한다. 도 6a 및 6b는 PKD2 프리-mRNA의 대안적인 5' ss AS 이벤트를 따른 체계적인 ASO 워크를 도시한다. 도 10은 PKD2 mRNA의 5' UTR을 따른 체계적인 ASO 워크를 도시한다. 이러한 ASO는 2' 리보스 위치에서 균일한 포스포로티오에이트 백본 및 메톡시에틸을 가질 수 있다(2'MOE-PS). 이러한 변형은 이전에 높은 친화성으로 RNA에 대한 결합을 허용하고 표적 RNA-ASO 복합체의 뉴클레아제 및 RNase H 절단 둘 모두에 대한 내성을 부여하는 것으로 나타났다. 트랜스펙션된 세포로부터의 RT-PCR 분석은 PKD2 mRNA에서 AS를 감소시키고 생산적인 mRNA를 증가시키거나 PKD2의 번역을 촉진하는 여러 ASO를 확인한다. PKD2 생산적인 mRNA의 관찰된 증가는 TaqMan qPCR에 의해 확인된다. PKD2 번역의 관찰된 증가는 웨스턴 블롯팅에 의해 확인된다. AS의 배수 변화를 생산적 mRNA(qPCR)의 증가에 대해 플롯팅하여 ASO가 기전에서 기능하고 있음을 입증할 수 있다. PKD2 번역의 관찰된 증가는 웨스턴 블롯팅에 의해 확인된다. 번역의 배수 변화를 폴리시스틴 2 단백질의 증가에 대해 플롯팅하여(웨스턴 블롯팅), ASO가 기전에 대해 기능하고 있음을 입증할 수 있다. 이러한 결과는 유전자 발현 상향조절이 ASO로 비생산적인 AS를 방지함으로써 달성될 수 있음을 강력하게 시사할 것으로 예상된다.
실시예 11: 용량-의존적 방식으로 세포 단백질 발현을 증가시키기 위한 ASO의 사용
바람직한 상향조절 수준은 표적 유전자 및 질환마다 다양하기 때문에, 초기 워크로부터 선택된 양성 ASO 히트를 사용하여 생산적인 mRNA의 증가가 비생산적인 AS 이벤트에 걸쳐 적정될 수 있는지 여부를 결정한다. 예시적인 PKD2 ASO를 용량-의존적 상향조절을 입증하기 위해 증가하는 농도로 세포에서 트랜스펙션하였다. 농도를 ASO의 역가에 기초하여 선택하였다. RT-PCR 결과는 동일한 개개 용량으로 트랜스펙션된 비-표적화 ASO 대조군과 비교하여 PKD2에서 비생산적인 대안적인 3'ss 선택의 용량-의존적 감소를 보여준다. 역으로, 생산적 mRNA의 용량-의존적 증가는 비-표적화 ASO 대조군과 비교하여 TaqMan qPCR에 의해 측정시 관찰된다. 생산적인 mRNA에서 관찰된 상향조절이 단백질 수준의 용량-의존적 증가로 해석되는지 여부를 결정하기 위해, 폴리시스틴 2를 표적화 ASO의 농도를 증가시키면서 트랜스펙션된 세포로부터의 추출물에서 측정하였다. 먼저, PKD2에 대한 항체를 단백질 발현의 짧은 간섭 (si)RNA-매개 녹다운 및 웨스턴 블롯 분석에 의해 검증하였다. 선택된 ASO로 트랜스펙션된 세포로부터의 추출물의 면역블롯팅 결과는 폴리시스틴 2의 용량-의존적 증가를 나타낼 것으로 예상된다. 비-표적화 ASO 대조군은 단백질 수준에 유의한 영향을 미치지 않을 것으로 예상된다. 전체적으로, 데이터는 다양한 유형의 비생산적인 AS 이벤트를 표적화하는 ASO가 생산적인 mRNA의 적정 가능한 증가를 초래하여 단백질 발현의 증가를 초래함을 나타낼 것으로 예상된다. TANGO ASO-매개 단백질 상향조절의 적정 가능한 특성은 단백질 수준을 엄격하게 제어하고 과발현의 위험을 감소시킬 수 있음을 시사할 것으로 예상된다. TANGO 기술의 이러한 측면은 상염색체 우성 반수체 불충분 질환을 해결하는데 특히 적합할 것으로 예상된다.
실시예 12: 생체내 TANGO 접근법의 검증
생체내 TANGO 기전의 적용 가능성을 입증하기 위해, PKD2에서 비생산적인 엑손 포함 이벤트를 표적화하는 ASO 워크로부터 양성 히트를 선택할 수 있다. 인간 PKD2 유전자에서 비생산적인 AS 이벤트는 또한 마우스에서 발생하고 서열 수준에서 고도로 보존되어(데이터는 제시되지 않음), 마우스에서 인간 표적화 ASO를 시험할 수 있다. 본원에 제시된 다른 ASO와 유사하게, PKD2 ASO의 증가하는 농도의 짐노틱(자유) 섭취는 비-표적화 ASO 대조군과 비교하여 AS의 용량-의존적 감소 및 세포에서 생산적 mRNA의 역상관된 증가를 초래한다. ASO의 관찰된 효과가 생체내에서 요약될 수 있는지 확인하기 위해, ASO를 마우스에 투여하거나 PBS를 주사를 통해 마우스에 투여하였다. RNA 및 단백질을 주사 5일 후에 처리된 마우스로부터 추출할 수 있다. RT-PCR 분석은 대조군 PBS 코호트와 비교하여 ASO-처리된 마우스에서 명확한 표적 관여 및 비생산적인 엑손 내포의 일관된 감소를 나타내기 위해 수행될 수 있다. 이러한 감소는 TaqMan qPCR에 의해 측정된 생산적 mRNA의 대략 4배 증가로 효과적으로 번역될 수 있다. 동시에, 웨스턴 블롯에 의한 단백질의 증가를 검증된 항체를 사용하여 검출할 수 있다. 이러한 데이터는 비생산적인 AS 이벤트를 이용함으로써 단백질 발현을 상향조절하기 위한 TANGO 접근법의 개념의 생체내 증거를 제공한다.
실시예 13: 유전 질환의 치료를 위한 TANGO(Targeted Augmentation of Nuclear Gene Output)
단백질 발현을 증가시키기 위해 프리-mRNA 스플라이싱의 안티센스-매개 조절을 이용하는 신규한 기술인 TANGO(Targeted Augmentation of Nuclear Gene Output)를 개발하였다. TANGO는 넌센스-매개 mRNA 붕괴(NMD) 또는 핵 보유에 의한 전사체 분해를 초래하는 자연 발생 비생산적인 스플라이싱 이벤트를 방지한다. 이렇게 함으로써, TANGO는 생산적인 mRNA의 생성을 증가시켜, 전장의 완전한 기능 단백질의 증가를 초래한다. 비생산적인 이벤트를 확인하기 위해 RNA 시퀀싱(RNAseq) 데이터세트의 생물정보학적 분석을 수행하였다. 비생산적인 이벤트는 단백질-코딩 유전자의 50% 초과에서 발견되었으며, 이 중 대략 2,900개는 질환-관련된다. 인-실리코 예측을 검증하기 위해, 다양한 유형의 NMD 유도, 비생산적인 대안적 스플라이싱(AS) 이벤트(카세트 엑손, 대안적인 스플라이스 부위, 및 대안적인 인트론)를 나타내는 표적(예를 들어, PKD2)을, NMD를 억제하는 것으로 알려진 번역 억제제인 사이클로헥시미드(CHX)로 세포를 처리함으로써 선택하고 이들의 존재비를 정량하였다. 선택된 표적의 RT-PCR 분석을 수행하였고, DMSO-처리된 세포와 비교하여 CHX 처리시 비생산적인 mRNA의 증가를 관찰하였다. 안티센스 올리고뉴클레오티드(ASO)는 3가지 유형의 NMD 유도, 비생산적인 AS 이벤트를 표적화하도록 설계되며, TANGO ASO는 시험관내에서 용량-의존적 방식으로 생산적인 mRNA 및 단백질을 증가시키기 위해 스플라이싱을 조절할 수 있을 것으로 예상된다. TANGO 기전과 일치하게, ASO-매개된 상향조절의 수준은 표적화된 NMD 유도 이벤트의 존재비에 정비례하는 것으로 관찰될 것으로 예상된다. 또한, PKD2에서 비생산적인 AS 이벤트를 표적화하는 TANGO ASO의 야생형 마우스에의 주사는 생산적인 mRNA 및 폴리시스틴 2의 증가를 초래할 것으로 예상된다. TANGO가 자연 발생 비생산적인 AS를 이용함에 따라, 이러한 신규한 접근법은 야생형 또는 저형성 대립유전자로부터 유전자 발현을 상향조절하는 데 이용될 수 있어, 유전 질환을 치료하기 위한 잠재적으로 독특한 전략을 제공한다. TANGO는 유전적 간질과 같은 상염색체 우성 반수체부전 질환에 대한 치료를 개발하기 위해 적용되고 있다. 야생형 대립유전자로부터 발현을 증가시키는 TANGO ASO는 결핍된 단백질의 생리학적 수준을 회복시키는 데 사용될 수 있다.
실시예 14: NMD 접합부의 전사체 데이터베이스 및 라벨링:
주석이 달린 전사체를 GENCODE(v. 28) 및 REFSEQ(UCSC를 통해)로부터 다운로딩하였다. 각각의 주석이 달린 엑손-엑손 접합부는 "코딩" 또는 "NMD"로 라벨링된다. 접합부는 "넌센스_매개_붕괴"(GENCODE) 또는 "NR"(REFSEQ)로 라벨링된 전사체에서 독점적으로 발견되는 경우에만 "NMD"로 라벨링된다.
RNA-seq 라이브러리 프로세싱:
스플라이스 접합부 카운트를 생성하기 위해 모든 RNA-seq 샘플을 STAR1 v2.6.1b를 사용하여 hg38 게놈 및 조합된 전사체 데이터베이스에 정렬하였다.
추정되는 NMD 유도 스플라이싱 이벤트의 확인 및 정량:
모든 샘플을 SUPPA22를 통해 진행시켜 주석이 달린 대안적인 스플라이싱 이벤트를 규정하였다. 이후, 하기와 같이 대안적 스플라이싱의 각 유형을 라벨링하고 정량화하기 위해 상이한 접근법을 사용하였다:
엑손 내포( EI ) 및 엑손 스킵핑 ( ES ): "스킵핑된 엑손" 이벤트를 SUPPA로부터 분석하여 각 이벤트에 대한 포함 및 스킵핑 접합부를 수득하였다. 스킵핑 접합부가 "NMD"로 라벨링된 경우, 이벤트는 "ES_NMD"로 라벨링된다. 포함 접합부 중 하나가 "NMD"로 라벨링된 경우, 이벤트는 "EI_NMD"로 라벨링된다. 그 외에는, 이벤트는 "카세트 엑손"으로 라벨링된다. 포함 및 스킵핑 접합부 카운트는 STAR 출력으로부터 검색되며, 이러한 카운트는 동일한 대안적으로 스플라이싱된 엑손을 공유하는 모든 이벤트에 걸쳐 합산된다.
포함에 대한 최종 PSI는 로 계산된다.
내포 이벤트의 경우, .
스킵핑 이벤트의 경우, .
대안적인 3' 및 5' 스플라이스 부위(A3 및 A5): A3 및 A5 이벤트는 SUPPA로부터 분석되어 각각의 대안적인 이벤트에 상응하는 접합부를 수득한다. 긴 또는 짧은 접합부가 "NMD"로 라벨링되는 경우, NMD 이벤트가 보고된다. 둘 접합부 모두가 NMD를 보고하는 경우, 이는 그러한 영역에 복잡한 스플라이싱이 있을 가능성이 있기 때문에 보고되지 않는다. 스플라이스 접합부 카운트를 STAR 출력으로부터 검색하였다. PSI는 로 보고된다.
대안적인 인트론 이벤트(AI): 보유된 인트론 이벤트를 SUPPA로부터 분석하여 대안적인 인트론 이벤트의 목록을 획득하였다. 이벤트 접합부가 NMD로 라벨링된 경우, AI 이벤트를 NMD로 라벨링하였다. PSI를 계산하기 위해, 이의 3' 및 5' 스플라이스 부위(및 동일한 AI 이벤트를 함유하는 다른 모든 모 엑손)를 사용하여 모든 접합부를 합산함으로써 AI가 위치된 엑손의 발현 수준을 추정하였다. AI 접합부의 사용은 이후 범위 [0, ]에 속할 것이며, 이는 AI 접합부의 완전한 사용(이는 인트론 보유를 초래하지 않음)이 엑손 접합부 및 AI 접합부에서 유사한 카운트로 달성되기 때문이다(전체 인트론 보유는 접합부에 대해 0 판독을 가짐). Ψ를 계산하기 위해, 이러한 범위가 이제 이 되도록 접합부 카운트를 정규화하였다.
질환 관련성 주석 :
Orphanet의 공개적으로 이용 가능한 데이터 저장소인 Orphadata(http://www.orphadata.org)로부터 유전자-질환 연관 데이터를 다운로딩하였다. 주석을 모든 유전자 기호 별칭을 포함하도록 확장하였다.
실시예 15: 사이클로헥시미드(CHX)로의 처리, 세포 배양, 및 트랜스펙션
비생산적 mRNA의 존재비를 결정하기 위해, 세포를 DMSO에 용해된 50 ㎍/ml의 CHX(Cell Signaling Technology)와 함께 3시간 동안 인큐베이션하였다.
예를 들어, 세포를 10% FBS를 갖는 EMEM 중에서 성장시키고, 1×105개의 세포를 24-웰 플레이트에 시딩하고, 초기 스크리닝을 위해 80 nM ASO 또는 제조사의 지침에 따라 Lipofectamine RNAiMax 시약(Invitrogen)을 사용하여 1, 5, 25 nM의 선택된 ASO로 역-트랜스펙션하였다. 트랜스펙션 24시간 후에 RNeasy 미니 키트(Qiagen)를 사용하여 총 RNA를 추출하고, ImProm-II 역전사효소(Promega)로 cDNA를 합성하였다. 트랜스펙션 48시간 후에 총 단백질을 RIPA 완충제(Cell Signaling Technology)로 추출하였다.
또 다른 예로서, HEK293 세포를 10% FBS를 갖는 EMEM 중에서 성장시키고, 7×105개의 세포를 6-웰 플레이트에 시딩하고, 제조사의 지침에 따라 Lipofectamine RNAiMax 시약(Invitrogen)을 사용하여 30, 60, 및 120 nM의 안티센스 올리고뉴클레오티드(ASO)로 역-트랜스펙션하였다. 트랜스펙션 24시간 후에 RNeasy 미니 키트(Qiagen)를 사용하여 총 RNA를 추출하고, ImProm-II 역전사효소(Promega)로 cDNA를 합성하였다. 트랜스펙션 48시간 후에 총 단백질을 RIPA 완충제(Cell Signaling Technology)로 추출하였다.
또 다른 예로서, Huh7 세포를 10% FBS를 갖는 DMEM 중에서 성장시키고, 1×105개의 세포를 12-웰 플레이트에 시딩하고, 제조사의 지침에 따라 Lipofectamine RNAiMAX(Invitrogen)를 사용하여 5, 20, 또는 80 nM ASO로 역-트랜스펙션하였다. RT-PCR 분석을 위해, 세포를 트랜스펙션 3시간 내지 21시간 후에 DMSO 중 50 ㎍/mL의 CHX(Cell Signaling Technology)로 처리하였다. 트랜스펙션 24시간 후에 RNeasy 미니 키트(Qiagen)를 사용하여 총 RNA를 추출하고, ImProm-II 역전사효소(Promega)로 cDNA를 합성하였다. 트랜스펙션 48시간 후에 총 단백질을 RIPA 완충제(Cell Signaling Technology)로 추출하였다.
또 다른 예로서, ReNcell VM 세포를 약 90% 컨플루언시(confluency)에 도달할 때까지 라미닌 코팅된 플라스크(2D 배양)에서 각각 20 ng/mL의 bFGF 및 EGF를 함유하는 완전한 NSC 배지에서 성장시켰다. 이후, 세포를 아큐타제 처리에 의해 분리하고, PBS로 세척하고, 김노틱(유리) 섭취를 위해 3, 8, 20 μM ASO를 갖는 초저 부착 표면 24-웰 폴리스티렌 플레이트에서 완전 NSC 배지 중에서 배양하였다. 총 RNA를 배지에 ASO 첨가 72시간 후에 RNeasy 미니 키트(Qiagen)를 사용하여 추출하고, cDNA를 ImProm-II 역전사효소(Promega)로 합성하였다.
실시예 16: qPCR 및 RT-PCR 검정
생산적인 mRNA의 발현 분석을 위해, PKD2에 대해 TaqMan qPCR(Thermo Fisher SC)을 수행하였다. SYBR 그린 qPCR 또는 프로브-기반 qPCR을 정방향 프라이머 및 역방향 프라이머, 및 프로브를 갖는 인간 PKD2에 대해 수행하였다. 사이클링 조건은, 예를 들어, 30 사이클 동안 변성을 위해 95℃에서 30초, 어닐링을 위해 60℃에서 30초 및 연장을 위해 72℃에서 60초였다. 또 다른 예로서, 사이클링 조건은 29 사이클 동안 변성을 위해 95℃에서 30초, 어닐링을 위해 55℃에서 30초, 및 연장을 위해 72℃에서 30초였다. 또 다른 예로서, 사이클링 조건은 28 사이클 동안 변성을 위해 95℃에서 30초, 어닐링을 위해 55℃에서 30초, 및 연장을 위해 72℃에서 75초였다. 또 다른 예로서, 사이클링 조건은 28 사이클 동안 변성을 위해 95℃에서 30초, 어닐링을 위해 56℃에서 30초, 및 연장을 위해 72℃에서 75초였다. PCR 생성물을 5% 폴리아크릴아미드 겔에서 분리하고, Multi Gauge 소프트웨어 버전 2.3으로 정량화하였다.
실시예 17: 웨스턴 블롯팅
단백질 추출물을 Pierce BCA 단백질 검정 키트(ThermoFisher)를 사용하여 비색 검정에 의해 정량화하였다.
예를 들어, 면역블롯팅을 25 ㎍의 용해물로 수행하였다. 또 다른 예로서, 면역블롯팅을 60 ㎍의 용해물로 수행하였다. 또 다른 예로서, 면역블롯팅을 120 ㎍의 용해물로 수행하였다. 또 다른 예로서, 면역블롯팅을 30 ㎍의 용해물로 수행하였다. 일차 항체 및 이차 항체를 구입하였다. 블롯을 Typhoon RLA 9000 이미저(General Electric)를 사용하여 스캔하였다. 밀도측정 분석을 Multi Gauge 소프트웨어 버전 2.3을 사용하여 수행하였다.
실시예 18: 유세포 분석
FACS 완충제에서 배양 플레이트로부터 세포를 리프팅하였다. 세포를 APC-항체(1:250)로 염색하였다. 15,000개 세포로부터의 데이터를 Guava Easycyte 12HT(EMD Millipore) 유세포 분석기에서 수집하였다. 형광 마이너스 1을 사용하여 포지티브 게이트를 결정하였다.
실시예 19: PKD2 엑손 영역 및 5'UTR 벡터화된 ASO 워크
비생산적인 AS 이벤트를 방지할 수 있는 벡터화된 ASO를 확인하기 위해, 체계적인 벡터화된 ASO 워크를 관심 AS 이벤트를 따라 5-nt 또는 2-nt 단계로 수행할 수 있다. 이러한 벡터화된 ASO를 벡터로부터, 이의 표적화 서열로서 ASO 서열을 함유하는 변형된 U1 snRNA 또는 U7 snRNA로서 발현할 수 있다. 도 5는 PKD2 프리-mRNA의 NMD 엑손 AS 이벤트를 따른 체계적인 벡터화된 ASO 워크를 도시한다. 도 6a 및 6b는 PKD2 프리-mRNA의 대안적인 5' ss AS 이벤트를 따른 체계적인 벡터화된 ASO 워크를 보여준다. 도 10은 PKD2 mRNA의 5' UTR을 따른 체계적인 벡터화된 ASO 워크를 도시한다. 벡터화된 ASO는 변형된 U7 snRNA로 발현된다. 트랜스펙션된 세포주로부터의 RT-PCR 분석은 PKD2 mRNA에서 감소된 AS 및 생산적인 mRNA의 증가를 초래하는 여러 벡터화된 ASO를 확인할 수 있다. PKD2 생산적인 mRNA의 관찰된 증가는 TaqMan qPCR에 의해 확인될 수 있다. AS의 배수 변화는 생산적 mRNA(qPCR)의 증가에 대해 플롯팅되어 벡터화된 ASO가 기전에 대해 기능하고 있음을 입증할 수 있다.
본 발명의 바람직한 구현예가 여기에서 도시되고 설명되었지만, 이러한 구현예는 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 이제 본 발명을 벗어나지 않고 당업자에게 수많은 변형, 변경 및 대체가 일어날 것이다. 본원에 기재된 본 발명의 구현예에 대한 다양한 대안이 본 발명을 실시하는데 사용될 수 있음을 이해해야 한다. 다음 청구범위는 본 발명의 범위를 정의하고 이들 청구범위 및 그 등가물 범위 내의 방법 및 구조를 포괄하도록 의도된다.
예시적인 구현예 I
특정 구현예에서, 표적 유전자로부터 전사되고 넌센스 매개 RNA 붕괴 유도 엑손(NMD 엑손)을 포함하는 프리-mRNA를 갖는 세포에서 표적 단백질의 발현을 조절하는 방법이 본원에 기재되어 있고, 방법은 제제 또는 이 제제를 인코딩하는 벡터를 세포에 접촉시켜, 제제는 프리-mRNA로부터 NMD 엑손의 스플라이싱을 조절함으로써, 프리-mRNA로부터 처리되는 프로세싱된 mRNA의 수준을 조절하는 단계, 및 세포에서 표적 단백질의 발현을 조절하는 단계로서, 표적 단백질은 폴리시스틴 2이고 표적 유전자는 PKD2 유전자인 단계를 포함한다.
특정 구현예에서, 대상체의 세포에서 표적 단백질의 발현을 조절함으로써 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되어 있고, 방법은 제제 또는 이 제제를 인코딩하는 벡터를 대상체의 세포에 접촉시켜, 제제는 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터의 넌센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 처리되는 프로세싱된 mRNA의 수준을 조절 단계, 및 세포에서 표적 단백질의 발현을 조절하는 단계로서 표적 단백질은 폴리시스틴 2이고 표적 유전자는 PKD2 유전자인 단계를 포함한다.
일부 구현예에서, 제제는 (a) 프리-mRNA의 표적화 부분에 결합하고; (b) NMD 엑손의 스플라이싱에 관여하는 인자의 결합을 조절하거나; 또는 (c) (a)와 (b)의 조합이다.
일부 구현예에서, 제제는 NMD 엑손의 표적화 부분의 영역에 대한 스플라이싱에 관여하는 인자의 결합을 방해한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손에 근접한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 5' 말단의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 5' 5' 말단의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 3' 말단 다운스트림의 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 3' 말단 다운스트림의 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031085의 게놈 부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031085의 게놈 부위의 업스트림에 있는 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031140의 게놈 부위 다운스트림의 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031140의 게놈 부위 다운스트림의 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 프리-mRNA의 2개의 정규 엑손 영역 사이의 인트론 영역에 위치하고, 인트론 영역은 NMD 엑손을 함유한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손과 적어도 부분적으로 중첩된다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 업스트림 또는 다운스트림 인트론과 적어도 부분적으로 중첩된다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 5' NMD 엑손-인트론 접합부 또는 3' NMD 엑손-인트론 접합부를 포함한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손 내에 있다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 또는 그 초과 개의 연속 뉴클레오티드를 포함한다.
일부 구현예에서, NMD 엑손은 표 2에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80%, 적어도 90% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, NMD 엑손은 표 2에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.9%, 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, NMD 엑손은 표 2에 열거된 서열로 이루어진 군으로부터 선택된 서열을 포함한다.
일부 구현예에서, 프리-mRNA는 표 2 또는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, 프리-mRNA는 표 2 또는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 유전자 서열에 의해 인코딩된다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 표 2 또는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고, ASO는 표 4에 열거된 서열로 이루어진 군으로부터 선택된 서열의 적어도 8개의 연속 핵산에 상보적인 적어도 약 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성인 서열을 포함한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085 88031140 내에 있다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085 88031140의 업스트림 또는 다운스트림이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 엑손 GRCh38/ hg38: chr4:88031085 88031140의 엑손-인트론 접합부를 포함한다.
일부 구현예에서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 전장 폴리시스틴 2 또는 야생형 폴리시스틴 2이다.
일부 구현예에서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 야생형 폴리시스틴 2에 비해 적어도 부분적으로 기능적이다.
일부 구현예에서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 전장 야생형 폴리시스틴 2에 비해 적어도 부분적으로 기능적이다.
일부 구현예에서, 제제는 프리-mRNA로부터 NMD 엑손의 배제를 촉진한다.
일부 구현예에서, 제제와 접촉된 세포에서 프리-mRNA로부터의 NMD 엑손의 배제는 대조군 세포에서 프리-mRNA로부터의 NMD 엑손의 배제에 비해 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다.
일부 구현예에서, 제제는 세포에서 프로세싱된 mRNA의 수준을 증가시킨다.
일부 구현예에서, 제제와 접촉된 세포에서 프로세싱된 mRNA의 수준은 대조군 세포에서 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다.
일부 구현예에서, 제제는 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 제제와 접촉된 세포에서 프리-mRNA로부터 발현된 표적 단백질의 수준은 대조군 세포에서 생산된 표적 단백질의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다.
일부 구현예에서, 질환 또는 병태는 표적 단백질의 기능 상실 돌연변이에 의해 유도된다.
일부 구현예에서, 질환 또는 병태는 표적 단백질을 인코딩하는 유전자의 반가불충분성과 연관되고, 여기서 대상체는 기능성 표적 단백질을 인코딩하는 제1 대립유전자, 및 표적 단백질이 생산되지 않거나 감소된 수준으로 생산되는 제2 대립유전자, 또는 비기능성 표적 단백질 또는 부분 기능성 표적 단백질을 인코딩하는 제2 대립유전자를 갖는다.
일부 구현예에서, 질환 또는 병태는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 및 두개내 동맥류로 이루어진 군으로부터 선택된다.
일부 구현예에서, 질환 또는 병태는 표적 단백질을 인코딩하는 유전자의 상염색체 열성 돌연변이와 연관되며, 여기서 대상체는 제 (i) 표적 단백질은 생산되지 않거나 야생형 대립유전자에 비해 감소된 수준으로 생산되거나; 또는 (ii) 생산된 표적 단백질은 야생형 대립유전자에 비해 비기능적이거나 부분적으로 기능적인 제1 대립유전자 인코딩, 및 (iii) 표적 단백질은 야생형 대립유전자에 비해 감소된 수준으로 생산되고 생산된 표적 단백질은 야생형 대립유전자에 비해 적어도 부분적으로 기능적임; 또는 (iv) 생산된 표적 단백질은 야생형 대립유전자에 비해 부분적으로 기능적인 제2 대립유전자를 갖는다.
일부 구현예에서, 질환 또는 병태는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 및 두개내 동맥류로 이루어진 군으로부터 선택된다.
일부 구현예에서, 제제는 프리-mRNA로부터 NMD 엑손의 배제를 촉진하고 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 제제는 표적 단백질을 인코딩하는 프리-mRNA로부터 NMD 엑손의 배제를 억제한다.
일부 구현예에서, 제제와 접촉된 세포에서 프리-mRNA로부터의 NMD 엑손의 배제는 대조군 세포에서 프리-mRNA로부터의 NMD 엑손의 배제에 비해 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 감소된다.
일부 구현예에서, 제제는 세포에서 프로세싱된 mRNA의 수준을 감소시킨다.
일부 구현예에서, 제제와 접촉된 세포에서 프로세싱된 mRNA의 수준은 대조군 세포에서 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 감소된다.
일부 구현예에서, 제제는 세포에서 표적 단백질의 발현을 감소시킨다.
일부 구현예에서, 제제와 접촉된 세포에서 프리-mRNA로부터 발현된 표적 단백질의 수준은 대조군 세포에서 발현된 표적 단백질의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 감소된다.
일부 구현예에서, 질환 또는 병태는 표적 단백질의 기능 이득 돌연변이에 의해 유도된다.
일부 구현예에서, 대상체는 표적 단백질이 증가된 수준으로 생성되는 대립유전자, 또는 세포에서 증가된 활성을 나타내는 돌연변이 표적 단백질을 인코딩하는 대립유전자를 갖는다.
일부 구현예에서, 제제는 표적 단백질을 인코딩하는 프리-mRNA로부터 NMD 엑손의 배제를 억제하고 세포에서 표적 단백질의 발현을 감소시킨다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고 안티센스 올리고머는 포스포로티오에이트 연결 또는 포스포로디아미데이트 연결을 포함하는 백본 변형을 포함한다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 포스포로디아미데이트 모폴리노, 잠금 핵산, 펩티드 핵산, 2'-O-메틸, 2'-플루오로, 또는 2'-O-메톡시에틸 모이어티를 포함한다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고 안티센스 올리고머는 적어도 하나의 변형된 당 모이어티를 포함한다.
일부 구현예에서, 각각의 당 모이어티는 변형된 당 모이어티이다.
일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 또는 12 내지 15개의 핵염기로 이루어진다.
일부 구현예에서, 제제가 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 프리-mRNA의 표적화 부분에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 상보적이다.
일부 구현예에서, 표적 단백질의 mRNA 수준 또는 발현 수준을 평가하는 것을 추가로 포함한다.
일부 구현예에서, 대상체는 인간이다.
한 구현예에서, 대상체는 비-인간 동물이다.
일부 구현예에서, 대상체는 태아, 배아 또는 아동이다.
일부 구현예에서, 세포는 생체 외의 것이다.
일부 구현예에서, 제제는 대상체의 척수강내 주사, 뇌실심내 주사, 복강내 주사, 근육내 주사, 피하 주사, 유리체내 또는 정맥내 주사에 의해 투여된다.
일부 구현예에서, 방법은 대상체에게 제2 치료제를 투여하는 것을 추가로 포함한다.
특정 구현예에서, 제2 치료제는 소분자이다.
일부 구현예에서, 제2 치료제는 안티센스 올리고머이다.
일부 구현예에서, 제2 치료제는 인트론 체류를 수정한다.
일부 구현예에서, 방법은 질환 또는 병태를 치료한다.
특정 구현예에서, 프로세싱된 mRNA 전사물로부터 NSE의 배제를 조절하고 프로세싱된 mRNA 전사체에 정규 엑손의 포함을 조절하기 위해 프리-mRNA 내의 표적 모티프와 상호작용하는 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제를 포함하는 조성물이 본원에 기재되어 있고, 여기서 표적 모티프는 (i) 2개의 정규 엑손 사이의 인트론 영역, (ii) 2개의 정규 엑손 중 하나, 또는 (iii) 인트론 및 정규 엑손 둘 다에 걸쳐 있는 영역에 위치하고; 여기서 NSE는 (a) 정규 엑손의 일부만, 또는 (b) 정규 엑손 및 정규 엑손에 인접한 인트론의 적어도 일부를 포함하고; 여기서 NSE 조절 제제는 프리-mRNA 전사체로부터 NSE의 배제를 조절하고 프로세싱된 mRNA 전사체에서 정규 엑손의 포함를 조절한다.
일부 구현예에서, NSE 조절 제제는 프리-mRNA 전사체로부터 NSE의 배제를 촉진하고 프로세싱된 mRNA 전사체에서 정규 엑손의 포함을 촉진한다.
일부 구현예에서, 프로세싱된 mRNA 전사체는 표적 단백질을 인코딩하고 NSE 조절 제제는 프리-mRNA를 함유하는 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
특정 구현예에서, 프리-mRNA의 대체 5' 또는 3' 스플라이스 부위에서 스플라이싱을 조절하고 프리-mRNA로부터 프로세싱되는 프로세싱된 mRNA 전사체에 정규 엑손의 포함을 조절하기 위해 프리-mRNA 내의 표적 모티프와 상호작용하는 넌센스 매개 RNA 붕괴 대체 5' 또는 3' 스플라이스 부위(NSASS) 조절 제제를 포함하는 조성물이 본원에 기재되고, 여기서 표적 모티프는 (i) 2개의 정규 엑손 사이의 인트론 영역, (ii) 2개의 정규 엑손 중 하나, 또는 (iii) 인트론 및 정규 엑손 둘 다에 걸쳐 있는 영역에 위치하고; 여기서 프리-mRNA의 대체 5' 또는 3' 스플라이스 부위에서 스플라이싱을 조절하는 것은 프리-mRNA 전사체로부터 엑손의 배제를 조절하고, 여기서 엑손은 (a) 정규 엑손의 일부만, 또는 (b) 정규 엑손 및 정규 엑손에 인접한 인트론의 적어도 일부를 포함하고; 여기서 NSASS 조절 제제는 프리-mRNA 전사체로부터 엑손의 배제를 조절하고 프로세싱된 mRNA 전사체에서 정규 엑손의 포함를 조절한다.
일부 구현예에서, NSASS 조절 제제는 프리-mRNA 전사체로부터 대체 5' 또는 3' 스플라이스 부위에서의 스플라이싱으로 인한 엑손의 배제를 촉진하고 프로세싱된 mRNA 전사체에서 정규 엑손의 포함을 촉진한다.
일부 구현예에서, 프로세싱된 mRNA 전사체는 표적 단백질을 인코딩하고 NSASS 조절 제제는 프리-mRNA를 함유하는 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 표적 단백질은 PKD2로 이루어진 군으로부터 선택된다.
특정 구현예에서, 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하는 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제를 포함하는 조성물이 본원에 기재되고, 여기서 프리-mRNA는 정규 엑손 다음 및 정규 엑손 내에 있는 인트론과 관련하여 정규 5' 스플라이스 부위 업스트림, 또는 정규 엑손 다음 및 인트론 내의 인트론과 관련하여 표준 5' 스플라이스 부위 다운스트림의 대체 5' 스플라이스 부위를 포함하는 대체 넌센스 매개 RNA 붕괴 유도(NMD) 엑손을 포함하고; 여기서 NSE 조절 제제는 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱을 조절함으로써 프리-mRNA로부터의 mRNA 전사체의 프로세싱을 조절하고, 여기서 대체 5' 스플라이스 부위에서의 프리-mRNA의 스플라이싱은 세포에서 표적 단백질의 발현을 조절한다.
일부 구현예에서, 표적 단백질은 PKD2이다.
일부 구현예에서, 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱은 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 대체 넌센스 매개 RNA 붕괴 유도(NMD) 엑손은 정규 엑손 다음 및 정규 엑손 내의 인트론과 관련하여 정규 5' 스플라이스 부위 업스트림의 정규 5' 스플라이스 부위를 포함한다.
일부 구현예에서, 대체 넌센스 매개 RNA 붕괴 유도(NMD) 엑손은 정규 엑손 다음 및 인트론 내의 인트론과 관련하여 정규 5' 스플라이스 부위 다운스트림의 정규 5' 스플라이스 부위를 포함한다.
특정 구현예에서, 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하는 넌센스 매개 RNA 붕괴 대체 5' 또는 3' 스플라이스 부위 (NSASS) 조절 제제를 포함하는 조성물이 본원에 기재되고, 여기서 프리-mRNA는 정규 엑손 다음 및 정규 엑손 내에 있는 인트론과 관련하여 정규 5' 스플라이스 부위 업스트림, 또는 정규 엑손 다음 및 인트론 내의 인트론과 관련하여 표준 5' 스플라이스 부위 다운스트림의 대체 5' 스플라이스 부위를 포함하는 엑손을 포함하고; 여기서 NSASS 조절 제제는 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱을 조절함으로써 프리-mRNA로부터의 mRNA 전사체의 프로세싱을 조절하고, 여기서 대체 5' 스플라이스 부위에서의 프리-mRNA의 스플라이싱은 세포에서 표적 단백질의 발현을 조절한다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
일부 구현예에서, 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱은 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 프리-mRNA는 정규 엑손 다음 및 정규 엑손 내의 인트론과 관련하여 정규 5' 스플라이스 부위 업스트림의 대체 5' 스플라이스 부위를 포함하는 엑손을 포함한다.
일부 구현예에서, 프리-mRNA는 정규 엑손 다음 및 인트론 내의 인트론과 관련하여 정규 5' 스플라이스 부위 다운스트림의 대체 5' 스플라이스 부위를 포함하는 엑손을 포함한다.
특정 구현예에서, 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하는 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제를 포함하는 조성물이 본원에 기재되고, 여기서 프리-mRNA는 정규 엑손 앞 및 정규 엑손 내에 있는 인트론과 관련하여 정규 3' 스플라이스 부위 업스트림, 또는 정규 엑손 앞 및 인트론 내의 인트론과 관련하여 정규 3' 스플라이스 부위 업스트림의 대체 3' 스플라이스 부위를 포함하는 대체 넌센스 매개 RNA 붕괴 유도(NMD) 엑손을 포함하고; 여기서 NSE 조절 제제는 대체 3' 스플라이스 부위에서 프리-mRNA의 스플라이싱을 조절함으로써 프리-mRNA로부터의 mRNA 전사체의 프로세싱을 조절하고, 여기서 대체 3' 스플라이스 부위에서의 프리-mRNA의 스플라이싱은 세포에서 표적 단백질의 발현을 조절한다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
일부 구현예에서, 대체 3' 스플라이스 부위에서 프리-mRNA의 스플라이싱은 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 대체 넌센스 매개 RNA 붕괴 유도(NMD) 엑손은 정규 엑손 앞 및 정규 엑손 내의 인트론과 관련하여 정규 3' 스플라이스 부위 다운스트림의 정규 3' 스플라이스 부위를 포함한다.
일부 구현예에서, 대체 넌센스 매개 RNA 붕괴 유도(NMD) 엑손은 정규 엑손 앞 및 인트론 내의 인트론과 관련하여 정규 3' 스플라이스 부위 업스트림의 정규 3' 스플라이스 부위를 포함한다.
특정 구현예에서, 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하는 넌센스 매개 RNA 붕괴 대체 5' 또는 3' 스플라이스 부위 (NSASS) 조절 제제를 포함하는 조성물이 본원에 기재되고, 여기서 프리-mRNA는 정규 엑손 앞 및 정규 엑손 내에 있는 인트론과 관련하여 정규 3' 스플라이스 부위 다운스트림, 또는 정규 엑손 앞 및 인트론 내의 인트론과 관련하여 정규 3' 스플라이스 부위 업스트림의 대체 3' 스플라이스 부위를 포함하는 엑손을 포함하고; 여기서 NSASS 조절 제제는 대체 3' 스플라이스 부위에서 프리-mRNA의 스플라이싱을 조절함으로써 프리-mRNA로부터의 mRNA 전사체의 프로세싱을 조절하고, 여기서 대체 3' 스플라이스 부위에서의 프리-mRNA의 스플라이싱은 세포에서 표적 단백질의 발현을 조절한다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
일부 구현예에서, 대체 3' 스플라이스 부위에서 프리-mRNA의 스플라이싱은 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 프리-mRNA는 정규 엑손 앞 및 정규 엑손 내의 인트론과 관련하여 정규 3' 스플라이스 부위 다운스트림의 대체 3' 스플라이스 부위를 포함하는 엑손을 포함한다.
일부 구현예에서, 프리-mRNA는 정규 엑손 앞 및 인트론 내의 인트론과 관련하여 정규 3' 스플라이스 부위 업스트림의 대체 3' 스플라이스 부위를 포함하는 엑손을 포함한다.
다양한 구현예에서, 제제는 소분자이다.
일부 구현예에서, 제제는 폴리펩티드이다.
일부 구현예에서, 폴리펩티드는 핵산 결합 단백질이다.
일부 구현예에서, 핵산 결합 단백질은 TAL-이펙터 또는 징크 핑거 결합 도메인을 함유한다.
일부 구현예에서, 핵산 결합 단백질은 Cas 계열 단백질이다.
일부 구현예에서, 폴리펩티드는 하나 이상의 핵산 분자와 동반되거나 복합화된다.
일부 구현예에서, 제제는 프리-mRNA의 표적화 영역에 상보적인 안티센스 올리고머(ASO)이다.
일부 구현예에서, 제제는 표적 단백질을 인코딩하는 프리-mRNA의 표적화 영역에 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 상보적이다.
일부 구현예에서, 제제는 포스포로티오에이트 연결 또는 포스포로디아미데이트 연결을 포함하는 백본 변형을 포함한다.
일부 구현예에서, 제제는 포스포로디아미데이트 모폴리노를 포함한다.
일부 구현예에서, 제제는 잠금 핵산을 포함한다.
일부 구현예에서, 제제는 펩티드 핵산을 포함한다.
일부 구현예에서, 제제는 2'-O-메틸을 포함한다.
일부 구현예에서, 제제는 2'-플루오로 또는 2'-O-메톡시에틸 모이어티를 포함한다.
일부 구현예에서, 제제는 적어도 하나의 변형된 당 모이어티를 포함한다.
일부 구현예에서, 각각의 당 모이어티는 변형된 당 모이어티이다.
일부 구현예에서, 제제는 안티센스 올리고머이고, 여기서 제제는 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 또는 12 내지 15개의 핵염기로 이루어진다.
특정 구현예에서, 본원에 제공된 바와 같은 조성물에 따른 제제를 인코딩하는 핵산 분자를 포함하는 조성물이 본원에 기재된다.
일부 구현예에서, 핵산 분자는 바이러스 전달 시스템에 통합된다.
일부 구현예에서, 바이러스 전달 시스템은 아데노바이러스 연관 벡터이다.
특정 구현예에서, 본원에 기재술된 단백질 발현 조절 방법은 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제를 프리-mRNA 내의 표적 모티프에 접촉시키는 단계를 포함하고, 여기서 NSE는 (i) 정규 엑손의 일부만, 또는 (ii) 정규 엑손 및 정규 엑손에 인접한 인트론의 적어도 일부를 포함하고; 여기서 프리-mRNA는 프로세싱되어 프로세싱된 mRNA 전사체를 형성하고, 여기서 NSE 조절 제제는 프리-mRNA 전사체로부터 NSE의 배제를 조절하고 프로세싱된 mRNA 전사체에서 정규 엑손의 포함을 조절하고; 그리고 프로세싱된 mRNA 전사체는 번역되고, 여기서 NSE의 배제 및 정규 엑손의 포함은 정규 엑손 대신에 NSE를 포함하는 동등한 mRNA 전사체의 표적 단백질 발현에 비해 표적 단백질 발현을 조절한다.
일부 구현예에서, 표적 모티프는 2개의 정규 엑손 사이의 인트론 영역에 위치한다.
일부 구현예에서, 표적 모티프는 2개의 정규 엑손 중 하나에 위치한다.
일부 구현예에서, 표적 모티프는 인트론 및 정규 엑손 모두에 걸친 영역에 위치한다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
특정 구현예에서, 표적 단백질을 인코딩하는 프리-mRNA를 갖는 세포에 의한 표적 단백질의 발현을 조절하는 방법이 본원에 기재되고, 여기서 프리-mRNA는 정규 엑손 앞 및 정규 엑손 내에 있는 인트론과 관련하여 정규 3' 스플라이스 부위 업스트림, 또는 정규 엑손 앞 및 인트론 내의 인트론과 관련하여 3' 스플라이스 부위 업스트림의 대체 3' 스플라이스 부위를 포함하는 대체 넌센스 매개 RNA 붕괴 유도(NMD) 엑손을 포함하고; 이 방법은 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제를 세포에 접촉시키는 것을 포함하며, 여기서 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제는 대체 3' 스플라이스 부위에서 프리-mRNA의 스플라이싱을 조절함으로써 프리-mRNA로부터의 mRNA 전사물의 프로세싱을 조절하고, 여기서 대체 3' 스플라이스 부위에서의 프리-mRNA의 스플라이싱은 표적 단백질의 발현을 조절한다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
특정 구현예에서, 표적 단백질을 인코딩하는 프리-mRNA를 갖는 세포에 의한 표적 단백질의 발현을 조절하는 방법이 본원에 기재되고, 여기서 프리-mRNA는 정규 엑손 다음 및 정규 엑손 내에 있는 인트론과 관련하여 정규 5' 스플라이스 부위 업스트림, 또는 정규 엑손 다음 및 인트론 내의 인트론과 관련하여 정규 5' 스플라이스 부위 다운스트림의 대체 5' 스플라이스 부위를 포함하는 대체 넌센스 매개 RNA 붕괴 유도(NMD) 엑손을 포함하고; 이 방법은 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제를 세포에 접촉시키는 것을 포함하며, 여기서 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제는 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱을 조절함으로써 프리-mRNA로부터의 mRNA 전사물의 프로세싱을 조절하고, 여기서 대체 5' 스플라이스 부위에서의 프리-mRNA의 스플라이싱은 표적 단백질의 발현을 조절한다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
일부 구현예에서, 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제는 프리-mRNA의 표적화 부분에 결합한다.
일부 구현예에서, 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제는 NSE 또는 NMD 엑손의 스플라이싱에 관여하는 인자에 결합한다.
일부 구현예에서, 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제는 NMD 엑손의 스플라이싱에 관여하는 인자의 활성을 억제한다.
일부 구현예에서, 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제는 프리-mRNA의 표적화 부분의 영역에 대한 NMD 엑손의 스플라이싱에 관여하는 인자의 결합을 방해한다.
일부 구현예에서, 프리-mRNA의 스플라이싱의 조절은 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 세포 내 표적 단백질의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 프리-mRNA의 스플라이싱의 조정은 표적 단백질을 인코딩하는 프로세싱된 mRNA의 생산을 증가시킨다.
일부 구현예에서, 치료제와 접촉된 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 표적 단백질은 단백질의 정규 동형이다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
일부 구현예에서, 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제는 본원에 제공된 바와 같은 조성물이다.
특정 구현예에서, 본원에 제공된 바와 같은 조성물을 포함하는 치료제; 및 약제학적으로 허용되는 부형제 및/또는 전달 비히클을 포함하는 약제학적 조성물이 본원에 제공된다.
특정 구현예에서, 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되어 있고, 방법은 본원에 제공된 약제학적 조성물을 감소가 필요한 대상체에게 투여하는 단계를 포함한다.
특정 구현예에서, 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되고, 상기 방법은 (a) 프로세싱된 mRNA 전사제로부터 NSE의 배제를 조절하고 프로세싱된 mRNA 전사제에서 정규 엑손의 포함을 조절하기 위해 프리-mRNA 내의 표적 모티프와 상호작용하는 넌센스 매개 RNA 붕괴 엑손(NSE) 조절 제제로서,
NSE는 (i) 정규 엑손의 일부만, 또는 (ii) 정규 엑손 및 정규 엑손에 인접한 인트론의 적어도 일부를 포함하는 넌센스 매개 RNA 붕괴 엑손 (NSE) 조절 제제; 및 (b) 약제학적으로 허용되는 부형제 및/또는 전달 비히클을 포함하는 약제학적 조성물을 대상체에게 투여하는 것을 포함하고, 여기서 질환 또는 병태는 프로세싱된 mRNA로부터 번역된 표적 단백질의 발현의 조절에 의해 NSE 조절 제제의 투여에 의해 대상체에서 치료되거나 예방된다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
특정 구현예에서, 대상체의 세포에서 표적 단백질의 발현을 조절함으로써 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되고, 대상체의 세포는 표적 단백질을 인코딩하는 프리-mRNA를 갖고, 여기서 프리-mRNA는 (a) 정규 엑손의 5' 말단에 측접하는 정규 인트론 앞에 있는 정규 엑손; 및 (b) 정규 엑손 앞 및 정규 엑손 내의 인트론과 관련하여 정규 3' 스플라이스 부위 다운스트림, 또는 정규 엑손 앞 및 정규 엑손 내의 인트론 과 관련하여 정규 3' 스플라이스 부위 업스트림의 대체 3' 스플라이스 부위를 포함하는 대체 넌센스 매개된 RNA 붕괴 유도(NMD) 엑손을 포함하고, 이 방법은 치료제를 세포에 접촉시키는 것을 포함하고, 여기서 치료제는 대체 3' 스플라이스 부위에서 프리-mRNA의 스플라이싱을 조절함으로써 프리-mRNA로부터의 mRNA 전사체의 프로세싱을 조절하고, 대체 3' 스플라이스 부위에서의 프리-mRNA의 스플라이싱은 대상체의 세포에서 표적 단백질의 발현을 조절한다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
특정 구현예에서, 대상체의 세포에서 표적 단백질의 발현을 조절함으로써 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되고, 대상체의 세포는 표적 단백질을 인코딩하는 프리-mRNA를 갖고, 여기서 프리-mRNA는 (a) 정규 엑손의 3' 말단에 측접하는 정규 인트론이 뒤따르는 정규 엑손; 및 (b) 정규 엑손 다음 및 정규 엑손 내의 인트론과 관련하여 정규 5' 스플라이스 부위 업스트림, 또는 정규 엑손 다음 및 정규 엑손 내의 인트론 과 관련하여 정규 5' 스플라이스 부위 다운스트림의 대체 3' 스플라이스 부위를 포함하는 대체 넌센스 매개된 RNA 붕괴 유도(NMD) 엑손을 포함하고, 이 방법은 치료제를 세포에 접촉시키는 것을 포함하고, 여기서 치료제는 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱을 조절함으로써 프리-mRNA로부터의 mRNA 전사체의 프로세싱을 조절하고, 대체 5' 스플라이스 부위에서의 프리-mRNA의 스플라이싱은 대상체의 세포에서 표적 단백질의 발현을 조절한다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다.
일부 구현예에서, 질환은 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 또는 두개내 동맥류로 이루어진 군으로부터 선택된다.
일부 구현예에서, 질환 또는 병태는 표적 단백질의 결핍된 양 또는 활성에 의해 야기된다.
일부 구현예에서, 치료제는 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준을 증가시킨다.
일부 구현예에서, 치료제는 세포에서 표적 단백질의 발현을 증가시킨다.
일부 구현예에서, 치료제와 접촉된 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 세포 내 표적 단백질의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 표적 단백질의 mRNA 수준 또는 발현 수준을 평가하는 것을 추가로 포함한다.
일부 구현예에서, 방법은 질환과 연관된 적어도 하나의 유전적 돌연변이에 대해 대상체의 게놈을 평가하는 것을 추가로 포함한다.
일부 구현예에서, 적어도 하나의 유전적 돌연변이는 질환과 연관된 유전자의 유전자좌 내에 있다.
일부 구현예에서, 적어도 하나의 유전적 돌연변이는 질환과 연관된 유전자의 발현과 연관된 유전자좌 내에 있다.
일부 구현예에서, 적어도 하나의 유전적 돌연변이는 PKD2 유전자 좌 내에 있다.
일부 구현예에서, 적어도 하나의 유전적 돌연변이는 PKD2 유전자 발현과 연관된 유전자좌 내에 있다.
일부 구현예에서, 대상체는 인간이다.
한 구현예에서, 대상체는 비-인간 동물이다.
일부 구현예에서, 대상체는 태아, 배아 또는 아동이다.
일부 구현예에서, 세포 또는 세포들은 생체외, 또는 생체외 조직 또는 기관에 있다.
일부 구현예에서, 치료제는 뇌심실내 주사, 복강내 주사, 근육내 주사, 척추강내 주사, 피하 주사, 경구 투여, 활막 주사, 유리체내 투여, 망막하 주사, 국소 적용, 이식, 또는 정맥내 주사에 의해 대상체에게 투여된다.
일부 구현예에서, 방법은 질환 또는 병태를 치료한다.
특정 구현예에서, 본원에 제공된 바와 같은 방법에 사용하기 위한 치료제가 본원에 기재된다.
특정 구현예에서, 본원에 제공된 바와 같은 치료제 및 약제학적으로 허용되는 부형제를 포함하는 약제학적 조성물이 본원에 기재된다.
특정 구현예에서, 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 제공되고, 방법은 뇌심실내 주사, 복강내 주사, 근육내 주사, 척추강내 주사, 피하 주사, 경구 투여, 활막 주사, 유리체내 투여, 망막하 주사, 국소 적용, 이식, 또는 정맥내 주사에 의해 대상체에게 본원에 기재된 약제학적 조성물을 투여하는 것을 포함한다.
일부 구현예에서, 방법은 대상체를 치료한다.
특정 구현예에서, 프로세싱된 mRNA 전사물로부터 NSE의 배제를 조절하고 프로세싱된 mRNA 전사체에 정규 엑손의 포함을 조절하기 위해 표적 유전자로부터 전사된 프리-mRNA 내의 표적 모티프와 상호작용하는 넌센스 매개 RNA 붕괴 엑손 (NSE) 조절 제제 또는 이 제제를 인코딩하는 바이러스 벡터를 포함하는 조성물이 본원에 기재되고, 표적 모티프는 (i) 2개의 정규 엑손 사이의 인트론 영역, (ii) 2개의 정규 엑손 중 하나, 또는 (iii) 인트론 및 정규 엑손 둘 다에 걸쳐 있는 영역에 위치하고; 여기서 NSAE는 (a) 정규 엑손의 일부만, 또는 (b) 정규 엑손 및 정규 엑손에 인접한 인트론의 적어도 일부를 포함하고; 여기서 NSAE 조절 제제는 프로세싱된 mRNA 전사체로부터 NSAE의 배제를 조절하고 프로세싱된 mRNA 전사체에서 정규 엑손의 포함를 조절하고; 표적 유전자는 PKD2 유전자이다.
일부 구현예에서, NSAE 조절 제제는 프로세싱된 mRNA 전사체로부터 NSAE의 배제를 촉진하고 프로세싱된 mRNA 전사체에서 정규 엑손의 포함을 촉진한다.
일부 구현예에서, 프로세싱된 mRNA 전사체는 표적 단백질을 인코딩하고 NSAE 조절 제제는 프리-mRNA를 함유하는 세포에서 표적 단백질의 발현을 증가시키고, 표적 단백질은 PKD2이다.
예시적인 구현예 II
특정 구현예에서, 표적 유전자로부터 전사되고 넌센스 매개 RNA 붕괴 유도 엑손(NMD 엑손)을 포함하는 프리-mRNA를 갖는 세포에서 표적 단백질의 발현을 조절하는 방법이 본원에 기재되어 있고, 방법은 제제 또는 이 제제를 인코딩하는 벡터를 세포에 접촉시켜, 제제는 프리-mRNA로부터 NMD 엑손의 스플라이싱을 조절함으로써, 프리-mRNA로부터 처리되는 프로세싱된 mRNA의 수준을 조절하는 단계, 및 세포에서 표적 단백질의 발현을 조절하는 단계로서, 표적 단백질은 PKD2 유전자에 의해 인코딩되는 단계를 포함한다.
특정 구현예에서, 대상체의 세포에서 표적 단백질의 발현을 조절함으로써 이를 필요로 하는 대상체에서 질환 또는 병태는 발병할 가능성을 치료하거나 감소시키는 방법이 기재되며, 이는 제제 또는 벡터를 접촉시키는 단계를 포함한다. 대상체의 세포에 제제를 인코딩하고, 이에 의해 제제는 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터 비-센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 프로세싱된 프로세싱된 mRNA의 수준을 조절하고 대상체의 세포에서 표적 단백질의 발현을 조절하며, 표적 단백질은 PKD2 유전자에 의해 인코딩된다.
일부 구현예에서, 표적 단백질은 폴리시스틴 2이다. 일부 구현예에서, 질환 또는 병태는 폴리시스틴 2의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다. 일부 구현예에서, 질환 또는 병태는 폴리시스틴 1의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다. 일부 구현예에서, 질환 또는 병태는 폴리시스틴 2가 기능적으로 증강, 보상, 대체 또는 기능적으로 상호작용하는 단백질의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다.
일부 구현예에서, 제제는 (a) 프리-mRNA의 표적화 부분에 결합하고; (b) NMD 엑손의 스플라이싱에 관여하는 인자의 결합을 조절하거나; 또는 (c) (a)와 (b)의 조합이다. 일부 구현예에서, 제제는 NMD 엑손의 스플라이싱에 관여하는 인자의 결합을 방해한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손에 근접한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 5' 말단의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 5' 5' 말단의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 3' 말단 다운스트림의 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 3' 말단 다운스트림의 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031085의 게놈 부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031085의 게놈 부위의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031140의 게놈 부위 다운스트림의 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031140의 게놈 부위 다운스트림의 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 프리-mRNA의 2개의 정규 엑손 영역 사이의 인트론 영역에 위치하고, 인트론 영역은 NMD 엑손을 함유한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손과 적어도 부분적으로 중첩된다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 업스트림 또는 다운스트림 인트론과 적어도 부분적으로 중첩된다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 5' NMD 엑손-인트론 접합부 또는 3' NMD 엑손-인트론 접합부를 포함한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손 내에 있다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 NMD 엑손의 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 또는 그 초과 개의 연속 뉴클레오티드를 포함한다.
일부 구현예에서, NMD 엑손은 표 2에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80%, 적어도 90% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, NMD 엑손은 표 2에 열거된 서열로 이루어진 군으로부터 선택된 서열을 포함한다. 일부 구현예에서, 프리-mRNA는 표 2 또는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 프리-mRNA는 표 2 또는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 유전자 서열에 의해 인코딩된다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 표 2 또는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고, ASO는 표 4에 열거된 서열로 이루어진 군으로부터 선택된 서열의 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 또는 18개의 연속 핵산에 대해 적어도 약 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성인 서열을 포함한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085-88031140 내에 있다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085-88031140의 업스트림 또는 다운스트림이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085 88031140의 엑손-인트론 접합부를 포함한다.
일부 구현예에서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 전장 폴리시스틴 2 또는 야생형 폴리시스틴 2이다. 일부 구현예에서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 야생형 폴리시스틴 2에 비해 적어도 부분적으로 기능적이다. 일부 구현예에서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 전장 야생형 폴리시스틴 2에 비해 적어도 부분적으로 기능적이다.
일부 구현예에서, 제제는 프리-mRNA로부터 NMD 엑손의 스플라이싱을 조절하고 프리-mRNA로부터 NMD 엑손의 배제를 촉진함으로써, 프리-mRNA로부터 프로세싱되고 NMD 엑손이 결여된 프로세싱된 mRNA의 수준을 조절한다. 일부 구현예에서, 제제와 접촉된 세포에서 프리-mRNA로부터의 NMD 엑손의 배제는 대조군 세포에서 프리-mRNA로부터의 NMD 엑손의 배제에 비해 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다. 일부 구현예에서, 방법은 세포에서 프로세싱된 mRNA의 수준을 증가시킨다. 일부 구현예에서, 제제와 접촉된 세포에서 프로세싱된 mRNA의 수준은 대조군 세포에서 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다. 일부 구현예에서, 제제는 세포에서 표적 단백질의 발현을 증가시킨다. 일부 구현예에서, 표적 단백질의 수준은 대조군 세포에서 생산된 표적 단백질의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가된다.
일부 구현예에서, NMD 엑손은 조기 종결 코돈(PTC)을 포함한다. 일부 구현예에서, 질환 또는 병태는 표적 유전자 또는 표적 단백질의 기능 상실 돌연변이와 연관된다. 일부 구현예에서, 질환 또는 병태는 표적 유전자의 반가불충분성과 연관되고, 대상체는 기능성 폴리시스틴 2를 인코딩하는 제1 대립유전자 및 폴리시스틴 2가 생산되지 않거나 감소된 수준으로 생산되는 제2 대립유전자, 또는 비기능성 폴리시스틴 2 또는 부분적 기능성 폴리시스틴 2를 인코딩하는 제2 대립유전자를 가지고 있다. 일부 구현예에서, 하나 또는 둘 모두의 대립유전자는 하이포모르프이거나 부분적으로 기능적이다. 일부 구현예에서, 질환 또는 병태는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 및 두개내 동맥류로 이루어진 군으로부터 선택된다. 일부 구현예에서, 질환 또는 병태는 PKD1 또는 PKD2 유전자의 돌연변이와 연관되며, 여기서 대상체는 제 (i) 표적 단백질은 생산되지 않거나 야생형 대립유전자에 비해 감소된 수준으로 생산되거나; 또는 (ii) 생산된 표적 단백질은 야생형 대립유전자에 비해 비기능적이거나 부분적으로 기능적인 제1 대립유전자 인코딩, 및 (iii) 표적 단백질은 야생형 대립유전자에 비해 감소된 수준으로 생산되고 생산된 표적 단백질은 야생형 대립유전자에 비해 적어도 부분적으로 기능적임; 또는 (iv) 생산된 표적 단백질은 야생형 대립유전자에 비해 부분적으로 기능적인 제2 대립유전자를 갖는다.
일부 구현예에서, 질환 또는 병태는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 및 두개내 동맥류로 이루어진 군으로부터 선택된다. 일부 구현예에서, 돌연변이는 하이포모르픽 돌연변이이다. 일부 구현예에서, 질환 또는 병태는 PKD2 유전자의 돌연변이와 연관된다. 일부 구현예에서, 질환 또는 병태는 PKD1 유전자의 돌연변이와 연관된다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 2와 상호작용하는 폴리시스틴 1 영역의 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 방해하는 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 약화시키는 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 감소시키는 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 차단하는 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 2와 상호작용하는 폴리시스틴 1 영역의 돌연변이이다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 방해하는 돌연변이이다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 약화시키는 돌연변이이다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 감소시키는 돌연변이이다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 차단하는 돌연변이이다.
일부 구현예에서, 제제는 프리-mRNA로부터 NMD 엑손의 배제를 촉진함으로써, 프리-mRNA로부터 프로세싱되고 NMD 엑손이 결여된 프로세싱된 mRNA의 수준을 조절하고 세포의 표적 단백질의 발현을 증가시킨다. 일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고 안티센스 올리고머는 포스포로티오에이트 연결 또는 포스포로디아미데이트 연결을 포함하는 백본 변형을 포함한다. 일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 포스포로디아미데이트 모폴리노, 잠금 핵산, 펩티드 핵산, 2'-O-메틸, 2'-플루오로, 또는 2'-O-메톡시에틸 모이어티를 포함한다. 일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고 안티센스 올리고머는 적어도 하나의 변형된 당 모이어티를 포함한다. 일부 구현예에서, 각각의 당 모이어티는 변형된 당 모이어티이다. 일부 구현예에서, 제제는 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 또는 12 내지 15개의 핵염기로 이루어진다. 일부 구현예에서, 제제가 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 프리-mRNA의 표적화 부분에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 상보적이다.
일부 구현예에서, 표적 단백질의 프로세싱된 mRNA 수준 또는 발현 수준을 평가하는 것을 추가로 포함한다. 일부 구현예에서, 대상체는 인간이다. 한 구현예에서, 대상체는 비-인간 동물이다. 일부 구현예에서, 대상체는 태아, 배아 또는 아동이다. 일부 구현예에서, 세포는 생체 외의 것이다. 일부 구현예에서, 제제는 대상체의 척수강내 주사, 뇌실심내 주사, 복강내 주사, 근육내 주사, 피하 주사, 유리체내 또는 정맥내 주사에 의해 투여된다. 일부 구현예에서, 방법은 대상체에게 제2 치료제를 투여하는 것을 추가로 포함한다. 특정 구현예에서, 제2 치료제는 소분자이다. 일부 구현예에서, 제2 치료제는 안티센스 올리고머이다. 일부 구현예에서, 제2 치료제는 인트론 체류를 수정한다. 일부 구현예에서, 방법은 질환 또는 병태를 치료한다.
특정 구현예에서, 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터 넌센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 프로세싱되는 프로세싱된 mRNA의 수준을 조절하고, 프리-mRNA를 갖는 세포에서 표적 단백질의 발현을 조절하는, 제제 또는 상기 제제를 인코딩하는 벡터를 포함하는 조성물로서, 표적 단백질은 PKD2 유전자에 의해 인코딩되는 조성물이 본원에 기재된다. 특정 구현예에서, 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터 넌센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 프로세싱되는 프로세싱된 mRNA의 수준을 조절하고 대상체의 세포에서 표적 단백질의 발현을 조절함으로써 필요한 대상체에서 질환 또는 병태를 치료하는, 제제 또는 상기 제제를 인코딩하는 벡터를 포함하는 조성물로서, 표적 단백질은 PKD2 유전자에 의해 인코딩되는 조성물이 본원에 기재된다. 특정 구현예에서, 본원에 기재된 바와 같은 조성물; 및 약제학적으로 허용되는 부형제 및/또는 전달 비히클을 포함하는 약제학적 조성물이 본원에 기재된다. 특정 구현예에서, 넌센스 매개된 RNA 붕괴 대체 스플라이스 부위(NSASS) 조절제 또는 이 제제를 인코딩하는 바이러스 벡터를 포함하는 조성물이 본원에 기재되고, 제제는 표적 유전자로부터 전사되고 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하고, 프리-mRNA는 정규 5' 스플라이스 부위의 다운스트림에 대체 5' 스플라이스 부위를 포함하고, 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱에 의해 생산되는 프로세싱된 mRNA는 넌센스 매개 RNA 붕괴를 거치고, 제제는 대체 5' 스플라이스 부위에서 스플라이싱을 조절하여 프리-mRNA의 프로세싱을 조절하고; 그리고 표적 유전자는 PKD2이다.
일부 구현예에서, 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 방지하거나 감소시킴으로써 프리-mRNA의 프로세싱을 조절한다. 일부 구현예에서, 제제는 정규 5' 스플라이스-부위에서 스플라이싱을 촉진하거나 증가시킴으로써 프리-mRNA의 프로세싱을 조절한다. 일부 구현예에서, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱을 조절하는 것은 세포에서 표적 단백질의 발현을 증가시킨다. 일부 구현예에서, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산된 프로세싱된 mRNA는 조기 종결 코돈(PTC)을 포함한다.
다양한 구현예에서, 제제는 소분자이다. 일부 구현예에서, 제제는 폴리펩티드이다. 일부 구현예에서, 폴리펩티드는 핵산 결합 단백질이다. 일부 구현예에서, 핵산 결합 단백질은 TAL-이펙터 또는 징크 핑거 결합 도메인을 함유한다. 일부 구현예에서, 핵산 결합 단백질은 Cas 계열 단백질이다. 일부 구현예에서, 폴리펩티드는 하나 이상의 핵산 분자와 동반되거나 복합화된다. 일부 구현예에서, 제제는 프리-mRNA의 표적화 영역에 상보적인 안티센스 올리고머(ASO)이다. 일부 구현예에서, 제제는 표적 단백질을 인코딩하는 프리-mRNA의 표적화 영역에 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 상보적이다. 일부 구현예에서, 제제는 포스포로티오에이트 연결 또는 포스포로디아미데이트 연결을 포함하는 백본 변형을 포함한다. 일부 구현예에서, 제제는 포스포로디아미데이트 모폴리노를 포함한다. 일부 구현예에서, 제제는 잠금 핵산을 포함한다. 일부 구현예에서, 제제는 펩티드 핵산을 포함한다. 일부 구현예에서, 제제는 2'-O-메틸을 포함한다. 일부 구현예에서, 제제는 2'-플루오로 또는 2'-O-메톡시에틸 모이어티를 포함한다. 일부 구현예에서, 제제는 적어도 하나의 변형된 당 모이어티를 포함한다. 일부 구현예에서, 각각의 당 모이어티는 변형된 당 모이어티이다. 일부 구현예에서, 제제는 안티센스 올리고머이고, 여기서 제제는 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 또는 12 내지 15개의 핵염기로 이루어진다.
특정 구현예에서, 본원에 기재된 바와 같은 조성물에 따른 제제를 인코딩하는 핵산 분자를 포함하는 조성물이 본원에 기재된다. 일부 구현예에서, 핵산 분자는 바이러스 전달 시스템에 통합된다. 일부 구현예에서, 바이러스 전달 시스템은 아데노바이러스 연관 벡터이다. 일부 구현예에서, 바이러스 벡터는 아데노바이러스 연관 바이러스 벡터이다.
특정 구현예에서, 표적 유전자로부터 전사되고 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하는 방법이 본원에 기재되고, 상기 방법은 넌센스 매개 RNA 붕괴 대체 스플라이스 부위(NSASS) 조절제 또는 이 제제를 인코딩하는 바이러스 벡터를 세포에 접촉시키는 것을 포함하고, 프리-mRNA는 정규 5' 스플라이스 부위의 다운스트림에 대체 5' 스플라이스 부위를 포함하고, 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱에 의해 생산되는 프로세싱된 mRNA는 넌센스 매개 RNA 붕괴를 거치고, 제제는 대체 5' 스플라이스 부위에서 스플라이싱을 조절하여 표적 단백질의 발현을 조절함으로써 프리-mRNA의 프로세싱을 조절하고; 표적 유전자는 PKD2이다.
일부 구현예에서, 제제는 (a) 프리-mRNA의 표적화 부분에 결합하고; (b) 대체 5' 스플라이스-부위에서 스플라이싱에 관여하는 인자의 결합을 조절하거나; 또는 (c) (a)와 (b)의 조합이다. 일부 구현예에서, 제제는 대체 5' 스플라이스-부위에서 스플라이싱에 관여하는 인자가 표적화 부분의 영역에 결합하는 것을 방해한다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에 근접한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위 다운스트림의 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위 다운스트림의 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4 88036480의 게놈 부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88036480의 게놈 부위의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88036480의 게놈 부위 다운스트림의 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드이다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88036480의 게놈 부위 다운스트림의 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드이다.
일부 구현예에서, 프리-mRNA의 표적화 부분은 정규 5' 스플라이스-부위와 대체 5' 스플라이스-부위 사이의 영역에 위치한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에서 스플라이싱에 의해 연장된 엑손 영역에 위치한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위와 적어도 부분적으로 중첩된다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 업스트림 또는 다운스트림 영역과 적어도 부분적으로 중첩된다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에서 스플라이싱에 의해 연장된 엑손 영역 내에 있다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에서 스플라이싱에 의해 연장된 엑손 영역의 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 또는 그 초과 개의 연속 뉴클레오티드를 포함한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 2개의 정규 엑손 사이의 인트론 영역에 위치한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 2개의 정규 엑손 중 하나에 위치한다. 일부 구현예에서, 프리-mRNA의 표적화 부분은 인트론 및 정규 엑손 모두에 걸쳐 있는 영역에 위치한다.
일부 구현예에서, 세포 내 표적 단백질의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다. 일부 구현예에서, 프리-mRNA의 스플라이싱의 조정은 표적 단백질을 인코딩하는 프로세싱된 mRNA의 생산을 증가시킨다. 일부 구현예에서, 제제와 접촉된 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 표적 단백질은 단백질의 정규 동형이다. 일부 구현예에서, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산된 프로세싱된 mRNA는 조기 종결 코돈(PTC)을 포함한다. 일부 구현예에서, NSASS 조절제는 본원에 기재된 바와 같은 조성물이다.
특정 구현예에서, 본원에 기재된 바와 같은 조성물; 및 약제학적으로 허용되는 부형제 및/또는 전달 비히클을 포함하는 약제학적 조성물이 본원에 기재된다.
특정 구현예에서, 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되어 있고, 방법은 감소가 필요한 대상체에게 약제학적 조성물을 투여하는 것을 포함하고, 약제학적 조성물은 넌센스 매개된 RNA 붕괴 대체 스플라이스 부위(NSASS) 조절제 또는 이 제제를 인코딩하는 바이러스 벡터로서, 제제는 표적 유전자로부터 전사되고 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하고, 프리-mRNA는 정규 5' 스플라이스 부위의 다운스트림에 대체 5' 스플라이스 부위를 포함하고, 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱은 대안적으로 스플라이싱된 mRNA의 넌센스 매개된 RNA 붕괴를 초래하고, 제제는 대체 5' 스플라이스 부위에서 스플라이싱을 조절하여 프리-mRNA의 프로세싱을 조절하고; 그리고 표적 유전자는 PKD2인, 바이러스 벡터 및 약제학적으로 허용되는 부형제를 포함한다. 특정 구현예에서, 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되어 있고, 방법은 본원에 기재된 약제학적 조성물을 대상체에게 투여하는 단계를 포함한다.
일부 구현예에서, 질환은 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 또는 두개내 동맥류로 이루어진 군으로부터 선택된다. 일부 구현예에서, 질환 또는 병태는 폴리시스틴 2의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다. 일부 구현예에서, 질환 또는 병태는 폴리시스틴 1의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다. 일부 구현예에서, 질환 또는 병태는 폴리시스틴 2가 기능적으로 증강, 보상, 대체 또는 기능적으로 상호작용하는 단백질의 양 또는 활성의 결핍과 연관된 질환 또는 병태이다. 일부 구현예에서, 질환 또는 병태는 표적 단백질의 결핍된 양 또는 활성에 의해 야기된다.
일부 구현예에서, 제제는 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준을 증가시킨다. 일부 구현예에서, 제제와 접촉된 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다. 일부 구현예에서, 제제는 세포에서 표적 단백질의 발현을 증가시킨다. 일부 구현예에서, 세포 내 표적 단백질의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가된다.
일부 구현예에서, 표적 단백질의 mRNA 수준 또는 발현 수준을 평가하는 것을 추가로 포함한다. 일부 구현예에서, 방법은 질환과 연관된 적어도 하나의 유전적 돌연변이에 대해 대상체의 게놈을 평가하는 것을 추가로 포함한다. 일부 구현예에서, 적어도 하나의 유전적 돌연변이는 질환과 연관된 유전자의 유전자좌 내에 있다. 일부 구현예에서, 적어도 하나의 유전적 돌연변이는 질환과 연관된 유전자의 발현과 연관된 유전자좌 내에 있다. 일부 구현예에서, 적어도 하나의 유전적 돌연변이는 PKD2 유전자 좌 내에 있다. 일부 구현예에서, 적어도 하나의 유전적 돌연변이는 PKD1 유전자 좌 내에 있다. 일부 구현예에서, 적어도 하나의 유전적 돌연변이는 PKD2 유전자 발현과 연관된 유전자좌 내에 있다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 2와 상호작용하는 폴리시스틴 1 영역의 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 방해하는 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 약화시키는 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 감소시키는 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 차단하는 돌연변이를 포함한다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 2와 상호작용하는 폴리시스틴 1 영역의 돌연변이이다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 방해하는 돌연변이이다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 약화시키는 돌연변이이다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 감소시키는 돌연변이이다. 일부 구현예에서, PKD1의 돌연변이는 폴리시스틴 1과 폴리시스틴 2 사이의 상호작용을 차단하는 돌연변이이다.
일부 구현예에서, 대상체는 인간이다. 한 구현예에서, 대상체는 비-인간 동물이다. 일부 구현예에서, 대상체는 태아, 배아 또는 아동이다. 일부 구현예에서, 세포 또는 세포들은 생체외, 또는 생체외 조직 또는 기관에 있다. 일부 구현예에서, 제제는 뇌심실내 주사, 복강내 주사, 근육내 주사, 척추강내 주사, 피하 주사, 경구 투여, 활막 주사, 유리체내 투여, 망막하 주사, 국소 적용, 이식, 또는 정맥내 주사에 의해 대상체에게 투여된다. 일부 구현예에서, 방법은 질환 또는 병태를 치료한다.
특정 구현예에서, 본원에 기재된 바와 같은 방법에 사용하기 위한 치료제가 본원에 기재된다. 특정 구현예에서, 본원에 기재된 바와 같은 치료제 및 약제학적으로 허용되는 부형제를 포함하는 약제학적 조성물이 본원에 기재된다. 특정 구현예에서, 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법이 본원에 기재되고, 방법은 뇌심실내 주사, 복강내 주사, 근육내 주사, 척추강내 주사, 피하 주사, 경구 투여, 활막 주사, 유리체내 투여, 망막하 주사, 국소 적용, 이식, 또는 정맥내 주사에 의해 대상체에게 본원에 기재된 약제학적 조성물을 투여하는 것을 포함한다. 일부 구현예에서, 방법은 대상체를 치료한다.
SEQUENCE LISTING <110> STOKE THERAPEUTICS, INC. <120> COMPOSITIONS FOR TREATMENT OF CONDITIONS AND DISEASES ASSOCIATED WITH POLYCYSTIN EXPRESSION <130> 47991-732.601 <140> PCT/US2022/015074 <141> 2022-02-03 <150> 63/145,288 <151> 2021-02-03 <160> 271 <170> PatentIn version 3.5 <210> 1 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 1 gtactttcaa agttattt 18 <210> 2 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 2 gagaggtact ttcaaagt 18 <210> 3 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 3 tgatagagag gtactttc 18 <210> 4 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 4 ttctgtgata gagaggta 18 <210> 5 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 5 caattttctg tgatagag 18 <210> 6 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 6 atgaacaatt ttctgtga 18 <210> 7 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 7 gccaaatgaa caattttc 18 <210> 8 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 8 atgaagccaa atgaacaa 18 <210> 9 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 9 aaatgatgaa gccaaatg 18 <210> 10 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 10 cattgaaatg atgaagcc 18 <210> 11 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 11 tcatgcattg aaatgatg 18 <210> 12 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 12 gatactcatg cattgaaa 18 <210> 13 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 13 ctgtcgatac tcatgcat 18 <210> 14 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 14 aggtcctgtc gatactca 18 <210> 15 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 15 aaagcaggtc ctgtcgat 18 <210> 16 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 16 aatgcaaagc aggtcctg 18 <210> 17 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 17 tgttaaatgc aaagcagg 18 <210> 18 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 18 cacagtgtta aatgcaaa 18 <210> 19 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 19 tctcacacag tgttaaat 18 <210> 20 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 20 ttacgtctca cacagtgt 18 <210> 21 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 21 ataacttacg tctcacac 18 <210> 22 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 22 tcaccataac ttacgtct 18 <210> 23 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 23 acaactcacc ataactta 18 <210> 24 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 24 ttctaacaac tcaccata 18 <210> 25 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 25 gtaacttcta acaactca 18 <210> 26 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 26 gaacagtaac ttctaaca 18 <210> 27 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 27 agtaggaaca gtaacttc 18 <210> 28 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 28 ttgagagtag gaacagta 18 <210> 29 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 29 accccctttg agagtagg 18 <210> 30 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 30 agtttacccc ctttgaga 18 <210> 31 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 31 atgttagttt accccctt 18 <210> 32 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 32 tctcaatgtt agtttacc 18 <210> 33 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 33 aaagttctca atgttagt 18 <210> 34 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 34 caggcaaagt tctcaatg 18 <210> 35 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 35 aggcacaggc aaagttct 18 <210> 36 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 36 gtgcaaggca caggcaaa 18 <210> 37 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 37 gcacagtgca aggcacag 18 <210> 38 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 38 actcagcaca gtgcaagg 18 <210> 39 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 39 gaaacactca gcacagtg 18 <210> 40 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 40 gatatgaaac actcagca 18 <210> 41 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 41 ggtaagatat gaaacact 18 <210> 42 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 42 aataaggtaa gatatgaa 18 <210> 43 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 43 aattaaataa ggtaagat 18 <210> 44 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 44 atagaaatta aataaggt 18 <210> 45 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 45 agactataga aattaaat 18 <210> 46 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 46 gagttagact atagaaat 18 <210> 47 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 47 ttatagagtt agactata 18 <210> 48 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 48 ttaccttata gagttaga 18 <210> 49 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 49 agtacttacc ttatagag 18 <210> 50 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 50 ataaatcgaa ccatcgta 18 <210> 51 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 51 aaatcataaa tcgaacca 18 <210> 52 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 52 ttgaaaaatc ataaatcg 18 <210> 53 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 53 tgaagttgaa aaatcata 18 <210> 54 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 54 caccatgaag ttgaaaaa 18 <210> 55 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 55 cacatcacca tgaagttg 18 <210> 56 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 56 actttcacat caccatga 18 <210> 57 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 57 gtatcacttt cacatcac 18 <210> 58 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 58 aatgtgtatc actttcac 18 <210> 59 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 59 tatagaatgt gtatcact 18 <210> 60 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 60 gtttctatag aatgtgta 18 <210> 61 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 61 gtgtggtttc tatagaat 18 <210> 62 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 62 tgaaagtgtg gtttctat 18 <210> 63 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 63 aaaattgaaa gtgtggtt 18 <210> 64 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 64 aattcaaaat tgaaagtg 18 <210> 65 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 65 accaaaattc aaaattga 18 <210> 66 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 66 aaaagaccaa aattcaaa 18 <210> 67 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 67 ctggaaaaag accaaaat 18 <210> 68 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 68 gtagcctgga aaaagacc 18 <210> 69 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 69 gtatggtagc ctggaaaa 18 <210> 70 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 70 ttagagtatg gtagcctg 18 <210> 71 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 71 tctttagagt atggtagc 18 <210> 72 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 72 ctctatcttt agagtatg 18 <210> 73 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 73 tgtggctcta tctttaga 18 <210> 74 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 74 ggatctgtgg ctctatct 18 <210> 75 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 75 gactgggatc tgtggctc 18 <210> 76 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 76 acatggctga ctgggatc 18 <210> 77 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 77 taatcacatg gctgactg 18 <210> 78 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 78 cctcataatc acatggct 18 <210> 79 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 79 taccctcata atcacatg 18 <210> 80 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 80 tcgcttaccc tcataatc 18 <210> 81 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 81 attggtcgct taccctca 18 <210> 82 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 82 agagtattgg tcgcttac 18 <210> 83 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 83 actgtagagt attggtcg 18 <210> 84 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 84 aatacactgt agagtatt 18 <210> 85 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 85 aatacaatac actgtaga 18 <210> 86 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 86 ctggcaatac aatacact 18 <210> 87 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 87 accatctggc aatacaat 18 <210> 88 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 88 gcaaaaccat ctggcaat 18 <210> 89 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 89 gttgggcaaa accatctg 18 <210> 90 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 90 ggctagttgg gcaaaacc 18 <210> 91 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 91 cattaggcta gttgggca 18 <210> 92 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 92 acttacatta ggctagtt 18 <210> 93 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 93 agaatactta cattaggc 18 <210> 94 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 94 tgtttagaat acttacat 18 <210> 95 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 95 aaacatgttt agaatact 18 <210> 96 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 96 accttaaaca tgtttaga 18 <210> 97 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 97 ggcctacctt aaacatgt 18 <210> 98 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 98 agcctggcct accttaaa 18 <210> 99 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 99 agcttagcct ggcctacc 18 <210> 100 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 100 tttcttcccg gcgcccgc 18 <210> 101 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 101 cctttcttcc cggcgccc 18 <210> 102 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 102 ttcctttctt cccggcgc 18 <210> 103 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 103 tgttcctttc ttcccggc 18 <210> 104 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 104 catgttcctt tcttcccg 18 <210> 105 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 105 gccatgttcc tttcttcc 18 <210> 106 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 106 gagccatgtt cctttctt 18 <210> 107 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 107 aggagccatg ttcctttc 18 <210> 108 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 108 tcaggagcca tgttcctt 18 <210> 109 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 109 cctcaggagc catgttcc 18 <210> 110 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 110 cgcctcagga gccatgtt 18 <210> 111 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 111 tgcgcctcag gagccatg 18 <210> 112 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 112 tgtgcgcctc aggagcca 18 <210> 113 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 113 ctgtgcgcct caggagcc 18 <210> 114 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 114 guacuuucaa aguuauuu 18 <210> 115 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 115 gagagguacu uucaaagu 18 <210> 116 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 116 ugauagagag guacuuuc 18 <210> 117 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 117 uucugugaua gagaggua 18 <210> 118 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 118 caauuuucug ugauagag 18 <210> 119 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 119 augaacaauu uucuguga 18 <210> 120 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 120 gccaaaugaa caauuuuc 18 <210> 121 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 121 augaagccaa augaacaa 18 <210> 122 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 122 aaaugaugaa gccaaaug 18 <210> 123 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 123 cauugaaaug augaagcc 18 <210> 124 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 124 ucaugcauug aaaugaug 18 <210> 125 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 125 gauacucaug cauugaaa 18 <210> 126 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 126 cugucgauac ucaugcau 18 <210> 127 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 127 agguccuguc gauacuca 18 <210> 128 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 128 aaagcagguc cugucgau 18 <210> 129 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 129 aaugcaaagc agguccug 18 <210> 130 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 130 uguuaaaugc aaagcagg 18 <210> 131 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 131 cacaguguua aaugcaaa 18 <210> 132 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 132 ucucacacag uguuaaau 18 <210> 133 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 133 uuacgucuca cacagugu 18 <210> 134 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 134 auaacuuacg ucucacac 18 <210> 135 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 135 ucaccauaac uuacgucu 18 <210> 136 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 136 acaacucacc auaacuua 18 <210> 137 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 137 uucuaacaac ucaccaua 18 <210> 138 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 138 guaacuucua acaacuca 18 <210> 139 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 139 gaacaguaac uucuaaca 18 <210> 140 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 140 aguaggaaca guaacuuc 18 <210> 141 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 141 uugagaguag gaacagua 18 <210> 142 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 142 acccccuuug agaguagg 18 <210> 143 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 143 aguuuacccc cuuugaga 18 <210> 144 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 144 auguuaguuu acccccuu 18 <210> 145 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 145 ucucaauguu aguuuacc 18 <210> 146 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 146 aaaguucuca auguuagu 18 <210> 147 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 147 caggcaaagu ucucaaug 18 <210> 148 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 148 aggcacaggc aaaguucu 18 <210> 149 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 149 gugcaaggca caggcaaa 18 <210> 150 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 150 gcacagugca aggcacag 18 <210> 151 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 151 acucagcaca gugcaagg 18 <210> 152 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 152 gaaacacuca gcacagug 18 <210> 153 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 153 gauaugaaac acucagca 18 <210> 154 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 154 gguaagauau gaaacacu 18 <210> 155 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 155 aauaagguaa gauaugaa 18 <210> 156 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 156 aauuaaauaa gguaagau 18 <210> 157 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 157 auagaaauua aauaaggu 18 <210> 158 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 158 agacuauaga aauuaaau 18 <210> 159 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 159 gaguuagacu auagaaau 18 <210> 160 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 160 uuauagaguu agacuaua 18 <210> 161 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 161 uuaccuuaua gaguuaga 18 <210> 162 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 162 aguacuuacc uuauagag 18 <210> 163 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 163 auaaaucgaa ccaucgua 18 <210> 164 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 164 aaaucauaaa ucgaacca 18 <210> 165 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 165 uugaaaaauc auaaaucg 18 <210> 166 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 166 ugaaguugaa aaaucaua 18 <210> 167 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 167 caccaugaag uugaaaaa 18 <210> 168 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 168 cacaucacca ugaaguug 18 <210> 169 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 169 acuuucacau caccauga 18 <210> 170 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 170 guaucacuuu cacaucac 18 <210> 171 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 171 aauguguauc acuuucac 18 <210> 172 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 172 uauagaaugu guaucacu 18 <210> 173 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 173 guuucuauag aaugugua 18 <210> 174 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 174 gugugguuuc uauagaau 18 <210> 175 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 175 ugaaagugug guuucuau 18 <210> 176 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 176 aaaauugaaa gugugguu 18 <210> 177 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 177 aauucaaaau ugaaagug 18 <210> 178 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 178 accaaaauuc aaaauuga 18 <210> 179 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 179 aaaagaccaa aauucaaa 18 <210> 180 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 180 cuggaaaaag accaaaau 18 <210> 181 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 181 guagccugga aaaagacc 18 <210> 182 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 182 guaugguagc cuggaaaa 18 <210> 183 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 183 uuagaguaug guagccug 18 <210> 184 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 184 ucuuuagagu augguagc 18 <210> 185 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 185 cucuaucuuu agaguaug 18 <210> 186 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 186 uguggcucua ucuuuaga 18 <210> 187 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 187 ggaucugugg cucuaucu 18 <210> 188 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 188 gacugggauc uguggcuc 18 <210> 189 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 189 acauggcuga cugggauc 18 <210> 190 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 190 uaaucacaug gcugacug 18 <210> 191 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 191 ccucauaauc acauggcu 18 <210> 192 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 192 uacccucaua aucacaug 18 <210> 193 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 193 ucgcuuaccc ucauaauc 18 <210> 194 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 194 auuggucgcu uacccuca 18 <210> 195 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 195 agaguauugg ucgcuuac 18 <210> 196 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 196 acuguagagu auuggucg 18 <210> 197 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 197 aauacacugu agaguauu 18 <210> 198 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 198 aauacaauac acuguaga 18 <210> 199 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 199 cuggcaauac aauacacu 18 <210> 200 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 200 accaucuggc aauacaau 18 <210> 201 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 201 gcaaaaccau cuggcaau 18 <210> 202 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 202 guugggcaaa accaucug 18 <210> 203 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 203 ggcuaguugg gcaaaacc 18 <210> 204 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 204 cauuaggcua guugggca 18 <210> 205 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 205 acuuacauua ggcuaguu 18 <210> 206 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 206 agaauacuua cauuaggc 18 <210> 207 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 207 uguuuagaau acuuacau 18 <210> 208 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 208 aaacauguuu agaauacu 18 <210> 209 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 209 accuuaaaca uguuuaga 18 <210> 210 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 210 ggccuaccuu aaacaugu 18 <210> 211 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 211 agccuggccu accuuaaa 18 <210> 212 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 212 agcuuagccu ggccuacc 18 <210> 213 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 213 uuucuucccg gcgcccgc 18 <210> 214 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 214 ccuuucuucc cggcgccc 18 <210> 215 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 215 uuccuuucuu cccggcgc 18 <210> 216 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 216 uguuccuuuc uucccggc 18 <210> 217 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 217 cauguuccuu ucuucccg 18 <210> 218 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 218 gccauguucc uuucuucc 18 <210> 219 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 219 gagccauguu ccuuucuu 18 <210> 220 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 220 aggagccaug uuccuuuc 18 <210> 221 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 221 ucaggagcca uguuccuu 18 <210> 222 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 222 ccucaggagc cauguucc 18 <210> 223 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 223 cgccucagga gccauguu 18 <210> 224 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 224 ugcgccucag gagccaug 18 <210> 225 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 225 ugugcgccuc aggagcca 18 <210> 226 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 226 cugugcgccu caggagcc 18 <210> 227 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> misc_feature <222> (1)..(3) <223> This region may encompass 1-3 nucleotides <220> <221> modified_base <222> (4)..(10) <223> a, c, g, or u <220> <221> misc_feature <222> (4)..(10) <223> This region may encompass 1-7 nucleotides <220> <221> misc_feature <222> (11)..(13) <223> This region may encompass 1-3 nucleotides <220> <221> modified_base <222> (14)..(20) <223> a, c, g, or u <220> <221> misc_feature <222> (14)..(20) <223> This region may encompass 1-7 nucleotides <220> <221> misc_feature <222> (21)..(23) <223> This region may encompass 1-3 nucleotides <220> <221> modified_base <222> (24)..(30) <223> a, c, g, or u <220> <221> misc_feature <222> (24)..(30) <223> This region may encompass 1-7 nucleotides <220> <221> misc_feature <222> (31)..(33) <223> This region may encompass 1-3 nucleotides <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 227 gggnnnnnnn gggnnnnnnn gggnnnnnnn ggg 33 <210> 228 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 228 gggagccggg cuggggcuca cacggggg 28 <210> 229 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 229 aauuuuugga g 11 <210> 230 <211> 11 <212> RNA <213> Homo sapiens <400> 230 aauuugucua g 11 <210> 231 <211> 32765 <212> DNA <213> Homo sapiens <400> 231 aggcggcggc gggcgccggg aagaaaggaa catggctcct gaggcgcaca gcgccgagcg 60 cggcgccgcg cacccgcgcg ccggacgcca gtgaccgcga tggtgaactc cagtcgcgtg 120 cagcctcagc agcccgggga cgccaagcgg ccgcccgcgc cccgcgcgcc ggacccgggc 180 cggctgatgg ctggctgcgc ggccgtgggc gccagcctcg ccgccccggg cggcctctgc 240 gagcagcggg gcctggagat cgagatgcag cgcatccggc aggcggccgc gcgggacccc 300 ccggccggag ccgcggcctc cccttctcct ccgctctcgt cgtgctcccg gcaggcgtgg 360 agccgcgata accccggctt cgaggccgag gaggaggagg aggaggtgga aggggaagaa 420 ggcggaatgg tggtggagat ggacgtagag tggcgcccgg gcagccggag gtcggccgcc 480 tcctcggccg tgagctccgt gggcgcgcgg agccgggggc ttgggggcta ccacggcgcg 540 ggccacccga gcgggaggcg gcgccggcga gaggaccagg gcccgccgtg ccccagccca 600 gtcggcggcg gggacccgct gcatcgccac ctccccctgg aagggcagcc gccccgagtg 660 gcctgggcgg agaggctggt tcgcgggctg cgaggtaaga gcgcgcgacc cgcagcggca 720 gatgcacgaa ccagaacggc cggcgccggc cggggccatc gcccgctgcg gcagctcccc 780 gggctccatc tcgcatcccc tctgcgttcc gcctcccttg gaagcgcatt ccccacctcc 840 gctagtgctg ccctatttcc ggtacccagc gcggaattcc actgctcttt tgttggtgca 900 tatttattgg atacctcctt cttcaggata tgtcaccata gtctttttta ctgaaaatta 960 gtgaaagcct aattagagtg aaagagtaca tctgggtttt gttttttttt ttcttgtaga 1020 ggaaaaaatg aacattactt gtgtaactga tggtagttgc aactgcatat ttgccaatgt 1080 cacaaaatct aaaggaaaat gttatagtca cccgtggttt ccttcttgcc tggacactcc 1140 attgtcccgg gctgaaaagg gtagcagtac agtgcatata atgtcaagtt gtgggaggag 1200 tgtggcagat tgtcattggt gcattttttt ggtgatgtgt gtggttgttt tgaggagtgg 1260 gagctgttaa gaacaccaca aatagaataa aataatatcg tgaagttatt tggccgtttc 1320 taattctaga catttttcta aaaacagttg caaaggaaag attacattgt tttaaaaaaa 1380 tttgaagtat gtttttaaat aactaaatta atgttctttg aaattccacc aaaatgatga 1440 agtcaccaga tagcagctga taaatgtgtc tgagcccagt gcgcccagct ctacaaaagg 1500 cagaagagga attttcaaat ttgccagtgc ccagtaagag gacatgaatt ttctagtacc 1560 agaggaaatt ctctttttac aaattttgtc agaggtatcc ttgggaaagt atttcatttg 1620 cttttaccct ccaaattatt ttaatctata tttttaagag tttccattct cagttgagtt 1680 tttcttgttc ttctccttct gtcagttttg aaagtcttgc acaaaaacaa tccaggtgtt 1740 gttacagcag tgtgattaaa accaggtcag gcctacactg aaatcccagt tccaccactc 1800 attagctgta cgaccttgag caagttactt atcctctctg atacccaatt tttggatttt 1860 tttttttttt aaagagatga tcataacgct taggacttga ctctttggga gaattaagtg 1920 agttaagaca taaaatgtgc agcatgtatt tgtcatgtta ttagcgcttc agaaatataa 1980 atgtaaacat tttggtactt cgtttatgga gattcttata ctagttaatt ttattaaaag 2040 catgatgggg aacagaagat ccttttcgga taacctgtgt gagtaaatta ataaaacact 2100 aacacttttt aagattcaaa actggattaa ttatgttatt ttacaccatt taaaatgtgc 2160 atttaaaaaa tattcactga agtgagagag aagttccttt taagttaata aataatggta 2220 agttgcatga tccttttaac tcagtttaag catttgataa cacccctaac cttgtttgaa 2280 taaactcaat aacagaatat agagaaataa aatatatatt tcatatgagt atgtatgtaa 2340 atttatttct tttaaaggaa aatttcagga aacaaaatga ataagctcat agtcataaaa 2400 cctctagcca aagtgtgtca atggtctgat ttgtaggaga gcagactcag gaatcgggaa 2460 tttttttttt ttttttaaga gtcggggttt cactctgtca ctgaggctgg agtgcgggga 2520 agcaaacgta gctcactgcg gcctcaaact cctgggctca agctgccctc ccacctcagc 2580 ttcccaagta gttgggatta caggtgcaag ctgctgctcc tagctgaaaa gttttaatta 2640 tataaaatgt ttaaataaat tgttattcct ttcttttatg aagaaatata attgatattc 2700 ttgtcactta ttaaataagc aacattttaa aatgtttagc acctactgtg aagatagcac 2760 tgtgctagct gctatgaata aactagaata gcatatcact gttttcctat ggacaaaaac 2820 ccagaaatgt aaaataaata gccatgaatg ggttgagatt ccccctgccc cctttggata 2880 ctgatgacag aaatcttata tgcactatgt aagcagtgcc ctaggatcag aacagaaagt 2940 aacttgcaat ttttaaaggt gggagaaatg actgaagttt ggagtggtca ggagtttccc 3000 tggaagtctc ttgcctttgt gactttgtat agctccctca aactacctga gcctgagctc 3060 ctcatttata aaatggaaga attgaaccta gcttccaagg tcctttctag cttcaccatg 3120 ctctggtctg ttgtttaatg acatgaatcc aagatggaca acaaatggtc gattttgctc 3180 cttctacagt aaatagatct atcttcttag cagaagtaaa atagtaaaga aagaagacat 3240 gtttgaggcc tgttgaggcc tgtttgctgt atgcattgta tctaatcaag gaattgagaa 3300 tgtagcccta aatattagga aggagttgaa agtttctgag caggaacaga acatgctgaa 3360 aggaaattgt gtcagcagca tggtgtacag gagagcttgg cagagagaaa ggaggcaaga 3420 agacctgtgg gaggcagcca gtaaggaggt gaagagggcc tggaccaaag gaagccaagg 3480 atgaccgaaa gatttaaaga tgaagcccag atttaaaagt atcctcaagt atttgtttat 3540 tcttttctta gcaaattctt tttagtacaa agataaaata tggcactctg agtcataaaa 3600 ttttctgaat ttcagaagtt gaatgttttt ctgaatgtat caacctgtta aagtcagttc 3660 ctgtttgtta ttttaggcgt atattcttgg gctttttttt ttttttccta gagaaactat 3720 gaagtactag ctgtgcaagt cagggtgggc taagctgcta aaacagatac ctccctcccc 3780 ttcaataccc tgaagaacaa gaagttaatt ttttgctcgt gtaacatttt agagagggta 3840 ttccaggttg aatacctgga ataatgaatg aaataataag tcgactctta tttctcctaa 3900 aataattgga tcttgacatt gaaattggtg tgctgattgt atttaataag tgacctccaa 3960 tgcagttatt tcattttgcc atactttatg taatttttat tttttctgcc ttccctttcg 4020 atgtctaaag ggaagcataa ttagttattg gaaaggttat tgagacttaa aaaaagattt 4080 gaacatggct ttggttgatg ctaccacaca gaaactgcaa acatccaact caccgctctt 4140 agttgctgtt catgatagtc tatgcacagt gactgatgaa tttagcctgt cttgaggctt 4200 cagaacttag tcttatgtca tcacgagcag agctttatcc taaattacag gttttcaatg 4260 gggggggggg ggaggggcag ttttgcccct caggggacat ttggcaatct ctggagacat 4320 ttttgattgt catacctggg gggatgcccc tggcatctcc tgggttgagg ttaaggatgc 4380 tgctaatcta caatgcacag tacagccacc ccacacacac acactacaaa gcattctccc 4440 acccaaattg ccaggagtga ggactttgag aaaccctgcc ctagactgtt aaattcaaaa 4500 ggaaataatg gtttattgct cacagtgtgc caggcactgt gttaaactcc ttatattcat 4560 agttttgttt ttatcctcac aacaacctgt gaagaaagaa ctctcatccg tcaccacttt 4620 actgttgagg gcactaagcc ttctaaaggt taaatgactt gcccagggcc gcaactatta 4680 gatgttgcag tcaggattta attccaggca ctttgtgttc aaagtgtttc tcatccactg 4740 tgctatatgc cagtagtgcc caaacctaac tttagccagc aattgtctgc atctcttcag 4800 tttatgaaca tttatttatt aggacatgca ggataatcat accaacacag tccgtgtatc 4860 cagaattcta attgatctag ggagtgggag agcctgcctc tctatttttt ttaaattggt 4920 gtgaaatata cataacataa aattggccat tttaaccatt ttaagtatat aattgagtga 4980 cattaggtag atttattata ttatgtaaat ggacttaaca caatttattt ccagaacttt 5040 tttatcatcc caaacagaaa ctctgtactc attaaacagt aactccctgt ttccccactc 5100 ccccttgccc cagacgctag taacctccat tctacttccc ctttctgtga gtctccctgt 5160 tgtagctacc tgatgtaagt gaaatcagac catgtttgat cttttgtgtc tggcttattc 5220 acttagcata gtattttcaa ggtttatcca tgcgtgcaaa ttcccttctt ttttatgacg 5280 aaatactatt taattgtgtg tgtacatgtg cacacacaat gaaatactat ttcatcataa 5340 aaaggaagtt tgtacacata tatacacaca caccaaattt tgtttatcca ttcatcagtt 5400 catgggcatt tgcggttttt ttccaccttt cgactgttgt gactttccgt ttatttttaa 5460 tctgaacttt actccatcac ttcctccctt tcctttttta ttcgcaccat aattttgaac 5520 aagcagactt tgtattttca ttactctggg gatttttttg agggaggctt gctacccttt 5580 ggggttgtgg taaggttgtg ccagtaacag aattcatgca gtaaaaaaca ttcatgggac 5640 tttcttttgt gataggtact agggatgcag agatgaataa tacaaggtct cgaccttcaa 5700 ggagctcagg gtttagtagg gaaaacagag gtataagtaa gtcattgcaa tgccaggtcc 5760 cagatatggg aggattccag caaagagagg ataaggccag gcacagccgc tcatgcctat 5820 agtcccaaca ctttgggaag ctgagatggg aggatcactt aagcccagca gttcaaggct 5880 accctgggca acatagtgag tggcaaaaaa tacaaaaatt agccaggcag ggtggcacat 5940 gcctgtggtc ccagttattt gggagtttga ggtgggagaa tcacctgagc ctgggagatt 6000 gaggctgcag tgagctgtga tcacgccact gcactccagc ctgggtgaca cagtgagagg 6060 tgagagcctg tatctaaaaa aaaaaaaaag agaggatcag atttacctgg agaggtcaga 6120 gaaggtttcc agagggagta aaacttgagc ttcattttga agaatgagag gggaatacaa 6180 ggagggaaaa ataataggaa caagacctgt tcctgttaca gcaaacctgt aactcccacc 6240 atggaatggg cacgttttcc tgtagacatt tggagccagt gtgggcttca agcctagggg 6300 gctgatatga tcatttgtca atctgaagat gactcttgga acaacgtaga ggatagggtg 6360 aggtgggtag gctggtggct gacagactag gtcaggagag ggctgaccaa gaggaggagg 6420 ggtgacgagg gctggaacta aggcatatga gctgggatgg aaagaagcta gatagaaagg 6480 aaacaaaaac catcagaact gtggaaccaa ctccatggga gggataagaa gagggcctat 6540 tctagggtga aacccaaatt tctggcatgg taccattaac ccaaacagaa agaggagatt 6600 tccagagaaa gaaaagcaaa ttttgcggga ggtgagtgtg agctgtctag agaatatgca 6660 ggtagaacta catgttaact gtaacatata cttgtctgca cctcaggaga tggctgatta 6720 agaattcagg attcaggcca ggcacggtgg cacacgcctt taatcccagc tgcttaagag 6780 actggggcgg gaggattgct tgagcctggg aatccgagat cagcctgggc aacatagcaa 6840 gacactgtct ctaaaaaaaa aaaaaaattc aagattctgg agtcaatatt acttaaggta 6900 gcaactgtct attctataga aaatggacaa atatagataa aaagccactt ccctttctaa 6960 aagtgtccct gcaattcaag tgaatactag gaaggattgt gttcattctt ctaaacaaga 7020 ctcacatgta tcttagcaca aaaagaggat tcttttatga tacaaatgca ctgagaattt 7080 ggtcaggcta tcacaatgaa ctgatagttc agatggattt gagtctttat accactctgg 7140 aatctggacc aactgggcct cctaaggcca ttttgcagat ctgggcttgt ttctgaagct 7200 acagacaggc ctcttccaag cactctaagt gctccacaaa taatatttct gtttcccaga 7260 acaaccccac aaaaaggtac tcttactcca tttttagatg aggaagtgga ggctcatgat 7320 gtcaggtaag ctttctcagc tcccaagtgg ttaagccctc agtttaatgt catttgactc 7380 cagagcccta tgttgcacca tgccttgata ataggccata tgggtttcat gtatttcaga 7440 tggggaaggt tagtgtgagg tgaaagatac acaattaacc ttttaaccat ggaactgaaa 7500 tatttacaga tgaagtgata caatagctgg aattaattcc aaaataattg gggtggtact 7560 ggtccatggc ctgttaggaa ctgggccgca gagcaggagg tgagcagcag gctagtgagc 7620 attgctaccc cctatcatat cagcagtggc atcagatggg tgaggatgta aatgaactag 7680 gattggcatt gagttgatat tgttggatct aggtgataga tttatcatta taatattctc 7740 tctttgtgat atttctgata ttttctaaaa taaaaagttg tagttattta tttatttaga 7800 cggagtttca ctcttttgcc caggttggag tgcagtggtg tgatctcggc tcactgtagc 7860 ctccgcctcc cgggttcaag cgattctcct gcctcagcct cccgagtagc tgggactaca 7920 gcctcccgag tagctcacca ccacacccag ctaacttttg tatttttagt agagaggagg 7980 tttcaccatg ttagataggc tggtctcaaa ctcctgacct caggtgatcc acccacctcg 8040 gcctcccaga gtgctgggat tacaggcgtg agccagtgtg cccagccaat aaaaagtttt 8100 tgaaaggatt tagataaaat agttggggaa atggcatttt tgttcaaagc caattattta 8160 tgtttggaat atcttttgtg cttggagttc tccattacag agttccccag tgttcctatt 8220 aataagtaac attgagcaga ggaatgcact gtttagatca gcagtcccca acctttttgg 8280 caccagggac cggcttcatg gaagacaatt tttccacaga cctggggtag gaagtgtttg 8340 gggatgaaac tgttccacct cagatcatca ggcattagtg agattctcat aaggagcagg 8400 caatctagat tcttcacatg cgcagttcac aatagggttc tcactcctgt gagaatctaa 8460 tgccacccct gatctgacag gaggcggagc tcgggcggta atgctcactt gcctgcggct 8520 cacctcctgc tgtggggccc ggttcctaac aggccatgga ccagtacccg tctgcagcct 8580 ggggactggg gaccctgctt tagatgatgt actctggctt tgcattctgg cattagctaa 8640 gcaccctctt aaaggaaatt gggtctatac tctcagtccg tgttctccct aacacctgga 8700 aacattgaat accttcaatg ctgggaagtt aactcccacc acaactagaa cagctatggg 8760 aaagacaaca gttgattttg aagagtgtca ccaatttgca catgattcca tccttaacca 8820 ttcttatcct atcagctctg ccaaacatgg agaatagttg gctgcaggac agctattttt 8880 cctacttgta gatgcaacta tttctcaccc accaggatgt aaaaggtccc tgtaccctaa 8940 gattggtcct acatacacac ccaatgggaa aatgagatga aaaatttaaa gcagtaaata 9000 tttgaggaag tagatagagt aatttagaaa aagaaaatac acagggccaa gcacagtggc 9060 tcacatctgt aatcccagca ctttgagagg ccaaggtgag aggattgctt gagctcagga 9120 gtttgaggcc agcctaggca atgtagtgag accccacctc tacaaaaaat taaaaactta 9180 gttgggcttg gtagtatgta cctgtagttt aagaaacttg ggaggctgag ctgaggcagg 9240 aggattgttt gagcccgggt ggtcaaggct gcagtgggcc atgattgtgc cagagtactc 9300 cagcctgggt gatagagtga gactctgtct caaacaaaaa aaaaaacaga gacagaaaaa 9360 aagaaagaaa atatatggat gtatatcata taaaaatata aataagggag gccaagtgca 9420 gtggcatgcc tgtaatccca gcactttggg aggctgaagc aggaggatca cttgaggccg 9480 agaattcgag accagcctgg gcaacgtatt gagacctcat ctctgcaaaa aatcaaaaaa 9540 tgaggcggaa ggatggcttg agcccaggag atcaagcctt cagtgagctg tgatcgtacc 9600 actacactcc aggctgggta acagagagag accctgcctc aagataaata aattcataca 9660 tacatacata catacgtaca tacatacata cataagaaga cttgtttctt tccatttgca 9720 atgtttcatt caaaggctag aattaaattg ccgtaggcca tcacaagttt agcttgaata 9780 ttattatttt ttcaagatgg agtctcactc tgtcacccag gctggagtgc agtggtgtga 9840 ttttggctca ctgcaacctc tgtctcccgg gttcaaccga ttcttctgcc tcagcctccc 9900 atgtagctgg gattacaggc gcccgccacc acacctggct aagttttgta tttttagtag 9960 agacagggtt tcaccatgtt ggccagactg gtcttgaact cctgacctca agtgatctac 10020 ccgcctcacc ctcccaaagt gctgggatta taggcttgag ccactgcacc cagcctagct 10080 tgaagaaaat ttgataggag tttgtttttt tctatttata ggccaagcaa taccacgtat 10140 aaatattaag aatcatggct gttccttagt gcctagttgt ttataaacca tgggaaagaa 10200 tgaaatcatt gaccaaatga gacagggtaa cagtcttccc tgggagtaaa gagactagca 10260 gtctctattg acatatattt taggcctggc ctccaaaata aatttaccca aagaagtgat 10320 gtatttgtgt ccagggctac cgagcctaat ctttggctgc ctctgtgtta ttctaagttg 10380 taattttcca tgtcatctaa atttgtaata attctttaat atgatagtgt ttcagtgaac 10440 aaacattctg cttgctgcat ttcttctgag tgagtaattc cctgacaact accagatctt 10500 ggcagaagca aagttggtca taagttatgc tccactctca gtgctggtga aacgtatgat 10560 gcgtaacaca gtgtttttga attcagtgct gattttccta aaggacattt ggaaggaaaa 10620 aagaaaagga aaggaaatac ccaaattcag gaatagaact tacatattat tataagactt 10680 aaaaaataca tgaacactaa tgatgaactc atttcttcga agtaaaaggc cttatgctat 10740 tttttcccat ttccctatgt ggcttgattg tggcgaaagt ggctgtgtga gtttccatta 10800 ttgaaggagt taaggtctgt ggaatcaaag catgagacaa catgcaagga ccaggttggt 10860 ttccatttaa cagccaacct aatctaactg aaaggattga gaggtttgtc ttttttggaa 10920 agtgttaagg ttcttccaag taaccagcaa tgtgacttta ccacactgtt cattaacggg 10980 gctttggatg gccaccatgt ctgctgctgg ctgagtccaa aactgcggtc actctctcca 11040 gcaagctcat ggagggttac gtcatcttca ctcagccagc ccaacgcttt ttccatctgc 11100 taaaatgtag aacatggttg ttgattctac tctttctaca aagaaagaga gggaacatgg 11160 atgagttgct gcttttaaag attatatgtt aattgctgtt ttaaaaatct gctcagctaa 11220 gcacgcttag tgtaatcagt caccatggag ttttttaata ggacagcttc tgctcttaca 11280 gagcagagtt tttatgccag taggttagaa gcataacatg tttctatatt gaagtgattc 11340 tccaacaagg acttcttttc atcaggggtg acctaaaagt tattacttga aatataatta 11400 catcatgttc ttaactgggt ttagtagtag gataattaca aggttgtatc cacctcaaat 11460 aggaagaact gataagtttt gcacaattat ttaactcctc tgttaggcct tccttatttc 11520 ctgttctctt tttaaaattt gactaagata ttgctaatgg gcttgggagc ctataaaatg 11580 atcagaattg ttgccttatg ttttgcatgt ttggggtaac attggagcca gatgtactct 11640 taaataaaag gtaggcctac aaaaccagtt tctcagttgc attcaaaatg tgattaaaaa 11700 aaaaaaaagg agaatctccc ttataggtga actttttaat ttgtgcttta ttttcccttt 11760 tgccattcat gagatttctt aaataaaatg atatcttttc ttttcttcat tattatttta 11820 aaggtctctg gggaacaaga ctcatggagg aaagcagcac taaccgagag aaatacctta 11880 aaagtgtttt acgggaactg gtcacatacc tcctttttct catagtcttg tgcatctgta 11940 agtagaatat ttccttgcac taatgggaaa gttttgaaaa gatttgacct atccaaatca 12000 taattaaaag gaagtgtgta tgcaccagag gggcaactgg gaagttacct tcttaccttt 12060 gtttttaatt ctaatatttt tatttgggca tttgtttatt gactatcttc ctatggtaga 12120 atgcaagctt tataagagaa gggacgtgat ttgttctctg ctgtaccccc atttcccaaa 12180 actgcagatg gcaacagaag gctctgaaaa atatataaga aagaattttt ctaattgtga 12240 ctaaattgtg accaaatgct aagtgactgt ggacttgcgt ttaacacagg acgggagagg 12300 caaagagttc aattccaatt tagaatttgg tcaagttctc ttctgcactc tggtaaacat 12360 taattaaaaa tcagcattat ctgaccagcc agttcatcgt cagtggtggt gattttcact 12420 atgagatacg cgtggcaact tgccagacac caagaaacca agttagagga tttttgtatt 12480 agattcctta acaatgaata cagtatcacc attattacag tatcatcatt attgtcatac 12540 tattattata tcagttaaca taaagtctgc ataagaattg tttccagaaa aatgactttc 12600 caaatttaac tttcaggaaa tacaaataat gctactaata ttgcttttat tggcgtatac 12660 atgtaatatc cccttctttt ggatttggat atgttgtgtc attgcctcat tttaattcat 12720 tatttcttct caatctttaa taattgctgg acttttactc cacaagaaac ttgctatagg 12780 cccatctctt tcgtcttctt tccttctttc agttcgtctt cccatcctct ggtaggggga 12840 ggggagggat gcctgagcga gagactagct gtaggaacca tttgtctcaa agtccagaaa 12900 gccacaggtg atggatttgt cctctgaatc aaagggcgtt cgatgatgga tttctgtcat 12960 gtctcatcta aagtcttcac gagaacagat gaggaagcag ttttatgacc ccagagcctc 13020 ctaccaaact cctctgagaa aaggtttcct tttttttttt tttttttaaa ttagagacag 13080 agtcttgatc tgtttcacag gccggagtgc agtggcacaa tcatagctca ctgcagcctc 13140 gagctcctag gcttcagtga tcctcccacc tcagtcaccc acgtagctgg gactacagct 13200 gcacaccacc atgcccagct aacttttaaa acatttttgt agaggtgggg tctcactttg 13260 ctgcctatac tggtctccag ctcctagctt caagtgatcc tcctgccttg gaagttctgg 13320 gattataggc atgagccact gcacccagcc tggatgtgat atttttatgt tttaaattgt 13380 tagagtttag aaacttgaga ttgagtttgc tgcctgcatt aaaatgatgc ttaaacatta 13440 aactgcagtg gccttaaata ttaacaagtt gattagaatt actaagttct tttcaagctt 13500 tacatataca gacaaatttc ttatgcaaaa tagaaggtaa cccctgtacg taagtctaga 13560 atttcagcag tccccaaaac tgactgagca ttagaatcac tctgatttta aaatacatat 13620 gtggttttcc gagatctact aacagagcct ccataatgta gcctagagaa acgagttttc 13680 agatgtagtg ataaatttgg aaggtaagtc agagaagtaa gctgaagaca gagttttagg 13740 aaatatgcct aaagtcacat aatgaattgg ttttcttgtt tatttgagaa tattgtcgct 13800 ttttgttctt tttcatgcaa atcacatttt atttcttatg tgagtagcta tatatttaaa 13860 aattttgttt ttggaatatt gtagaatctc tacttaagaa agtatcttag cagtcatatg 13920 gtctgacctc actgaatgct aaattctctt taaaacatcc gtctcagatg gttactcata 13980 ctgcctctga ttgaacaaga gtcccaggtt aagggactta cttctttgaa atcgttcatt 14040 tcatttttct acagctatgt tagaaagttc gtccttagca gtgaagccag agtctatctc 14100 ttataacttc tacccagttg caccctccaa gcctacctat accaagtatc ttttttccac 14160 gttgcttttc caattcagct cttcgcaagt ttggagacaa atacctaatc tcctctaagc 14220 cttctccagg ttaagccttt ccagttcatc cagctgttga ttatgtgatt ggagacacaa 14280 gtttgagtaa ctcccatgat ggaaagtccc tctggtgaat gttctgttca tcagagtccc 14340 taagaaagca catgagcctc accatggtga gtggggccat gagattccta aaccagacac 14400 tacactgtgg cttgtgcaac ctaccatggc cagactcatg aggctgtttc atcatataaa 14460 taattcctta gtctcttcac caaaaactgt gaagcactgt gtcccccagc tgtatgtgag 14520 ctagcctggg accatagtgg aggactcctc tttcaaccct gttaaatttc atcttgttag 14580 gatctgccca tttttccatt ctgttgaaat tatcttggaa ctggattcat tcatctcaca 14640 tcagctactc cccgaagcct cacagtatca gcagagttat tatctctatc catatccttg 14700 taaattatta aactaaaaaa gattggtcta agaacatcag tccattaatc aaggctcttt 14760 ggttggagtt cacttcatta tattatcatc cagctcagag tgttcataaa caagatgata 14820 ggaaagactt ttccaaatgc ctgtctgagt aattccccca ttcctgtgat ctgtgagctg 14880 ttgaccagat taaaaaggaa gtgagaataa ccaggcaaga tttactccta gcaaaacctt 14940 actggcttct agtgactgag tcctttccct attgcttacc agctatcttt ttaattacta 15000 gttttaaaat cttgccagca atgtcaatat caaatgacca agaatatcaa actcattact 15060 ctgtatgtaa atgagatagt gtacttaccc ctatggctta agtattaggc tgttcttgca 15120 ttgccctaaa tacctgagac tgggtaattt ataaaaaaag aggtttggcc aggcactgtg 15180 gatcaggcct gtaatctcag cactttgtca ggctgaagca ggtgtaatgg tgagccaaga 15240 gttcaaactt agcctggaca acaaggtgaa accccctctc tgcaaaaaat acaaaaatta 15300 tctgggcatg gtggcatgca cctgtagtcc cagccaccca ggaggctgag gtgggaaaat 15360 tgtttgaagc tgggagtcag tgattgcagt gagccatgat tgcaacactg cactccatcc 15420 agcctgggcg acagagcaag accctgtctc aaaaaataaa taaatgaata aataaataaa 15480 ataaataaat aaatagaaaa gaaaaagaaa gaaaagagat ttatttgcct catggttctg 15540 caggctgtaa gggaagcata gctccagcat ctgcttctgg ggaggcctca ggaagctgtt 15600 actcatggca gaaggtgaag caggagcttg cacatcatgt ggcaaaagca ggagcaagag 15660 agagagaatg gggcagggaa gaagccccac acttttaaat gaccagatcg catgagaaat 15720 cactcgttac ctcaaggaca gtaccaagag gatggtacta aattcctgag aaatccaccc 15780 ccatgatctg atcacctcgt accaggcccc gccttcagca ttggggatta tgtttcaaca 15840 tgagatttgg atggggacaa catccaaact atatcacctt gcatagtagg tagggtttta 15900 aaaagcagtt tggcacagta agaaaagtac agattttttt tgcatcagac agacctgagt 15960 taaaatccca gcttcactgc taacatgcta ggtaaatgtg ggcaagttaa ttaacatttc 16020 taagcctttg tttcctcact ggtaaaacaa gtatttggaa atatcattgt gaagattaga 16080 aataatacat gaaaagatcc taggatgctg tctgtcatac agtagtagta gtaagaagtt 16140 attcttgcca aagattgttg agaatggcag aattatctca gttctaagag ctatagtttc 16200 taattatttg agcctagact cagattcatt tggagcagct aactgctcac caagagctta 16260 ttttccatct taccaatgag gttatgtgcc ctgtgttttt aaaatcagtc tacttaacca 16320 agagaacaga aatgacatga gaattaagta atctcacttt ctctgttatt taggatttat 16380 tcctactcaa aacctgagag ttgctatgaa ttcaccatta aagcacttat taatatacat 16440 gggttactgt tataaatagc aatagtattg ctattgtgtg agttaggtgt tgaagttcaa 16500 gaaaggaata aagaatattt agaagatctt tgaaaacagt gtctgggtac ggtggctcat 16560 gcctgtaatc tcagcacttt gggaggccga ggcaggcaga tcacttgagg tcacgagttc 16620 aagaccagcc tgggcaactt ggcgagacct cgtctctaca agatatacaa aaattagccg 16680 ggtatgttgg catgcacctg taatcccagc tacttaggag gctgaagcac aagaatcact 16740 tgaacctggg aagcagaggt tgcagtgagc caagattgta ccactgcact ccagcctggg 16800 caatagagca acactctgtc tcgaaaaaaa aaaaaaaaaa aaaaaaaaga aagaaagaag 16860 gaaggaagga aagaaaaaaa aaggaaaaaa tgcaaggaag gtatttggtg aatctataat 16920 aataaaaatg tatttgtcat ttcctttttc tgtgctctca ttctataaaa ttgagtaaaa 16980 aatctatata tagtttaaac acattaatag aaatcacaaa agttagctga gtcaacattg 17040 tagaaacata atatttctgt atgtcaaaga aatagacaac attaaaaagc agaaagcaat 17100 tacaaagaat gattataaga aacatcacaa agggttaata ttttaacaca tttgaaactc 17160 aaaaatcact gagaaaagca gtagacttcc ataaatattt tatagagtag aaaaaatagg 17220 ccaagcacag tggctcatgc ctgtaattcc agcactttgg gaggccgagg agggtggatc 17280 acgaggtcag gagttcaaga ccagcccggc caagatggtg aaaccccatc tctactaaaa 17340 atacaaaaac tagccaggcg tggtggcagg tgcctgtaat cccagctact tgggaggctg 17400 aggcagggaa ttgcttaaac ccttaaaccc gggaggtgga ggttgcagtg agccaagttc 17460 gcaccactgc attccagcct gggcgacaga acgagactct gtctcagaaa aagaaaagaa 17520 aagaatagaa aaagaatcca tgggcaggca cagtggctca tgcttataat cccagtactc 17580 taggaagcca aggtgagagg atcaattgag gccaggagtt caaggccagc ctgggcaaca 17640 tagcaagact ttgtctctat taaaaatttt aaaattagcc aggcatggtg acgcacacct 17700 gtagtcccaa ttacttggga gcctgaggca ggagaactgc ttgaggctgc agtgagctat 17760 gattagacca ctgcactcca gcctgagcta cacagtgaga ccttgtgtca aaaaagtaaa 17820 aaaataaaaa ttagccaggc atggtggcac atgcctgtag tcccagctac tcaggaggct 17880 gaggcaagag gatgacttga gtctggaaga tggagactgc agtgagctgt ggtcatgcca 17940 ctgcactcca gcctgggtga cagagcaaga ccctgtctca aaaaaaaaaa aaagaaaaga 18000 aaagaaaaat aaataaaatt tattcaaata caaaagtgat gtggtttgac tctgtgttgc 18060 cacccagatc tcatctccaa ttgtaatccc cgtgtattga cggaggttcc tggtaggaga 18120 tgattggatc atggggatgg tttcccctct gctgttctca tgatagtgag tgagttctca 18180 tgaaatctgg ttgtttggta ggtgtctgtc acttacccct tctttttctc tctcctgctg 18240 ccttgtgaag aaggtacttc cttctccttt gccttccacc atgattataa gtttcctgag 18300 gccttcccag ccatttggaa ctgtaagtca attaaacctc tttcctttat aaattaccga 18360 gtctcaggca gttttttata gaagtgtgaa aatggtctaa tacagagact tggtaccagg 18420 agtggggtac tgctataaaa aataacctga agatatggaa gcgactctgg aactgggtaa 18480 caggcagcaa ttggaacagt ttggagggct cagaagaaga caggaagatg tgggaaagtt 18540 tggaatttcc tagagacttg ttgaatggct ttgaccaata cactgatagt gatatggaca 18600 atgaagtcca ggctgagatg gtctcaggtg gagatgagga acttattggg aactggagta 18660 aacgtcactc ttacatgttt tagcgaagag actggcagca tttttcccct gccctagaga 18720 tctgtggaac tttgaacttg agagacatga tttagagtat ctggcagaag atatttctaa 18780 gcaccaaagc attcgagagg tgacctggct tttcctgaaa gcatacagtt atatgtgctc 18840 acaaagagat ggtttgaaat tggaacttat gtttaaaggg gaagcagagt gcaacaaaag 18900 tttagggagt ttgcagcctg accatgtggt agaaaagaaa aacccatttt ctggggagaa 18960 attcaagctg gctggagaaa tttgcataag taacgaggag ctgaatgtga gttgccaaga 19020 caatggggta aatgtctcca gggcgtttca gaaaatcttc agggcagacc ctcacaacac 19080 aagcctggag gcctagaagg gaaaaatggt gtgagccagg cccaggccca ggccccagct 19140 gttctgtgca gccttgggac atggcaccct gtgttccagc cactccagct ccagctgtgg 19200 ttaaaaggag ccaaggtaca gctggaccat tgcttcagag ggtacaaatc ccaagcatta 19260 gcagcttcca tgtggtgttg ggtctttggg tgcacagaag acaaaagttg agctttggaa 19320 gccgctgcct agatttcaga ggatgtatgg aaacacctcg atgtccaggc agaagtctgc 19380 tgcaggggca gagccttatg gagaacctct gctagggcaa tgcagggggg aaatgtgggg 19440 ttggagctcc cacacagagt ccccactggg gcactgcctc atggagctgt gagaaaagga 19500 ccaccatcct ccagactcca gaatggtaga tccaccaaca gattgcactc tgcgcttaga 19560 aaagctgcag gcactcaatg ccagcctgtg aaagcagctg caggggctgt accctgcaga 19620 gccacagagg tggagctgtc caaggccatg ggagcccacc ccttgcatta gcatggagac 19680 aggggatcaa aggagatttt ggagatctaa gatttaatga atgccctgtc gagtttcaga 19740 cttgaatggg gcctgtgacc cctttgtttt ggccaatttc tcctatttgg aatgggaaca 19800 tatacccaat gcctgtaccc ccattgtatc ttggaagtaa ctaacttgct tttgatttta 19860 cagactcagg cagaagggac ttgccttgtc tcagatgaga ctttggactt gaacttttga 19920 gttaatgttg gaacgaatta agacattggg gttctgttgg gaaggcgtat ttggttttga 19980 aatgtgagaa ggacatgaga ttttggaggg gccaggggta gaatgatatg gtttgactct 20040 gtgtctccac ccaaatctca tctccaattg taatccccat gtgtcaaggg agggacctga 20100 tgggaggtga ctgaatcata ggggcagttt cccccatgct gtttgcatga tagtgaggga 20160 gttctcatga gatctggttt tttggtaagt gtctgggctt cccccttttc cctctctctc 20220 ctactgcctt gtgaagaagg tacttgcttc tcctttgcct tctgccatga ttgtaagttt 20280 cctgaggtct ccccagccat tcagaactgt gagtcaatta aacctcttcc tgcctattct 20340 caggcagttc tttatagcag tatgaaaatg gactactaca gaaagtgtgt aactttaaac 20400 tcagtagtat ccaaagaagt aatgaaaatg gagaaacgaa caacaaaatc atagtacaat 20460 atggtgtatg tactaggaca ggaagagccc ttttaagaag agatctatgt atttccattt 20520 gtttatctct gaaagaaagc aactttgcct tgtattctga aaaagaaagg aatattttat 20580 tttacttgta aaaatcttac aaggatgcta gtctaaatat agttttccta atttgccaga 20640 gaatccatga agatcgagtt gataacaaga tcagtgaagt aaaggtcagt gagttaatct 20700 cacagcagct gcaggctaat tccatttcca gtgaaaaacg tcttgattgc tcaccacata 20760 tcttttcacc acaaacagtt tcagtcttaa gatcacatgt tgcaatccat gagaagtaac 20820 tattaagcct tcaactatga ctggagggct cctcgccctt tctgataaat tgactggaca 20880 aaaactcaat tttaaaatga caagaaatag aagatgtata aatgtacttt aaatgtgacc 20940 aaaatgggtt gtgaaaacac aagacacaat atccaaaaat gctggcaaca cagtacactg 21000 tagagtattg gttgtttatt tacccttgct attgtgtggc tgagcttact gccactgccc 21060 agcattgcaa gggcatcaaa ctgcctatca ctagcctagg aaaagatcaa aattcaaaat 21120 tctaagtaca gtttctactg aatgcttatc acttttgcac cattttaaag taaaaaaatc 21180 agtaagttga accatcatat atccaagatt gtctgtatat aaatattata catctttctc 21240 tcacttttaa aacaaaataa tactagccaa tactaccatt ctcaaaagca cttgtgtcaa 21300 cagcctttac cccttaaaga ttttcctcac aattttaaaa ttgttactta ctattttctt 21360 tgaaatgttg accaaacctg gattaaaaga tttgggggtt ttagtgactg tatttcacaa 21420 actctcttat tgattctgca gcctcacttc tgcctcctaa aaagccctca ccaaggtcac 21480 gggggatggc tcttttcagc ctcttcctgg catttggtcc agtggcattt ggcattctag 21540 gacttccctc tttgtctttg ataactccct ctcttcctgt gttcctcctt gctgtgttca 21600 cttgcttcgc tttcttcttt ctgaagcatg tttacacagt gttttctctg attgggcctg 21660 tgacgttctt taggtcatct tttccacaaa taatgcttca actagtactt gcgtgccagt 21720 gactccacgt cccactcatg agctctgaac ctagtaccag cttctgctgg acatctacaa 21780 tgggatctct cacaggcctc tctcattggt aacatgcccc agcctgaact catctcccac 21840 ccatctatcc agccatgctc tctagttcac ctgaacactt gggtgtcatc ctagatgctt 21900 tcccttccca gtcttctgtg atcattctgc ctcatcagag gctctctaat ctgtcttctt 21960 tcctatatcg ctcttgtccc tattttaatc ctaatcatct atttcctgac ttattcattc 22020 cttaagttgg tcagtaattt aattaaaaac agatttaggc cctgacctta aatgtgataa 22080 gtgatatgaa aggagatgac tggggaaaag gatttccctc aaggaaggcc tctgtgaagc 22140 ctgaagcaag aatgaaaacg agtcagacga agagagaatt gtatgaatga aggctctgag 22200 gcaggaaaac actcagatca ttccagaatc acttagaagc caagtgaagc cagttcctgg 22260 agagcagatc atcaaatgaa gatggaaagg tgaccagggg ccagacctgt agttttggtg 22320 ggccttggtg agggatttac agtaggacac cccatggttt aagtatgaaa gtgacaagat 22380 tcctttaagt tttaagaggc ctcgaaatat gaaccacaga ttagatggaa gctactctcc 22440 ctgtgtctgg actttttaga atttccaaga gctgctgttt ctggaaccag attaatacaa 22500 gtcagtcttc catttattta tttatgtatt tatttgagac agggtctcac tctgtcaccc 22560 aggctggggt gcagtggcat gaacacagct cactgcagct tgggggctca agagatcctc 22620 ctgcctcagc ctcccatgta gttgggacca caggcaccta ccacccagct aattttattt 22680 gttgtagaaa tgaggtctca ttttgctgcc caggctgttc ttgaactctt gggctcaagc 22740 gatcctcctg caacatcttc ccaaagtgct gggatcactc ttccatttaa catgctatct 22800 caacgtcaag ataaacttta aaatctttag ataataggct ggcattttac ttaaacgatc 22860 tttacttctt cagaactgcc attccctata aatatctggt tcttcaacca catcaaacca 22920 cttgtgatct caaaaagcct cagcgtacac tgtcctttct gtcattctaa ttcctcctca 22980 tccttcaaaa tcaactcaag gaccagatcc agggagaagc ttagtggtgc ccacccgaac 23040 cggccccctc cttcgagttg tgctgccatt cgggcccacc tcttcacaca gggttgtcag 23100 accagaccag ctcatgcgtt caccgccctt gcagggatgg gatgcagctg tgcacctctc 23160 agtgccgaca cctggagagt ctcacgaaat gttgacaaca tggcctgttt ccatttcttg 23220 ttcactagga cttctcattt actaacacac agaatttcct gtagtatgtc cacttaatca 23280 gttcaagcct aataattcct tgatttgggt atagtgcttt gcatttatat actgatggtc 23340 cccaacttac gatggttcga tttatgattt ttcaacttca tggtgatgtg aaagtgatac 23400 acattctata gaaaccacac tttcaatttt gaattttggt ctttttccag gctaccatac 23460 tctaaagata gagccacaga tcccagtcag ccatgtgatt atgagggtaa gcgaccaata 23520 ctctacagtg tattgtattg ccagatggtt ttgcccaact agcctaatgt aagtattcta 23580 aacatgttta aggtaggcca ggctaagctg tgttgctcat tcagtaggtt aggtatatta 23640 aatgcatttt caacttatga tattttcaat ttacaatgag tttatcagga tgtaactcta 23700 ctataagtca aggatcatct tgtatagcac ttttaattta tagagtccct tcaaatgttt 23760 gtttgtattt tatttccact gcatccctgt gaggatacca taagttatac agctaacaaa 23820 acagttagtt ttcctgtgca aagtgatggc ttcatcttgt ggcagattac ctggaatact 23880 gtggccaagg catcttagtt ctactgtctt tatatatcta gtacagttat atttttatgg 23940 cagctctgat ttcttctttg gcccaagggt tattaagaga gggaaaaaat ttaatttctt 24000 aacagatata tatatctatg tcaagtcata tatttaattc aaacccttaa tattcctagg 24060 taatttttgt ctactttctc tgtcaaagat tgaaagatac agggttttaa gtttccaact 24120 gtaattgtag ttttggtaat tgttttatta ctaacaggta ttgctctgta tattttgatg 24180 ttctgttatt caatacataa gaattcatta cagttgaatc atcatgtata gtataattta 24240 ccaatgtaaa ataacctttt tatcaaactg agtattcacc ttataatgtc ctctgtcaga 24300 ggattataat accacttaaa accttttaaa aaatattttg ttcctgataa ttttagcttt 24360 gagtggtttt cttataacaa ttctagagat gcgtttttat tttttaacca agatttaaag 24420 ctttgtgatt tagtaagagt ctaaaccatt cacagttcat gcttttttgt caaatttcta 24480 ttatttagta ttttcctctc ttttatattt tcctgttatt ttccatttct attcttttgt 24540 tagactggaa attttttctt tgctttcttt tatcctagtg atttgaaatt tatgtaatat 24600 atactattct acaataccct ttatttgttt tcaatatttg aacctatatt tttcaacatt 24660 attaagaata aaatagtatt tgttgctatt ttgaaatgat agaccatgtt tttaaggcag 24720 gttggtggtt gttaaggcac cagtatcggc caggcacgat ggctcacacc tgtaatctca 24780 gcactttcgg aggccgaggt gggcagatcg tttgagccca gcactttggc cgatactgtg 24840 gtttactgta ttttgttcta gtttatttta tggaaaatgg gaattcagtg gttaagacaa 24900 ggattaaata gcagaagaaa gatgtgtaca tatgtacaga tgtatgtgtc ctttatatgt 24960 tttttagtac tcttgtctcc tttctggtcc tcatttaagg ttatctattt catgcagtaa 25020 atttttcttc acaattcatt tcatttagag agtgaatgct accttccaag tgggctttct 25080 ccagttttcc tttcagggac ttaaaggaga agtgatgtta acagttttat atttccattg 25140 cattttacag tgtgcagatg tcttcacata tatttcccca tttgagcttt acaaaagccc 25200 ttagtattat tctcattgtc tagattccaa aatcaggctt agaggagtta aatagttgtc 25260 caggatctca agatgcaaga cccacaatca tgaacagagg cagatgttca ggatggaggc 25320 aagctgaaac tcaaaaccaa atcattatga ctccaaattc aggagtcttt tagctgccac 25380 ctgcatgggc tcttggtgta gctgaccacc agagtttgta gagctgtcat tcaggtgtgc 25440 catggacttt cctgggacct ggcacaggag aaggactgag ttaatgtttg ctgattaaat 25500 atctgttaca ggctgggcgc ggtggctcac gaccgtaatc ccagcacttt gggaggccga 25560 gcagggagga tcacttgagc tcacaagttt gagaccagcc tgggcagcat ggcgaaaccc 25620 cgtctctaca aaaaatttga aaattagctg gccatggtga tgcatgcctg tagtcccagg 25680 tactcaggaa gctgaggtgg gaggatcaca tgagcccatg agattgaagc tgcagtgagc 25740 tgagatggtg ccactgcact ccagccttgg ccatagagcc agaccttatc tcaaaaaaaa 25800 aaaaaaaaag ttacaataat cttcccttca aagctggaag gcattattta cctgtctgtc 25860 cagcagatgg tgctacataa ccaagggaat ctgttgcttg cccttggtga agctattaaa 25920 gccaatacag atcttgagaa tttcaaaagc aaaaatcaat actggattat gagtgctcta 25980 ggaaaataaa gagataaatt ttcaatttac atacttatat atagttatac catatttgta 26040 aataaaaata tataaataat ttatcaaaat tcctttttaa cagcaacaac cacagtaaac 26100 ccacaggtta aaaactccac aacagtctat attaatcagt caatgcaaag tacattccaa 26160 ttccaagtta actgaaaata atcaacttaa tcatttggtt ggctctgagc agccttcact 26220 gcttgctctt gtgtcatgtt tctttctgtc ctcgattggc tatagactta cagacggctt 26280 ttgcagagga cagtgtactc atgtccatcc tttgcatcct ttgtgggagt tggctaggca 26340 gcactctccc tggggacact atgaactcct cttcttgagt gcagagatca cgtcttgttc 26400 atcttcatgc ccaatacctt gttccataaa tatgaatgga ttagaattct aaactcttaa 26460 ctctgcccca agacagttct gagaggtagt aagtcatata acacctgaag aggactgttc 26520 ttgtcctaat tacattaggt tataagatga caggtgaggg agccaaacca gggggcctgg 26580 aaattattca tacatctcta gatacagtat acaagttgtg tgtattatgt gtatttactc 26640 tgtaattgat tgcttgagat gaacccccaa acacactcgt gtttggatca ttattatcta 26700 cccttctcct taaataatct taatttccta tgatgcttga aagggaaaga ggggccaggt 26760 gtggtggttc acacctgtaa tcccagcact ttgggaggct gaggtgggag catcacctga 26820 ggtctggagt tcaagaccaa cctgaccaac atggtgaaac cctgtctcta ctaaaaataa 26880 aaaatcagct gggcatggta gcacatgcct gtaatcccag ctacttggga ggctgaagtg 26940 ggagaatcgc ttgaacctgg gagggggagg ttgcagtgag ccgagatcac tccattgcac 27000 tccagactgg gcaacaacag tgaaactccg tctcaaaaaa aaaaaaaaaa aaaaggcaga 27060 gtggggaaga gagctgcatg aaggagagat ttactaaata gtacttaatc ccaaaataat 27120 ttctataggt ttgaatatga tccctgaaat ttattatagg ttcaggtaag tattaatcac 27180 gggtattcag aactgtggtt taaaaaatgt atagaacatg tttccttccc cttgaaactt 27240 tttatcagct aattatagga attatattat acctgcaatc attaaagtcc agaatgagac 27300 agtacttggt aaagtgctga aatttataat aaatgcatta tagcaatcca gttaaggagg 27360 aagagccacc attattgaac atttgttaag tgtcagccat tgtactagat aaattttagt 27420 tattattttt atttaggcac caaaaaatcc atgggatagt tggttatccc catcttactg 27480 aagaggaaac tgaagctcag aaagtttaag caacttgcac aggtcacata gcaagtaagg 27540 agcatggcca ggaatcagac cctgatctcc tttggtctac taagcttgca aaggatcttc 27600 ccgcctcctt ccaagaccat tcaatattat cagtaaatgt ccatggcaag gatgtagttc 27660 gagttatagg gttccattca agatatgatt ggtaggtggg aagcagatat gtctgtgtca 27720 atcagtatcc tggaagaagg agatgatgaa ctcaagtggt gattaaggga agtttaatga 27780 agggactatt tacagagatg tggtggggtt aagagaacca acaaggggaa gtgatgcact 27840 caaaaagtta ctacctccag gctttagggg attgggggag ggagtggcac agtgtgaacc 27900 cagtgtggtt gtgagaaaag ggattccctc agcagccatg gccaaggtta gagtctccac 27960 tgccaaactg catccaggtg gtgagggaat ggagaatagg ggtggggtaa caaactctga 28020 cctcggtatc cccaaagggc aaaggattcc aggtggtaca gttcgtaaag attagcctca 28080 gggcacagaa cagggcagag aagaatggag aattgatctg gaggaaacaa acaatggctt 28140 gcccatgtta ttgcagggag agtaggctgg tgtgcacagc aggagggtgg ggagcccagc 28200 atatagctgt gttggggcct gtgcagatca gcctcactgg cagggaggat ctgagccgag 28260 aggtggtgga agatgaaatc gagtaggcat gttggtagtc ctaaatatca agtaaacgtt 28320 cctgatctta cattgatact caatagtaag ccaattttgt ttcccataag ccaatattaa 28380 tattacgtat ttcttttata agccagagat atagagagat accctagaag aatgataggg 28440 gaaaggaagg caagggtgag agaagacctt gtgtgaattt gtccaaaatg tttatccaca 28500 ggaacaatcc ctttgtgaag gctgctggta tgtgaatgtg tgccggttcc cttggggcgt 28560 tcatttggat ctttctgtgt tccagtgacc tacggcatga tgagctccaa tgtgtactac 28620 tacacccgga tgatgtcaca gctcttccta gacacccccg tgtccaaaac ggagaaaact 28680 aactttaaaa ctctgtcttc catggaagac ttctggaagg tatttgcaaa taactttgaa 28740 agtacctctc tatcacagaa aattgttcat ttggcttcat catttcaatg catgagtatc 28800 gacaggacct gctttgcatt taacactgtg tgagacgtaa gttatggtga gttgttagaa 28860 gttactgttc ctactctcaa agggggtaaa ctaacattga gaactttgcc tgtgccttgc 28920 actgtgctga gtgtttcata tcttacctta tttaatttct atagtctaac tctataaggt 28980 aagtactaag actatgccct agtttgttaa tgaggaaaat gagattcagg atgtttaaat 29040 gcgtatggtc acatggctag ggaacaagaa aaattgattt ttttctagcc tgacagctac 29100 ttcatcctag tttgtaattc attccatgag tcaagattca ataaatattt attgagaatc 29160 tcctagaatg taaggccaat gaagggcagt gtggttcttc tgtcttgctt cgccttttgt 29220 gttttgtctc tttgttgatg atggcatgta tccccagctc ttagaacagt gcttgattca 29280 aagtaagcac attctttcaa aggtctgctg ttggtggggc ttggtggctc acgcctgtaa 29340 tcccagcact ttgggaggcc aaggcaggag gattgcttta gcccaggatt ttgaaaccag 29400 ctgggcacaa catagtatga ctttgtctct ccaaaaaagt taaagaatta gcagggtgtg 29460 gtggtacaca cctgcagtcc cagctactca ggaggctgag gtgggagaat cacttgagcg 29520 attgcttgag gtcaaggctg cagtgagcca tggccatgct actgcattcc agctggggca 29580 acagagtgag accctttctc aaaaaaaatc ccccccaaaa aaaaacccaa aaacaaacaa 29640 aaaaggtctg ctgttgtgaa gttcaaccca atccagcccc ttcccaagtt gtcacaaatt 29700 ccaacgtagt taacagtata ccaatgagtg ataccacagg aaaaatatta aactgatctg 29760 agggatatgg ggcttggaat ctaagaaaat tggaagggaa attgaaaagg aaattattat 29820 ttctccttgg ggagatagtt tctaaaattc ttactacacc ctggggtcag agctgttgat 29880 tttaaggata gagacaactg agtcacagga aactattcat atataaaagt acctggcatc 29940 caaaaccaca cttgtataat atgaatcttt caccatctga gtagggcaaa tcagtctatc 30000 tctgttgatc atctgacaag gatagcacac tgagaaatag atctgtcttc cctacaggca 30060 tagctagttg tacaaactaa caagagactt ttgtatacac attccatgat gataaatgcc 30120 aatcactaaa gggacgagga gggattggag agttcaccat acagcaaaat agtccagaca 30180 ggtgaaaggt ctatcaaatg ccaggctggt aatcaaaact gtagcctttt ctctaaacaa 30240 agtttagaac catgattgtg tgggacatta ttttaataag ggaaagtgca gttaatcatg 30300 accccacctt tagtccaaga acaaaaatca gagctgccac gtattaagta cccactctgt 30360 gccaggtgca gtaactatgc aaaagatggg ttttccagat gcaagaacct tggttcagag 30420 gaccctgctc aaggcctcat agctaacaaa tgatggggca agatgctatc ccaaatctct 30480 ctgacaacaa aactcattct tatcactcta ctattttcat agagttgcca aatgcttggt 30540 tatgcaaacg atgcaggcag gggcaagaca gcggctgagc ttggaacttt ttcagagatg 30600 tttcctttgc ttttagttca cagaaggctc cttattggat gggctgtact ggaagatgca 30660 gcccagcaac cagactgaag ctgacaaccg aagtttcatc ttctatgaga acctgctgtt 30720 aggggttcca cgaatacggc aactccgagt cagaaatgga tcctgctcta tcccccagga 30780 cttgagagat gaaattaaag agtgctatga tgtctactct gtcagtagtg aagatagggc 30840 tccctttggg ccccgaaatg gaaccgcgta agtgtctgtg actcattgcc actcggtgat 30900 attcattcat ttattctctg aactcccacc attcattcat tcattccctg acaccttcac 30960 caaggcaaaa ataagttcag tgactcttca gtgcttatat ttaaaccttg gccaacttga 31020 cctttgactt cttaagtttt cactacttct tagccttctt ttagtttcta catgcatatt 31080 tttcagaaga ctaaatcgtt gaccatataa cccctcaaaa attaattatc tgagcgtttg 31140 aaaatttcat ttaagatgcc ctgggccctg tttttacagg tgcagtaaca tcatccacta 31200 agttatttaa cacaagtttt ctggttcagg aactcttttt ataggtcttg caaacaggtt 31260 tttgttcaga atggagttat ttaatgtgta agcttgtgag gcaatttttt gttaggttta 31320 aagcccattt tgttcaaatg tttgagattt taggtatata tttgtacacg tgcatattta 31380 caggggcttt ttgtacactt tggtactcct acttcaaaca tcttgtgtat taagggaggt 31440 cacttactat tttagaagta ttgtagttat tataaagaaa caagaagacc tccaaggccg 31500 tttcagggtg ggcctttgcg gttgctgtcc ctgggtacgt cactggtcgg agtcatcttc 31560 taagctttgc tcagctaatt ctgtcggttc atctaggttc ttttcttgga aactgagttg 31620 cccagaatcc acatttgtta ctatacaatg ggcaatcacc ttttcaatta gtatattctt 31680 cttgtacctt ccagtataca ctctatttaa taccagaacc cataagaaac aaatttagta 31740 aaaatccagg ttgggcacag tttctcatgc ctgtaatccc agcactttgg aaagccaagg 31800 cggacagatc acttgaggtc aggagttcaa gaccagccta gccaacatgg tgaaaccctg 31860 actctactaa aaatacaaaa attagctggg tgtggtgaca tgtgcctata gtcacagcta 31920 ttcgggaggc tgaggcagga gaattgcttg agcccgagtg gtgggggttg cagtgagctg 31980 aggtctcatc attgcactcc agcctgggca acagagcaag actccccctc aaaaaaaaaa 32040 aaaaacaaat ttagtgaaaa tccagagctt tagaacaaag gaactaaata gtctcaaagg 32100 acattatcat ccaagttatg atagtgattt cgctttcttt aaaaaaaaaa ttattacaga 32160 tagagtttct tgatgttgcc caggctggcc tcaaactcct gggctcaagc agtcctccag 32220 cctcagcctc ccaagtagct gggactatga gaatatgcca ccatgcccag ctttattttg 32280 ctttctaatg tgcctttttg tagttcctgc aaagcataag catgccttca tctgtggtac 32340 cctttccaat attttattta tctcacatca ctaataagat aaatttatac agccactgct 32400 ctgtgccaga cattatttaa gaagttattt cacgcattat ctcatctgcc ttcacaaaac 32460 aactctaaaa taggtatcac ctccatttta tagatgaaaa aactgaggct cacttgccca 32520 aagtgtcaca gctaacaaat tggactgaac caagatttaa gcagcctgac tccaaaaccc 32580 atgtttcgcc tactaaacct cttccatatt aattcctcct ccatattaat tgcgtcgtta 32640 gggtggcttg tcgacgctct cagctcccca tcagtactca agcttcctga gggcagggat 32700 tctattttgt taactgctgt attctcaaag ccttgaacaa tgcctcatat gtaaagatac 32760 taata 32765 <210> 232 <211> 134 <212> DNA <213> Homo sapiens <400> 232 tgacctacgg catgatgagc tccaatgtgt actactacac ccggatgatg tcacagctct 60 tcctagacac ccccgtgtcc aaaacggaga aaactaactt taaaactctg tcttccatgg 120 aagacttctg gaag 134 <210> 233 <211> 1897 <212> DNA <213> Homo sapiens <400> 233 gtatttgcaa ataactttga aagtacctct ctatcacaga aaattgttca tttggcttca 60 tcatttcaat gcatgagtat cgacaggacc tgctttgcat ttaacactgt gtgagacgta 120 agttatggtg agttgttaga agttactgtt cctactctca aagggggtaa actaacattg 180 agaactttgc ctgtgccttg cactgtgctg agtgtttcat atcttacctt atttaatttc 240 tatagtctaa ctctataagg taagtactaa gactatgccc tagtttgtta atgaggaaaa 300 tgagattcag gatgtttaaa tgcgtatggt cacatggcta gggaacaaga aaaattgatt 360 tttttctagc ctgacagcta cttcatccta gtttgtaatt cattccatga gtcaagattc 420 aataaatatt tattgagaat ctcctagaat gtaaggccaa tgaagggcag tgtggttctt 480 ctgtcttgct tcgccttttg tgttttgtct ctttgttgat gatggcatgt atccccagct 540 cttagaacag tgcttgattc aaagtaagca cattctttca aaggtctgct gttggtgggg 600 cttggtggct cacgcctgta atcccagcac tttgggaggc caaggcagga ggattgcttt 660 agcccaggat tttgaaacca gctgggcaca acatagtatg actttgtctc tccaaaaaag 720 ttaaagaatt agcagggtgt ggtggtacac acctgcagtc ccagctactc aggaggctga 780 ggtgggagaa tcacttgagc gattgcttga ggtcaaggct gcagtgagcc atggccatgc 840 tactgcattc cagctggggc aacagagtga gaccctttct caaaaaaaat cccccccaaa 900 aaaaaaccca aaaacaaaca aaaaaggtct gctgttgtga agttcaaccc aatccagccc 960 cttcccaagt tgtcacaaat tccaacgtag ttaacagtat accaatgagt gataccacag 1020 gaaaaatatt aaactgatct gagggatatg gggcttggaa tctaagaaaa ttggaaggga 1080 aattgaaaag gaaattatta tttctccttg gggagatagt ttctaaaatt cttactacac 1140 cctggggtca gagctgttga ttttaaggat agagacaact gagtcacagg aaactattca 1200 tatataaaag tacctggcat ccaaaaccac acttgtataa tatgaatctt tcaccatctg 1260 agtagggcaa atcagtctat ctctgttgat catctgacaa ggatagcaca ctgagaaata 1320 gatctgtctt ccctacaggc atagctagtt gtacaaacta acaagagact tttgtataca 1380 cattccatga tgataaatgc caatcactaa agggacgagg agggattgga gagttcacca 1440 tacagcaaaa tagtccagac aggtgaaagg tctatcaaat gccaggctgg taatcaaaac 1500 tgtagccttt tctctaaaca aagtttagaa ccatgattgt gtgggacatt attttaataa 1560 gggaaagtgc agttaatcat gaccccacct ttagtccaag aacaaaaatc agagctgcca 1620 cgtattaagt acccactctg tgccaggtgc agtaactatg caaaagatgg gttttccaga 1680 tgcaagaacc ttggttcaga ggaccctgct caaggcctca tagctaacaa atgatggggc 1740 aagatgctat cccaaatctc tctgacaaca aaactcattc ttatcactct actattttca 1800 tagagttgcc aaatgcttgg ttatgcaaac gatgcaggca ggggcaagac agcggctgag 1860 cttggaactt tttcagagat gtttcctttg cttttag 1897 <210> 234 <211> 261 <212> DNA <213> Homo sapiens <400> 234 tgacctacgg catgatgagc tccaatgtgt actactacac ccggatgatg tcacagctct 60 tcctagacac ccccgtgtcc aaaacggaga aaactaactt taaaactctg tcttccatgg 120 aagacttctg gaaggtattt gcaaataact ttgaaagtac ctctctatca cagaaaattg 180 ttcatttggc ttcatcattt caatgcatga gtatcgacag gacctgcttt gcatttaaca 240 ctgtgtgaga cgtaagttat g 261 <210> 235 <211> 1770 <212> DNA <213> Homo sapiens <400> 235 gtgagttgtt agaagttact gttcctactc tcaaaggggg taaactaaca ttgagaactt 60 tgcctgtgcc ttgcactgtg ctgagtgttt catatcttac cttatttaat ttctatagtc 120 taactctata aggtaagtac taagactatg ccctagtttg ttaatgagga aaatgagatt 180 caggatgttt aaatgcgtat ggtcacatgg ctagggaaca agaaaaattg atttttttct 240 agcctgacag ctacttcatc ctagtttgta attcattcca tgagtcaaga ttcaataaat 300 atttattgag aatctcctag aatgtaaggc caatgaaggg cagtgtggtt cttctgtctt 360 gcttcgcctt ttgtgttttg tctctttgtt gatgatggca tgtatcccca gctcttagaa 420 cagtgcttga ttcaaagtaa gcacattctt tcaaaggtct gctgttggtg gggcttggtg 480 gctcacgcct gtaatcccag cactttggga ggccaaggca ggaggattgc tttagcccag 540 gattttgaaa ccagctgggc acaacatagt atgactttgt ctctccaaaa aagttaaaga 600 attagcaggg tgtggtggta cacacctgca gtcccagcta ctcaggaggc tgaggtggga 660 gaatcacttg agcgattgct tgaggtcaag gctgcagtga gccatggcca tgctactgca 720 ttccagctgg ggcaacagag tgagaccctt tctcaaaaaa aatccccccc aaaaaaaaac 780 ccaaaaacaa acaaaaaagg tctgctgttg tgaagttcaa cccaatccag ccccttccca 840 agttgtcaca aattccaacg tagttaacag tataccaatg agtgatacca caggaaaaat 900 attaaactga tctgagggat atggggcttg gaatctaaga aaattggaag ggaaattgaa 960 aaggaaatta ttatttctcc ttggggagat agtttctaaa attcttacta caccctgggg 1020 tcagagctgt tgattttaag gatagagaca actgagtcac aggaaactat tcatatataa 1080 aagtacctgg catccaaaac cacacttgta taatatgaat ctttcaccat ctgagtaggg 1140 caaatcagtc tatctctgtt gatcatctga caaggatagc acactgagaa atagatctgt 1200 cttccctaca ggcatagcta gttgtacaaa ctaacaagag acttttgtat acacattcca 1260 tgatgataaa tgccaatcac taaagggacg aggagggatt ggagagttca ccatacagca 1320 aaatagtcca gacaggtgaa aggtctatca aatgccaggc tggtaatcaa aactgtagcc 1380 ttttctctaa acaaagttta gaaccatgat tgtgtgggac attattttaa taagggaaag 1440 tgcagttaat catgacccca cctttagtcc aagaacaaaa atcagagctg ccacgtatta 1500 agtacccact ctgtgccagg tgcagtaact atgcaaaaga tgggttttcc agatgcaaga 1560 accttggttc agaggaccct gctcaaggcc tcatagctaa caaatgatgg ggcaagatgc 1620 tatcccaaat ctctctgaca acaaaactca ttcttatcac tctactattt tcatagagtt 1680 gccaaatgct tggttatgca aacgatgcag gcaggggcaa gacagcggct gagcttggaa 1740 ctttttcaga gatgtttcct ttgcttttag 1770 <210> 236 <211> 56 <212> DNA <213> Homo sapiens <400> 236 gctaccatac tctaaagata gagccacaga tcccagtcag ccatgtgatt atgagg 56 <210> 237 <211> 16648 <212> DNA <213> Homo sapiens <400> 237 gtaagtagaa tatttccttg cactaatggg aaagttttga aaagatttga cctatccaaa 60 tcataattaa aaggaagtgt gtatgcacca gaggggcaac tgggaagtta ccttcttacc 120 tttgttttta attctaatat ttttatttgg gcatttgttt attgactatc ttcctatggt 180 agaatgcaag ctttataaga gaagggacgt gatttgttct ctgctgtacc cccatttccc 240 aaaactgcag atggcaacag aaggctctga aaaatatata agaaagaatt tttctaattg 300 tgactaaatt gtgaccaaat gctaagtgac tgtggacttg cgtttaacac aggacgggag 360 aggcaaagag ttcaattcca atttagaatt tggtcaagtt ctcttctgca ctctggtaaa 420 cattaattaa aaatcagcat tatctgacca gccagttcat cgtcagtggt ggtgattttc 480 actatgagat acgcgtggca acttgccaga caccaagaaa ccaagttaga ggatttttgt 540 attagattcc ttaacaatga atacagtatc accattatta cagtatcatc attattgtca 600 tactattatt atatcagtta acataaagtc tgcataagaa ttgtttccag aaaaatgact 660 ttccaaattt aactttcagg aaatacaaat aatgctacta atattgcttt tattggcgta 720 tacatgtaat atccccttct tttggatttg gatatgttgt gtcattgcct cattttaatt 780 cattatttct tctcaatctt taataattgc tggactttta ctccacaaga aacttgctat 840 aggcccatct ctttcgtctt ctttccttct ttcagttcgt cttcccatcc tctggtaggg 900 ggaggggagg gatgcctgag cgagagacta gctgtaggaa ccatttgtct caaagtccag 960 aaagccacag gtgatggatt tgtcctctga atcaaagggc gttcgatgat ggatttctgt 1020 catgtctcat ctaaagtctt cacgagaaca gatgaggaag cagttttatg accccagagc 1080 ctcctaccaa actcctctga gaaaaggttt cctttttttt tttttttttt aaattagaga 1140 cagagtcttg atctgtttca caggccggag tgcagtggca caatcatagc tcactgcagc 1200 ctcgagctcc taggcttcag tgatcctccc acctcagtca cccacgtagc tgggactaca 1260 gctgcacacc accatgccca gctaactttt aaaacatttt tgtagaggtg gggtctcact 1320 ttgctgccta tactggtctc cagctcctag cttcaagtga tcctcctgcc ttggaagttc 1380 tgggattata ggcatgagcc actgcaccca gcctggatgt gatattttta tgttttaaat 1440 tgttagagtt tagaaacttg agattgagtt tgctgcctgc attaaaatga tgcttaaaca 1500 ttaaactgca gtggccttaa atattaacaa gttgattaga attactaagt tcttttcaag 1560 ctttacatat acagacaaat ttcttatgca aaatagaagg taacccctgt acgtaagtct 1620 agaatttcag cagtccccaa aactgactga gcattagaat cactctgatt ttaaaataca 1680 tatgtggttt tccgagatct actaacagag cctccataat gtagcctaga gaaacgagtt 1740 ttcagatgta gtgataaatt tggaaggtaa gtcagagaag taagctgaag acagagtttt 1800 aggaaatatg cctaaagtca cataatgaat tggttttctt gtttatttga gaatattgtc 1860 gctttttgtt ctttttcatg caaatcacat tttatttctt atgtgagtag ctatatattt 1920 aaaaattttg tttttggaat attgtagaat ctctacttaa gaaagtatct tagcagtcat 1980 atggtctgac ctcactgaat gctaaattct ctttaaaaca tccgtctcag atggttactc 2040 atactgcctc tgattgaaca agagtcccag gttaagggac ttacttcttt gaaatcgttc 2100 atttcatttt tctacagcta tgttagaaag ttcgtcctta gcagtgaagc cagagtctat 2160 ctcttataac ttctacccag ttgcaccctc caagcctacc tataccaagt atcttttttc 2220 cacgttgctt ttccaattca gctcttcgca agtttggaga caaataccta atctcctcta 2280 agccttctcc aggttaagcc tttccagttc atccagctgt tgattatgtg attggagaca 2340 caagtttgag taactcccat gatggaaagt ccctctggtg aatgttctgt tcatcagagt 2400 ccctaagaaa gcacatgagc ctcaccatgg tgagtggggc catgagattc ctaaaccaga 2460 cactacactg tggcttgtgc aacctaccat ggccagactc atgaggctgt ttcatcatat 2520 aaataattcc ttagtctctt caccaaaaac tgtgaagcac tgtgtccccc agctgtatgt 2580 gagctagcct gggaccatag tggaggactc ctctttcaac cctgttaaat ttcatcttgt 2640 taggatctgc ccatttttcc attctgttga aattatcttg gaactggatt cattcatctc 2700 acatcagcta ctccccgaag cctcacagta tcagcagagt tattatctct atccatatcc 2760 ttgtaaatta ttaaactaaa aaagattggt ctaagaacat cagtccatta atcaaggctc 2820 tttggttgga gttcacttca ttatattatc atccagctca gagtgttcat aaacaagatg 2880 ataggaaaga cttttccaaa tgcctgtctg agtaattccc ccattcctgt gatctgtgag 2940 ctgttgacca gattaaaaag gaagtgagaa taaccaggca agatttactc ctagcaaaac 3000 cttactggct tctagtgact gagtcctttc cctattgctt accagctatc tttttaatta 3060 ctagttttaa aatcttgcca gcaatgtcaa tatcaaatga ccaagaatat caaactcatt 3120 actctgtatg taaatgagat agtgtactta cccctatggc ttaagtatta ggctgttctt 3180 gcattgccct aaatacctga gactgggtaa tttataaaaa aagaggtttg gccaggcact 3240 gtggatcagg cctgtaatct cagcactttg tcaggctgaa gcaggtgtaa tggtgagcca 3300 agagttcaaa cttagcctgg acaacaaggt gaaaccccct ctctgcaaaa aatacaaaaa 3360 ttatctgggc atggtggcat gcacctgtag tcccagccac ccaggaggct gaggtgggaa 3420 aattgtttga agctgggagt cagtgattgc agtgagccat gattgcaaca ctgcactcca 3480 tccagcctgg gcgacagagc aagaccctgt ctcaaaaaat aaataaatga ataaataaat 3540 aaaataaata aataaataga aaagaaaaag aaagaaaaga gatttatttg cctcatggtt 3600 ctgcaggctg taagggaagc atagctccag catctgcttc tggggaggcc tcaggaagct 3660 gttactcatg gcagaaggtg aagcaggagc ttgcacatca tgtggcaaaa gcaggagcaa 3720 gagagagaga atggggcagg gaagaagccc cacactttta aatgaccaga tcgcatgaga 3780 aatcactcgt tacctcaagg acagtaccaa gaggatggta ctaaattcct gagaaatcca 3840 cccccatgat ctgatcacct cgtaccaggc cccgccttca gcattgggga ttatgtttca 3900 acatgagatt tggatgggga caacatccaa actatatcac cttgcatagt aggtagggtt 3960 ttaaaaagca gtttggcaca gtaagaaaag tacagatttt ttttgcatca gacagacctg 4020 agttaaaatc ccagcttcac tgctaacatg ctaggtaaat gtgggcaagt taattaacat 4080 ttctaagcct ttgtttcctc actggtaaaa caagtatttg gaaatatcat tgtgaagatt 4140 agaaataata catgaaaaga tcctaggatg ctgtctgtca tacagtagta gtagtaagaa 4200 gttattcttg ccaaagattg ttgagaatgg cagaattatc tcagttctaa gagctatagt 4260 ttctaattat ttgagcctag actcagattc atttggagca gctaactgct caccaagagc 4320 ttattttcca tcttaccaat gaggttatgt gccctgtgtt tttaaaatca gtctacttaa 4380 ccaagagaac agaaatgaca tgagaattaa gtaatctcac tttctctgtt atttaggatt 4440 tattcctact caaaacctga gagttgctat gaattcacca ttaaagcact tattaatata 4500 catgggttac tgttataaat agcaatagta ttgctattgt gtgagttagg tgttgaagtt 4560 caagaaagga ataaagaata tttagaagat ctttgaaaac agtgtctggg tacggtggct 4620 catgcctgta atctcagcac tttgggaggc cgaggcaggc agatcacttg aggtcacgag 4680 ttcaagacca gcctgggcaa cttggcgaga cctcgtctct acaagatata caaaaattag 4740 ccgggtatgt tggcatgcac ctgtaatccc agctacttag gaggctgaag cacaagaatc 4800 acttgaacct gggaagcaga ggttgcagtg agccaagatt gtaccactgc actccagcct 4860 gggcaataga gcaacactct gtctcgaaaa aaaaaaaaaa aaaaaaaaaa agaaagaaag 4920 aaggaaggaa ggaaagaaaa aaaaaggaaa aaatgcaagg aaggtatttg gtgaatctat 4980 aataataaaa atgtatttgt catttccttt ttctgtgctc tcattctata aaattgagta 5040 aaaaatctat atatagttta aacacattaa tagaaatcac aaaagttagc tgagtcaaca 5100 ttgtagaaac ataatatttc tgtatgtcaa agaaatagac aacattaaaa agcagaaagc 5160 aattacaaag aatgattata agaaacatca caaagggtta atattttaac acatttgaaa 5220 ctcaaaaatc actgagaaaa gcagtagact tccataaata ttttatagag tagaaaaaat 5280 aggccaagca cagtggctca tgcctgtaat tccagcactt tgggaggccg aggagggtgg 5340 atcacgaggt caggagttca agaccagccc ggccaagatg gtgaaacccc atctctacta 5400 aaaatacaaa aactagccag gcgtggtggc aggtgcctgt aatcccagct acttgggagg 5460 ctgaggcagg gaattgctta aacccttaaa cccgggaggt ggaggttgca gtgagccaag 5520 ttcgcaccac tgcattccag cctgggcgac agaacgagac tctgtctcag aaaaagaaaa 5580 gaaaagaata gaaaaagaat ccatgggcag gcacagtggc tcatgcttat aatcccagta 5640 ctctaggaag ccaaggtgag aggatcaatt gaggccagga gttcaaggcc agcctgggca 5700 acatagcaag actttgtctc tattaaaaat tttaaaatta gccaggcatg gtgacgcaca 5760 cctgtagtcc caattacttg ggagcctgag gcaggagaac tgcttgaggc tgcagtgagc 5820 tatgattaga ccactgcact ccagcctgag ctacacagtg agaccttgtg tcaaaaaagt 5880 aaaaaaataa aaattagcca ggcatggtgg cacatgcctg tagtcccagc tactcaggag 5940 gctgaggcaa gaggatgact tgagtctgga agatggagac tgcagtgagc tgtggtcatg 6000 ccactgcact ccagcctggg tgacagagca agaccctgtc tcaaaaaaaa aaaaaagaaa 6060 agaaaagaaa aataaataaa atttattcaa atacaaaagt gatgtggttt gactctgtgt 6120 tgccacccag atctcatctc caattgtaat ccccgtgtat tgacggaggt tcctggtagg 6180 agatgattgg atcatgggga tggtttcccc tctgctgttc tcatgatagt gagtgagttc 6240 tcatgaaatc tggttgtttg gtaggtgtct gtcacttacc ccttcttttt ctctctcctg 6300 ctgccttgtg aagaaggtac ttccttctcc tttgccttcc accatgatta taagtttcct 6360 gaggccttcc cagccatttg gaactgtaag tcaattaaac ctctttcctt tataaattac 6420 cgagtctcag gcagtttttt atagaagtgt gaaaatggtc taatacagag acttggtacc 6480 aggagtgggg tactgctata aaaaataacc tgaagatatg gaagcgactc tggaactggg 6540 taacaggcag caattggaac agtttggagg gctcagaaga agacaggaag atgtgggaaa 6600 gtttggaatt tcctagagac ttgttgaatg gctttgacca atacactgat agtgatatgg 6660 acaatgaagt ccaggctgag atggtctcag gtggagatga ggaacttatt gggaactgga 6720 gtaaacgtca ctcttacatg ttttagcgaa gagactggca gcatttttcc cctgccctag 6780 agatctgtgg aactttgaac ttgagagaca tgatttagag tatctggcag aagatatttc 6840 taagcaccaa agcattcgag aggtgacctg gcttttcctg aaagcataca gttatatgtg 6900 ctcacaaaga gatggtttga aattggaact tatgtttaaa ggggaagcag agtgcaacaa 6960 aagtttaggg agtttgcagc ctgaccatgt ggtagaaaag aaaaacccat tttctgggga 7020 gaaattcaag ctggctggag aaatttgcat aagtaacgag gagctgaatg tgagttgcca 7080 agacaatggg gtaaatgtct ccagggcgtt tcagaaaatc ttcagggcag accctcacaa 7140 cacaagcctg gaggcctaga agggaaaaat ggtgtgagcc aggcccaggc ccaggcccca 7200 gctgttctgt gcagccttgg gacatggcac cctgtgttcc agccactcca gctccagctg 7260 tggttaaaag gagccaaggt acagctggac cattgcttca gagggtacaa atcccaagca 7320 ttagcagctt ccatgtggtg ttgggtcttt gggtgcacag aagacaaaag ttgagctttg 7380 gaagccgctg cctagatttc agaggatgta tggaaacacc tcgatgtcca ggcagaagtc 7440 tgctgcaggg gcagagcctt atggagaacc tctgctaggg caatgcaggg gggaaatgtg 7500 gggttggagc tcccacacag agtccccact ggggcactgc ctcatggagc tgtgagaaaa 7560 ggaccaccat cctccagact ccagaatggt agatccacca acagattgca ctctgcgctt 7620 agaaaagctg caggcactca atgccagcct gtgaaagcag ctgcaggggc tgtaccctgc 7680 agagccacag aggtggagct gtccaaggcc atgggagccc accccttgca ttagcatgga 7740 gacaggggat caaaggagat tttggagatc taagatttaa tgaatgccct gtcgagtttc 7800 agacttgaat ggggcctgtg acccctttgt tttggccaat ttctcctatt tggaatggga 7860 acatataccc aatgcctgta cccccattgt atcttggaag taactaactt gcttttgatt 7920 ttacagactc aggcagaagg gacttgcctt gtctcagatg agactttgga cttgaacttt 7980 tgagttaatg ttggaacgaa ttaagacatt ggggttctgt tgggaaggcg tatttggttt 8040 tgaaatgtga gaaggacatg agattttgga ggggccaggg gtagaatgat atggtttgac 8100 tctgtgtctc cacccaaatc tcatctccaa ttgtaatccc catgtgtcaa gggagggacc 8160 tgatgggagg tgactgaatc ataggggcag tttcccccat gctgtttgca tgatagtgag 8220 ggagttctca tgagatctgg ttttttggta agtgtctggg cttccccctt ttccctctct 8280 ctcctactgc cttgtgaaga aggtacttgc ttctcctttg ccttctgcca tgattgtaag 8340 tttcctgagg tctccccagc cattcagaac tgtgagtcaa ttaaacctct tcctgcctat 8400 tctcaggcag ttctttatag cagtatgaaa atggactact acagaaagtg tgtaacttta 8460 aactcagtag tatccaaaga agtaatgaaa atggagaaac gaacaacaaa atcatagtac 8520 aatatggtgt atgtactagg acaggaagag cccttttaag aagagatcta tgtatttcca 8580 tttgtttatc tctgaaagaa agcaactttg ccttgtattc tgaaaaagaa aggaatattt 8640 tattttactt gtaaaaatct tacaaggatg ctagtctaaa tatagttttc ctaatttgcc 8700 agagaatcca tgaagatcga gttgataaca agatcagtga agtaaaggtc agtgagttaa 8760 tctcacagca gctgcaggct aattccattt ccagtgaaaa acgtcttgat tgctcaccac 8820 atatcttttc accacaaaca gtttcagtct taagatcaca tgttgcaatc catgagaagt 8880 aactattaag ccttcaacta tgactggagg gctcctcgcc ctttctgata aattgactgg 8940 acaaaaactc aattttaaaa tgacaagaaa tagaagatgt ataaatgtac tttaaatgtg 9000 accaaaatgg gttgtgaaaa cacaagacac aatatccaaa aatgctggca acacagtaca 9060 ctgtagagta ttggttgttt atttaccctt gctattgtgt ggctgagctt actgccactg 9120 cccagcattg caagggcatc aaactgccta tcactagcct aggaaaagat caaaattcaa 9180 aattctaagt acagtttcta ctgaatgctt atcacttttg caccatttta aagtaaaaaa 9240 atcagtaagt tgaaccatca tatatccaag attgtctgta tataaatatt atacatcttt 9300 ctctcacttt taaaacaaaa taatactagc caatactacc attctcaaaa gcacttgtgt 9360 caacagcctt taccccttaa agattttcct cacaatttta aaattgttac ttactatttt 9420 ctttgaaatg ttgaccaaac ctggattaaa agatttgggg gttttagtga ctgtatttca 9480 caaactctct tattgattct gcagcctcac ttctgcctcc taaaaagccc tcaccaaggt 9540 cacgggggat ggctcttttc agcctcttcc tggcatttgg tccagtggca tttggcattc 9600 taggacttcc ctctttgtct ttgataactc cctctcttcc tgtgttcctc cttgctgtgt 9660 tcacttgctt cgctttcttc tttctgaagc atgtttacac agtgttttct ctgattgggc 9720 ctgtgacgtt ctttaggtca tcttttccac aaataatgct tcaactagta cttgcgtgcc 9780 agtgactcca cgtcccactc atgagctctg aacctagtac cagcttctgc tggacatcta 9840 caatgggatc tctcacaggc ctctctcatt ggtaacatgc cccagcctga actcatctcc 9900 cacccatcta tccagccatg ctctctagtt cacctgaaca cttgggtgtc atcctagatg 9960 ctttcccttc ccagtcttct gtgatcattc tgcctcatca gaggctctct aatctgtctt 10020 ctttcctata tcgctcttgt ccctatttta atcctaatca tctatttcct gacttattca 10080 ttccttaagt tggtcagtaa tttaattaaa aacagattta ggccctgacc ttaaatgtga 10140 taagtgatat gaaaggagat gactggggaa aaggatttcc ctcaaggaag gcctctgtga 10200 agcctgaagc aagaatgaaa acgagtcaga cgaagagaga attgtatgaa tgaaggctct 10260 gaggcaggaa aacactcaga tcattccaga atcacttaga agccaagtga agccagttcc 10320 tggagagcag atcatcaaat gaagatggaa aggtgaccag gggccagacc tgtagttttg 10380 gtgggccttg gtgagggatt tacagtagga caccccatgg tttaagtatg aaagtgacaa 10440 gattccttta agttttaaga ggcctcgaaa tatgaaccac agattagatg gaagctactc 10500 tccctgtgtc tggacttttt agaatttcca agagctgctg tttctggaac cagattaata 10560 caagtcagtc ttccatttat ttatttatgt atttatttga gacagggtct cactctgtca 10620 cccaggctgg ggtgcagtgg catgaacaca gctcactgca gcttgggggc tcaagagatc 10680 ctcctgcctc agcctcccat gtagttggga ccacaggcac ctaccaccca gctaatttta 10740 tttgttgtag aaatgaggtc tcattttgct gcccaggctg ttcttgaact cttgggctca 10800 agcgatcctc ctgcaacatc ttcccaaagt gctgggatca ctcttccatt taacatgcta 10860 tctcaacgtc aagataaact ttaaaatctt tagataatag gctggcattt tacttaaacg 10920 atctttactt cttcagaact gccattccct ataaatatct ggttcttcaa ccacatcaaa 10980 ccacttgtga tctcaaaaag cctcagcgta cactgtcctt tctgtcattc taattcctcc 11040 tcatccttca aaatcaactc aaggaccaga tccagggaga agcttagtgg tgcccacccg 11100 aaccggcccc ctccttcgag ttgtgctgcc attcgggccc acctcttcac acagggttgt 11160 cagaccagac cagctcatgc gttcaccgcc cttgcaggga tgggatgcag ctgtgcacct 11220 ctcagtgccg acacctggag agtctcacga aatgttgaca acatggcctg tttccatttc 11280 ttgttcacta ggacttctca tttactaaca cacagaattt cctgtagtat gtccacttaa 11340 tcagttcaag cctaataatt ccttgatttg ggtatagtgc tttgcattta tatactgatg 11400 gtccccaact tacgatggtt cgatttatga tttttcaact tcatggtgat gtgaaagtga 11460 tacacattct atagaaacca cactttcaat tttgaatttt ggtctttttc caggctacca 11520 tactctaaag atagagccac agatcccagt cagccatgtg attatgaggg taagcgacca 11580 atactctaca gtgtattgta ttgccagatg gttttgccca actagcctaa tgtaagtatt 11640 ctaaacatgt ttaaggtagg ccaggctaag ctgtgttgct cattcagtag gttaggtata 11700 ttaaatgcat tttcaactta tgatattttc aatttacaat gagtttatca ggatgtaact 11760 ctactataag tcaaggatca tcttgtatag cacttttaat ttatagagtc ccttcaaatg 11820 tttgtttgta ttttatttcc actgcatccc tgtgaggata ccataagtta tacagctaac 11880 aaaacagtta gttttcctgt gcaaagtgat ggcttcatct tgtggcagat tacctggaat 11940 actgtggcca aggcatctta gttctactgt ctttatatat ctagtacagt tatattttta 12000 tggcagctct gatttcttct ttggcccaag ggttattaag agagggaaaa aatttaattt 12060 cttaacagat atatatatct atgtcaagtc atatatttaa ttcaaaccct taatattcct 12120 aggtaatttt tgtctacttt ctctgtcaaa gattgaaaga tacagggttt taagtttcca 12180 actgtaattg tagttttggt aattgtttta ttactaacag gtattgctct gtatattttg 12240 atgttctgtt attcaataca taagaattca ttacagttga atcatcatgt atagtataat 12300 ttaccaatgt aaaataacct ttttatcaaa ctgagtattc accttataat gtcctctgtc 12360 agaggattat aataccactt aaaacctttt aaaaaatatt ttgttcctga taattttagc 12420 tttgagtggt tttcttataa caattctaga gatgcgtttt tattttttaa ccaagattta 12480 aagctttgtg atttagtaag agtctaaacc attcacagtt catgcttttt tgtcaaattt 12540 ctattattta gtattttcct ctcttttata ttttcctgtt attttccatt tctattcttt 12600 tgttagactg gaaatttttt ctttgctttc ttttatccta gtgatttgaa atttatgtaa 12660 tatatactat tctacaatac cctttatttg ttttcaatat ttgaacctat atttttcaac 12720 attattaaga ataaaatagt atttgttgct attttgaaat gatagaccat gtttttaagg 12780 caggttggtg gttgttaagg caccagtatc ggccaggcac gatggctcac acctgtaatc 12840 tcagcacttt cggaggccga ggtgggcaga tcgtttgagc ccagcacttt ggccgatact 12900 gtggtttact gtattttgtt ctagtttatt ttatggaaaa tgggaattca gtggttaaga 12960 caaggattaa atagcagaag aaagatgtgt acatatgtac agatgtatgt gtcctttata 13020 tgttttttag tactcttgtc tcctttctgg tcctcattta aggttatcta tttcatgcag 13080 taaatttttc ttcacaattc atttcattta gagagtgaat gctaccttcc aagtgggctt 13140 tctccagttt tcctttcagg gacttaaagg agaagtgatg ttaacagttt tatatttcca 13200 ttgcatttta cagtgtgcag atgtcttcac atatatttcc ccatttgagc tttacaaaag 13260 cccttagtat tattctcatt gtctagattc caaaatcagg cttagaggag ttaaatagtt 13320 gtccaggatc tcaagatgca agacccacaa tcatgaacag aggcagatgt tcaggatgga 13380 ggcaagctga aactcaaaac caaatcatta tgactccaaa ttcaggagtc ttttagctgc 13440 cacctgcatg ggctcttggt gtagctgacc accagagttt gtagagctgt cattcaggtg 13500 tgccatggac tttcctggga cctggcacag gagaaggact gagttaatgt ttgctgatta 13560 aatatctgtt acaggctggg cgcggtggct cacgaccgta atcccagcac tttgggaggc 13620 cgagcaggga ggatcacttg agctcacaag tttgagacca gcctgggcag catggcgaaa 13680 ccccgtctct acaaaaaatt tgaaaattag ctggccatgg tgatgcatgc ctgtagtccc 13740 aggtactcag gaagctgagg tgggaggatc acatgagccc atgagattga agctgcagtg 13800 agctgagatg gtgccactgc actccagcct tggccataga gccagacctt atctcaaaaa 13860 aaaaaaaaaa aagttacaat aatcttccct tcaaagctgg aaggcattat ttacctgtct 13920 gtccagcaga tggtgctaca taaccaaggg aatctgttgc ttgcccttgg tgaagctatt 13980 aaagccaata cagatcttga gaatttcaaa agcaaaaatc aatactggat tatgagtgct 14040 ctaggaaaat aaagagataa attttcaatt tacatactta tatatagtta taccatattt 14100 gtaaataaaa atatataaat aatttatcaa aattcctttt taacagcaac aaccacagta 14160 aacccacagg ttaaaaactc cacaacagtc tatattaatc agtcaatgca aagtacattc 14220 caattccaag ttaactgaaa ataatcaact taatcatttg gttggctctg agcagccttc 14280 actgcttgct cttgtgtcat gtttctttct gtcctcgatt ggctatagac ttacagacgg 14340 cttttgcaga ggacagtgta ctcatgtcca tcctttgcat cctttgtggg agttggctag 14400 gcagcactct ccctggggac actatgaact cctcttcttg agtgcagaga tcacgtcttg 14460 ttcatcttca tgcccaatac cttgttccat aaatatgaat ggattagaat tctaaactct 14520 taactctgcc ccaagacagt tctgagaggt agtaagtcat ataacacctg aagaggactg 14580 ttcttgtcct aattacatta ggttataaga tgacaggtga gggagccaaa ccagggggcc 14640 tggaaattat tcatacatct ctagatacag tatacaagtt gtgtgtatta tgtgtattta 14700 ctctgtaatt gattgcttga gatgaacccc caaacacact cgtgtttgga tcattattat 14760 ctacccttct ccttaaataa tcttaatttc ctatgatgct tgaaagggaa agaggggcca 14820 ggtgtggtgg ttcacacctg taatcccagc actttgggag gctgaggtgg gagcatcacc 14880 tgaggtctgg agttcaagac caacctgacc aacatggtga aaccctgtct ctactaaaaa 14940 taaaaaatca gctgggcatg gtagcacatg cctgtaatcc cagctacttg ggaggctgaa 15000 gtgggagaat cgcttgaacc tgggaggggg aggttgcagt gagccgagat cactccattg 15060 cactccagac tgggcaacaa cagtgaaact ccgtctcaaa aaaaaaaaaa aaaaaaaggc 15120 agagtgggga agagagctgc atgaaggaga gatttactaa atagtactta atcccaaaat 15180 aatttctata ggtttgaata tgatccctga aatttattat aggttcaggt aagtattaat 15240 cacgggtatt cagaactgtg gtttaaaaaa tgtatagaac atgtttcctt ccccttgaaa 15300 ctttttatca gctaattata ggaattatat tatacctgca atcattaaag tccagaatga 15360 gacagtactt ggtaaagtgc tgaaatttat aataaatgca ttatagcaat ccagttaagg 15420 aggaagagcc accattattg aacatttgtt aagtgtcagc cattgtacta gataaatttt 15480 agttattatt tttatttagg caccaaaaaa tccatgggat agttggttat ccccatctta 15540 ctgaagagga aactgaagct cagaaagttt aagcaacttg cacaggtcac atagcaagta 15600 aggagcatgg ccaggaatca gaccctgatc tcctttggtc tactaagctt gcaaaggatc 15660 ttcccgcctc cttccaagac cattcaatat tatcagtaaa tgtccatggc aaggatgtag 15720 ttcgagttat agggttccat tcaagatatg attggtaggt gggaagcaga tatgtctgtg 15780 tcaatcagta tcctggaaga aggagatgat gaactcaagt ggtgattaag ggaagtttaa 15840 tgaagggact atttacagag atgtggtggg gttaagagaa ccaacaaggg gaagtgatgc 15900 actcaaaaag ttactacctc caggctttag gggattgggg gagggagtgg cacagtgtga 15960 acccagtgtg gttgtgagaa aagggattcc ctcagcagcc atggccaagg ttagagtctc 16020 cactgccaaa ctgcatccag gtggtgaggg aatggagaat aggggtgggg taacaaactc 16080 tgacctcggt atccccaaag ggcaaaggat tccaggtggt acagttcgta aagattagcc 16140 tcagggcaca gaacagggca gagaagaatg gagaattgat ctggaggaaa caaacaatgg 16200 cttgcccatg ttattgcagg gagagtaggc tggtgtgcac agcaggaggg tggggagccc 16260 agcatatagc tgtgttgggg cctgtgcaga tcagcctcac tggcagggag gatctgagcc 16320 gagaggtggt ggaagatgaa atcgagtagg catgttggta gtcctaaata tcaagtaaac 16380 gttcctgatc ttacattgat actcaatagt aagccaattt tgtttcccat aagccaatat 16440 taatattacg tatttctttt ataagccaga gatatagaga gataccctag aagaatgata 16500 ggggaaagga aggcaagggt gagagaagac cttgtgtgaa tttgtccaaa atgtttatcc 16560 acaggaacaa tccctttgtg aaggctgctg gtatgtgaat gtgtgccggt tcccttgggg 16620 cgttcatttg gatctttctg tgttccag 16648 <210> 238 <211> 19640 <212> DNA <213> Homo sapiens <400> 238 atgtcttctc tctcttacag ctcttcaaat tcatcaattt taacaggacc atgagccagc 60 tctcgacaac catgtctcga tgtgccaaag acctgtttgg ctttgctatt atgttcttca 120 ttattttcct agcgtatgct cagttggcat accttgtctt tggcactcag gtcgatgact 180 tcagtacttt ccaagagtgt atgtaagtat atatgaaatt aagaagaaaa atttaatcag 240 agttgtcact gcttctcaag aataaatctt catatgaggt tgctatatga ccaccaatta 300 tttaaaacca gttattttaa gtaagaatta attacctttt cccaaaacat tgatctaccc 360 atgcaaagaa gacaatgcat cctgaaatgc tgatgcttaa gatagcagcc caaagtagta 420 aaatacagtt aacagacata ggaaaccaac actgttctga agactgagtt tttctttgca 480 ccaaatgcag atggtagctt ctagaaggct gtttgcctat attcttactc ctgttgaata 540 ttgttgccat atatttagaa cttcaagtta ttttctaagg aaaaaaacaa gatatttcta 600 atattctaag gtaaactcag accagtacaa gaattttcag tttttttttc caaagatccc 660 aaatgtgaaa taaaacaaca aaaagcagcc agtgtcagat ttctatgcca tttagaaagg 720 agttagttta aaaaggaatg gaagtaatag ggttttgtgc atagatatct cgaattaata 780 ttgctgttga taaaagtgat tttgctaaga cccagcactg acaacacttg gccactttga 840 tcccatttta agtacttgtc agaatattgg atctttgaac tcaaaccatt ttgggttttt 900 ggggtttttt tgttttgttt ttttttgttt tgttttgttt ttgaggcacg gtcttgctct 960 gttgcccagg ctggagtgca gtggtgcaat catagctcac tgcagccttg aactcctagg 1020 ctcaagcaat cctgctgcct cagcctgctg agtagctggg actacaagtg tatgccacca 1080 tgcctggcca atttttaact ttttttatga gaagggatct cactgtgtag cccagggtgg 1140 tattgaactc cagggcctca cactgtcctc tcacctcagc ttccaaaagt actgggatta 1200 caggcatgag ccaccacacc aggccctgtt gttttttttt taaagaaatt tttaacttta 1260 gaccgagggt gactgttgtc aaggtttagg gttaagatgt tttacctaga ttatgtgttg 1320 aaatgttata gccaattgct ttataagtta ttgaataata attgtatttt cttttttttt 1380 ttttttttga gatggagtct cgttccatcg cccaagctag agtgcagcgg tgtaatctca 1440 gctcactgca acctctgcct cccgggttca agcgattctc ctgcctcagc ctcccgaata 1500 gctgagatta tgggcgcacg ccaccaagcc cagctaattt ttgtattttt agtagagacg 1560 gggtttcact atattggcca ggctgttctc gaactcctga cctcgtgatc cgcccgcctc 1620 ggcctcccaa agtgctggga ttacagacgt gatccaccgt gcccagcttg tgttttcttt 1680 ttaaccaaat ggaaataacc tctgtagcat gaaagcattt tattattatt gcagaaggct 1740 ttaattgctg atacaagtag caagactttg taaatgggat tgacaatttt ctgttattcg 1800 gcagctacct atactgctaa aaggtccaaa aataatgaaa tcatctttaa gaaatgttgc 1860 atcaactagt ggacattctt tgtttttgta ttgtggtgtt ttgttttatt tttatagctt 1920 cactcaattc cgtatcattt tgggcgatat caactttgca gagattgagg aagctaatcg 1980 agttttggga ccaatttatt tcactacatt tgtgttcttt atgttcttca ttcttttggt 2040 atgtacattt ttatttatag tgaggttcaa tttaaacttc gtaaatcctt gtcttctctt 2100 ttctctcaca ctttatgtcc tatcaatttt aaataaagac ccaggaagta gaaaaaagtg 2160 tggatgttgg aaaacttatt ttccttttat taattcacag ttttgagact catatcaaat 2220 gtcttttctg tggtctttca ttgatccatg tatatgtgtc tattcaatgc aaaaaaaatt 2280 agatctcttc catggtcttt catttctctc tctatatatg tatctattcc atgcaaaaaa 2340 gaaattagat caagtacaaa tttataaaga tacctaaaat agtgctttgc ctaaaaagta 2400 gaatatgctt acatgctttt taaactcata tgtcagcact ttcgtagtca cttgctagca 2460 tgacttttct ctctttcttc ttttcttttt aaaaaataag aacggaaaag caagctagat 2520 ctaagatgtc gagtaatagt tgagtgaatc attgcatgtc aaaattagga tattctgttt 2580 taaattattt atatcccatt catctagaga ctgcctacag agaatattca aataattaag 2640 tttaaaacta aatgtaacaa tgaatggaaa ttgcattaaa attattttca aaaataattt 2700 ttttattctc ttgatttggt acaaatgaac atttttaatg tttttgccct aagtcaatta 2760 agttttttta aggtgttttg ttctttttct taacatttat atattcaatt gtctactgag 2820 aaggtgttaa gccagcttaa tttaggcaat atttttcatc taaacactaa cagtcatctt 2880 aagaacaatt ttcttaagaa aataacattt tttccatttc agtaaattgt gtaaagatcc 2940 cttgaggaag gttaagtgat cacattttca gtaattcagt gtaataactc taaagtcagt 3000 ccaggtatta ctggttaagt atatggtatt tattgattgg gtattagatg tactgtatta 3060 atttcctgtt taaaaaaaat tttttttccg gggagacaca gcctctggtg taaaacaaag 3120 gtgtgttccc tagctgtact ttaacaggac tgaaaaggtc aggaatatca ttcaagttca 3180 tatgtatctt gctgtatgca tggtttatgg ctcattttta aacttacacc tcttaagctt 3240 cttcttccta tcatatatta aaacaatgga gagaagaata agcctctgtt actctaccat 3300 tgatagtact tcggattcta gagtacctga atctctacta agaaggcaaa aaccaggaat 3360 tgagagtcct gcacctgacc cttcagttga tctcaggcca cctagttttc tccgtttatc 3420 aatctgccaa acaaggatgg atagagtcgt ggcaactgga aaggctcaaa tgtggaattg 3480 tttgaatgtg gtcctttagt aggcagccat cttaccagat ctagagtatt cagtcatctt 3540 accagatcag tcaccagaac atgaaaagaa gctcttagtt tctatcttta tactaaaatt 3600 gtttttttgt acgactgcac aaaaaagaat tgctctcctt gcacctccca gagatatagg 3660 tggatagata catacatacg tacatacata catacataca tacatacata catacataga 3720 cacatacata gatagaagtc tactttcaat acaaacctgt cttttaagga aatgacaagc 3780 tgagcatagg gttggccacc tttctgagcc gattgcctgg tattagttta ttgcccctgt 3840 ttagcaagaa ggcacagtgt taagaagtgg ctcagctgaa ccaggataac cccactcttc 3900 ccccacatca acaggaaaga catcctggtg cagatgtcca tctgataatt cagggaacct 3960 cgggagacag gatggagagg agggtgagct agcttcctct tcccacacct tcaagagcct 4020 ttctcaagca ctttctattt tttgaaatct ctttagaggt cccagacttt gatctgtttc 4080 aattaaggta ttggcaggca ttagttaaca gccacttgga agcaaaaata gaacattaga 4140 tccctgagtt ggaagagaga aggtagaagg tgttacttgg actgcaatta tctgcacttg 4200 gaattgagca tttagtcaaa aacttatatg tattctatat tctattctca tttctgctac 4260 agaattgtaa acaatattct tccttaatac agaaattcat agcccactaa aataagagcg 4320 ttctcatttg ttcatttctc aatcatttaa taagtattta ctaagccact atatccatat 4380 atatatatat atcatatata ctgtataata cacactgtag tgttttttgt ggattgtgta 4440 ctatgaggta gtatgttaga tactgccagt actggggtaa ggaaaacagc ctgattaggc 4500 ccttacgaag attcctcaga cttgtgggga aaacagacat tatcaaatag aaatacttgc 4560 aaaccacagt tatgtgttaa aaaggaaaaa caaagtaaaa aaaaagttgg tgggggggaa 4620 cctgatctcc tggatacagt gcttcgagaa agtttgttgt tggaaatgca aaccattact 4680 actgtggaag ggaaaggtca gaaaaatgaa ctcaccatta ctgaatagta atagtagcta 4740 tcaattaggt ggcacttacc tgcatcagga cctgtcctga gcactttaca tagattgtct 4800 cactaaccag cccaacaaat atgtaaggga gatactatta tttttcccat tttattaatg 4860 taaaacaatt aaataattct ttaaaattag acttagaaaa gtggagcaac aatcttagca 4920 gtgctaggac tgaaatccaa gtttgcttga ctccaaagtc tatctctctt ccagaaactt 4980 tttctttact atctgcctag taggcctgct gtattcctat ttgcaacagc cttttaaact 5040 ctttaaaaat gtgtcctgta aatttcatat atgattatac aaaaaaactt ggaataagca 5100 tacaattcta cttatctgtg ttaactgttg aaatttgaag agctttttgg aattctatac 5160 ccttcagtag tgtatgtaaa agtttctaaa tatagagaac atagataagc aaaaataata 5220 ttaaataaaa taatcgcacc attagtaggt aaatatacta atattttgtt gtattttatt 5280 cttgtatgtt ttcacaaagt atatcataaa atttttcctg tggcatgact taacggagaa 5340 aataatcttc ccaaaacatg tggcagcaaa actgttaatt tattacatca ggctgggcac 5400 agtggctcac gcttgcaatc ccagcacttt gggaagccga ggcgggcaga tcacttgagg 5460 ccaggagttc gagaccagcc tggccaacgt ggtgaaacac tgtctctact aaaaatacaa 5520 cagttagcca ggtgtagtgg cacatgcctg taatcccagc tactcaggag gctgagactc 5580 aagaattgct tgaacccagg aggcagaggt tgcagtaagc tgaggtcgcg cccctgcact 5640 ccagcctggg caacacagtg agactctgtc tcaaaaaaaa aaattttttt ttaaataaat 5700 aaataataaa tttatgtctt cataaagcac tcagattagg aaaaaaagga taaacaaaaa 5760 ggcatgtgtc atttttttga ttgataattc caaattatgt ttcttccttt aatttttgcc 5820 ctcctttcat ttacaaacag aatatgtttt tggctatcat caatgatact tactctgaag 5880 tgaaatctga cttggcacag cagaaagctg aaatggaact ctcagatctt atcagaaagg 5940 taggaaaaac cttaattctc agaattcttc tgtttctgac ataaaatgag cattgtttca 6000 cccagatttt caaatcaaca ttgatccatt gaaattgttt gaaataaaga atacattgct 6060 atatttcagg aataatttaa atgttcccta tcttggagtc ttgatggata tactgctatc 6120 ttgaatttta attctgggaa tccttttatg ccctggaatt aaattctcaa caatcttttg 6180 acactttaag agctgagctg aaggttcatc accttcatta ttttgacatc tcctgtagct 6240 ggctctcact tcaggatcct gagttgagaa taaactagaa gggaagatta tataaaggga 6300 tttccacctc ttctgtctca attaccattt taaaaaaata aaaagtttta gaggaaaaca 6360 cttagtagtt caccctttac ccttgacctt ccacggcagt tttaaaataa gcaaaggaaa 6420 agattcatga attcaggcca tagcctgggg cctgagaact tttacttatg caccttctca 6480 ggaagggttt cattgttaaa tagaagggca ggacaggaaa gttgggcctc tttgttcttc 6540 tcaatgtaac ttctttattt ggtttaaagt ataaaatgta tacaacaaca aataaccaca 6600 tttaaaatac acagtttgtt tcccaacatc attttgctaa gtcatagtgg ctccttaact 6660 gtaatttttt tttttattag tccaagcctt aggattatgt tatctgtgat atatgttata 6720 atagaaaact taagcctctt aaaacaaagt ccttgggatg ggacctaaga ttcacattat 6780 cttgattccg cataacagtt gcttacattt tagcaaatct ccagtgtgta tgcaagcact 6840 cctcacttgg cacaattctg atacacacaa actttggtta ccccagtttt gttatgtaac 6900 accaccttca acaacacagt tcaaatttca gttatcatag tatattaact ctgagtaaca 6960 gcacaaagta caaactccac tgctagctct tcagtgtata gatcagttac ctgagtaaca 7020 gatgtgcagg ctgagcaggc tcactggtca gtcatgacac tattttcagt ctgttactaa 7080 ttggtcactg agcatctgct atccaattca caaacaaaga aagcatgtag tgttgcttcc 7140 ttgtgttcca gtaataagcc catgtgacat tttacaaaaa tggataattg aaaaagagaa 7200 tgggtgcagt ggctcacgca tgttgggagg ccaaggcgga tggatcacct gaggtcagga 7260 gttcgaaacc agcctggcca acatggtgaa accccatctc tactaaaaat acaaaattag 7320 ctgagtgtgg cgacagatgc ctgtaatccc agctactggg gaggctgagg caggagaatc 7380 gcttgcacct aggaggcgga ggttgcagtg agccgagatc gtgccattgc actccagcct 7440 gggtaacaag agcgaaactc cgtctcaaaa aaaaaaaaga aaagaaaaga aaagaaaaag 7500 agaatgggct agcaaagaaa tgaaaaatgg taacactgga agtgaaaatc aaaacagagt 7560 aatggattta tagaagaaat agctgagtga agaagaaata ggagtgttga cactgcgatc 7620 attcaagaga tccagatatg gagccagaag aacttagggc aggtctatca acttaaatga 7680 ggaaaatagc tgtgataaaa cagatgaaga tgtcttgagg aaatgatgcc tgcaaaaaac 7740 ttcacattaa gggaagtctt attagagata tttcacaata atgaaagtac aaaagaaaaa 7800 atgttggggc tggacatggt ggcttactcc tgtaatccca gcactttgag aggccaaggt 7860 gggtggatca cttgaggcca ggaagtcgag acaagcctga tcaacatgat gaaaccccgt 7920 ctctattaaa aatacaaaaa ttagccagac atgatggtgc acacctgtaa ttccagctac 7980 tcaagtggct gaggcacgag aattgcttga accagggagg cggaggttgc agtaagctga 8040 gattgcacca ctgcaatcca gccaggtgac agggtaagac tgtgtctcaa aaataaataa 8100 aagaaaaata tgttggaagc tcatccacat ttaagaagga atatgacaat tcactaatgc 8160 atagaaaaga agttcactcc acattgtaaa gtgtacagtg taatattata caatgaaaac 8220 aaggcaagtg ctgtttaaac tactctggat acatttttta caaagaaata aaacacttta 8280 gtttttaatg tttctaatgt tttacatttt agtgtattaa atcaatatta gttttcttct 8340 tttttaagct ccctatacat ttataactga cactaaggga gtgtttaatg ttttgattaa 8400 aagttgtaaa gatcacagaa caattgtaat tcttcccact gattattcag atcattttgc 8460 acaatttcag cttgcatggt cacttacagt gccgcactat gtgcaaagca aggtcaggtc 8520 taaagttcgc taatgaaaaa tcctcggcca ggggcagtgg ctcacccctg taatcctagc 8580 actttggaag gcgaggcagg cagatcgctt gagctcagga gttcaacacc agcctgggca 8640 acatggtgag accctgtctc tacaaaaaaa aaaaaatagc aaggcgtggt gactcacacc 8700 tgtagtccca gctacttgtt gggggctgag ttgggaaaat cacttgagct caggaggtcg 8760 aggctgcagt gagccagaat cacgccactg cccttctgcc tgggtgacag agtaagatcc 8820 tgtctcaaaa aaagggaaaa tcctcatcta catttcactg ggttttttgt ttgtttgttt 8880 gtttgtttat acacacttaa ggaaattact gtctagaaga tagataatat aaaaaataaa 8940 aatgcaattc atgattcggg tttcttggta ttcctaagaa ctgttgcaca gtactttatg 9000 ctctgaggca gacagctata gcatatatag taatttttgt ttctatcaca taaacttgaa 9060 tacacatatg agtaaaagac ctttagttct tcatgactta ctgaaagacc ctgacttttt 9120 ccatgtaact gttccacaag tgttttatgg aaaactggat acattaattc ttcattcatc 9180 cagcacgtac ttgttgaatg gccaatgtac accaggtttg tagtagttac tactgtgaat 9240 ggaaagtaaa acagatgcaa aaggagaata cactaaacca agtcttttat tttttctctc 9300 tctgataggg ctaccataaa gctttggtca aactaaaact gaaaaaaaat accgtggatg 9360 acatttcaga gagtctgcgg caaggaggag gcaagttaaa ctttgacgaa cttcgacaag 9420 atctcaaagg gtgagaatca tgcttcctga ggttctgaaa aattcctgct tctaaagata 9480 aattcctggt gataagagta tttctagccc aagggctcat acagatactt tttttttttt 9540 tttccagagg caggtatctt tctggaacat gttataagag gaaaacttgc ccccatttgg 9600 tgatttctcc tttcctcctg cattttgatg tctctgtgtt gagggtgaac tgggtacaag 9660 gaatgatttt tatctgtatc ctctctctaa tttcaggaag ggccatactg atgcagagat 9720 tgaggcaata ttcacaaagt acgaccaaga tggagaccaa gaactgaccg aacatgaaca 9780 tcagcagatg agagacgact tggagaaaga gagggtgggt ctggtttagg agaaccggat 9840 ttgatttggt acctacaaca ccacagatgt atcaaacact atagaagtag tgggttattg 9900 agtctcttgc ccattcccca ccacactctc tctctctctc agtcggttta tgtgttagta 9960 ccctgtttat tccagaaaga atatataaca caattatgta taaaaatggg tggttagcat 10020 gatataaaaa cgtcaaaatg aaaagcaagc aaaacaaaag taaaaataat ggattattaa 10080 tgaagcttaa aaatgcattc ataaaaacac atatgcttat taagattggg ctacaaattg 10140 ggccctaagc ttgctggtaa tcagcttgaa aagagaagcc tgattagctg cagagtccac 10200 aatgtccgtg agagtgaaga aaacaaaaaa tgacttacca agagatgtga aattattctg 10260 gttagttagt ggctatttaa attgttaact tttttttctt tttttttttt ttttgagatg 10320 gagtcttgct ctgcctccca ggctggagtg cagtggcaca atcgcgactc actgcaacct 10380 ccacctcccg ggttcaagcg attctcttgc ctcagcctcc caagtagcta ggactacagg 10440 cacatgccat catgcccggc taatttttgt atttgtagta gatatggggt ttcaccatgt 10500 tggtctcaaa ctcctgactg caagcaatct gcccaccttg gcctcccaaa gtggtgggat 10560 tacaggcagt agccaccgtg cctttcctaa attattaaca tttataataa aattaacagc 10620 cgccttccat ttgaatactt tttacaaaat agttaaaaat aaacataagt gggcttttat 10680 agtcagaaaa aaaaattcaa agctttacca ttaactttca aaaataaatg gttagacagc 10740 aacaacaaaa atctgtggta actgaggtac agagaacaca gatgaatgtt attacaaaag 10800 ccactttcct atgagaagtc taggacagtg gtttctaaat gccactccac agacagtgct 10860 agtaggtgac agacttctcc agtcacagtg aaatttaagc ataaagaaaa tgaggaaaat 10920 ttttacaagg ctctatttag acaaagttct tattctgaca ttacatcttt cctactttgg 10980 agctgttgaa tgtattatct tttatgaaaa gaaggcgatc caggttgagc atccctaacc 11040 caaatatgtg agtctgaaat gctccaaaac ctaaaacttc ttgagcacaa acatgatagt 11100 caaaggtcat gcttaaagga aatgctgtca ttggagcagt ttggattttg ggttttcaga 11160 ttagggatgc tgaaccagta agtataatgc aaacattcca aaatattttt gaaaatccca 11220 aatccaaaac acttctgatc ccaagtattt caaataaggg atactcaacc tgtaatatat 11280 ttcttcattt ctttatttat tttattatta ttttaagatg gctcatggcc cactgcagcc 11340 tcaaactcct aggctcaagt gatcttccga cctcaacctc ccaggtagct caggtagctg 11400 ggactgcagg catgcatcac catgcctggc taatttttta aaaaattttt tgtggaggca 11460 gagtctcacc ttgctgccca ggccagtctc aaactcctgg cttcaagcag tactcctgcc 11520 tcagcctccc aaagtattag gattacaggt gtgaccacta tgcctggccc atatttcttc 11580 atttagtttt ttctttgcct gctgtgtttt taatgttctt tcttgttcaa acaaaaagtt 11640 ggctattcct tgctgttagt taaatttgcc aatctatgaa actgaaaaat gcaggagtcc 11700 cagcctggtg ttaaatacaa agaaatccca ggtaaatggc atgcacccag ttcctgcttg 11760 cccaagtcct tggtgaggct tctgtggggt ctcagtgttc tgctcctcac tcagtgaccc 11820 cttgttcttc aggaggacct ggatttggat cacagttctt taccacgtcc catgagcagc 11880 cgaagtttcc ctcgaagcct ggatgactct gaggaggatg acgatgaaga tagcggacat 11940 agctccagaa ggaggggaag catttctagt ggcgtttctt acgaagagtt tcaagtgtaa 12000 gtataaagga attggcagaa tttgcgttga caagagtcca catgagacca ggcagttccc 12060 tcatctctct gaattcactc ctttccatta ctaatcatcc agcttttaaa aataacttat 12120 actggccaga cgcagtggct catgcctgta atcccaccac tttgggaggc caaagcaggc 12180 aggtcatgag gtcagaagtt cgagacgagc ctggccaaca tagtgaaacc ccatctctat 12240 taaaaataca aaaaattagc tgggcatggt ggtgggcacc tgtaatccta gctacttggg 12300 aggctgaggc aagagaattg cttgaacccg ggaggcggag gttacagaga gccgagatgg 12360 ctccactgca caccagcctg ggcgacagtg caagactctg tctcaaaaaa aaaaaaactt 12420 gtcaattggt gttttgtttc ttacataata tgtttactat aaaaattagc aaataagagc 12480 aaaagaaaac attaacattt cacatatttc taccaatgaa aaatgtttat taatatatca 12540 gtgtttgtgt ctctatttgc atgtgtttat caatgtttct atatattttt atggcctaac 12600 atatggttcg tcctgaagaa tgttccttgt gcatttgaga agaatgaata ttctgctgtt 12660 caagtgttct gtagatgttt gttaggtcta gtttgtttac agttttattc aggtctccca 12720 tttcctggtt gatcttagat gtgcctagat gtggtattca cgtttgaaag tggggtatta 12780 aagtctccaa gtattattag ttggagttca tcccttcaat tctgtaaggt tttgctttgt 12840 gtattttgga actctgttgt tgggtgcata catatttata actagtatat tttcctaata 12900 tattgaccct attttctctc tcaacttaat gaggctaaag aaaaaaaaga attgaccctg 12960 ttttcattac aagatgttat ccactttatc tctagtaaaa ttctttgttt taagtatttt 13020 ttgtttgata ttactgtaac cactccagct ttcttttggt tgctgtttgc atgataaatc 13080 tttttccatc cttttacttt aaacttattt atatctttca gtctgaagta tgtctctcct 13140 gtagacagca tataattgga tcttatcttt ttatccagtt tgacaatttc tgtttttgat 13200 tagattgctt aatccattca tttaatgtta tcattgatgt agttgatttc tgtctgctat 13260 tttatttttt gttttctagc ttactttttt ttgttcctct ttcactgctt tcttgtacat 13320 taagtgaata ttttcaagta taacatttaa atttttttaa tgatttttca ttttttttag 13380 tcaggagttg ctctaagact tagtttatac aattaagtta tgaaaaatta cttcagatat 13440 atattaactg aatccagtga gatatagaaa tcatttctat ttagcttttt tcctcttccc 13500 tctttttgtg ctatatattc atctatctat atgtatatat agtcatctac atatgttgca 13560 aatcacattg ttagaacaat gttacatttt tataacacac tgtgtaatat atagtatata 13620 attttatatc tcttaatgaa gctgagagaa gaggaagtat atatttataa atgtgtatat 13680 taacctactt ttttaccatt tctaattctc ttcttttgct cctctggatt caagttatca 13740 tctgtcgtca ttctctttct ccgatacagc tttgctactg cctacctcct attattgtca 13800 aatatattac atttctatta tagaccttca gatccaatta tgtacatatt tttacacaac 13860 tgctttttaa atcagttaag gaacaaaagg agaaatgtac atatatacta tattttatac 13920 ctacacagtt atctttacca gtgttctttg ccttttcatg tggattctga ttactatctg 13980 gagtcacttg ctttcagcat aaagaatttc ctttagtatt ttttgtaaag caggtttgct 14040 agcaatgaat tctttcattt tttgtttatc tgagaatgtt tttctttctc cttcatttcc 14100 tctggcttgt attgtttctg atgagaagac aggtgctaat tttactgtgg tccccttgta 14160 catgatgact caattttctc tcaccacttt caagattttt ttgcttttgt ctttcattat 14220 ttttactgtg atatgtctgg gtataaatct ctgagttcat cctacttaga aagtgttttt 14280 tctgcttctt tcactttctc ttctcctttg ggacccgcat tatgcatatg cttaggggta 14340 tcacatattt ctcttaggct ctgttcgtcg tcattttttt tccctctctg ttcctcagag 14400 tgcatagtct gtattgatgt atcttcaagt tcactgactt gttcttctgt cagcttgctt 14460 aaatctctgt tgagctcctc tagttattta tttatttatt tatttatttt atatatatat 14520 atatatatat atatatagag agagagagag agagagagag agaaagagag agagagagag 14580 acagggagac agggtctcac tccatcaccc aggctggagt acagtggtgt aatcatggct 14640 ctctacagcc tgaacacctg ggctcaaatg atcctcctgc ctcaacctcc caagtagcta 14700 ggactatggg cacatgctgc catgcctggc taatttttaa aaaaaaattt gtagagatgg 14760 catcttgtta tgttgcccag gttggtctca aactcccggc ctcaagtgat ccttccgcct 14820 cggcctccca aagtgctggg gtcacaggta tgagccaccg cacttagcct gaatttttta 14880 tttattatac ttttcaactc cagaatttct atttggttct ttttagcaat ctctgtctct 14940 ttattctgta tttgatgata tcctgtattt gatgagacaa tgtcatcata acttcctttt 15000 ttttttaaga gatagggtct ctctctgtca cccaggctag agtgcagtgg catgatccta 15060 gctcactgca gcctcgaact cctgaactca agcaatcctc ccacctcagc ctcctaagta 15120 cctgacacta caggcatgag ccactgtacc cagctaattt ttattttttg tagagatggg 15180 gtctaagttg cccaggctgg tctcaaactc ctgggctcaa gtgatcctcc ctgctcaggc 15240 tcccaaagtg ctgggattac aggcatgaac cactggaccc agcctccttt atttctttaa 15300 ccatggtggg gttttttatt atttgtttgt ttgttttaac ctgtttgaat atatttataa 15360 taggtacctt caggtctttg tctgctaagt ctgacatctg ggccctctca aagacagttt 15420 cagttgtctt tttttttttc ttcttgtgta tgggaacatt ttcctgtttt tttgttttgt 15480 tttttgttgt tttgttttgt tgttgttgtt gttgttaaag attggacatg ttagataata 15540 tattgtagga actctggcta gtgattccct ttcctcccca ggacttgttt ttatttctct 15600 ttgcttgttt actttttcat acagtctgtt tccccacagt gtctgcctct gactttattc 15660 cttagagggc gcagctgtgg ccatgtacgt agtcactctg ggaagacagt ggttttagca 15720 gcgtgctcat taactttctc tgacctcttt gttatacctc ctgcctctgt ggatattaga 15780 cccagttatt acatttcatt gtttactgat tggtctattg ttttccagaa tgccttggga 15840 tgtaatttgc tccacagtct gatccactta aattcaggcc tctttgcagg gctagtttta 15900 gaggccagtc tttttttttt tttttttttt tttttgagac agagtctcac tctgttgccc 15960 aggccggaat gtagtggtgc agtctcagct cactgcagcc tcaatctctc aggctcaagc 16020 aatcttccca cctcagcttc tcaagtagct aggactacag gtgcacgcca ccatgcctgg 16080 ttaatttttg cattttttat agagatgggg ttttaccatg ttgccccggc tggtctcaaa 16140 ctcctgagtt caagcaatcc acccacctca gcctcacaaa aggccgggat tacagatatg 16200 caccaccacg cctggcccct gaggccagtc tttaactgtc ttcttagctg tctctttccc 16260 tggttctctc tggtgaacta gctggtaatt tgtttatctc ataaggctac cagattcctt 16320 gtaaatgctt atccccacaa tctccattgt tttcaagagc atcgttagtc tttaatttcc 16380 tcacgcttca ttccaaataa agtccattca cttgagaaga gttctatatt cctatgacct 16440 gtgtctcccc atgagcaaaa ctgctactgc tttacagagc cagggacagt ggcccacctc 16500 tctgtggcat cctgctttat gaacaagtca ctgggctcag atggcagtct ctgattttct 16560 caccttgctt cttctggcat ggaaactcca ccctacaagt gggaactgag tggaagaaga 16620 gagccccatt ccccttagcc actcttaaca ggattagaac ctctgcaaca tgcatttaag 16680 aatgggaaca ggctgggcac agtggctcac gcctgtaatc ctagcacttt gggaggtcaa 16740 ggcaggagga ttgcttgagc caggagttca ggaccagcct gtgcaacatg gtgagaccct 16800 catctctaca agaaatagaa aaattaactg gtgggttgtg tatacctgta atcccagcta 16860 ctcgggagcc tgaagtggga ggattgcttg aacctggagg cagaggttgc agtgagtcaa 16920 gattacacca ttgcacgcca gcctgggcaa cagagtgaga ctctgtctca aaaaaaaaaa 16980 aaaaaaaaga gtaggaacat tgaggctggg catggtggct catgcctgta atcctagcac 17040 tatgggaggc caaggcagga gtatcacttg acgctaggag ttcaagacca acctgggtaa 17100 catagcgaga ctttgtctct attaaaaaaa aaaaaaaaaa aggtgtaaaa aacttttgta 17160 acaagagtgg gaaagccggg cacagtggct cacacctgta atcccagcac tttggaaggc 17220 caaggcaggc aggcggatca cctgaggtca ggagtttgag accagcctgg ccaacgtggt 17280 gaaaccccat ctctactaaa aaatagaaaa attatctggg catggtggtg cacacctgta 17340 gtcccagcta ctcgggaggc tgaggcagga gaatcacttg aacctacgag gcagaagttg 17400 cagtaagcca agatcacgcc actgcactcc agcctgggcg acagagcaag actctgtctc 17460 aaaaaaaaaa aaagagtgga aatgttagga tgagaaatgc tggcagcctg cccctccctg 17520 ggagatactg tagccctaga ctggaagttg ggggaggagg gagccctgtg ctcttagctg 17580 cacccatgtg aagttgtgct tctatcacat gagctgggga caggagagaa ggctcagatt 17640 atggcttcag tgccacagaa tctcttcata ctaaaattta gtagattttc ttgaataaat 17700 gctttttcat ttgctgtaca cccttaaaag tttctagaaa tttttaatat ttgagtttta 17760 aaaaataatt ttcaacagtt acagttattt cactaaagag agagtctaca gaaccctctt 17820 gccaccattg cagaggttgt ctttggctta cgagttttta aagtatttgt atacattttt 17880 taagttcaaa ataatagaat tgtaagtgaa catgctgttt tcatactgtt tttcaagctt 17940 tatttaatat attgtaaatc taattctatt ttattaaata gtctgccaca gtataatgtc 18000 tgatgtctcc ttagaatttt attgtatgga tgaacaatga ttatttaatt tcctaccaat 18060 tgttgggtgt tttttgtttg tttgtttgtt tttgagactg ggtctcactc tgtcacccag 18120 gctggagtgc aggagtgcgg tggaatgatc acggctcact gcagcctcaa catcccaagg 18180 ctcaggtgat ccttccacct cagcctcgca agtagctggg agtacaggca catgccacca 18240 tgcccaccta ttttttagag atgaagtttt gccatcctgc ccaggctggc tcgaactcct 18300 ggcctcaagc gatctgcaca cttccgcctc ccaaaatgcc aggattacag gcgtgagcca 18360 tcatgcccta cccccccatc aattgtttga tgtagccatt tttcaatgat ccgcgattaa 18420 gaagcagcac tcttttatag ccaaaaatta cacatatata aaattttcct ttagaaaatg 18480 ttctaaaaat ggaatgtcta actaaagggt taggcataca ttcttaagac ttctgatacg 18540 cgctgacttg caggaaagtt gtttcagtta acactcctac cagcggcatc cgagagttaa 18600 tctgtaaagc ttgagacaac ttagaaagtg tttcaaatga ttgtgttgct taagaaaaaa 18660 atcttagcac ttccttttga aaagccagtg gggctgaaaa gacaatgaca agcactttgt 18720 ccctctgtac tgtgttttcc ttgcagcctg gtgagacgag tggaccggat ggagcattcc 18780 atcggcagca tagtgtccaa gattgacgcc gtgatcgtga agctagagat tatggagcga 18840 gccaaactga agaggaggga ggtgctggga aggctgttgg atggggtggc cgaggtcagt 18900 agtcatgagc tgaaaacacc gctgctgagc atggtgttat taatgaaaat atatgttgct 18960 gacagttgta tttgaagtat tgaagaagag taaaaaaaat ttacgtttat agaaattcac 19020 aatgatgttt ccatttactc tcattttcag atttttttct ctgaaacaga aacactcttt 19080 ctataaaatc tcttgctata aaacatcaat gtagtcatat tgtctaaccc ttaggctgag 19140 atgtttatct ttctccataa ctacagataa aattataatc tggaggtgtt actttcttaa 19200 tactccatat gctaatggtc ctgccttcac tgcagggtag aattaagtga aaaattactc 19260 cagcaactct gagatttgct attatatgct gtaaatctcc agccttacca aactacagat 19320 tatttggtcc ctggacttcc taaggcattt ccttctactg cccccaacac cagtttcttt 19380 ttcccttttt aggatgaaag gctgggtcgt gacagtgaaa tccataggga acagatggaa 19440 cggctagtac gtgaagagtt ggaacgctgg gaatccgatg atgcagcttc ccagatcagt 19500 catggtttag gcacgccagt gggactaaat ggtcaacctc gccccagaag ctcccgccca 19560 tcttcctccc aatctacaga aggcatggaa ggtgcaggtg gaaatgggag ttctaatgtc 19620 cacgtatgat atgtgtgttt 19640 <210> 239 <211> 7321 <212> DNA <213> Homo sapiens <400> 239 gaatgatagg ggaaaggaag gcaagggtga gagaagacct tgtgtgaatt tgtccaaaat 60 gtttatccac aggaacaatc cctttgtgaa ggctgctggt atgtgaatgt gtgccggttc 120 ccttggggcg ttcatttgga tctttctgtg ttccagtgac ctacggcatg atgagctcca 180 atgtgtacta ctacacccgg atgatgtcac agctcttcct agacaccccc gtgtccaaaa 240 cggagaaaac taactttaaa actctgtctt ccatggaaga cttctggaag gtatttgcaa 300 ataactttga aagtacctct ctatcacaga aaattgttca tttggcttca tcatttcaat 360 gcatgagtat cgacaggacc tgctttgcat ttaacactgt gtgagacgta agttatggtg 420 agttgttaga agttactgtt cctactctca aagggggtaa actaacattg agaactttgc 480 ctgtgccttg cactgtgctg agtgtttcat atcttacctt atttaatttc tatagtctaa 540 ctctataagg taagtactaa gactatgccc tagtttgtta atgaggaaaa tgagattcag 600 gatgtttaaa tgcgtatggt cacatggcta gggaacaaga aaaattgatt tttttctagc 660 ctgacagcta cttcatccta gtttgtaatt cattccatga gtcaagattc aataaatatt 720 tattgagaat ctcctagaat gtaaggccaa tgaagggcag tgtggttctt ctgtcttgct 780 tcgccttttg tgttttgtct ctttgttgat gatggcatgt atccccagct cttagaacag 840 tgcttgattc aaagtaagca cattctttca aaggtctgct gttggtgggg cttggtggct 900 cacgcctgta atcccagcac tttgggaggc caaggcagga ggattgcttt agcccaggat 960 tttgaaacca gctgggcaca acatagtatg actttgtctc tccaaaaaag ttaaagaatt 1020 agcagggtgt ggtggtacac acctgcagtc ccagctactc aggaggctga ggtgggagaa 1080 tcacttgagc gattgcttga ggtcaaggct gcagtgagcc atggccatgc tactgcattc 1140 cagctggggc aacagagtga gaccctttct caaaaaaaat cccccccaaa aaaaaaccca 1200 aaaacaaaca aaaaaggtct gctgttgtga agttcaaccc aatccagccc cttcccaagt 1260 tgtcacaaat tccaacgtag ttaacagtat accaatgagt gataccacag gaaaaatatt 1320 aaactgatct gagggatatg gggcttggaa tctaagaaaa ttggaaggga aattgaaaag 1380 gaaattatta tttctccttg gggagatagt ttctaaaatt cttactacac cctggggtca 1440 gagctgttga ttttaaggat agagacaact gagtcacagg aaactattca tatataaaag 1500 tacctggcat ccaaaaccac acttgtataa tatgaatctt tcaccatctg agtagggcaa 1560 atcagtctat ctctgttgat catctgacaa ggatagcaca ctgagaaata gatctgtctt 1620 ccctacaggc atagctagtt gtacaaacta acaagagact tttgtataca cattccatga 1680 tgataaatgc caatcactaa agggacgagg agggattgga gagttcacca tacagcaaaa 1740 tagtccagac aggtgaaagg tctatcaaat gccaggctgg taatcaaaac tgtagccttt 1800 tctctaaaca aagtttagaa ccatgattgt gtgggacatt attttaataa gggaaagtgc 1860 agttaatcat gaccccacct ttagtccaag aacaaaaatc agagctgcca cgtattaagt 1920 acccactctg tgccaggtgc agtaactatg caaaagatgg gttttccaga tgcaagaacc 1980 ttggttcaga ggaccctgct caaggcctca tagctaacaa atgatggggc aagatgctat 2040 cccaaatctc tctgacaaca aaactcattc ttatcactct actattttca tagagttgcc 2100 aaatgcttgg ttatgcaaac gatgcaggca ggggcaagac agcggctgag cttggaactt 2160 tttcagagat gtttcctttg cttttagttc acagaaggct ccttattgga tgggctgtac 2220 tggaagatgc agcccagcaa ccagactgaa gctgacaacc gaagtttcat cttctatgag 2280 aacctgctgt taggggttcc acgaatacgg caactccgag tcagaaatgg atcctgctct 2340 atcccccagg acttgagaga tgaaattaaa gagtgctatg atgtctactc tgtcagtagt 2400 gaagataggg ctccctttgg gccccgaaat ggaaccgcgt aagtgtctgt gactcattgc 2460 cactcggtga tattcattca tttattctct gaactcccac cattcattca ttcattccct 2520 gacaccttca ccaaggcaaa aataagttca gtgactcttc agtgcttata tttaaacctt 2580 ggccaacttg acctttgact tcttaagttt tcactacttc ttagccttct tttagtttct 2640 acatgcatat ttttcagaag actaaatcgt tgaccatata acccctcaaa aattaattat 2700 ctgagcgttt gaaaatttca tttaagatgc cctgggccct gtttttacag gtgcagtaac 2760 atcatccact aagttattta acacaagttt tctggttcag gaactctttt tataggtctt 2820 gcaaacaggt ttttgttcag aatggagtta tttaatgtgt aagcttgtga ggcaattttt 2880 tgttaggttt aaagcccatt ttgttcaaat gtttgagatt ttaggtatat atttgtacac 2940 gtgcatattt acaggggctt tttgtacact ttggtactcc tacttcaaac atcttgtgta 3000 ttaagggagg tcacttacta ttttagaagt attgtagtta ttataaagaa acaagaagac 3060 ctccaaggcc gtttcagggt gggcctttgc ggttgctgtc cctgggtacg tcactggtcg 3120 gagtcatctt ctaagctttg ctcagctaat tctgtcggtt catctaggtt cttttcttgg 3180 aaactgagtt gcccagaatc cacatttgtt actatacaat gggcaatcac cttttcaatt 3240 agtatattct tcttgtacct tccagtatac actctattta ataccagaac ccataagaaa 3300 caaatttagt aaaaatccag gttgggcaca gtttctcatg cctgtaatcc cagcactttg 3360 gaaagccaag gcggacagat cacttgaggt caggagttca agaccagcct agccaacatg 3420 gtgaaaccct gactctacta aaaatacaaa aattagctgg gtgtggtgac atgtgcctat 3480 agtcacagct attcgggagg ctgaggcagg agaattgctt gagcccgagt ggtgggggtt 3540 gcagtgagct gaggtctcat cattgcactc cagcctgggc aacagagcaa gactccccct 3600 caaaaaaaaa aaaaaacaaa tttagtgaaa atccagagct ttagaacaaa ggaactaaat 3660 agtctcaaag gacattatca tccaagttat gatagtgatt tcgctttctt taaaaaaaaa 3720 attattacag atagagtttc ttgatgttgc ccaggctggc ctcaaactcc tgggctcaag 3780 cagtcctcca gcctcagcct cccaagtagc tgggactatg agaatatgcc accatgccca 3840 gctttatttt gctttctaat gtgccttttt gtagttcctg caaagcataa gcatgccttc 3900 atctgtggta ccctttccaa tattttattt atctcacatc actaataaga taaatttata 3960 cagccactgc tctgtgccag acattattta agaagttatt tcacgcatta tctcatctgc 4020 cttcacaaaa caactctaaa ataggtatca cctccatttt atagatgaaa aaactgaggc 4080 tcacttgccc aaagtgtcac agctaacaaa ttggactgaa ccaagattta agcagcctga 4140 ctccaaaacc catgtttcgc ctactaaacc tcttccatat taattcctcc tccatattaa 4200 ttgcgtcgtt agggtggctt gtcgacgctc tcagctcccc atcagtactc aagcttcctg 4260 agggcaggga ttctattttg ttaactgctg tattctcaaa gccttgaaca atgcctcata 4320 tgtaaagata ctaataaata tgtgctggat gcattcgagt gatttctact ccagggtgga 4380 ttgccaaagg ggaccttccc tgtcatatct aaactatcct tttattcttc tacattctca 4440 agtcactccc atttcttctt cccttcaact ccaaacttct tggaagaata gtcttcattt 4500 gccacttcca tttccttacc atcaattcac gtcttaaagc ttaggttctt gcttttgaca 4560 tctcaccagg aagctactag ggacctctag ttagcaaatc cactgaacaa atctcagttt 4620 ttatcccctt catactgtct gcagaaagtg gcagtgttga ccgctcattc ttttgacttc 4680 catgaagaac tctacacttt gggttctttt aactctgaaa cccctttctc tcacttctct 4740 tattcccagg ttctatattc atatctccgt cttttctttc ttttctctct ttcccatgac 4800 attcagatgg cttccactga catctttatt tggtgactca tcatttcttc aacaatgtgc 4860 caggcatgtt cccattgcta gaagtccccc ctcttctagt agtgcccttg atgctggaga 4920 aacaaagcag caggaaacag aagaaacgtc ctttcttcac agagcttgca ttctagtgat 4980 acaagacaca tctctattcc acctggatgt cccacacctc ttgtgattta atatgcccca 5040 aactaaactc atcgttttct tatgagatct gctctttgtt ctgttaatgg cactgccgtc 5100 ttcctattgc cctgaaagag actccagagt catttttgag ccatgtttcc tccttgcccc 5160 aacttccaaa tcagttacca agttctgctg gcagtcactg tggttacgac actctctcac 5220 tccttccttt cccttcccat cttcactgag tgacttcagg cctcattacc tcttggttat 5280 tgcagacttt gctaagggag ctgtgtcagg ggtccctaag accaccccca ggttcagtga 5340 ttcactagaa ggactcagca tagaggcatc cttacagcta aggtttatta tggtgaaagg 5400 atacaaaaga aaaggcacat ggcaatatct ggggaaaacc tggtgtaggc ttccaggagc 5460 cctctcccag tgaggtcaca taggatgtgc tgaatttctc caggaacgag ttgtagcaac 5520 atgtgtgaaa tgtctatcag agagattaat tagagactca gtgcctgggg tgttcactgg 5580 gtactggtac tggtttatga ctagcatgtg ccaaaattcc cgactctcag aaggaaagca 5640 ggtgttgagt gtaagccaca ttgcttatac aaatagcaca ggcacagcaa gcctctctta 5700 ccggtcaggg aaagttgaat actggtgcag ggagctgttt atcagtcaag ttcccagatg 5760 ccagccaaag tccaaccttg caaacaggcc ttcctaaaga aaggccatct caggcctgct 5820 gtgttaactc ttttctgcac atgagccctc tgttcctccc cactccagtc ttccctgctg 5880 ccaccagacc agccctgttg tgtgcctctt agaactttcc cttcacagac tccttcatgt 5940 ttgcccttca caagctgacc acagaccacc tttcaatctg ccattcttta tcttatggga 6000 gccaaactga actacttctt ctcttgacca atggctcacg gttgaaaatg cccttcccat 6060 ttgtattagt ctggtctcat gctgctgata aagacatacc tgagactggg caatttacca 6120 aagaaagagg tttaatggac ttacagttcc acatggctgg ggaggcctca caatcatggt 6180 ggaaggcgag gagcaagtca cgtcttacgt ggatggcagc aggcaaagag agagagcttg 6240 tgcagggaaa atcccactta taaaaccatc agatctcgtg agacttactc actatcatga 6300 gaccagcatg ggaaagacct gcccccatga ttcaattacc tcctaccggg tttctccaac 6360 aaaacatggg aattgtggga gttacaattc aagatgagtt tggttgggga cacagccaac 6420 ccatatgacc attcacctgt gcaagtccag atcctactca cctttcatgg ttcaggtcca 6480 acacagcttc ttcctaaagc cttttctaat ccatccctcc actgccagat ccccaaataa 6540 ggacagcttt cctctgatct gccagcctta tttcttttct cttttgcttc ttattattat 6600 ccaccttgta ttttacttgt ttaattataa ctcttatttc cctacttgtt ataaatttgg 6660 gagggaaagg acctttatat ccccattagt gctgaagaag catctgtttt ctaagagatc 6720 ctctgaatat ttgtggatga aattcccaaa tgctgacaat gccacttgat gaacttgtcc 6780 ctcttttggc tgtaattttc tctggggacc tcaagtcgtc tagtccctga gcacagttac 6840 ccagagaagg cagccgtata aactgagcag aggctctaga gcagagcaga ggctctaggg 6900 acaaacagcc ctggcattgg ttcccgagtc tgccctcaaa agctttggga ctacattgac 6960 ctcactaagc ctcagggccc tcattcctaa agaggctaat aacagtatga gaattaacca 7020 agaaaacatg aactgccagg tcaggcacag tacccagctt gataggcctt aatacatact 7080 ttattttaca aggaaccagc tgtccttgta attgcctcaa gtgttccact gattgtaact 7140 gtttgttttt tggttttgtt tttaatcagt tggatctaca caagtgaaaa agacttgaat 7200 ggtagtagcc actggggaat cattgcaact tatagtggag ctggctatta tctggatttg 7260 tcaagaacaa gagaggaaac agctgcacaa gttgctagcc tcaagaaaaa tgtctggctg 7320 g 7321 <210> 240 <211> 30140 <212> DNA <213> Homo sapiens <400> 240 ccagtcggcg gcggggaccc gctgcatcgc cacctccccc tggaagggca gccgccccga 60 gtggcctggg cggagaggct ggttcgcggg ctgcgaggta agagcgcgcg acccgcagcg 120 gcagatgcac gaaccagaac ggccggcgcc ggccggggcc atcgcccgct gcggcagctc 180 cccgggctcc atctcgcatc ccctctgcgt tccgcctccc ttggaagcgc attccccacc 240 tccgctagtg ctgccctatt tccggtaccc agcgcggaat tccactgctc ttttgttggt 300 gcatatttat tggatacctc cttcttcagg atatgtcacc atagtctttt ttactgaaaa 360 ttagtgaaag cctaattaga gtgaaagagt acatctgggt tttgtttttt tttttcttgt 420 agaggaaaaa atgaacatta cttgtgtaac tgatggtagt tgcaactgca tatttgccaa 480 tgtcacaaaa tctaaaggaa aatgttatag tcacccgtgg tttccttctt gcctggacac 540 tccattgtcc cgggctgaaa agggtagcag tacagtgcat ataatgtcaa gttgtgggag 600 gagtgtggca gattgtcatt ggtgcatttt tttggtgatg tgtgtggttg ttttgaggag 660 tgggagctgt taagaacacc acaaatagaa taaaataata tcgtgaagtt atttggccgt 720 ttctaattct agacattttt ctaaaaacag ttgcaaagga aagattacat tgttttaaaa 780 aaatttgaag tatgttttta aataactaaa ttaatgttct ttgaaattcc accaaaatga 840 tgaagtcacc agatagcagc tgataaatgt gtctgagccc agtgcgccca gctctacaaa 900 aggcagaaga ggaattttca aatttgccag tgcccagtaa gaggacatga attttctagt 960 accagaggaa attctctttt tacaaatttt gtcagaggta tccttgggaa agtatttcat 1020 ttgcttttac cctccaaatt attttaatct atatttttaa gagtttccat tctcagttga 1080 gtttttcttg ttcttctcct tctgtcagtt ttgaaagtct tgcacaaaaa caatccaggt 1140 gttgttacag cagtgtgatt aaaaccaggt caggcctaca ctgaaatccc agttccacca 1200 ctcattagct gtacgacctt gagcaagtta cttatcctct ctgataccca atttttggat 1260 tttttttttt tttaaagaga tgatcataac gcttaggact tgactctttg ggagaattaa 1320 gtgagttaag acataaaatg tgcagcatgt atttgtcatg ttattagcgc ttcagaaata 1380 taaatgtaaa cattttggta cttcgtttat ggagattctt atactagtta attttattaa 1440 aagcatgatg gggaacagaa gatccttttc ggataacctg tgtgagtaaa ttaataaaac 1500 actaacactt tttaagattc aaaactggat taattatgtt attttacacc atttaaaatg 1560 tgcatttaaa aaatattcac tgaagtgaga gagaagttcc ttttaagtta ataaataatg 1620 gtaagttgca tgatcctttt aactcagttt aagcatttga taacacccct aaccttgttt 1680 gaataaactc aataacagaa tatagagaaa taaaatatat atttcatatg agtatgtatg 1740 taaatttatt tcttttaaag gaaaatttca ggaaacaaaa tgaataagct catagtcata 1800 aaacctctag ccaaagtgtg tcaatggtct gatttgtagg agagcagact caggaatcgg 1860 gaattttttt ttttttttta agagtcgggg tttcactctg tcactgaggc tggagtgcgg 1920 ggaagcaaac gtagctcact gcggcctcaa actcctgggc tcaagctgcc ctcccacctc 1980 agcttcccaa gtagttggga ttacaggtgc aagctgctgc tcctagctga aaagttttaa 2040 ttatataaaa tgtttaaata aattgttatt cctttctttt atgaagaaat ataattgata 2100 ttcttgtcac ttattaaata agcaacattt taaaatgttt agcacctact gtgaagatag 2160 cactgtgcta gctgctatga ataaactaga atagcatatc actgttttcc tatggacaaa 2220 aacccagaaa tgtaaaataa atagccatga atgggttgag attccccctg ccccctttgg 2280 atactgatga cagaaatctt atatgcacta tgtaagcagt gccctaggat cagaacagaa 2340 agtaacttgc aatttttaaa ggtgggagaa atgactgaag tttggagtgg tcaggagttt 2400 ccctggaagt ctcttgcctt tgtgactttg tatagctccc tcaaactacc tgagcctgag 2460 ctcctcattt ataaaatgga agaattgaac ctagcttcca aggtcctttc tagcttcacc 2520 atgctctggt ctgttgttta atgacatgaa tccaagatgg acaacaaatg gtcgattttg 2580 ctccttctac agtaaataga tctatcttct tagcagaagt aaaatagtaa agaaagaaga 2640 catgtttgag gcctgttgag gcctgtttgc tgtatgcatt gtatctaatc aaggaattga 2700 gaatgtagcc ctaaatatta ggaaggagtt gaaagtttct gagcaggaac agaacatgct 2760 gaaaggaaat tgtgtcagca gcatggtgta caggagagct tggcagagag aaaggaggca 2820 agaagacctg tgggaggcag ccagtaagga ggtgaagagg gcctggacca aaggaagcca 2880 aggatgaccg aaagatttaa agatgaagcc cagatttaaa agtatcctca agtatttgtt 2940 tattcttttc ttagcaaatt ctttttagta caaagataaa atatggcact ctgagtcata 3000 aaattttctg aatttcagaa gttgaatgtt tttctgaatg tatcaacctg ttaaagtcag 3060 ttcctgtttg ttattttagg cgtatattct tgggcttttt tttttttttc ctagagaaac 3120 tatgaagtac tagctgtgca agtcagggtg ggctaagctg ctaaaacaga tacctccctc 3180 cccttcaata ccctgaagaa caagaagtta attttttgct cgtgtaacat tttagagagg 3240 gtattccagg ttgaatacct ggaataatga atgaaataat aagtcgactc ttatttctcc 3300 taaaataatt ggatcttgac attgaaattg gtgtgctgat tgtatttaat aagtgacctc 3360 caatgcagtt atttcatttt gccatacttt atgtaatttt tattttttct gccttccctt 3420 tcgatgtcta aagggaagca taattagtta ttggaaaggt tattgagact taaaaaaaga 3480 tttgaacatg gctttggttg atgctaccac acagaaactg caaacatcca actcaccgct 3540 cttagttgct gttcatgata gtctatgcac agtgactgat gaatttagcc tgtcttgagg 3600 cttcagaact tagtcttatg tcatcacgag cagagcttta tcctaaatta caggttttca 3660 atgggggggg gggggagggg cagttttgcc cctcagggga catttggcaa tctctggaga 3720 catttttgat tgtcatacct ggggggatgc ccctggcatc tcctgggttg aggttaagga 3780 tgctgctaat ctacaatgca cagtacagcc accccacaca cacacactac aaagcattct 3840 cccacccaaa ttgccaggag tgaggacttt gagaaaccct gccctagact gttaaattca 3900 aaaggaaata atggtttatt gctcacagtg tgccaggcac tgtgttaaac tccttatatt 3960 catagttttg tttttatcct cacaacaacc tgtgaagaaa gaactctcat ccgtcaccac 4020 tttactgttg agggcactaa gccttctaaa ggttaaatga cttgcccagg gccgcaacta 4080 ttagatgttg cagtcaggat ttaattccag gcactttgtg ttcaaagtgt ttctcatcca 4140 ctgtgctata tgccagtagt gcccaaacct aactttagcc agcaattgtc tgcatctctt 4200 cagtttatga acatttattt attaggacat gcaggataat cataccaaca cagtccgtgt 4260 atccagaatt ctaattgatc tagggagtgg gagagcctgc ctctctattt tttttaaatt 4320 ggtgtgaaat atacataaca taaaattggc cattttaacc attttaagta tataattgag 4380 tgacattagg tagatttatt atattatgta aatggactta acacaattta tttccagaac 4440 ttttttatca tcccaaacag aaactctgta ctcattaaac agtaactccc tgtttcccca 4500 ctcccccttg ccccagacgc tagtaacctc cattctactt cccctttctg tgagtctccc 4560 tgttgtagct acctgatgta agtgaaatca gaccatgttt gatcttttgt gtctggctta 4620 ttcacttagc atagtatttt caaggtttat ccatgcgtgc aaattccctt cttttttatg 4680 acgaaatact atttaattgt gtgtgtacat gtgcacacac aatgaaatac tatttcatca 4740 taaaaaggaa gtttgtacac atatatacac acacaccaaa ttttgtttat ccattcatca 4800 gttcatgggc atttgcggtt tttttccacc tttcgactgt tgtgactttc cgtttatttt 4860 taatctgaac tttactccat cacttcctcc ctttcctttt ttattcgcac cataattttg 4920 aacaagcaga ctttgtattt tcattactct ggggattttt ttgagggagg cttgctaccc 4980 tttggggttg tggtaaggtt gtgccagtaa cagaattcat gcagtaaaaa acattcatgg 5040 gactttcttt tgtgataggt actagggatg cagagatgaa taatacaagg tctcgacctt 5100 caaggagctc agggtttagt agggaaaaca gaggtataag taagtcattg caatgccagg 5160 tcccagatat gggaggattc cagcaaagag aggataaggc caggcacagc cgctcatgcc 5220 tatagtccca acactttggg aagctgagat gggaggatca cttaagccca gcagttcaag 5280 gctaccctgg gcaacatagt gagtggcaaa aaatacaaaa attagccagg cagggtggca 5340 catgcctgtg gtcccagtta tttgggagtt tgaggtggga gaatcacctg agcctgggag 5400 attgaggctg cagtgagctg tgatcacgcc actgcactcc agcctgggtg acacagtgag 5460 aggtgagagc ctgtatctaa aaaaaaaaaa aagagaggat cagatttacc tggagaggtc 5520 agagaaggtt tccagaggga gtaaaacttg agcttcattt tgaagaatga gaggggaata 5580 caaggaggga aaaataatag gaacaagacc tgttcctgtt acagcaaacc tgtaactccc 5640 accatggaat gggcacgttt tcctgtagac atttggagcc agtgtgggct tcaagcctag 5700 ggggctgata tgatcatttg tcaatctgaa gatgactctt ggaacaacgt agaggatagg 5760 gtgaggtggg taggctggtg gctgacagac taggtcagga gagggctgac caagaggagg 5820 aggggtgacg agggctggaa ctaaggcata tgagctggga tggaaagaag ctagatagaa 5880 aggaaacaaa aaccatcaga actgtggaac caactccatg ggagggataa gaagagggcc 5940 tattctaggg tgaaacccaa atttctggca tggtaccatt aacccaaaca gaaagaggag 6000 atttccagag aaagaaaagc aaattttgcg ggaggtgagt gtgagctgtc tagagaatat 6060 gcaggtagaa ctacatgtta actgtaacat atacttgtct gcacctcagg agatggctga 6120 ttaagaattc aggattcagg ccaggcacgg tggcacacgc ctttaatccc agctgcttaa 6180 gagactgggg cgggaggatt gcttgagcct gggaatccga gatcagcctg ggcaacatag 6240 caagacactg tctctaaaaa aaaaaaaaaa ttcaagattc tggagtcaat attacttaag 6300 gtagcaactg tctattctat agaaaatgga caaatataga taaaaagcca cttccctttc 6360 taaaagtgtc cctgcaattc aagtgaatac taggaaggat tgtgttcatt cttctaaaca 6420 agactcacat gtatcttagc acaaaaagag gattctttta tgatacaaat gcactgagaa 6480 tttggtcagg ctatcacaat gaactgatag ttcagatgga tttgagtctt tataccactc 6540 tggaatctgg accaactggg cctcctaagg ccattttgca gatctgggct tgtttctgaa 6600 gctacagaca ggcctcttcc aagcactcta agtgctccac aaataatatt tctgtttccc 6660 agaacaaccc cacaaaaagg tactcttact ccatttttag atgaggaagt ggaggctcat 6720 gatgtcaggt aagctttctc agctcccaag tggttaagcc ctcagtttaa tgtcatttga 6780 ctccagagcc ctatgttgca ccatgccttg ataataggcc atatgggttt catgtatttc 6840 agatggggaa ggttagtgtg aggtgaaaga tacacaatta accttttaac catggaactg 6900 aaatatttac agatgaagtg atacaatagc tggaattaat tccaaaataa ttggggtggt 6960 actggtccat ggcctgttag gaactgggcc gcagagcagg aggtgagcag caggctagtg 7020 agcattgcta ccccctatca tatcagcagt ggcatcagat gggtgaggat gtaaatgaac 7080 taggattggc attgagttga tattgttgga tctaggtgat agatttatca ttataatatt 7140 ctctctttgt gatatttctg atattttcta aaataaaaag ttgtagttat ttatttattt 7200 agacggagtt tcactctttt gcccaggttg gagtgcagtg gtgtgatctc ggctcactgt 7260 agcctccgcc tcccgggttc aagcgattct cctgcctcag cctcccgagt agctgggact 7320 acagcctccc gagtagctca ccaccacacc cagctaactt ttgtattttt agtagagagg 7380 aggtttcacc atgttagata ggctggtctc aaactcctga cctcaggtga tccacccacc 7440 tcggcctccc agagtgctgg gattacaggc gtgagccagt gtgcccagcc aataaaaagt 7500 ttttgaaagg atttagataa aatagttggg gaaatggcat ttttgttcaa agccaattat 7560 ttatgtttgg aatatctttt gtgcttggag ttctccatta cagagttccc cagtgttcct 7620 attaataagt aacattgagc agaggaatgc actgtttaga tcagcagtcc ccaacctttt 7680 tggcaccagg gaccggcttc atggaagaca atttttccac agacctgggg taggaagtgt 7740 ttggggatga aactgttcca cctcagatca tcaggcatta gtgagattct cataaggagc 7800 aggcaatcta gattcttcac atgcgcagtt cacaataggg ttctcactcc tgtgagaatc 7860 taatgccacc cctgatctga caggaggcgg agctcgggcg gtaatgctca cttgcctgcg 7920 gctcacctcc tgctgtgggg cccggttcct aacaggccat ggaccagtac ccgtctgcag 7980 cctggggact ggggaccctg ctttagatga tgtactctgg ctttgcattc tggcattagc 8040 taagcaccct cttaaaggaa attgggtcta tactctcagt ccgtgttctc cctaacacct 8100 ggaaacattg aataccttca atgctgggaa gttaactccc accacaacta gaacagctat 8160 gggaaagaca acagttgatt ttgaagagtg tcaccaattt gcacatgatt ccatccttaa 8220 ccattcttat cctatcagct ctgccaaaca tggagaatag ttggctgcag gacagctatt 8280 tttcctactt gtagatgcaa ctatttctca cccaccagga tgtaaaaggt ccctgtaccc 8340 taagattggt cctacataca cacccaatgg gaaaatgaga tgaaaaattt aaagcagtaa 8400 atatttgagg aagtagatag agtaatttag aaaaagaaaa tacacagggc caagcacagt 8460 ggctcacatc tgtaatccca gcactttgag aggccaaggt gagaggattg cttgagctca 8520 ggagtttgag gccagcctag gcaatgtagt gagaccccac ctctacaaaa aattaaaaac 8580 ttagttgggc ttggtagtat gtacctgtag tttaagaaac ttgggaggct gagctgaggc 8640 aggaggattg tttgagcccg ggtggtcaag gctgcagtgg gccatgattg tgccagagta 8700 ctccagcctg ggtgatagag tgagactctg tctcaaacaa aaaaaaaaac agagacagaa 8760 aaaaagaaag aaaatatatg gatgtatatc atataaaaat ataaataagg gaggccaagt 8820 gcagtggcat gcctgtaatc ccagcacttt gggaggctga agcaggagga tcacttgagg 8880 ccgagaattc gagaccagcc tgggcaacgt attgagacct catctctgca aaaaatcaaa 8940 aaatgaggcg gaaggatggc ttgagcccag gagatcaagc cttcagtgag ctgtgatcgt 9000 accactacac tccaggctgg gtaacagaga gagaccctgc ctcaagataa ataaattcat 9060 acatacatac atacatacgt acatacatac atacataaga agacttgttt ctttccattt 9120 gcaatgtttc attcaaaggc tagaattaaa ttgccgtagg ccatcacaag tttagcttga 9180 atattattat tttttcaaga tggagtctca ctctgtcacc caggctggag tgcagtggtg 9240 tgattttggc tcactgcaac ctctgtctcc cgggttcaac cgattcttct gcctcagcct 9300 cccatgtagc tgggattaca ggcgcccgcc accacacctg gctaagtttt gtatttttag 9360 tagagacagg gtttcaccat gttggccaga ctggtcttga actcctgacc tcaagtgatc 9420 tacccgcctc accctcccaa agtgctggga ttataggctt gagccactgc acccagccta 9480 gcttgaagaa aatttgatag gagtttgttt ttttctattt ataggccaag caataccacg 9540 tataaatatt aagaatcatg gctgttcctt agtgcctagt tgtttataaa ccatgggaaa 9600 gaatgaaatc attgaccaaa tgagacaggg taacagtctt ccctgggagt aaagagacta 9660 gcagtctcta ttgacatata ttttaggcct ggcctccaaa ataaatttac ccaaagaagt 9720 gatgtatttg tgtccagggc taccgagcct aatctttggc tgcctctgtg ttattctaag 9780 ttgtaatttt ccatgtcatc taaatttgta ataattcttt aatatgatag tgtttcagtg 9840 aacaaacatt ctgcttgctg catttcttct gagtgagtaa ttccctgaca actaccagat 9900 cttggcagaa gcaaagttgg tcataagtta tgctccactc tcagtgctgg tgaaacgtat 9960 gatgcgtaac acagtgtttt tgaattcagt gctgattttc ctaaaggaca tttggaagga 10020 aaaaagaaaa ggaaaggaaa tacccaaatt caggaataga acttacatat tattataaga 10080 cttaaaaaat acatgaacac taatgatgaa ctcatttctt cgaagtaaaa ggccttatgc 10140 tattttttcc catttcccta tgtggcttga ttgtggcgaa agtggctgtg tgagtttcca 10200 ttattgaagg agttaaggtc tgtggaatca aagcatgaga caacatgcaa ggaccaggtt 10260 ggtttccatt taacagccaa cctaatctaa ctgaaaggat tgagaggttt gtcttttttg 10320 gaaagtgtta aggttcttcc aagtaaccag caatgtgact ttaccacact gttcattaac 10380 ggggctttgg atggccacca tgtctgctgc tggctgagtc caaaactgcg gtcactctct 10440 ccagcaagct catggagggt tacgtcatct tcactcagcc agcccaacgc tttttccatc 10500 tgctaaaatg tagaacatgg ttgttgattc tactctttct acaaagaaag agagggaaca 10560 tggatgagtt gctgctttta aagattatat gttaattgct gttttaaaaa tctgctcagc 10620 taagcacgct tagtgtaatc agtcaccatg gagtttttta ataggacagc ttctgctctt 10680 acagagcaga gtttttatgc cagtaggtta gaagcataac atgtttctat attgaagtga 10740 ttctccaaca aggacttctt ttcatcaggg gtgacctaaa agttattact tgaaatataa 10800 ttacatcatg ttcttaactg ggtttagtag taggataatt acaaggttgt atccacctca 10860 aataggaaga actgataagt tttgcacaat tatttaactc ctctgttagg ccttccttat 10920 ttcctgttct ctttttaaaa tttgactaag atattgctaa tgggcttggg agcctataaa 10980 atgatcagaa ttgttgcctt atgttttgca tgtttggggt aacattggag ccagatgtac 11040 tcttaaataa aaggtaggcc tacaaaacca gtttctcagt tgcattcaaa atgtgattaa 11100 aaaaaaaaaa aggagaatct cccttatagg tgaacttttt aatttgtgct ttattttccc 11160 ttttgccatt catgagattt cttaaataaa atgatatctt ttcttttctt cattattatt 11220 ttaaaggtct ctggggaaca agactcatgg aggaaagcag cactaaccga gagaaatacc 11280 ttaaaagtgt tttacgggaa ctggtcacat acctcctttt tctcatagtc ttgtgcatct 11340 gtaagtagaa tatttccttg cactaatggg aaagttttga aaagatttga cctatccaaa 11400 tcataattaa aaggaagtgt gtatgcacca gaggggcaac tgggaagtta ccttcttacc 11460 tttgttttta attctaatat ttttatttgg gcatttgttt attgactatc ttcctatggt 11520 agaatgcaag ctttataaga gaagggacgt gatttgttct ctgctgtacc cccatttccc 11580 aaaactgcag atggcaacag aaggctctga aaaatatata agaaagaatt tttctaattg 11640 tgactaaatt gtgaccaaat gctaagtgac tgtggacttg cgtttaacac aggacgggag 11700 aggcaaagag ttcaattcca atttagaatt tggtcaagtt ctcttctgca ctctggtaaa 11760 cattaattaa aaatcagcat tatctgacca gccagttcat cgtcagtggt ggtgattttc 11820 actatgagat acgcgtggca acttgccaga caccaagaaa ccaagttaga ggatttttgt 11880 attagattcc ttaacaatga atacagtatc accattatta cagtatcatc attattgtca 11940 tactattatt atatcagtta acataaagtc tgcataagaa ttgtttccag aaaaatgact 12000 ttccaaattt aactttcagg aaatacaaat aatgctacta atattgcttt tattggcgta 12060 tacatgtaat atccccttct tttggatttg gatatgttgt gtcattgcct cattttaatt 12120 cattatttct tctcaatctt taataattgc tggactttta ctccacaaga aacttgctat 12180 aggcccatct ctttcgtctt ctttccttct ttcagttcgt cttcccatcc tctggtaggg 12240 ggaggggagg gatgcctgag cgagagacta gctgtaggaa ccatttgtct caaagtccag 12300 aaagccacag gtgatggatt tgtcctctga atcaaagggc gttcgatgat ggatttctgt 12360 catgtctcat ctaaagtctt cacgagaaca gatgaggaag cagttttatg accccagagc 12420 ctcctaccaa actcctctga gaaaaggttt cctttttttt tttttttttt aaattagaga 12480 cagagtcttg atctgtttca caggccggag tgcagtggca caatcatagc tcactgcagc 12540 ctcgagctcc taggcttcag tgatcctccc acctcagtca cccacgtagc tgggactaca 12600 gctgcacacc accatgccca gctaactttt aaaacatttt tgtagaggtg gggtctcact 12660 ttgctgccta tactggtctc cagctcctag cttcaagtga tcctcctgcc ttggaagttc 12720 tgggattata ggcatgagcc actgcaccca gcctggatgt gatattttta tgttttaaat 12780 tgttagagtt tagaaacttg agattgagtt tgctgcctgc attaaaatga tgcttaaaca 12840 ttaaactgca gtggccttaa atattaacaa gttgattaga attactaagt tcttttcaag 12900 ctttacatat acagacaaat ttcttatgca aaatagaagg taacccctgt acgtaagtct 12960 agaatttcag cagtccccaa aactgactga gcattagaat cactctgatt ttaaaataca 13020 tatgtggttt tccgagatct actaacagag cctccataat gtagcctaga gaaacgagtt 13080 ttcagatgta gtgataaatt tggaaggtaa gtcagagaag taagctgaag acagagtttt 13140 aggaaatatg cctaaagtca cataatgaat tggttttctt gtttatttga gaatattgtc 13200 gctttttgtt ctttttcatg caaatcacat tttatttctt atgtgagtag ctatatattt 13260 aaaaattttg tttttggaat attgtagaat ctctacttaa gaaagtatct tagcagtcat 13320 atggtctgac ctcactgaat gctaaattct ctttaaaaca tccgtctcag atggttactc 13380 atactgcctc tgattgaaca agagtcccag gttaagggac ttacttcttt gaaatcgttc 13440 atttcatttt tctacagcta tgttagaaag ttcgtcctta gcagtgaagc cagagtctat 13500 ctcttataac ttctacccag ttgcaccctc caagcctacc tataccaagt atcttttttc 13560 cacgttgctt ttccaattca gctcttcgca agtttggaga caaataccta atctcctcta 13620 agccttctcc aggttaagcc tttccagttc atccagctgt tgattatgtg attggagaca 13680 caagtttgag taactcccat gatggaaagt ccctctggtg aatgttctgt tcatcagagt 13740 ccctaagaaa gcacatgagc ctcaccatgg tgagtggggc catgagattc ctaaaccaga 13800 cactacactg tggcttgtgc aacctaccat ggccagactc atgaggctgt ttcatcatat 13860 aaataattcc ttagtctctt caccaaaaac tgtgaagcac tgtgtccccc agctgtatgt 13920 gagctagcct gggaccatag tggaggactc ctctttcaac cctgttaaat ttcatcttgt 13980 taggatctgc ccatttttcc attctgttga aattatcttg gaactggatt cattcatctc 14040 acatcagcta ctccccgaag cctcacagta tcagcagagt tattatctct atccatatcc 14100 ttgtaaatta ttaaactaaa aaagattggt ctaagaacat cagtccatta atcaaggctc 14160 tttggttgga gttcacttca ttatattatc atccagctca gagtgttcat aaacaagatg 14220 ataggaaaga cttttccaaa tgcctgtctg agtaattccc ccattcctgt gatctgtgag 14280 ctgttgacca gattaaaaag gaagtgagaa taaccaggca agatttactc ctagcaaaac 14340 cttactggct tctagtgact gagtcctttc cctattgctt accagctatc tttttaatta 14400 ctagttttaa aatcttgcca gcaatgtcaa tatcaaatga ccaagaatat caaactcatt 14460 actctgtatg taaatgagat agtgtactta cccctatggc ttaagtatta ggctgttctt 14520 gcattgccct aaatacctga gactgggtaa tttataaaaa aagaggtttg gccaggcact 14580 gtggatcagg cctgtaatct cagcactttg tcaggctgaa gcaggtgtaa tggtgagcca 14640 agagttcaaa cttagcctgg acaacaaggt gaaaccccct ctctgcaaaa aatacaaaaa 14700 ttatctgggc atggtggcat gcacctgtag tcccagccac ccaggaggct gaggtgggaa 14760 aattgtttga agctgggagt cagtgattgc agtgagccat gattgcaaca ctgcactcca 14820 tccagcctgg gcgacagagc aagaccctgt ctcaaaaaat aaataaatga ataaataaat 14880 aaaataaata aataaataga aaagaaaaag aaagaaaaga gatttatttg cctcatggtt 14940 ctgcaggctg taagggaagc atagctccag catctgcttc tggggaggcc tcaggaagct 15000 gttactcatg gcagaaggtg aagcaggagc ttgcacatca tgtggcaaaa gcaggagcaa 15060 gagagagaga atggggcagg gaagaagccc cacactttta aatgaccaga tcgcatgaga 15120 aatcactcgt tacctcaagg acagtaccaa gaggatggta ctaaattcct gagaaatcca 15180 cccccatgat ctgatcacct cgtaccaggc cccgccttca gcattgggga ttatgtttca 15240 acatgagatt tggatgggga caacatccaa actatatcac cttgcatagt aggtagggtt 15300 ttaaaaagca gtttggcaca gtaagaaaag tacagatttt ttttgcatca gacagacctg 15360 agttaaaatc ccagcttcac tgctaacatg ctaggtaaat gtgggcaagt taattaacat 15420 ttctaagcct ttgtttcctc actggtaaaa caagtatttg gaaatatcat tgtgaagatt 15480 agaaataata catgaaaaga tcctaggatg ctgtctgtca tacagtagta gtagtaagaa 15540 gttattcttg ccaaagattg ttgagaatgg cagaattatc tcagttctaa gagctatagt 15600 ttctaattat ttgagcctag actcagattc atttggagca gctaactgct caccaagagc 15660 ttattttcca tcttaccaat gaggttatgt gccctgtgtt tttaaaatca gtctacttaa 15720 ccaagagaac agaaatgaca tgagaattaa gtaatctcac tttctctgtt atttaggatt 15780 tattcctact caaaacctga gagttgctat gaattcacca ttaaagcact tattaatata 15840 catgggttac tgttataaat agcaatagta ttgctattgt gtgagttagg tgttgaagtt 15900 caagaaagga ataaagaata tttagaagat ctttgaaaac agtgtctggg tacggtggct 15960 catgcctgta atctcagcac tttgggaggc cgaggcaggc agatcacttg aggtcacgag 16020 ttcaagacca gcctgggcaa cttggcgaga cctcgtctct acaagatata caaaaattag 16080 ccgggtatgt tggcatgcac ctgtaatccc agctacttag gaggctgaag cacaagaatc 16140 acttgaacct gggaagcaga ggttgcagtg agccaagatt gtaccactgc actccagcct 16200 gggcaataga gcaacactct gtctcgaaaa aaaaaaaaaa aaaaaaaaaa agaaagaaag 16260 aaggaaggaa ggaaagaaaa aaaaaggaaa aaatgcaagg aaggtatttg gtgaatctat 16320 aataataaaa atgtatttgt catttccttt ttctgtgctc tcattctata aaattgagta 16380 aaaaatctat atatagttta aacacattaa tagaaatcac aaaagttagc tgagtcaaca 16440 ttgtagaaac ataatatttc tgtatgtcaa agaaatagac aacattaaaa agcagaaagc 16500 aattacaaag aatgattata agaaacatca caaagggtta atattttaac acatttgaaa 16560 ctcaaaaatc actgagaaaa gcagtagact tccataaata ttttatagag tagaaaaaat 16620 aggccaagca cagtggctca tgcctgtaat tccagcactt tgggaggccg aggagggtgg 16680 atcacgaggt caggagttca agaccagccc ggccaagatg gtgaaacccc atctctacta 16740 aaaatacaaa aactagccag gcgtggtggc aggtgcctgt aatcccagct acttgggagg 16800 ctgaggcagg gaattgctta aacccttaaa cccgggaggt ggaggttgca gtgagccaag 16860 ttcgcaccac tgcattccag cctgggcgac agaacgagac tctgtctcag aaaaagaaaa 16920 gaaaagaata gaaaaagaat ccatgggcag gcacagtggc tcatgcttat aatcccagta 16980 ctctaggaag ccaaggtgag aggatcaatt gaggccagga gttcaaggcc agcctgggca 17040 acatagcaag actttgtctc tattaaaaat tttaaaatta gccaggcatg gtgacgcaca 17100 cctgtagtcc caattacttg ggagcctgag gcaggagaac tgcttgaggc tgcagtgagc 17160 tatgattaga ccactgcact ccagcctgag ctacacagtg agaccttgtg tcaaaaaagt 17220 aaaaaaataa aaattagcca ggcatggtgg cacatgcctg tagtcccagc tactcaggag 17280 gctgaggcaa gaggatgact tgagtctgga agatggagac tgcagtgagc tgtggtcatg 17340 ccactgcact ccagcctggg tgacagagca agaccctgtc tcaaaaaaaa aaaaaagaaa 17400 agaaaagaaa aataaataaa atttattcaa atacaaaagt gatgtggttt gactctgtgt 17460 tgccacccag atctcatctc caattgtaat ccccgtgtat tgacggaggt tcctggtagg 17520 agatgattgg atcatgggga tggtttcccc tctgctgttc tcatgatagt gagtgagttc 17580 tcatgaaatc tggttgtttg gtaggtgtct gtcacttacc ccttcttttt ctctctcctg 17640 ctgccttgtg aagaaggtac ttccttctcc tttgccttcc accatgatta taagtttcct 17700 gaggccttcc cagccatttg gaactgtaag tcaattaaac ctctttcctt tataaattac 17760 cgagtctcag gcagtttttt atagaagtgt gaaaatggtc taatacagag acttggtacc 17820 aggagtgggg tactgctata aaaaataacc tgaagatatg gaagcgactc tggaactggg 17880 taacaggcag caattggaac agtttggagg gctcagaaga agacaggaag atgtgggaaa 17940 gtttggaatt tcctagagac ttgttgaatg gctttgacca atacactgat agtgatatgg 18000 acaatgaagt ccaggctgag atggtctcag gtggagatga ggaacttatt gggaactgga 18060 gtaaacgtca ctcttacatg ttttagcgaa gagactggca gcatttttcc cctgccctag 18120 agatctgtgg aactttgaac ttgagagaca tgatttagag tatctggcag aagatatttc 18180 taagcaccaa agcattcgag aggtgacctg gcttttcctg aaagcataca gttatatgtg 18240 ctcacaaaga gatggtttga aattggaact tatgtttaaa ggggaagcag agtgcaacaa 18300 aagtttaggg agtttgcagc ctgaccatgt ggtagaaaag aaaaacccat tttctgggga 18360 gaaattcaag ctggctggag aaatttgcat aagtaacgag gagctgaatg tgagttgcca 18420 agacaatggg gtaaatgtct ccagggcgtt tcagaaaatc ttcagggcag accctcacaa 18480 cacaagcctg gaggcctaga agggaaaaat ggtgtgagcc aggcccaggc ccaggcccca 18540 gctgttctgt gcagccttgg gacatggcac cctgtgttcc agccactcca gctccagctg 18600 tggttaaaag gagccaaggt acagctggac cattgcttca gagggtacaa atcccaagca 18660 ttagcagctt ccatgtggtg ttgggtcttt gggtgcacag aagacaaaag ttgagctttg 18720 gaagccgctg cctagatttc agaggatgta tggaaacacc tcgatgtcca ggcagaagtc 18780 tgctgcaggg gcagagcctt atggagaacc tctgctaggg caatgcaggg gggaaatgtg 18840 gggttggagc tcccacacag agtccccact ggggcactgc ctcatggagc tgtgagaaaa 18900 ggaccaccat cctccagact ccagaatggt agatccacca acagattgca ctctgcgctt 18960 agaaaagctg caggcactca atgccagcct gtgaaagcag ctgcaggggc tgtaccctgc 19020 agagccacag aggtggagct gtccaaggcc atgggagccc accccttgca ttagcatgga 19080 gacaggggat caaaggagat tttggagatc taagatttaa tgaatgccct gtcgagtttc 19140 agacttgaat ggggcctgtg acccctttgt tttggccaat ttctcctatt tggaatggga 19200 acatataccc aatgcctgta cccccattgt atcttggaag taactaactt gcttttgatt 19260 ttacagactc aggcagaagg gacttgcctt gtctcagatg agactttgga cttgaacttt 19320 tgagttaatg ttggaacgaa ttaagacatt ggggttctgt tgggaaggcg tatttggttt 19380 tgaaatgtga gaaggacatg agattttgga ggggccaggg gtagaatgat atggtttgac 19440 tctgtgtctc cacccaaatc tcatctccaa ttgtaatccc catgtgtcaa gggagggacc 19500 tgatgggagg tgactgaatc ataggggcag tttcccccat gctgtttgca tgatagtgag 19560 ggagttctca tgagatctgg ttttttggta agtgtctggg cttccccctt ttccctctct 19620 ctcctactgc cttgtgaaga aggtacttgc ttctcctttg ccttctgcca tgattgtaag 19680 tttcctgagg tctccccagc cattcagaac tgtgagtcaa ttaaacctct tcctgcctat 19740 tctcaggcag ttctttatag cagtatgaaa atggactact acagaaagtg tgtaacttta 19800 aactcagtag tatccaaaga agtaatgaaa atggagaaac gaacaacaaa atcatagtac 19860 aatatggtgt atgtactagg acaggaagag cccttttaag aagagatcta tgtatttcca 19920 tttgtttatc tctgaaagaa agcaactttg ccttgtattc tgaaaaagaa aggaatattt 19980 tattttactt gtaaaaatct tacaaggatg ctagtctaaa tatagttttc ctaatttgcc 20040 agagaatcca tgaagatcga gttgataaca agatcagtga agtaaaggtc agtgagttaa 20100 tctcacagca gctgcaggct aattccattt ccagtgaaaa acgtcttgat tgctcaccac 20160 atatcttttc accacaaaca gtttcagtct taagatcaca tgttgcaatc catgagaagt 20220 aactattaag ccttcaacta tgactggagg gctcctcgcc ctttctgata aattgactgg 20280 acaaaaactc aattttaaaa tgacaagaaa tagaagatgt ataaatgtac tttaaatgtg 20340 accaaaatgg gttgtgaaaa cacaagacac aatatccaaa aatgctggca acacagtaca 20400 ctgtagagta ttggttgttt atttaccctt gctattgtgt ggctgagctt actgccactg 20460 cccagcattg caagggcatc aaactgccta tcactagcct aggaaaagat caaaattcaa 20520 aattctaagt acagtttcta ctgaatgctt atcacttttg caccatttta aagtaaaaaa 20580 atcagtaagt tgaaccatca tatatccaag attgtctgta tataaatatt atacatcttt 20640 ctctcacttt taaaacaaaa taatactagc caatactacc attctcaaaa gcacttgtgt 20700 caacagcctt taccccttaa agattttcct cacaatttta aaattgttac ttactatttt 20760 ctttgaaatg ttgaccaaac ctggattaaa agatttgggg gttttagtga ctgtatttca 20820 caaactctct tattgattct gcagcctcac ttctgcctcc taaaaagccc tcaccaaggt 20880 cacgggggat ggctcttttc agcctcttcc tggcatttgg tccagtggca tttggcattc 20940 taggacttcc ctctttgtct ttgataactc cctctcttcc tgtgttcctc cttgctgtgt 21000 tcacttgctt cgctttcttc tttctgaagc atgtttacac agtgttttct ctgattgggc 21060 ctgtgacgtt ctttaggtca tcttttccac aaataatgct tcaactagta cttgcgtgcc 21120 agtgactcca cgtcccactc atgagctctg aacctagtac cagcttctgc tggacatcta 21180 caatgggatc tctcacaggc ctctctcatt ggtaacatgc cccagcctga actcatctcc 21240 cacccatcta tccagccatg ctctctagtt cacctgaaca cttgggtgtc atcctagatg 21300 ctttcccttc ccagtcttct gtgatcattc tgcctcatca gaggctctct aatctgtctt 21360 ctttcctata tcgctcttgt ccctatttta atcctaatca tctatttcct gacttattca 21420 ttccttaagt tggtcagtaa tttaattaaa aacagattta ggccctgacc ttaaatgtga 21480 taagtgatat gaaaggagat gactggggaa aaggatttcc ctcaaggaag gcctctgtga 21540 agcctgaagc aagaatgaaa acgagtcaga cgaagagaga attgtatgaa tgaaggctct 21600 gaggcaggaa aacactcaga tcattccaga atcacttaga agccaagtga agccagttcc 21660 tggagagcag atcatcaaat gaagatggaa aggtgaccag gggccagacc tgtagttttg 21720 gtgggccttg gtgagggatt tacagtagga caccccatgg tttaagtatg aaagtgacaa 21780 gattccttta agttttaaga ggcctcgaaa tatgaaccac agattagatg gaagctactc 21840 tccctgtgtc tggacttttt agaatttcca agagctgctg tttctggaac cagattaata 21900 caagtcagtc ttccatttat ttatttatgt atttatttga gacagggtct cactctgtca 21960 cccaggctgg ggtgcagtgg catgaacaca gctcactgca gcttgggggc tcaagagatc 22020 ctcctgcctc agcctcccat gtagttggga ccacaggcac ctaccaccca gctaatttta 22080 tttgttgtag aaatgaggtc tcattttgct gcccaggctg ttcttgaact cttgggctca 22140 agcgatcctc ctgcaacatc ttcccaaagt gctgggatca ctcttccatt taacatgcta 22200 tctcaacgtc aagataaact ttaaaatctt tagataatag gctggcattt tacttaaacg 22260 atctttactt cttcagaact gccattccct ataaatatct ggttcttcaa ccacatcaaa 22320 ccacttgtga tctcaaaaag cctcagcgta cactgtcctt tctgtcattc taattcctcc 22380 tcatccttca aaatcaactc aaggaccaga tccagggaga agcttagtgg tgcccacccg 22440 aaccggcccc ctccttcgag ttgtgctgcc attcgggccc acctcttcac acagggttgt 22500 cagaccagac cagctcatgc gttcaccgcc cttgcaggga tgggatgcag ctgtgcacct 22560 ctcagtgccg acacctggag agtctcacga aatgttgaca acatggcctg tttccatttc 22620 ttgttcacta ggacttctca tttactaaca cacagaattt cctgtagtat gtccacttaa 22680 tcagttcaag cctaataatt ccttgatttg ggtatagtgc tttgcattta tatactgatg 22740 gtccccaact tacgatggtt cgatttatga tttttcaact tcatggtgat gtgaaagtga 22800 tacacattct atagaaacca cactttcaat tttgaatttt ggtctttttc caggctacca 22860 tactctaaag atagagccac agatcccagt cagccatgtg attatgaggg taagcgacca 22920 atactctaca gtgtattgta ttgccagatg gttttgccca actagcctaa tgtaagtatt 22980 ctaaacatgt ttaaggtagg ccaggctaag ctgtgttgct cattcagtag gttaggtata 23040 ttaaatgcat tttcaactta tgatattttc aatttacaat gagtttatca ggatgtaact 23100 ctactataag tcaaggatca tcttgtatag cacttttaat ttatagagtc ccttcaaatg 23160 tttgtttgta ttttatttcc actgcatccc tgtgaggata ccataagtta tacagctaac 23220 aaaacagtta gttttcctgt gcaaagtgat ggcttcatct tgtggcagat tacctggaat 23280 actgtggcca aggcatctta gttctactgt ctttatatat ctagtacagt tatattttta 23340 tggcagctct gatttcttct ttggcccaag ggttattaag agagggaaaa aatttaattt 23400 cttaacagat atatatatct atgtcaagtc atatatttaa ttcaaaccct taatattcct 23460 aggtaatttt tgtctacttt ctctgtcaaa gattgaaaga tacagggttt taagtttcca 23520 actgtaattg tagttttggt aattgtttta ttactaacag gtattgctct gtatattttg 23580 atgttctgtt attcaataca taagaattca ttacagttga atcatcatgt atagtataat 23640 ttaccaatgt aaaataacct ttttatcaaa ctgagtattc accttataat gtcctctgtc 23700 agaggattat aataccactt aaaacctttt aaaaaatatt ttgttcctga taattttagc 23760 tttgagtggt tttcttataa caattctaga gatgcgtttt tattttttaa ccaagattta 23820 aagctttgtg atttagtaag agtctaaacc attcacagtt catgcttttt tgtcaaattt 23880 ctattattta gtattttcct ctcttttata ttttcctgtt attttccatt tctattcttt 23940 tgttagactg gaaatttttt ctttgctttc ttttatccta gtgatttgaa atttatgtaa 24000 tatatactat tctacaatac cctttatttg ttttcaatat ttgaacctat atttttcaac 24060 attattaaga ataaaatagt atttgttgct attttgaaat gatagaccat gtttttaagg 24120 caggttggtg gttgttaagg caccagtatc ggccaggcac gatggctcac acctgtaatc 24180 tcagcacttt cggaggccga ggtgggcaga tcgtttgagc ccagcacttt ggccgatact 24240 gtggtttact gtattttgtt ctagtttatt ttatggaaaa tgggaattca gtggttaaga 24300 caaggattaa atagcagaag aaagatgtgt acatatgtac agatgtatgt gtcctttata 24360 tgttttttag tactcttgtc tcctttctgg tcctcattta aggttatcta tttcatgcag 24420 taaatttttc ttcacaattc atttcattta gagagtgaat gctaccttcc aagtgggctt 24480 tctccagttt tcctttcagg gacttaaagg agaagtgatg ttaacagttt tatatttcca 24540 ttgcatttta cagtgtgcag atgtcttcac atatatttcc ccatttgagc tttacaaaag 24600 cccttagtat tattctcatt gtctagattc caaaatcagg cttagaggag ttaaatagtt 24660 gtccaggatc tcaagatgca agacccacaa tcatgaacag aggcagatgt tcaggatgga 24720 ggcaagctga aactcaaaac caaatcatta tgactccaaa ttcaggagtc ttttagctgc 24780 cacctgcatg ggctcttggt gtagctgacc accagagttt gtagagctgt cattcaggtg 24840 tgccatggac tttcctggga cctggcacag gagaaggact gagttaatgt ttgctgatta 24900 aatatctgtt acaggctggg cgcggtggct cacgaccgta atcccagcac tttgggaggc 24960 cgagcaggga ggatcacttg agctcacaag tttgagacca gcctgggcag catggcgaaa 25020 ccccgtctct acaaaaaatt tgaaaattag ctggccatgg tgatgcatgc ctgtagtccc 25080 aggtactcag gaagctgagg tgggaggatc acatgagccc atgagattga agctgcagtg 25140 agctgagatg gtgccactgc actccagcct tggccataga gccagacctt atctcaaaaa 25200 aaaaaaaaaa aagttacaat aatcttccct tcaaagctgg aaggcattat ttacctgtct 25260 gtccagcaga tggtgctaca taaccaaggg aatctgttgc ttgcccttgg tgaagctatt 25320 aaagccaata cagatcttga gaatttcaaa agcaaaaatc aatactggat tatgagtgct 25380 ctaggaaaat aaagagataa attttcaatt tacatactta tatatagtta taccatattt 25440 gtaaataaaa atatataaat aatttatcaa aattcctttt taacagcaac aaccacagta 25500 aacccacagg ttaaaaactc cacaacagtc tatattaatc agtcaatgca aagtacattc 25560 caattccaag ttaactgaaa ataatcaact taatcatttg gttggctctg agcagccttc 25620 actgcttgct cttgtgtcat gtttctttct gtcctcgatt ggctatagac ttacagacgg 25680 cttttgcaga ggacagtgta ctcatgtcca tcctttgcat cctttgtggg agttggctag 25740 gcagcactct ccctggggac actatgaact cctcttcttg agtgcagaga tcacgtcttg 25800 ttcatcttca tgcccaatac cttgttccat aaatatgaat ggattagaat tctaaactct 25860 taactctgcc ccaagacagt tctgagaggt agtaagtcat ataacacctg aagaggactg 25920 ttcttgtcct aattacatta ggttataaga tgacaggtga gggagccaaa ccagggggcc 25980 tggaaattat tcatacatct ctagatacag tatacaagtt gtgtgtatta tgtgtattta 26040 ctctgtaatt gattgcttga gatgaacccc caaacacact cgtgtttgga tcattattat 26100 ctacccttct ccttaaataa tcttaatttc ctatgatgct tgaaagggaa agaggggcca 26160 ggtgtggtgg ttcacacctg taatcccagc actttgggag gctgaggtgg gagcatcacc 26220 tgaggtctgg agttcaagac caacctgacc aacatggtga aaccctgtct ctactaaaaa 26280 taaaaaatca gctgggcatg gtagcacatg cctgtaatcc cagctacttg ggaggctgaa 26340 gtgggagaat cgcttgaacc tgggaggggg aggttgcagt gagccgagat cactccattg 26400 cactccagac tgggcaacaa cagtgaaact ccgtctcaaa aaaaaaaaaa aaaaaaaggc 26460 agagtgggga agagagctgc atgaaggaga gatttactaa atagtactta atcccaaaat 26520 aatttctata ggtttgaata tgatccctga aatttattat aggttcaggt aagtattaat 26580 cacgggtatt cagaactgtg gtttaaaaaa tgtatagaac atgtttcctt ccccttgaaa 26640 ctttttatca gctaattata ggaattatat tatacctgca atcattaaag tccagaatga 26700 gacagtactt ggtaaagtgc tgaaatttat aataaatgca ttatagcaat ccagttaagg 26760 aggaagagcc accattattg aacatttgtt aagtgtcagc cattgtacta gataaatttt 26820 agttattatt tttatttagg caccaaaaaa tccatgggat agttggttat ccccatctta 26880 ctgaagagga aactgaagct cagaaagttt aagcaacttg cacaggtcac atagcaagta 26940 aggagcatgg ccaggaatca gaccctgatc tcctttggtc tactaagctt gcaaaggatc 27000 ttcccgcctc cttccaagac cattcaatat tatcagtaaa tgtccatggc aaggatgtag 27060 ttcgagttat agggttccat tcaagatatg attggtaggt gggaagcaga tatgtctgtg 27120 tcaatcagta tcctggaaga aggagatgat gaactcaagt ggtgattaag ggaagtttaa 27180 tgaagggact atttacagag atgtggtggg gttaagagaa ccaacaaggg gaagtgatgc 27240 actcaaaaag ttactacctc caggctttag gggattgggg gagggagtgg cacagtgtga 27300 acccagtgtg gttgtgagaa aagggattcc ctcagcagcc atggccaagg ttagagtctc 27360 cactgccaaa ctgcatccag gtggtgaggg aatggagaat aggggtgggg taacaaactc 27420 tgacctcggt atccccaaag ggcaaaggat tccaggtggt acagttcgta aagattagcc 27480 tcagggcaca gaacagggca gagaagaatg gagaattgat ctggaggaaa caaacaatgg 27540 cttgcccatg ttattgcagg gagagtaggc tggtgtgcac agcaggaggg tggggagccc 27600 agcatatagc tgtgttgggg cctgtgcaga tcagcctcac tggcagggag gatctgagcc 27660 gagaggtggt ggaagatgaa atcgagtagg catgttggta gtcctaaata tcaagtaaac 27720 gttcctgatc ttacattgat actcaatagt aagccaattt tgtttcccat aagccaatat 27780 taatattacg tatttctttt ataagccaga gatatagaga gataccctag aagaatgata 27840 ggggaaagga aggcaagggt gagagaagac cttgtgtgaa tttgtccaaa atgtttatcc 27900 acaggaacaa tccctttgtg aaggctgctg gtatgtgaat gtgtgccggt tcccttgggg 27960 cgttcatttg gatctttctg tgttccagtg acctacggca tgatgagctc caatgtgtac 28020 tactacaccc ggatgatgtc acagctcttc ctagacaccc ccgtgtccaa aacggagaaa 28080 actaacttta aaactctgtc ttccatggaa gacttctgga aggtatttgc aaataacttt 28140 gaaagtacct ctctatcaca gaaaattgtt catttggctt catcatttca atgcatgagt 28200 atcgacagga cctgctttgc atttaacact gtgtgagacg taagttatgg tgagttgtta 28260 gaagttactg ttcctactct caaagggggt aaactaacat tgagaacttt gcctgtgcct 28320 tgcactgtgc tgagtgtttc atatcttacc ttatttaatt tctatagtct aactctataa 28380 ggtaagtact aagactatgc cctagtttgt taatgaggaa aatgagattc aggatgttta 28440 aatgcgtatg gtcacatggc tagggaacaa gaaaaattga tttttttcta gcctgacagc 28500 tacttcatcc tagtttgtaa ttcattccat gagtcaagat tcaataaata tttattgaga 28560 atctcctaga atgtaaggcc aatgaagggc agtgtggttc ttctgtcttg cttcgccttt 28620 tgtgttttgt ctctttgttg atgatggcat gtatccccag ctcttagaac agtgcttgat 28680 tcaaagtaag cacattcttt caaaggtctg ctgttggtgg ggcttggtgg ctcacgcctg 28740 taatcccagc actttgggag gccaaggcag gaggattgct ttagcccagg attttgaaac 28800 cagctgggca caacatagta tgactttgtc tctccaaaaa agttaaagaa ttagcagggt 28860 gtggtggtac acacctgcag tcccagctac tcaggaggct gaggtgggag aatcacttga 28920 gcgattgctt gaggtcaagg ctgcagtgag ccatggccat gctactgcat tccagctggg 28980 gcaacagagt gagacccttt ctcaaaaaaa atccccccca aaaaaaaacc caaaaacaaa 29040 caaaaaaggt ctgctgttgt gaagttcaac ccaatccagc cccttcccaa gttgtcacaa 29100 attccaacgt agttaacagt ataccaatga gtgataccac aggaaaaata ttaaactgat 29160 ctgagggata tggggcttgg aatctaagaa aattggaagg gaaattgaaa aggaaattat 29220 tatttctcct tggggagata gtttctaaaa ttcttactac accctggggt cagagctgtt 29280 gattttaagg atagagacaa ctgagtcaca ggaaactatt catatataaa agtacctggc 29340 atccaaaacc acacttgtat aatatgaatc tttcaccatc tgagtagggc aaatcagtct 29400 atctctgttg atcatctgac aaggatagca cactgagaaa tagatctgtc ttccctacag 29460 gcatagctag ttgtacaaac taacaagaga cttttgtata cacattccat gatgataaat 29520 gccaatcact aaagggacga ggagggattg gagagttcac catacagcaa aatagtccag 29580 acaggtgaaa ggtctatcaa atgccaggct ggtaatcaaa actgtagcct tttctctaaa 29640 caaagtttag aaccatgatt gtgtgggaca ttattttaat aagggaaagt gcagttaatc 29700 atgaccccac ctttagtcca agaacaaaaa tcagagctgc cacgtattaa gtacccactc 29760 tgtgccaggt gcagtaacta tgcaaaagat gggttttcca gatgcaagaa ccttggttca 29820 gaggaccctg ctcaaggcct catagctaac aaatgatggg gcaagatgct atcccaaatc 29880 tctctgacaa caaaactcat tcttatcact ctactatttt catagagttg ccaaatgctt 29940 ggttatgcaa acgatgcagg caggggcaag acagcggctg agcttggaac tttttcagag 30000 atgtttcctt tgcttttagt tcacagaagg ctccttattg gatgggctgt actggaagat 30060 gcagcccagc aaccagactg aagctgacaa ccgaagtttc atcttctatg agaacctgct 30120 gttaggggtt ccacgaatac 30140 <210> 241 <211> 32598 <212> DNA <213> Homo sapiens <400> 241 aatggtagta gccactgggg aatcattgca acttatagtg gagctggcta ttatctggat 60 ttgtcaagaa caagagagga aacagctgca caagttgcta gcctcaagaa aaatgtctgg 120 ctggaccgag gaaccagggc aacttttatt gacttctcag tgtacaacgc caacattaac 180 ctgttctgtg tggtcaggtg tgtactgagg acatgcatcc ctcctatttc tgtgtggttg 240 tacatacatc ctattctggg gttagccaga aaaacctttg cctgcagtta gctacatgag 300 gatgccaagg acccagacgg atagcaaggg aggggtaaaa actgaaggct taccgaaata 360 aaggatattt gaggaaggga gttgggatcc tagaatatta cgagttggaa agaaccataa 420 ctctggtcca agttcatctc aatgctggaa cctttccaga aaaagtattg tgtttttcta 480 acatctgtct ttacccatta taaggatggt tagtgccaca tgttccatca ccaagtcccc 540 cggccatcaa atcttgactc atttcctgga gtttctcact ctcagatgag cctctgctat 600 tagcacacaa gcacagtaac cggagtgctt gtaggatgct cagtaggata cccaggttac 660 ctgctcgtgc tcagggctac caaaggcacg taaagttcct tccacagatc ctgggatgtt 720 gccatgatga cccctctgtg agatagtaac aaaaatgaca aagattccac tggcttgtct 780 gggactcttc ttcattcatt tattcagcaa acattcattg gacacttaat atgggctagg 840 cattgttctc ggctcttggg acatgtcagc aaacaaaata aagatccgca ccttggcaga 900 gcttgcatcc aaccaggagg agactagaga ataaacatta aacaatacaa ataaatagta 960 tagtatatta gaaggtaata ggtactatta aaaagaaaga aaaagcagag caagaggaag 1020 tcagagttca cccactttaa tcttcctggt gagcatgtca gcaacaccca aacatcacta 1080 acatggatta ttgcatgtat atttacacat aagataagaa gtgtttattc tcataatagt 1140 ctttgtcatc attcttgagg ttaagttcaa ttctgcttta tgtggcttgt tggattgtcc 1200 cagtccttgt atttaacaac atttgcagaa aatagtacca cattaaatca attatagatt 1260 atcccttatc caaaatgctt aagaccagaa tgtttgagat ttaagaaatt tttcaggttt 1320 tggaatgtct gcatatatat aatgagatat cttggggatg ggacccaagt ctaaacacaa 1380 aattcattta tgtttcataa atgaaactta atgcacatag cctgaaggaa attttatttt 1440 tcccttaggg atgttgaatc aactgttgtg tgccagcatg ttgacaatga cctgtcacat 1500 gaagtcgggt gtggaatttt ccacttgtgc gttcatggcg gtgctcagaa agtttgggat 1560 tttgaagcat tttatatttc agattttcac attagaaata ctcaagctgt ccttgctcac 1620 agtggccaaa aaaaaagaaa gaaagaaaag aaatactcaa ccagtagtcc agtagtagtt 1680 atcactagaa atgaatgaaa atctattgca gtattattga gtttttccta attattccag 1740 tgcagataaa aagaaaagaa taaaaaggaa gagaataaaa acagagaggc aactctgata 1800 ttttagtaaa ttctatttat agaaggtctt gagtatttct tctgcttcct cccttacttt 1860 aaggatgaac attgttaaga caactgcttc atttctctat actgtttttc taagtttctg 1920 gaagtggttg actactgcag ggccagaatg ggccagagaa atgacttgac acttgaaggc 1980 cacttccttc ccttttgagt tcccaatgaa gctgtcacat acaaggctct tggcttcaga 2040 gttgctctcc tgagtttttg attctcaccc ctactctcta acacatcaaa taggaaagaa 2100 agaacaggag aactgacaat gaaaaggaag gaaaattttc acacttctct gaccagttct 2160 aatttaccat agtcctgttt ttacttgatt attgctcatg catgtgtcct gtatgctcag 2220 gttccaggtg cggctacctg tcctgtaatg gcagagatag tgatggctag tagctgacta 2280 aagggctttt aaatgtctca aaatgaagca gctagagatt ctatttctag ttagaaaaga 2340 agtctgtatc attaactgaa tcacccagct ttctcagtgt gacacctaca aaatgggcat 2400 ttgacaagaa aaaaaccctc agtccagtta tggtaaagca gtaaagatca gagccatcag 2460 tatggatgta aaatagtgta tgttttagac aatcagacat ctattgagta cccacctatt 2520 aactataagg ctctgggaag aagagagaaa actaccctgg aggacaaact atttgatgct 2580 atttaggtgt tacataatga atgaatgact cagttcctat ctttatatat gtacaaaata 2640 tatcctactt ctcaaccaga ttacacatgt tttgagtgga tggtttatat ttctttatat 2700 tcttcatgtt gcctagtaga aggacttgaa tttaatagaa gtcctagggc caggcatggt 2760 ggctccttcc tgtaattcca gcactctgaa aggcccaggc aggaggatca tttgagccca 2820 ggagtttgag accaacctgg gcaaaagggc aagactcagt ctctgccaaa aaaaaaaaaa 2880 ttagttgggc atggtgctgc acacttacat tcccagctac tcaggaggct aaggcaggag 2940 aatcccttga gccctggaat ttgaggcagc agtgagctat gattgcaaca ctgcactcca 3000 gcctgggcaa caaagcgagt ccctgtctct taaaaaaata ataacagaag tcctagaaaa 3060 gtttgtgtgt tgatttactt ttacattaaa agtatatggc atgttgagca gcgtaaatat 3120 agaaaagtgt agggaagact gagcaggaag tactcctttg ggactgaaag acctcaggaa 3180 gtcttattcc tttgatggca caaaattctc caagtatgga attattagct atgataaaaa 3240 tgttttgccg ctagtttggg gggactcatg gtagcagttt cattaccttg taatgcatga 3300 acagaacaga tggacatcca ttcctggctg tattcatgtg ttgttgttgt tattgtttta 3360 attgttctta tttacatgca ggttattggt tgaattccca gcaacaggtg gtgtgattcc 3420 atcttggcaa tttcagcctt taaagctgat ccgatatgtc acaacttttg atttcttcct 3480 ggcagcctgt gagattatct tttgtttctt tatcttttac tatgtggtgg aagagatatt 3540 ggaaattcgc attcacaaac tacactattt caggagtttc tggaattgtc tggatgttgt 3600 gatcgttgtg gtaggtttga gaacaacacc aaatttccta ttctattcta caagcatgtt 3660 aactagagtc tttgatctcc tcagcattgt ggatcttgat attcccaaaa aagaatctaa 3720 aagtccccct caattatatc aacttctgtt actaattatt ttctcatttt gcatgagtaa 3780 ctttgctgag tatgaagtgg agaggtattt acagtatgct ctcagccacg ctaataacaa 3840 gagtatctca gtaattcata tttggcttta gtatgccgta tgagatgtgg aggagaaaac 3900 agtttttttt ctttgttttt ttttccacta atgatatttt tcttcaactg ctggtaaaaa 3960 tcaatttata ttttcctgca catgtgtgaa gttacagcaa taaaaaaact tgtcggccag 4020 gtgtggtagc tcatgcctgt aatcccagca cttggggagg ccaaggcagg aggatcactt 4080 aagccccaga gttcaagccc agccagggta acatagtgag accctgtctt tacaaaaaaa 4140 aaaaaattta attagtcagg catggtggca cacacctgta gtctcagcta ttccagaggc 4200 cgaagtggga ggatcatttg agcccaggag gctgaggctg cagtgagcta taaatgcacc 4260 actgcactgc agcctgggtg acagagtgag accttgcctc aaaaagaaaa gaaaaaagaa 4320 aaatcatcct gaaaatattt tgtgcggcag agaaaacttt ctgcagttta aaattttctg 4380 caaatagtct gcagagtaca aatgtaagtt atattcatca aagttttctg tatgaggtat 4440 aagaaatcaa aggcaggcca tgcacagtgg ctcataccta taatccctgc actttaggga 4500 actgaggtgg gaggatcact tgagatcagg agtttgatac cagcctgggc aacatagtga 4560 gaccccatct ctaaaaaata aaaataaaaa ataaatcaaa ggcagagtca taatcaagac 4620 catgacacca tgtaaattct gtgtctgctc ttgactctat tataacttct aagatttttt 4680 tcaagatgtt ttcccttcat ccttatcact taattaagca tccgtcactt ccttcctgtg 4740 gtttcagtgt ataaaagaat ttttacaagc ttttctccct tcagcaataa caggtaacat 4800 ttcgctaagt ccagttgtac atttaagcat ataacaacat gcttaattat tagatgctta 4860 caagctttgc ttggcatagg tgtaccatgt attattctat gtctttcctt cccactgtcc 4920 tatgatagcc attaccttct gaaatctcag taaatgatgc actaccctat tagcattctc 4980 tcttctgtta gccctcctta tgagagttat tctttccctc atcccactcc taaaaattca 5040 tttggccttt gtggagtatt tagatcaagt cattattaaa ctattcccca ctagaattat 5100 taatagttga taaaatatgg aaaatatatt attcatatgt gagtgaaaga acacttaaag 5160 cataaaaaag aactacatgg ccatatattg catggcaata actatattag cagcaataat 5220 aattgtaata gtaataataa taatggctaa cactttagaa gcttctgtgt taggcatttc 5280 cgggtgcttt tcatggtaca gaagctcatt tgttcctcat actaaccctc ttcactactc 5340 tgccactgcc tctcaagcca tggatatgtg cactttagag tttttactta aagtaaaaat 5400 tcctgtagaa tagatggtgt tgaccccatc agaccgtgat gcagttagaa gtgcatcccg 5460 tcttttacga tggccataca acatcacaca aatcaaggta aacccttgat ccccaaattc 5520 tcaatgtatt aataatgaac agagttacac aagaatttta gcatttaagg aaacaggaga 5580 gacgataata ctggaaataa tttttcagaa tatttctgtt cggattgatg gcagagtgca 5640 ggccatatac attgacaatt attccagaac acaattattg tttggagcta aaaggatgca 5700 aaccctgcct cttggcttat atggatttat ttatgtttag gccattgaaa taatggtaga 5760 aaggtaagta tgatatgcta attaagaaca gacttccttt ttatatttta accaaagaac 5820 tcaatatcaa caaaagacta gtcagtggta ttcacccttt ttgatcatac acacctatca 5880 gtgaaagctt tgactactac acaccctaat ttattatctt tatttgtaaa ttgtgtgcct 5940 actttggtgt aacaggtaca tccgtaaaac atacacatac atagaatttt aaagattgga 6000 ataaaagtta atacaaatag aattccaaaa ctttcttacc acctacctag aagttgtaac 6060 attttcttcc catagcccag tgaattgcct tgcacctgct ttggcgacca ataggaagaa 6120 aggcaatgat atcatggaaa ttgtctcttt ggctcaacag ccacagcatt ttgcaagtgt 6180 ttctttgaaa acttgcttca ctgtgttttt caattttttt tttaaacaac acttaatact 6240 gccagacaac aattcagaca gtgtgctttt tgtttataaa gaacaaggaa gggctactgg 6300 aatctcactt gtcctttgaa acttttgctg accaagtgta gaagtgaggg catgccttct 6360 gctcacccac aaaacacacc ctgtgctcca ctggaccttc aaaccagtgg aaagacccaa 6420 cgctttttgt tttatctagc caaaatttgc ttatgcttac ccaaaacctg aaaagaaatt 6480 atattcttaa tataaataca atcacatctt gaaatcactt tgaaattttc tttattttcc 6540 ttttttcttt ccccaacata tgttctgaag tacacaggct gcatcagtca gccatttgtc 6600 ctgagcaata gtctttcaaa actagaagaa ttacttgaaa aaaagaagac tattaaggaa 6660 tttaaactca aataatttat tgaccacttg ctaggttgta cagggtaaat tttttttttt 6720 tttttttttt ttgagatgga gtcttgctct gtcacccaga ctggagtaca gtggcaccat 6780 ctcggctcac tgcaagctct gcctcccggg ttcacgccat tctccctcct cagcctcctg 6840 agtagctggg actacaggtg cctgccacca tgcccagcta attttttgta tttttagtag 6900 agacagggtt tcaccgagtt agccaggatg gtctcgatct cctgacctcg tgatccgccc 6960 acctcagcct cccaaagtgc tgggattaca ggcgtgaacc accgcgcctg gcccgactaa 7020 ttcatttatt cagcgagtgt tttctgagca cctactatgt acttgccact gttctaggca 7080 ctggggatac aggaatgaac aaaatcaccc aaatctctgc cctcccaatt ttctggtatg 7140 gagagaaagt tcttttgtag atagggatga gaatcccaca gaaaactcag gagtgatgta 7200 acaatgcaaa tgctcacaaa atctctttcc tcatctttca ttccctattt ggaaggaaag 7260 gtttcaaaga cattgatgtt gtataaatga ccatcttctt cattatttta taaacatttg 7320 tcctgtgcag agtaaaaaca actggactgc ataacaaatt atacctattg agagttgggt 7380 aaagagttac cattggatcc agtccaccaa cccaaatgtt tttctacatg tattagctga 7440 gatgagctcc tcatctcagg agaagcctat tcccactgca ggccttcttg agtctgctgt 7500 gttcatcatt cccaccacca acacaaaaat acaagattgg ctctggaaat ccttcacaga 7560 gaaggaagga aaggaagatg gtgaggttgg ctttttagct gtgatcagca accaagctgg 7620 tctttgctat gagaatcagt gggaccatga tctctatggt catctcagga agggagggct 7680 aatgaagtgg tctctggcca tgattcctaa gaagagagaa tggacagcaa agatcgcagc 7740 acctgccaca gcccacctgc tgcagattca gaccccctgg tggggccagg ttgttatgac 7800 taacccctag cactgtctac atttagtggt gatggatgcc aaggaggggg cagtgtcccc 7860 ttggatctga ttgtaaagct tagaaccaaa gcatatgtgg aaagttgtag ggtcatgagt 7920 taagggacag aaatgagcaa gagagaagcc cttggctcat atattcccac tgcaggcctt 7980 cttgagccct ctgtattcat cattcccact gtctttcaag cccaagctca tgctttgttc 8040 tcatgggcac tcatttttag gatatctttt gtccctcttg actttatgtt gtgtgatacc 8100 aactctttag tagttttttg tattatttaa cttcatgtgt ttatctgctc ttgagtctcg 8160 agggcaggat ttatgcagtt tacttctgtt tattcctctt agcccttgca cagtgctgta 8220 tacatagaca tctactatat ttttgttaaa cagagcaaag aatggctggc aattggagaa 8280 tgcagagaaa ccgaaaaatt ttaaatttaa aaatcacaaa taaaaacagc aggatgaagg 8340 caagaaagca aaagggtgga aagtgattaa aatgaaggtg gcagaaaaaa cagaaagcat 8400 tcctctttga gtttgagtct gttatagtgt gatctcttct gtgtatgcat gtatgtgtgt 8460 gtaatgtata tgtgcacaca catgcatgca tgccttcgtt gagtttctat tccgaactaa 8520 ggaaatgcaa gcaatatact gttttactta ttttatggca gggcttaaca ctttccattt 8580 gagtgagtga cttttaagaa tgacatcggg taagtataat ggtgagccct tataattaat 8640 acattggtga agaaaaatat actagtcata ttaaggtaag tttcatattt ctaaaacact 8700 gtaataaaat ataaatattt tgcttttcag ctgtcagtgg tagctatagg aattaacata 8760 tacagaacat caaatgtgga ggtgctacta cagtttctgg aagatcaaaa tactttcccc 8820 aactttgagc atctggcata ttggcagata cagttcaaca atatagctgc tgtcacagta 8880 ttttttgtct ggattaaggt aatttataaa tttcatgttc tacattttaa ataatatttt 8940 ctttaaaaaa aatgagttcc acaaaatcat ggaatacttg aatttgaaat tcaagtgacc 9000 agccaaagct gctcaatatt tactttgaga cagggtctca ctctgtcacc caggctggag 9060 tgcagtggta tgattacagc tcattgcagc ctcgacttcc caggcccaag cgatcctccc 9120 accttatcct ccgaagtcac tgggactaca ggcatgtgcc accatacccg gctaattttt 9180 aaattttttc gtagagacaa ggtctcatta tgttgcccag gctggttttg aactcctggg 9240 ttcaagcaat cctcccacct cagcctccca aagtgctggg attacaggca tgagccaccg 9300 tgccaggcct catattttac atataaagta aactattgag actcatgtga tcattcctct 9360 cactgtcaat gacatacttc tgctatctga attagtgcaa gatcagtccc tataggtttt 9420 gtttaacaaa tgcagtaaga ggcctttcag tgtgttagct gggcctgggg ccccaggctg 9480 ctaacagatg agatgaacag gtgaaggaaa aggaacttag agaaagagag ggaaggagca 9540 ggtggaggga aggggagagt tgctgcactt ggaaatgctt gctagaaggg atcgcctctt 9600 ttccaggtag aggctgtaag ggaagcttta cctagaatta aggttggaac agacactgct 9660 tccaaatagt tccttgctca ctattttcct tattgtccca agatataatg tgcatttcca 9720 tgtgtgtgaa aggttatgac atttcatata caacaagcct caattctgga gatgcaggaa 9780 atttcaataa ttctcaggca gcagctgcca ttcggtcacc agcacaggct ctgattgtgc 9840 tgtccagaca gtaagtacta gccacatgtg cctatttaaa ttcaaattta aattagttaa 9900 gcttaaatac aattaaaaac gcagttcctt ggtcctactg gccacacatt aagtgttcaa 9960 tggctactgt ctaggacagt ggaaatgtag aacatttcca tcatcacaga acgttctctt 10020 gaaaagcact gttctggaag gtacttaccc gttatgtact tttctgagtt ggtattcata 10080 cctagaagac ctgaggttta tcacaagaca tagacttgga ccaggcgcag tggctcatgc 10140 ctgtaattcc agcattttgg gaggccgaga taggtcccct gagcccagga gtctgatacc 10200 agcctgggca acatggcaaa acctcatctc tactaaaaat acaaaaatta gctgggggtg 10260 gtggcacgtg cctgtagtcc tagctactta ggaggcttag gcgggaggat tgcttgaatc 10320 cagaaggcgg agggtgcagt gagccaagat cgcaccgctg cactccagcc tgggcaacag 10380 agtgagaccc tgtctcaaaa aaaaaaaaaa aatgcataga ctttatcctg tatttctcat 10440 gctatttatt tattgacatg cttgttcaag agaaaccatc actaaagcac aaaaccttga 10500 tcataacata gtaataataa tcaaacagca aaaataataa tagtaataag aatgttctgt 10560 ggtgatggaa atgttctata ttttcattgt cctagacagt agccactaac catgtatagg 10620 catggaacac ttaacatgtg gctagtagga ccaagggact gaatttttaa ttgtatttaa 10680 tcttacttaa tttaaatttg aatttagata tccacacatg tttggatagc acagtcagag 10740 cctgtgctgg tgaaaggatg gcaggtgctg cctgagaatt actgaagttt ccttgattat 10800 tattagttta ataataataa tcaagatagt aataataatc aagatagtaa taataatcaa 10860 gatctcagct gggcacagtg gctcacgcac tttgggaggc tgaggcgggc agatcacctg 10920 acgtcgggtt tgagaccagc ctggccaaca tggtgaaacc ctgtccctac taaaaataca 10980 aaaaaaaaaa attagctggg tgtggtggca cgtgcctatg atcccagcta cttgggaatc 11040 tgaggcagga gaattgcttg aacccaggaa gcagaggttg cggtgagctg aatcatgcca 11100 ctgcactcca gcctgggcaa cagagcagca cttcgtctca aaaaaaaaaa aaaaagatct 11160 caaatgaatt gggattgtat taagtaatga ttaagtaatg tgattacagc aatcctcaag 11220 aaatatttca ctgtggccag taacaatgtg taacagacct ttaaacttct agagattttc 11280 ctacaacatg tgtctcaggc tgatgtgttt tatttagtgc ttctcttgga aatgtcttgc 11340 ccctcgatac tttatcatta aggtctttaa ggcagggatc atgactctac tttttttttt 11400 tttttttttt ttgggacgga gtcttgctct gtcgcccagg ctggagtgca gtggcacaat 11460 cttagctcac tgcaacctcc gtctcctggg ttcacgccat tctcctgcct cagcctcccg 11520 agtagctggg actacaggcg gctgccacca cgcccggcta attttttata tttttagtag 11580 agacggggtt tcaccgtgtt agccaggatg gtctcgatct cctgacctcg tgatccaccc 11640 acctcggcct cccaaagtgc tgggattaca ggcttgagcc accacgcccg gcctcatgac 11700 tctacttcta atatctcatc atgtgctctt ccactgaggc ttctacttag agctacacaa 11760 tctgggcagc catcctcagt gccttatcta ccaacatgct caatatggct ttgcagggtt 11820 cactgtctac cagcagggtt cactatctac caacatgctc aatatttctt tgcagtcagg 11880 cagagcaggc tttgcagttc aggcagggca gctggctgca ggccccagct gactcctggg 11940 gatagaatgc caatatttca gacattgcag agatttgagg caatgtacat aaagccctcc 12000 acatataact gatgcacaat aaatgacagt taatattatg caacaagaat ttcctggggg 12060 gttttataat taatttttat ttgtgtgaag ttttttccct cccttttact ttaatccttt 12120 ttggggggaa agcatcacta gtcacagttc acggcagcct cgacctccca ggctcaagca 12180 accctcccac ctcagcctcc tgagtagctg aaaccacagg tgtgtgccac cacacctgac 12240 taatttattt ttattttcta atgaaacaga atcttgccat attgcccagg ctgatcttaa 12300 actcatgggc tcaagcgatc ctcctgcctc agtcttccaa agtgccggga ttatagatgt 12360 gagccactgc actcagcctt tttttttttt tttttaattg tagatagcat aaaacctact 12420 gttttaacca tgcttaagtg tacaattcag tggcattaag tacattcaca gtgttgtgca 12480 gccatcgcca ttatgctgca ttattttcag aactttttca ttattctaaa ctgaaacttt 12540 gtatccattg aacactaact cccaattccc ccagtccctg gtaacctcca ttctactttc 12600 tgtcactgtg agtttgacta ttctaagtac ctaatttaag tggaatcata cagtatttgt 12660 ccttttgtgt caggcttatt tcactttgca tgatgttttc aaggttcatc catgttgtaa 12720 cctgtcagaa tttaatttct tttcaggatg aaataatgtt ttattatata cagtcacacc 12780 attttgttta tccattcatc tattgatgtc ttctctctct tacagctctt caaattcatc 12840 aattttaaca ggaccatgag ccagctctcg acaaccatgt ctcgatgtgc caaagacctg 12900 tttggctttg ctattatgtt cttcattatt ttcctagcgt atgctcagtt ggcatacctt 12960 gtctttggca ctcaggtcga tgacttcagt actttccaag agtgtatgta agtatatatg 13020 aaattaagaa gaaaaattta atcagagttg tcactgcttc tcaagaataa atcttcatat 13080 gaggttgcta tatgaccacc aattatttaa aaccagttat tttaagtaag aattaattac 13140 cttttcccaa aacattgatc tacccatgca aagaagacaa tgcatcctga aatgctgatg 13200 cttaagatag cagcccaaag tagtaaaata cagttaacag acataggaaa ccaacactgt 13260 tctgaagact gagtttttct ttgcaccaaa tgcagatggt agcttctaga aggctgtttg 13320 cctatattct tactcctgtt gaatattgtt gccatatatt tagaacttca agttattttc 13380 taaggaaaaa aacaagatat ttctaatatt ctaaggtaaa ctcagaccag tacaagaatt 13440 ttcagttttt ttttccaaag atcccaaatg tgaaataaaa caacaaaaag cagccagtgt 13500 cagatttcta tgccatttag aaaggagtta gtttaaaaag gaatggaagt aatagggttt 13560 tgtgcataga tatctcgaat taatattgct gttgataaaa gtgattttgc taagacccag 13620 cactgacaac acttggccac tttgatccca ttttaagtac ttgtcagaat attggatctt 13680 tgaactcaaa ccattttggg tttttggggt ttttttgttt tgtttttttt tgttttgttt 13740 tgtttttgag gcacggtctt gctctgttgc ccaggctgga gtgcagtggt gcaatcatag 13800 ctcactgcag ccttgaactc ctaggctcaa gcaatcctgc tgcctcagcc tgctgagtag 13860 ctgggactac aagtgtatgc caccatgcct ggccaatttt taactttttt tatgagaagg 13920 gatctcactg tgtagcccag ggtggtattg aactccaggg cctcacactg tcctctcacc 13980 tcagcttcca aaagtactgg gattacaggc atgagccacc acaccaggcc ctgttgtttt 14040 ttttttaaag aaatttttaa ctttagaccg agggtgactg ttgtcaaggt ttagggttaa 14100 gatgttttac ctagattatg tgttgaaatg ttatagccaa ttgctttata agttattgaa 14160 taataattgt attttctttt tttttttttt tttgagatgg agtctcgttc catcgcccaa 14220 gctagagtgc agcggtgtaa tctcagctca ctgcaacctc tgcctcccgg gttcaagcga 14280 ttctcctgcc tcagcctccc gaatagctga gattatgggc gcacgccacc aagcccagct 14340 aatttttgta tttttagtag agacggggtt tcactatatt ggccaggctg ttctcgaact 14400 cctgacctcg tgatccgccc gcctcggcct cccaaagtgc tgggattaca gacgtgatcc 14460 accgtgccca gcttgtgttt tctttttaac caaatggaaa taacctctgt agcatgaaag 14520 cattttatta ttattgcaga aggctttaat tgctgataca agtagcaaga ctttgtaaat 14580 gggattgaca attttctgtt attcggcagc tacctatact gctaaaaggt ccaaaaataa 14640 tgaaatcatc tttaagaaat gttgcatcaa ctagtggaca ttctttgttt ttgtattgtg 14700 gtgttttgtt ttatttttat agcttcactc aattccgtat cattttgggc gatatcaact 14760 ttgcagagat tgaggaagct aatcgagttt tgggaccaat ttatttcact acatttgtgt 14820 tctttatgtt cttcattctt ttggtatgta catttttatt tatagtgagg ttcaatttaa 14880 acttcgtaaa tccttgtctt ctcttttctc tcacacttta tgtcctatca attttaaata 14940 aagacccagg aagtagaaaa aagtgtggat gttggaaaac ttattttcct tttattaatt 15000 cacagttttg agactcatat caaatgtctt ttctgtggtc tttcattgat ccatgtatat 15060 gtgtctattc aatgcaaaaa aaattagatc tcttccatgg tctttcattt ctctctctat 15120 atatgtatct attccatgca aaaaagaaat tagatcaagt acaaatttat aaagatacct 15180 aaaatagtgc tttgcctaaa aagtagaata tgcttacatg ctttttaaac tcatatgtca 15240 gcactttcgt agtcacttgc tagcatgact tttctctctt tcttcttttc tttttaaaaa 15300 ataagaacgg aaaagcaagc tagatctaag atgtcgagta atagttgagt gaatcattgc 15360 atgtcaaaat taggatattc tgttttaaat tatttatatc ccattcatct agagactgcc 15420 tacagagaat attcaaataa ttaagtttaa aactaaatgt aacaatgaat ggaaattgca 15480 ttaaaattat tttcaaaaat aattttttta ttctcttgat ttggtacaaa tgaacatttt 15540 taatgttttt gccctaagtc aattaagttt ttttaaggtg ttttgttctt tttcttaaca 15600 tttatatatt caattgtcta ctgagaaggt gttaagccag cttaatttag gcaatatttt 15660 tcatctaaac actaacagtc atcttaagaa caattttctt aagaaaataa cattttttcc 15720 atttcagtaa attgtgtaaa gatcccttga ggaaggttaa gtgatcacat tttcagtaat 15780 tcagtgtaat aactctaaag tcagtccagg tattactggt taagtatatg gtatttattg 15840 attgggtatt agatgtactg tattaatttc ctgtttaaaa aaaatttttt ttccggggag 15900 acacagcctc tggtgtaaaa caaaggtgtg ttccctagct gtactttaac aggactgaaa 15960 aggtcaggaa tatcattcaa gttcatatgt atcttgctgt atgcatggtt tatggctcat 16020 ttttaaactt acacctctta agcttcttct tcctatcata tattaaaaca atggagagaa 16080 gaataagcct ctgttactct accattgata gtacttcgga ttctagagta cctgaatctc 16140 tactaagaag gcaaaaacca ggaattgaga gtcctgcacc tgacccttca gttgatctca 16200 ggccacctag ttttctccgt ttatcaatct gccaaacaag gatggataga gtcgtggcaa 16260 ctggaaaggc tcaaatgtgg aattgtttga atgtggtcct ttagtaggca gccatcttac 16320 cagatctaga gtattcagtc atcttaccag atcagtcacc agaacatgaa aagaagctct 16380 tagtttctat ctttatacta aaattgtttt tttgtacgac tgcacaaaaa agaattgctc 16440 tccttgcacc tcccagagat ataggtggat agatacatac atacgtacat acatacatac 16500 atacatacat acatacatac atagacacat acatagatag aagtctactt tcaatacaaa 16560 cctgtctttt aaggaaatga caagctgagc atagggttgg ccacctttct gagccgattg 16620 cctggtatta gtttattgcc cctgtttagc aagaaggcac agtgttaaga agtggctcag 16680 ctgaaccagg ataaccccac tcttccccca catcaacagg aaagacatcc tggtgcagat 16740 gtccatctga taattcaggg aacctcggga gacaggatgg agaggagggt gagctagctt 16800 cctcttccca caccttcaag agcctttctc aagcactttc tattttttga aatctcttta 16860 gaggtcccag actttgatct gtttcaatta aggtattggc aggcattagt taacagccac 16920 ttggaagcaa aaatagaaca ttagatccct gagttggaag agagaaggta gaaggtgtta 16980 cttggactgc aattatctgc acttggaatt gagcatttag tcaaaaactt atatgtattc 17040 tatattctat tctcatttct gctacagaat tgtaaacaat attcttcctt aatacagaaa 17100 ttcatagccc actaaaataa gagcgttctc atttgttcat ttctcaatca tttaataagt 17160 atttactaag ccactatatc catatatata tatatatcat atatactgta taatacacac 17220 tgtagtgttt tttgtggatt gtgtactatg aggtagtatg ttagatactg ccagtactgg 17280 ggtaaggaaa acagcctgat taggccctta cgaagattcc tcagacttgt ggggaaaaca 17340 gacattatca aatagaaata cttgcaaacc acagttatgt gttaaaaagg aaaaacaaag 17400 taaaaaaaaa gttggtgggg gggaacctga tctcctggat acagtgcttc gagaaagttt 17460 gttgttggaa atgcaaacca ttactactgt ggaagggaaa ggtcagaaaa atgaactcac 17520 cattactgaa tagtaatagt agctatcaat taggtggcac ttacctgcat caggacctgt 17580 cctgagcact ttacatagat tgtctcacta accagcccaa caaatatgta agggagatac 17640 tattattttt cccattttat taatgtaaaa caattaaata attctttaaa attagactta 17700 gaaaagtgga gcaacaatct tagcagtgct aggactgaaa tccaagtttg cttgactcca 17760 aagtctatct ctcttccaga aactttttct ttactatctg cctagtaggc ctgctgtatt 17820 cctatttgca acagcctttt aaactcttta aaaatgtgtc ctgtaaattt catatatgat 17880 tatacaaaaa aacttggaat aagcatacaa ttctacttat ctgtgttaac tgttgaaatt 17940 tgaagagctt tttggaattc tatacccttc agtagtgtat gtaaaagttt ctaaatatag 18000 agaacataga taagcaaaaa taatattaaa taaaataatc gcaccattag taggtaaata 18060 tactaatatt ttgttgtatt ttattcttgt atgttttcac aaagtatatc ataaaatttt 18120 tcctgtggca tgacttaacg gagaaaataa tcttcccaaa acatgtggca gcaaaactgt 18180 taatttatta catcaggctg ggcacagtgg ctcacgcttg caatcccagc actttgggaa 18240 gccgaggcgg gcagatcact tgaggccagg agttcgagac cagcctggcc aacgtggtga 18300 aacactgtct ctactaaaaa tacaacagtt agccaggtgt agtggcacat gcctgtaatc 18360 ccagctactc aggaggctga gactcaagaa ttgcttgaac ccaggaggca gaggttgcag 18420 taagctgagg tcgcgcccct gcactccagc ctgggcaaca cagtgagact ctgtctcaaa 18480 aaaaaaaatt tttttttaaa taaataaata ataaatttat gtcttcataa agcactcaga 18540 ttaggaaaaa aaggataaac aaaaaggcat gtgtcatttt tttgattgat aattccaaat 18600 tatgtttctt cctttaattt ttgccctcct ttcatttaca aacagaatat gtttttggct 18660 atcatcaatg atacttactc tgaagtgaaa tctgacttgg cacagcagaa agctgaaatg 18720 gaactctcag atcttatcag aaaggtagga aaaaccttaa ttctcagaat tcttctgttt 18780 ctgacataaa atgagcattg tttcacccag attttcaaat caacattgat ccattgaaat 18840 tgtttgaaat aaagaataca ttgctatatt tcaggaataa tttaaatgtt ccctatcttg 18900 gagtcttgat ggatatactg ctatcttgaa ttttaattct gggaatcctt ttatgccctg 18960 gaattaaatt ctcaacaatc ttttgacact ttaagagctg agctgaaggt tcatcacctt 19020 cattattttg acatctcctg tagctggctc tcacttcagg atcctgagtt gagaataaac 19080 tagaagggaa gattatataa agggatttcc acctcttctg tctcaattac cattttaaaa 19140 aaataaaaag ttttagagga aaacacttag tagttcaccc tttacccttg accttccacg 19200 gcagttttaa aataagcaaa ggaaaagatt catgaattca ggccatagcc tggggcctga 19260 gaacttttac ttatgcacct tctcaggaag ggtttcattg ttaaatagaa gggcaggaca 19320 ggaaagttgg gcctctttgt tcttctcaat gtaacttctt tatttggttt aaagtataaa 19380 atgtatacaa caacaaataa ccacatttaa aatacacagt ttgtttccca acatcatttt 19440 gctaagtcat agtggctcct taactgtaat tttttttttt attagtccaa gccttaggat 19500 tatgttatct gtgatatatg ttataataga aaacttaagc ctcttaaaac aaagtccttg 19560 ggatgggacc taagattcac attatcttga ttccgcataa cagttgctta cattttagca 19620 aatctccagt gtgtatgcaa gcactcctca cttggcacaa ttctgataca cacaaacttt 19680 ggttacccca gttttgttat gtaacaccac cttcaacaac acagttcaaa tttcagttat 19740 catagtatat taactctgag taacagcaca aagtacaaac tccactgcta gctcttcagt 19800 gtatagatca gttacctgag taacagatgt gcaggctgag caggctcact ggtcagtcat 19860 gacactattt tcagtctgtt actaattggt cactgagcat ctgctatcca attcacaaac 19920 aaagaaagca tgtagtgttg cttccttgtg ttccagtaat aagcccatgt gacattttac 19980 aaaaatggat aattgaaaaa gagaatgggt gcagtggctc acgcatgttg ggaggccaag 20040 gcggatggat cacctgaggt caggagttcg aaaccagcct ggccaacatg gtgaaacccc 20100 atctctacta aaaatacaaa attagctgag tgtggcgaca gatgcctgta atcccagcta 20160 ctggggaggc tgaggcagga gaatcgcttg cacctaggag gcggaggttg cagtgagccg 20220 agatcgtgcc attgcactcc agcctgggta acaagagcga aactccgtct caaaaaaaaa 20280 aaagaaaaga aaagaaaaga aaaagagaat gggctagcaa agaaatgaaa aatggtaaca 20340 ctggaagtga aaatcaaaac agagtaatgg atttatagaa gaaatagctg agtgaagaag 20400 aaataggagt gttgacactg cgatcattca agagatccag atatggagcc agaagaactt 20460 agggcaggtc tatcaactta aatgaggaaa atagctgtga taaaacagat gaagatgtct 20520 tgaggaaatg atgcctgcaa aaaacttcac attaagggaa gtcttattag agatatttca 20580 caataatgaa agtacaaaag aaaaaatgtt ggggctggac atggtggctt actcctgtaa 20640 tcccagcact ttgagaggcc aaggtgggtg gatcacttga ggccaggaag tcgagacaag 20700 cctgatcaac atgatgaaac cccgtctcta ttaaaaatac aaaaattagc cagacatgat 20760 ggtgcacacc tgtaattcca gctactcaag tggctgaggc acgagaattg cttgaaccag 20820 ggaggcggag gttgcagtaa gctgagattg caccactgca atccagccag gtgacagggt 20880 aagactgtgt ctcaaaaata aataaaagaa aaatatgttg gaagctcatc cacatttaag 20940 aaggaatatg acaattcact aatgcataga aaagaagttc actccacatt gtaaagtgta 21000 cagtgtaata ttatacaatg aaaacaaggc aagtgctgtt taaactactc tggatacatt 21060 ttttacaaag aaataaaaca ctttagtttt taatgtttct aatgttttac attttagtgt 21120 attaaatcaa tattagtttt cttctttttt aagctcccta tacatttata actgacacta 21180 agggagtgtt taatgttttg attaaaagtt gtaaagatca cagaacaatt gtaattcttc 21240 ccactgatta ttcagatcat tttgcacaat ttcagcttgc atggtcactt acagtgccgc 21300 actatgtgca aagcaaggtc aggtctaaag ttcgctaatg aaaaatcctc ggccaggggc 21360 agtggctcac ccctgtaatc ctagcacttt ggaaggcgag gcaggcagat cgcttgagct 21420 caggagttca acaccagcct gggcaacatg gtgagaccct gtctctacaa aaaaaaaaaa 21480 atagcaaggc gtggtgactc acacctgtag tcccagctac ttgttggggg ctgagttggg 21540 aaaatcactt gagctcagga ggtcgaggct gcagtgagcc agaatcacgc cactgccctt 21600 ctgcctgggt gacagagtaa gatcctgtct caaaaaaagg gaaaatcctc atctacattt 21660 cactgggttt tttgtttgtt tgtttgtttg tttatacaca cttaaggaaa ttactgtcta 21720 gaagatagat aatataaaaa ataaaaatgc aattcatgat tcgggtttct tggtattcct 21780 aagaactgtt gcacagtact ttatgctctg aggcagacag ctatagcata tatagtaatt 21840 tttgtttcta tcacataaac ttgaatacac atatgagtaa aagaccttta gttcttcatg 21900 acttactgaa agaccctgac tttttccatg taactgttcc acaagtgttt tatggaaaac 21960 tggatacatt aattcttcat tcatccagca cgtacttgtt gaatggccaa tgtacaccag 22020 gtttgtagta gttactactg tgaatggaaa gtaaaacaga tgcaaaagga gaatacacta 22080 aaccaagtct tttatttttt ctctctctga tagggctacc ataaagcttt ggtcaaacta 22140 aaactgaaaa aaaataccgt ggatgacatt tcagagagtc tgcggcaagg aggaggcaag 22200 ttaaactttg acgaacttcg acaagatctc aaagggtgag aatcatgctt cctgaggttc 22260 tgaaaaattc ctgcttctaa agataaattc ctggtgataa gagtatttct agcccaaggg 22320 ctcatacaga tacttttttt ttttttttcc agaggcaggt atctttctgg aacatgttat 22380 aagaggaaaa cttgccccca tttggtgatt tctcctttcc tcctgcattt tgatgtctct 22440 gtgttgaggg tgaactgggt acaaggaatg atttttatct gtatcctctc tctaatttca 22500 ggaagggcca tactgatgca gagattgagg caatattcac aaagtacgac caagatggag 22560 accaagaact gaccgaacat gaacatcagc agatgagaga cgacttggag aaagagaggg 22620 tgggtctggt ttaggagaac cggatttgat ttggtaccta caacaccaca gatgtatcaa 22680 acactataga agtagtgggt tattgagtct cttgcccatt ccccaccaca ctctctctct 22740 ctctcagtcg gtttatgtgt tagtaccctg tttattccag aaagaatata taacacaatt 22800 atgtataaaa atgggtggtt agcatgatat aaaaacgtca aaatgaaaag caagcaaaac 22860 aaaagtaaaa ataatggatt attaatgaag cttaaaaatg cattcataaa aacacatatg 22920 cttattaaga ttgggctaca aattgggccc taagcttgct ggtaatcagc ttgaaaagag 22980 aagcctgatt agctgcagag tccacaatgt ccgtgagagt gaagaaaaca aaaaatgact 23040 taccaagaga tgtgaaatta ttctggttag ttagtggcta tttaaattgt taactttttt 23100 ttcttttttt tttttttttg agatggagtc ttgctctgcc tcccaggctg gagtgcagtg 23160 gcacaatcgc gactcactgc aacctccacc tcccgggttc aagcgattct cttgcctcag 23220 cctcccaagt agctaggact acaggcacat gccatcatgc ccggctaatt tttgtatttg 23280 tagtagatat ggggtttcac catgttggtc tcaaactcct gactgcaagc aatctgccca 23340 ccttggcctc ccaaagtggt gggattacag gcagtagcca ccgtgccttt cctaaattat 23400 taacatttat aataaaatta acagccgcct tccatttgaa tactttttac aaaatagtta 23460 aaaataaaca taagtgggct tttatagtca gaaaaaaaaa ttcaaagctt taccattaac 23520 tttcaaaaat aaatggttag acagcaacaa caaaaatctg tggtaactga ggtacagaga 23580 acacagatga atgttattac aaaagccact ttcctatgag aagtctagga cagtggtttc 23640 taaatgccac tccacagaca gtgctagtag gtgacagact tctccagtca cagtgaaatt 23700 taagcataaa gaaaatgagg aaaattttta caaggctcta tttagacaaa gttcttattc 23760 tgacattaca tctttcctac tttggagctg ttgaatgtat tatcttttat gaaaagaagg 23820 cgatccaggt tgagcatccc taacccaaat atgtgagtct gaaatgctcc aaaacctaaa 23880 acttcttgag cacaaacatg atagtcaaag gtcatgctta aaggaaatgc tgtcattgga 23940 gcagtttgga ttttgggttt tcagattagg gatgctgaac cagtaagtat aatgcaaaca 24000 ttccaaaata tttttgaaaa tcccaaatcc aaaacacttc tgatcccaag tatttcaaat 24060 aagggatact caacctgtaa tatatttctt catttcttta tttattttat tattatttta 24120 agatggctca tggcccactg cagcctcaaa ctcctaggct caagtgatct tccgacctca 24180 acctcccagg tagctcaggt agctgggact gcaggcatgc atcaccatgc ctggctaatt 24240 ttttaaaaaa ttttttgtgg aggcagagtc tcaccttgct gcccaggcca gtctcaaact 24300 cctggcttca agcagtactc ctgcctcagc ctcccaaagt attaggatta caggtgtgac 24360 cactatgcct ggcccatatt tcttcattta gttttttctt tgcctgctgt gtttttaatg 24420 ttctttcttg ttcaaacaaa aagttggcta ttccttgctg ttagttaaat ttgccaatct 24480 atgaaactga aaaatgcagg agtcccagcc tggtgttaaa tacaaagaaa tcccaggtaa 24540 atggcatgca cccagttcct gcttgcccaa gtccttggtg aggcttctgt ggggtctcag 24600 tgttctgctc ctcactcagt gaccccttgt tcttcaggag gacctggatt tggatcacag 24660 ttctttacca cgtcccatga gcagccgaag tttccctcga agcctggatg actctgagga 24720 ggatgacgat gaagatagcg gacatagctc cagaaggagg ggaagcattt ctagtggcgt 24780 ttcttacgaa gagtttcaag tgtaagtata aaggaattgg cagaatttgc gttgacaaga 24840 gtccacatga gaccaggcag ttccctcatc tctctgaatt cactcctttc cattactaat 24900 catccagctt ttaaaaataa cttatactgg ccagacgcag tggctcatgc ctgtaatccc 24960 accactttgg gaggccaaag caggcaggtc atgaggtcag aagttcgaga cgagcctggc 25020 caacatagtg aaaccccatc tctattaaaa atacaaaaaa ttagctgggc atggtggtgg 25080 gcacctgtaa tcctagctac ttgggaggct gaggcaagag aattgcttga acccgggagg 25140 cggaggttac agagagccga gatggctcca ctgcacacca gcctgggcga cagtgcaaga 25200 ctctgtctca aaaaaaaaaa aacttgtcaa ttggtgtttt gtttcttaca taatatgttt 25260 actataaaaa ttagcaaata agagcaaaag aaaacattaa catttcacat atttctacca 25320 atgaaaaatg tttattaata tatcagtgtt tgtgtctcta tttgcatgtg tttatcaatg 25380 tttctatata tttttatggc ctaacatatg gttcgtcctg aagaatgttc cttgtgcatt 25440 tgagaagaat gaatattctg ctgttcaagt gttctgtaga tgtttgttag gtctagtttg 25500 tttacagttt tattcaggtc tcccatttcc tggttgatct tagatgtgcc tagatgtggt 25560 attcacgttt gaaagtgggg tattaaagtc tccaagtatt attagttgga gttcatccct 25620 tcaattctgt aaggttttgc tttgtgtatt ttggaactct gttgttgggt gcatacatat 25680 ttataactag tatattttcc taatatattg accctatttt ctctctcaac ttaatgaggc 25740 taaagaaaaa aaagaattga ccctgttttc attacaagat gttatccact ttatctctag 25800 taaaattctt tgttttaagt attttttgtt tgatattact gtaaccactc cagctttctt 25860 ttggttgctg tttgcatgat aaatcttttt ccatcctttt actttaaact tatttatatc 25920 tttcagtctg aagtatgtct ctcctgtaga cagcatataa ttggatctta tctttttatc 25980 cagtttgaca atttctgttt ttgattagat tgcttaatcc attcatttaa tgttatcatt 26040 gatgtagttg atttctgtct gctattttat tttttgtttt ctagcttact tttttttgtt 26100 cctctttcac tgctttcttg tacattaagt gaatattttc aagtataaca tttaaatttt 26160 tttaatgatt tttcattttt tttagtcagg agttgctcta agacttagtt tatacaatta 26220 agttatgaaa aattacttca gatatatatt aactgaatcc agtgagatat agaaatcatt 26280 tctatttagc ttttttcctc ttccctcttt ttgtgctata tattcatcta tctatatgta 26340 tatatagtca tctacatatg ttgcaaatca cattgttaga acaatgttac atttttataa 26400 cacactgtgt aatatatagt atataatttt atatctctta atgaagctga gagaagagga 26460 agtatatatt tataaatgtg tatattaacc tactttttta ccatttctaa ttctcttctt 26520 ttgctcctct ggattcaagt tatcatctgt cgtcattctc tttctccgat acagctttgc 26580 tactgcctac ctcctattat tgtcaaatat attacatttc tattatagac cttcagatcc 26640 aattatgtac atatttttac acaactgctt tttaaatcag ttaaggaaca aaaggagaaa 26700 tgtacatata tactatattt tatacctaca cagttatctt taccagtgtt ctttgccttt 26760 tcatgtggat tctgattact atctggagtc acttgctttc agcataaaga atttccttta 26820 gtattttttg taaagcaggt ttgctagcaa tgaattcttt cattttttgt ttatctgaga 26880 atgtttttct ttctccttca tttcctctgg cttgtattgt ttctgatgag aagacaggtg 26940 ctaattttac tgtggtcccc ttgtacatga tgactcaatt ttctctcacc actttcaaga 27000 tttttttgct tttgtctttc attattttta ctgtgatatg tctgggtata aatctctgag 27060 ttcatcctac ttagaaagtg ttttttctgc ttctttcact ttctcttctc ctttgggacc 27120 cgcattatgc atatgcttag gggtatcaca tatttctctt aggctctgtt cgtcgtcatt 27180 ttttttccct ctctgttcct cagagtgcat agtctgtatt gatgtatctt caagttcact 27240 gacttgttct tctgtcagct tgcttaaatc tctgttgagc tcctctagtt atttatttat 27300 ttatttattt attttatata tatatatata tatatatata tagagagaga gagagagaga 27360 gagagagaaa gagagagaga gagagacagg gagacagggt ctcactccat cacccaggct 27420 ggagtacagt ggtgtaatca tggctctcta cagcctgaac acctgggctc aaatgatcct 27480 cctgcctcaa cctcccaagt agctaggact atgggcacat gctgccatgc ctggctaatt 27540 tttaaaaaaa aatttgtaga gatggcatct tgttatgttg cccaggttgg tctcaaactc 27600 ccggcctcaa gtgatccttc cgcctcggcc tcccaaagtg ctggggtcac aggtatgagc 27660 caccgcactt agcctgaatt ttttatttat tatacttttc aactccagaa tttctatttg 27720 gttcttttta gcaatctctg tctctttatt ctgtatttga tgatatcctg tatttgatga 27780 gacaatgtca tcataacttc cttttttttt taagagatag ggtctctctc tgtcacccag 27840 gctagagtgc agtggcatga tcctagctca ctgcagcctc gaactcctga actcaagcaa 27900 tcctcccacc tcagcctcct aagtacctga cactacaggc atgagccact gtacccagct 27960 aatttttatt ttttgtagag atggggtcta agttgcccag gctggtctca aactcctggg 28020 ctcaagtgat cctccctgct caggctccca aagtgctggg attacaggca tgaaccactg 28080 gacccagcct cctttatttc tttaaccatg gtggggtttt ttattatttg tttgtttgtt 28140 ttaacctgtt tgaatatatt tataataggt accttcaggt ctttgtctgc taagtctgac 28200 atctgggccc tctcaaagac agtttcagtt gtcttttttt ttttcttctt gtgtatggga 28260 acattttcct gtttttttgt tttgtttttt gttgttttgt tttgttgttg ttgttgttgt 28320 taaagattgg acatgttaga taatatattg taggaactct ggctagtgat tccctttcct 28380 ccccaggact tgtttttatt tctctttgct tgtttacttt ttcatacagt ctgtttcccc 28440 acagtgtctg cctctgactt tattccttag agggcgcagc tgtggccatg tacgtagtca 28500 ctctgggaag acagtggttt tagcagcgtg ctcattaact ttctctgacc tctttgttat 28560 acctcctgcc tctgtggata ttagacccag ttattacatt tcattgttta ctgattggtc 28620 tattgttttc cagaatgcct tgggatgtaa tttgctccac agtctgatcc acttaaattc 28680 aggcctcttt gcagggctag ttttagaggc cagtcttttt tttttttttt tttttttttt 28740 gagacagagt ctcactctgt tgcccaggcc ggaatgtagt ggtgcagtct cagctcactg 28800 cagcctcaat ctctcaggct caagcaatct tcccacctca gcttctcaag tagctaggac 28860 tacaggtgca cgccaccatg cctggttaat ttttgcattt tttatagaga tggggtttta 28920 ccatgttgcc ccggctggtc tcaaactcct gagttcaagc aatccaccca cctcagcctc 28980 acaaaaggcc gggattacag atatgcacca ccacgcctgg cccctgaggc cagtctttaa 29040 ctgtcttctt agctgtctct ttccctggtt ctctctggtg aactagctgg taatttgttt 29100 atctcataag gctaccagat tccttgtaaa tgcttatccc cacaatctcc attgttttca 29160 agagcatcgt tagtctttaa tttcctcacg cttcattcca aataaagtcc attcacttga 29220 gaagagttct atattcctat gacctgtgtc tccccatgag caaaactgct actgctttac 29280 agagccaggg acagtggccc acctctctgt ggcatcctgc tttatgaaca agtcactggg 29340 ctcagatggc agtctctgat tttctcacct tgcttcttct ggcatggaaa ctccacccta 29400 caagtgggaa ctgagtggaa gaagagagcc ccattcccct tagccactct taacaggatt 29460 agaacctctg caacatgcat ttaagaatgg gaacaggctg ggcacagtgg ctcacgcctg 29520 taatcctagc actttgggag gtcaaggcag gaggattgct tgagccagga gttcaggacc 29580 agcctgtgca acatggtgag accctcatct ctacaagaaa tagaaaaatt aactggtggg 29640 ttgtgtatac ctgtaatccc agctactcgg gagcctgaag tgggaggatt gcttgaacct 29700 ggaggcagag gttgcagtga gtcaagatta caccattgca cgccagcctg ggcaacagag 29760 tgagactctg tctcaaaaaa aaaaaaaaaa aaagagtagg aacattgagg ctgggcatgg 29820 tggctcatgc ctgtaatcct agcactatgg gaggccaagg caggagtatc acttgacgct 29880 aggagttcaa gaccaacctg ggtaacatag cgagactttg tctctattaa aaaaaaaaaa 29940 aaaaaaggtg taaaaaactt ttgtaacaag agtgggaaag ccgggcacag tggctcacac 30000 ctgtaatccc agcactttgg aaggccaagg caggcaggcg gatcacctga ggtcaggagt 30060 ttgagaccag cctggccaac gtggtgaaac cccatctcta ctaaaaaata gaaaaattat 30120 ctgggcatgg tggtgcacac ctgtagtccc agctactcgg gaggctgagg caggagaatc 30180 acttgaacct acgaggcaga agttgcagta agccaagatc acgccactgc actccagcct 30240 gggcgacaga gcaagactct gtctcaaaaa aaaaaaaaga gtggaaatgt taggatgaga 30300 aatgctggca gcctgcccct ccctgggaga tactgtagcc ctagactgga agttggggga 30360 ggagggagcc ctgtgctctt agctgcaccc atgtgaagtt gtgcttctat cacatgagct 30420 ggggacagga gagaaggctc agattatggc ttcagtgcca cagaatctct tcatactaaa 30480 atttagtaga ttttcttgaa taaatgcttt ttcatttgct gtacaccctt aaaagtttct 30540 agaaattttt aatatttgag ttttaaaaaa taattttcaa cagttacagt tatttcacta 30600 aagagagagt ctacagaacc ctcttgccac cattgcagag gttgtctttg gcttacgagt 30660 ttttaaagta tttgtataca ttttttaagt tcaaaataat agaattgtaa gtgaacatgc 30720 tgttttcata ctgtttttca agctttattt aatatattgt aaatctaatt ctattttatt 30780 aaatagtctg ccacagtata atgtctgatg tctccttaga attttattgt atggatgaac 30840 aatgattatt taatttccta ccaattgttg ggtgtttttt gtttgtttgt ttgtttttga 30900 gactgggtct cactctgtca cccaggctgg agtgcaggag tgcggtggaa tgatcacggc 30960 tcactgcagc ctcaacatcc caaggctcag gtgatccttc cacctcagcc tcgcaagtag 31020 ctgggagtac aggcacatgc caccatgccc acctattttt tagagatgaa gttttgccat 31080 cctgcccagg ctggctcgaa ctcctggcct caagcgatct gcacacttcc gcctcccaaa 31140 atgccaggat tacaggcgtg agccatcatg ccctaccccc ccatcaattg tttgatgtag 31200 ccatttttca atgatccgcg attaagaagc agcactcttt tatagccaaa aattacacat 31260 atataaaatt ttcctttaga aaatgttcta aaaatggaat gtctaactaa agggttaggc 31320 atacattctt aagacttctg atacgcgctg acttgcagga aagttgtttc agttaacact 31380 cctaccagcg gcatccgaga gttaatctgt aaagcttgag acaacttaga aagtgtttca 31440 aatgattgtg ttgcttaaga aaaaaatctt agcacttcct tttgaaaagc cagtggggct 31500 gaaaagacaa tgacaagcac tttgtccctc tgtactgtgt tttccttgca gcctggtgag 31560 acgagtggac cggatggagc attccatcgg cagcatagtg tccaagattg acgccgtgat 31620 cgtgaagcta gagattatgg agcgagccaa actgaagagg agggaggtgc tgggaaggct 31680 gttggatggg gtggccgagg tcagtagtca tgagctgaaa acaccgctgc tgagcatggt 31740 gttattaatg aaaatatatg ttgctgacag ttgtatttga agtattgaag aagagtaaaa 31800 aaaatttacg tttatagaaa ttcacaatga tgtttccatt tactctcatt ttcagatttt 31860 tttctctgaa acagaaacac tctttctata aaatctcttg ctataaaaca tcaatgtagt 31920 catattgtct aacccttagg ctgagatgtt tatctttctc cataactaca gataaaatta 31980 taatctggag gtgttacttt cttaatactc catatgctaa tggtcctgcc ttcactgcag 32040 ggtagaatta agtgaaaaat tactccagca actctgagat ttgctattat atgctgtaaa 32100 tctccagcct taccaaacta cagattattt ggtccctgga cttcctaagg catttccttc 32160 tactgccccc aacaccagtt tctttttccc tttttaggat gaaaggctgg gtcgtgacag 32220 tgaaatccat agggaacaga tggaacggct agtacgtgaa gagttggaac gctgggaatc 32280 cgatgatgca gcttcccaga tcagtcatgg tttaggcacg ccagtgggac taaatggtca 32340 acctcgcccc agaagctccc gcccatcttc ctcccaatct acagaaggca tggaaggtgc 32400 aggtggaaat gggagttcta atgtccacgt atgatatgtg tgtttcagta tgtgtgtttc 32460 taataagtga ggaagtggct gtcctgaatt gctgtaacaa gcacactatt tatatgccct 32520 gaccaccata ggatgctagt ctttgtgacc gattgctaat cttctgcact ttaatttatt 32580 ttatataaac tttaccca 32598 <210> 242 <211> 23828 <212> DNA <213> Homo sapiens <400> 242 atactttccc caactttgag catctggcat attggcagat acagttcaac aatatagctg 60 ctgtcacagt attttttgtc tggattaagg taatttataa atttcatgtt ctacatttta 120 aataatattt tctttaaaaa aaatgagttc cacaaaatca tggaatactt gaatttgaaa 180 ttcaagtgac cagccaaagc tgctcaatat ttactttgag acagggtctc actctgtcac 240 ccaggctgga gtgcagtggt atgattacag ctcattgcag cctcgacttc ccaggcccaa 300 gcgatcctcc caccttatcc tccgaagtca ctgggactac aggcatgtgc caccataccc 360 ggctaatttt taaatttttt cgtagagaca aggtctcatt atgttgccca ggctggtttt 420 gaactcctgg gttcaagcaa tcctcccacc tcagcctccc aaagtgctgg gattacaggc 480 atgagccacc gtgccaggcc tcatatttta catataaagt aaactattga gactcatgtg 540 atcattcctc tcactgtcaa tgacatactt ctgctatctg aattagtgca agatcagtcc 600 ctataggttt tgtttaacaa atgcagtaag aggcctttca gtgtgttagc tgggcctggg 660 gccccaggct gctaacagat gagatgaaca ggtgaaggaa aaggaactta gagaaagaga 720 gggaaggagc aggtggaggg aaggggagag ttgctgcact tggaaatgct tgctagaagg 780 gatcgcctct tttccaggta gaggctgtaa gggaagcttt acctagaatt aaggttggaa 840 cagacactgc ttccaaatag ttccttgctc actattttcc ttattgtccc aagatataat 900 gtgcatttcc atgtgtgtga aaggttatga catttcatat acaacaagcc tcaattctgg 960 agatgcagga aatttcaata attctcaggc agcagctgcc attcggtcac cagcacaggc 1020 tctgattgtg ctgtccagac agtaagtact agccacatgt gcctatttaa attcaaattt 1080 aaattagtta agcttaaata caattaaaaa cgcagttcct tggtcctact ggccacacat 1140 taagtgttca atggctactg tctaggacag tggaaatgta gaacatttcc atcatcacag 1200 aacgttctct tgaaaagcac tgttctggaa ggtacttacc cgttatgtac ttttctgagt 1260 tggtattcat acctagaaga cctgaggttt atcacaagac atagacttgg accaggcgca 1320 gtggctcatg cctgtaattc cagcattttg ggaggccgag ataggtcccc tgagcccagg 1380 agtctgatac cagcctgggc aacatggcaa aacctcatct ctactaaaaa tacaaaaatt 1440 agctgggggt ggtggcacgt gcctgtagtc ctagctactt aggaggctta ggcgggagga 1500 ttgcttgaat ccagaaggcg gagggtgcag tgagccaaga tcgcaccgct gcactccagc 1560 ctgggcaaca gagtgagacc ctgtctcaaa aaaaaaaaaa aaatgcatag actttatcct 1620 gtatttctca tgctatttat ttattgacat gcttgttcaa gagaaaccat cactaaagca 1680 caaaaccttg atcataacat agtaataata atcaaacagc aaaaataata atagtaataa 1740 gaatgttctg tggtgatgga aatgttctat attttcattg tcctagacag tagccactaa 1800 ccatgtatag gcatggaaca cttaacatgt ggctagtagg accaagggac tgaattttta 1860 attgtattta atcttactta atttaaattt gaatttagat atccacacat gtttggatag 1920 cacagtcaga gcctgtgctg gtgaaaggat ggcaggtgct gcctgagaat tactgaagtt 1980 tccttgatta ttattagttt aataataata atcaagatag taataataat caagatagta 2040 ataataatca agatctcagc tgggcacagt ggctcacgca ctttgggagg ctgaggcggg 2100 cagatcacct gacgtcgggt ttgagaccag cctggccaac atggtgaaac cctgtcccta 2160 ctaaaaatac aaaaaaaaaa aattagctgg gtgtggtggc acgtgcctat gatcccagct 2220 acttgggaat ctgaggcagg agaattgctt gaacccagga agcagaggtt gcggtgagct 2280 gaatcatgcc actgcactcc agcctgggca acagagcagc acttcgtctc aaaaaaaaaa 2340 aaaaaagatc tcaaatgaat tgggattgta ttaagtaatg attaagtaat gtgattacag 2400 caatcctcaa gaaatatttc actgtggcca gtaacaatgt gtaacagacc tttaaacttc 2460 tagagatttt cctacaacat gtgtctcagg ctgatgtgtt ttatttagtg cttctcttgg 2520 aaatgtcttg cccctcgata ctttatcatt aaggtcttta aggcagggat catgactcta 2580 cttttttttt tttttttttt tttgggacgg agtcttgctc tgtcgcccag gctggagtgc 2640 agtggcacaa tcttagctca ctgcaacctc cgtctcctgg gttcacgcca ttctcctgcc 2700 tcagcctccc gagtagctgg gactacaggc ggctgccacc acgcccggct aattttttat 2760 atttttagta gagacggggt ttcaccgtgt tagccaggat ggtctcgatc tcctgacctc 2820 gtgatccacc cacctcggcc tcccaaagtg ctgggattac aggcttgagc caccacgccc 2880 ggcctcatga ctctacttct aatatctcat catgtgctct tccactgagg cttctactta 2940 gagctacaca atctgggcag ccatcctcag tgccttatct accaacatgc tcaatatggc 3000 tttgcagggt tcactgtcta ccagcagggt tcactatcta ccaacatgct caatatttct 3060 ttgcagtcag gcagagcagg ctttgcagtt caggcagggc agctggctgc aggccccagc 3120 tgactcctgg ggatagaatg ccaatatttc agacattgca gagatttgag gcaatgtaca 3180 taaagccctc cacatataac tgatgcacaa taaatgacag ttaatattat gcaacaagaa 3240 tttcctgggg ggttttataa ttaattttta tttgtgtgaa gttttttccc tcccttttac 3300 tttaatcctt tttgggggga aagcatcact agtcacagtt cacggcagcc tcgacctccc 3360 aggctcaagc aaccctccca cctcagcctc ctgagtagct gaaaccacag gtgtgtgcca 3420 ccacacctga ctaatttatt tttattttct aatgaaacag aatcttgcca tattgcccag 3480 gctgatctta aactcatggg ctcaagcgat cctcctgcct cagtcttcca aagtgccggg 3540 attatagatg tgagccactg cactcagcct tttttttttt ttttttaatt gtagatagca 3600 taaaacctac tgttttaacc atgcttaagt gtacaattca gtggcattaa gtacattcac 3660 agtgttgtgc agccatcgcc attatgctgc attattttca gaactttttc attattctaa 3720 actgaaactt tgtatccatt gaacactaac tcccaattcc cccagtccct ggtaacctcc 3780 attctacttt ctgtcactgt gagtttgact attctaagta cctaatttaa gtggaatcat 3840 acagtatttg tccttttgtg tcaggcttat ttcactttgc atgatgtttt caaggttcat 3900 ccatgttgta acctgtcaga atttaatttc ttttcaggat gaaataatgt tttattatat 3960 acagtcacac cattttgttt atccattcat ctattgatgt cttctctctc ttacagctct 4020 tcaaattcat caattttaac aggaccatga gccagctctc gacaaccatg tctcgatgtg 4080 ccaaagacct gtttggcttt gctattatgt tcttcattat tttcctagcg tatgctcagt 4140 tggcatacct tgtctttggc actcaggtcg atgacttcag tactttccaa gagtgtatgt 4200 aagtatatat gaaattaaga agaaaaattt aatcagagtt gtcactgctt ctcaagaata 4260 aatcttcata tgaggttgct atatgaccac caattattta aaaccagtta ttttaagtaa 4320 gaattaatta ccttttccca aaacattgat ctacccatgc aaagaagaca atgcatcctg 4380 aaatgctgat gcttaagata gcagcccaaa gtagtaaaat acagttaaca gacataggaa 4440 accaacactg ttctgaagac tgagtttttc tttgcaccaa atgcagatgg tagcttctag 4500 aaggctgttt gcctatattc ttactcctgt tgaatattgt tgccatatat ttagaacttc 4560 aagttatttt ctaaggaaaa aaacaagata tttctaatat tctaaggtaa actcagacca 4620 gtacaagaat tttcagtttt tttttccaaa gatcccaaat gtgaaataaa acaacaaaaa 4680 gcagccagtg tcagatttct atgccattta gaaaggagtt agtttaaaaa ggaatggaag 4740 taatagggtt ttgtgcatag atatctcgaa ttaatattgc tgttgataaa agtgattttg 4800 ctaagaccca gcactgacaa cacttggcca ctttgatccc attttaagta cttgtcagaa 4860 tattggatct ttgaactcaa accattttgg gtttttgggg tttttttgtt ttgttttttt 4920 ttgttttgtt ttgtttttga ggcacggtct tgctctgttg cccaggctgg agtgcagtgg 4980 tgcaatcata gctcactgca gccttgaact cctaggctca agcaatcctg ctgcctcagc 5040 ctgctgagta gctgggacta caagtgtatg ccaccatgcc tggccaattt ttaacttttt 5100 ttatgagaag ggatctcact gtgtagccca gggtggtatt gaactccagg gcctcacact 5160 gtcctctcac ctcagcttcc aaaagtactg ggattacagg catgagccac cacaccaggc 5220 cctgttgttt tttttttaaa gaaattttta actttagacc gagggtgact gttgtcaagg 5280 tttagggtta agatgtttta cctagattat gtgttgaaat gttatagcca attgctttat 5340 aagttattga ataataattg tattttcttt tttttttttt ttttgagatg gagtctcgtt 5400 ccatcgccca agctagagtg cagcggtgta atctcagctc actgcaacct ctgcctcccg 5460 ggttcaagcg attctcctgc ctcagcctcc cgaatagctg agattatggg cgcacgccac 5520 caagcccagc taatttttgt atttttagta gagacggggt ttcactatat tggccaggct 5580 gttctcgaac tcctgacctc gtgatccgcc cgcctcggcc tcccaaagtg ctgggattac 5640 agacgtgatc caccgtgccc agcttgtgtt ttctttttaa ccaaatggaa ataacctctg 5700 tagcatgaaa gcattttatt attattgcag aaggctttaa ttgctgatac aagtagcaag 5760 actttgtaaa tgggattgac aattttctgt tattcggcag ctacctatac tgctaaaagg 5820 tccaaaaata atgaaatcat ctttaagaaa tgttgcatca actagtggac attctttgtt 5880 tttgtattgt ggtgttttgt tttattttta tagcttcact caattccgta tcattttggg 5940 cgatatcaac tttgcagaga ttgaggaagc taatcgagtt ttgggaccaa tttatttcac 6000 tacatttgtg ttctttatgt tcttcattct tttggtatgt acatttttat ttatagtgag 6060 gttcaattta aacttcgtaa atccttgtct tctcttttct ctcacacttt atgtcctatc 6120 aattttaaat aaagacccag gaagtagaaa aaagtgtgga tgttggaaaa cttattttcc 6180 ttttattaat tcacagtttt gagactcata tcaaatgtct tttctgtggt ctttcattga 6240 tccatgtata tgtgtctatt caatgcaaaa aaaattagat ctcttccatg gtctttcatt 6300 tctctctcta tatatgtatc tattccatgc aaaaaagaaa ttagatcaag tacaaattta 6360 taaagatacc taaaatagtg ctttgcctaa aaagtagaat atgcttacat gctttttaaa 6420 ctcatatgtc agcactttcg tagtcacttg ctagcatgac ttttctctct ttcttctttt 6480 ctttttaaaa aataagaacg gaaaagcaag ctagatctaa gatgtcgagt aatagttgag 6540 tgaatcattg catgtcaaaa ttaggatatt ctgttttaaa ttatttatat cccattcatc 6600 tagagactgc ctacagagaa tattcaaata attaagttta aaactaaatg taacaatgaa 6660 tggaaattgc attaaaatta ttttcaaaaa taattttttt attctcttga tttggtacaa 6720 atgaacattt ttaatgtttt tgccctaagt caattaagtt tttttaaggt gttttgttct 6780 ttttcttaac atttatatat tcaattgtct actgagaagg tgttaagcca gcttaattta 6840 ggcaatattt ttcatctaaa cactaacagt catcttaaga acaattttct taagaaaata 6900 acattttttc catttcagta aattgtgtaa agatcccttg aggaaggtta agtgatcaca 6960 ttttcagtaa ttcagtgtaa taactctaaa gtcagtccag gtattactgg ttaagtatat 7020 ggtatttatt gattgggtat tagatgtact gtattaattt cctgtttaaa aaaaattttt 7080 tttccgggga gacacagcct ctggtgtaaa acaaaggtgt gttccctagc tgtactttaa 7140 caggactgaa aaggtcagga atatcattca agttcatatg tatcttgctg tatgcatggt 7200 ttatggctca tttttaaact tacacctctt aagcttcttc ttcctatcat atattaaaac 7260 aatggagaga agaataagcc tctgttactc taccattgat agtacttcgg attctagagt 7320 acctgaatct ctactaagaa ggcaaaaacc aggaattgag agtcctgcac ctgacccttc 7380 agttgatctc aggccaccta gttttctccg tttatcaatc tgccaaacaa ggatggatag 7440 agtcgtggca actggaaagg ctcaaatgtg gaattgtttg aatgtggtcc tttagtaggc 7500 agccatctta ccagatctag agtattcagt catcttacca gatcagtcac cagaacatga 7560 aaagaagctc ttagtttcta tctttatact aaaattgttt ttttgtacga ctgcacaaaa 7620 aagaattgct ctccttgcac ctcccagaga tataggtgga tagatacata catacgtaca 7680 tacatacata catacataca tacatacata catagacaca tacatagata gaagtctact 7740 ttcaatacaa acctgtcttt taaggaaatg acaagctgag catagggttg gccacctttc 7800 tgagccgatt gcctggtatt agtttattgc ccctgtttag caagaaggca cagtgttaag 7860 aagtggctca gctgaaccag gataacccca ctcttccccc acatcaacag gaaagacatc 7920 ctggtgcaga tgtccatctg ataattcagg gaacctcggg agacaggatg gagaggaggg 7980 tgagctagct tcctcttccc acaccttcaa gagcctttct caagcacttt ctattttttg 8040 aaatctcttt agaggtccca gactttgatc tgtttcaatt aaggtattgg caggcattag 8100 ttaacagcca cttggaagca aaaatagaac attagatccc tgagttggaa gagagaaggt 8160 agaaggtgtt acttggactg caattatctg cacttggaat tgagcattta gtcaaaaact 8220 tatatgtatt ctatattcta ttctcatttc tgctacagaa ttgtaaacaa tattcttcct 8280 taatacagaa attcatagcc cactaaaata agagcgttct catttgttca tttctcaatc 8340 atttaataag tatttactaa gccactatat ccatatatat atatatatca tatatactgt 8400 ataatacaca ctgtagtgtt ttttgtggat tgtgtactat gaggtagtat gttagatact 8460 gccagtactg gggtaaggaa aacagcctga ttaggccctt acgaagattc ctcagacttg 8520 tggggaaaac agacattatc aaatagaaat acttgcaaac cacagttatg tgttaaaaag 8580 gaaaaacaaa gtaaaaaaaa agttggtggg ggggaacctg atctcctgga tacagtgctt 8640 cgagaaagtt tgttgttgga aatgcaaacc attactactg tggaagggaa aggtcagaaa 8700 aatgaactca ccattactga atagtaatag tagctatcaa ttaggtggca cttacctgca 8760 tcaggacctg tcctgagcac tttacataga ttgtctcact aaccagccca acaaatatgt 8820 aagggagata ctattatttt tcccatttta ttaatgtaaa acaattaaat aattctttaa 8880 aattagactt agaaaagtgg agcaacaatc ttagcagtgc taggactgaa atccaagttt 8940 gcttgactcc aaagtctatc tctcttccag aaactttttc tttactatct gcctagtagg 9000 cctgctgtat tcctatttgc aacagccttt taaactcttt aaaaatgtgt cctgtaaatt 9060 tcatatatga ttatacaaaa aaacttggaa taagcataca attctactta tctgtgttaa 9120 ctgttgaaat ttgaagagct ttttggaatt ctataccctt cagtagtgta tgtaaaagtt 9180 tctaaatata gagaacatag ataagcaaaa ataatattaa ataaaataat cgcaccatta 9240 gtaggtaaat atactaatat tttgttgtat tttattcttg tatgttttca caaagtatat 9300 cataaaattt ttcctgtggc atgacttaac ggagaaaata atcttcccaa aacatgtggc 9360 agcaaaactg ttaatttatt acatcaggct gggcacagtg gctcacgctt gcaatcccag 9420 cactttggga agccgaggcg ggcagatcac ttgaggccag gagttcgaga ccagcctggc 9480 caacgtggtg aaacactgtc tctactaaaa atacaacagt tagccaggtg tagtggcaca 9540 tgcctgtaat cccagctact caggaggctg agactcaaga attgcttgaa cccaggaggc 9600 agaggttgca gtaagctgag gtcgcgcccc tgcactccag cctgggcaac acagtgagac 9660 tctgtctcaa aaaaaaaaat ttttttttaa ataaataaat aataaattta tgtcttcata 9720 aagcactcag attaggaaaa aaaggataaa caaaaaggca tgtgtcattt ttttgattga 9780 taattccaaa ttatgtttct tcctttaatt tttgccctcc tttcatttac aaacagaata 9840 tgtttttggc tatcatcaat gatacttact ctgaagtgaa atctgacttg gcacagcaga 9900 aagctgaaat ggaactctca gatcttatca gaaaggtagg aaaaacctta attctcagaa 9960 ttcttctgtt tctgacataa aatgagcatt gtttcaccca gattttcaaa tcaacattga 10020 tccattgaaa ttgtttgaaa taaagaatac attgctatat ttcaggaata atttaaatgt 10080 tccctatctt ggagtcttga tggatatact gctatcttga attttaattc tgggaatcct 10140 tttatgccct ggaattaaat tctcaacaat cttttgacac tttaagagct gagctgaagg 10200 ttcatcacct tcattatttt gacatctcct gtagctggct ctcacttcag gatcctgagt 10260 tgagaataaa ctagaaggga agattatata aagggatttc cacctcttct gtctcaatta 10320 ccattttaaa aaaataaaaa gttttagagg aaaacactta gtagttcacc ctttaccctt 10380 gaccttccac ggcagtttta aaataagcaa aggaaaagat tcatgaattc aggccatagc 10440 ctggggcctg agaactttta cttatgcacc ttctcaggaa gggtttcatt gttaaataga 10500 agggcaggac aggaaagttg ggcctctttg ttcttctcaa tgtaacttct ttatttggtt 10560 taaagtataa aatgtataca acaacaaata accacattta aaatacacag tttgtttccc 10620 aacatcattt tgctaagtca tagtggctcc ttaactgtaa tttttttttt tattagtcca 10680 agccttagga ttatgttatc tgtgatatat gttataatag aaaacttaag cctcttaaaa 10740 caaagtcctt gggatgggac ctaagattca cattatcttg attccgcata acagttgctt 10800 acattttagc aaatctccag tgtgtatgca agcactcctc acttggcaca attctgatac 10860 acacaaactt tggttacccc agttttgtta tgtaacacca ccttcaacaa cacagttcaa 10920 atttcagtta tcatagtata ttaactctga gtaacagcac aaagtacaaa ctccactgct 10980 agctcttcag tgtatagatc agttacctga gtaacagatg tgcaggctga gcaggctcac 11040 tggtcagtca tgacactatt ttcagtctgt tactaattgg tcactgagca tctgctatcc 11100 aattcacaaa caaagaaagc atgtagtgtt gcttccttgt gttccagtaa taagcccatg 11160 tgacatttta caaaaatgga taattgaaaa agagaatggg tgcagtggct cacgcatgtt 11220 gggaggccaa ggcggatgga tcacctgagg tcaggagttc gaaaccagcc tggccaacat 11280 ggtgaaaccc catctctact aaaaatacaa aattagctga gtgtggcgac agatgcctgt 11340 aatcccagct actggggagg ctgaggcagg agaatcgctt gcacctagga ggcggaggtt 11400 gcagtgagcc gagatcgtgc cattgcactc cagcctgggt aacaagagcg aaactccgtc 11460 tcaaaaaaaa aaaagaaaag aaaagaaaag aaaaagagaa tgggctagca aagaaatgaa 11520 aaatggtaac actggaagtg aaaatcaaaa cagagtaatg gatttataga agaaatagct 11580 gagtgaagaa gaaataggag tgttgacact gcgatcattc aagagatcca gatatggagc 11640 cagaagaact tagggcaggt ctatcaactt aaatgaggaa aatagctgtg ataaaacaga 11700 tgaagatgtc ttgaggaaat gatgcctgca aaaaacttca cattaaggga agtcttatta 11760 gagatatttc acaataatga aagtacaaaa gaaaaaatgt tggggctgga catggtggct 11820 tactcctgta atcccagcac tttgagaggc caaggtgggt ggatcacttg aggccaggaa 11880 gtcgagacaa gcctgatcaa catgatgaaa ccccgtctct attaaaaata caaaaattag 11940 ccagacatga tggtgcacac ctgtaattcc agctactcaa gtggctgagg cacgagaatt 12000 gcttgaacca gggaggcgga ggttgcagta agctgagatt gcaccactgc aatccagcca 12060 ggtgacaggg taagactgtg tctcaaaaat aaataaaaga aaaatatgtt ggaagctcat 12120 ccacatttaa gaaggaatat gacaattcac taatgcatag aaaagaagtt cactccacat 12180 tgtaaagtgt acagtgtaat attatacaat gaaaacaagg caagtgctgt ttaaactact 12240 ctggatacat tttttacaaa gaaataaaac actttagttt ttaatgtttc taatgtttta 12300 cattttagtg tattaaatca atattagttt tcttcttttt taagctccct atacatttat 12360 aactgacact aagggagtgt ttaatgtttt gattaaaagt tgtaaagatc acagaacaat 12420 tgtaattctt cccactgatt attcagatca ttttgcacaa tttcagcttg catggtcact 12480 tacagtgccg cactatgtgc aaagcaaggt caggtctaaa gttcgctaat gaaaaatcct 12540 cggccagggg cagtggctca cccctgtaat cctagcactt tggaaggcga ggcaggcaga 12600 tcgcttgagc tcaggagttc aacaccagcc tgggcaacat ggtgagaccc tgtctctaca 12660 aaaaaaaaaa aatagcaagg cgtggtgact cacacctgta gtcccagcta cttgttgggg 12720 gctgagttgg gaaaatcact tgagctcagg aggtcgaggc tgcagtgagc cagaatcacg 12780 ccactgccct tctgcctggg tgacagagta agatcctgtc tcaaaaaaag ggaaaatcct 12840 catctacatt tcactgggtt ttttgtttgt ttgtttgttt gtttatacac acttaaggaa 12900 attactgtct agaagataga taatataaaa aataaaaatg caattcatga ttcgggtttc 12960 ttggtattcc taagaactgt tgcacagtac tttatgctct gaggcagaca gctatagcat 13020 atatagtaat ttttgtttct atcacataaa cttgaataca catatgagta aaagaccttt 13080 agttcttcat gacttactga aagaccctga ctttttccat gtaactgttc cacaagtgtt 13140 ttatggaaaa ctggatacat taattcttca ttcatccagc acgtacttgt tgaatggcca 13200 atgtacacca ggtttgtagt agttactact gtgaatggaa agtaaaacag atgcaaaagg 13260 agaatacact aaaccaagtc ttttattttt tctctctctg atagggctac cataaagctt 13320 tggtcaaact aaaactgaaa aaaaataccg tggatgacat ttcagagagt ctgcggcaag 13380 gaggaggcaa gttaaacttt gacgaacttc gacaagatct caaagggtga gaatcatgct 13440 tcctgaggtt ctgaaaaatt cctgcttcta aagataaatt cctggtgata agagtatttc 13500 tagcccaagg gctcatacag atactttttt tttttttttc cagaggcagg tatctttctg 13560 gaacatgtta taagaggaaa acttgccccc atttggtgat ttctcctttc ctcctgcatt 13620 ttgatgtctc tgtgttgagg gtgaactggg tacaaggaat gatttttatc tgtatcctct 13680 ctctaatttc aggaagggcc atactgatgc agagattgag gcaatattca caaagtacga 13740 ccaagatgga gaccaagaac tgaccgaaca tgaacatcag cagatgagag acgacttgga 13800 gaaagagagg gtgggtctgg tttaggagaa ccggatttga tttggtacct acaacaccac 13860 agatgtatca aacactatag aagtagtggg ttattgagtc tcttgcccat tccccaccac 13920 actctctctc tctctcagtc ggtttatgtg ttagtaccct gtttattcca gaaagaatat 13980 ataacacaat tatgtataaa aatgggtggt tagcatgata taaaaacgtc aaaatgaaaa 14040 gcaagcaaaa caaaagtaaa aataatggat tattaatgaa gcttaaaaat gcattcataa 14100 aaacacatat gcttattaag attgggctac aaattgggcc ctaagcttgc tggtaatcag 14160 cttgaaaaga gaagcctgat tagctgcaga gtccacaatg tccgtgagag tgaagaaaac 14220 aaaaaatgac ttaccaagag atgtgaaatt attctggtta gttagtggct atttaaattg 14280 ttaacttttt tttctttttt tttttttttt gagatggagt cttgctctgc ctcccaggct 14340 ggagtgcagt ggcacaatcg cgactcactg caacctccac ctcccgggtt caagcgattc 14400 tcttgcctca gcctcccaag tagctaggac tacaggcaca tgccatcatg cccggctaat 14460 ttttgtattt gtagtagata tggggtttca ccatgttggt ctcaaactcc tgactgcaag 14520 caatctgccc accttggcct cccaaagtgg tgggattaca ggcagtagcc accgtgcctt 14580 tcctaaatta ttaacattta taataaaatt aacagccgcc ttccatttga atacttttta 14640 caaaatagtt aaaaataaac ataagtgggc ttttatagtc agaaaaaaaa attcaaagct 14700 ttaccattaa ctttcaaaaa taaatggtta gacagcaaca acaaaaatct gtggtaactg 14760 aggtacagag aacacagatg aatgttatta caaaagccac tttcctatga gaagtctagg 14820 acagtggttt ctaaatgcca ctccacagac agtgctagta ggtgacagac ttctccagtc 14880 acagtgaaat ttaagcataa agaaaatgag gaaaattttt acaaggctct atttagacaa 14940 agttcttatt ctgacattac atctttccta ctttggagct gttgaatgta ttatctttta 15000 tgaaaagaag gcgatccagg ttgagcatcc ctaacccaaa tatgtgagtc tgaaatgctc 15060 caaaacctaa aacttcttga gcacaaacat gatagtcaaa ggtcatgctt aaaggaaatg 15120 ctgtcattgg agcagtttgg attttgggtt ttcagattag ggatgctgaa ccagtaagta 15180 taatgcaaac attccaaaat atttttgaaa atcccaaatc caaaacactt ctgatcccaa 15240 gtatttcaaa taagggatac tcaacctgta atatatttct tcatttcttt atttatttta 15300 ttattatttt aagatggctc atggcccact gcagcctcaa actcctaggc tcaagtgatc 15360 ttccgacctc aacctcccag gtagctcagg tagctgggac tgcaggcatg catcaccatg 15420 cctggctaat tttttaaaaa attttttgtg gaggcagagt ctcaccttgc tgcccaggcc 15480 agtctcaaac tcctggcttc aagcagtact cctgcctcag cctcccaaag tattaggatt 15540 acaggtgtga ccactatgcc tggcccatat ttcttcattt agttttttct ttgcctgctg 15600 tgtttttaat gttctttctt gttcaaacaa aaagttggct attccttgct gttagttaaa 15660 tttgccaatc tatgaaactg aaaaatgcag gagtcccagc ctggtgttaa atacaaagaa 15720 atcccaggta aatggcatgc acccagttcc tgcttgccca agtccttggt gaggcttctg 15780 tggggtctca gtgttctgct cctcactcag tgaccccttg ttcttcagga ggacctggat 15840 ttggatcaca gttctttacc acgtcccatg agcagccgaa gtttccctcg aagcctggat 15900 gactctgagg aggatgacga tgaagatagc ggacatagct ccagaaggag gggaagcatt 15960 tctagtggcg tttcttacga agagtttcaa gtgtaagtat aaaggaattg gcagaatttg 16020 cgttgacaag agtccacatg agaccaggca gttccctcat ctctctgaat tcactccttt 16080 ccattactaa tcatccagct tttaaaaata acttatactg gccagacgca gtggctcatg 16140 cctgtaatcc caccactttg ggaggccaaa gcaggcaggt catgaggtca gaagttcgag 16200 acgagcctgg ccaacatagt gaaaccccat ctctattaaa aatacaaaaa attagctggg 16260 catggtggtg ggcacctgta atcctagcta cttgggaggc tgaggcaaga gaattgcttg 16320 aacccgggag gcggaggtta cagagagccg agatggctcc actgcacacc agcctgggcg 16380 acagtgcaag actctgtctc aaaaaaaaaa aaacttgtca attggtgttt tgtttcttac 16440 ataatatgtt tactataaaa attagcaaat aagagcaaaa gaaaacatta acatttcaca 16500 tatttctacc aatgaaaaat gtttattaat atatcagtgt ttgtgtctct atttgcatgt 16560 gtttatcaat gtttctatat atttttatgg cctaacatat ggttcgtcct gaagaatgtt 16620 ccttgtgcat ttgagaagaa tgaatattct gctgttcaag tgttctgtag atgtttgtta 16680 ggtctagttt gtttacagtt ttattcaggt ctcccatttc ctggttgatc ttagatgtgc 16740 ctagatgtgg tattcacgtt tgaaagtggg gtattaaagt ctccaagtat tattagttgg 16800 agttcatccc ttcaattctg taaggttttg ctttgtgtat tttggaactc tgttgttggg 16860 tgcatacata tttataacta gtatattttc ctaatatatt gaccctattt tctctctcaa 16920 cttaatgagg ctaaagaaaa aaaagaattg accctgtttt cattacaaga tgttatccac 16980 tttatctcta gtaaaattct ttgttttaag tattttttgt ttgatattac tgtaaccact 17040 ccagctttct tttggttgct gtttgcatga taaatctttt tccatccttt tactttaaac 17100 ttatttatat ctttcagtct gaagtatgtc tctcctgtag acagcatata attggatctt 17160 atctttttat ccagtttgac aatttctgtt tttgattaga ttgcttaatc cattcattta 17220 atgttatcat tgatgtagtt gatttctgtc tgctatttta ttttttgttt tctagcttac 17280 ttttttttgt tcctctttca ctgctttctt gtacattaag tgaatatttt caagtataac 17340 atttaaattt ttttaatgat ttttcatttt ttttagtcag gagttgctct aagacttagt 17400 ttatacaatt aagttatgaa aaattacttc agatatatat taactgaatc cagtgagata 17460 tagaaatcat ttctatttag cttttttcct cttccctctt tttgtgctat atattcatct 17520 atctatatgt atatatagtc atctacatat gttgcaaatc acattgttag aacaatgtta 17580 catttttata acacactgtg taatatatag tatataattt tatatctctt aatgaagctg 17640 agagaagagg aagtatatat ttataaatgt gtatattaac ctactttttt accatttcta 17700 attctcttct tttgctcctc tggattcaag ttatcatctg tcgtcattct ctttctccga 17760 tacagctttg ctactgccta cctcctatta ttgtcaaata tattacattt ctattataga 17820 ccttcagatc caattatgta catattttta cacaactgct ttttaaatca gttaaggaac 17880 aaaaggagaa atgtacatat atactatatt ttatacctac acagttatct ttaccagtgt 17940 tctttgcctt ttcatgtgga ttctgattac tatctggagt cacttgcttt cagcataaag 18000 aatttccttt agtatttttt gtaaagcagg tttgctagca atgaattctt tcattttttg 18060 tttatctgag aatgtttttc tttctccttc atttcctctg gcttgtattg tttctgatga 18120 gaagacaggt gctaatttta ctgtggtccc cttgtacatg atgactcaat tttctctcac 18180 cactttcaag atttttttgc ttttgtcttt cattattttt actgtgatat gtctgggtat 18240 aaatctctga gttcatccta cttagaaagt gttttttctg cttctttcac tttctcttct 18300 cctttgggac ccgcattatg catatgctta ggggtatcac atatttctct taggctctgt 18360 tcgtcgtcat tttttttccc tctctgttcc tcagagtgca tagtctgtat tgatgtatct 18420 tcaagttcac tgacttgttc ttctgtcagc ttgcttaaat ctctgttgag ctcctctagt 18480 tatttattta tttatttatt tattttatat atatatatat atatatatat atagagagag 18540 agagagagag agagagagaa agagagagag agagagacag ggagacaggg tctcactcca 18600 tcacccaggc tggagtacag tggtgtaatc atggctctct acagcctgaa cacctgggct 18660 caaatgatcc tcctgcctca acctcccaag tagctaggac tatgggcaca tgctgccatg 18720 cctggctaat ttttaaaaaa aaatttgtag agatggcatc ttgttatgtt gcccaggttg 18780 gtctcaaact cccggcctca agtgatcctt ccgcctcggc ctcccaaagt gctggggtca 18840 caggtatgag ccaccgcact tagcctgaat tttttattta ttatactttt caactccaga 18900 atttctattt ggttcttttt agcaatctct gtctctttat tctgtatttg atgatatcct 18960 gtatttgatg agacaatgtc atcataactt cctttttttt ttaagagata gggtctctct 19020 ctgtcaccca ggctagagtg cagtggcatg atcctagctc actgcagcct cgaactcctg 19080 aactcaagca atcctcccac ctcagcctcc taagtacctg acactacagg catgagccac 19140 tgtacccagc taatttttat tttttgtaga gatggggtct aagttgccca ggctggtctc 19200 aaactcctgg gctcaagtga tcctccctgc tcaggctccc aaagtgctgg gattacaggc 19260 atgaaccact ggacccagcc tcctttattt ctttaaccat ggtggggttt tttattattt 19320 gtttgtttgt tttaacctgt ttgaatatat ttataatagg taccttcagg tctttgtctg 19380 ctaagtctga catctgggcc ctctcaaaga cagtttcagt tgtctttttt tttttcttct 19440 tgtgtatggg aacattttcc tgtttttttg ttttgttttt tgttgttttg ttttgttgtt 19500 gttgttgttg ttaaagattg gacatgttag ataatatatt gtaggaactc tggctagtga 19560 ttccctttcc tccccaggac ttgtttttat ttctctttgc ttgtttactt tttcatacag 19620 tctgtttccc cacagtgtct gcctctgact ttattcctta gagggcgcag ctgtggccat 19680 gtacgtagtc actctgggaa gacagtggtt ttagcagcgt gctcattaac tttctctgac 19740 ctctttgtta tacctcctgc ctctgtggat attagaccca gttattacat ttcattgttt 19800 actgattggt ctattgtttt ccagaatgcc ttgggatgta atttgctcca cagtctgatc 19860 cacttaaatt caggcctctt tgcagggcta gttttagagg ccagtctttt tttttttttt 19920 tttttttttt tgagacagag tctcactctg ttgcccaggc cggaatgtag tggtgcagtc 19980 tcagctcact gcagcctcaa tctctcaggc tcaagcaatc ttcccacctc agcttctcaa 20040 gtagctagga ctacaggtgc acgccaccat gcctggttaa tttttgcatt ttttatagag 20100 atggggtttt accatgttgc cccggctggt ctcaaactcc tgagttcaag caatccaccc 20160 acctcagcct cacaaaaggc cgggattaca gatatgcacc accacgcctg gcccctgagg 20220 ccagtcttta actgtcttct tagctgtctc tttccctggt tctctctggt gaactagctg 20280 gtaatttgtt tatctcataa ggctaccaga ttccttgtaa atgcttatcc ccacaatctc 20340 cattgttttc aagagcatcg ttagtcttta atttcctcac gcttcattcc aaataaagtc 20400 cattcacttg agaagagttc tatattccta tgacctgtgt ctccccatga gcaaaactgc 20460 tactgcttta cagagccagg gacagtggcc cacctctctg tggcatcctg ctttatgaac 20520 aagtcactgg gctcagatgg cagtctctga ttttctcacc ttgcttcttc tggcatggaa 20580 actccaccct acaagtggga actgagtgga agaagagagc cccattcccc ttagccactc 20640 ttaacaggat tagaacctct gcaacatgca tttaagaatg ggaacaggct gggcacagtg 20700 gctcacgcct gtaatcctag cactttggga ggtcaaggca ggaggattgc ttgagccagg 20760 agttcaggac cagcctgtgc aacatggtga gaccctcatc tctacaagaa atagaaaaat 20820 taactggtgg gttgtgtata cctgtaatcc cagctactcg ggagcctgaa gtgggaggat 20880 tgcttgaacc tggaggcaga ggttgcagtg agtcaagatt acaccattgc acgccagcct 20940 gggcaacaga gtgagactct gtctcaaaaa aaaaaaaaaa aaaagagtag gaacattgag 21000 gctgggcatg gtggctcatg cctgtaatcc tagcactatg ggaggccaag gcaggagtat 21060 cacttgacgc taggagttca agaccaacct gggtaacata gcgagacttt gtctctatta 21120 aaaaaaaaaa aaaaaaaggt gtaaaaaact tttgtaacaa gagtgggaaa gccgggcaca 21180 gtggctcaca cctgtaatcc cagcactttg gaaggccaag gcaggcaggc ggatcacctg 21240 aggtcaggag tttgagacca gcctggccaa cgtggtgaaa ccccatctct actaaaaaat 21300 agaaaaatta tctgggcatg gtggtgcaca cctgtagtcc cagctactcg ggaggctgag 21360 gcaggagaat cacttgaacc tacgaggcag aagttgcagt aagccaagat cacgccactg 21420 cactccagcc tgggcgacag agcaagactc tgtctcaaaa aaaaaaaaag agtggaaatg 21480 ttaggatgag aaatgctggc agcctgcccc tccctgggag atactgtagc cctagactgg 21540 aagttggggg aggagggagc cctgtgctct tagctgcacc catgtgaagt tgtgcttcta 21600 tcacatgagc tggggacagg agagaaggct cagattatgg cttcagtgcc acagaatctc 21660 ttcatactaa aatttagtag attttcttga ataaatgctt tttcatttgc tgtacaccct 21720 taaaagtttc tagaaatttt taatatttga gttttaaaaa ataattttca acagttacag 21780 ttatttcact aaagagagag tctacagaac cctcttgcca ccattgcaga ggttgtcttt 21840 ggcttacgag tttttaaagt atttgtatac attttttaag ttcaaaataa tagaattgta 21900 agtgaacatg ctgttttcat actgtttttc aagctttatt taatatattg taaatctaat 21960 tctattttat taaatagtct gccacagtat aatgtctgat gtctccttag aattttattg 22020 tatggatgaa caatgattat ttaatttcct accaattgtt gggtgttttt tgtttgtttg 22080 tttgtttttg agactgggtc tcactctgtc acccaggctg gagtgcagga gtgcggtgga 22140 atgatcacgg ctcactgcag cctcaacatc ccaaggctca ggtgatcctt ccacctcagc 22200 ctcgcaagta gctgggagta caggcacatg ccaccatgcc cacctatttt ttagagatga 22260 agttttgcca tcctgcccag gctggctcga actcctggcc tcaagcgatc tgcacacttc 22320 cgcctcccaa aatgccagga ttacaggcgt gagccatcat gccctacccc cccatcaatt 22380 gtttgatgta gccatttttc aatgatccgc gattaagaag cagcactctt ttatagccaa 22440 aaattacaca tatataaaat tttcctttag aaaatgttct aaaaatggaa tgtctaacta 22500 aagggttagg catacattct taagacttct gatacgcgct gacttgcagg aaagttgttt 22560 cagttaacac tcctaccagc ggcatccgag agttaatctg taaagcttga gacaacttag 22620 aaagtgtttc aaatgattgt gttgcttaag aaaaaaatct tagcacttcc ttttgaaaag 22680 ccagtggggc tgaaaagaca atgacaagca ctttgtccct ctgtactgtg ttttccttgc 22740 agcctggtga gacgagtgga ccggatggag cattccatcg gcagcatagt gtccaagatt 22800 gacgccgtga tcgtgaagct agagattatg gagcgagcca aactgaagag gagggaggtg 22860 ctgggaaggc tgttggatgg ggtggccgag gtcagtagtc atgagctgaa aacaccgctg 22920 ctgagcatgg tgttattaat gaaaatatat gttgctgaca gttgtatttg aagtattgaa 22980 gaagagtaaa aaaaatttac gtttatagaa attcacaatg atgtttccat ttactctcat 23040 tttcagattt ttttctctga aacagaaaca ctctttctat aaaatctctt gctataaaac 23100 atcaatgtag tcatattgtc taacccttag gctgagatgt ttatctttct ccataactac 23160 agataaaatt ataatctgga ggtgttactt tcttaatact ccatatgcta atggtcctgc 23220 cttcactgca gggtagaatt aagtgaaaaa ttactccagc aactctgaga tttgctatta 23280 tatgctgtaa atctccagcc ttaccaaact acagattatt tggtccctgg acttcctaag 23340 gcatttcctt ctactgcccc caacaccagt ttctttttcc ctttttagga tgaaaggctg 23400 ggtcgtgaca gtgaaatcca tagggaacag atggaacggc tagtacgtga agagttggaa 23460 cgctgggaat ccgatgatgc agcttcccag atcagtcatg gtttaggcac gccagtggga 23520 ctaaatggtc aacctcgccc cagaagctcc cgcccatctt cctcccaatc tacagaaggc 23580 atggaaggtg caggtggaaa tgggagttct aatgtccacg tatgatatgt gtgtttcagt 23640 atgtgtgttt ctaataagtg aggaagtggc tgtcctgaat tgctgtaaca agcacactat 23700 ttatatgccc tgaccaccat aggatgctag tctttgtgac cgattgctaa tcttctgcac 23760 tttaatttat tttatataaa ctttacccat ggttcaaaga tttttttttc tttttctcat 23820 ataagaaa 23828 <210> 243 <211> 23754 <212> DNA <213> Homo sapiens <400> 243 acagttcaac aatatagctg ctgtcacagt attttttgtc tggattaagg taatttataa 60 atttcatgtt ctacatttta aataatattt tctttaaaaa aaatgagttc cacaaaatca 120 tggaatactt gaatttgaaa ttcaagtgac cagccaaagc tgctcaatat ttactttgag 180 acagggtctc actctgtcac ccaggctgga gtgcagtggt atgattacag ctcattgcag 240 cctcgacttc ccaggcccaa gcgatcctcc caccttatcc tccgaagtca ctgggactac 300 aggcatgtgc caccataccc ggctaatttt taaatttttt cgtagagaca aggtctcatt 360 atgttgccca ggctggtttt gaactcctgg gttcaagcaa tcctcccacc tcagcctccc 420 aaagtgctgg gattacaggc atgagccacc gtgccaggcc tcatatttta catataaagt 480 aaactattga gactcatgtg atcattcctc tcactgtcaa tgacatactt ctgctatctg 540 aattagtgca agatcagtcc ctataggttt tgtttaacaa atgcagtaag aggcctttca 600 gtgtgttagc tgggcctggg gccccaggct gctaacagat gagatgaaca ggtgaaggaa 660 aaggaactta gagaaagaga gggaaggagc aggtggaggg aaggggagag ttgctgcact 720 tggaaatgct tgctagaagg gatcgcctct tttccaggta gaggctgtaa gggaagcttt 780 acctagaatt aaggttggaa cagacactgc ttccaaatag ttccttgctc actattttcc 840 ttattgtccc aagatataat gtgcatttcc atgtgtgtga aaggttatga catttcatat 900 acaacaagcc tcaattctgg agatgcagga aatttcaata attctcaggc agcagctgcc 960 attcggtcac cagcacaggc tctgattgtg ctgtccagac agtaagtact agccacatgt 1020 gcctatttaa attcaaattt aaattagtta agcttaaata caattaaaaa cgcagttcct 1080 tggtcctact ggccacacat taagtgttca atggctactg tctaggacag tggaaatgta 1140 gaacatttcc atcatcacag aacgttctct tgaaaagcac tgttctggaa ggtacttacc 1200 cgttatgtac ttttctgagt tggtattcat acctagaaga cctgaggttt atcacaagac 1260 atagacttgg accaggcgca gtggctcatg cctgtaattc cagcattttg ggaggccgag 1320 ataggtcccc tgagcccagg agtctgatac cagcctgggc aacatggcaa aacctcatct 1380 ctactaaaaa tacaaaaatt agctgggggt ggtggcacgt gcctgtagtc ctagctactt 1440 aggaggctta ggcgggagga ttgcttgaat ccagaaggcg gagggtgcag tgagccaaga 1500 tcgcaccgct gcactccagc ctgggcaaca gagtgagacc ctgtctcaaa aaaaaaaaaa 1560 aaatgcatag actttatcct gtatttctca tgctatttat ttattgacat gcttgttcaa 1620 gagaaaccat cactaaagca caaaaccttg atcataacat agtaataata atcaaacagc 1680 aaaaataata atagtaataa gaatgttctg tggtgatgga aatgttctat attttcattg 1740 tcctagacag tagccactaa ccatgtatag gcatggaaca cttaacatgt ggctagtagg 1800 accaagggac tgaattttta attgtattta atcttactta atttaaattt gaatttagat 1860 atccacacat gtttggatag cacagtcaga gcctgtgctg gtgaaaggat ggcaggtgct 1920 gcctgagaat tactgaagtt tccttgatta ttattagttt aataataata atcaagatag 1980 taataataat caagatagta ataataatca agatctcagc tgggcacagt ggctcacgca 2040 ctttgggagg ctgaggcggg cagatcacct gacgtcgggt ttgagaccag cctggccaac 2100 atggtgaaac cctgtcccta ctaaaaatac aaaaaaaaaa aattagctgg gtgtggtggc 2160 acgtgcctat gatcccagct acttgggaat ctgaggcagg agaattgctt gaacccagga 2220 agcagaggtt gcggtgagct gaatcatgcc actgcactcc agcctgggca acagagcagc 2280 acttcgtctc aaaaaaaaaa aaaaaagatc tcaaatgaat tgggattgta ttaagtaatg 2340 attaagtaat gtgattacag caatcctcaa gaaatatttc actgtggcca gtaacaatgt 2400 gtaacagacc tttaaacttc tagagatttt cctacaacat gtgtctcagg ctgatgtgtt 2460 ttatttagtg cttctcttgg aaatgtcttg cccctcgata ctttatcatt aaggtcttta 2520 aggcagggat catgactcta cttttttttt tttttttttt tttgggacgg agtcttgctc 2580 tgtcgcccag gctggagtgc agtggcacaa tcttagctca ctgcaacctc cgtctcctgg 2640 gttcacgcca ttctcctgcc tcagcctccc gagtagctgg gactacaggc ggctgccacc 2700 acgcccggct aattttttat atttttagta gagacggggt ttcaccgtgt tagccaggat 2760 ggtctcgatc tcctgacctc gtgatccacc cacctcggcc tcccaaagtg ctgggattac 2820 aggcttgagc caccacgccc ggcctcatga ctctacttct aatatctcat catgtgctct 2880 tccactgagg cttctactta gagctacaca atctgggcag ccatcctcag tgccttatct 2940 accaacatgc tcaatatggc tttgcagggt tcactgtcta ccagcagggt tcactatcta 3000 ccaacatgct caatatttct ttgcagtcag gcagagcagg ctttgcagtt caggcagggc 3060 agctggctgc aggccccagc tgactcctgg ggatagaatg ccaatatttc agacattgca 3120 gagatttgag gcaatgtaca taaagccctc cacatataac tgatgcacaa taaatgacag 3180 ttaatattat gcaacaagaa tttcctgggg ggttttataa ttaattttta tttgtgtgaa 3240 gttttttccc tcccttttac tttaatcctt tttgggggga aagcatcact agtcacagtt 3300 cacggcagcc tcgacctccc aggctcaagc aaccctccca cctcagcctc ctgagtagct 3360 gaaaccacag gtgtgtgcca ccacacctga ctaatttatt tttattttct aatgaaacag 3420 aatcttgcca tattgcccag gctgatctta aactcatggg ctcaagcgat cctcctgcct 3480 cagtcttcca aagtgccggg attatagatg tgagccactg cactcagcct tttttttttt 3540 ttttttaatt gtagatagca taaaacctac tgttttaacc atgcttaagt gtacaattca 3600 gtggcattaa gtacattcac agtgttgtgc agccatcgcc attatgctgc attattttca 3660 gaactttttc attattctaa actgaaactt tgtatccatt gaacactaac tcccaattcc 3720 cccagtccct ggtaacctcc attctacttt ctgtcactgt gagtttgact attctaagta 3780 cctaatttaa gtggaatcat acagtatttg tccttttgtg tcaggcttat ttcactttgc 3840 atgatgtttt caaggttcat ccatgttgta acctgtcaga atttaatttc ttttcaggat 3900 gaaataatgt tttattatat acagtcacac cattttgttt atccattcat ctattgatgt 3960 cttctctctc ttacagctct tcaaattcat caattttaac aggaccatga gccagctctc 4020 gacaaccatg tctcgatgtg ccaaagacct gtttggcttt gctattatgt tcttcattat 4080 tttcctagcg tatgctcagt tggcatacct tgtctttggc actcaggtcg atgacttcag 4140 tactttccaa gagtgtatgt aagtatatat gaaattaaga agaaaaattt aatcagagtt 4200 gtcactgctt ctcaagaata aatcttcata tgaggttgct atatgaccac caattattta 4260 aaaccagtta ttttaagtaa gaattaatta ccttttccca aaacattgat ctacccatgc 4320 aaagaagaca atgcatcctg aaatgctgat gcttaagata gcagcccaaa gtagtaaaat 4380 acagttaaca gacataggaa accaacactg ttctgaagac tgagtttttc tttgcaccaa 4440 atgcagatgg tagcttctag aaggctgttt gcctatattc ttactcctgt tgaatattgt 4500 tgccatatat ttagaacttc aagttatttt ctaaggaaaa aaacaagata tttctaatat 4560 tctaaggtaa actcagacca gtacaagaat tttcagtttt tttttccaaa gatcccaaat 4620 gtgaaataaa acaacaaaaa gcagccagtg tcagatttct atgccattta gaaaggagtt 4680 agtttaaaaa ggaatggaag taatagggtt ttgtgcatag atatctcgaa ttaatattgc 4740 tgttgataaa agtgattttg ctaagaccca gcactgacaa cacttggcca ctttgatccc 4800 attttaagta cttgtcagaa tattggatct ttgaactcaa accattttgg gtttttgggg 4860 tttttttgtt ttgttttttt ttgttttgtt ttgtttttga ggcacggtct tgctctgttg 4920 cccaggctgg agtgcagtgg tgcaatcata gctcactgca gccttgaact cctaggctca 4980 agcaatcctg ctgcctcagc ctgctgagta gctgggacta caagtgtatg ccaccatgcc 5040 tggccaattt ttaacttttt ttatgagaag ggatctcact gtgtagccca gggtggtatt 5100 gaactccagg gcctcacact gtcctctcac ctcagcttcc aaaagtactg ggattacagg 5160 catgagccac cacaccaggc cctgttgttt tttttttaaa gaaattttta actttagacc 5220 gagggtgact gttgtcaagg tttagggtta agatgtttta cctagattat gtgttgaaat 5280 gttatagcca attgctttat aagttattga ataataattg tattttcttt tttttttttt 5340 ttttgagatg gagtctcgtt ccatcgccca agctagagtg cagcggtgta atctcagctc 5400 actgcaacct ctgcctcccg ggttcaagcg attctcctgc ctcagcctcc cgaatagctg 5460 agattatggg cgcacgccac caagcccagc taatttttgt atttttagta gagacggggt 5520 ttcactatat tggccaggct gttctcgaac tcctgacctc gtgatccgcc cgcctcggcc 5580 tcccaaagtg ctgggattac agacgtgatc caccgtgccc agcttgtgtt ttctttttaa 5640 ccaaatggaa ataacctctg tagcatgaaa gcattttatt attattgcag aaggctttaa 5700 ttgctgatac aagtagcaag actttgtaaa tgggattgac aattttctgt tattcggcag 5760 ctacctatac tgctaaaagg tccaaaaata atgaaatcat ctttaagaaa tgttgcatca 5820 actagtggac attctttgtt tttgtattgt ggtgttttgt tttattttta tagcttcact 5880 caattccgta tcattttggg cgatatcaac tttgcagaga ttgaggaagc taatcgagtt 5940 ttgggaccaa tttatttcac tacatttgtg ttctttatgt tcttcattct tttggtatgt 6000 acatttttat ttatagtgag gttcaattta aacttcgtaa atccttgtct tctcttttct 6060 ctcacacttt atgtcctatc aattttaaat aaagacccag gaagtagaaa aaagtgtgga 6120 tgttggaaaa cttattttcc ttttattaat tcacagtttt gagactcata tcaaatgtct 6180 tttctgtggt ctttcattga tccatgtata tgtgtctatt caatgcaaaa aaaattagat 6240 ctcttccatg gtctttcatt tctctctcta tatatgtatc tattccatgc aaaaaagaaa 6300 ttagatcaag tacaaattta taaagatacc taaaatagtg ctttgcctaa aaagtagaat 6360 atgcttacat gctttttaaa ctcatatgtc agcactttcg tagtcacttg ctagcatgac 6420 ttttctctct ttcttctttt ctttttaaaa aataagaacg gaaaagcaag ctagatctaa 6480 gatgtcgagt aatagttgag tgaatcattg catgtcaaaa ttaggatatt ctgttttaaa 6540 ttatttatat cccattcatc tagagactgc ctacagagaa tattcaaata attaagttta 6600 aaactaaatg taacaatgaa tggaaattgc attaaaatta ttttcaaaaa taattttttt 6660 attctcttga tttggtacaa atgaacattt ttaatgtttt tgccctaagt caattaagtt 6720 tttttaaggt gttttgttct ttttcttaac atttatatat tcaattgtct actgagaagg 6780 tgttaagcca gcttaattta ggcaatattt ttcatctaaa cactaacagt catcttaaga 6840 acaattttct taagaaaata acattttttc catttcagta aattgtgtaa agatcccttg 6900 aggaaggtta agtgatcaca ttttcagtaa ttcagtgtaa taactctaaa gtcagtccag 6960 gtattactgg ttaagtatat ggtatttatt gattgggtat tagatgtact gtattaattt 7020 cctgtttaaa aaaaattttt tttccgggga gacacagcct ctggtgtaaa acaaaggtgt 7080 gttccctagc tgtactttaa caggactgaa aaggtcagga atatcattca agttcatatg 7140 tatcttgctg tatgcatggt ttatggctca tttttaaact tacacctctt aagcttcttc 7200 ttcctatcat atattaaaac aatggagaga agaataagcc tctgttactc taccattgat 7260 agtacttcgg attctagagt acctgaatct ctactaagaa ggcaaaaacc aggaattgag 7320 agtcctgcac ctgacccttc agttgatctc aggccaccta gttttctccg tttatcaatc 7380 tgccaaacaa ggatggatag agtcgtggca actggaaagg ctcaaatgtg gaattgtttg 7440 aatgtggtcc tttagtaggc agccatctta ccagatctag agtattcagt catcttacca 7500 gatcagtcac cagaacatga aaagaagctc ttagtttcta tctttatact aaaattgttt 7560 ttttgtacga ctgcacaaaa aagaattgct ctccttgcac ctcccagaga tataggtgga 7620 tagatacata catacgtaca tacatacata catacataca tacatacata catagacaca 7680 tacatagata gaagtctact ttcaatacaa acctgtcttt taaggaaatg acaagctgag 7740 catagggttg gccacctttc tgagccgatt gcctggtatt agtttattgc ccctgtttag 7800 caagaaggca cagtgttaag aagtggctca gctgaaccag gataacccca ctcttccccc 7860 acatcaacag gaaagacatc ctggtgcaga tgtccatctg ataattcagg gaacctcggg 7920 agacaggatg gagaggaggg tgagctagct tcctcttccc acaccttcaa gagcctttct 7980 caagcacttt ctattttttg aaatctcttt agaggtccca gactttgatc tgtttcaatt 8040 aaggtattgg caggcattag ttaacagcca cttggaagca aaaatagaac attagatccc 8100 tgagttggaa gagagaaggt agaaggtgtt acttggactg caattatctg cacttggaat 8160 tgagcattta gtcaaaaact tatatgtatt ctatattcta ttctcatttc tgctacagaa 8220 ttgtaaacaa tattcttcct taatacagaa attcatagcc cactaaaata agagcgttct 8280 catttgttca tttctcaatc atttaataag tatttactaa gccactatat ccatatatat 8340 atatatatca tatatactgt ataatacaca ctgtagtgtt ttttgtggat tgtgtactat 8400 gaggtagtat gttagatact gccagtactg gggtaaggaa aacagcctga ttaggccctt 8460 acgaagattc ctcagacttg tggggaaaac agacattatc aaatagaaat acttgcaaac 8520 cacagttatg tgttaaaaag gaaaaacaaa gtaaaaaaaa agttggtggg ggggaacctg 8580 atctcctgga tacagtgctt cgagaaagtt tgttgttgga aatgcaaacc attactactg 8640 tggaagggaa aggtcagaaa aatgaactca ccattactga atagtaatag tagctatcaa 8700 ttaggtggca cttacctgca tcaggacctg tcctgagcac tttacataga ttgtctcact 8760 aaccagccca acaaatatgt aagggagata ctattatttt tcccatttta ttaatgtaaa 8820 acaattaaat aattctttaa aattagactt agaaaagtgg agcaacaatc ttagcagtgc 8880 taggactgaa atccaagttt gcttgactcc aaagtctatc tctcttccag aaactttttc 8940 tttactatct gcctagtagg cctgctgtat tcctatttgc aacagccttt taaactcttt 9000 aaaaatgtgt cctgtaaatt tcatatatga ttatacaaaa aaacttggaa taagcataca 9060 attctactta tctgtgttaa ctgttgaaat ttgaagagct ttttggaatt ctataccctt 9120 cagtagtgta tgtaaaagtt tctaaatata gagaacatag ataagcaaaa ataatattaa 9180 ataaaataat cgcaccatta gtaggtaaat atactaatat tttgttgtat tttattcttg 9240 tatgttttca caaagtatat cataaaattt ttcctgtggc atgacttaac ggagaaaata 9300 atcttcccaa aacatgtggc agcaaaactg ttaatttatt acatcaggct gggcacagtg 9360 gctcacgctt gcaatcccag cactttggga agccgaggcg ggcagatcac ttgaggccag 9420 gagttcgaga ccagcctggc caacgtggtg aaacactgtc tctactaaaa atacaacagt 9480 tagccaggtg tagtggcaca tgcctgtaat cccagctact caggaggctg agactcaaga 9540 attgcttgaa cccaggaggc agaggttgca gtaagctgag gtcgcgcccc tgcactccag 9600 cctgggcaac acagtgagac tctgtctcaa aaaaaaaaat ttttttttaa ataaataaat 9660 aataaattta tgtcttcata aagcactcag attaggaaaa aaaggataaa caaaaaggca 9720 tgtgtcattt ttttgattga taattccaaa ttatgtttct tcctttaatt tttgccctcc 9780 tttcatttac aaacagaata tgtttttggc tatcatcaat gatacttact ctgaagtgaa 9840 atctgacttg gcacagcaga aagctgaaat ggaactctca gatcttatca gaaaggtagg 9900 aaaaacctta attctcagaa ttcttctgtt tctgacataa aatgagcatt gtttcaccca 9960 gattttcaaa tcaacattga tccattgaaa ttgtttgaaa taaagaatac attgctatat 10020 ttcaggaata atttaaatgt tccctatctt ggagtcttga tggatatact gctatcttga 10080 attttaattc tgggaatcct tttatgccct ggaattaaat tctcaacaat cttttgacac 10140 tttaagagct gagctgaagg ttcatcacct tcattatttt gacatctcct gtagctggct 10200 ctcacttcag gatcctgagt tgagaataaa ctagaaggga agattatata aagggatttc 10260 cacctcttct gtctcaatta ccattttaaa aaaataaaaa gttttagagg aaaacactta 10320 gtagttcacc ctttaccctt gaccttccac ggcagtttta aaataagcaa aggaaaagat 10380 tcatgaattc aggccatagc ctggggcctg agaactttta cttatgcacc ttctcaggaa 10440 gggtttcatt gttaaataga agggcaggac aggaaagttg ggcctctttg ttcttctcaa 10500 tgtaacttct ttatttggtt taaagtataa aatgtataca acaacaaata accacattta 10560 aaatacacag tttgtttccc aacatcattt tgctaagtca tagtggctcc ttaactgtaa 10620 tttttttttt tattagtcca agccttagga ttatgttatc tgtgatatat gttataatag 10680 aaaacttaag cctcttaaaa caaagtcctt gggatgggac ctaagattca cattatcttg 10740 attccgcata acagttgctt acattttagc aaatctccag tgtgtatgca agcactcctc 10800 acttggcaca attctgatac acacaaactt tggttacccc agttttgtta tgtaacacca 10860 ccttcaacaa cacagttcaa atttcagtta tcatagtata ttaactctga gtaacagcac 10920 aaagtacaaa ctccactgct agctcttcag tgtatagatc agttacctga gtaacagatg 10980 tgcaggctga gcaggctcac tggtcagtca tgacactatt ttcagtctgt tactaattgg 11040 tcactgagca tctgctatcc aattcacaaa caaagaaagc atgtagtgtt gcttccttgt 11100 gttccagtaa taagcccatg tgacatttta caaaaatgga taattgaaaa agagaatggg 11160 tgcagtggct cacgcatgtt gggaggccaa ggcggatgga tcacctgagg tcaggagttc 11220 gaaaccagcc tggccaacat ggtgaaaccc catctctact aaaaatacaa aattagctga 11280 gtgtggcgac agatgcctgt aatcccagct actggggagg ctgaggcagg agaatcgctt 11340 gcacctagga ggcggaggtt gcagtgagcc gagatcgtgc cattgcactc cagcctgggt 11400 aacaagagcg aaactccgtc tcaaaaaaaa aaaagaaaag aaaagaaaag aaaaagagaa 11460 tgggctagca aagaaatgaa aaatggtaac actggaagtg aaaatcaaaa cagagtaatg 11520 gatttataga agaaatagct gagtgaagaa gaaataggag tgttgacact gcgatcattc 11580 aagagatcca gatatggagc cagaagaact tagggcaggt ctatcaactt aaatgaggaa 11640 aatagctgtg ataaaacaga tgaagatgtc ttgaggaaat gatgcctgca aaaaacttca 11700 cattaaggga agtcttatta gagatatttc acaataatga aagtacaaaa gaaaaaatgt 11760 tggggctgga catggtggct tactcctgta atcccagcac tttgagaggc caaggtgggt 11820 ggatcacttg aggccaggaa gtcgagacaa gcctgatcaa catgatgaaa ccccgtctct 11880 attaaaaata caaaaattag ccagacatga tggtgcacac ctgtaattcc agctactcaa 11940 gtggctgagg cacgagaatt gcttgaacca gggaggcgga ggttgcagta agctgagatt 12000 gcaccactgc aatccagcca ggtgacaggg taagactgtg tctcaaaaat aaataaaaga 12060 aaaatatgtt ggaagctcat ccacatttaa gaaggaatat gacaattcac taatgcatag 12120 aaaagaagtt cactccacat tgtaaagtgt acagtgtaat attatacaat gaaaacaagg 12180 caagtgctgt ttaaactact ctggatacat tttttacaaa gaaataaaac actttagttt 12240 ttaatgtttc taatgtttta cattttagtg tattaaatca atattagttt tcttcttttt 12300 taagctccct atacatttat aactgacact aagggagtgt ttaatgtttt gattaaaagt 12360 tgtaaagatc acagaacaat tgtaattctt cccactgatt attcagatca ttttgcacaa 12420 tttcagcttg catggtcact tacagtgccg cactatgtgc aaagcaaggt caggtctaaa 12480 gttcgctaat gaaaaatcct cggccagggg cagtggctca cccctgtaat cctagcactt 12540 tggaaggcga ggcaggcaga tcgcttgagc tcaggagttc aacaccagcc tgggcaacat 12600 ggtgagaccc tgtctctaca aaaaaaaaaa aatagcaagg cgtggtgact cacacctgta 12660 gtcccagcta cttgttgggg gctgagttgg gaaaatcact tgagctcagg aggtcgaggc 12720 tgcagtgagc cagaatcacg ccactgccct tctgcctggg tgacagagta agatcctgtc 12780 tcaaaaaaag ggaaaatcct catctacatt tcactgggtt ttttgtttgt ttgtttgttt 12840 gtttatacac acttaaggaa attactgtct agaagataga taatataaaa aataaaaatg 12900 caattcatga ttcgggtttc ttggtattcc taagaactgt tgcacagtac tttatgctct 12960 gaggcagaca gctatagcat atatagtaat ttttgtttct atcacataaa cttgaataca 13020 catatgagta aaagaccttt agttcttcat gacttactga aagaccctga ctttttccat 13080 gtaactgttc cacaagtgtt ttatggaaaa ctggatacat taattcttca ttcatccagc 13140 acgtacttgt tgaatggcca atgtacacca ggtttgtagt agttactact gtgaatggaa 13200 agtaaaacag atgcaaaagg agaatacact aaaccaagtc ttttattttt tctctctctg 13260 atagggctac cataaagctt tggtcaaact aaaactgaaa aaaaataccg tggatgacat 13320 ttcagagagt ctgcggcaag gaggaggcaa gttaaacttt gacgaacttc gacaagatct 13380 caaagggtga gaatcatgct tcctgaggtt ctgaaaaatt cctgcttcta aagataaatt 13440 cctggtgata agagtatttc tagcccaagg gctcatacag atactttttt tttttttttc 13500 cagaggcagg tatctttctg gaacatgtta taagaggaaa acttgccccc atttggtgat 13560 ttctcctttc ctcctgcatt ttgatgtctc tgtgttgagg gtgaactggg tacaaggaat 13620 gatttttatc tgtatcctct ctctaatttc aggaagggcc atactgatgc agagattgag 13680 gcaatattca caaagtacga ccaagatgga gaccaagaac tgaccgaaca tgaacatcag 13740 cagatgagag acgacttgga gaaagagagg gtgggtctgg tttaggagaa ccggatttga 13800 tttggtacct acaacaccac agatgtatca aacactatag aagtagtggg ttattgagtc 13860 tcttgcccat tccccaccac actctctctc tctctcagtc ggtttatgtg ttagtaccct 13920 gtttattcca gaaagaatat ataacacaat tatgtataaa aatgggtggt tagcatgata 13980 taaaaacgtc aaaatgaaaa gcaagcaaaa caaaagtaaa aataatggat tattaatgaa 14040 gcttaaaaat gcattcataa aaacacatat gcttattaag attgggctac aaattgggcc 14100 ctaagcttgc tggtaatcag cttgaaaaga gaagcctgat tagctgcaga gtccacaatg 14160 tccgtgagag tgaagaaaac aaaaaatgac ttaccaagag atgtgaaatt attctggtta 14220 gttagtggct atttaaattg ttaacttttt tttctttttt tttttttttt gagatggagt 14280 cttgctctgc ctcccaggct ggagtgcagt ggcacaatcg cgactcactg caacctccac 14340 ctcccgggtt caagcgattc tcttgcctca gcctcccaag tagctaggac tacaggcaca 14400 tgccatcatg cccggctaat ttttgtattt gtagtagata tggggtttca ccatgttggt 14460 ctcaaactcc tgactgcaag caatctgccc accttggcct cccaaagtgg tgggattaca 14520 ggcagtagcc accgtgcctt tcctaaatta ttaacattta taataaaatt aacagccgcc 14580 ttccatttga atacttttta caaaatagtt aaaaataaac ataagtgggc ttttatagtc 14640 agaaaaaaaa attcaaagct ttaccattaa ctttcaaaaa taaatggtta gacagcaaca 14700 acaaaaatct gtggtaactg aggtacagag aacacagatg aatgttatta caaaagccac 14760 tttcctatga gaagtctagg acagtggttt ctaaatgcca ctccacagac agtgctagta 14820 ggtgacagac ttctccagtc acagtgaaat ttaagcataa agaaaatgag gaaaattttt 14880 acaaggctct atttagacaa agttcttatt ctgacattac atctttccta ctttggagct 14940 gttgaatgta ttatctttta tgaaaagaag gcgatccagg ttgagcatcc ctaacccaaa 15000 tatgtgagtc tgaaatgctc caaaacctaa aacttcttga gcacaaacat gatagtcaaa 15060 ggtcatgctt aaaggaaatg ctgtcattgg agcagtttgg attttgggtt ttcagattag 15120 ggatgctgaa ccagtaagta taatgcaaac attccaaaat atttttgaaa atcccaaatc 15180 caaaacactt ctgatcccaa gtatttcaaa taagggatac tcaacctgta atatatttct 15240 tcatttcttt atttatttta ttattatttt aagatggctc atggcccact gcagcctcaa 15300 actcctaggc tcaagtgatc ttccgacctc aacctcccag gtagctcagg tagctgggac 15360 tgcaggcatg catcaccatg cctggctaat tttttaaaaa attttttgtg gaggcagagt 15420 ctcaccttgc tgcccaggcc agtctcaaac tcctggcttc aagcagtact cctgcctcag 15480 cctcccaaag tattaggatt acaggtgtga ccactatgcc tggcccatat ttcttcattt 15540 agttttttct ttgcctgctg tgtttttaat gttctttctt gttcaaacaa aaagttggct 15600 attccttgct gttagttaaa tttgccaatc tatgaaactg aaaaatgcag gagtcccagc 15660 ctggtgttaa atacaaagaa atcccaggta aatggcatgc acccagttcc tgcttgccca 15720 agtccttggt gaggcttctg tggggtctca gtgttctgct cctcactcag tgaccccttg 15780 ttcttcagga ggacctggat ttggatcaca gttctttacc acgtcccatg agcagccgaa 15840 gtttccctcg aagcctggat gactctgagg aggatgacga tgaagatagc ggacatagct 15900 ccagaaggag gggaagcatt tctagtggcg tttcttacga agagtttcaa gtgtaagtat 15960 aaaggaattg gcagaatttg cgttgacaag agtccacatg agaccaggca gttccctcat 16020 ctctctgaat tcactccttt ccattactaa tcatccagct tttaaaaata acttatactg 16080 gccagacgca gtggctcatg cctgtaatcc caccactttg ggaggccaaa gcaggcaggt 16140 catgaggtca gaagttcgag acgagcctgg ccaacatagt gaaaccccat ctctattaaa 16200 aatacaaaaa attagctggg catggtggtg ggcacctgta atcctagcta cttgggaggc 16260 tgaggcaaga gaattgcttg aacccgggag gcggaggtta cagagagccg agatggctcc 16320 actgcacacc agcctgggcg acagtgcaag actctgtctc aaaaaaaaaa aaacttgtca 16380 attggtgttt tgtttcttac ataatatgtt tactataaaa attagcaaat aagagcaaaa 16440 gaaaacatta acatttcaca tatttctacc aatgaaaaat gtttattaat atatcagtgt 16500 ttgtgtctct atttgcatgt gtttatcaat gtttctatat atttttatgg cctaacatat 16560 ggttcgtcct gaagaatgtt ccttgtgcat ttgagaagaa tgaatattct gctgttcaag 16620 tgttctgtag atgtttgtta ggtctagttt gtttacagtt ttattcaggt ctcccatttc 16680 ctggttgatc ttagatgtgc ctagatgtgg tattcacgtt tgaaagtggg gtattaaagt 16740 ctccaagtat tattagttgg agttcatccc ttcaattctg taaggttttg ctttgtgtat 16800 tttggaactc tgttgttggg tgcatacata tttataacta gtatattttc ctaatatatt 16860 gaccctattt tctctctcaa cttaatgagg ctaaagaaaa aaaagaattg accctgtttt 16920 cattacaaga tgttatccac tttatctcta gtaaaattct ttgttttaag tattttttgt 16980 ttgatattac tgtaaccact ccagctttct tttggttgct gtttgcatga taaatctttt 17040 tccatccttt tactttaaac ttatttatat ctttcagtct gaagtatgtc tctcctgtag 17100 acagcatata attggatctt atctttttat ccagtttgac aatttctgtt tttgattaga 17160 ttgcttaatc cattcattta atgttatcat tgatgtagtt gatttctgtc tgctatttta 17220 ttttttgttt tctagcttac ttttttttgt tcctctttca ctgctttctt gtacattaag 17280 tgaatatttt caagtataac atttaaattt ttttaatgat ttttcatttt ttttagtcag 17340 gagttgctct aagacttagt ttatacaatt aagttatgaa aaattacttc agatatatat 17400 taactgaatc cagtgagata tagaaatcat ttctatttag cttttttcct cttccctctt 17460 tttgtgctat atattcatct atctatatgt atatatagtc atctacatat gttgcaaatc 17520 acattgttag aacaatgtta catttttata acacactgtg taatatatag tatataattt 17580 tatatctctt aatgaagctg agagaagagg aagtatatat ttataaatgt gtatattaac 17640 ctactttttt accatttcta attctcttct tttgctcctc tggattcaag ttatcatctg 17700 tcgtcattct ctttctccga tacagctttg ctactgccta cctcctatta ttgtcaaata 17760 tattacattt ctattataga ccttcagatc caattatgta catattttta cacaactgct 17820 ttttaaatca gttaaggaac aaaaggagaa atgtacatat atactatatt ttatacctac 17880 acagttatct ttaccagtgt tctttgcctt ttcatgtgga ttctgattac tatctggagt 17940 cacttgcttt cagcataaag aatttccttt agtatttttt gtaaagcagg tttgctagca 18000 atgaattctt tcattttttg tttatctgag aatgtttttc tttctccttc atttcctctg 18060 gcttgtattg tttctgatga gaagacaggt gctaatttta ctgtggtccc cttgtacatg 18120 atgactcaat tttctctcac cactttcaag atttttttgc ttttgtcttt cattattttt 18180 actgtgatat gtctgggtat aaatctctga gttcatccta cttagaaagt gttttttctg 18240 cttctttcac tttctcttct cctttgggac ccgcattatg catatgctta ggggtatcac 18300 atatttctct taggctctgt tcgtcgtcat tttttttccc tctctgttcc tcagagtgca 18360 tagtctgtat tgatgtatct tcaagttcac tgacttgttc ttctgtcagc ttgcttaaat 18420 ctctgttgag ctcctctagt tatttattta tttatttatt tattttatat atatatatat 18480 atatatatat atagagagag agagagagag agagagagaa agagagagag agagagacag 18540 ggagacaggg tctcactcca tcacccaggc tggagtacag tggtgtaatc atggctctct 18600 acagcctgaa cacctgggct caaatgatcc tcctgcctca acctcccaag tagctaggac 18660 tatgggcaca tgctgccatg cctggctaat ttttaaaaaa aaatttgtag agatggcatc 18720 ttgttatgtt gcccaggttg gtctcaaact cccggcctca agtgatcctt ccgcctcggc 18780 ctcccaaagt gctggggtca caggtatgag ccaccgcact tagcctgaat tttttattta 18840 ttatactttt caactccaga atttctattt ggttcttttt agcaatctct gtctctttat 18900 tctgtatttg atgatatcct gtatttgatg agacaatgtc atcataactt cctttttttt 18960 ttaagagata gggtctctct ctgtcaccca ggctagagtg cagtggcatg atcctagctc 19020 actgcagcct cgaactcctg aactcaagca atcctcccac ctcagcctcc taagtacctg 19080 acactacagg catgagccac tgtacccagc taatttttat tttttgtaga gatggggtct 19140 aagttgccca ggctggtctc aaactcctgg gctcaagtga tcctccctgc tcaggctccc 19200 aaagtgctgg gattacaggc atgaaccact ggacccagcc tcctttattt ctttaaccat 19260 ggtggggttt tttattattt gtttgtttgt tttaacctgt ttgaatatat ttataatagg 19320 taccttcagg tctttgtctg ctaagtctga catctgggcc ctctcaaaga cagtttcagt 19380 tgtctttttt tttttcttct tgtgtatggg aacattttcc tgtttttttg ttttgttttt 19440 tgttgttttg ttttgttgtt gttgttgttg ttaaagattg gacatgttag ataatatatt 19500 gtaggaactc tggctagtga ttccctttcc tccccaggac ttgtttttat ttctctttgc 19560 ttgtttactt tttcatacag tctgtttccc cacagtgtct gcctctgact ttattcctta 19620 gagggcgcag ctgtggccat gtacgtagtc actctgggaa gacagtggtt ttagcagcgt 19680 gctcattaac tttctctgac ctctttgtta tacctcctgc ctctgtggat attagaccca 19740 gttattacat ttcattgttt actgattggt ctattgtttt ccagaatgcc ttgggatgta 19800 atttgctcca cagtctgatc cacttaaatt caggcctctt tgcagggcta gttttagagg 19860 ccagtctttt tttttttttt tttttttttt tgagacagag tctcactctg ttgcccaggc 19920 cggaatgtag tggtgcagtc tcagctcact gcagcctcaa tctctcaggc tcaagcaatc 19980 ttcccacctc agcttctcaa gtagctagga ctacaggtgc acgccaccat gcctggttaa 20040 tttttgcatt ttttatagag atggggtttt accatgttgc cccggctggt ctcaaactcc 20100 tgagttcaag caatccaccc acctcagcct cacaaaaggc cgggattaca gatatgcacc 20160 accacgcctg gcccctgagg ccagtcttta actgtcttct tagctgtctc tttccctggt 20220 tctctctggt gaactagctg gtaatttgtt tatctcataa ggctaccaga ttccttgtaa 20280 atgcttatcc ccacaatctc cattgttttc aagagcatcg ttagtcttta atttcctcac 20340 gcttcattcc aaataaagtc cattcacttg agaagagttc tatattccta tgacctgtgt 20400 ctccccatga gcaaaactgc tactgcttta cagagccagg gacagtggcc cacctctctg 20460 tggcatcctg ctttatgaac aagtcactgg gctcagatgg cagtctctga ttttctcacc 20520 ttgcttcttc tggcatggaa actccaccct acaagtggga actgagtgga agaagagagc 20580 cccattcccc ttagccactc ttaacaggat tagaacctct gcaacatgca tttaagaatg 20640 ggaacaggct gggcacagtg gctcacgcct gtaatcctag cactttggga ggtcaaggca 20700 ggaggattgc ttgagccagg agttcaggac cagcctgtgc aacatggtga gaccctcatc 20760 tctacaagaa atagaaaaat taactggtgg gttgtgtata cctgtaatcc cagctactcg 20820 ggagcctgaa gtgggaggat tgcttgaacc tggaggcaga ggttgcagtg agtcaagatt 20880 acaccattgc acgccagcct gggcaacaga gtgagactct gtctcaaaaa aaaaaaaaaa 20940 aaaagagtag gaacattgag gctgggcatg gtggctcatg cctgtaatcc tagcactatg 21000 ggaggccaag gcaggagtat cacttgacgc taggagttca agaccaacct gggtaacata 21060 gcgagacttt gtctctatta aaaaaaaaaa aaaaaaaggt gtaaaaaact tttgtaacaa 21120 gagtgggaaa gccgggcaca gtggctcaca cctgtaatcc cagcactttg gaaggccaag 21180 gcaggcaggc ggatcacctg aggtcaggag tttgagacca gcctggccaa cgtggtgaaa 21240 ccccatctct actaaaaaat agaaaaatta tctgggcatg gtggtgcaca cctgtagtcc 21300 cagctactcg ggaggctgag gcaggagaat cacttgaacc tacgaggcag aagttgcagt 21360 aagccaagat cacgccactg cactccagcc tgggcgacag agcaagactc tgtctcaaaa 21420 aaaaaaaaag agtggaaatg ttaggatgag aaatgctggc agcctgcccc tccctgggag 21480 atactgtagc cctagactgg aagttggggg aggagggagc cctgtgctct tagctgcacc 21540 catgtgaagt tgtgcttcta tcacatgagc tggggacagg agagaaggct cagattatgg 21600 cttcagtgcc acagaatctc ttcatactaa aatttagtag attttcttga ataaatgctt 21660 tttcatttgc tgtacaccct taaaagtttc tagaaatttt taatatttga gttttaaaaa 21720 ataattttca acagttacag ttatttcact aaagagagag tctacagaac cctcttgcca 21780 ccattgcaga ggttgtcttt ggcttacgag tttttaaagt atttgtatac attttttaag 21840 ttcaaaataa tagaattgta agtgaacatg ctgttttcat actgtttttc aagctttatt 21900 taatatattg taaatctaat tctattttat taaatagtct gccacagtat aatgtctgat 21960 gtctccttag aattttattg tatggatgaa caatgattat ttaatttcct accaattgtt 22020 gggtgttttt tgtttgtttg tttgtttttg agactgggtc tcactctgtc acccaggctg 22080 gagtgcagga gtgcggtgga atgatcacgg ctcactgcag cctcaacatc ccaaggctca 22140 ggtgatcctt ccacctcagc ctcgcaagta gctgggagta caggcacatg ccaccatgcc 22200 cacctatttt ttagagatga agttttgcca tcctgcccag gctggctcga actcctggcc 22260 tcaagcgatc tgcacacttc cgcctcccaa aatgccagga ttacaggcgt gagccatcat 22320 gccctacccc cccatcaatt gtttgatgta gccatttttc aatgatccgc gattaagaag 22380 cagcactctt ttatagccaa aaattacaca tatataaaat tttcctttag aaaatgttct 22440 aaaaatggaa tgtctaacta aagggttagg catacattct taagacttct gatacgcgct 22500 gacttgcagg aaagttgttt cagttaacac tcctaccagc ggcatccgag agttaatctg 22560 taaagcttga gacaacttag aaagtgtttc aaatgattgt gttgcttaag aaaaaaatct 22620 tagcacttcc ttttgaaaag ccagtggggc tgaaaagaca atgacaagca ctttgtccct 22680 ctgtactgtg ttttccttgc agcctggtga gacgagtgga ccggatggag cattccatcg 22740 gcagcatagt gtccaagatt gacgccgtga tcgtgaagct agagattatg gagcgagcca 22800 aactgaagag gagggaggtg ctgggaaggc tgttggatgg ggtggccgag gtcagtagtc 22860 atgagctgaa aacaccgctg ctgagcatgg tgttattaat gaaaatatat gttgctgaca 22920 gttgtatttg aagtattgaa gaagagtaaa aaaaatttac gtttatagaa attcacaatg 22980 atgtttccat ttactctcat tttcagattt ttttctctga aacagaaaca ctctttctat 23040 aaaatctctt gctataaaac atcaatgtag tcatattgtc taacccttag gctgagatgt 23100 ttatctttct ccataactac agataaaatt ataatctgga ggtgttactt tcttaatact 23160 ccatatgcta atggtcctgc cttcactgca gggtagaatt aagtgaaaaa ttactccagc 23220 aactctgaga tttgctatta tatgctgtaa atctccagcc ttaccaaact acagattatt 23280 tggtccctgg acttcctaag gcatttcctt ctactgcccc caacaccagt ttctttttcc 23340 ctttttagga tgaaaggctg ggtcgtgaca gtgaaatcca tagggaacag atggaacggc 23400 tagtacgtga agagttggaa cgctgggaat ccgatgatgc agcttcccag atcagtcatg 23460 gtttaggcac gccagtggga ctaaatggtc aacctcgccc cagaagctcc cgcccatctt 23520 cctcccaatc tacagaaggc atggaaggtg caggtggaaa tgggagttct aatgtccacg 23580 tatgatatgt gtgtttcagt atgtgtgttt ctaataagtg aggaagtggc tgtcctgaat 23640 tgctgtaaca agcacactat ttatatgccc tgaccaccat aggatgctag tctttgtgac 23700 cgattgctaa tcttctgcac tttaatttat tttatataaa ctttacccat ggtt 23754 <210> 244 <211> 5089 <212> DNA <213> Homo sapiens <400> 244 aggcggcggc gggcgccggg aagaaaggaa catggctcct gaggcgcaca gcgccgagcg 60 cggcgccgcg cacccgcgcg ccggacgcca gtgaccgcga tggtgaactc cagtcgcgtg 120 cagcctcagc agcccgggga cgccaagcgg ccgcccgcgc cccgcgcgcc ggacccgggc 180 cggctgatgg ctggctgcgc ggccgtgggc gccagcctcg ccgccccggg cggcctctgc 240 gagcagcggg gcctggagat cgagatgcag cgcatccggc aggcggccgc gcgggacccc 300 ccggccggag ccgcggcctc cccttctcct ccgctctcgt cgtgctcccg gcaggcgtgg 360 agccgcgata accccggctt cgaggccgag gaggaggagg aggaggtgga aggggaagaa 420 ggcggaatgg tggtggagat ggacgtagag tggcgcccgg gcagccggag gtcggccgcc 480 tcctcggccg tgagctccgt gggcgcgcgg agccgggggc ttgggggcta ccacggcgcg 540 ggccacccga gcgggaggcg gcgccggcga gaggaccagg gcccgccgtg ccccagccca 600 gtcggcggcg gggacccgct gcatcgccac ctccccctgg aagggcagcc gccccgagtg 660 gcctgggcgg agaggctggt tcgcgggctg cgaggtctct ggggaacaag actcatggag 720 gaaagcagca ctaaccgaga gaaatacctt aaaagtgttt tacgggaact ggtcacatac 780 ctcctttttc tcatagtctt gtgcatcttg acctacggca tgatgagctc caatgtgtac 840 tactacaccc ggatgatgtc acagctcttc ctagacaccc ccgtgtccaa aacggagaaa 900 actaacttta aaactctgtc ttccatggaa gacttctgga agttcacaga aggctcctta 960 ttggatgggc tgtactggaa gatgcagccc agcaaccaga ctgaagctga caaccgaagt 1020 ttcatcttct atgagaacct gctgttaggg gttccacgaa tacggcaact ccgagtcaga 1080 aatggatcct gctctatccc ccaggacttg agagatgaaa ttaaagagtg ctatgatgtc 1140 tactctgtca gtagtgaaga tagggctccc tttgggcccc gaaatggaac cgcttggatc 1200 tacacaagtg aaaaagactt gaatggtagt agccactggg gaatcattgc aacttatagt 1260 ggagctggct attatctgga tttgtcaaga acaagagagg aaacagctgc acaagttgct 1320 agcctcaaga aaaatgtctg gctggaccga ggaaccaggg caacttttat tgacttctca 1380 gtgtacaacg ccaacattaa cctgttctgt gtggtcaggt tattggttga attcccagca 1440 acaggtggtg tgattccatc ttggcaattt cagcctttaa agctgatccg atatgtcaca 1500 acttttgatt tcttcctggc agcctgtgag attatctttt gtttctttat cttttactat 1560 gtggtggaag agatattgga aattcgcatt cacaaactac actatttcag gagtttctgg 1620 aattgtctgg atgttgtgat cgttgtgctg tcagtggtag ctataggaat taacatatac 1680 agaacatcaa atgtggaggt gctactacag tttctggaag atcaaaatac tttccccaac 1740 tttgagcatc tggcatattg gcagatacag ttcaacaata tagctgctgt cacagtattt 1800 tttgtctgga ttaagctctt caaattcatc aattttaaca ggaccatgag ccagctctcg 1860 acaaccatgt ctcgatgtgc caaagacctg tttggctttg ctattatgtt cttcattatt 1920 ttcctagcgt atgctcagtt ggcatacctt gtctttggca ctcaggtcga tgacttcagt 1980 actttccaag agtgtatctt cactcaattc cgtatcattt tgggcgatat caactttgca 2040 gagattgagg aagctaatcg agttttggga ccaatttatt tcactacatt tgtgttcttt 2100 atgttcttca ttcttttgaa tatgtttttg gctatcatca atgatactta ctctgaagtg 2160 aaatctgact tggcacagca gaaagctgaa atggaactct cagatcttat cagaaagggc 2220 taccataaag ctttggtcaa actaaaactg aaaaaaaata ccgtggatga catttcagag 2280 agtctgcggc aaggaggagg caagttaaac tttgacgaac ttcgacaaga tctcaaaggg 2340 aagggccata ctgatgcaga gattgaggca atattcacaa agtacgacca agatggagac 2400 caagaactga ccgaacatga acatcagcag atgagagacg acttggagaa agagagggag 2460 gacctggatt tggatcacag ttctttacca cgtcccatga gcagccgaag tttccctcga 2520 agcctggatg actctgagga ggatgacgat gaagatagcg gacatagctc cagaaggagg 2580 ggaagcattt ctagtggcgt ttcttacgaa gagtttcaag tcctggtgag acgagtggac 2640 cggatggagc attccatcgg cagcatagtg tccaagattg acgccgtgat cgtgaagcta 2700 gagattatgg agcgagccaa actgaagagg agggaggtgc tgggaaggct gttggatggg 2760 gtggccgagg atgaaaggct gggtcgtgac agtgaaatcc atagggaaca gatggaacgg 2820 ctagtacgtg aagagttgga acgctgggaa tccgatgatg cagcttccca gatcagtcat 2880 ggtttaggca cgccagtggg actaaatggt caacctcgcc ccagaagctc ccgcccatct 2940 tcctcccaat ctacagaagg catggaaggt gcaggtggaa atgggagttc taatgtccac 3000 gtatgatatg tgtgtttcag tatgtgtgtt tctaataagt gaggaagtgg ctgtcctgaa 3060 ttgctgtaac aagcacacta tttatatgcc ctgaccacca taggatgcta gtctttgtga 3120 ccgattgcta atcttctgca ctttaattta ttttatataa actttaccca tggttcaaag 3180 attttttttt ctttttctca tataagaaat ctaggtgtaa atattgagta cagaaaaaaa 3240 atcttcatga tgtgtattga gcggtacgcc cagttgccac catgactgag tcttctcagt 3300 tgacaatgaa gtagcctttt aaagctagaa aactgtcaaa gggcttctga gtttcatttc 3360 cagtcacaaa aatcagtatt gttatttttt tccaagagtg tgaaggaaaa tggggcattc 3420 ctttccactc tggcatagtt catgagctta atacatagct ttcttttaag aaaggagcct 3480 tttttttcaa ctagcttcct ggggtaaact tttctaaaag ataaaatgga aaggaactcc 3540 aaactatgat agaatctgtg tgaatggtta agatgaatgt taaatactat gcttttttgt 3600 aagttgatcg tatctgatgt ctgtgggact aactgtatca cttaattttt accttatttt 3660 ggctctaatt tgaataagct gagtaaaacc accaaagatc agttatagga taaaatggca 3720 tctctaacca taacacagga gaattggaag gagccctaag ttgtcactca gtttaatttc 3780 ttttaatggt tagtttagcc taaagattta tctgcatatt ctttttccca tgtggctcta 3840 ctcatttgca actgaattta atgttataac tcatctagtg agaccaactt actaaatttt 3900 tagtatgcac tgaaagtttt tatccaacaa ttatgttcat tttaagcaaa attttaagaa 3960 agttttgaaa ttcataaagc atttggtttt aaactatttt aagaatatag tactcggtca 4020 ggtatgacgg ctcacgcctg taatcccagc actttgggag gccgaaacag gcgaatcact 4080 tgagcccagg agttcaagac caacatgggc aatgtggcga aactccatct ctacaaaaaa 4140 tgcaaaaata aaaaatatag tactcaagta ttcttgatcc tgtgtttcaa aactagaatt 4200 tgtaatgcaa atggagctca gtctaataaa aaagaggttt tggtattaaa agttcataca 4260 ttagacagta tcagccaaaa tttgagttag caacactgtt ttctttacga gagggtctca 4320 cccaaattta tggggagaaa tctatttctc aaaaaaaaaa atcttctttt acagaaatgt 4380 tgagtaaggt gacattttga gcgctaataa gcaaaagagc atgcagtgct gttgaataac 4440 cctcacttgg agaaccaaga gaatcctgtc gtttaatgct atattttaat ttcacaagtt 4500 gttcatttaa ctggtagaat gtcagtccaa tctccaatga gaacatgagc aaatagacct 4560 ttccaggttg aaagtgaaac atactgggtt tctgtaagtt tttcctcatg gcttcatctc 4620 tatctttact ttctcttgaa tatgctacac aaagttcttt attactacat actaaagttt 4680 gcattccagg gatattgact gtacatattt atgtatatgt accatgttgt tacatgtaaa 4740 caaacttcaa tttgaagtgc agctattatg tggtatccat gtgtatcgac catgtgccat 4800 atatcaatta tggtcactag aaagtctctt tatgatactt tttattgtac tgtttttcat 4860 ttcacttgca aaattttgca gaattcctcc tttctaccca taaattacat atatttttct 4920 tctttagtca tggagaactc cccccctcat ctcttcccta ttatctttcc ctgtgtactg 4980 gtattattaa aaagacatta catacgcaag tctttctcga caatcaagaa tgttattaat 5040 gtgtaatact gagcacttta cttcttaata aaaacttgat atagtagca 5089 <210> 245 <211> 1222 <212> DNA <213> Homo sapiens <400> 245 atgtcttctc tctcttacag ctcttcaaat tcatcaattt taacaggacc atgagccagc 60 tctcgacaac catgtctcga tgtgccaaag acctgtttgg ctttgctatt atgttcttca 120 ttattttcct agcgtatgct cagttggcat accttgtctt tggcactcag gtcgatgact 180 tcagtacttt ccaagagtgt atcttcactc aattccgtat cattttgggc gatatcaact 240 ttgcagagat tgaggaagct aatcgagttt tgggaccaat ttatttcact acatttgtgt 300 tctttatgtt cttcattctt ttgaatatgt ttttggctat catcaatgat acttactctg 360 aagtgaaatc tgacttggca cagcagaaag ctgaaatgga actctcagat cttatcagaa 420 agggctacca taaagctttg gtcaaactaa aactgaaaaa aaataccgtg gatgacattt 480 cagagagtct gcggcaagga ggaggcaagt taaactttga cgaacttcga caagatctca 540 aagggaaggg ccatactgat gcagagattg aggcaatatt cacaaagtac gaccaagatg 600 gagaccaaga actgaccgaa catgaacatc agcagatgag agacgacttg gagaaagaga 660 gggaggacct ggatttggat cacagttctt taccacgtcc catgagcagc cgaagtttcc 720 ctcgaagcct ggatgactct gaggaggatg acgatgaaga tagcggacat agctccagaa 780 ggaggggaag catttctagt ggcgtttctt acgaagagtt tcaagtcctg gtgagacgag 840 tggaccggat ggagcattcc atcggcagca tagtgtccaa gattgacgcc gtgatcgtga 900 agctagagat tatggagcga gccaaactga agaggaggga ggtgctggga aggctgttgg 960 atggggtggc cgaggatgaa aggctgggtc gtgacagtga aatccatagg gaacagatgg 1020 aacggctagt acgtgaagag ttggaacgct gggaatccga tgatgcagct tcccagatca 1080 gtcatggttt aggcacgcca gtgggactaa atggtcaacc tcgccccaga agctcccgcc 1140 catcttcctc ccaatctaca gaaggcatgg aaggtgcagg tggaaatggg agttctaatg 1200 tccacgtatg atatgtgtgt tt 1222 <210> 246 <211> 693 <212> DNA <213> Homo sapiens <400> 246 gaatgatagg ggaaaggaag gcaagggtga gagaagacct tgtgtgaatt tgtccaaaat 60 gtttatccac aggaacaatc cctttgtgaa ggctgctggt atgtgaatgt gtgccggttc 120 ccttggggcg ttcatttgga tctttctgtg ttccagtgac ctacggcatg atgagctcca 180 atgtgtacta ctacacccgg atgatgtcac agctcttcct agacaccccc gtgtccaaaa 240 cggagaaaac taactttaaa actctgtctt ccatggaaga cttctggaag ttcacagaag 300 gctccttatt ggatgggctg tactggaaga tgcagcccag caaccagact gaagctgaca 360 accgaagttt catcttctat gagaacctgc tgttaggggt tccacgaata cggcaactcc 420 gagtcagaaa tggatcctgc tctatccccc aggacttgag agatgaaatt aaagagtgct 480 atgatgtcta ctctgtcagt agtgaagata gggctccctt tgggccccga aatggaaccg 540 cttggatcta cacaagtgaa aaagacttga atggtagtag ccactgggga atcattgcaa 600 cttatagtgg agctggctat tatctggatt tgtcaagaac aagagaggaa acagctgcac 660 aagttgctag cctcaagaaa aatgtctggc tgg 693 <210> 247 <211> 550 <212> DNA <213> Homo sapiens <400> 247 ccagtcggcg gcggggaccc gctgcatcgc cacctccccc tggaagggca gccgccccga 60 gtggcctggg cggagaggct ggttcgcggg ctgcgaggtc tctggggaac aagactcatg 120 gaggaaagca gcactaaccg agagaaatac cttaaaagtg ttttacggga actggtcaca 180 tacctccttt ttctcatagt cttgtgcatc tgaacaatcc ctttgtgaag gctgctggta 240 tgtgaatgtg tgccggttcc cttggggcgt tcatttggat ctttctgtgt tccagtgacc 300 tacggcatga tgagctccaa tgtgtactac tacacccgga tgatgtcaca gctcttccta 360 gacacccccg tgtccaaaac ggagaaaact aactttaaaa ctctgtcttc catggaagac 420 ttctggaagt tcacagaagg ctccttattg gatgggctgt actggaagat gcagcccagc 480 aaccagactg aagctgacaa ccgaagtttc atcttctatg agaacctgct gttaggggtt 540 ccacgaatac 550 <210> 248 <211> 1720 <212> DNA <213> Homo sapiens <400> 248 aatggtagta gccactgggg aatcattgca acttatagtg gagctggcta ttatctggat 60 ttgtcaagaa caagagagga aacagctgca caagttgcta gcctcaagaa aaatgtctgg 120 ctggaccgag gaaccagggc aacttttatt gacttctcag tgtacaacgc caacattaac 180 ctgttctgtg tggtcagctg tcagtggtag ctataggaat taacatatac agaacatcaa 240 atgtggaggt gctactacag tttctggaag atcaaaatac tttccccaac tttgagcatc 300 tggcatattg gcagatacag ttcaacaata tagctgctgt cacagtattt tttgtctgga 360 ttaagctctt caaattcatc aattttaaca ggaccatgag ccagctctcg acaaccatgt 420 ctcgatgtgc caaagacctg tttggctttg ctattatgtt cttcattatt ttcctagcgt 480 atgctcagtt ggcatacctt gtctttggca ctcaggtcga tgacttcagt actttccaag 540 agtgtatctt cactcaattc cgtatcattt tgggcgatat caactttgca gagattgagg 600 aagctaatcg agttttggga ccaatttatt tcactacatt tgtgttcttt atgttcttca 660 ttcttttgaa tatgtttttg gctatcatca atgatactta ctctgaagtg aaatctgact 720 tggcacagca gaaagctgaa atggaactct cagatcttat cagaaagggc taccataaag 780 ctttggtcaa actaaaactg aaaaaaaata ccgtggatga catttcagag agtctgcggc 840 aaggaggagg caagttaaac tttgacgaac ttcgacaaga tctcaaaggg aagggccata 900 ctgatgcaga gattgaggca atattcacaa agtacgacca agatggagac caagaactga 960 ccgaacatga acatcagcag atgagagacg acttggagaa agagagggag gacctggatt 1020 tggatcacag ttctttacca cgtcccatga gcagccgaag tttccctcga agcctggatg 1080 actctgagga ggatgacgat gaagatagcg gacatagctc cagaaggagg ggaagcattt 1140 ctagtggcgt ttcttacgaa gagtttcaag tcctggtgag acgagtggac cggatggagc 1200 attccatcgg cagcatagtg tccaagattg acgccgtgat cgtgaagcta gagattatgg 1260 agcgagccaa actgaagagg agggaggtgc tgggaaggct gttggatggg gtggccgagg 1320 atgaaaggct gggtcgtgac agtgaaatcc atagggaaca gatggaacgg ctagtacgtg 1380 aagagttgga acgctgggaa tccgatgatg cagcttccca gatcagtcat ggtttaggca 1440 cgccagtggg actaaatggt caacctcgcc ccagaagctc ccgcccatct tcctcccaat 1500 ctacagaagg catggaaggt gcaggtggaa atgggagttc taatgtccac gtatgatatg 1560 tgtgtttcag tatgtgtgtt tctaataagt gaggaagtgg ctgtcctgaa ttgctgtaac 1620 aagcacacta tttatatgcc ctgaccacca taggatgcta gtctttgtga ccgattgcta 1680 atcttctgca ctttaattta ttttatataa actttaccca 1720 <210> 249 <211> 1362 <212> DNA <213> Homo sapiens <400> 249 atactttccc caactttgag catctggcat attggcagat acagttcaac aatatagctg 60 ctgtcacagt attttttgtc tggattaagc tcttcaaatt catcaatttt aacaggacca 120 tgagccagct ctcgacaacc atgtctcgat gtgccaaaga cctgtttggc tttgctatta 180 tgttcttcat tattttccta gcgtatgctc agttggcata ccttgtcttt ggcactcagg 240 tcgatgactt cagtactttc caagagtgta taatatgttt ttggctatca tcaatgatac 300 ttactctgaa gtgaaatctg acttggcaca gcagaaagct gaaatggaac tctcagatct 360 tatcagaaag ggctaccata aagctttggt caaactaaaa ctgaaaaaaa ataccgtgga 420 tgacatttca gagagtctgc ggcaaggagg aggcaagtta aactttgacg aacttcgaca 480 agatctcaaa gggaagggcc atactgatgc agagattgag gcaatattca caaagtacga 540 ccaagatgga gaccaagaac tgaccgaaca tgaacatcag cagatgagag acgacttgga 600 gaaagagagg gaggacctgg atttggatca cagttcttta ccacgtccca tgagcagccg 660 aagtttccct cgaagcctgg atgactctga ggaggatgac gatgaagata gcggacatag 720 ctccagaagg aggggaagca tttctagtgg cgtttcttac gaagagtttc aagtcctggt 780 gagacgagtg gaccggatgg agcattccat cggcagcata gtgtccaaga ttgacgccgt 840 gatcgtgaag ctagagatta tggagcgagc caaactgaag aggagggagg tgctgggaag 900 gctgttggat ggggtggccg aggatgaaag gctgggtcgt gacagtgaaa tccataggga 960 acagatggaa cggctagtac gtgaagagtt ggaacgctgg gaatccgatg atgcagcttc 1020 ccagatcagt catggtttag gcacgccagt gggactaaat ggtcaacctc gccccagaag 1080 ctcccgccca tcttcctccc aatctacaga aggcatggaa ggtgcaggtg gaaatgggag 1140 ttctaatgtc cacgtatgat atgtgtgttt cagtatgtgt gtttctaata agtgaggaag 1200 tggctgtcct gaattgctgt aacaagcaca ctatttatat gccctgacca ccataggatg 1260 ctagtctttg tgaccgattg ctaatcttct gcactttaat ttattttata taaactttac 1320 ccatggttca aagatttttt tttctttttc tcatataaga aa 1362 <210> 250 <211> 1554 <212> DNA <213> Homo sapiens <400> 250 acagttcaac aatatagctg ctgtcacagt attttttgtc tggattaagc tcttcaaatt 60 catcaatttt aacaggacca tgagccagct ctcgacaacc atgtctcgat gtgccaaaga 120 cctgtttggc tttgctatta tgttcttcat tattttccta gcgtatgctc agttggcata 180 ccttgtcttt ggcactcagg tcgatgactt cagtactttc caagagtgta taatatgttt 240 ttggctatca tcaatgatac ttactctgaa gtgaaatctg acttggcaca gcagaaagct 300 gaaatggaac tctcagatct tatcagaaag ggctaccata aagctttggt caaactaaaa 360 ctgaaaaaaa ataccgtgga tgacatttca gagagtctgc ggcaaggagg aggcaagtta 420 aactttgacg aacttcgaca agatctcaaa gggtgagaat catgcttcct gaggttctga 480 aaaattcctg cttctaaaga taaattcctg gtgataagag tatttctagc ccaagggctc 540 atacagatac tttttttttt tttttccaga ggcaggtatc tttctggaac atgttataag 600 aggaaaactt gcccccattt ggtgatttct cctttcctcc tgcattttga tgtctctgtg 660 ttgagggtga actgggtaca aggaatgatt tttatctgta tcctctctct aatttcagga 720 agggccatac tgatgcagag attgaggcaa tattcacaaa gtacgaccaa gatggagacc 780 aagaactgac cgaacatgaa catcagcaga tgagagacga cttggagaaa gagagggagg 840 acctggattt ggatcacagt tctttaccac gtcccatgag cagccgaagt ttccctcgaa 900 gcctggatga ctctgaggag gatgacgatg aagatagcgg acatagctcc agaaggaggg 960 gaagcatttc tagtggcgtt tcttacgaag agtttcaagt cctggtgaga cgagtggacc 1020 ggatggagca ttccatcggc agcatagtgt ccaagattga cgccgtgatc gtgaagctag 1080 agattatgga gcgagccaaa ctgaagagga gggaggtgct gggaaggctg ttggatgggg 1140 tggccgagga tgaaaggctg ggtcgtgaca gtgaaatcca tagggaacag atggaacggc 1200 tagtacgtga agagttggaa cgctgggaat ccgatgatgc agcttcccag atcagtcatg 1260 gtttaggcac gccagtggga ctaaatggtc aacctcgccc cagaagctcc cgcccatctt 1320 cctcccaatc tacagaaggc atggaaggtg caggtggaaa tgggagttct aatgtccacg 1380 tatgatatgt gtgtttcagt atgtgtgttt ctaataagtg aggaagtggc tgtcctgaat 1440 tgctgtaaca agcacactat ttatatgccc tgaccaccat aggatgctag tctttgtgac 1500 cgattgctaa tcttctgcac tttaatttat tttatataaa ctttacccat ggtt 1554 <210> 251 <211> 99 <212> DNA <213> Homo sapiens <400> 251 aggcggcggc gggcgccggg aagaaaggaa catggctcct gaggcgcaca gcgccgagcg 60 cggcgccgcg cacccgcgcg ccggacgcca gtgaccgcg 99 <210> 252 <211> 341 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 252 cccacaucgc cugccacuac uuaaguccga uucacuucgg cuuuagcucc aagccuuuaa 60 ucucgcgaag cucuuuuuuu uuuuuuaaca acauaggagc ugugauuggc uguuuucagc 120 caaucagcac ugacucauuu gcauagccuu uacaagcggu cacaaacuca agaaacgagc 180 gguuuuaaua gucuuuuaga auauuguuua ucgaaccgaa uaaggaacug ugcuuuguga 240 uucacauauc aguggagggg uguggaaaug gcaccuugau cucacccuca ucgaaagugg 300 aguugauguc cuucccuggc ucgcuacaga cgcacuuccg c 341 <210> 253 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 253 aaguguuaca gcucuuuuag 20 <210> 254 <211> 42 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 254 aauuugucua gcagguuuuc ugacuucggu cggaaaaccc cu 42 <210> 255 <211> 42 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 255 aauuuuugga gcagguuuuc ugacuucggu cggaaaaccc cu 42 <210> 256 <211> 168 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 256 cccaauuuca cuggucuaca augaaagcaa aacaguucuc uuccccgcuc cccggugugu 60 gagaggggcu uugauccuuc ucugguuucc uaggaaacgc guaugugcua gagccacgcu 120 cugagacuuc cgccucgugc ggucccgcuu ccuuucugcc uccucugg 168 <210> 257 <211> 571 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 257 cccacaucgc cugccacuac uuaaguccga uucacuucgg cuuuagcucc aagccuuuaa 60 ucucgcgaag cucuuuuuuu uuuuuuaaca acauaggagc ugugauuggc uguuuucagc 120 caaucagcac ugacucauuu gcauagccuu uacaagcggu cacaaacuca agaaacgagc 180 gguuuuaaua gucuuuuaga auauuguuua ucgaaccgaa uaaggaacug ugcuuuguga 240 uucacauauc aguggagggg uguggaaaug gcaccuugau cucacccuca ucgaaagugg 300 aguugauguc cuucccuggc ucgcuacaga cgcacuuccg caaguguuac agcucuuuua 360 gaauuugucu agcagguuuu cugacuucgg ucggaaaacc ccucccaauu ucacuggucu 420 acaaugaaag caaaacaguu cucuuccccg cuccccggug ugugagaggg gcuuugaucc 480 uucucugguu uccuaggaaa cgcguaugug cuagagccac gcucugagac uuccgccucg 540 ugcggucccg cuuccuuucu gccuccucug g 571 <210> 258 <211> 571 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 258 cccacaucgc cugccacuac uuaaguccga uucacuucgg cuuuagcucc aagccuuuaa 60 ucucgcgaag cucuuuuuuu uuuuuuaaca acauaggagc ugugauuggc uguuuucagc 120 caaucagcac ugacucauuu gcauagccuu uacaagcggu cacaaacuca agaaacgagc 180 gguuuuaaua gucuuuuaga auauuguuua ucgaaccgaa uaaggaacug ugcuuuguga 240 uucacauauc aguggagggg uguggaaaug gcaccuugau cucacccuca ucgaaagugg 300 aguugauguc cuucccuggc ucgcuacaga cgcacuuccg caaguguuac agcucuuuua 360 gaauuuuugg agcagguuuu cugacuucgg ucggaaaacc ccucccaauu ucacuggucu 420 acaaugaaag caaaacaguu cucuuccccg cuccccggug ugugagaggg gcuuugaucc 480 uucucugguu uccuaggaaa cgcguaugug cuagagccac gcucugagac uuccgccucg 540 ugcggucccg cuuccuuucu gccuccucug g 571 <210> 259 <211> 210 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 259 aauuuuugga gcagguuuuc ugacuucggu cggaaaaccc cucccaauuu cacuggucua 60 caaugaaagc aaaacaguuc ucuuccccgc uccccggugu gugagagggg cuuugauccu 120 ucucugguuu ccuaggaaac gcguaugugc uagagccacg cucugagacu uccgccucgu 180 gcggucccgc uuccuuucug ccuccucugg 210 <210> 260 <211> 569 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 260 cccacaucgc cugccacuac uuaaguccga uucacuucgg cuuuagcucc aagccuuuaa 60 ucucgcgaag cucuuuuuuu uuuuuuaaca acauaggagc ugugauuggc uguuuucagc 120 caaucagcac ugacucauuu gcauagccuu uacaagcggu cacaaacuca agaaacgagc 180 gguuuuaaua gucuuuuaga auauuguuua ucgaaccgaa uaaggaacug ugcuuuguga 240 uucacauauc aguggagggg uguggaaaug gcaccuugau cucacccuca ucgaaagugg 300 aguugauguc cuucccuggc ucgcuacaga cgcacuuccg cguacuuuca aaguuauuua 360 auuuuuggag cagguuuucu gacuucgguc ggaaaacccc ucccaauuuc acuggucuac 420 aaugaaagca aaacaguucu cuuccccgcu ccccggugug ugagaggggc uuugauccuu 480 cucugguuuc cuaggaaacg cguaugugcu agagccacgc ucugagacuu ccgccucgug 540 cggucccgcu uccuuucugc cuccucugg 569 <210> 261 <211> 569 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 261 cccacaucgc cugccacuac uuaaguccga uucacuucgg cuuuagcucc aagccuuuaa 60 ucucgcgaag cucuuuuuuu uuuuuuaaca acauaggagc ugugauuggc uguuuucagc 120 caaucagcac ugacucauuu gcauagccuu uacaagcggu cacaaacuca agaaacgagc 180 gguuuuaaua gucuuuuaga auauuguuua ucgaaccgaa uaaggaacug ugcuuuguga 240 uucacauauc aguggagggg uguggaaaug gcaccuugau cucacccuca ucgaaagugg 300 aguugauguc cuucccuggc ucgcuacaga cgcacuuccg cauaaaucga accaucguaa 360 auuuuuggag cagguuuucu gacuucgguc ggaaaacccc ucccaauuuc acuggucuac 420 aaugaaagca aaacaguucu cuuccccgcu ccccggugug ugagaggggc uuugauccuu 480 cucugguuuc cuaggaaacg cguaugugcu agagccacgc ucugagacuu ccgccucgug 540 cggucccgcu uccuuucugc cuccucugg 569 <210> 262 <211> 569 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 262 cccacaucgc cugccacuac uuaaguccga uucacuucgg cuuuagcucc aagccuuuaa 60 ucucgcgaag cucuuuuuuu uuuuuuaaca acauaggagc ugugauuggc uguuuucagc 120 caaucagcac ugacucauuu gcauagccuu uacaagcggu cacaaacuca agaaacgagc 180 gguuuuaaua gucuuuuaga auauuguuua ucgaaccgaa uaaggaacug ugcuuuguga 240 uucacauauc aguggagggg uguggaaaug gcaccuugau cucacccuca ucgaaagugg 300 aguugauguc cuucccuggc ucgcuacaga cgcacuuccg cuuucuuccc ggcgcccgca 360 auuuuuggag cagguuuucu gacuucgguc ggaaaacccc ucccaauuuc acuggucuac 420 aaugaaagca aaacaguucu cuuccccgcu ccccggugug ugagaggggc uuugauccuu 480 cucugguuuc cuaggaaacg cguaugugcu agagccacgc ucugagacuu ccgccucgug 540 cggucccgcu uccuuucugc cuccucugg 569 <210> 263 <211> 121 <212> DNA <213> Homo sapiens <400> 263 ttacgatggt tcgatttatg atttttcaac ttcatggtga tgtgaaagtg atacacattc 60 tatagaaacc acactttcaa ttttgaattt tggtcttttt ccaggctacc atactctaaa 120 g 121 <210> 264 <211> 94 <212> DNA <213> Homo sapiens <400> 264 tggtcttttt ccaggctacc atactctaaa gatagagcca cagatcccag tcagccatgt 60 gattatgagg gtaagcgacc aatactctac agtg 94 <210> 265 <211> 116 <212> DNA <213> Homo sapiens <400> 265 gattatgagg gtaagcgacc aatactctac agtgtattgt attgccagat ggttttgccc 60 aactagccta atgtaagtat tctaaacatg tttaaggtag gccaggctaa gctgtg 116 <210> 266 <211> 108 <212> DNA <213> Homo sapiens <400> 266 ggaaggtatt tgcaaataac tttgaaagta cctctctatc acagaaaatt gttcatttgg 60 cttcatcatt tcaatgcatg agtatcgaca ggacctgctt tgcattta 108 <210> 267 <211> 97 <212> DNA <213> Homo sapiens <400> 267 acctgctttg catttaacac tgtgtgagac gtaagttatg gtgagttgtt agaagttact 60 gttcctactc tcaaaggggg taaactaaca ttgagaa 97 <210> 268 <211> 102 <212> DNA <213> Homo sapiens <400> 268 aaactaacat tgagaacttt gcctgtgcct tgcactgtgc tgagtgtttc atatcttacc 60 ttatttaatt tctatagtct aactctataa ggtaagtact aa 102 <210> 269 <211> 150 <212> DNA <213> Homo sapiens <400> 269 aaggtatttg caaataactt tgaaagtacc tctctatcac agaaaattgt tcatttggct 60 tcatcatttc aatgcatgag tatcgacagg acctgctttg catttaacac tgtgtgagac 120 gtaagttatg gtgagttgtt agaagttact 150 <210> 270 <211> 146 <212> DNA <213> Homo sapiens <400> 270 tatggtgagt tgttagaagt tactgttcct actctcaaag ggggtaaact aacattgaga 60 actttgcctg tgccttgcac tgtgctgagt gtttcatatc ttaccttatt taatttctat 120 agtctaactc tataaggtaa gtacta 146 <210> 271 <211> 98 <212> DNA <213> Homo sapiens <400> 271 ggcggcgggc gccgggaaga aaggaacatg gctcctgagg cgcacagcgc cgagcgcggc 60 gccgcgcacc cgcgcgccgg acgccagtga ccgcgatg 98

Claims (184)

  1. 표적 유전자로부터 전사되고 넌센스 매개 RNA 붕괴 유도 엑손(NMD 엑손)을 포함하는 프리-mRNA를 갖는 세포에서 표적 단백질의 발현을 조절하는 방법으로서, 제제 또는 이 제제를 인코딩하는 벡터를 세포에 접촉시켜, 제제가 프리-mRNA로부터 NMD 엑손의 스플라이싱을 조절함으로써, 프리-mRNA로부터 처리되는 프로세싱된 mRNA의 수준을 조절하는 단계, 및 세포에서 PKD2 유전자에 의해 인코딩되는 표적 단백질의 발현을 조절하는 단계를 포함하는, 방법.
  2. 대상체의 세포에서 표적 단백질의 발현을 조절함으로써 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법으로서, 제제 또는 이 제제를 인코딩하는 벡터를 대상체의 세포에 접촉시켜, 제제가 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터의 넌센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 처리되는 프로세싱된 mRNA의 수준을 조절하는 단계, 및 세포에서 PKD2 유전자에 의해 인코딩되는 표적 단백질의 발현을 조절하는 단계를 포함하는, 방법.
  3. 제1항 또는 제2항에 있어서, 표적 단백질은 폴리시스틴 2인, 방법.
  4. 제2항에 있어서, 질환 또는 병태는 폴리시스틴 2의 양 또는 활성의 결핍과 연관된 질환 또는 병태인, 방법.
  5. 제2항에 있어서, 질환 또는 병태는 폴리시스틴 1의 양 또는 활성의 결핍과 연관된 질환 또는 병태인, 방법.
  6. 제3항에 있어서, 질환 또는 병태는 폴리시스틴 2가 기능적으로 증강, 보상, 대체 또는 기능적으로 상호작용하는 단백질의 양 또는 활성의 결핍과 연관된 질환 또는 병태인, 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 제제는 하기인, 방법:
    (a) 프리-mRNA의 표적화 부분에 결합함;
    (b) NMD 엑손의 스플라이싱에 관여하는 인자의 결합을 조절함; 또는
    (c) (a)와 (b)의 조합.
  8. 제7항에 있어서, 제제는 NMD 엑손의 스플라이싱에 관여하는 인자의 결합을 방해하는, 방법.
  9. 제7항에 있어서, 프리-mRNA의 표적화 부분은 NMD 엑손에 근접한 것인, 방법.
  10. 제7항에 있어서, 프리-mRNA의 표적화 부분은 NMD 엑손의 5' 말단의 업스트림(upstream)에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
  11. 제7항에 있어서, 프리-mRNA의 표적화 부분은 NMD 엑손의 5' 말단의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드인, 방법.
  12. 제7항에 있어서, 프리-mRNA의 표적화 부분은 NMD 엑손의 3' 말단의 다운스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
  13. 제7항에 있어서, 프리-mRNA의 표적화 부분은 NMD 엑손의 3' 말단의 다운스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드인, 방법.
  14. 제7항에 있어서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031085의 게놈 부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
  15. 제7항에 있어서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031085의 게놈 부위의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
  16. 제7항에 있어서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031140의 게놈 부위의 다운스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
  17. 제7항에 있어서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88031140의 게놈 부위의 다운스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
  18. 제7항에 있어서, 프리-mRNA의 표적화 부분은 프리-mRNA의 2개의 정규 엑손 영역 사이의 인트론 영역에 위치하고, 인트론 영역은 NMD 엑손을 함유하는, 방법.
  19. 제7항에 있어서, 프리-mRNA의 표적화 부분은 NMD 엑손과 적어도 부분적으로 중첩되는, 방법.
  20. 제7항에 있어서, 프리-mRNA의 표적화 부분은 NMD 엑손의 업스트림 또는 다운스트림 인트론과 적어도 부분적으로 중첩되는, 방법.
  21. 제7항에 있어서, 프리-mRNA의 표적화 부분은 5' NMD 엑손-인트론 접합 또는 3' NMD 엑손-인트론 접합을 포함하는, 방법.
  22. 제7항에 있어서, 프리-mRNA의 표적화 부분은 NMD 엑손 내에 있는, 방법.
  23. 제7항에 있어서, 프리-mRNA의 표적화 부분은 NMD 엑손의 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 또는 그 초과 개의 연속 뉴클레오티드를 포함하는, 방법.
  24. 제1항 내지 제23항 중 어느 한 항에 있어서, NMD 엑손은 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80%, 적어도 90% 또는 100% 서열 동일성을 갖는 서열을 포함하는, 방법.
  25. 제1항 내지 제23항 중 어느 한 항에 있어서, NMD 엑손은 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열을 포함하는, 방법.
  26. 제7항에 있어서, 프리-mRNA는 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함하는, 방법.
  27. 제7항에 있어서, 프리-mRNA는 표 2에 열거된 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 약 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 유전자 서열에 의해 인코딩되는, 방법.
  28. 제7항에 있어서, 프리-mRNA의 표적화 부분은 표 3에 열거된 서열로 이루어진 군으로부터 선택된 서열의 적어도 8개의 연속 핵산을 포함하는 영역에 대해 적어도 80%, 85%, 90%, 95%, 97% 또는 100% 서열 동일성을 갖는 서열을 포함하는, 방법.
  29. 제7항에 있어서, 제제는 안티센스 올리고머(ASO)이고, ASO는 표 4 또는 표 5에 열거된 서열로 이루어진 군으로부터 선택된 서열의 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 또는 18개의 연속 핵산에 대해 적어도 약 80%, 85%, 90%, 95%, 97%, 또는 100% 서열 동일성인 서열을 포함하는, 방법.
  30. 제7항에 있어서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085-88031140내에 있는 것인, 방법.
  31. 제7항에 있어서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085-88031140의 업스트림 또는 다운스트림인, 방법.
  32. 제7항에 있어서, 프리-mRNA의 표적화 부분은 넌센스 매개 RNA 붕괴 유도 엑손 GRCh38/ hg38: chr4:88031085 88031140의 엑손-인트론 접합부를 포함하는, 방법.
  33. 제3항에 있어서, 프로세싱된 mRNA로부터 발현되는 폴리시스틴 2는 전장 폴리시스틴 2 또는 야생형 폴리시스틴 2인, 방법.
  34. 제3항에 있어서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 야생형 폴리시스틴 2에 비해 적어도 부분적으로 기능적인 것인, 방법.
  35. 제3항에 있어서, 프로세싱된 mRNA로부터 발현된 폴리시스틴 2는 전장 야생형 폴리시스틴 2에 비해 적어도 부분적으로 기능적인 것인, 방법.
  36. 제1항 내지 제35항 중 어느 한 항에 있어서, 제제는 프리-mRNA로부터 NMD 엑손의 스플라이싱을 조절하고 프리-mRNA로부터 NMD 엑손의 배제를 촉진함으로써, 프리-mRNA로부터 프로세싱되고 NMD 엑손이 결여된 프로세싱된 mRNA의 수준을 조절하는, 방법.
  37. 제36항에 있어서, 제제와 접촉된 세포에서 프리-mRNA로부터의 NMD 엑손의 배제는 대조군 세포에서 프리-mRNA로부터의 NMD 엑손의 배제에 비해 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가되는, 방법.
  38. 제1항 내지 제37항 중 어느 한 항에 있어서, 세포에서 프로세싱된 mRNA의 수준을 증가시키는, 방법.
  39. 제38항에 있어서, 제제와 접촉된 세포에서 프로세싱된 mRNA의 수준은 대조군 세포에서 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가되는, 방법.
  40. 제1항 내지 제37항 중 어느 한 항에 있어서, 제제는 세포에서 표적 단백질의 발현을 증가시키는, 방법.
  41. 제40항에 있어서, 표적 단백질의 수준은 대조군 세포에서 생산된 표적 단백질의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배까지 증가되는, 방법.
  42. 제1항 내지 제41항 중 어느 한 항에 있어서, NMD 엑손은 조기 종결 코돈(PTC)을 포함하는, 방법.
  43. 제2항에 있어서, 질환 또는 병태는 표적 유전자 또는 표적 단백질의 기능 상실 돌연변이와 연관된 것인, 방법.
  44. 제43항에 있어서, 질환 또는 병태는 표적 유전자의 반가불충분성(haploinsufficiency)과 연관되고, 대상체는 기능성 폴리시스틴 2를 인코딩하는 제1 대립유전자 및 폴리시스틴 2가 생산되지 않거나 감소된 수준으로 생산되는 제2 대립유전자, 또는 비기능성 폴리시스틴 2 또는 부분적 기능성 폴리시스틴 2를 인코딩하는 제2 대립유전자를 가지는, 방법.
  45. 제44항에 있어서, 하나 또는 둘 모두의 대립유전자는 하이포모르프이거나 부분적으로 기능적인 것인, 방법.
  46. 제2항 또는 제44항에 있어서, 질환 또는 병태는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 및 두개내 동맥류로 이루어진 군으로부터 선택되는, 방법.
  47. 제2항 또는 제43항에 있어서, 질환 또는 병태는 PKD1 또는 PKD2 유전자의 돌연변이와 연관되고, 대상체는,
    하기 표적 단백질을 인코딩하는 제1 대립유전자:
    (i) 표적 단백질은 생산되지 않거나 야생형 대립유전자에 비해 감소된 수준으로 생산됨; 또는
    (ii) 생산된 표적 단백질은 야생형 대립유전자에 비해 비기능적이거나 부분적으로 기능적임, 및
    하기 표적 단백질을 인코딩하는 제2 대립유전자를 갖는 방법:
    (iii) 표적 단백질은 야생형 대립유전자에 비해 감소된 수준으로 생산되고 생산된 표적 단백질은 야생형 대립유전자에 비해 적어도 부분적으로 기능적임; 또는
    (iv) 생산된 표적 단백질은 야생형 대립유전자에 비해 부분적으로 기능적임.
  48. 제47항에 있어서, 질환 또는 병태는 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 및 두개내 동맥류로 이루어진 군으로부터 선택되는, 방법.
  49. 제47항에 있어서, 돌연변이는 하이포모르픽(hypomorphic) 돌연변이인, 방법.
  50. 제47항에 있어서, 질환 또는 병태는 PKD2 유전자의 돌연변이와 연관된 것인, 방법.
  51. 제47항에 있어서, 질환 또는 병태는 PKD1 유전자의 돌연변이와 연관된 것인, 방법.
  52. 제43항에 있어서, 제제는 프리-mRNA로부터 NMD 엑손의 배제를 촉진함으로써, 프리-mRNA로부터 프로세싱되고 NMD 엑손이 결여된 프로세싱된 mRNA의 수준을 조절하고 세포의 표적 단백질의 발현을 증가시키는, 방법.
  53. 제1항 또는 제2항에 있어서, 제제는 안티센스 올리고머(ASO)이고 안티센스 올리고머는 포스포로티오에이트 연결 또는 포스포로디아미데이트 연결을 포함하는 백본 변형을 포함하는, 방법.
  54. 제1항 또는 제2항에 있어서, 제제는 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 포스포로디아미데이트 모폴리노, 잠금 핵산, 펩티드 핵산, 2'-O-메틸, 2'-플루오로, 또는 2'-O-메톡시에틸 모이어티를 포함하는, 방법.
  55. 제1항 또는 제2항에 있어서, 제제는 안티센스 올리고머(ASO)이고 안티센스 올리고머는 적어도 하나의 변형된 당 모이어티를 포함하는, 방법.
  56. 제55항에 있어서, 각각의 당 모이어티는 변형된 당 모이어티인, 방법.
  57. 제1항 또는 제2항에 있어서, 제제는 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 또는 12 내지 15개의 핵염기로 이루어지는, 방법.
  58. 제7항에 있어서, 제제는 안티센스 올리고머(ASO)이고, 안티센스 올리고머는 프리-mRNA의 표적화 부분에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 상보적인 것인, 방법.
  59. 제1항 또는 제2항에 있어서, 제제를 인코딩하는 벡터를 세포에 접촉시키는 단계를 포함하는, 방법.
  60. 제59항에 있어서, 제제는 안티센스 올리고머를 포함하는 폴리뉴클레오티드인, 방법.
  61. 제59항에 있어서, 벡터는 바이러스 벡터인, 방법.
  62. 제61항에 있어서, 바이러스 벡터는 아데노바이러스 연관 바이러스 벡터인, 조성물.
  63. 제59항에 있어서, 폴리뉴클레오티드는 변형된 snRNA를 추가로 포함하는, 방법.
  64. 제63항에 있어서, 변형된 인간 snRNA는 변형된 U1 snRNA 또는 변형된 U7 snRNA인, 방법.
  65. 제63항에 있어서, 변형된 인간 snRNA는 변형된 U7 snRNA이고 안티센스 올리고머는 표 4 또는 표 5에 열거된 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 갖는, 방법.
  66. 제1항 또는 제2항에 있어서, 표적 단백질의 프로세싱된 mRNA 수준 또는 발현 수준을 평가하는 단계를 추가로 포함하는, 방법.
  67. 제2항에 있어서, 대상체는 인간인, 방법.
  68. 제2항에 있어서, 대상체는 비-인간 동물인, 방법.
  69. 제2항에 있어서, 대상체는 태아, 배아 또는 아동인, 방법.
  70. 제1항 또는 제2항에 있어서, 세포는 생체 외인 것인, 방법.
  71. 제2항에 있어서, 제제는 대상체의 척수강내 주사, 뇌실심내 주사, 복강내 주사, 근육내 주사, 피하 주사, 유리체내 또는 정맥내 주사에 의해 투여되는, 방법.
  72. 제2항에 있어서, 대상체에게 제2 치료제를 투여하는 단계를 추가로 포함하는, 방법.
  73. 제72항에 있어서, 제2 치료제는 소분자인, 방법.
  74. 제72항에 있어서, 제2 치료제는 안티센스 올리고머인, 방법.
  75. 제72항에 있어서, 제2 치료제는 인트론 체류를 수정하는 것인, 방법.
  76. 제1항 내지 제75항 중 어느 한 항에 있어서, 방법은 넌센스 매개 RNA 붕괴 대체 스플라이스 부위(NSASS) 조절제 또는 이 제제를 인코딩하는 바이러스 벡터를 세포에 접촉시키는 단계를 추가로 포함하고, 프리-mRNA는 정규 5' 스플라이스 부위의 다운스트림에 대체 5' 스플라이스-부위를 포함하고, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산되는 프로세싱된 mRNA는 넌센스 매개 RNA 붕괴를 거치고, 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 조절하여 표적 단백질의 발현을 조절함으로써 프리-mRNA의 프로세싱을 조절하고; 그리고 표적 유전자는 PKD2인, 방법.
  77. 제1항 내지 제76항 중 어느 한 항에 있어서, 질환 또는 병태를 치료하는, 방법.
  78. 조성물로서, 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터 넌센스 매개 mRNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 프로세싱되는 프로세싱된 mRNA의 수준을 조절하고, 프리-mRNA를 갖는 세포에서 표적 단백질의 발현을 조절하는, 제제 또는 상기 제제를 인코딩하는 벡터를 포함하며, 표적 단백질은 PKD2 유전자에 의해 인코딩되는, 조성물.
  79. 조성물로서, 표적 유전자로부터 전사되고 NMD 엑손을 포함하는 프리-mRNA로부터 넌센스 매개 RNA 붕괴 유도 엑손(NMD 엑손)의 스플라이싱을 조절함으로써, 프리-mRNA로부터 프로세싱되는 프로세싱된 mRNA의 수준을 조절하고 대상체의 세포에서 표적 단백질의 발현을 조절함으로써 필요한 대상체에서 질환 또는 병태를 치료하는, 제제 또는 상기 제제를 인코딩하는 벡터를 포함하며, 표적 단백질은 PKD2 유전자에 의해 인코딩되는, 조성물.
  80. 제78항 또는 제79항의 조성물; 및 약제학적으로 허용되는 부형제 및/또는 전달 비히클을 포함하는, 약제학적 조성물.
  81. 넌센스 매개된 RNA 붕괴 대체 스플라이스-부위(NSASS) 조절제 또는 이 제제를 인코딩하는 바이러스 벡터를 포함하는 조성물로서, 제제는 표적 유전자로부터 전사되고 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하고, 프리-mRNA는 정규 5' 스플라이스-부위의 다운스트림에 대체 5' 스플라이스-부위를 포함하고, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산되는 프로세싱된 mRNA는 넌센스 매개 RNA 붕괴를 거치고, 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 조절하여 프리-mRNA의 프로세싱을 조절하고; 그리고 표적 유전자는 PKD2인, 방법.
  82. 제81항에 있어서, 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 방지하거나 감소시킴으로써 프리-mRNA의 프로세싱을 조절하는, 조성물.
  83. 제81항 또는 제82항에 있어서, 제제는 정규 5' 스플라이스-부위에서 스플라이싱을 촉진하거나 증가시킴으로써 프리-mRNA의 프로세싱을 조절하는, 조성물.
  84. 제81항에 있어서, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱을 조절하는 것은 세포에서 표적 단백질의 발현을 증가시키는, 조성물.
  85. 제81항 내지 제84항 중 어느 한 항에 있어서, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산된 프로세싱된 mRNA는 조기 종결 코돈(PTC)을 포함하는, 조성물.
  86. 제81항 내지 제85항 중 어느 한 항에 있어서, 제제는 소분자인, 조성물.
  87. 제81항 내지 제85항 중 어느 한 항에 있어서, 제제는 폴리펩티드인, 조성물.
  88. 제87항에 있어서, 폴리펩티드는 핵산 결합 단백질인, 조성물.
  89. 제88항에 있어서, 핵산 결합 단백질은 TAL-이펙터 또는 징크 핑거 결합 도메인을 함유하는, 조성물.
  90. 제88항에 있어서, 핵산 결합 단백질은 Cas 계열 단백질인, 조성물.
  91. 제88항에 있어서, 폴리펩티드는 하나 이상의 핵산 분자를 수반하거나 또는 이와 복합화되는 것인, 조성물.
  92. 제81항 내지 제85항 중 어느 한 항에 있어서, 제제는 프리-mRNA의 표적화 영역에 상보적인 안티센스 올리고머(ASO)인, 조성물.
  93. 제92항에 있어서, 제제는 표적 단백질을 인코딩하는 프리-mRNA의 표적화 영역에 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 상보적인, 조성물.
  94. 제92항 또는 제93항에 있어서, 제제는 포스포로티오에이트 연결 또는 포스포로디아미데이트 연결을 포함하는 백본 변형을 포함하는, 조성물.
  95. 제92항 내지 제94항 중 어느 한 항에 있어서, 제제는 포스포로디아미데이트 모폴리노를 포함하는, 조성물.
  96. 제92항 내지 제95항 중 어느 한 항에 있어서, 제제는 잠금 핵산을 포함하는, 조성물.
  97. 제92항 내지 제96항 중 어느 한 항에 있어서, 제제는 펩티드 핵산을 포함하는, 조성물.
  98. 제92항 내지 제96항 중 어느 한 항에 있어서, 제제는 2'-O-메틸을 포함하는, 조성물.
  99. 제92항 내지 제98항 중 어느 한 항에 있어서, 제제는 2'-플루오로, 또는 2'-O-메톡시에틸 모이어티를 포함하는, 조성물.
  100. 제92항 내지 제99항 중 어느 한 항에 있어서, 제제는 적어도 하나의 변형된 당 모이어티를 포함하는, 조성물.
  101. 제100항에 있어서, 각각의 당 모이어티는 변형된 당 모이어티인, 조성물.
  102. 제81항 내지 제85항 또는 제92항 내지 제101항 중 어느 한 항에 있어서, 제제는 안티센스 올리고머이고, 제제는 8 내지 50개의 핵염기, 8 내지 40개의 핵염기, 8 내지 35개의 핵염기, 8 내지 30개의 핵염기, 8 내지 25개의 핵염기, 8 내지 20개의 핵염기, 8 내지 15개의 핵염기, 9 내지 50개의 핵염기, 9 내지 40개의 핵염기, 9 내지 35개의 핵염기, 9 내지 30개의 핵염기, 9 내지 25개의 핵염기, 9 내지 20개의 핵염기, 9 내지 15개의 핵염기, 10 내지 50개의 핵염기, 10 내지 40개의 핵염기, 10 내지 35개의 핵염기, 10 내지 30개의 핵염기, 10 내지 25개의 핵염기, 10 내지 20개의 핵염기, 10 내지 15개의 핵염기, 11 내지 50개의 핵염기, 11 내지 40개의 핵염기, 11 내지 35개의 핵염기, 11 내지 30개의 핵염기, 11 내지 25개의 핵염기, 11 내지 20개의 핵염기, 11 내지 15개의 핵염기, 12 내지 50개의 핵염기, 12 내지 40개의 핵염기, 12 내지 35개의 핵염기, 12 내지 30개의 핵염기, 12 내지 25개의 핵염기, 12 내지 20개의 핵염기, 또는 12 내지 15개의 핵염기로 이루어지는, 조성물.
  103. 제78항, 제79항 및 제81항 중 어느 한 항에 있어서, 조성물이 제제를 인코딩하는 벡터를 포함하는, 조성물.
  104. 제103항에 있어서, 제제는 안티센스 올리고머를 포함하는 폴리뉴클레오티드인, 방법.
  105. 제103항에 있어서, 벡터는 바이러스 벡터인, 방법.
  106. 제105항에 있어서, 바이러스 벡터는 아데노바이러스 연관 바이러스 벡터인, 조성물.
  107. 제103항에 있어서, 폴리뉴클레오티드는 변형된 snRNA를 추가로 포함하는, 조성물.
  108. 제107항에 있어서, 변형된 인간 snRNA는 변형된 U1 snRNA 또는 변형된 U7 snRNA인, 조성물.
  109. 제107항에 있어서, 변형된 인간 snRNA는 변형된 U7 snRNA이고 안티센스 올리고머는 표 4 또는 표 5에 열거된 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 갖는, 조성물.
  110. 제81항 내지 제85항 또는 제87항 내지 제109항 중 어느 한 항의 조성물에 따른 제제를 인코딩하는 핵산 분자를 포함하는, 조성물.
  111. 제110항에 있어서, 핵산 분자는 바이러스 전달 시스템에 혼입되는 것인, 조성물.
  112. 제111항에 있어서, 바이러스 전달 시스템은 아데노바이러스 연관 벡터인, 조성물.
  113. 제81항에 있어서, 바이러스 벡터는 아데노바이러스 연관 바이러스 벡터인, 조성물.
  114. 표적 유전자로부터 전사되고 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하는 방법으로서, 상기 방법은 넌센스 매개 RNA 붕괴 대체 스플라이스 부위(NSASS) 조절제 또는 이 제제를 인코딩하는 바이러스 벡터를 세포에 접촉시키는 단계를 포함하고, 프리-mRNA는 정규 5' 스플라이스 부위의 다운스트림에 대체 5' 스플라이스-부위를 포함하고, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산되는 프로세싱된 mRNA는 넌센스 매개 RNA 붕괴를 거치고, 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 조절하여 표적 단백질의 발현을 조절함으로써 프리-mRNA의 프로세싱을 조절하고; 그리고
    여기서 표적 유전자는 PKD2인, 방법.
  115. 제114항에 있어서, 제제는 하기인, 방법:
    (a) 프리-mRNA의 표적화 부분에 결합함;
    (b) 대체 5' 스플라이스-부위에서 스플라이싱에 관여하는 인자의 결합을 조절함; 또는
    (c) (a)와 (b)의 조합.
  116. 제115항에 있어서, 제제는 대체 5' 스플라이스-부위에서 스플라이싱에 관여하는 인자가 표적화 부분의 영역에 결합하는 것을 방해하는, 방법.
  117. 제115항 또는 제116항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에 근접한 것인, 방법.
  118. 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
  119. 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 업스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드인, 방법.
  120. 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 다운스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
  121. 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 다운스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드인, 방법.
  122. 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4 88036480의 게놈 부위의 업스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
  123. 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88036480 업스트림의 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드인, 방법.
  124. 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4 88036480의 게놈 부위의 다운스트림에 있는 최대 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드인, 방법.
  125. 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 GRCh38/ hg38: chr4:88036480 유전자 부위의 다운스트림에 있는 적어도 약 1500개의 뉴클레오티드, 약 1000개의 뉴클레오티드, 약 800개의 뉴클레오티드, 약 700개의 뉴클레오티드, 약 600개의 뉴클레오티드, 약 500개의 뉴클레오티드, 약 400개의 뉴클레오티드, 약 300개의 뉴클레오티드, 약 200개의 뉴클레오티드, 약 100개의 뉴클레오티드, 약 80개의 뉴클레오티드, 약 70개의 뉴클레오티드, 약 60개의 뉴클레오티드, 약 50개의 뉴클레오티드, 약 40개의 뉴클레오티드, 약 30개의 뉴클레오티드, 약 20개의 뉴클레오티드, 약 10개의 뉴클레오티드, 약 5개의 뉴클레오티드, 약 4개의 뉴클레오티드, 약 2개의 뉴클레오티드, 약 1개의 뉴클레오티드인, 방법.
  126. 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 정규 5' 스플라이스-부위와 대체 5' 스플라이스-부위 사이의 영역에 위치하는, 방법.
  127. 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에서 스플라이싱에 의해 연장된 엑손 영역에 위치하는, 방법.
  128. 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위와 적어도 부분적으로 중첩되는, 방법.
  129. 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위의 업스트림 또는 다운스트림 영역과 적어도 부분적으로 중첩되는, 방법.
  130. 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에서 스플라이싱에 의해 연장된 엑손 영역 내에 있는, 방법.
  131. 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 대체 5' 스플라이스-부위에서 스플라이싱에 의해 연장된 엑손 영역의 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 또는 그 초과 개의 연속 뉴클레오티드를 포함하는, 방법.
  132. 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 2개의 정규 엑손 사이의 인트론 영역에 위치하는, 방법.
  133. 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 2개의 정규 엑손 중 하나에 위치하는, 방법.
  134. 제115항 내지 제117항 중 어느 한 항에 있어서, 프리-mRNA의 표적화 부분은 인트론 및 정규 엑손 모두에 걸친 영역에 위치하는, 방법.
  135. 제114항에 있어서, 세포 내 표적 단백질의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가되는, 방법.
  136. 제114항 내지 제135항 중 어느 한 항에 있어서, 프리-mRNA의 스플라이싱의 조절은 표적 단백질을 인코딩하는 프로세싱된 mRNA의 생산을 증가시키는, 방법.
  137. 제136항에 있어서, 제제와 접촉된 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가되는, 방법.
  138. 제114항 내지 제137항 중 어느 한 항에 있어서, 표적 단백질은 단백질의 정규 동형인, 방법.
  139. 제114항 내지 제138항 중 어느 한 항에 있어서, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산된 프로세싱된 mRNA는 조기 종결 코돈(PTC)을 포함하는, 방법.
  140. 제114항 내지 제139항 중 어느 한 항에 있어서, 방법은 제2 제제 또는 이 제2 제제를 인코딩하는 벡터를 세포에 접촉시키는 단계를 추가로 포함하고, 프리-mRNA는 넌센스 매개 RNA 붕괴 유도 엑손(NMD 엑손)을 포함하여, 이로써 제2 제제는 프리-mRNA로부터 NMD 엑손의 스플라이싱을 조절하고, 이로써 프리-mRNA로부터 프로세싱되는 프로세싱된 mRNA의 수준을 조절하고, 세포에서 표적 단백질의 발현을 조절하고, 표적 단백질은 PKD2 유전자에 의해 인코딩되는, 방법.
  141. 제114항 내지 제140항 중 어느 한 항에 있어서, NSASS 조절제가 제81항 내지 제113항 중 어느 한 항의 조성물인, 방법.
  142. 제81항 내지 제113항 중 어느 한 항의 조성물; 및 약제학적으로 허용되는 부형제 및/또는 전달 비히클을 포함하는, 약제학적 조성물.
  143. 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법으로서, 방법은 약제학적 조성물을 필요로 하는 대상체에게 투여하는 단계를 포함하고, 약제학적 조성물은 넌센스 매개 RNA 붕괴 대체 스플라이스 부위(NSASS) 조절제 또는 이 제제를 인코딩하는 바이러스 벡터를 포함하는 조성물; 및 약제학적으로 허용되는 부형제를 포함하고, 제제는 표적 유전자로부터 전사되고 표적 단백질을 인코딩하는 프리-mRNA를 포함하는 세포에서 표적 단백질의 발현을 조절하고,
    여기서 프리-mRNA는 정규 5' 스플라이스-부위의 다운스트림에 대체 5' 스플라이스-부위를 포함하고, 대체 5' 스플라이스 부위에서 프리-mRNA의 스플라이싱은 대안적으로 스플라이싱된 mRNA의 넌센스 매개 RNA 붕괴를 초래하고, 제제는 대체 5' 스플라이스 부위에서 스플라이싱을 조절함으로써 프리-mRNA의 프로세싱을 조절하고; 그리고 표적 유전자는 PKD2인, 방법.
  144. 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법으로서, 제81항의 약제학적 조성물을 대상체에게 투여하는 단계를 포함하는, 방법.
  145. 제143항 또는 제144항에 있어서, 질환은 다낭성 간 질환을 수반하거나 수반하지 않는 다낭성 신장 질환, 상염색체 우성 다낭성 신장 질환 또는 두개내 동맥류인, 방법.
  146. 제143항 또는 제144항에 있어서, 질환 또는 병태는 폴리시스틴 2의 양 또는 활성의 결핍과 연관된 질환 또는 병태인, 방법.
  147. 제143항 또는 제144항에 있어서, 질환 또는 병태는 폴리시스틴 1의 양 또는 활성의 결핍과 연관된 질환 또는 병태인, 방법.
  148. 제143항 또는 제144항에 있어서, 질환 또는 병태는 폴리시스틴 2가 기능적으로 증강, 보상, 대체 또는 기능적으로 상호작용하는 단백질의 양 또는 활성의 결핍과 연관된 질환 또는 병태인, 방법.
  149. 제143항 내지 제148항 중 어느 한 항에 있어서, 질환 또는 병태는 표적 단백질의 결핍된 양 또는 활성에 의해 야기되는, 방법.
  150. 제143항 내지 제149항 중 어느 한 항에 있어서, 제제는 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준을 증가시키는, 방법.
  151. 제150항에 있어서, 제제와 접촉된 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가되는, 방법.
  152. 제143항 내지 제151항 중 어느 한 항에 있어서, 제제는 세포에서 표적 단백질의 발현을 증가시키는, 방법.
  153. 제152항에 있어서, 세포 내 표적 단백질의 수준은 대조군 세포에서 표적 단백질을 인코딩하는 프로세싱된 mRNA의 수준과 비교하여 약 1.1 내지 약 10배, 약 1.5 내지 약 10배, 약 2 내지 약 10배, 약 3 내지 약 10배, 약 4 내지 약 10배, 약 1.1 내지 약 5배, 약 1.1 내지 약 6배, 약 1.1 내지 약 7배, 약 1.1 내지 약 8배, 약 1.1 내지 약 9배, 약 2 내지 약 5배, 약 2 내지 약 6배, 약 2 내지 약 7배, 약 2 내지 약 8배, 약 2 내지 약 9배, 약 3 내지 약 6배, 약 3 내지 약 7배, 약 3 내지 약 8배, 약 3 내지 약 9배, 약 4 내지 약 7배, 약 4 내지 약 8배, 약 4 내지 약 9배, 적어도 약 1.1배, 적어도 약 1.5배, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 3배, 적어도 약 3.5배, 적어도 약 4배, 적어도 약 5배, 또는 적어도 약 10배 증가되는, 방법.
  154. 제143항 내지 제153항 중 어느 한 항에 있어서, 표적 단백질의 mRNA 수준 또는 발현 수준을 평가하는 단계를 추가로 포함하는, 방법.
  155. 제143항 내지 제154항 중 어느 한 항에 있어서, 질환과 연관된 적어도 하나의 유전적 돌연변이에 대해 대상체의 게놈을 평가하는 단계를 추가로 포함하는, 방법.
  156. 제155항에 있어서, 적어도 하나의 유전적 돌연변이는 질환과 연관된 유전자의 유전자좌 내에 있는 것인, 방법.
  157. 제155항에 있어서, 적어도 하나의 유전적 돌연변이는 질환과 연관된 유전자의 발현과 연관된 유전자좌 내에 있는 것인, 방법.
  158. 제155항에 있어서, 적어도 하나의 유전적 돌연변이는 PKD2 유전자좌 내에 있는 것인, 방법.
  159. 제155항에 있어서, 적어도 하나의 유전적 돌연변이는 PKD1 유전자좌 내에 있는 것인, 방법.
  160. 제155항에 있어서, 적어도 하나의 유전적 돌연변이는 PKD2 유전자 발현과 연관된 유전자좌 내에 있는 것인, 방법.
  161. 제143항 내지 제160항 중 어느 한 항에 있어서, 대상체는 인간인, 방법.
  162. 제143항 내지 제160항 중 어느 한 항에 있어서, 대상체는 비-인간 동물인, 방법.
  163. 제143항 내지 제160항 중 어느 한 항에 있어서, 대상체는 태아, 배아 또는 아동인, 방법.
  164. 제143항 내지 제163항 중 어느 한 항에 있어서, 세포 또는 세포들이 생체외, 또는 생체외 조직 또는 기관에 있는 것인, 방법.
  165. 제143항 내지 제164항 중 어느 한 항에 있어서, 제제는 뇌심실내 주사, 복강내 주사, 근육내 주사, 척추강내 주사, 피하 주사, 경구 투여, 활막 주사, 유리체내 투여, 망막하 주사, 국소 적용, 이식, 또는 정맥내 주사에 의해 대상체에게 투여되는, 방법.
  166. 제143항 내지 제165항 중 어느 한 항에 있어서, 질환 또는 병태를 치료하는, 방법.
  167. 제143항 내지 제166항 중 어느 한 항의 방법에 사용하기 위한 치료제.
  168. 제167항의 치료제 및 약제학적으로 허용되는 부형제를 포함하는 약제학적 조성물.
  169. 필요로 하는 대상체에서 질환 또는 병태를 치료하거나 그 발병 가능성을 감소시키는 방법으로서, 뇌심실내 주사, 복강내 주사, 근육내 주사, 척추강내 주사, 피하 주사, 경구 투여, 활막 주사, 유리체내 투여, 망막하 주사, 국소 적용, 이식, 또는 정맥내 주사에 의해 대상체에게 제168항의 약제학적 조성물을 투여하는 단계를 포함하는, 방법.
  170. 제169항에 있어서, 대상체를 치료하는, 방법.
  171. 표적 단백질을 인코딩하는 프로세싱된 mRNA를 갖는 세포에서 표적 단백질의 발현을 증가시키는 방법으로서, 세포 내로 (1) 제1 제제 또는 상기 제1 제제를 인코딩하는 제1 핵산 서열, 및 (2) 제2 제제 또는 상기 제2 제제를 인코딩하는 제2 핵산 서열을 전달하는 단계를 포함하고,
    프리-mRNA는 넌센스 매개 RNA 붕괴 유도 엑손(NMD 엑손)을 포함하여, 이로써 제1 제제는 프리-mRNA로부터 NMD 엑손의 스플라이싱을 조절함으로써, 프리-mRNA로부터 프로세싱되는 프로세싱된 mRNA의 수준을 조절하고, 세포에서 표적 단백질의 발현을 조절하고; 그리고
    프리-mRNA는 정규 5' 스플라이스-부위의 다운스트림에 대체 5' 스플라이스-부위를 포함하고, 대체 5' 스플라이스-부위에서 프리-mRNA의 스플라이싱에 의해 생산되는 프로세싱된 mRNA는 넌센스 매개 RNA 붕괴를 거치고, 제2 제제는 대체 5' 스플라이스-부위에서 스플라이싱을 조절하여 표적 단백질의 발현을 조절함으로써 프리-mRNA의 프로세싱을 조절하고;
    표적 단백질은 PKD2 유전자에 의해 인코딩되는, 방법.
  172. 제제 또는 상기 제제를 인코딩하는 벡터를 포함하는 조성물로서, 제제는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는 안티센스 올리고머를 포함하는, 조성물.
  173. 제제를 인코딩하는 벡터를 포함하는 조성물로서, 제제는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함하는 다핵산을 포함하는, 조성물.
  174. 폴리시스틴 2 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하는 프로세싱된 mRNA를 갖는 세포에서 폴리시스틴 2 단백질의 발현을 증가시키는 방법으로서, 제제 또는 상기 제제를 인코딩하는 벡터를 세포에 접촉시키는 단계를 포함하며, 제제는 번역 조절 요소의 구조를 조절함으로써 세포에서 폴리시스틴 2 단백질의 발현을 증가시키는, 방법.
  175. 폴리시스틴 2 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하는 프로세싱된 mRNA를 갖는 세포에서 폴리시스틴 2 단백질의 발현을 증가시키는 방법으로서, 제제 또는 상기 제제를 인코딩하는 벡터를 세포에 접촉시키는 단계를 포함하며, 제제는 (a) 프로세싱된 mRNA의 표적화 부분에 결합하고; (b) 프로세싱된 mRNA의 번역에 관여하는 인자와 번역 조절 요소의 상호작용을 조절하거나; 또는 (c) (a)와 (b)의 조합으로 세포에서 폴리시스틴 2 단백질의 발현을 증가시키는, 방법.
  176. 세포에서 폴리시스틴 2 단백질의 발현을 조절하는 방법으로서, 제제 또는 상기 제제를 인코딩하는 벡터를 세포에 접촉시키는 단계를 포함하며, 제제는 표 4 또는 표 5의 서열로 이루어진 군으로부터 선택된 서열에 대해 적어도 80% 서열 동일성을 갖는 안티센스 올리고머를 포함하는, 방법.
  177. 제제를 포함하는 조성물로서, 제제는 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 표적화 부분에 결합하는 안티센스 올리고머를 포함하고, 프로세싱된 mRNA의 표적화 부분은 프로세싱된 mRNA의 주요 시작 코돈의 적어도 하나의 뉴클레오티드를 포함하고, 프로세싱된 mRNA의 5' UTR 내에 있는 것인, 조성물.
  178. 제제를 인코딩하는 벡터를 포함하는 조성물로서, 제제는 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 표적화 부분에 결합하는 서열을 포함하는 다핵산을 포함하고, 프로세싱된 mRNA의 표적화 부분은 프로세싱된 mRNA의 주요 시작 코돈의 적어도 하나의 뉴클레오티드를 포함하고, 프로세싱된 mRNA의 5' UTR 내에 있는 것인, 조성물.
  179. 제제를 포함하는 조성물로서, 제제는 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 번역 조절 요소의 구조를 조절함으로써 폴리시스틴 2 단백질의 발현을 증가시키고, 번역 조절 요소는 프로세싱된 mRNA의 번역을 억제하는, 조성물.
  180. 제제를 인코딩하는 벡터를 포함하는 조성물로서, 제제는 폴리시스틴 2 단백질을 인코딩하는 프로세싱된 mRNA의 번역 조절 요소의 구조를 조절함으로써 폴리시스틴 2 단백질의 발현을 증가시키고, 번역 조절 요소는 프로세싱된 mRNA의 번역을 억제하는, 조성물.
  181. 제제를 포함하는 조성물로서, 제제는 세포에서 프로세싱된 mRNA의 번역을 증가시키고, 프로세싱된 mRNA는 폴리시스틴 2 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하고, 제제는 번역 조절 요소의 구조를 조절함으로써 번역 효율성 및/또는 프로세싱된 mRNA의 번역 속도를 증가시키고, 제제는 (a) 프로세싱된 mRNA의 표적화 부분에 결합하고; (b) 프로세싱된 mRNA의 번역에 관여하는 인자와 번역 조절 요소의 상호작용을 조절하거나; 또는 (c) (a)와 (b)의 조합인, 조성물.
  182. 제제를 인코딩하는 벡터를 포함하는 조성물로서, 제제는 세포에서 프로세싱된 mRNA의 번역을 증가시키고, 프로세싱된 mRNA는 폴리시스틴 2 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하고, 제제는 번역 조절 요소의 구조를 조절함으로써 번역 효율성 및/또는 프로세싱된 mRNA의 번역 속도를 증가시키고, 제제는 (a) 프로세싱된 mRNA의 표적화 부분에 결합하고; (b) 프로세싱된 mRNA의 번역에 관여하는 인자와 번역 조절 요소의 상호작용을 조절하거나; 또는 (c) (a)와 (b)의 조합인, 조성물.
  183. 표적 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하는 프로세싱된 mRNA를 갖는 세포에서 표적 단백질의 발현을 증가시키는 방법으로서, 세포 내로 (1) 제1 제제 또는 상기 제1 제제를 인코딩하는 제1 핵산 서열, 및 (2) 제2 제제 또는 상기 제2 제제를 인코딩하는 제2 핵산 서열을 전달하는 단계 및 이로써 세포에서 표적 단백질의 발현을 증가시키는 단계를 포함하며, 제1 제제는 표적 단백질을 인코딩하는 표적 유전자로부터 전사되는 프리-mRNA의 스플라이싱을 조절하고, 제2 제제는 표적 단백질을 인코딩하는 프로세싱된 mRNA의 번역 조절 요소의 구조를 조절하며, 표적 단백질은 폴리시스틴 2인, 방법.
  184. 표적 단백질을 인코딩하고 프로세싱된 mRNA의 번역을 억제하는 번역 조절 요소를 포함하는 프로세싱된 mRNA를 갖는 세포에서 표적 단백질의 발현을 증가시키는 방법으로서, 세포 내로 (1) 제1 제제 또는 상기 제1 제제를 인코딩하는 제1 핵산 서열, 및 (2) 제2 제제 또는 상기 제2 제제를 인코딩하는 제2 핵산 서열을 전달하는 단계 및 이로써 세포에서 표적 단백질의 발현을 증가시키는 단계를 포함하며, 제1 제제는 표적 단백질을 인코딩하는 표적 유전자로부터 전사되는 프리-mRNA의 스플라이싱을 조절하고, 제2 제제는 (a) 프로세싱된 mRNA의 표적 부분에 결합하거나; (b) 프로세싱된 mRNA의 번역에 관여하는 인자와 번역 조절 요소의 상호작용을 조절하거나; 또는 (c) (a)와 (b)의 조합이며, 표적 단백질은 폴리시스틴 2인, 방법.
KR1020237029596A 2021-02-03 2022-02-03 폴리시스틴 발현과 관련된 병태 및 질환의 치료용 조성물 KR20230150973A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163145288P 2021-02-03 2021-02-03
US63/145,288 2021-02-03
PCT/US2022/015074 WO2022169947A2 (en) 2021-02-03 2022-02-03 Compositions for treatment of conditions and diseases associated with polycystin expression

Publications (1)

Publication Number Publication Date
KR20230150973A true KR20230150973A (ko) 2023-10-31

Family

ID=82741748

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237029596A KR20230150973A (ko) 2021-02-03 2022-02-03 폴리시스틴 발현과 관련된 병태 및 질환의 치료용 조성물

Country Status (11)

Country Link
US (1) US20240117353A1 (ko)
EP (1) EP4288543A2 (ko)
JP (1) JP2024507717A (ko)
KR (1) KR20230150973A (ko)
CN (1) CN117413061A (ko)
AR (1) AR124809A1 (ko)
AU (1) AU2022215577A1 (ko)
BR (1) BR112023015636A2 (ko)
CA (1) CA3207341A1 (ko)
TW (1) TW202242113A (ko)
WO (1) WO2022169947A2 (ko)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6916619B2 (en) * 2001-10-12 2005-07-12 Athena Diagnostics, Inc. Compositions and methods for genetic analysis of polycystic kidney disease
US11096956B2 (en) * 2015-12-14 2021-08-24 Stoke Therapeutics, Inc. Antisense oligomers and uses thereof
CN111936163A (zh) * 2017-10-23 2020-11-13 斯托克制药公司 用于治疗基于无义介导的rna衰变的病况和疾病的反义寡聚体

Also Published As

Publication number Publication date
CN117413061A (zh) 2024-01-16
WO2022169947A3 (en) 2022-09-15
WO2022169947A2 (en) 2022-08-11
AR124809A1 (es) 2023-05-10
CA3207341A1 (en) 2022-08-11
JP2024507717A (ja) 2024-02-21
US20240117353A1 (en) 2024-04-11
AU2022215577A1 (en) 2023-09-21
TW202242113A (zh) 2022-11-01
EP4288543A2 (en) 2023-12-13
BR112023015636A2 (pt) 2024-01-02

Similar Documents

Publication Publication Date Title
AU2020250262B2 (en) Compositions for modulating tau expression
KR102391812B1 (ko) B형 간염 감염을 치료하기 위해 PAPD5 또는 PAPD7 mRNA를 감소시키기 위한 핵산 분자
ES2744098T3 (es) Composiciones y sus usos dirigidos a la huntingtina
KR101866152B1 (ko) 종양 억제 유전자에 대한 천연 안티센스 전사체의 억제에 의해 종양 억제 유전자 관련된 질환의 치료
RU2745324C2 (ru) Композиции и способы модулирования экспрессии tau
KR20220062517A (ko) 결합 변형된 올리고머 화합물 및 이의 용도
AU2020267282B2 (en) Compositions and methods for decreasing tau expression
KR20160027968A (ko) Foxp3 발현을 조절하기 위한 조성물 및 방법
KR20220012230A (ko) 스플라이싱 및 번역을 조절하기 위한 방법 및 조성물
AU2021203300B2 (en) Nucleic acid molecule for reduction of PAPD5 and PAPD7 mRNA for treating hepatitis B infection
KR20230022409A (ko) 병태 및 질환의 치료를 위한 opa1 안티센스 올리고머
TW202221014A (zh) 用於減少app表現之化合物及方法
US20040115641A1 (en) Modulation of ROCK 1 expression
CN117795076A (zh) 用丝裂原活化蛋白激酶激酶激酶15(map3k15)抑制剂治疗代谢病症的方法
KR20230137958A (ko) 헌팅틴을 조절하기 위한 화합물 및 방법
KR20230074214A (ko) 지방간 질환의 치료 방법
KR20230005933A (ko) Atxn1을 조정하는 화합물 및 방법
KR20230150973A (ko) 폴리시스틴 발현과 관련된 병태 및 질환의 치료용 조성물
TW202237842A (zh) 靶向atxn3之反義寡核苷酸
CN115362255A (zh) 用无七之子2(sos2)抑制剂治疗眼科疾患