KR101748679B1 - 섬유증 감수성 유전자 및 이의 용도 - Google Patents
섬유증 감수성 유전자 및 이의 용도 Download PDFInfo
- Publication number
- KR101748679B1 KR101748679B1 KR1020117021902A KR20117021902A KR101748679B1 KR 101748679 B1 KR101748679 B1 KR 101748679B1 KR 1020117021902 A KR1020117021902 A KR 1020117021902A KR 20117021902 A KR20117021902 A KR 20117021902A KR 101748679 B1 KR101748679 B1 KR 101748679B1
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- fibrosis
- ctgf
- snp
- artificial sequence
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/569—Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
- G01N33/56983—Viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/136—Screening for pharmacological compounds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/172—Haplotypes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Pathology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Hematology (AREA)
- Virology (AREA)
- Biomedical Technology (AREA)
- Urology & Nephrology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Cell Biology (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
본 발명은 섬유증 감수성 유전자자리, 즉 CTGF 유전자자리의 동정을 개시하며, 이는 섬유증에 대한 소인의 검출, 섬유증의 진단 및 예후를 위해 사용될 수 있을 뿐만 아니라, 치료적으로 활성인 약물을 스크리닝하기 위해 사용될 수도 있다. 특히, 본 발명은 대상체의 샘플에서 CTGF 유전자자리의 변경의 존재를 검출하는 단계를 포함하는 방법에 관한 것이며, 상기 변경의 존재는 섬유증에 대한 소인 또는 섬유증의 존재를 나타낸다.
Description
본 발명은 일반적으로 유전학 분야 및 의약 분야에 관한 것이다. 특히, 본 발명은 간 질환, 간경변, 피부 켈로이드, 비만증 및 임의의 섬유증 질환에서 발생하는, 섬유증의 진단 또는 예후에 사용되거나, 또는 섬유증에 대한 소인의 검출에 사용될 수 있는, 인간 섬유증 감수성 유전자의 동정을 개시한다. 특히, 본 발명은 치료적으로 활성인 약물의 스크리닝을 위한 새로운 표적을 나타내고 섬유증에 대한 감수성과 관련된 6번 염색체에서 CTGF 유전자의 특정 대립유전자를 개시한다. 특히, 본 발명은 CTGF 유전자 및 발현 산물의 특정 돌연변이에 관한 것일 뿐만 아니라, 이러한 돌연변이에 기초한 진단 도구 및 키트에 관한 것이다. 또한, 본 발명은 모든 섬유증 인간 질환에서 발생하는 섬유증의 예방 및/또는 치료를 위해 사용될 수 있다.
섬유증은 기관, 이의 임의의 부분 또는 조직에서, 예를 들어 간, 이의 임의의 부분 또는 조직에서, 특히 손상에 반응하여 나타나는, 섬유성 결합조직의 과다한 성장이다.
이형 섬유증은 간염 바이러스 및 주혈흡충 감염에서와 같이 다양한 병인학의 만성적인 간 염증에서 발생한다. 주혈흡충에 의해 감염된 특정 대상체는 느린 피브로저(slow fibroser)인 반면, 다른 대상체는 빠른 피브로저(rapid fibroser)라는 점, 및 이는 Chr 6q22-q23에 위치한 주요 유전자에 부분적으로 의존한다는 점은 이미 밝혀졌다(Dessein et al., 1999; Mohamed-Ali et al., 1999).
시스토조미아시스(schistosomiasis)는, 숙주의 혈관계에서 성장하여 알을 낳고 이들 중 일부는 간으로 운반되어 문맥주위 공간에서 염증을 촉발시키는 연충류에 의해 야기된다. 기생충은 그의 인간 숙주에서 수년 동안 생존하기 때문에, 다수의 조직 파괴와 연관되는 만성적인 간 염증이 감염된 대상체에서 흔하게 나타난다. 조직 치유는 손상된 조직에서 세포외 기질 단백질(ECMP)의 퇴적을 필요로 하며, 이는 나중에 전환되어 정상적인 간세포에 의해 대체된다. 일부 환자에게서, ECMP는 정맥류성 정맥, 복수를 야기하는 혈류를 감소시키는 섬유증 퇴적을 형성하면서 문맥주위 공간에 축적된다. 수개월 또는 수년간의 만성적 또는 반복적 손상 이후에, 섬유증은 영구적이고 비가역적이 된다. 대상체는 섬유증의 결과로 사망한다.
남쪽 국가들에서, 3억 5천만명의 감염된 대상체의 5 내지 10%가 중증의 간섬유증을 발달시킬 수 있는 것으로 추정된다. 주혈흡충 감염 대상체에서 간섬유증 진행을 예측하고 뒤를 따르도록 할 수 있는 양호한 마커가 존재하지 않는다.
간섬유증의 진단은 주로 간생검법, 탄력측정(elastometry)(Boursier et al, 2008; Macias et al., 2008) 및 초음파 분석(Richter et al., 2001; Lambertucci et al., 2004; King et al., 2003)에 기초한다.
생검법은 경피, 경정맥, 방사선사진-유도 미세바늘 또는 복강경 검사 경로를 통해 얻어지며, 이는 임상적 설정에 의존한다. 병리조직학적 시험은 임상의가 괴사염증의 중증도를 나누고 섬유증의 정도를 단계로 나눌 수 있도록 한다. Metavir 스코어링 시스템은 하기와 같이 1-4 등급에 대해 섬유증의 단계에 스코어를 부여한다: FO = 섬유증이 없음, F1 = 격막(septa)이 없는 문맥 섬유증, F2 = 문맥 섬유증 및 소수의 격막, F3 = 간경변이 없는 다수의 격막, F4 = 간경변(Bedossa et al., 1996). 간생검법은 침습적이고 값비싼 과정이며, 이는 간의 작은 부분만을 샘플로 한다. 따라서, 이는 간섬유증의 전반적인 평가를 할 수 없으며, 샘플링 변이와 관찰자간 및 관찰자내 에러(inter- and intra-observer error)가 생긴다. 또한, 간생검법은 3%의 유의적인 이환율 및 0.03%의 사망률과 연관된다(Garcia-Tsao et al., 1993). 잠재적인 복합증에는 생검과 관련된 국부 혈종, 감염 및 통증이 포함된다.
비침습적 테스트(즉, 혈청학적 마커, 탄력측정(elastometry), 초음파 분석)가 사용되지만, 정기적인 임상 사용을 위한 준비가 아직 되어 있지 않다.
혈액 마커의 패널(panel)은 주로 만성 C형 간염 또는 C형 바이러스 간염에 기인한 간경변을 앓는 환자에게서 테스트되었다. 이러한 시험은 혈청 마커가 환자의 약 35%에서 섬유증을 판단하거나 또는 배제할 수 있다는 점을 밝혔다(Sebastiani et al., 2006). 그러나, 개별적으로 환자를 관찰할 때, 상기 마커는 섬유증의 다양한 단계들 사이를 신뢰성있게 구별할 수 없었다. 보다 최근의 연구는 진단의 정확성을 개선시킨 알고리즘 접근법을 고안하기 위해 혈청 마커의 3개의 패널을 포함시켰다(Parkes et al., 2006). 상기 평가된 3개의 패널은 APRI(아스파르테이트 트랜스아미나아제 대 혈소판 비 지수), Forns 지수(혈소판, 감마글루타밀트랜스펩티다제, 콜레스테롤) 및 Fibrotest(GGT, 합토글로빈, 빌리루빈, 아포리포단백질 A, 알파-2-마크로글로불린)였다. APRI 이후에 Fibrotest로 이루어지는 알고리즘은 섬유증의 진단 정확도를 90% 이상까지 신장시켰다. 이러한 그룹은 이러한 알고리즘의 사용이 간생검의 50%까지에 대한 필요성을 배제할 수 있다는 점을 추정하였다. 그러나, 이러한 알고리즘을 사용하여, 섬유증의 개별 단계들이 구별될 수 없다. 상기 혈청 마커의 한계점은 매우 활성인 간 염증이 존재할 때 위양성의 가능성이다.
피브로스캔(fibroscan)은 간섬유증을 단계를 나누는 또다른 획기적인 접근법이며, 이는 탄성영상(elastography)에 기초하며, 평균 간 조직 강도의 신속한 측정을 제공한다(Ziol et al, 2005). 프로브는 간으로 저 주파 및 진폭의 진동을 전달하기 위해 이용된다. 이러한 진동파는 탄성 전단 파를 유발하며, 이의 간을 통한 속도는 킬로파스칼(kPa)로 측정되는 조직강도에 직접적으로 비례한다. 피브로스캔 기법의 감수성은 79 내지 95%이며, 간생검에 비해 78 내지 95%의 특이성을 갖는다. 그러나, 이러한 기법의 한계점은 유동 또는 지방 조직에서 탄성파의 감쇠와 관련되며, 이는 환자에게서 섬유증의 평가를 손상시키게 된다. 또한, 피브로스캔은 극히 값비싼 장치이다.
그러나, 섬유증 진행과 치료 효율을 예측하는 효과적인 방법이 존재하지 않고 있다.
다수의 분자들이 간섬유증의 치료를 위해 테스트되었다. 예를 들어, 코르티코스테로이드는 자가면역 및 알코올성 간염에서 간 염증을 억제하기 위해 사용되어왔다(Czaja et al., 2003). 우르소데옥시콜산은 담즙산과 결합하여, 이에 따라 간 염증을 감소시킴으로써 PBC 환자에게서 생존을 증가시키는 것으로 입증되었다(Poupon et al., 1997). 프로스타글란딘 E 및 특이적 수용체 대항물질(TNF알파, IL-1 수용체 대항물질)에 의한 염증성 시토킨을 중화시키는 것은 뮤린 모델에서는 테스트되었으나, 인간에서는 아직 테스트되지 않았다(Bruck et al., 1997).
간섬유증을 축소시키는데 있어서 또다른 매력적인 표적은 간 성상 세포 활성화의 하향조절이다. 인터페론 감마는 C형 간염 감염의 치료법을 위해 리바비린과 조합되어 사용된다. 인터페론의 항섬유증 효과는 성상세포 활성화의 하향조절과 부분적으로 관련될 수 있다는 점이 상정된다. 이러한 메카니즘은 인터페론 알파에 대해 바이러스학적 반응을 나타내지 않는 C형 바이러스 간염을 앓는 환자에게서 나타난 섬유증의 개선을 설명할 수 있다(Poynard et al., 1998).
항산화제(n-아세틸시스테인, 알파-토코페롤)의 시험은 현재 인간에게서 진행 중이다. 안지오텐신 II 수용체는 성상세포 활성화에서 상향조절되며, 이에 따라 안지오텐신 전화효소 억제제 및 안지오텐신 수용체 차단제는 시험관내 및 동물내에서 항섬유증 활성이 입증되었다. 이는 여전히 인간에 대해 재현되어야 한다(Jonsson et al., 2001). 기질 금속단백질가수분해효소를 통해 기질 분해를 촉진하는 것은 뮤린 모델에서 유리한 것으로 입증된 항섬유증 전략이다(Iimuro et al., 2003). 간 성상세포의 특이적 아폽토시스는 또다른 흥미로운 이론적 아이디어에 해당하지만, 아직 조사되지 않았다(Gressner et al., 1998). 섬유증의 역전을 목적으로 하는 치료법은 일반적으로 장기간 사용하기에는 너무 독성이 강하거나(즉, 코르티코스테로이드류, 페니실라민), 또는 어떠한 입증된 효과도 없다(즉, 콜히친).
결론적으로, 효과적이고 잘 견디어지는 항섬유증 약물은 현재 존재하지 않으며, 섬유증의 현재 치료는 유독한 제제의 철회로 제한된다.
섬유증 발달은 Chr 6q23의 주요 유전자자리에 의해 현저하게 영향을 받는다는 점이 이미 보고되었다(Dessein et al, 1999). 또한, CTGF 유전자는 PGDF, VEGF 및 마스터 피브로제닉(master fibrogenic) 분자 TGF-β를 포함하는 다양한 프로-피브로제닉 성장인자(Leask et al., 2006)와 상승작용함으로써 섬유증의 증가에 기여한다는 점이 제안되었다. 특히, CTGF는 TGF-β 다운스트림 조절자로서 작용한다(Leask et al., 2006; Leask et al., 2003). 이는 수용체에 대한 TGF-β 결합을 증가시키고, TGF-β상에서 네거티브 Smad-7 피드백 루프를 저해하며(Wahab et al., 2005); 이는 주요 TGF-β 대항물질 BPM-7의 수용체 결합을 억제한다(Abreu et al., 2002). TGF-β에 대한 CTGF 작용의 중요한 결과는, 진행되는 섬유증 과정에 관여하는 근섬유아세포를 생성하는 ECMP로 간 성상세포 및 다른 유세포의 전환-분화(trans-differentiation)의 자극이다(Kalluri et al., 2003; Neilson et al., 2005). 또한, CTGF는 ECMP상에서 피브론넥틴 도메인에 대한 그의 결합 능력을 통해 ECMP 네트워킹을 증가시키는 것으로 여겨진다(Gressner et al., 2007; Yoshida et al., 2007). CTGF는 간세포(Kobayashi et al., 2005; Gressner et al., 2007), 간 성상세포, 근섬유아세포 및 내피세포(Gressnet et al., 2008)를 포함하는 다양한 세포들에 의해 생성된다. CTGF 전사물의 과발현은 다른 병인적 기원의 섬유증이 발생한 간을 포함하여 다양한 조직들에서 보고되었다(Rachfal et al., 2003). 래트에서의 실험작업은 siRNA에 의해 CTGF를 억제하는 것이 조직 섬유증을 예방하거나 감소시킨다는 점을 보여주었다(Li et al., 2006; George et al., 2007).
그러나, 인간 섬유증 감수성을 조절하는 유전적 인자들은 동정되지 않았을 뿐만 아니라, 섬유증 진행에 대한 그의 효과도 역시 밝혀지지 않았다.
본 발명의 요약
본 발명의 목적은 섬유증의 예후 및 치료에 대해 새로운 유전적 접근을 제공하는 것이다. 본 발명은 인간의 섬유증 감수성 유전자자리, 즉 CTGF 유전자자리(CCN2)의 동정에 대해 개시하며, 이는 섬유증, 특히 간섬유증에 대한 소인의 검출, 진단 및 예후를 위해 사용될 수 있을 뿐만 아니라, 치료적으로 활성인 약물을 스크리닝하기 위해 사용될 수도 있다. 특히, 본 발명은 대상체의 샘플에서 CTGF 유전자자리(CCN2)의 변경의 존재를 검출하는 단계를 포함하는 방법에 관한 것이며, 상기 변경의 존재는 섬유증에 대한 소인 또는 존재를 나타낸다.
본 발명의 특정 목적은 대상체에서 발생한 섬유증의 진단 및/또는 예후, 또는 섬유증에 대한 소인의 검출을 위한 시험관내 방법에 관한 것으로서, 상기 방법은 대상체의 샘플에서 CTGF 유전자 또는 폴리펩티드의 변경의 존재를 검출하는 단계를 포함하며, 상기 변경의 존재는 섬유증의 존재 또는 섬유증에 대한 소인을 나타내는 것이다. 본 발명의 특정 목적은 섬유증의 진행을 평가(예측)하기 위한 방법에 관한 것이다.
바람직한 구현예에서, 상기 변경은 CTGF 유전자의 개시 코돈의 업스트림에서 20 kb 이내, 및 CTGF 유전자의 3'UTR의 다운스트림에서 20 kb 이내에 위치한다.
바람직하게는, 상기 변경은 CTGF 유전자의 개시 코돈의 업스트림에서 15.3 kb 영역, 및 미번역 영역(3'UTR)의 다운스트림에서 14.1 kb 영역의 주변 서열에 위치한다.
바람직한 또다른 구현예에서, 상기 변경은 하나 이상의 염기의 변이, 삽입 또는 결실이다. 더 바람직한 구현예에서, 상기 변경은 섬유증과 관련된 하나 또는 수개의 단일 뉴클레오티드 다형성(SNP) 또는 SNP의 단상형(haplotype)이다. 바람직하게는, 상기 단일 뉴클레오티드 다형성은 SNP 플랭킹(flanking) CTGF 유전자이며, 이는 CTGF 유전자에 가까이 위치한 대립유전자의 변이체이다.
본 발명의 방법에 의해, 간 질환 섬유증, 간경변, 피부 켈로이드, 비후성반흔 및 비만증으로부터 선택된 인간의 섬유증 질환에서 발생하는 섬유증의 검출 및 예후가 가능하다. 특히, 상기 간섬유증은 A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스(HCV), 시스토조마 자포니쿰(S. japonicum) 또는 시스토조마 만소니(S. mansoni) 감염에 의해 야기될 수 있다.
특정 구현예에서, 상기 방법은 HCV로 감염된 대상체의 생물학적 샘플의 CTGF 유전자자리에서 SNP rs9402373 및/또는 rs6918698의 존재를 검출하는 단계를 포함하며, 여기서 위치 rs9402373에서 대립유전자 C의 존재 및/또는 위치 rs6918698에서 대립유전자 G의 존재는 대상체에서 간섬유증이 발생할 위험 또는 간섬유증의 진행, 또는 간섬유증의 나쁜 예후를 나타낸다.
바람직하게는, 상기 CTGF 유전자자리의 변경은 선택적 하이브리드화 어세이, 시퀀싱 어세이, 마이크로시퀀싱 어세이, 및/또는 대립유전자-특이적 증폭 어세이를 수행함으로써 결정된다.
본 발명의 또다른 측면에서, 상기 CTGF 유전자의 변경은 제한효소 소화에 의해 결정되며, 하나 이상의 상기 SNP의 검출은 섬유증의 지표가 된다.
또한, 본 발명은 섬유증을 앓거나 또는 섬유증이 발생할 소인이 있는 대상체를 위한 치료적 화합물을 선택하는 방법에 관한 것으로서, 상기 방법은 시험 화합물을 CTGF 폴리펩티드 또는 유전자 또는 이의 단편과 접촉시키는 단계, 및 CTGF 유전자와 관련된 경로의 생물학적 활성 또는 기능을 증대 또는 감소시키는 상기 시험 화합물의 능력을 결정하는 단계를 포함한다.
본 발명의 상세한 설명
본 발명은 섬유증 발생에 있어서 가장 중요한 단계들을 동정하며, 섬유증, 특히 간섬유증에서 질환의 진행을 예측하는 중요한 유전자 마커를 제공한다.
섬유증의 초기 검출 및 섬유증의 정기적 모니터링은, 섬유증의 과정을 중지시키거나 심지어 역전시킬 수 있는 항-섬유증 요법의 개시를 고려할 것이다. 결과적으로, 이는 인간 섬유증 질환, 예를 들어 간섬유증 또는 간 간경변에 대한 진행, 및 이러한 상태가 수반하는 이환율과 사망률을 방지할 것이다. 이와 같이 다양한 초기 섬유증 검출법의 개발은 간 질환을 앓는 환자의 향후 치료를 위해 좋은 징조이다.
본 발명자는 인간 섬유증과 연관된 주요한 유전자를 동정하였다. 본 발명자는 각각 시스토조마 자포니쿰과 시스토조마 만소니로 감염된 2명의 중국인, 1명의 수단인과 1명의 브라질인 집단에서 섬유증이 CTGF 유전자에 위치한 대립유전자의 변이체에 현저하게 의존한다는 점을 보여주었다. 두 개의 상기 변이체는 핵 인자(nuclear factor) 결합에 영향을 미친다.
섬유증을 앓는 개개인에게서 다양한 핵산 샘플들이 특정 분석 과정을 받았다. 간섬유증을 앓는 4개 개체군이 조사되었으며, 그 중에서도 시스토조마 자포니쿰으로 감염된 중국 중부의 둥팅호의 어민들의 개체군, 시스토조마 자포니쿰으로 감염된 후난성 지방에 살고 있는 농민들의 개체군이 조사되었다.
시스토조마 만소니로 감염된 2개의 추가 개체군(수단인 개체군 및 브라질인 개체군)이 또한 포함되었다. 상기 분석 과정에 의해, 간섬유증을 앓는 대상체에서 과발현되는 상기 개체군들의 특정 단일 뉴클레오티드 다형성(들) SNP(들)가 동정되었다.
본 발명자는 먼저 중국 중부 근처 웨양시의 둥팅호의 어민들에게서 섬유증을 조사하였다. 어민 개체군에서 섬유증의 발달에 영향을 미치는 다양한 인자의 분석은, 성별, 오염수에 대한 노출, 및 프라지콴텔(Praziquantel)에 의한 항-주혈흡충 치료가 섬유증의 위험과 유의적으로 연관된다는 점을 보여주었다. 여러 공변인들의 테스트는 "어업 년수"와 "어선에서 출생"이 노출을 측정하는데 가장 좋은 공변인(covariate)이라는 점을 보여주었다. "치료" 공변인은 지난 20년간 프라지콴텔 치료의 횟수이다.
이러한 공변인들을 사용하여, 본 발명자는 개체군 샘플(N=300)에 대해, 12개의 후보 유전자(6q23 영역에서 2개의 유전자(IFNGR1, CTGF), 및 상기 영역 외에서 10개의 유전자)에서 SNP(유전자 당 3개)가 섬유증의 위험과 연관되는지 여부를 테스트하였다. CTGF 유전자 근처의 하나의 SNP rs9399005는 섬유증을 시사하는 연관을 나타낸다(p=0.02).
그 후, 본 발명자는 8개의 케이스와 2개의 대조군(어민 개체군)에서 CTGF 유전자의 3.2 kb 및 개시 코돈의 업스트림에서 15.3 kb 및 3'UTR 영역의 14.1 kb를 시퀀싱하였다. 61개의 SNP가 기록되었으며, 그 중에서 50개는 이전에 공지되었다. 53개의 SNP(53 SNP)는 20%보다 높은 MAF를 가졌다. 본 발명자는 주요한 효과를 나타내는 유전자를 찾고 있었기 때문에, MAF>20%인 SNP를 선택하였다. 53개의 SNP 중에서 33개는 70명의 어민들에 대해 유전자형이었다.
본 발명자는 Hap Map 프로젝트로부터 데이터를 사용하여, 빈 I 내지 VII에서 각각 5개, 2개, 3개, 2개, 5개, 3개, 2개의 SNP를 포함하는 7개의 상관관계 빈(r2=0.5)을 발견하였다(도 1). 마지막으로, 22개의 SNP 또는 유전적 변이체가 추가의 분석을 위해 유전자형 분석되었다. 상기 22개는 초기 단계에서 테스트된 3개의 SNP에 부가되었다.
CTGF 유전자자리의 상기 25 SNP 또는 유전적 변이체(22+3) 중에서, 8개의 유전적 변이체는 인간 대상체에서 간섬유증과 상관관계가 있는 것으로 동정되었다(rs 12527705, rs12526196, rs9399005, rs6918698, rs3037970, 1931002, rs2151532 및 rs9402373). 따라서, 본 발명의 특정 목적은 섬유증에 대한 소인의 검출 및/또는 섬유증의 예후를 위한 방법에 관한 것으로서, 상기 방법은 rs12527705, rs12526196, rs9399005, rs6918698, rs3037970, 1931002, rs2151532 및 rs9402373으로 이루어진 군에서 선택된 하나 이상의 SNP의 존재 또는 변경을 검출하는 단계를 포함한다.
상기 SNP 중에서, rs9402373의 C 대립유전자 또는 rs12526196의 T 대립유전자는 핵 인자 SRY, Lyf-1, CdxA, CP2, Ik-2 또는 Nkx-2를 특이적으로 결합한다.
SNP rs6918698 및 rs9402373는 HCV 감염 대상체에서 간섬유증과 연관되는 것으로 나타났다. 특히, rs9402373의 대립유전자 C는 유해한 것으로 나타났으며, 즉 이는 중증 간섬유증과 강하게 상관관계가 있다.
본 발명자에 의해 수집된 실험 데이터가 비록 테스트된 개체군에 의존하여 특정 대립유전자들의 연관성을 확인할 수 없었더라도, 본 발명은 테스트된 모든 개체군에서 섬유증과 유의적으로 상관관계가 있는 것으로 발견된 특정 SNP에 한정되지 않는다. 실제로, 불충분한 집단, 교락(confounding) 변수들의 불완전한 평가, 상기 개체군에서 SNP의 더 낮은 빈도 등을 포함하는 여러 개의 이유들이 일부 개체군에서 유의적인 상관관계의 확인에 대한 실패를 설명할 수 있다.
정의
본 발명에서, "섬유증"은 모든 섬유증 인간 질환, 예를 들어 간 질환, 간경변, 피부 켈로이드, 비후성반흔, 강피증, 비만증 및 임의의 섬유증 질환에서 발생하는 모든 유형의 인간 섬유증을 나타낸다.
본 발명에서, "간섬유증" 또는 "HF"는 간, 간의 조직 또는 간 조직의 임의의 부분에서 발생하는 모든 유형의 섬유증을 나타낸다. 간섬유증은 특히 손상에 응하여 발생한다. 간섬유증은 만성적인 간 손상에 대한 흔한 반응일 수 있으며, 이는 결국 간경변 및 이의 복합증, 간문맥항진증, 간부전 및 간세포암종을 야기한다. 간섬유증은 간에서 과다한 결합조직이 증대된 과도한 상처치유이다. 세포외 기질은 과잉생산되거나, 분해가 결핍되거나, 또는 이 둘 모두에 해당한다. 특히 염증 성분이 존재한다면, 만성적인 손상이 계기가 된다. 다양한 유형의 만성적인 간 손상은 섬유증, 예컨대 화학적 섬유증(CCl4), 박테리아 섬유증(즉, 브루셀라병), 기생충 섬유증(즉, 주혈흡충 종에 의해 야기되는 빌하르지오시스/시스토조미아시스; 또는 에키노코코시스 감염) 또는 바이러스 섬유증(즉, A형 간염 바이러스(HAV), B형 간염 바이러스(HBV) 또는 C형 간염 바이러스(HCV) 감염에 의해 야기되는 간염)을 야기할 수 있다.
본 발명에서, "피부 켈로이드(cutaneous keloid)"는 피부상에서 반흔조직의 과다한 성장이다. 특히, 켈로이드 및 비후성반흔(HSc)은 인간 특유의 피부 섬유증식 장애이며, 이는 외상, 염증, 수술, 화상 이후에, 때로는 자발적으로 발생한다. 이는 진피와 피하 조직에서 콜라겐의 과다한 퇴적을 특징으로 한다. 정상적인 상처 치유의 세선(fine line) 반흔 특징과 대조적으로, HSc 및 켈로이드의 풍부한 반흔형성은 통상적으로 외모손상, 경축, 소양증 및 통증을 야기한다. 켈로이드는 흑인, 히스패닉 및 동양인 중에서 가족성 기질을 갖는 개개인에게서 발생한다. HSc와 달리, 켈로이드 반흔은 원래 상처의 주변부를 넘어서 확대되고 길어지며, 거의 퇴보되지 않는다. 이러한 장애는 상처 치유의 기본 과정의 일탈을 나타내며, 여기에는 세포 이동 및 증식, 염증, 세포외 기질(ECM) 단백질 및 시토킨의 합성 및 분비의 증가, 및 새롭게 합성된 기질의 개조가 포함된다. 생물학적으로, 켈로이드는 세포외 기질 성분, 특히 콜라겐, 피브로넥틴, 엘라스틴 및 프로테오글리칸의 과도한 퇴적을 나타내는 이형 섬유아세포의 집단을 특징으로 하는 섬유증 조직이다. 일반적으로, 켈로이드는 비교적 무세포 중심과 두껍고 풍부한 콜라겐 다발을 포함하며, 이는 병변의 진피 심층 부분에서 결절을 형성한다. 치유의 염증 시기 동안 성장인자의 방출 및 활성화는, 혈관형성, 재-상피화, 섬유아세포의 보충 및 증식, 기질 퇴적을 포함하는 반흔 과정의 전제조건이다. 이어서, CTGF를 포함하는 조절 시토킨의 활성의 비정상적인 생성은 켈로이드의 발생에 기여할 수 있다.
본 발명에서, "CTGF(결합 조직 성장 인자) 유전자자리(gene locus)"는 CCN2 유전자자리라고도 불리우며, 이는 세포 또는 유기체의 모든 서열 또는 산물을 나타내며, 여기에는 CTGF 코딩 서열, CTGF 비-코딩 서열(예컨대, 인트론), 전사 및/또는 번역을 제어하는 CTGF 조절 서열(예컨대, 프로모터, 인핸서, 터미네이터 등), 모든 대응하는 발현 산물, 예컨대 CTGF RNA(예컨대, mRNA) 및 CTGF 폴리펩티드(예컨대, 전-단백질 및 성숙 단백질); 뿐만 아니라 CTGF 유전자의 개시 코돈의 업스트림에서 20 kb 영역, 바람직하게는 15.3 kb 영역의 주변 서열, 및 미번역 영역(3'UTR)의 다운스트림에서 20 kb 영역, 바람직하게는 14.1 kb 영역의 주변 서열이 포함된다. 예를 들어, CTGF 유전자자리에는 시퀀싱에 의해 동정된 61개의 SNP(도 1), 특히 표 1의 8개의 SNP를 포함하는 주변 서열이 포함된다. 그러나, 특정 구현예에서 대부분의 변경들은 프로모터 서열에 있지 않다.
본 발명에서, "예후"라는 용어에는 성인, 아동 및 태아에게서, 초기, 증상 이전 단계 및 말기 단계를 포함하는 다양한 단계에서, 검출, 모니터링, 투여, 비교 등이 포함된다. 예후에는 통상적으로 섬유증의 진행, 및 가장 적합한 치료(약물유전학)를 규정하는 대상체의 특징 등의 평가(예측)이 포함된다. 본 발명은 CTGF 유전자자리에서 돌연변이 또는 다형성으로부터 야기된 섬유증 또는 관련 장애의 진행 속도를 결정하기 위한 예후 방법을 제공한다. 치료 또는 약물에 대한 반응, 또는 치료 또는 약물에 대한 부작용을 분석하고 예측하는 예후는, 개개인이 특정 치료 약물로 처치되어야 하는지 여부를 결정하는 것을 목적으로 한다. 예를 들어, 만일 예후에 의해 개개인이 특정 약물에 의한 치료에 긍정적으로 반응할 것이라는 가능성이 나타난다면, 약물은 개개인에게 투여될 수 있다. 역으로, 만일 예후에 의해 개개인이 특정 약물에 의한 치료에 부정적으로 반응할 수 있다고 나타난다면, 대안적인 치료 경로가 처방될 수 있다. 부정적인 반응은 효과적인 반응의 부재, 또는 독성 부작용의 존재에 의해 규정될 수 있다. 임상 약물 시험은 CTGF 유전자자리 SNP에 대한 또다른 적용을 나타낸다. 약물에 대한 반응 또는 약물에 대한 부작용을 나타내는 하나 이상의 CTGF SNP는 전술한 방법을 사용하여 동정될 수 있다. 그 후에, 상기 제제의 임상시험에서 잠재적인 참가자들은 스크리닝되어, 약물에 대해 호의적으로 반응할 것 같은 개개인이 동정되고, 부작용을 나타낼 것 같은 개개인은 배제될 수 있다. 이러한 방식으로, 약물 치료의 유효성은, 본 시험에서 긍정적으로 반응할 것 같지 않은 개개인을 포함한 결과로서 측정을 저하시키지 않고, 원하지 않는 안전문제의 위험을 무릅쓰지 않으면서, 약물에 긍정적으로 반응하는 개개인에게서 측정될 수 있다.
변경(alteration)
변경은 CTGF DNA, RNA 또는 폴리펩티드의 수준에서 결정될 수 있다. 선택적으로, 검출은 CTGF 유전자자리의 전부 또는 일부의 시퀀싱에 의해 수행되거나, 또는 CTGF 유전자자리의 전부 또는 일부의 선택적 하이브리드화 또는 증폭에 의해 수행된다. 더 바람직하게는, CTGF 유전자자리 특이적 증폭이 변경을 동정하는 단계 이전에 수행된다. CTGF 유전자자리에서의 변경은 유전자자리의 코딩 및/또는 비-코딩 영역에서 돌연변이(들), 결실(들), 재배열(들) 및/또는 삽입(들)의 임의의 형태 단독, 또는 다양한 조합(들)일 수 있다. 특히, 돌연변이에는 점 돌연변이가 포함된다. 결실은, 예를 들어 2개의 잔기부터 전체 유전자 또는 유전자자리에 이르기까지, 유전자자리의 코딩 또는 비-코딩 부분에서 임의의 둘 이상의 잔기 영역을 포함할 수 있다. 비록 더 큰 결실이 물론 발생할 수 있을지라도, 통상적인 결실은 더 작은 영역, 예컨대 도메인(인트론) 또는 반복된 서열 또는 약 50개 미만의 연속적 염기쌍의 단편에 대해 발생한다. 삽입은 유전자자리의 코딩 또는 비-코딩 부분에서 하나 이상의 잔기의 부가를 포함할 수 있다. 삽입은 통상적으로 유전자자리에서 1 내지 50개의 염기쌍 의 부가를 포함할 수 있다. 재배열에는 서열의 역위가 포함된다. CTGF 유전자자리 변경은 종결 코돈의 생성, 프레임시프트 돌연변이, 아미노산 치환, 특정 RNA 스플라이싱 또는 가공, 산물 불안정, 절단된 폴리펩티드 생성 등을 야기할 수 있다. 상기 변경은 기능, 안정성, 표적화 또는 구조가 변형된 CTGF 폴리펩티드의 생성을 야기할 수 있다. 또한, 상기 변경은 단백질 발현의 감소, 또는 다르게는 상기 생성의 증가를 야기할 수 있다.
바람직한 구현예에서, 상기 변경은 하나 이상의 염기의 돌연변이, 삽입 또는 결실이다. 본 발명에 따른 방법의 특정 구현예에서, CTGF 유전자자리의 변경은 CTGF 유전자 또는 이에 대응하는 발현 산물에서 점 돌연변이, 결실 및 삽입, 더 바람직하게는 점 돌연변이 및 결실로부터 선택된다. 상기 변경은 CTGF DNA, RNA 또는 폴리펩티드의 수준에서 결정될 수 있다.
본 발명의 특정 목적은 섬유증에 대한 소인의 검출 및/또는 섬유증의 예후를 위한 방법이며, 상기 방법은 rs9402373, rs1931002, rs12526196, rs1257379, rs12527705, rs9399005, rs6918698, rs3037970, rs2151532, rs9321314, rs9321315, rs6910279, rs6940184, rs12523697, rs9493149, rs12529636, rs6917644, rs9493150, rs928501, rs11966728, rs7747601, rs12198610, 132319925 D/I, rs9483364, rs2095252, rs6926879, rs34118837, rs1931003, rs12191459, rs12206863, rs7768619, rs10872386 및 rs2327184로 이루어진 군에서 선택된 하나 이상의 변경 또는 SNP의 존재를 검출하는 단계를 포함한다.
상기 132319925 D/I(결실/삽입) 다형성은 이전에 공지된 적이 없는 새로운 다형성이다. 이러한 다형성을 식별할 수 있도록 하기 위해, 본 발명자는 좌표계에 따른 위치와 D/I를 명칭에 포함시켰으며, 상기 다형성이 결실 또는 삽입을 유도한다는 점을 나타내었다. 상기 다형성은 또한 132319925-/GAAA로 표시될 수도 있다.
바람직하게는, 상기 섬유증과 연관된 변경(들) 또는 SNP(들)는 rs12527705, rs12526196, rs9399005, rs6918698, rs3037970, rs1931002, rs2151532 및 rs9402373으로 이루어진 군으로부터 선택된다. 더 바람직하게는, 상기 rs9402373C 및 rs12526196T 대립유전자가 우선적으로 핵 인자를 결합한다.
상기 변경/SNP는 하기 표 1에 기재되어 있다.
염색체의 게놈서열의 뉴클레오티드 위치 |
변경/SNP 참조번호 |
다형성(polymorphism) |
서열 참조번호 |
132304944 | rs12527705 | A/T | 서열번호 1 |
132305169 | rs12526196 | C/T | 서열번호 2 |
132310657 | rs9399005 | C/T | 서열번호 3 |
132314950 | rs6918698 | C/G | 서열번호 4 |
132316891 | rs3037970 | -/TAAAA (D/I) | 서열번호 5 |
132320175 | rs1931002 | A/G | 서열번호 6 |
132316423 | rs2151532 | C/T | 서열번호 7 |
132319124 | rs9402373 | C/G | 서열번호 8 |
132321533 | rs12527379 | A/G | 서열번호 9 |
132294634 | rs9321314 | A/G | 서열번호 10 |
132294969 | rs9321315 | A/T | 서열번호 11 |
132295757 | rs6910279 | A/G | 서열번호 12 |
132299137 | rs6940184 | G/T | 서열번호 13 |
132299717 | rs12523697 | C/T | 서열번호 14 |
132300452 | rs9493149 | A/G | 서열번호 15 |
132301414 | rs12529636 | A/G | 서열번호 16 |
132307358 | rs6917644 | A/G | 서열번호 17 |
132315684 | rs9493150 | C/G | 서열번호 18 |
132317130 | rs928501 | A/C | 서열번호 19 |
132318298 | rs11966728 | C/T | 서열번호 20 |
132318597 | rs7747601 | A/G | 서열번호 21 |
132318713 | rs12198610 | A/G | 서열번호 22 |
132323491 | rs9483364 | A/G | 서열번호 23 |
132325281 | rs2095252 | A/G | 서열번호 24 |
132304054 | rs6926879 | A/C | 서열번호 25 |
132307157 | rs1931003 | A/G | 서열번호 26 |
132309432 | rs12191459 | C/T | 서열번호 27 |
132310735 | rs12206863 | A/C | 서열번호 28 |
132319026 | rs7768619 | C/T | 서열번호 29 |
132323557 | rs10872386 | C/T | 서열번호 30 |
132324717 | rs2327184 | A/G | 서열번호 31 |
132304021 | rs34118837 | C/G | 서열번호 32 |
132319925 | - (프로모터 5) | -/GAAA (D/I) |
CTGF 유전자의 변경은 변경된 CTGF RNA 발현의 존재를 결정함으로써 검출될 수 있다. 변경된 RNA 발현에는 변경된 RNA 서열의 존재, 변경된 RNA 스플라이싱 또는 가공의 존재, RNA의 변경된 양의 존재 등이 포함된다. 이는 당업계에 알려진 다양한 기법들에 의해 검출될 수 있으며, 여기에는 예를 들어 CTGF RNA의 전부 또는 일부의 시퀀싱, 또는 CTGF RNA의 전부 또는 일부의 선택적 하이브리드화 또는 선택적 증폭이 포함된다.
추가의 변이체에서, 상기 방법은 변경된 CTGF 폴리펩티드 발현의 존재를 검출하는 단계를 포함한다. 변경된 CTGF 폴리펩티드 발현에는 변경된 폴리펩티드 서열의 존재, CTGF 폴리펩티드의 변경된 양의 존재, 변경된 조직 분포의 존재 등이 포함된다. 이는 당업계에 알려진 다양한 기법들에 의해 검출될 수 있으며, 여기에는 예를 들어 시퀀싱 및/또는 특이적 리간드(예컨대 항체)에 대한 결합이 포함된다.
전술한 바와 같이, 시퀀싱, 하이브리드화, 증폭 및/또는 특이적 리간드(예컨대 항체)에 대한 결합을 포함하여 당업계에 알려진 다양한 기법들은, 변경된 CTGF 유전자 또는 RNA 발현 또는 서열을 검출하거나 정량화하기 위해 사용될 수 있다. 또다른 적합한 방법에는 대립유전자-특이적 올리고뉴클레오티드(ASO), 대립유전자-특이적 증폭, (DNA에 대한) 서던 블롯, (RNA에 대한) 노던 블롯, 단일 가닥 구조 분석(SSCA), PFGE, 형광 제자리 하이브리드화(FISH), 겔 이동, 클램프 변성 겔 전기영동, 이형2중가닥 분석, RN아제 보호법, 화학적 미스매치 절단, ELISA, 방사면역측정법(RIA) 및 면역효소측정법(IEMA)이 포함된다. 상기 접근법 중 일부(예컨대, SSCA 및 CGGE)는 변경된 서열이 존재한 결과로서 핵산의 전기영동 이동도의 변화에 기초한다. 이러한 기법들에 따르면, 변경된 서열이 겔상에서 이동도의 변화에 의해 가시화된다. 그 후, 단편들은 서열화되어, 변경을 확인할 수 있다. 다른 일부 접근법은 대상체의 핵산과 야생형 또는 변경된 CTGF 유전자 또는 RNA에 대해 특이적인 프로브 사이의 특이적 하이브리드화에 기초한다. 상기 프로브는 기질에 고정될 수 있거나 또는 현탁될 수 있다. 상기 프로브는 통상적으로 하이브리드의 검출을 촉진하기 위하여 표지된다. 상기 접근법 중 일부는 특히 폴리펩티드 서열 또는 발현 수준을 평가하는데 적합하며, 예를 들어 노던 블롯, ELISA 및 RIA가 있다. 상기 후자는 폴리펩티드에 특이적인 리간드, 더 바람직하게는 특이적 항체의 사용을 필요로 한다.
바람직한 구현예에서, 본 방법은 대상체의 샘플에서 변경된 CTGF 유전자 발현 프로파일의 존재를 검출하는 단계를 포함한다. 전술한 바와 같이, 이는 더 바람직하게는 상기 샘플에 존재하는 핵산의 시퀀싱, 선택적 하이브리드화 및/또는 선택적 증폭에 의해 달성될 수 있다.
시퀀싱
시퀀싱은 자동화 서열분석기를 사용하여, 당업계에 잘 알려진 기법들을 사용하여 수행될 수 있다. 시퀀싱은 온전한 CTGF 유전자자리에 대해, 또는 더 바람직하게는 이의 특이적 도메인, 통상적으로 유해한 돌연변이 또는 다른 변경을 수반하는 것으로 알려지거나 의심되는 것에 대해 수행될 수 있다.
증폭
증폭은 핵산 복제를 개시하는데 사용되는 상보적 핵산 서열 사이의 특이적 하이브리드의 형성에 기초한다. 증폭은 당업계에 알려진 다양한 기법들, 예컨대 폴리머라제 연쇄반응(PCR), 리가제 연쇄반응(LCR), 가닥 치환 증폭(SDA) 및 핵산 서열 기재 증폭(NASBA)에 의해 수행될 수 있다. 이러한 기법들은 시판되는 시약과 프로토콜을 사용하여 수행될 수 있다. 바람직한 기법은 대립유전자-특이적 PCR 또는 PCR-SSCP를 사용한다. 증폭에는 일반적으로 반응을 개시하기 위한 특이적 핵산 프라이머의 사용이 필요하다. CTGF 유전자자리의 서열을 증폭하는데 유용한 핵산 프라이머는 상기 유전자자리의 표적 영역의 옆에 배치된 CTGF 유전자자리의 부분과 특이적으로 하이브리드화될 수 있으며, 상기 표적 영역은 섬유증 또는 관련 장애를 갖는 특정 대상체에서 변경된다. 상기 표적 영역의 예는 표 2에 기재되어 있다. 본 발명의 또다른 특정 목적은 CTGF 유전자 또는 주변 영역을 포함하는 유전자자리의 서열을 증폭하는데 유용한 핵산 프라이머에 관한 것이다. 상기 프라이머는 바람직하게는 CTGF 유전자자리의 핵산 서열에 대해 상보적이며, 핵산 서열에 대해 특이적으로 하이브리드화된다. 특정 프라이머는 상기 유전자자리의 표적 영역의 옆에 배치된 CTGF 유전자자리의 부분과 특이적으로 하이브리드화될 수 있으며, 상기 표적 영역은 섬유증 또는 관련 장애를 갖는 특정 대상체에서 변경된다. 표 2에서 동정된 것과 같은 SNP를 포함하는 CTGF 표적 영역을 증폭하기 위해 사용될 수 있는 프라이머는 그의 서열 또는 CTGF의 게놈 서열에 기초하여 설계될 수 있다.
또한, 본 발명은 핵산 프라이머에 관한 것이며, 상기 프라이머는 섬유증 또는 관련 장애를 갖는 특정 대상체에서 변경된 CTGF 유전자자리 코딩 서열(예컨대, 유전자 또는 RNA)의 부분에 상보적이고, 이에 대해 특이적으로 하이브리드화된다. 이와 관련하여, 본 발명의 특정 프라이머는 CTGF 유전자자리 또는 RNA의 변경된 서열에 대해 특이적이다. 상기 프라이머를 사용함으로써, 증폭 산물의 검출은 CTGF 유전자자리에서 변경의 존재를 나타낸다. 반면, 증폭 산물의 부재는 샘플에서 특이적 변경이 존재하지 않는다는 점을 나타낸다. 또한, 본 발명은 대상체에서 섬유증 또는 관련 장애의 존재 또는 이에 대한 소인을 검출하는 방법, 또는 섬유증 또는 관련 장애의 치료에 대한 대상체의 반응을 평가하는 방법에서, 전술한 핵산 프라이머 또는 핵산 프라이머 쌍의 용도에 관한 것이다.
선택적 하이브리드화
하이브리드화 검출 방법은 핵산 서열 변경(들)을 검출할 수 있게 하는 상보적 핵산 서열 사이의 특이적 하이브리드의 형성에 기초한다. 특정 검출 기법에는, 야생형 또는 변경된 CTGF 유전자 또는 RNA에 대해 특이적인 핵산 프로브를 사용하고, 그 후 하이브리드의 존재를 검출하는 것이 포함된다. 상기 프로브는 (핵산 어레이 또는 칩 기법에서와 같이) 기질 또는 지지체에 고정되거나 또는 현탁될 수 있다. 상기 프로브는 통상적으로 하이브리드의 검출을 촉진하기 위하여 표지된다. 이와 관련하여, 본 발명의 특정 구현예는 변경된 CTGF 유전자자리에 대해 특이적인 핵산 프로브와 대상체의 샘플을 접촉시키는 단계, 및 하이브리드의 형성을 평가하는 단계를 포함한다. 바람직한 특정 구현예에서, 본 방법은 야생형의 CTGF 유전자자리와 이의 변경된 다양한 형태들에 대해 각각 특이적인 프로브 세트와 샘플을 동시에 접촉시키는 단계를 포함한다. 이러한 구현예에서, 샘플의 CTGF 유전자자리에서 다양한 형태의 변경의 존재를 직접적으로 검출하는 것이 가능하다. 또한, 다양한 대상체의 다양한 샘플들이 동시에 처리될 수 있다.
본 발명에서, 프로브는, CTGF 유전자 또는 RNA(의 표적 부분)에 상보적이고 이에 대해 특이적 하이브리드화될 수 있으며, 섬유증에 대한 소인이 있거나 섬유증과 연관된 CTGF 대립유전자 연관 폴리뉴클레오티드 다형성을 검출하는데 적합한, 폴리뉴클레오티드 서열을 나타낸다. 프로브는 바람직하게는 CTGF 유전자, RNA, 또는 이의 표적 부분에 완전히 상보적이다. 프로브는 통상적으로 길이가 8 내지 1000인 뉴클레오티드의 단일 가닥 핵산을 포함하며, 예를 들어 상기 길이는 10 내지 800, 더 바람직하게는 15 내지 700, 일반적으로 20 내지 500이다. 또한, 더 긴 프로브도 사용될 수 있다. 본 발명의 바람직한 프로브는, 변경을 수반하는 CTGF 유전자자리 또는 RNA의 영역에 특이적으로 하이브리드화할 수 있는, 길이가 8 내지 500인 뉴클레오티드의 단일 가닥 핵산 분자이다.
본 발명의 방법은, 변경된(예컨대, 돌연변이된) CTGF 유전자 또는 RNA에 대해 특이적인 핵산 프로브, 즉 상기 변경된 CTGF 유전자 또는 RNA에 대해 특이적으로 하이브리드화하고, 상기 변경이 없는 CTGF 유전자 또는 RNA에 대해서는 본질적으로 하이브리드화하지 않는 핵산 프로브를 이용한다. 특이성은, 표적 서열에 대한 하이브리드화가 특이적인 신호를 생성하고, 이는 비-특이적 하이브리드화를 통해 생성된 신호와 구별될 수 있다는 것을 나타낸다. 본 발명에 따른 프로브를 설계하기 위해, 완전하게 상보적인 서열이 바람직하다. 그러나, 특이적인 신호가 비-특이적 하이브리드화와 구별될 수 있는 한, 특정 미스매치는 용인될 수 있는 것으로 여겨져야 할 것이다.
상기 프로브의 특정 예는, 상기 표 1에 기재되어 있는 점 돌연변이를 수반하는 CTGF 유전자자리 또는 RNA를 포함하는 게놈 영역의 표적 부분에 대해 상보적인 핵산 서열이다. 특히, 상기 프로브는 SNP 또는 이의 상보적 서열을 포함하는 서열번호 1 내지 8 또는 이의 단편으로 이루어진 군으로부터 선택된 서열을 포함할 수 있다.
프로브의 서열은 본 출원에서 제공된 CTGF 유전자 및 RNA의 서열로부터 유래될 수 있다. 프로브의 화학적 변형 뿐만 아니라 뉴클레오티드 치환이 수행될 수 있다. 상기 화학적 변형은 하이브리드의 안정성을 증가시키기 위해 사용될 수 있거나(예컨대, 인터컬레이팅 기), 또는 프로브를 표지하기 위해 사용될 수 있다. 표지의 일반적인 예에는 방사능, 형광, 발광, 효소 표지 등이 포함되지만, 이에 한정되는 것은 아니다. 또한, 본 발명은 대상체에서 섬유증 또는 관련 장애의 존재 또는 이에 대한 소인을 검출하는 방법, 또는 섬유증 또는 관련 장애의 치료에 대한 대상체의 반응을 평가하는 방법에서, 전술한 핵산 프로브의 용도에 관한 것이다.
특이적 리간드 결합
전술한 바와 같이, CTGF 유전자자리의 변경은 또한 CTGF 폴리펩티드 서열 또는 발현 수준의 변경(들)을 스크리닝함으로써 검출될 수 있다. 이와 관련하여, CTGF 폴리펩티드에 대해 특이적인 리간드와 샘플을 접촉시키는 것과, 복합체의 형성을 결정하는 것이 또한 개시되어 있다. 특이적 항체와 같은 다양한 유형의 리간드가 사용될 수 있다. 특정 구현예에서, 상기 샘플은 CTGF 폴리펩티드에 대해 특이적인 항체와 접촉되고, 면역 복합체의 형성이 결정된다. 면역 복합체를 검출하기 위한 다양한 방법들, 예를 들어 ELISA, 방사면역측정법(RIA) 및 면역효소측정법(IEMA)이 사용될 수 있다. 본 발명에서, 항체는 폴리클로날 항체, 모노클로날 항체, 및 실질적으로 동일한 항원 특이성을 갖는 항체의 단편 또는 유도체를 나타낸다. 단편에는 Fab, Fab'2, CDR 영역 등이 포함된다. 유도체에는 단일 사슬 항체, 인간화된 항체, 다관능 항체 등이 포함된다. CTGF 폴리펩티드에 대해 특이적인 항체는 CTGF 폴리펩티드에 선택적으로 결합하는 항체, 즉 CTGF 폴리펩티드 또는 이의 에피토프-함유 단편에 대한 항체를 나타낸다. 비록 다른 항원에 대한 비-특이적 결합이 발생할 수 있더라도, 표적 CTGF 폴리펩티드에 대한 결합은 더 높은 친화력으로 발생하며, 이는 비-특이적 결합과 신뢰성있게 구별될 수 있다.
또한, CTGF 유전자자리 또는 폴리펩티드의 변경, CTGF 유전자 또는 폴리펩티드 발현의 변경, 및/또는 CTGF 활성의 변경의 존재를 대상체의 샘플에서 검출하기 위한 시약 및 생성물을 포함하는 진단 키트가 개시되어 있다. 상기 진단 키트에는 본 발명에 개시된 임의의 프라이머, 임의의 프라이머 쌍, 임의의 핵산 프로브 및/또는 임의의 리간드, 바람직하게는 항체가 포함된다. 또한, 상기 진단 키트에는 하이브리드화, 증폭 또는 항원-항체 면역 반응을 수행하기 위한 시약 및/또는 프로토콜이 포함될 수 있다.
연관불균형(linkage disequilibrium)
관심대상인 게놈 역역에서, 특히 CTGF 유전자자리에서 첫번째 SNP가 동정된다면, 상기 첫번째 SNP와 연관불균형에 있는 다른 부가적인 SNP가 동정될 수 있다. 실제로, 섬유증 또는 관련 장애와 연관된 첫번째 SNP와 연관불균형에 있는 임의의 SNP가 이러한 특성(trait)과 연관될 것이다. 따라서, 특정 SNP와 섬유증 사이에 연관이 입증된다면, 이러한 특성과 연관된 부가적 SNP의 발견은 상기 특정 영역에서 SNP의 밀도를 증가시키기 위해 매우 흥미로울 수 있다. 특정 SNP와 연관불균형에 있는 부가적 SNP의 동정은 하기를 포함한다: (a) 다수의 개개인들의 첫번째 SNP를 포함하거나 첫번째 SNP를 둘러싼 게놈 영역의 단편을 증폭시키는 단계; (b) 상기 첫번째 SNP를 포함하거나 둘러싼 게놈 영역에서 두번째 SNP를 동정하는 단계; (c) 상기 첫번째 SNP와 두번째 SNP 사이에서 연관불균형 분석을 수행하는 단계; 및 (d) 상기 첫번째 마커와 연관불균형에 있는 상기 두번째 SNP를 선택하는 단계. 또한, (b) 단계 및 (c) 단계를 포함하는 서브-컴비네이션(sub-combination)이 고려된다. 또한, 연관불균형에 있는 상기 SNP는 본 발명에 따른 방법에서, 특히 본 발명에 따른 진단 방법에서 사용될 수 있다.
인과적 돌연변이
섬유증에 대해 책임이 있는 CTGF 유전자자리의 돌연변이는, 섬유증 또는 관련 장애를 나타내는 환자와 대조군 개체의 CTGF 유전자자리의 서열을 비교함으로써 동정될 수 있다. CTGF의 SNP의 동정된 연관에 기초하여, 동정된 유전자자리가 돌연변이를 위해 스캐닝될 수 있다. 바람직한 구현예에서, CTGF 유전자자리의 기능 영역, 예컨대 엑손 및 스플라이스 부위, 프로모터 및 다른 조절 영역들이 돌연변이를 위해 스캐닝된다. 바람직하게는, 섬유증을 나타내는 환자는 섬유증과 연관되는 것으로 보여진 돌연변이를 수반하고, 대조군 개인은 섬유증과 연관된 돌연변이 또는 대립유전자를 수반하지 않는다. 또한, 섬유증을 나타내는 환자는 섬유증과 연관되는 것으로 보여진 돌연변이를 대조군 개체보다 더 높은 친화력으로 수반할 수도 있다. 상기 돌연변이를 검출하는데 사용되는 방법은 일반적으로 하기 단계를 포함한다: 섬유증을 나타내는 환자와 대조군 개체의 CTGF 유전자자리의 DNA 샘플로부터 섬유증과 연관된 SNP 또는 SNP 군을 포함하는 CTGF 유전자자리의 영역을 증폭하는 단계; 상기 증폭된 영역을 시퀀싱하는 단계; 섬유증 또는 관련 장애를 나타내는 환자와 대조군 개체의 CTGF 유전자의 DNA 서열을 비교하는 단계; 섬유증을 나타내는 환자에 대해 특이적인 돌연변이를 결정하는 단계.
약물 스크리닝
약물 후보 또는 예를 스크리닝하기 위한 새로운 방법이 또한 개시된다. 이러한 방법에는 결합 분석 및/또는 기능 분석이 포함되며, 이는 시험관내, 세포계, 동물 등에서 수행될 수 있다. 본 발명의 특정 목적은 생물학적으로 활성인 화합물을 선택하는 방법에 관한 것이며, 상기 방법은 본 발명에 따른 CTGF 유전자 또는 폴리펩티드와 시험 화합물을 시험관내에서 접촉시키는 단계, 및 상기 CTGF 유전자 또는 폴리펩티드에 결합하는 상기 시험 화합물의 능력을 결정하는 단계를 포함한다. 상기 유전자 또는 폴리펩티드에 대한 결합은, 상기 표적의 활성을 조절하고 이에 따라 대상체에서 섬유증을 유발하는 경로에 영향을 미치는 화합물의 능력에 관한 지표를 제공한다. 바람직한 구현예에서, 본 방법은 본 발명에 따른 CTGF 폴리펩티드 또는 이의 단편과 시험 화합물을 시험관내에서 접촉시키는 단계, 및 상기 CTGF 폴리펩티드 또는 단편에 결합하는 상기 시험 화합물의 능력을 결정하는 단계를 포함한다. 상기 단편은 바람직하게는 CTGF 폴리펩티드의 결합 부위를 포함한다. 바람직하게는, 상기 CTGF 유전자 또는 폴리펩티드 또는 이의 단편은, 변경 또는 돌연변이를 포함하는 변경되거나 돌연변이된 CTGF 유전자 또는 폴리펩티드 또는 이의 단편이다. 본 발명의 특정 목적은 섬유증에 대해 활성인 화합물을 선택하는 방법에 관한 것이며, 상기 방법은 본 발명에 따른 CTGF 폴리펩티드 또는 이의 결합부위-함유 단편과 시험 화합물을 시험관내에서 접촉시키는 단계, 및 상기 CTGF 폴리펩티드 또는 이의 단편에 결합하는 상기 시험 화합물의 능력을 결정하는 단계를 포함한다. 바람직하게는, 상기 CTGF 폴리펩티드 또는 이의 단편은, 변경 또는 돌연변이를 포함하는 변경되거나 돌연변이된 CTGF 폴리펩티드 또는 이의 단편이다. 약물 후보를 스크리닝하기 위한 방법은 본 발명에 따른 CTGF 폴리펩티드를 발현하는 재조합 숙주 세포를 시험 화합물과 접촉시키는 단계, 및 상기 CTGF에 결합하고 CTGF 폴리펩티드의 활성을 조절하는 상기 시험 화합물의 능력을 결정하는 단계를 포함한다. 바람직하게는, 상기 CTGF 폴리펩티드 또는 이의 단편은, 변경 또는 돌연변이를 포함하는 변경되거나 돌연변이된 CTGF 폴리펩티드 또는 이의 단편이다. 결합을 결정하는 것은 다양한 기법들, 예컨대 시험 화합물의 표지화, 표지된 참조 리간드와의 경쟁 등에 의해 수행될 수 있다.
또한, 생물학적으로 활성인 화합물을 선택하는 방법은 CTGF 폴리펩티드와 시험 화합물을 시험관내에서 접촉시키는 단계, 및 상기 CTGF 폴리펩티드의 활성을 조절하는 상기 시험 화합물의 능력을 결정하는 단계를 포함한다. 바람직하게는, 상기 CTGF 폴리펩티드 또는 이의 단편은, 변경 또는 돌연변이를 포함하는 변경되거나 돌연변이된 CTGF 폴리펩티드 또는 이의 단편이다.
또한, 섬유증을 갖거나 섬유증을 발달시킬 소인이 있는 대상체를 위해 생물학적으로 활성인 화합물을 선택하는 방법은 본 발명에 따른 CTGF 유전자와 시험 화합물을 시험관내에서 접촉시키는 단계, 및 상기 CTGF 유전자의 발현을 조절하는 상기 시험 화합물의 능력을 결정하는 단계를 포함한다. 바람직하게는, 상기 CTGF 유전자 또는 이의 단편은, 변경 또는 돌연변이를 포함하는 변경되거나 돌연변이된 CTGF 유전자 또는 이의 단편이다.
또한, 활성 화합물, 특히 섬유증에 대해 활성인 화합물의 스크리닝, 선택 또는 동정 방법은 리포터 구조물(construct)을 포함하는 재조합 숙주 세포와 시험 화합물을 접촉시키는 단계, 및 리포터 유전자의 발현을 조절(예컨대, 활성화 또는 억제)하는 시험 화합물을 선택하는 단계를 포함하며, 여기서 상기 리포터 구조물은 CTGF 유전자 프로모터의 조절하에서 리포터 유전자를 포함한다. 바람직하게는, 상기 CTGF 유전자 프로모터 또는 이의 단편은, 변경 또는 돌연변이를 포함하는 변경되거나 돌연변이된 CTGF 유전자 프로모터 또는 이의 단편이다.
상기 스크리닝 분석은 임의의 적합한 장치, 예컨대 플레이트, 튜브, 접시, 플라스크 등에서 수행될 수 있다. 통상적으로, 상기 분석은 멀티웰 플레이트에서 수행된다. 수개의 시험 화합물들이 동시에 분석될 수 있다. 또한, 상기 시험 화합물은 다양한 기원, 성질 및 조성을 가질 수 있다. 이는 임의의 유기 또는 무기 물질, 예컨대 지질, 펩티드, 폴리펩티드, 핵산, 소분자 등일 수 있으며, 독립적으로 또는 다른 물질들과 혼합하여 사용될 수 있다. 상기 화합물은 예를 들어 생성물의 조합 라이브러리의 전부 또는 일부일 수 있다.
약학 조성물, 치료법
또한, 하기를 포함하는 약학 조성물이 기재된다: (i) 전술한 CTGF 폴리펩티드 또는 이의 단편, CTGF 폴리펩티드 또는 이의 단편을 인코딩하는 핵산, 벡터 또는 재조합 숙주 세포, 및 (ii) 약학적으로 허용가능한 담체 또는 매개체. 또한, 본 발명은 대상체의 섬유증 또는 관련 장애의 치료 또는 예방 방법에 관한 것으로서, 상기 방법은 기능적 (예컨대, 야생형) CTGF 폴리펩티드 또는 CTGF 유전자자리를 인코딩하는 핵산을 상기 대상체에 투여하는 단계를 포함한다. 또한, 본 발명은 대상체의 섬유증의 치료 또는 예방 방법에 관한 것으로서, 상기 방법은 본 발명에 따른 CTGF 유전자자리 또는 단백질의 발현 또는 활성을 조절하는, 바람직하게는 활성화 또는 모방하는 화합물을 상기 대상체에 투여하는 단계를 포함한다. 상기 화합물은 CTGF의 작용물질 또는 대항물질, CTGF의 안티센스 또는 RNAi, CTGF 폴리펩티드에 대해 특이적인 항체 또는 이의 단편 또는 유도체일 수 있다. 본 방법의 특정 구현예에서, 상기 조절은 억제이다. 본 방법의 또다른 특정 구현예에서, 상기 조절은 활성화이다.
또한, 본 발명은 대상체의 섬유증의 치료 또는 예방용 약학 조성물의 제조에 있어서, 본 발명에 따른 기능적 CTGF 폴리펩티드, CTGF 유전자자리를 인코딩하는 핵산, CTGF 유전자 또는 단백질의 발현 또는 활성을 조절하는 화합물의 용도를 개시한다. 상기 화합물은 CTGF의 작용물질 또는 대항물질, CTGF의 안티센스 또는 RNAi, CTGF 폴리펩티드에 대해 특이적인 항체 또는 이의 단편 또는 유도체일 수 있다. 본 방법의 특정 구현예에서, 상기 조절은 억제이다. 본 방법의 또다른 특정 구현예에서, 상기 조절은 활성화이다.
본 발명은 섬유증과 CTGF 유전자자리 사이의 상관관계를 입증한다. 따라서, 본 발명은 치료적 개입의 신규한 표적을 제공한다. 다양한 접근법들이 대상체, 특히 변경된 CTGF 유전자자리를 갖는 대상체에서 CTGF 활성 또는 기능을 회복하거나 조절하기 위해 고려될 수 있다. 상기 대상체에게 야생형의 기능을 제공하는 것은 병적인 세포 또는 유기체에서 섬유증의 표현형 발현을 억제하는 것으로 여겨진다. 상기 기능의 제공은 유전자 또는 단백질 요법을 통해 달성되거나, 또는 CTGF 폴리펩티드 활성을 조절하거나 모방하는 화합물(예컨대, 상기 스크리닝 분석에서 동정된 작용물질)을 투여함으로써 달성될 수 있다.
야생형 CTGF 유전자 또는 기능적 부분이 전술한 벡터를 사용하여 이를 필요로 하는 대상체의 세포에 도입될 수 있다. 상기 벡터는 바이러스 벡터 또는 플라스미드일 수 있다. 상기 유전자는 또한 네이키드(naked) DNA로서 도입될 수도 있다. 상기 유전자는 수용 숙주 세포의 게놈으로 통합시키거나 또는 염색체외에 잔존시키기 위해 제공될 수 있다. 통합은 임의적으로 규정되거나 정확하게 규정된 부위에서 예를 들어 상동 재조합을 통해 발생할 수 있다. 특히, CTGF 유전자의 기능적 복제본은 세포에서 변경된 형태를 대신하여 상동 재조합을 통해 삽입될 수 있다. 추가적인 기법에는 유전자 총, 리포솜-매개 트랜스펙션, 양이온 지질-매개 트랜스펙션 등이 포함된다. 유전자 요법은 직접 유전자 조사에 의해 달성되거나, 또는 기능적 CTGF 폴리펩티드를 발현하는 생체외 제조된 유전적 변형 세포를 투여함으로써 달성될 수 있다.
또한, CTGF 활성을 갖는 다른 분자들(예컨대, 펩티드, 약물, CTGF 작용물질 또는 유기 화합물)이 대상체에서 기능적 CTGF 활성을 회복시키기 위해 사용되거나, 또는 세포에서 유해한 표현형을 억제하기 위해 사용될 수도 있다. 세포에서 기능적 CTGF 유전자자리 기능의 복구는 섬유증의 발달을 예방하기 위해 사용되거나, 또는 섬유증의 진행을 축소시키기 위해 사용될 수 있다.
본 발명의 추가적인 측면 및 이점들은 하기의 실시예에 기재될 것이며, 이는 예시적으로서 고려되어야 하고 본 발명의 범위가 이에 한정되어서는 안 된다.
도 1: 어민들의 CTGF(=CCN2) 유전자자리에서 상관관계 빈(bin).
33개의 마커가 '재료 및 방법' 항목에 기재된 바와 같이 70개의 관련되지 않은 대상체에 대해 유전자형 분석되었다. SNP 사이의 상관관계(r2 값)는 Haploview 소프트웨어를 사용하여 결정되었다. 가장 어두운 색상은 가장 강한 상관관계를 나타낸다. 상관관계 빈(r2>0.05)은 하기와 같았다: 빈 1에서, SNP rs9321314, rs6940184, rs12523697, rs9493149 및 rs12529636; 빈 2에서, SNP rs12527705 및 rs12526196; 빈 3에서, SNP rs9399005, rs6918698, 및 결실/삽입(D/I) rs3037970; 빈 4에서, SNP rs2151532 및 SNP rs1931002; 빈 5에서, SNP rs9493150, rs928501, rs11966728, rs12198610 및 새로운 삽입/결실(132319925 -/GAAA); 빈 6에서, SNP rs7747601, rs7768619 및 rs9402373; 빈 7에서, SNP rs12527379 및 rs2095252.
8개의 케이스와 2개의 대조군에서, CCN2(3.2kb) 및 개시 코돈의 업스트림에서 15.3 kb 및 3'UTR 영역의 14.1 kb를 시퀀싱하였다. 이는 61개의 SNP를 밝혔으며, 그 중에서 50개는 이전에 공지되었다.
본 발명자는 주요한 효과를 나타내는 유전자를 찾고 있었기 때문에, MAF>20%인 53개의 SNP에 집중하였다. MAF>20%인 33개의 SNP는 70명의 어민들에 대해 유전자형 분석되었다. SNP 사이의 상관관계(r2 값)는 Haploview 소프트웨어를 사용하여 결정되었다. 하단부의 도는 r2 값 x 1OO을 보여준다. 가장 어두운 색상은 가장 강한 상관관계를 나타낸다. 이 도면의 상단부에, 각각의 마커의 상대적 위치와 함께 물리 지도(physical map)이 또한 도시되어 있다. 이러한 마커들은 7개의 상관관계(r2=0.5) 빈(I 내지 VII)으로 그룹지어진다.
SNP rs9321314, rs6940184, rs12523697, rs9493149 및 rs12529636이 빈 1에 있으며; SNP rs12527705 및 rs12526196이 빈 2에 있으며; SNP rs9399005, rs6918698 및 D/I rs3037970이 빈 3에 있으며; SNP rs2151532 및 SNP rs1931002가 빈 4에 있으며; SNP rs9493150, rs928501, rs11966728, rs12198610 및 새로운 삽입/결실(132319925 -/GAAA)이 빈 5에 있으며; SNP rs7747601, rs7768619 및 rs9402373이 빈 6에 있으며; SNP rs12527379 및 rs2095252가 빈 7에 있다.
22개의 SNP가 전체 어민 샘플(201개의 대조군 및 99개의 케이스)에서 추가로 유전자형 분석되었다. 일변량 분석의 결과는 도 1의 상단부와 표 1 및 4에 나타나 있다. 간섬유증과 연관된 SNP는 빈 II에서 SNP rs12527705(p=0.02, OR=2.3) 및 SNP rs12526196(p=0.02, OR=2.2)이었으며, 빈 III에서 SNP rs9399005(p=0.02, OR=2.2), SNP rs6918698(p=0.02, OR=2) 및 D/I rs3037970(p=0.003, OR=2.6)이었으며, 빈 IV에서 SNP rs1931002(p=0.004, OR=2.3) 및 rs2151532(p=0.02, OR=1.98)였으며, 빈 VI에서 SNP rs9402373(p=0.015, OR=2)이었다. 분석은 성별(p<0.001), 노출(어업 년수: p<0.001, 어선에서의 출생: p<0.01) 및 치료 횟수(p<0.01)에 대해 조정되었다.
상기 분석에서, D/I rs3037970은 2개의 SNP를 동시에 테스트하는 다변량 분석에서 rs6918698을 제외하였다. 마찬가지로, SNP rs1931002는 SNP rs2151532를 제외하였으며; SNP rs1256196은 SNP rs12527705 및 SNP rs9399005를 제외하였다. 이는 SNP 또는 결실 rs12526196, rs30337970, rs1931002, rs9402373이 간섬유증(HF)과 가장 강한 연관을 갖는다는 점을 나타내었다. 4개의 모든 SNP가 동일한 회귀 모델에서 테스트되었을 때(표 4의 하단부), SNP rs12526196(p=0.007, OR=3), rs9402373(p=0.002, OR=2.8) 및 rs1931002(p=0.002, OR=2.8)는 HF와 독립적인 연관을 나타내었다. 53.9%의 대조군과 67.5%의 케이스에 존재하는 단상형 1002C, 6196T는 HF와 연관되었다(p<0.005). 또한, 본 발명자는 간문맥항진증의 증거로 후기 HF와 연관된 표현형을 테스트하였다. 본 발명자는 (154개의 대조군과 151개의 케이스) rs9402373(p=0.005, OR=2.6) 및 rs3037970(p=0.05, OR=2)이 상기 표현형과 연관되었으며, SNP rs1256196은 더 중증의 질환 표현형과의 연관 경향을 나타낸다는 점(p=0.12)을 발견하였다. 성별(p=0.001)은 상기 모델에 공변인으로서 들어갔다. 이는 rs9402373과 rs3037970 모두가 중증 질환에 더 중요하게 기여할 수 있다는 점을 보여주었다.
도 2A: 전기영동 이동도 변화 분석은 SNP rs12526196 및 rs9402373과 핵 인자의 대립유전자 특이적 결합을 나타낸다.
EMSA는 자극된 인간 간세포 세포주(HEPG2)의 핵 추출물을 사용하여 '재료 및 방법' 항목에 따라 수행되었다. 12526196T 대립유전자는 C 대립유전자보다 더 높은 친화력으로 핵 인자에 결합되었다(복합체 1). SNP rs9402373C 대립유전자는 G 대립유전자에 의해 결합되지 않은 핵 인자에 결합되었다(복합체 2). 대립유전자 특이적 결합은 SNP rs12527705 및 SNP rs1931002에 대해 전혀 관찰되지 않았다.
도 2B: rs9402373 다형성에 대한 경쟁적 전기영동 이동도 변화 분석.
경쟁반응이 비오티닐화되지 않은 rs9402373G 및 C 프로브의 100 또는 200 fmol과 함께 수행되었다. 비오티닐화되지 않은 rs9402373G 없이 농도 200 fmol의 비오티닐화되지 않은 rs9402373C 프로브와 함께 수행된 경쟁반응은 비오티닐화된 rs9402373C 프로브의 결합과 경쟁하였다.
도 3은 HCV 또는 주혈흡충 감염 대상체에서 간섬유증과 SNP rs9402373의 연관의 메타(meta) 분석을 나타낸다.
33개의 마커가 '재료 및 방법' 항목에 기재된 바와 같이 70개의 관련되지 않은 대상체에 대해 유전자형 분석되었다. SNP 사이의 상관관계(r2 값)는 Haploview 소프트웨어를 사용하여 결정되었다. 가장 어두운 색상은 가장 강한 상관관계를 나타낸다. 상관관계 빈(r2>0.05)은 하기와 같았다: 빈 1에서, SNP rs9321314, rs6940184, rs12523697, rs9493149 및 rs12529636; 빈 2에서, SNP rs12527705 및 rs12526196; 빈 3에서, SNP rs9399005, rs6918698, 및 결실/삽입(D/I) rs3037970; 빈 4에서, SNP rs2151532 및 SNP rs1931002; 빈 5에서, SNP rs9493150, rs928501, rs11966728, rs12198610 및 새로운 삽입/결실(132319925 -/GAAA); 빈 6에서, SNP rs7747601, rs7768619 및 rs9402373; 빈 7에서, SNP rs12527379 및 rs2095252.
8개의 케이스와 2개의 대조군에서, CCN2(3.2kb) 및 개시 코돈의 업스트림에서 15.3 kb 및 3'UTR 영역의 14.1 kb를 시퀀싱하였다. 이는 61개의 SNP를 밝혔으며, 그 중에서 50개는 이전에 공지되었다.
본 발명자는 주요한 효과를 나타내는 유전자를 찾고 있었기 때문에, MAF>20%인 53개의 SNP에 집중하였다. MAF>20%인 33개의 SNP는 70명의 어민들에 대해 유전자형 분석되었다. SNP 사이의 상관관계(r2 값)는 Haploview 소프트웨어를 사용하여 결정되었다. 하단부의 도는 r2 값 x 1OO을 보여준다. 가장 어두운 색상은 가장 강한 상관관계를 나타낸다. 이 도면의 상단부에, 각각의 마커의 상대적 위치와 함께 물리 지도(physical map)이 또한 도시되어 있다. 이러한 마커들은 7개의 상관관계(r2=0.5) 빈(I 내지 VII)으로 그룹지어진다.
SNP rs9321314, rs6940184, rs12523697, rs9493149 및 rs12529636이 빈 1에 있으며; SNP rs12527705 및 rs12526196이 빈 2에 있으며; SNP rs9399005, rs6918698 및 D/I rs3037970이 빈 3에 있으며; SNP rs2151532 및 SNP rs1931002가 빈 4에 있으며; SNP rs9493150, rs928501, rs11966728, rs12198610 및 새로운 삽입/결실(132319925 -/GAAA)이 빈 5에 있으며; SNP rs7747601, rs7768619 및 rs9402373이 빈 6에 있으며; SNP rs12527379 및 rs2095252가 빈 7에 있다.
22개의 SNP가 전체 어민 샘플(201개의 대조군 및 99개의 케이스)에서 추가로 유전자형 분석되었다. 일변량 분석의 결과는 도 1의 상단부와 표 1 및 4에 나타나 있다. 간섬유증과 연관된 SNP는 빈 II에서 SNP rs12527705(p=0.02, OR=2.3) 및 SNP rs12526196(p=0.02, OR=2.2)이었으며, 빈 III에서 SNP rs9399005(p=0.02, OR=2.2), SNP rs6918698(p=0.02, OR=2) 및 D/I rs3037970(p=0.003, OR=2.6)이었으며, 빈 IV에서 SNP rs1931002(p=0.004, OR=2.3) 및 rs2151532(p=0.02, OR=1.98)였으며, 빈 VI에서 SNP rs9402373(p=0.015, OR=2)이었다. 분석은 성별(p<0.001), 노출(어업 년수: p<0.001, 어선에서의 출생: p<0.01) 및 치료 횟수(p<0.01)에 대해 조정되었다.
상기 분석에서, D/I rs3037970은 2개의 SNP를 동시에 테스트하는 다변량 분석에서 rs6918698을 제외하였다. 마찬가지로, SNP rs1931002는 SNP rs2151532를 제외하였으며; SNP rs1256196은 SNP rs12527705 및 SNP rs9399005를 제외하였다. 이는 SNP 또는 결실 rs12526196, rs30337970, rs1931002, rs9402373이 간섬유증(HF)과 가장 강한 연관을 갖는다는 점을 나타내었다. 4개의 모든 SNP가 동일한 회귀 모델에서 테스트되었을 때(표 4의 하단부), SNP rs12526196(p=0.007, OR=3), rs9402373(p=0.002, OR=2.8) 및 rs1931002(p=0.002, OR=2.8)는 HF와 독립적인 연관을 나타내었다. 53.9%의 대조군과 67.5%의 케이스에 존재하는 단상형 1002C, 6196T는 HF와 연관되었다(p<0.005). 또한, 본 발명자는 간문맥항진증의 증거로 후기 HF와 연관된 표현형을 테스트하였다. 본 발명자는 (154개의 대조군과 151개의 케이스) rs9402373(p=0.005, OR=2.6) 및 rs3037970(p=0.05, OR=2)이 상기 표현형과 연관되었으며, SNP rs1256196은 더 중증의 질환 표현형과의 연관 경향을 나타낸다는 점(p=0.12)을 발견하였다. 성별(p=0.001)은 상기 모델에 공변인으로서 들어갔다. 이는 rs9402373과 rs3037970 모두가 중증 질환에 더 중요하게 기여할 수 있다는 점을 보여주었다.
도 2A: 전기영동 이동도 변화 분석은 SNP rs12526196 및 rs9402373과 핵 인자의 대립유전자 특이적 결합을 나타낸다.
EMSA는 자극된 인간 간세포 세포주(HEPG2)의 핵 추출물을 사용하여 '재료 및 방법' 항목에 따라 수행되었다. 12526196T 대립유전자는 C 대립유전자보다 더 높은 친화력으로 핵 인자에 결합되었다(복합체 1). SNP rs9402373C 대립유전자는 G 대립유전자에 의해 결합되지 않은 핵 인자에 결합되었다(복합체 2). 대립유전자 특이적 결합은 SNP rs12527705 및 SNP rs1931002에 대해 전혀 관찰되지 않았다.
도 2B: rs9402373 다형성에 대한 경쟁적 전기영동 이동도 변화 분석.
경쟁반응이 비오티닐화되지 않은 rs9402373G 및 C 프로브의 100 또는 200 fmol과 함께 수행되었다. 비오티닐화되지 않은 rs9402373G 없이 농도 200 fmol의 비오티닐화되지 않은 rs9402373C 프로브와 함께 수행된 경쟁반응은 비오티닐화된 rs9402373C 프로브의 결합과 경쟁하였다.
도 3은 HCV 또는 주혈흡충 감염 대상체에서 간섬유증과 SNP rs9402373의 연관의 메타(meta) 분석을 나타낸다.
재료 및 방법
통계적 분석
주혈흡충에 의해 감염된 대상체에서 질환 진행에 영향을 미치는 것으로 알려진 주요 공변인들을 포함하는 유전적 변이체와 섬유증이 발생된 개체의 확률 사이의 관계를 분석하기 위하여, 다변량 로지스틱 회귀가 사용되었다. 이러한 분석을 위해, 통계적 SPSS 소프트웨어(10.0 버전)가 사용되었다. 연령과 성별이 회귀 모델에서 테스트되었으며, 이들이 질환과 연관을 보여줄 때(p<0.05) 유지되었다. 집단은 성별과 연령에 대해 매치되었기 때문에, 이러한 공변인들은 유전적 변이체와 질환 사이의 연관에 대해 거의 영향을 미치지 않았다. 프라지콴텔 치료의 횟수, HBV에 의한 감염, 및 감염에 대한 노출은, 이러한 공변인들이 중국인 어민들(노출, 치료 횟수) 또는 중국인 농민들(HBV 감염, 출생 장소)에서와 같이 정확하게 평가될 수 있을 때, 회귀 모델에 포함되었다.
DNA 추출
5 내지 15 ml의 혈액의 분취량은 시트르산나트륨에서 수집되고, -20℃에서 유지되었다. DNA는 표준 염석 방법(Sambrook et al., 1989)을 사용하여 추출되었다. 일부 대상체들을 출혈을 거부하였다. 이 경우, 구강 세포 샘플이 폼-팁(foam-tipped) 어플리케이터를 사용하여 수집되었으며, Whatman에 의한 프로토콜(http://www.whatman.co.uk/)에 따라 지시 FTA1 카드(indicating FTA1 card)에 적용되었다. 깨끗하고 건조하고 편평한 표면에 지시 FTA1 카드를 위치시킬 것. FTA1 카드를 특별한 식별 명칭 또는 숫자로 표지할 것. 보호 패키지로부터 폼-팁 어플리케이터를 제거할 것. 어플리케이터의 플라스틱 핸들을 잡고, 구강에 폼 팁을 위치시키고, 30초 동안 뺨의 내부에 폼 팁의 일측면을 문지를 것. 다른 뺨에 대해 폼 팁의 반대쪽 측면을 사용하여 이를 반복할 것. 폼 팁을 잇몸선과 뺨의 접힌 부분을 따라 혀 아래에서 움직여, 가능한 한 많은 타액을 빨아들일 것. 어플리케이터를 구강에서 제거할 것. 지시 FTA1 카드의 종이 커버를 조심스럽게 들어올리고, 샘플 부분을 갖는 편평하고 둥근 폼 어플리케이터 팁을 내리누를 것. 카드에서 폼 팁을 들어올리지 말 것. 샘플 부분을 완전하게 포화시키기 위해, 좌우 이동(각 방향에서 908)을 3회 사용하여 팁을 쥐어짤 것. 상기 샘플 부분은 샘플의 이동에 따라 하얗게 변할 것이다. 건조시키기 위한 FTA1 카드를 깨끗한 표면에 위치시킬 것. 상기 카드를 실온에서 적어도 1시간 동안 건조되도록 할 것. 그 후에, 펀치를 200μl의 FTA 정제 완충액, 이어서 TE 완충액으로 3회 세척한다.
DNA 증폭
FTA 카드로부터 정제된 모든 DNA는 유전자형 분석 이전에 사전증폭되었다. 폴리머라제 연쇄반응(전체 게놈 증폭)은 일 펀치(one punch)의 생물학적 샘플(FTA1-결합 구강 세포 DNA) 또는 100 ng의 게놈 DNA를 함유하는 50 μl의 반응물, 1.5 OD의 15-염기 완전 퇴화 랜덤 프라이머(Genetix, Paris, France), 200 mM dNTP, 5 mM MgCl2, 5 ml의 10x PCR 완충액, 및 0.5 유닛(unit)의 고신뢰도(high fidelity) Taq DNA 폴리머라제(BIOTAQ DNA Polymerase, Bioline London, England)에서 수행되었다. 샘플은 하기에 따라 멀티블록 서모사이클러에서 증폭되었다: 94℃에서 3분의 사전-변성 단계, 94℃에서 1분, 37℃에서 2분, 경사로(37-55℃)에서 1분, 및 55℃에서 4분으로 이루어진 50회 사이클. 72℃에서 5분의 최종 확장 단계.
시퀀싱
정제된 PCR 산물은 ABI Prism 자동화 서열분석기에서 ABI Prism BigDye Terminator 사이클 시퀀싱 시스템(PE Applied Biosystems, Foster City, U.S.A.)을 사용하여 서열화되었다. 시퀀싱 반응은 GATC biotech(GATC, Marseille France)에 의한 양 가닥 시퀀싱에 대해 수행되었다. 시퀀싱 프라이머들은 표 2에 기재되어 있다. 8개의 케이스와 2개의 대조군에서 CCN2(3.2kb) 및 개시 코돈의 업스트림에서 15.3 kb 및 3'UTR 영역의 14.1 kb의 시퀀싱은 61개의 SNP를 밝혔으며(도 1), 그 중에서 50개는 이전에 공지되었다.
특이적 TaqMan 프로브에 의한 PCR을 통한 다형성 유전자형 분석(genotyping)
대립유전자의 구별은 TaqMan 프로브 분석(Applied Biosystems, Lafayette USA)을 사용하여 평가되었다. 각각의 반응물은 전체 부피 5 μl 중 12.5 ng의 게놈 DNA, TaqMan Universal PCR Master Mix(Applied Biosystems, Lafayette USA), 900 nM의 각각의 프라이머, 및 200 nM의 각각의 형광-표지된 하이브리드화 프로브를 포함하였다. RT-PCR은 하기 조건을 사용하여 ABI Prism Sequence Detection System 7900(Applied Biosystems, Lafayette USA)에서 수행되었다: 2분 동안 50℃, 10분 동안 95℃ 및 40회 사이클의 증폭(15초 동안 95℃ 변성, 1분 동안 60℃ 어닐링/신장). 이러한 방법론에 의해 하기의 SNP 또는 변경이 유전자형 분석되었다: rs9321314, rs9321315, rs6910279, rs6940184, rs12523697, rs9493149, rs12529636, rs12527705, rs12526196, rs6917644, rs9399005, rs6918698, rs9493150, rs2151532, rs3037970, rs928501, rs11966728, rs7747601, rs12198610, rs9402373, 132319925 D/I, rs1931002, rs12527379, rs9483364, rs2095252.
PCR 및 제한효소 소화에 의한 다형성 유전자형 분석
다형성(rs6926879, rs34118837, rs1931003, 12191459, rs12206863, 7768619, rs10872386 및 rs2327184)은 효소 제조사(Euromedex, Mundolsheim, France or New England Biolabs, Beverly, USA)에 의해 기재된 표준 조건하에서 제한효소 분석에 의해 유전자형 분석되었다. 폴리머라제 연쇄반응(PCR) 증폭은 표준 프로토콜에 따라 robocycler gradient 96(Stratagene, La Jolla, U.S.A.)에서 수행되었다. 각각의 소화는 아가로스 또는 아크릴아미드 겔에서 분해되고, 브롬화에티듐으로 염색되었으며, UV에 의해 시각화되었다. 프라이머는 표 2에 기재되어 있다.
핵 추출물의 제조
간 성상세포, 및 내피세포 및 근섬유아세포(Gressner et al., 2008)와 함께, 간세포는 간섬유증(HF)에서 CTGF를 생성하기 때문에(Kobayashi et al., 2005, Gressner et al., 2007), 핵 추출물은 덱사메타손(1mM)에 의해 1시간 동안 자극된 인간 간세포 세포주(HEPG2)로부터 제조되었다. 추출물은 Pierce의 핵 및 세포질 추출 시약(NE-PER; Pierce, Rockford, IL, USA)에 의해 제조되었다.
전기영동 이동도 변화 분석(EMSA: electrophoretic mobility shift assay)
상보적 단일 가닥 올리고뉴클레오티드가 변이체 뉴클레오티드의 각 측면에 대해 약 1Obp를 포괄하도록 상업적으로 합성되었으며, 이는 하기와 같다:
rs9402373C GCTCTCAAAACTAAGCCCAACTC (서열번호 33)
rs9402373G GAGTTGGGCTTAGTTTTGAGAGC (서열번호 34)
rs12527705A GTAATATAGAAGATGGGTCTA (서열번호 35)
rs12527705T GTAATATAGATGATGGGTCTA (서열번호 36)
rs12526196C GAATATACAACGAATATGGGC (서열번호 37)
rs12526196T GAATATACAATGAATATGGGC (서열번호 38)
rs1931002A TGGATGATTCAAACAACTTGG (서열번호 39)
rs1931002G TGGATGATTCGAACAACTTGG (서열번호 40)
10분 동안 끓는 물에 반응물(올리고뉴클레오티드 센스 및 올리고뉴클레오티드 안티센스)을 위치시키고, 실온까지 냉각시킴으로써, 상보적 가닥이 어닐링되었다. 결합 반응은 LightShift Chemiluminescent EMSA Kit(Pierce, Rockford, IL, USA)에 의해 세팅되었다. 20fmol의 상보적 DNA의 분취량은, 10 mM Tris, 50 mM KCl, 1 mM DTT, 2.5% 글리세롤, 5 mM MgCl2, 50 ng/μl poly d(I-C), 0.05% NP-40, pH 7.5에서 4 mg의 핵 추출물과 20분 동안 실온에서 인큐베이트되었다. 그 후, 반응물은 8% 비-변성 폴리아크릴아미드 겔상에 로딩되고, 11OV에서 150분 동안 수행되었다. 자유 DNA 및 DNA/단백질 복합체는 모세관 작용에 의해 나일론 N+ 막으로 이동되었다. 결합은 제조사(Pierce, Rockford, IL, USA)의 지시에 따라 검출되었다.
프라이머 서열(전방향 및 역방향) | 좌표계에 따른 위치 | PCR 산물의 크기 |
AAGGGGCAAGAGACCAAAGT (서열번호 41) CACCCTGCCATTTCATAGAAC (서열번호 42) |
132325212-132325194 132324384-132324404 |
831 bp |
ACCAGGGTGATGGTGCTAAA (서열번호 43) AATGACCATGAAAGGGCTTG (서열번호 44) |
132324557-132324538 132323775-132323794 |
783 bp |
TGCCCCCATATGTACAGAAA (서열번호 45) GGGACATTTTGCAAGGGTTA (서열번호 46) |
132323861-132323842 132323018-132323037 |
844 bp |
TTGCTAGAAAAAGGCTGTCAA (서열번호 47) CAGCCCAATATTCCACCAAG (서열번호 48) |
132323290-132323270 132322464-132322483 |
827 bp |
GCCAAGTTTATTTTGGCAGGT (서열번호 49) TTGGTTCTTCTTGATTGTGGTTT (서열번호 50) |
132322614-132322593 132321788-132321810 |
826 bp |
GCAAAGCAACATTGGTTCAA (서열번호 51) GGTATGCTTTGGGAGGCTTA (서열번호 52) |
132321921-132321912 132321088-132321107 |
844 bp |
TCTCAGCCGAAACAAGACTG (서열번호 53) TTTAGCGGGAACGCTTCTTA (서열번호 54) |
132321195-132321176 132320440-132320459 |
756 bp |
ACCGTGAAAGGGCTTTGTAA (서열번호 55) TGCTCAGCTTATTTTTGTCACC (서열번호 56) |
132320556-132320537 132319749-132319770 |
808 bp |
CCCTAACTCTCCCCATCCTC (서열번호 57) ATGTGCAGCTCAAGGAGACA (서열번호 58) |
132319847-132319828 132319044-132319025 |
823 bp |
TTGATTTTCTCTGAGCTCTCACC (서열번호 59) TAGGAATGAGCCTGGTGGTC (서열번호 60) |
132319238-132319216 132318427-132318446 |
812 bp |
GGTGTCCCCAAATCACACAT (서열번호 61) TATGGGCATCTGGACAGTGA (서열번호 62) |
132318639-132318620 132317802-132317821 |
838 bp |
ACGCCCTCTCCTTAACCTTC (서열번호 63) AGCCCCTTTGATTGACAGC (서열번호 64) |
132318031-132318012 132317194-132317212 |
838 bp |
GTTAATTCCTCATTTTACCACGA (서열번호 65) AGTCCCTCGAAGTCTCAAAAA (서열번호66) |
132317353-132317331 132316706-132316726 |
647 bp |
GCACAGAAACTTTTTCTTTCCTG (서열번호 67) AAGGGTAGGGATGTGCAGTG (서열번호 68) |
132316835-132316813 132316211-132316230 |
625 bp |
CAGGCATGAAGATGGTGGTA (서열번호 69) GGTGCAAAGATCGGCTTTAG (서열번호 70) |
132316364-132316345 132315687-132315706 |
679 bp |
TCTTCTTGGCTATTTTTCAACAGA (서열번호 71) GGGGTTCACCTAGGAGCATT (서열번호 72) |
132315803-132315780 132315065-132315084 |
739 bp |
CAAGACAAACCAAATCCAATCC (서열번호 73) TATCCTCTTCGCACCACTCC (서열번호 74) |
132315178-132315157 132314474-132314493 |
706 bp |
GTGGACAGAACAGGGCAAAC (서열번호 75) GCTTACCCGGCTGCAGAG (서열번호 76) |
132314570-132314551 132313934-132313951 |
637 bp |
ACAGCCCCGAGACGACAG (서열번호 77) GCAGCAGCTGGAGAAAGAAA (서열번호 78) |
132314127-132314110 132313593-132313512 |
635 bp |
AAAAAGAAACCGCTCGGACT (서열번호 79) CCAGGCAGTTGGCTCTAATC (서열번호 80) |
132313535-1323135016 132312934-132312953 |
602 bp |
TCAGGGTCGTGATTCTCTCC (서열번호 81) TGGAGATTTTGGGAGTACGG (서열번호 82) |
132313102-132313083 132312357-132312376 |
746 bp |
TCAAACTTCCTCCCCTCAAA (서열번호 83) TGCTCCTAAAGCCACACCTT (서열번호 84) |
132312529-132312510 132311826-132311845 |
704 bp |
GGAAAAGATTCCCACCCAAT (서열번호 85) CCATTTCATGCTTTGAACGA (서열번호 86) |
132311978-1323119459 132311320-132311339 |
659 bp |
TTGTGTGTGTGTGTGTGTGTGT (서열번호 87) AATGCCAAAAGGACCAAGTG (서열번호 88) |
132311497-132311476 132310673-132310692 |
806 bp |
CAGACTTGCAGGCATACACA (서열번호 89) TGGTTTGTGGTGTGGACAGT (서열번호 90) |
132310821-132310802 132309978-132309997 |
844 bp |
CCACATGAGGATAGCTGAGGA (서열번호 91) GCTTTGTTGGAGTGCTAGGC (서열번호 92) |
132310141-132310121 132309348-132309367 |
794 bp |
CCAAATCATCAACCACCGTA (서열번호 93) TTTCTGTAACCTGGCTTATTTCA (서열번호 94) |
132309544-132309525 132308717-132308739 |
828 bp |
TCTGCACCTCCATGTTCATT (서열번호 95) TTTGTAGGGATTTGGCTTCA (서열번호 96) |
132308929-132308910 132308085-132308104 |
845 bp |
ATTGAGTGGGTCAGGGACAA (서열번호 97) CCCTTTTCTTTAAACTCCAGCA (서열번호 98) |
132308323-132308304 132307518-132307539 |
806 bp |
TGGACAGGCAAAGAAAATCC (서열번호 99) TGCAAATAAACAGGCAGAAATG (서열번호 100) |
132307722-132307703 132306889-132306911 |
833 bp |
GCCCTTGCTGAGGAACCTAC (서열번호 101) ACACATTTCTTGCCCCAGAC (서열번호102) |
132307075-132307056 132306230-132306250 |
846 bp |
TCCCCCTACATCTGCCTACA (서열번호 103) AGCCTGTCTTCTGAGGCACT (서열번호 104) |
132306391-132306072 132305563-132305572 |
839 bp |
GGGGGACAGAGAAAGACTCC (서열번호 105) TGGGTCTACATGTCTATTGCTTTG (서열번호 106) |
132305749-132305730 132304957-132304970 |
803 bp |
GGGAATGCCCATATTCATTG (서열번호 107) TGGAAACCCAAGTTCTTCTGA (서열번호 108) |
132305185-132305166 132304372-132304392 |
814 bp |
CCCGCAAAGTTGTTCTTTGT (서열번호 109) CCATGACACAGCCCTCAAG (서열번호 110) |
132304558-132304539 132303384-132303402 |
775 bp |
GCCTCTATCCCACGTTTTGA (서열번호 111) TGTCCTTTGGAGGGACATAGA (서열번호 112) |
132304022-132304003 132303180-132303200 |
843 bp |
TATACACGTGCCATGGTGGT (서열번호 113) TGACTTAATGAATAAGCCTGCTG (서열번호 114) |
132303452-132303433 132302661-132302683 |
792 bp |
GCACCATATAAATGTGAGATTGGA (서열번호 115) AAAAGAAGCTGAATTTGCTTTAAAAT (서열번호 116) |
132302898-132302875 132302086-132302101 |
823 bp |
AGCAGGATACTGACAGGCAAA (서열번호 117) TCATTTAAAAATAAATCCCTCTGGA (서열번호 118) |
132302324-132302304 132301486-132301510 |
839 bp |
TGTTTTCCATTTTTCAATCCAA (서열번호 119) CCAGGGTCCCATTCCTAGTT (서열번호 120) |
132301639-132301618 132300868-132300887 |
772 bp |
GAGGCTTGTGGAGCATTAGC (서열번호 121) AGCATGGGTTTCCATAGCAG (서열번호 122) |
132301074-132301055 132300246-132300265 |
829 bp |
TGTTTGGGATTGAGGTCCTT (서열번호 123) TGTGCAGTTCAAACCCATGT (서열번호 124) |
132300436-132300417 132299625-132299644 |
812 bp |
TGTGGTATTGGGTTGCCATT (서열번호 125) TTCTCCCTACAGGTCCCAGA (서열번호 126) |
132299746-132299727 132298904-132298923 |
843 bp |
다형성 | 프라이머 서열(전방향 및 역방향) | 좌표계에 따른 위치 | PCR 산물의 크기 | 제한효소 | 예상 프로파일 |
rs6926879 | ATGCACTACCACACTAGGCTGA (서열번호 127) AGCAGCATGAGACATCAATCAC (서열번호 128) |
132304175-132304154 132303883-132303862 |
314 bp | BseYI | C/C 유전자형: 164+122+28 bp G/G 유전자형: 192+122 bp |
rs34118837 | ATGCACTACCACACTAGGCTGA (서열번호 129) AGCAGCATGAGACATCAATCAC (서열번호 130) |
132304175-132304154 132303883-132303862 |
314 bp | BseYI | C/C 유전자형: 164+122+28 bp G/G 유전자형: 192+122 bp |
rs1931003 | TGATTCTTGAAATCAAACCTTGAA (서열번호 131) GCTAGTAGGTTCCTCAGCAAGG (서열번호 132) |
132307324-132307301 132307073-132307052 |
273 bp | NlaIII | G/G 유전자형: 273 bp A/A 유전자형: 170+103 bp |
rs12191459 | ATGGCAATGCACACTTTCAC (서열번호 133) GCTTTGTTGGAGTGCTAGGC (서열번호 134) |
132309590-132309571 132309367-132309348 |
243 bp | BveI | C/C 유전자형: 150+93 bp T/T 유전자형: 243 bp |
rs12206863 | CTTGCAGGCATACACACCAC (서열번호 135) AACGGCCAGAGAGGTACAAA (서열번호 136) |
132310798-132310817 132310656-132310637 |
162 bp | BsmAI | A/A 유전자형: 107+55 bp C/C 유전자형: 88+55+19 bp |
rs7768619 | TGAGAGCCACTGAAGAATGG (서열번호 137) TAGGTGGAGCCTAGGGGACT (서열번호 138) |
132319120-132319101 132318916-132318897 |
224 bp | KspAI | T/T 유전자형: 224 bp C/C 유전자형: 127+97 bp |
rs10872386 | GGGGACATTTTCCAGACACA (서열번호 139) TGTCATCAAATTGCCACAGG (서열번호 140) |
132323619-132323600 132323410-132323391 |
229 bp | BanI | C/C 유전자형:102+74+63 bp T/T 유전자형:165+74 bp |
rs2327184 | AGCGAGACTCCGTCTCAAAA (서열번호 141) CTTTGCTTTCCGCTGTGATT (서열번호 142) |
132324882-132324863 132324677-132324658 |
225 bp | BsuRI | A/A 유전자형: 225 bp G/G 유전자형: 164+61 bp |
실시예 1
2개의 중국인 개체군의 샘플에서 중증 간섬유증(HF)과 CTGF 유전자자리의 SNP 사이의 연관
2개의 독립적인 중국인 샘플(S. japonicum가 풍토적인 지역에 거주하고 있는 어민들과 농민들)에 대한 데이터가 제공된다. 질환 표현형은 상기 '재료 및 방법' 항목에 기재되어 있는 후기 간섬유증(어민들), 또는 복수 및 사전 출혈(농민들)을 포함하였다.
유전자형과 간섬유증(HF) 표현형(상기 '재료 및 방법' 항목에 기재되어 있음) 사이의 연관은 첫번째로 일변량 분석을 사용하고(표 4의 상단부) 두번째로 다변량 분석을 사용하여 테스트되었으며(표 4의 하단부), 이는 SNP 또는 변경 rs12526196, rs1931002, rs3037970 및 rs9402373을 포함하며, 동일한 빈(bin)으로부터 SNP를 다시 테스트하였을 때 가장 강한 연관성을 보여주었다. 빈(bin)은 상관관계(r2>0.5) 군이며, 유전자형은 악화(aggravating)하는 유전자형이며, OR = Odd ratio, CI= OR의 신뢰구간이다.
어민 샘플: n=300, 99개의 케이스 및 201개의 대조군; 공변인: 어업 년수, 어선에서 출생, 성별, 프라지콴텔 치료 횟수. 중국인 농민 샘플: n=294, 113개의 대조군 및 181개의 케이스; 공변인 출생장소는 풍토적이거나 풍토적이 아니며, 치료되거나 또는 활성인 HBV 감염이다(p=0.05, OR=2.38).
어민들 개체군에서 섬유증 발달에 영향을 미치는 다양한 인자들의 분석은 성별, 오염수에 대한 노출, 및 프라지콴텔에 의한 항-주혈흡충 치료가 섬유증의 위험과 유의적으로 연관된다는 점을 보여주었다. 여러 개의 공변인들의 테스트는 "어업 년수"와 "어선에서의 출생"이 노출을 측정하는데 가장 좋은 공변인이라는 점을 보여주었다. "치료" 공변인은 지난 20년간 프라지콴텔 치료의 횟수이다.
시험 샘플
중국인 어민들은 광범위한 시험 동안 어선에서 모집된 반면(어민 샘플), 농민들(농민 샘플)은 병원 기록(케이스)으로부터 그들의 농장 또는 마을(대조군)로부터 직접 모집되었다. 어민들은 어선 및/또는 작은 섬에서 생활하고 있으며, 수년 전부터 어업을 하고 있다. 이들은 감염에 대해 대부분 노출되었던 반면, 대부분의 농민들은 오래 전에 감염되었는데, 그 이유는 들판의 기생충 전염이 15 내지 20년 전에 차단되었기 때문이다. 어민들과 농민들은 다른 지리학적 구역에서 유래한다. 대부분의 어민들은 강소성 지방 출신이며, 일부 어민들은 후베이성과 장시성 출신이다. 농민들은 여러 세대 동안 후난성 지방에서 거주해오고 있으며, 일부 농민들은 산악 지역 출신이었다.
간섬유증(HF)은 문헌 [Arnaud et al, 2008]에서 지시된 바와 같이 수정된 WHO 가이드라인에 따라 평가되었다. 어민 샘플은 300명의 대상체(201명의 대조군, 99명의 케이스)를 포함하였다. 케이스는 중증의 CentF(central fibrosis: CLH, D, E 또는 F) 또는 중증의 ParF(parenchymal fibrosis: GNH 또는 GW) 또는 CLM과 GNM 모두를 나타내었다. 대조군은 더 경증의 질환을 나타내었다: CentFib ≤ CLL 및 ParF ≤ GNL. 어민들에게서 간섬유증을 발생시킬 수 있는 공변인은 노출과 프라지콴텔 치료 횟수였다. 노출은 2개의 공변인, 즉 어업 년수 및 어선에서의 출생을 포함하였다. 중국인 농민 샘플은 294명의 대상체(113명의 대조군 및 181명의 케이스)를 포함하였다. 케이스는 중증 HF(어민들 케이스에 대해 규정된 바와 같음) 및 복수 및/또는 정맥류성 정맥을 나타내었다. HBV 및 HCV 감염은 이 샘플에서 평가될 수 있었으며; 3개의 대상체는 HCV로 감염되고 포함되지 않은 반면, > 60%는 활성 또는 치료된 HBV 감염을 가졌다. HBV 감염은 분석에서 유의적인 공변인이었으며(p<0.03), 노출과 치료 횟수는 중국인 농민들에게서 정확하게 평가될 수 없었다.
본 발명자는 유전자형 분석을 위해 여러 개의 SNP, 빈 당 2개의 SNP와 빈의 내부 또는 외부의 임의의 SNP를 선택하였으며, 이는 인 실리코(in silico) 분석에 의해 결정된 바와 같은 기능적 효과를 가질 수 있었다(도 1 참조). 그 후, 이러한 SNP는 450명의 개체의 중국인 어민 집단의 더 큰 집단에서 유전자형 분석되었다.
섬유증과 긍정적 또는 시사적 연관을 나타내는 SNP는 표 4에 기재되어 있다. 이러한 데이터에 적용된 보정률은 < 20이다('재료 및 방법' 항목 참조). 치료는 모든 대상체들에 대해 정확하게 기록될 수 없었기 때문에, 본 발명자가 노출을 알고 있는 450명의 대상체와 노출과 치료 모두를 알고 있는 380명의 대상체에 대해 수득된 데이터를 개별적으로 나타내었다.
우선, 본 발명자는 S. japonicum가 매우 풍토적인 중국 중부의 둥팅호의 어민들에게서 HF를 조사하였다. HF의 발달에 영향을 미친 공변인은 성별, 노출 및 항-주혈흡충 치료였다. 이러한 공변인을 사용함으로써, 201개의 대조군과 99개의 케이스에 대해 CCN2 및 IFNGR1에서 SNP(유전자 당 3개의 SNP)가 HF와 연관되었는지 여부를 테스트하였다. CCN2에 가까운 SNP rs9399005는 HF와 연관을 나타내었다(p=0.02). CCN2(3.2kb) 및 개시 코돈의 업스트림에서 15.3 kb 및 3'UTR 영역의 14.1 kb의 시퀀싱은 61개의 SNP를 밝혔으며(도 1), 그 중에서 50개는 이전에 공지되었다. MAF>20%인 53개의 SNP는 7개의 상관관계(r2=0.5) 빈(I 내지 VII)으로 그룹지어졌다(도 1). 본 발명자는 추가의 유전자형 분석을 위해 22 SNP, 빈 당 2개 이상의 SNP 및 빈 외부의 SNP(n=4)를 선택하였으며, 이는 인 실리코 분석에 의해 평가된 기능적 효과를 가질 수 있었다. HF와 연관된 SNP(표 4)는, 빈 II에서 SNP rs12527705(p=0.02, OR=2.3) 및 SNP rs12526196(p=0.02, OR=2.2)이었으며, 빈 III에서 SNP rs9399005(p=0.02, OR=2.2), SNP rs6918698(p=0.02, OR=2) 및 D/I rs3037970(p=0.003, OR=2.6)이었으며, 빈 IV에서 SNP rs1931002(p=0.004, OR=2.3) 및 rs21551532(p=0.02, OR=1.98)였으며, 빈 VI에서 SNP rs9402373(p=0.015, OR=2)이었다. 분석은 성별(p<0.001), 노출(어업 년수: p<0.001, 어선에서의 출생: p<0.01) 및 치료 횟수(p<0.01)에 대해 조정되었다. 결실/삽입(D/I) rs3037970은 2개의 SNP를 동시에 테스트하는 다변량 분석에서 rs6918698을 제외하였다. 마찬가지로, SNP rs1931002는 SNP rs21551532를 제외하였으며; SNP rs1256196은 SNP rs12527705 및 SNP rs9399005를 제외하였다. 이는 SNP rs12526196, rs30337970, rs1931002, rs9402373이 HF와 가장 강한 연관을 갖는다는 점을 나타내었다. 4개의 모든 SNP가 동일한 회귀 모델에서 테스트되었을 때(표 4의 하단부), SNP rs12526196(p=0.007, OR=3), rs9402373(p=0.002, OR=2.8) 및 rs1931002(p=0.002, OR=2.8)는 HF와 독립적인 연관을 나타내었다. 53.9%의 대조군과 67.5%의 케이스에 존재하는 단상형 1002C, 6196T는 HF와 연관되었다(p<0.005). 또한, 본 발명자는 간문맥항진증의 증거로 후기 HF와 연관된 표현형을 테스트하였다. 본 발명자는 (154개의 대조군과 151개의 케이스) SNP rs9402373(p=0.005, OR=2.6) 및 D/I rs3037970(p=0.05, OR=2)이 상기 표현형과 연관되었으며, SNP rs1256196은 더 중증의 질환 표현형과의 연관 경향을 나타낸다는 점(p=0.12)을 발견하였다. 성별(p=0.001)은 상기 모델에 공변인으로서 들어갔다. 이는 rs9402373과 D/I rs3037970 모두가 중증 섬유증에 더 중요하게 기여할 수 있다는 점을 보여주었다.
본 발명자는 들판에서 일하면서 S. japonicum에 감염되었으며 지방 병원의 기록으로부터 모집된 중국인 농민들의 부가적인 독립적 샘플에서 상기 결과들의 반복을 구하였다. 어민 샘플에서 HF와의 연관의 몇몇 증거를 보여준 SNP는 농민 샘플(113개의 대조군, 181개의 케이스)에서 유전자형 분석되었다. 일변량 분석은 중증 HF와 SNP rs9402373(p=0.003, OR=2.23) 및 SNP rs1256196(p=0.02, OR=1.85) 사이의 연관을 보여주었다. 다른 SNP는 연관되지 않았다(p>0.1). 다변량 분석은 SNP rs9402373(p=0.03, OR=2.26) 및 rs1256196(p=0.02, OR=1.88) 모두가 중증 섬유증과 독립적으로 연관된다는 점을 나타내었다. 공변인은 출생장소(풍토적 또는 풍토적이 아님, p=0.03) 및 HVB 감염(p=0.05)이었다.
실시예 2
시스토조마 만소니
로 감염된 수단인과 브라질인의 중증 간섬유증(HF)과 CTGF 유전자자리의 SNP 사이의 연관
HF를 야기하는 2개의 주요한 주혈흡충 균주는 아시아의 S. japonicum, 및 아프리카와 남아메리카의 S. mansoni이다. 본 발명자는 수단과 브라질의 S. mansoni 풍토 지역에서 HF가 CTGF 대립유전자의 변이체에 의해 또한 영향을 받는지 여부를 조사하였다. 중국인 어민들에서 HF와 연관된 CTGF 다형성(표 4)은 2개의 샘플 모두에서 유전자형 분석되었다. 표현형은 브라질인에게서 유의적인 이차 문맥 분지 비후 또는 수단인에게서 간문맥항진증과 연관된 중증 HF였으며, 여기서 브라질인은 수단인보다 훨씬 덜 영향을 받았는데, 그 이유는 수단인 샘플보다 브라질인 샘플에서 전염이 더 낮았기 때문이다.
유전자형과 HF 표현형(상기 '재료 및 방법' 항목에 기재되어 있음) 사이의 연관은 첫번째로 일변량 분석을 사용하고(표 5의 상단부) 두번째로 다변량 분석을 사용하여 테스트되었으며(표 5의 하단부), 이는 SNP rs12526196, rs12527705 및 rs9402373을 포함하였다. 유전자형은 악화하는 유전자형이며, OR= Odd ratio, CI= OR의 신뢰구간이다.
수단인 농민들: 314: 219개의 대조군 및 95개의 케이스. 브라질인 133: 60개의 케이스 및 73개의 대조군.
시험 샘플
수단인 샘플(314개의 대상체, 95개의 케이스 및 219개의 대조군)은 수단의 와드 메다니 지역의 마을에 거주하는 농민들 사이에서 모집되었다(Dessein et al, 1999). 중증 표현형은 문헌 [Dessein et al., 1999]에서와 같이 간문맥항진증의 증거를 갖는 HF(등급 ≥ C)와 연관되었다. 모든 대상체들은 대부분 S. mansoni에 의한 감염에 노출되었으며, 프라지콴텔 치료를 거의 받지 못하거나 전혀 받지 못하였다. 그러나, 노출과 치료 횟수는 이 샘플에서 정확하게 평가될 수 없었다.
브라질인 샘플(133개의 대상체, 73개의 대조군 및 60개의 케이스)은 S. mansoni 감염 달팽이가 살고 있는 강과 자주 접촉하는 성인 대상체 중에서 북동부 브라질의 마을에서 모집되었다. 10대에서 주혈흡충 알 분비에 의해 평가될 때, 감염은 중국인과 수단인에 비해 브라질인에게서 훨씬 덜 하였다. 간문맥항진증을 갖는 중증 HF는 개체군의 2% 미만에서 관찰되었다. 이차 문맥 분지의 문맥주위의 비후의 명백한 증거를 보이는 모든 대상체들이 케이스인 반면, 강과 유사하게 접촉한 다른 대상체들은 대조군이었다.
본 발명자는 S. mansoni로 감염된 브라질인에게서 간섬유증이 CTGF 대립유전자의 변이체에 의해 또한 영향을 받는지 여부를 조사하였다. 브라질인 집단은 이 시험을 위해 모집되었으며, 이전에 유전자형 분석이 되지 않았다. 본 발명자는 중국인 어민들에게서 섬유증과 분명하고 시사적인 연관을 나타내는 CTGF 다형성에 대해 유전자형 분석을 하였다. 이러한 연관 시험에서, 케이스는 간문맥의 이차 분지의 벽을 비후시키는 증거를 갖는 대상체였다. 유일한 교락 변수는 환자의 연령이었다. 수년 동안 감염에 대한 노출의 증거를 갖는 모든 대상체들이 선택되었다.
다음으로, 본 발명자는 수단과 브라질에서 풍토 대상체에서 S. mansoni에 의해 야기된 HF가 CTGF 대립유전자의 변이체에 의해 또한 영향을 받았는지 여부를 조사하였다. 중국인 어민들에게서 HF와 연관된 CTGF 다형성은 2개의 샘플 모두에서 유전자형 분석되었다. 표현형은 브라질인에게서 유의적인 이차 문맥 분지 비후 또는 수단인에게서 간문맥항진증과 연관된 중증 HF였으며, 여기서 브라질인은 수단인보다 훨씬 덜 영향을 받았다.
결론:
수단인(219개의 대조군, 95개의 케이스)에게서 일변량 분석(표 5의 좌측)은 SNP rs9402373(p=0.02, OR=2.7), rs1256196(p=0.044, OR=3.2) 및 rs12527705(p=0.05, OR=3)가 중증 HF와 연관된다는 점을 보여주었다. 악화하는 유전자형은 수단인과 중국인에서와 동일하다(표 4 및 5). 다변량 분석은 SNP rs9402373(p=0.03, OR=2.7) 및 SNP rs1256196(p=0.03, OR=3.5)이 추가적인 공변인 없이 HF와 독립적으로 연관된다는 점을 나타내었다.
브라질인(73개의 대조군, 60개의 케이스)의 유전자형 분석 데이터의 일변량 분석(표 5의 우측)은 추가적인 공변인 없이 HF와 SNP rs9402373(p=0.02, OR=2.57) 및 SNP rs6918698(p=0.008, OR=3) 사이의 연관을 보여주었다. 2개의 SNP 모두에 대해 질환과 연관되는 유전자형은 중국인과 수단인에서와 동일하다(표 4 및 5). 다변량 분석은 SNP rs9402373 및 rs6918698이 브라질인에게서 HF와 독립적으로 연관된다는 점을 나타내었다(p<0.001, OR>4).
인 실리코(in silico) 분석은 대립유전자의 변이체 SNP rs9402373 및 rs12526196이 핵 인자에 다르게 결합할 수 있다는 점을 시사하였다. 본 발명자는 이러한 점을 EMSA에 의해 입증하였다: rs9402373C 대립유전자는 G 대립유전자에 의해 결합되지 않은 핵 인자에 결합함(도 2A). 이러한 결합은 특이적 비오티닐화되지 않은 프로브와 경쟁하였다(도 2B). 또한, EMSA는 rs12526196T 대립유전자에 대해 핵 인자의 결합 친화력이 더 크다는 점을 보여주었다(도 2A). EMSA는 rs12527705 및 rs1931002 다형성에 대한 대립유전자 특이적 결합을 나타내지 않았다(도 2A).
이어서, SNP rs9402373은 테스트된 4개의 샘플 모두에서 HF와 연관되었다. 이러한 연관은, 엄한 섬유증 표현형 또는 더 중증의 표현형(HF + 문맥혈 고혈압의 증거)을 사용하여, 중국인과 수단인에게서 얻어졌다. 또한, SNP rs1256196은 중국인과 수단인에게서 HF와 독립적으로 연관되었다. 본 발명의 EMSA 데이터는 SNP rs1256196 및 SNP rs9402373의 대립유전자의 변이체가 핵 인자에 다르게 결합함을 나타내고, 이는 유전자 전사의 규칙성 또는 전사물의 안정성에 영향을 미칠 수 있다는 것을 시사한다.
HBV 감염은 중국인 농민들의 분석에서 유의적인 공변인이며, 이는 HBV가 중증 질환에 유의적으로 기여한다는 것을 나타내었다. 또한, 이는 SNP rs1256196 및 SNP rs9402373이 HBV에 의해 야기된 HF를 조절할 수도 있다는 점을 시사한다.
결론적으로, 본 시험은 섬유증과 다형성의 연관을 보여주며, 새로운 치료적 표적을 나타내는 질환 진행에서 가장 중요한 단계를 동정한다. 본 시험은 또한 HF 진행의 중요한 마커를 제공한다.
실시예 3: HCV 감염 대상체에서 간섬유증(HF)과 CTGF 유전자자리의 SNP 사이의 연관
HCV로 감염된 프랑스인 대상체에서 CTGF 유전적 변이체의 분석.
실시예 1에는 중국인 개체군의 샘플에서 CTGF 인코딩 유전자의 SNP 상관관계 빈(r2>0.8)이 기재되어 있다. 이는 3' 및 5' 플랭킹 영역의 10Kb와 전체 유전자에 대해 규정되었다. 마이너(minor) 대립유전자 빈도가 > 20%인 SNP만 분석되었다. 7개의 빈 중에서 4개(II, III, IV 및 VI 군)가 시스토조마 자포니쿰에 감염된 중국인 어민들에게서 주혈흡충 알에 의해 야기된 간섬유증과의 일부 연관을 보여주었다. 실시예 3에서, 본 발명자는 상기 4개의 빈 각각에서 2개의 SNP, 및 HCV로 감염된 프랑스인 샘플에서 부가적 SNP rs9399005(이는 주혈흡충성 섬유증과 시사적인 연관을 보여주었음)를 유전자형 분석하였으며, 이들이 후기 간섬유증과 연관되는지 여부를 결정하였다. 본 발명자는 빈 III 및 VI에서 연관에 대한 증거를 발견하였으나, 빈 II 및 IV에서는 발견하지 못하였다. 빈 IV에서 SNP rs6918698(p=0.03) 및 SNP rs3037970(p=0.04)이 간섬유증과 연관되었다. SNP rs6918698의 CG 및 GG 유전자형은 질환 악화와 연관되었다(OR=2.1, CI=1.1-4.0).
오직 빈 VI이 프랑스인 샘플에서도 간섬유증과 연관된(p=0.007) SNP rs9402373을 포함한다. 질환은 CC 유전자형에 의해 악화되었다(OR = 2.54; 1.3-4.96). 흥미롭게도, 대상체 동형접합 C/C는 동형접합 GG에 비해 중증 간섬유증의 위험의 평균 4배 증가를 나타내었다(OR=4.1 CI=1.1-14). SNP rs6918698 및 SNP rs9402373을 포함한 다변량 로지스틱 회귀 분석은 후자가 간섬유증과 가장 강하게 연관된다는 점을 나타내었다. SNP rs9402373의 존재에도 불구하고, SNP rs6918698은 간 질환과의 연관에 대한 경향을 여전히 보여주었으며, 이는 SNP rs9402373이 질환과 SNP rs6918698의 완전 연관을 설명할 수 없다는 점을 시사한다. 따라서, 본 발명자는 2개의 SNP 모두가 섬유증과 독립적으로 연관된다는 결론을 도출하였다.
CTGF 유전적 변이체는 HCV로 감염된 브라질인에게서 간섬유증과 또한 연관된다.
이어서, HCV로 감염된 브라질인에게서 동일한 4개의 빈으로부터 SNP를 테스트함으로써, 본 발명자는 전술한 발견의 확인을 구하였다. 본 발명자는 SNP rs6918698(p=0.0004)이 간섬유증과 명백하게 연관된다는 점을 발견하였다. SNP rs3037970은 연관에 대한 경향(p=0.07)을 보여주었으며, SNP rs6918698은 SNP rs3037970 연관을 설명하였다. SNP rs6918698 악화 유전자형은 G/G였다(OR 2.94; 1.5-7.7). 프랑스인 샘플에서와 같이, 본 발명자는 빈 VI의 SNP rs9402373이 브라질인 샘플에서 간섬유증과 강하게(p=0.003) 연관된다는 점(OR= 2.94, 1.45-5.97)을 관찰하였다. 특히, 이 샘플에서도 프랑스인 샘플에서와 같이, C/C는 질환을 악화시켰다. G/G 유전자형을 갖는 대상체는 소수이기 때문에, 본 발명자는 동형접합 대상체 사이에서 중증 섬유증의 위험을 비교할 수 없었다. 마지막으로, 본 발명자는 또한 간섬유증과 SNP rs9399005의 연관에 대한 경향(p=0.06)을 보여주었다.
로지스틱 회귀 분석은 SNP rs9402373(p=0.029)과 SNP rs6918698(p=0.03) 모두가 비슷한 상대적 위험도로 간섬유증에 독립적으로 기여하였다는 점(OR= 2.4-2.5)을 보여주고, 섬유증과 SNP rs9399005의 연관이 2개의 다른 SNP의 존재하에서 상실되었다는 점을 보여주었으며, 이는 간섬유증과 이 SNP의 연관이 SNP rs9402373 및 SNP rs6918698과 이의 상관관계에 의해 전적으로 설명된다는 점을 시사한다. 그러나, SNP rs9399005가 또한 간섬유증과 독립적으로 연관될 수 있다는 점이 완전히 배제될 수는 없다.
이어서, 본 발명자는 HCV로 감염된 프랑스인과 브라질인에게서 SNP rs9402373에 의해 수득된 데이터에 대해 Meta 분석을 수행하였다.
섬유증 연관 유전자형이 프랑스인(G/G + C/G)과 브라질인(G/G)에게서 서로 다르기 때문에, 상기 분석은 SNP rs6918698에 의해 수행되지 않았다. 본 발명자는 SNP rs9402373 CC 유전자형이 HCV에 의해 야기된 간섬유증과 연관된다는 점(p=0.00005, OR= 2.72; 1.67-4.43)을 발견하였다.
SNP rs9402373의 상기 동일한 CC 유전자형의 연관이 앞선 실시예들에서 간섬유증에 대해 보여졌기 때문에, 본 발명자는 또한 HCV 유도 HF(2개의 시험) 및 주혈흡충 유도 HF(4개의 시험)와 이 SNP의 연관을 테스트하는 시험의 Meta 분석을 수행하였다. 상기 Meta 분석의 결과는 도 3에 나타나 있으며, 이는 SNP rs9402373의 CC가 유전적 배경이 현저하게 다른 개체군들(중국인, 수단인, 브라질인 및 프랑스인)에서 다른 병원균 HCV(S.mansoni 및 S.japonicum)에 의해 야기된 중증 간섬유증(OR= 2.47; 1.8-3.25)과 강하게 연관된다는 점(p<10-9)을 보여준다.
참조문헌
SEQUENCE LISTING
<110> UNIVERSITE DE LA MEDITERRANEE
INSERM
<120> Fibrosis susceptibility gene and uses thereof
<130> IP20111818/FR
<160> 142
<170> KopatentIn 1.71
<210> 1
<211> 701
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (501)..(501)
<223> w=A/T
<400> 1
cagatctcag ttcatctctt tacgattggg agagtctgga agaaaaagat ctatctatat 60
taatagagat tctttagagg tgcaaatttt ccctcacaaa gaacaacttt gcggggccat 120
ttcaaaatat ggcaaagaaa catgttttgg ggaaatgcac tttttaattg atgtatattg 180
ttccattata taaatattct atactctatc aatttttctg tttacagaat tcagattttt 240
gctttcagtt tttggatgga tgaaactgct ttgagaattt tgtatgtctt ttgctcactt 300
ctcttgaata tataccaaag actaaaagtt attgtagtta tctaaattat acatgttaac 360
ttgctgacaa aaattgtgtt agaatttgtt gacctaatgt aaaagtttta tattcttgcg 420
atgcaaattc taattaatca atggtgctcc tcatttctta ctaactcttc tttgactctc 480
ttttaaacat gtaatataga wgatgggtct acatgtctat tgctttgaat cctatattta 540
ggtttggaat ctgacagtat tttaagaata tattttactt tgtttatttt gttcttagtc 600
ttagaaacag tctatatata attagtatga ttcatgaggt aaggaatagt tatacagagg 660
aaaatcgttc accattttat ttatggtata gagaaataga g 701
<210> 2
<211> 501
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (251)..(251)
<223> Y=C/T
<400> 2
ctctctttta aacatgtaat atagaagatg ggtctacatg tctattgctt tgaatcctat 60
atttaggttt ggaatctgac agtattttaa gaatatattt tactttgttt attttgttct 120
tagtcttaga aacagtctat atataattag tatgattcat gaggtaagga atagttatac 180
agaggaaaat cgttcaccat tttatttatg gtatagagaa atagagtaaa agacaacact 240
gaatatacaa ygaatatggg cattccctag agattcgatg tgtgttgcat gtactcctag 300
gcacgtggct aattaagata tagtggtttg aatagctaag ttatttactt atttatgtat 360
tgtgtattgt ttcatctaaa tgaaaatcat aaaatacttg aacacttttt gacatattcc 420
ttgctgtttt tttaatgaga tggaaatttg ttttttaaaa aatctctttc ttataatgta 480
tgttcatttc aaaaaatttg a 501
<210> 3
<211> 401
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (201)..(201)
<223> Y=C/T
<400> 3
aacggaatta tacaaaacaa gacttatgaa atagctccat ttaaatgagg atttcatttc 60
ataattttca gatttaacag taaggtaatg aagttcagaa acagacctag agcataaaat 120
ttttaaaaaa tgtaaacatt ttccacgtgc aaggcacata gactagtttg tgatgtgaag 180
ggttggaaac taacctataa yggccagaga ggtacaaatg ccaaaaggac caagtgtaat 240
acaacagggt taatggagac tgaagtaatc tagagagaat tgaatttaaa gtgtctataa 300
agttctgtga agataacaaa aaaaatggct gtatagtcaa tgtggtgtgt atgcctgcaa 360
gtctgtgata cttgattcag tgtgaagtat gtttacataa a 401
<210> 4
<211> 601
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (301)..(301)
<223> S=C/G
<400> 4
ccccccaacc cttagcaatg atttgcgttt tagaggctat aggctcttga aactctccaa 60
agagtagaaa aggagtgagt tgcttttaac catttgaaat cctcaagatg cctacctgta 120
aaaccctgaa ttctatattt gagatttgat catttgtcac ttgaggtaac ggttttggga 180
caagaaagag aacaaagacg cgtgtgactc aggatgcagt ctcctggggc agatttccaa 240
aactcttgct tagttttctc ttaatatatg taggagtttt atataggcaa ggacaaggga 300
sgagtggcca tcaatgtttc cagaaaaagg gatccattgt tctatcagag caaatgattc 360
tgtgttgggt aggtaggggc tctgggtgtc agggtgggaa cactgggatg caaagggggt 420
tcacctagga gcatttaaac acagcttcac tagggtcttt gagaaatgag tgcattttct 480
tatattaaaa cctataatct tcaaatgtgg attggatttg gtttgtcttg ttaaaataag 540
aagtctgatt ccattacaag agcagtgtac cctgttgtat ctggatataa actaagattg 600
a 601
<210> 5
<211> 985
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (490)..(490)
<223> N=-/TAAAA
<400> 5
gtactgggtt atagttagat ggcctaggtt gtattcttgg aactgccttt cgcagatctc 60
agggaagtca cacgtaggag ccatattccc atttctgttt aaaaaatgaa agtaatcata 120
atttttttaa tttaataggg ttcagtgagg gctgagtaga tgaaaattcc agggaattgg 180
tgctttattt ttttcagatt ttcttgattt tttttcaatc tctgtgtata ataagtatat 240
taccattctg ctctgttgtt aaaaatgtca aaagaaagaa tttggtttta ctataaaatt 300
ctcatagtcc ctcgaagtct caaaaaaatc tatagtcagt tccaaataga tgattttaat 360
gttgcttaag aggaaataag catattgaaa tatatagaac atatgaaatc tcaggaaaga 420
aaaagtttct gtgcattatc aggttagatt gaggctttat gatcaaaact ctttttgaag 480
gagttaaaan gactattatt aagagagtga cacagagaca gacagacaca tacatgcaca 540
cacacccaga gagagagaga atgagagaag acacccaaga cattcacaga ctcagaagta 600
tgtttttatt gtgatatgga ccatcaaatg ccaggaaact caaagggaaa ggctgatact 660
ccatccataa ttcatgccat gggatctgaa ttcttgcact attatcaatg actcagcaaa 720
tgtttgtgtg tgcctgggcg gtaaagtggg aaatagtggc ttcttataac ttcatccaac 780
tttgacttac cccagcccct ttgattgaca gcaggtcaga gttgggagaa aaagatcttt 840
gaatttgtgt gcaaaatggt taagatgcac taattttgac ttgtaagcaa gtatttatct 900
agcaaatgct ttttagagag cattttttcc tcgtggtaaa atgaggaatt aactaagctg 960
gccactgagt cctgtttacc aagct 985
<210> 6
<211> 586
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (228)..(228)
<223> R=A/G
<400> 6
aaattaaaca atgcattagt tgacttttac ttcaaatctg atgatgtcag gattttaaat 60
agaatgtggt ttttcttcat atgtggtgaa agttctgact tagaagataa gataccttct 120
caaaaagcct tatccaggtg ctcagatttt aatatatgat tcccataggc atggttattt 180
aaagatttac acacaggaaa atagtttaga aactctttgg atgattcraa caacttggtt 240
tttagcattc tagaacatac tggctaccaa gtttgctttt aatttgaaaa cttgtcacca 300
tcatggtagc acagttcaca ttacaaaatg aaatgaaaga aaactgtcaa cccaaatata 360
tgtaaagtgt taaagtctgt agcatcacat taagtaaaat accaccttgg tttccaagaa 420
atacaaatct aaagaaaatg tgatggacac aagcaatcat aattttttgg ttgtttcttt 480
atcatttgca taccatattc ttattagtga taagttacac atttttcact gaagaaagga 540
agactgttag gaactcccta actctcccca tcctccacaa atcaat 586
<210> 7
<211> 501
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (251)..(251)
<223> Y=C/G
<400> 7
tttgacattt ttaacaacag agcagaatgg taatatactt attatacaca gagattgaaa 60
aaaaatcaag aaaatctgaa aaaaataaag caccaattcc ctggaatttt catctactca 120
gccctcactg aaccctatta aattaaaaaa attatgatta ctttcatttt ttaaacagaa 180
atgggaatat ggctcctacg tgtgacttcc ctgagatctg cgaaaggcag ttccaagaat 240
acaacctagg ycatctaact ataacccagt acaacaattt atcccctcca tgaatgagtc 300
tccctgctgc aggcatgaag atggtggtag ctttcagact ctcctgagga ttcagaaatt 360
ccccaaccct tctcccacct acctcactct gcaagctagg agagctcacc accaagccca 420
catcccacct taggtgagac tcgcactgca catccctacc cttccccagc caccacacct 480
ttccaaccat tagaggtaga t 501
<210> 8
<211> 817
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (317)..(317)
<223> S=C/G
<400> 8
cccatcattc atccctggaa atgtgctccc acctctagcc aagaggcctg aggtcccttc 60
tcacaacttc aaactccctg gaataccatt aggtggagcc taggggactg gctaggaggt 120
gaaggtgtga gctccatacc tgccatttgc ttgccagtga cctcagggaa gacacctact 180
ctctctgagc ctgaaatttc ccacctgttc acagttaatg tgcagctcaa ggagacaata 240
tttatgaaag cactttcata aaggtattag agttttaaaa ttgcccttct cttccattct 300
tcagtggctc tcaaaastaa gcccaactca gattgactgt aaaagcctgt cacagtttga 360
ttttataaca gtgtccagct ctgcatgggt tttagagtgt taaaactagg tgagagctca 420
gagaaaatca aatcctacct cttatttatt tatttatttt attagattag atattcagga 480
ttgatagaga catttaacaa atgaaaactt tttttctttt tgaaataggg tctggctctg 540
tctcccaggg tggaatgtag tgccatgatc ttggctcact gcaacctctg cctcctgggc 600
tcaagtgatc ttcctgcctc agcctcccaa gtagctggga tagctgggac tacaggtgtg 660
caccaccata tccagctaat taaaagaatt tttttttttt tttttgtaga gatggggttt 720
tgccatgttg cccaggctgg tctcgaactc ctgagctcaa gagatcagcc catctcagcc 780
tcccaaagtg ctgggattac aggcgtaagc ccctgcg 817
<210> 9
<211> 601
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (301)..(301)
<223> R=A/G
<400> 9
ataattgtat cattcactga taagctaccc ttagggataa atatcatgac agagtctggg 60
acaaaccatc agcactgaag caatgtctac tatcaacata ggtttttcac gagtatcccc 120
taataaacat gtcctgccat gttattgata tttattttat gaacttgcct taactgaaaa 180
tgcactttcc tcaaactgaa tatgctttgc ctttcaggtt tacagctttc tccctctctc 240
ctttaaccat ggaaggattt gatttgaatc ataactagtt tcatgttgtt aatggaatgc 300
ratttgtcat aactacacat ggcagagaga gagggttgtc taggaatggt ggggttatga 360
tgagggaatt ttcttattga cctgcacatg tgtgtgaaag ttaacaacta caggattaca 420
tttcatataa ccattgactt gctcatgtct ggaaataata tcactattaa gctatttctc 480
atatacagat gataaaaact tattttgtcc aattgaatct tttgtggcat tttcatcatt 540
tctaacgtct ctatgttggt tcttcttgat tgtggttttc cctgctgttt ccgtatttga 600
c 601
<210> 10
<211> 1001
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (501)..(501)
<223> R=A/G
<400> 10
tgagaggcta tgagtggggt cagctttacc caaagtacat gggctgaaac ttgggggaat 60
aatccaccag agcaaagatc agcaattttt tttcttgaaa agggccccat agtaaatatt 120
tttagccttt gtgggctata cagtctgtca ctcaattctg ccactgtagc tcaaaagcag 180
ccatggatac tacatttttt taaaaaaggg catgaccgtg taccaagaaa actttgttta 240
caaaatcaga gagcaggcca gattcagatg acaggccaga gtttgccaac ccctgcacta 300
gagcgagatt aagtacagtt atcagactgg aagtcaggct ataaaaataa gcaacagatg 360
tccaccacat gcatagaata atatagatat ccctgcttct ctgggtcttt agcttttctc 420
tctctttgta ataagagtca taacagatga ctttaggagg ctctttttct tccaaagttc 480
tcctgacctc aaattaaaat rgtctactga gagtccaggt ggtggctttt gcaaatgctt 540
gggatccagg aggaaaggtg acagccttca tggtagcaag cctatagaca gtagcagccc 600
cagaatcaaa taatttgctt ctagatataa cactttcaca tgctaaaata taaaacctct 660
ctcctcagaa aaactaatct acttcttccc tagtctttcc aatgccagat aacagcacca 720
cagtttgtcc attcatttag gcaaaaagct ggggtgatat actcattttc ctgttaatat 780
ccctcagcca acctatcagc aagtcccatg tgcagaatat gcactgaatc tgaccactcc 840
atctacgtcc accaacacag ctcccacccg tgtcaccatg cgcctctcct ggacttctcc 900
agtagcctcc ccagtctccc tcctccctct tgctcctcta ctgtcctttc tcaattcagc 960
agccagaatg atctttctaa catctaaatc ctcccgtgac c 1001
<210> 11
<211> 861
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (361)..(361)
<223> W=A/T
<400> 11
agttctcctg acctcaaatt aaaatggtct actgagagtc caggtggtgg cttttgcaaa 60
tgcttgggat ccaggaggaa aggtgacagc cttcatggta gcaagcctat agacagtagc 120
agccccagaa tcaaataatt tgcttctaga tataacactt tcacatgcta aaatataaaa 180
cctctctcct cagaaaaact aatctacttc ttccctagtc tttccaatgc cagataacag 240
caccacagtt tgtccattca tttaggcaaa aagctggggt gatatactca ttttcctgtt 300
aatatccctc agccaaccta tcagcaagtc ccatgtgcag aatatgcact gaatctgacc 360
wctccatcta cgtccaccaa cacagctccc acccgtgtca ccatgcgcct ctcctggact 420
tctccagtag cctccccagt ctccctcctc cctcttgctc ctctactgtc ctttctcaat 480
tcagcagcca gaatgatctt tctaacatct aaatcctccc gtgacctctc attatgctat 540
ttatttattt attgagatgg agtcttcctc tgtcacccag actggagtgc agtggcatga 600
tttcggctca ctgcaacctc tgcctcccag gttcaagcgg ttcttctacc tcagcctccc 660
tagtagctgg gactacaggc atgcatctcc acacctggct aatttttgta tttttagtag 720
agagggggtt ttaccatgtc agccaggctg gtctcaaact cctgagctca ggtgatctgc 780
cctccttggc ctcccaaagt gctgggatta caggcgtgag ccaccacgca cagcttcctt 840
atgtttaaaa ctaaacctca g 861
<210> 12
<211> 1249
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (973)..(973)
<223> R=A/G
<400> 12
aaaacctctc tcctcagaaa aactaatcta cttcttccct agtctttcca atgccagata 60
acagcaccac agtttgtcca ttcatttagg caaaaagctg gggtgatata ctcattttcc 120
tgttaatatc cctcagccaa cctatcagca agtcccatgt gcagaatatg cactgaatct 180
gaccactcca tctacgtcca ccaacacagc tcccacccgt gtcaccatgc gcctctcctg 240
gacttctcca gtagcctccc cagtctccct cctccctctt gctcctctac tgtcctttct 300
caattcagca gccagaatga tctttctaac atctaaatcc tcccgtgacc tctcattatg 360
ctatttattt atttattgag atggagtctt cctctgtcac ccagactgga gtgcagtggc 420
atgatttcgg ctcactgcaa cctctgcctc ccaggttcaa gcggttcttc tacctcagcc 480
tccctagtag ctgggactac aggcatgcat ctccacacct ggctaatttt tgtattttta 540
gtagagaggg ggttttacca tgtcagccag gctggtctca aactcctgag ctcaggtgat 600
ctgccctcct tggcctccca aagtgctggg attacaggcg tgagccacca cgcacagctt 660
ccttatgttt aaaactaaac ctcagcagag tttacaaggt ccctatgacc tagacttcct 720
caaccctccc agcctcatct ctgaacactg tctccttttt aactggagct gaaaggagga 780
ggaataaagt aacttcaata aacaaccaga acagtgcttt caaatgtcac ttttggtgat 840
gatggaaatg ttctatatct gtgctgtcta gtatggaagc cactagccgc atgtcactac 900
tgagtgtttg aaatattgct actgtgacag agaggctgac ttttacactg tacttaattt 960
taattcattt aartgtaata gccacatttg tctatcagct actatggaca gcaaaaaact 1020
agaatatggg caaaactgat ataaatgata aaataaagtt atgaacagta tttgttaggg 1080
catctgaaag gaaagagggc tgctaggagg ttatgggatt cagggtagta ttaaaaaatc 1140
attcaaaaag tgacttctgg gaagggcttt aaatgatgag tgaagttgac ttagatataa 1200
atatatatgt gcttatatat atacatatac acacatgcat tatgagaag 1249
<210> 13
<211> 2706
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (1997)..(1997)
<223> K=G/T
<400> 13
ctatatttta gagcagttat gtacgtttat gtatatctct gtgtgtatac atataaatat 60
atatatatat atgcatgctt atgtataagt gaaatgaatg acaacaatga tacaagggac 120
aggagggagg aatttggatt acttgttatt gcaaagtact tgtactatct atgaagctgt 180
acagtgttat atgaaagtga acctggctgg gccaggtgca gtggctcaag cctgtaatcc 240
cagcactttg ggaggctgaa gtgggtgcat cacaaggtca ggagctcgag accagcctgg 300
ccaatatggt gaaaccctgt ctctactaaa aatacaaaaa tgagcagggt gtggtggcag 360
gtgcctgtag tcccagctac tcaggaggct gaggcaggag aattgcttga acgcgggagg 420
cagaggttgc agtgagccga gaatgcacca ctgcactcca gcctgggtga cagagcgaga 480
ttctgtctca agaaaaaaaa aaaaaagaaa gaaagtgaac ttgggtttgt tgtaaatgtg 540
tattgcaaat tctagagcaa ccgttaaaaa agtttttaaa aaagtagaat tgatatgcta 600
agaaaggaga gaaaatggaa tcatgtaaaa tgctcagtta atgccacaaa agacaaaagc 660
cctgtggaac acaagaagaa acaaagaaca agagcaacac atagaaaaca gtaacaaata 720
tggtagatgt taagccaact atatcaataa tcactgtaga tgtcagtggt ctaaatatgc 780
caattaaaag acagagcttg tcagagtata ttaaaaacac accagccgtg gtggtgcact 840
tgtgtaaccc cagctacctg ggatactgtg tgcggaggat ataaagccta ggagttcatg 900
accagcctgt acaacatagg gagaacctgt ctcaaagaaa aacaaacaaa caaaaaatca 960
agacccaact aattattgtc tgtaagaaac ccatgttaaa cagattagac tctgacaaaa 1020
cacgcatagg ttaaactcta gtaaaatact ttctcccgag ggtaggccct gctaagaaga 1080
gtacccagat gtatttcaaa atggttactt tcctcctccc actgctggaa gagcaaggaa 1140
atttttctcc aatattttgg gagataaaac tccccaaaac atgtgtgggt ggagggacag 1200
ggggcccatg actgtatctg ggaccacttt ttatataaac aaatctctaa attgaagttc 1260
aaatatttga gtgttggtga aaaagaaatg gagttattct gatacttgtg actcattact 1320
attatatata ttttttgctt aaattgtctc aggtttaatt attgcgagct ccttcaagtt 1380
gtcttttcag tatgaaccta acattttttt cagcaatttc ttacttgctg gtgccacaag 1440
tttttgcagg tttatcttgc attttctctg cctgagccat gaaatcagcc atttttccaa 1500
aaagccctag ttccttttat tggacattat taaaatttgg gttctacata tgttaattgt 1560
tctggggtgt cacagcacct aggatgatga cagctcagtt gacagaaaat acacatacag 1620
ctaagtgcat atataaaccc attctatatt tatgtctgtg tatatctata catgcattaa 1680
aaccatgagc tgtgctatgc ccaagccctc acaattactc attacttacc cattgacttg 1740
gcttgatcaa atgctagtca ggcttctccc tacaggtccc agaactttat cttattccca 1800
agcttttaag caagtgctaa gttacagaat atcttctcaa tgacttactc caagaatcca 1860
gtgaccaaag agaataaaaa tttactgtca aagccactct catgccatct gcctacctcc 1920
attcgcttgc cccactcttt cacaaacttc ctgctagccc tatttacttc tccttataaa 1980
agaaaggtct ttttctkttc gacctttaga ctttgccact tctgcaatag agtattctcc 2040
ctatttcaaa gttctcttcc ccatattgca atgcagttgg tccttgaaaa acacaggggt 2100
taggggtgct gaccccttgt gcagttaaaa attcacgtaa aatttttgac tcaccataaa 2160
cttaactact actagccgac tgttgactgg aagctttacc aataacacaa acaatagatt 2220
aacacatatt tgtgtgttat atatatttga cactgaattc ttatagtaaa gtaagagaaa 2280
ataaaatgaa aaaatgccat taagaacatt atatggaaga gaaaatatat ttattactta 2340
ttaaatggga atagatcatc agaaaggtct ttatcctcat tgtcttcatg atgggcaggc 2400
tgaggagaag agaaaagagt aggagttggt cttgctgtcc cttggcgtaa ctattattga 2460
aaaaaattca tgtataagtg gatttgtgca gttcaaaccc atgttcttca agggtcaact 2520
gtggcctttt tgaataaaat ctctatttta atctggcttt taaaaaattt gactactggt 2580
actactaatg gcaacccaat accacaggtg tttgaattaa tcagttaatt gcctttattg 2640
aaagaatgtc tatggtcttt tataatttat attttcctca agatagattt gtactgaaat 2700
aaaatc 2706
<210> 14
<211> 701
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (501)..(501)
<223> Y=C/T
<400> 14
ttggtccttg aaaaacacag gggttagggg tgctgacccc ttgtgcagtt aaaaattcac 60
gtaaaatttt tgactcacca taaacttaac tactactagc cgactgttga ctggaagctt 120
taccaataac acaaacaata gattaacaca tatttgtgtg ttatatatat ttgacactga 180
attcttatag taaagtaaga gaaaataaaa tgaaaaaatg ccattaagaa cattatatgg 240
aagagaaaat atatttatta cttattaaat gggaatagat catcagaaag gtctttatcc 300
tcattgtctt catgatgggc aggctgagga gaagagaaaa gagtaggagt tggtcttgct 360
gtcccttggc gtaactatta ttgaaaaaaa ttcatgtata agtggatttg tgcagttcaa 420
acccatgttc ttcaagggtc aactgtggcc tttttgaata aaatctctat tttaatctgg 480
cttttaaaaa atttgactac yggtactact aatggcaacc caataccaca ggtgtttgaa 540
ttaatcagtt aattgccttt attgaaagaa tgtctatggt cttttataat ttatattttc 600
ctcaagatag atttgtactg aaataaaatc taacttttat taaaactgaa aaagggaaat 660
ggaggattca ttgacaatgg ggtgtttcta tctgggtaac a 701
<210> 15
<211> 401
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (201)..(201)
<223> R=A/G
<400> 15
ggtttccata gcagcagctt ctagcagcca ctcctattgg cctgggtcct taccacaagc 60
agcacctccc tgcagatctt cctgctggtg aatgctgctc caagtgatta atgacttcca 120
ttcccctaga atctcattca gtgaatccta aaatgttcaa ctttaaagga cctcaatccc 180
aaacatcttc tctacaaaac rtctggattt ctccaatagc tagagggagc atttgatttc 240
tagcagcacc cccaagccag gtctcaatag gctccttacg aagccctggg gttcagttag 300
aatgccacac tgttttttca aagtccttta ttatctccat cggctactat tcatacctcc 360
ggtagaagag tcccattgac aggtgttctg gacttcaggc t 401
<210> 16
<211> 601
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (301)..(301)
<223> R=A/G
<400> 16
atgtaaacag agtcctggca aatagcccag acctcccagg gctccttaac ataagtacgc 60
aagcttgcct aataatcctg agtttaaaat tatgagtgac ataagataat cttcacactg 120
ggagtcatcg gcccaaatta cggttaaagg ttaaaaacaa acaaataaaa tgcaaaaaaa 180
aatcacatac aaaccaggct tatgttgtag aaaatatttc ctaagccctt ggatttaatg 240
tcatttttag agtttgatga tacctcccta gagagggtat aacaaatact gaacaaggat 300
racacagatc agaaagaatt tagctaggga ggaattcaga ttggggagaa aaataaggag 360
ttgggcctat tctcatttaa aaataaatcc ctctggaaag acataaaaga acatttttaa 420
aaagactaaa agaatggcag tttatctttt catttttaat gctaagtgtt tctattttaa 480
agggcttcca tcccaagtat atacttggat tgaaaaatgg aaaacagtta aaaatgaaga 540
tttttaagtt caaaatgttg atcaaaattt cctgattcaa attgcttttt tgactcttgg 600
a 601
<210> 17
<211> 1001
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (501)..(501)
<223> R=A/G
<400> 17
tatgcaaata aatatatatg ccaataaata tatgcaaata aacaggcaga aatgttctac 60
tttttacact gtatacagta ctttctcctt tttaaccttc attcagtctt agttctaaag 120
gtgagctata ttcaattctc actacagtcc ttaggttagt atctctcaga catttgtgtt 180
gtttgagctt gtttgctagt aggttcctca gcaagggctc acaggaaaaa tatgccctga 240
gttcttgtgt gtttttaaca gtttgtctgt gtccttcctg ttcattgcag cactatccac 300
gatagctaag ttatggaatc aacctaagtg tccatcaaca gatggatggg taaagaagat 360
gaggtatata tacacaatgg agtactattc attaaaaaag aagggaatcc tgtcatttgt 420
gacaacaggg atgaacctag tcattcaagg tttgatttca agaatcaagt cattcttgaa 480
aatcagtttt agaggataaa rgtttcttga ctctcatttt ctttccttaa gtatcttaaa 540
taagttattc catttttttc tgtcataaag tattgctgta aaaaaaatct aacgatgagc 600
taattttctt tttatttata aggctcatgt tctttttgtc ttcatgttca aatagctttt 660
cccttttctt taaactccag cagttttact agaatgtgtt ttgctgttag ttgatttgtt 720
taggcacatg gcacaccctt tcaacttgtg ctttcaaata cttttttatt ctagtaaagt 780
tttttttgac ttatagcttt taggattttt ttttcttctt taagaatttc taccctccac 840
atattggatt ttctttgcct gtccacaata tttattactt tttattgcaa tatgtttatt 900
tcttctttta tatttaaact tgttttctta tctgtaagag tatattcact cttatgctcc 960
ttgtagtttg atatagttcc tttatttcta aatctctgtt g 1001
<210> 18
<211> 601
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (301)..(301)
<223> S=C/G
<400> 18
tgtgtgcaga tgttgaatat ggccaataaa cctaagcata tctccatttc ttaatatagt 60
gctacttagc ttcactaaag acccaactaa ttcactgtgc tttcatttgg aatctatgtt 120
gtttagtggc ttttttgtta atacctccag ttcccatttt atataaagag agtgattcta 180
gggccatacc atttttgtat tctgtaatgc cgcatcattt gacattggtg ttaccaatga 240
gtagattcct ttaagttgtt gatgcttcag agcatgggtt caagataagc atatctgttt 300
stggtgcaaa gatcggcttt agaaacaatg cattatagat ttatcatttg aaaacagcct 360
gtttaaactg atcaaatttt taaagtttca gtacagtctg ttgaaaaata gccaagaaga 420
aatataacca ctccaacttc agcatagagc atatcatctg tgcacgatta cctcgttaag 480
ccagccacat gttatagagt gtagttgcat gtcaatagtg tgaatggcca gcaaaggggt 540
gggggtgccc tctgaagctc aggaagaatt ttcgtcattg ttatttaatg tcctttccaa 600
g 601
<210> 19
<211> 602
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (333)..(333)
<223> M=A/C
<400> 19
agctgaacat cttacaagac ttaaccaaac gaccagtaca aatgatgccc tagtagacac 60
acacacatac cttatatagc ttggtaaaca ggactcagtg gccagcttag ttaattcctc 120
attttaccac gaggaaaaaa tgctctctaa aaagcatttg ctagataaat acttgcttac 180
aagtcaaaat tagtgcatct taaccatttt gcacacaaat tcaaagatct ttttctccca 240
actctgacct gctgtcaatc aaaggggctg gggtaagtca aagttggatg aagttataag 300
aagccactat ttcccacttt accgcccagg camacacaaa catttgctga gtcattgata 360
atagtgcaag aattcagatc ccatggcatg aattatggat ggagtatcag cctttccctt 420
tgagtttcct ggcatttgat ggtccatatc acaataaaaa catacttctg agtctgtgaa 480
tgtcttgggt gtcttctctc attctctctc tctctgggtg tgtgtgcatg tatgtgtctg 540
tctgtctctg tgtcactctc ttaataatag tcttttaact ccttcaaaaa gagttttgat 600
ca 602
<210> 20
<211> 601
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (301)..(301)
<223> Y=C/T
<400> 20
tgtttgctta agatgaaggt taaggagagg gcgtacttgc tgggagttca tggcggggaa 60
gataaacgcg gatgtttact atctaaatta cattcattac cttcatgcct tttcctcctt 120
ataattagtt ctctgacttt cttaggatat tttctaatgc aaaggtattt gtcagaaggc 180
agtcaaggcc gttgcatgtg gtttgtgttt tatgtttgcc tgttcctcgc ttgtccatag 240
agttggaggc cagaggggtg agaaaggaag ttttgttttg taagatgata tcccttcaac 300
ytactgtttg tttcacttat tttgttaatt tgactctttt tttttttaaa gtagtttact 360
tagaatcctg tgttgcctct agtcagcttt tgttcatcta agatagtgtc agatgaggat 420
gctgctaggt aggaatgagc ctggtggtct cttacactgt cctcgacagg ttagaatctc 480
aaattcatca ccgtttagca accaggagta tttacagccc cttgcttcat cagggctaaa 540
tgtgaagcat ccccttggtg atacttaagg tgatatttaa gtgagtggga atgaaaaaca 600
g 601
<210> 21
<211> 401
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (201)..(201)
<223> R=A/G
<400> 21
aagatagtgt cagatgagga tgctgctagg taggaatgag cctggtggtc tcttacactg 60
tcctcgacag gttagaatct caaattcatc accgtttagc aaccaggagt atttacagcc 120
ccttgcttca tcagggctaa atgtgaagca tccccttggt gatacttaag gtgatattta 180
agtgagtggg aatgaaaaac rgaggaaata agcatttctt aagatgtgtg atttggggac 240
acccaatcaa taggtttagg aggaagagag aattgggact agctatctta tctcaaataa 300
tagaagtaag tgaaaggata aatattttga aaggactagt gtgaaatata catgaatgta 360
ttcctaggga ttctgctgcg gggtgggaaa ggggtgcaga t 401
<210> 22
<211> 601
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (301)..(301)
<223> R=A/G
<400> 22
aggatgctgc taggtaggaa tgagcctggt ggtctcttac actgtcctcg acaggttaga 60
atctcaaatt catcaccgtt tagcaaccag gagtatttac agccccttgc ttcatcaggg 120
ctaaatgtga agcatcccct tggtgatact taaggtgata tttaagtgag tgggaatgaa 180
aaacagagga aataagcatt tcttaagatg tgtgatttgg ggacacccaa tcaataggtt 240
taggaggaag agagaattgg gactagctat cttatctcaa ataatagaag taagtgaaag 300
rataaatatt ttgaaaggac tagtgtgaaa tatacatgaa tgtattccta gggattctgc 360
tgcggggtgg gaaaggggtg cagattaagc cagaccccat cattcatccc tggaaatgtg 420
ctcccacctc tagccaagag gcctgaggtc ccttctcaca acttcaaact ccctggaata 480
ccattaggtg gagcctaggg gactggctag gaggtgaagg tgtgagctcc atacctgcca 540
tttgcttgcc agtgacctca gggaagacac ctactctctc tgagcctgaa atttcccacc 600
t 601
<210> 23
<211> 501
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (251)..(251)
<223> R=A/G
<400> 23
aaaaaaaaag aatgtcatga cagtttgtat tgacagcctt tttctagcaa gaaacatacc 60
gttattttga acttgtgaat gatttatgaa ttgtgattct gtcttcagga tcctgttttt 120
ttctgttttg tttttgtttt tgtcatcaaa ttgccacagg ggggagtata agttcttgaa 180
agcagcaaga aatacagttt aagtaatttg gtaccaatta tcattattat tagaaacgtc 240
catatctgaa rcatctaaac agattagatt aatacctatg tgaaagtaga aatatttata 300
gtaaaaaatt gggcaccgtt taatatagga tttattaatt ttgtgatagt tgcaaaagct 360
gtgtctggaa aatgtcccca tgggtgaatg tgtgggcgtg cacatgcatg tgggtaatat 420
taatgctgta ggagaaggga gaaaatgtaa gtttctagtt tttgccatta aagtcatgac 480
gtgaaagaga gagggagaga g 501
<210> 24
<211> 601
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (301)..(301)
<223> R=A/G
<400> 24
agacaaaggc tggaggtttt cacacctggt agtctcatgt agaaaggaag gctgatcagc 60
agggaggcag aggaagggtt gacagggtag gaccttggag ggaagcagtt aggcttggaa 120
gggacacaaa ggaaaggatg gcaaagaact gaccagagca actaaaagca caacatagta 180
gaaccgagga cacatctgag actagagacc acaaatgtat ggcagacact ataggaacaa 240
ctaaggcagg cactggcttg aagaaaggtc atgaggccaa aggccagaag tgtaacaagg 300
rgctgttggc ataaaacagt atgccatgga gagagaggaa gcaaaaccgt gtgtccagga 360
gaaaaggaag gggcaagaga ccaaagtcac gatcaggtca aaacattgat gtgaagaata 420
aatgagcaag agaggccggg ggcggtggct cacgcctgta atcccagcac tttgggagac 480
cgaggtgggc agatcatgag gtcaggagat ggagaccatc ctggctaaca cggtgaaacc 540
ccgtctctac taaaagtaca aaaaacttag ccaggcgtgg tggcgggcgc ctgtagtccc 600
a 601
<210> 25
<211> 1982
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (1102)..(1102)
<223> M=A/C
<400> 25
caggaactca tcttaaatat ttaaaaataa gttttttttt ctaattgcaa ggaataagta 60
ctctttgtaa atgatatgga aagtatggaa tataataaag atgaaaaaga taactcctag 120
ataatcactt ttaatgtttt ggcaaaattc tttttaaaaa gtgctaaaga aaatgtggca 180
catatacatc atggaatact atgcatccat aaaaaagaat gagttcatgt cctttggagg 240
gacatagatg aagctgaaag ccatcattct tagcaaacta acccaggaac agaaaaccaa 300
acaccgcata ttctcactca taagtgggag ttgaacaatg agaacacatg gacacaggga 360
ggggaacatc acacatgggg gcctgttggg gggtgggggc caaggaaagg gaaaacatta 420
ggacaaatac ctaatgtatg cagagttaaa atctagatga cgggttgata ggtgcagcaa 480
accaccatgg cacgtgtata cctatgtaac aaatctgcac attctgcaca tgtatcccag 540
aacttaaagt aaaaaaaaaa aaagtgcttg aatatattta atttttaaac tttttaattg 600
aaatataata gagatttaac aatatgtgcc aagttctctc atgcccccac ctccaaagta 660
accactaccc tgcctttatc actatttagt tttgcttcct cttcaatttc atatagatga 720
cattatgcag tgtgtatgct tttgtgcctg acttctttca ctcaccataa tagtgctttt 780
cttttttata tataagagat ttattctgag ccaaatatga gtgaccatgg cccatgacac 840
agccctcaag aggtcctgag aacttgtgcc caaggtggtc tgggggcagc ttggttttat 900
acattttaga gcagcatgag acatcaatca catccgttta agaaatacat tggtttggtc 960
cagatgtgga gcgggtggtg ggggaagggg aggcttccag gttataggtg aatttaaaca 1020
ttttctggtt gacaattggt tgagtttgtc tcaaaacgtg ggatagaggc tgggcgcagt 1080
ggctcacgcc tataatccca gmactttggg aggccgaggc gggcggatca cctgagctca 1140
gaagttcaag accagcctgg gcaacatggt gaaaccccgt ctctattaaa aatacaaaaa 1200
atcagcctag tgtggtagtg catgcctgta atcccagcta ctcgggaggc tgaggcagga 1260
gaatcacttg aacccgggag gcagaggttg cagtgagtcg agatcacgcc actgcactcc 1320
ggcctgggcg acagagagag actttgtatc aaaaaaaaaa aaaaaaaaaa aaggcctggg 1380
atagatagaa agggaatgtt caggttaaga taaacattgt ggaaacccaa gttcttctga 1440
ggtcttatag tggctgcctg tagaggcaag aagtgacaaa tgtttcctat tcagatctca 1500
gttcatctct ttacgattgg gagagtctgg aagaaaaaga tctatctata ttaatagaga 1560
ttctttagag gtgcaaattt tccctcacaa agaacaactt tgcggggcca tttcaaaata 1620
tggcaaagaa acatgttttg gggaaatgca ctttttaatt gatgtatatt gttccattat 1680
ataaatattc tatactctat caatttttct gtttacagaa ttcagatttt tgctttcagt 1740
ttttggatgg atgaaactgc tttgagaatt ttgtatgtct tttgctcact tctcttgaat 1800
atataccaaa gactaaaagt tattgtagtt atctaaatta tacatgttaa cttgctgaca 1860
aaaattgtgt tagaatttgt tgacctaatg taaaagtttt atattcttgc gatgcaaatt 1920
ctaattaatc aatggtgctc ctcatttctt actaactctt ctttgactct cttttaaaca 1980
tg 1982
<210> 26
<211> 978
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (679)..(679)
<223> R=A/G
<400> 26
aactatatca aactacaagg agcataagag tgaatatact cttacagata agaaaacaag 60
tttaaatata aaagaagaaa taaacatatt gcaataaaaa gtaataaata ttgtggacag 120
gcaaagaaaa tccaatatgt ggagggtaga aattcttaaa gaagaaaaaa aaatcctaaa 180
agctataagt caaaaaaaac tttactagaa taaaaaagta tttgaaagca caagttgaaa 240
gggtgtgcca tgtgcctaaa caaatcaact aacagcaaaa cacattctag taaaactgct 300
ggagtttaaa gaaaagggaa aagctatttg aacatgaaga caaaaagaac atgagcctta 360
taaataaaaa gaaaattagc tcatcgttag atttttttta cagcaatact ttatgacaga 420
aaaaaatgga ataacttatt taagatactt aaggaaagaa aatgagagtc aagaaacttt 480
tatcctctaa aactgatttt caagaatgac ttgattcttg aaatcaaacc ttgaatgact 540
aggttcatcc ctgttgtcac aaatgacagg attcccttct tttttaatga atagtactcc 600
attgtgtata tatacctcat cttctttacc catccatctg ttgatggaca cttaggttga 660
ttccataact tagctatcrt ggatagtgct gcaatgaaca ggaaggacac agacaaactg 720
ttaaaaacac acaagaactc agggcatatt tttcctgtga gcccttgctg aggaacctac 780
tagcaaacaa gctcaaacaa cacaaatgtc tgagagatac taacctaagg actgtagtga 840
gaattgaata tagctcacct ttagaactaa gactgaatga aggttaaaaa ggagaaagta 900
ctgtatacag tgtaaaaagt agaacatttc tgcctgttta tttgcatata tttattggca 960
tatatattta tttgcata 978
<210> 27
<211> 701
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (501)..(501)
<223> Y=C/T
<400> 27
tcttttcaac atactgactt ctttttcatt gagtgtatac ccagtaatgg gattgctata 60
tcatatagta attgtattct taatttttta tggaactttc tgtttttcat aatggccgta 120
ctaatttaca ttcctgccaa caatgcacag ggtttttttt cctccacatc cttgctgaca 180
gttttgttat cttttgtttt tttgatagta gccattttaa caggtgtgaa gtgatagctc 240
attgtggttt tgatttgcat ttccctgatg gttagtaatg ttgaacattt tttcatatac 300
ttgttggcca tttgtgtgtc ttcttttgag aaacatctgt ctggtgacct gctcaattta 360
gattccactt ccaggagtat gaggatcttc tcctgggagg cagccctggc ttgtaagctt 420
tgttggagtg ctaggccaaa cccctactag attcaacagc tgctgtcagc ctggccttct 480
atatatctag tgactacctg ytggctgttt gagagctctc gtgttctcag aagcatcaga 540
taccttgttg tttctctgct tttctcacac atgtgctgac acggtgcaga tcttacggtg 600
gttgatgatt tggcaccccc tacctccgat atttgggggg tgaaagtgtg cattgccatc 660
taatttttgt agaaacattg cctgtgggat ttttgttttg c 701
<210> 28
<211> 601
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (301)..(301)
<223> M=A/C
<400> 28
attggttatc atggcaacca aaaacggaat tatacaaaac aagacttatg aaatagctcc 60
atttaaatga ggatttcatt tcataatttt cagatttaac agtaaggtaa tgaagttcag 120
aaacagacct agagcataaa atttttaaaa aatgtaaaca ttttccacgt gcaaggcaca 180
tagactagtt tgtgatgtga agggttggaa actaacctat aacggccaga gaggtacaaa 240
tgccaaaagg accaagtgta atacaacagg gttaatggag actgaagtaa tctagagaga 300
mttgaattta aagtgtctat aaagttctgt gaagataaca aaaaaaatgg ctgtatagtc 360
aatgtggtgt gtatgcctgc aagtctgtga tacttgattc agtgtgaagt atgtttacat 420
aaaaattcta tggaataatc aatttattaa tgtatagaat aattaaagat atttagaaaa 480
ttattggtga attatcttat gattaataag aacttcctat ttatgctcaa gaaaactcag 540
aaatgtttag aaggataaat gaataaccaa gccctttata gaaaaaatat acactttatt 600
t 601
<210> 29
<211> 406
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (206)..(206)
<223> Y=C/T
<400> 29
cctggaaatg tgctcccacc tctagccaag aggcctgagg tcccttctca caacttcaaa 60
ctccctggaa taccattagg tggagcctag gggactggct aggaggtgaa ggtgtgagct 120
ccatacctgc catttgcttg ccagtgacct cagggaagac acctactctc tctgagcctg 180
aaatttccca cctgttcaca gttaaygtgc agctcaagga gacaatattt atgaaagcac 240
tttcataaag gtattagagt tttaaaattg cccttctctt ccattcttca gtggctctca 300
aaactaagcc caactcagat tgactgtaaa agcctgtcac agtttgattt tataacagtg 360
tccagctctg catgggtttt agagtgttaa aactaggtga gagctc 406
<210> 30
<211> 438
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (201)..(201)
<223> Y=C/T
<400> 30
ttttttctgt tttgtttttg tttttgtcat caaattgcca caggggggag tataagttct 60
tgaaagcagc aagaaataca gtttaagtaa tttggtacca attatcatta ttattagaaa 120
cgtccatatc tgaaacatct aaacagatta gattaatacc tatgtgaaag tagaaatatt 180
tatagtaaaa aattgggcac ygtttaatat aggatttatt aattttgtga tagttgcaaa 240
agctgtgtct ggaaaatgtc cccatgggtg aatgtgtggg cgtgcacatg catgtgggta 300
atattaatgc tgtaggagaa gggagaaaat gtaagtttct agtttttgcc attaaagtca 360
tgacgtgaaa gagagaggga gagagagaaa gaaagtgaga aagtgctagt ctgtgtaaaa 420
tgaccatgaa agggcttg 438
<210> 31
<211> 1001
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (501)..(501)
<223> R=A/G
<400> 31
tgtgtatagt atctcatata tatatatata tatatatttt ttcgggtttt cacgctcaaa 60
gtcctgccac catcgtaagt taccccaata tccacccaaa tcactatcca aactcacttc 120
taagctcctc ttgcctgtct cttctaagct agtcaggatt tgccatacac cctgccattt 180
catagaactt ctgcaatccc cttgggtcct tgatatggtt tggctctgtg tccccaccaa 240
atctcatgta agattgtaat ccccagtgtt ggaggtggag ctggtgggag gtgattggat 300
cataggggtg gtttctgaag gtttagcacc atcaccctgg tgctgtctca tgagagagtt 360
ctcatgaaat ctgcttgttt aaaagtgtcc ccctttgttc ttttcttcct gctccagcca 420
tgtaggacgt gtctctttcc tctttgcttt ccgctgtgat tgcaagtttc ccgagacctc 480
cccagtcatg cttcctttac rgcctgcaga accatgaacc aattaaacct ctcttcttta 540
tagattatcc agtctcacgt agttctttat agcaatgtga gtacagacta atacagccct 600
acatttctgt cctctcctgc tctctcttgc tcatttattc tttttttttt gagacggagt 660
ctcgctctgt cgcccaggct ggagtgcagt tgggcgatct cggctcactg caagctccac 720
ctcctgggtt cacgccattc tcctgcctca gcctcccgag cagctgggac tacaggcgcc 780
cgccaccacg cctggctaag ttttttgtac ttttagtaga gacggggttt caccgtgtta 840
gccaggatgg tctccatctc ctgacctcat gatctgccca cctcggtctc ccaaagtgct 900
gggattacag gcgtgagcca ccgcccccgg cctctcttgc tcatttattc ttcacatcaa 960
tgttttgacc tgatcgtgac tttggtctct tgccccttcc t 1001
<210> 32
<211> 601
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (301)..(301)
<223> S=C/G
<400> 32
aatagtgctt ttctttttta tatataagag atttattctg agccaaatat gagtgaccat 60
ggcccatgac acagccctca agaggtcctg agaacttgtg cccaaggtgg tctgggggca 120
gcttggtttt atacatttta gagcagcatg agacatcaat cacatccgtt taagaaatac 180
attggtttgg tccagatgtg gagcgggtgg tgggggaagg ggaggcttcc aggttatagg 240
tgaatttaaa cattttctgg ttgacaattg gttgagtttg tctcaagacg tgggatagag 300
sctgggcgca gtggctcacg cctataatcc cagcactttg ggaggccgag gcgggcggat 360
cacctgagct cagaagttca agaccagcct gggcaacatg gtgaaacccc gtctctatta 420
aaaatacaaa aaatcagcct agtgtggtag tgcatgcctg taatcccagc tactcgggag 480
gctgaggcag gagaatcact tgaacccggg aggcagaggt tgcagtgagt cgagatcacg 540
ccactgcact ccggcctggg cgacagagag agactttgta tcaaaaaaaa aaaaaaaaaa 600
a 601
<210> 33
<211> 23
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 33
<400> 33
gctctcaaaa ctaagcccaa ctc 23
<210> 34
<211> 23
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 34
<400> 34
gagttgggct tagttttgag agc 23
<210> 35
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 35
<400> 35
gtaatataga agatgggtct a 21
<210> 36
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 36
<400> 36
gtaatataga tgatgggtct a 21
<210> 37
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 37
<400> 37
gaatatacaa cgaatatggg c 21
<210> 38
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 38
<400> 38
gaatatacaa tgaatatggg c 21
<210> 39
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 39
<400> 39
tggatgattc aaacaacttg g 21
<210> 40
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 40
<400> 40
tggatgattc gaacaacttg g 21
<210> 41
<211> 20
<212> DNA
<213> arttificial sequence
<400> 41
aaggggcaag agaccaaagt 20
<210> 42
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 42
<400> 42
caccctgcca tttcatagaa c 21
<210> 43
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 43
<400> 43
accagggtga tggtgctaaa 20
<210> 44
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 44
<400> 44
aatgaccatg aaagggcttg 20
<210> 45
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 45
<400> 45
tgcccccata tgtacagaaa 20
<210> 46
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 46
<400> 46
gggacatttt gcaagggtta 20
<210> 47
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 47
<400> 47
ttgctagaaa aaggctgtca a 21
<210> 48
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 48
<400> 48
cagcccaata ttccaccaag 20
<210> 49
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 49
<400> 49
gccaagttta ttttggcagg t 21
<210> 50
<211> 23
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 50
<400> 50
ttggttcttc ttgattgtgg ttt 23
<210> 51
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 51
<400> 51
gcaaagcaac attggttcaa 20
<210> 52
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 52
<400> 52
ggtatgcttt gggaggctta 20
<210> 53
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 53
<400> 53
tctcagccga aacaagactg 20
<210> 54
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 54
<400> 54
tttagcggga acgcttctta 20
<210> 55
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 55
<400> 55
accgtgaaag ggctttgtaa 20
<210> 56
<211> 22
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 56
<400> 56
tgctcagctt atttttgtca cc 22
<210> 57
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 57
<400> 57
ccctaactct ccccatcctc 20
<210> 58
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 58
<400> 58
atgtgcagct caaggagaca 20
<210> 59
<211> 23
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 59
<400> 59
ttgattttct ctgagctctc acc 23
<210> 60
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 60
<400> 60
taggaatgag cctggtggtc 20
<210> 61
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 61
<400> 61
ggtgtcccca aatcacacat 20
<210> 62
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 62
<400> 62
tatgggcatc tggacagtga 20
<210> 63
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 63
<400> 63
acgccctctc cttaaccttc 20
<210> 64
<211> 19
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 64
<400> 64
agcccctttg attgacagc 19
<210> 65
<211> 23
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 65
<400> 65
gttaattcct cattttacca cga 23
<210> 66
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 66
<400> 66
agtccctcga agtctcaaaa a 21
<210> 67
<211> 23
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 67
<400> 67
gcacagaaac tttttctttc ctg 23
<210> 68
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 68
<400> 68
aagggtaggg atgtgcagtg 20
<210> 69
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 69
<400> 69
caggcatgaa gatggtggta 20
<210> 70
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 70
<400> 70
ggtgcaaaga tcggctttag 20
<210> 71
<211> 24
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 71
<400> 71
tcttcttggc tatttttcaa caga 24
<210> 72
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 72
<400> 72
ggggttcacc taggagcatt 20
<210> 73
<211> 22
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 73
<400> 73
caagacaaac caaatccaat cc 22
<210> 74
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 74
<400> 74
tatcctcttc gcaccactcc 20
<210> 75
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 75
<400> 75
gtggacagaa cagggcaaac 20
<210> 76
<211> 18
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 76
<400> 76
gcttacccgg ctgcagag 18
<210> 77
<211> 18
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 77
<400> 77
acagccccga gacgacag 18
<210> 78
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 78
<400> 78
gcagcagctg gagaaagaaa 20
<210> 79
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 79
<400> 79
aaaaagaaac cgctcggact 20
<210> 80
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 80
<400> 80
ccaggcagtt ggctctaatc 20
<210> 81
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 81
<400> 81
tcagggtcgt gattctctcc 20
<210> 82
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 82
<400> 82
tggagatttt gggagtacgg 20
<210> 83
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 83
<400> 83
tcaaacttcc tcccctcaaa 20
<210> 84
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 84
<400> 84
tgctcctaaa gccacacctt 20
<210> 85
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 85
<400> 85
ggaaaagatt cccacccaat 20
<210> 86
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 86
<400> 86
ccatttcatg ctttgaacga 20
<210> 87
<211> 22
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 87
<400> 87
ttgtgtgtgt gtgtgtgtgt gt 22
<210> 88
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 88
<400> 88
aatgccaaaa ggaccaagtg 20
<210> 89
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 89
<400> 89
cagacttgca ggcatacaca 20
<210> 90
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 90
<400> 90
tggtttgtgg tgtggacagt 20
<210> 91
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 91
<400> 91
ccacatgagg atagctgagg a 21
<210> 92
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 92
<400> 92
gctttgttgg agtgctaggc 20
<210> 93
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 93
<400> 93
ccaaatcatc aaccaccgta 20
<210> 94
<211> 23
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 94
<400> 94
tttctgtaac ctggcttatt tca 23
<210> 95
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 95
<400> 95
tctgcacctc catgttcatt 20
<210> 96
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 96
<400> 96
tttgtaggga tttggcttca 20
<210> 97
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 97
<400> 97
attgagtggg tcagggacaa 20
<210> 98
<211> 22
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 98
<400> 98
cccttttctt taaactccag ca 22
<210> 99
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 99
<400> 99
tggacaggca aagaaaatcc 20
<210> 100
<211> 22
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 100
<400> 100
tgcaaataaa caggcagaaa tg 22
<210> 101
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 101
<400> 101
gcccttgctg aggaacctac 20
<210> 102
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 102
<400> 102
acacatttct tgccccagac 20
<210> 103
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 103
<400> 103
tccccctaca tctgcctaca 20
<210> 104
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 104
<400> 104
agcctgtctt ctgaggcact 20
<210> 105
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 105
<400> 105
gggggacaga gaaagactcc 20
<210> 106
<211> 24
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 106
<400> 106
tgggtctaca tgtctattgc tttg 24
<210> 107
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 107
<400> 107
gggaatgccc atattcattg 20
<210> 108
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 108
<400> 108
tggaaaccca agttcttctg a 21
<210> 109
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 109
<400> 109
cccgcaaagt tgttctttgt 20
<210> 110
<211> 19
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 110
<400> 110
ccatgacaca gccctcaag 19
<210> 111
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 111
<400> 111
gcctctatcc cacgttttga 20
<210> 112
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 112
<400> 112
tgtcctttgg agggacatag a 21
<210> 113
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 113
<400> 113
tatacacgtg ccatggtggt 20
<210> 114
<211> 23
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 114
<400> 114
tgacttaatg aataagcctg ctg 23
<210> 115
<211> 24
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 115
<400> 115
gcaccatata aatgtgagat tgga 24
<210> 116
<211> 26
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 116
<400> 116
aaaagaagct gaatttgctt taaaat 26
<210> 117
<211> 21
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 117
<400> 117
agcaggatac tgacaggcaa a 21
<210> 118
<211> 25
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 118
<400> 118
tcatttaaaa ataaatccct ctgga 25
<210> 119
<211> 22
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 119
<400> 119
tgttttccat ttttcaatcc aa 22
<210> 120
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 120
<400> 120
ccagggtccc attcctagtt 20
<210> 121
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 121
<400> 121
gaggcttgtg gagcattagc 20
<210> 122
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 122
<400> 122
agcatgggtt tccatagcag 20
<210> 123
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 123
<400> 123
tgtttgggat tgaggtcctt 20
<210> 124
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 124
<400> 124
tgtgcagttc aaacccatgt 20
<210> 125
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 125
<400> 125
tgtggtattg ggttgccatt 20
<210> 126
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 126
<400> 126
ttctccctac aggtcccaga 20
<210> 127
<211> 22
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 127
<400> 127
atgcactacc acactaggct ga 22
<210> 128
<211> 22
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 128
<400> 128
agcagcatga gacatcaatc ac 22
<210> 129
<211> 22
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 129
<400> 129
atgcactacc acactaggct ga 22
<210> 130
<211> 22
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 130
<400> 130
agcagcatga gacatcaatc ac 22
<210> 131
<211> 24
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 131
<400> 131
tgattcttga aatcaaacct tgaa 24
<210> 132
<211> 22
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 132
<400> 132
gctagtaggt tcctcagcaa gg 22
<210> 133
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 133
<400> 133
atggcaatgc acactttcac 20
<210> 134
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 134
<400> 134
gctttgttgg agtgctaggc 20
<210> 135
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 135
<400> 135
cttgcaggca tacacaccac 20
<210> 136
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 136
<400> 136
aacggccaga gaggtacaaa 20
<210> 137
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 137
<400> 137
tgagagccac tgaagaatgg 20
<210> 138
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 138
<400> 138
taggtggagc ctaggggact 20
<210> 139
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 139
<400> 139
ggggacattt tccagacaca 20
<210> 140
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 140
<400> 140
tgtcatcaaa ttgccacagg 20
<210> 141
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 141
<400> 141
agcgagactc cgtctcaaaa 20
<210> 142
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> SEQ ID NO 142
<400> 142
ctttgctttc cgctgtgatt 20
46
Claims (14)
- 대상체에서 발생한 간섬유증 또는 간경변을 진단 또는 예후하거나, 또는 간섬유증 또는 간경변에 대한 소인을 검출하기 위한 시험관내 방법으로서,
상기 방법이 상기 대상체의 생물학적 샘플에서 CTGF 유전자자리(gene locus)의 변경(alteration)의 존재를 검출하는 단계를 포함하고, 상기 변경이 SNP rs9402373인 것을 특징으로 하는 방법. - 제1항에 있어서,
상기 간섬유증이 A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, 시스토조마 자포니쿰 또는 시스토조마 만소니 감염에 의해 야기된 것을 특징으로 하는 방법. - 제1항에 있어서,
방법은 HCV로 감염된 대상체의 생물학적 샘플의 CTGF 유전자자리에서 SNP rs9402373의 존재를 검출하는 단계를 포함하며,
rs9402373에서 대립유전자 C의 존재가, 대상체에서 간섬유증이 발생하거나 간섬유증이 진행될 위험, 또는 간섬유증의 나쁜 예후를 나타내는 것을 특징으로 하는 방법. - 제1항 내지 제3항 중 어느 한 항에 있어서,
상기 CTGF 유전자자리의 변경의 존재가 시퀀싱, 선택적 하이브리드화 또는 선택적 증폭에 의해 검출되는 것을 특징으로 하는 방법. - 제1항 내지 제3항 중 어느 한 항에 있어서,
SNP의 존재가 제한효소 소화에 의해 검출되고, 하나 이상의 상기 SNP의 검출이 섬유증의 지표가 되는 것을 특징으로 하는 방법. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP09305159A EP2221387A1 (en) | 2009-02-19 | 2009-02-19 | Fibrosis susceptibility gene and uses thereof |
EP09305159.7 | 2009-02-19 | ||
PCT/EP2010/052048 WO2010094740A1 (en) | 2009-02-19 | 2010-02-18 | Fibrosis susceptibility gene and uses thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120004971A KR20120004971A (ko) | 2012-01-13 |
KR101748679B1 true KR101748679B1 (ko) | 2017-07-03 |
Family
ID=40568438
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020117021902A KR101748679B1 (ko) | 2009-02-19 | 2010-02-18 | 섬유증 감수성 유전자 및 이의 용도 |
Country Status (8)
Country | Link |
---|---|
US (2) | US9297044B2 (ko) |
EP (2) | EP2221387A1 (ko) |
JP (2) | JP5837825B2 (ko) |
KR (1) | KR101748679B1 (ko) |
CN (2) | CN102325904B (ko) |
BR (1) | BRPI1008936B8 (ko) |
CA (1) | CA2752802C (ko) |
WO (1) | WO2010094740A1 (ko) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012085217A1 (en) * | 2010-12-22 | 2012-06-28 | Universite De La Mediterranee (Aix-Marseille Ii) | A diagnostic method for dementias |
BR112014002347B1 (pt) | 2011-08-05 | 2021-09-21 | Inserm - Institut National De La Santé Et De La Recherche Médicale | Método in vitro para determinar um risco de desenvolvimento de fibrose hepática ou cirrose |
ES2422874B1 (es) * | 2012-03-12 | 2014-07-15 | Universidad Autnoma De Madrid | Método in vitro de pronóstico de fibrosis hepática grave |
EP3607065B1 (en) * | 2017-04-06 | 2023-03-15 | Qing Wang | Method and kit for constructing nucleic acid library |
EP3425056A1 (en) * | 2017-07-07 | 2019-01-09 | Genepred Biotechnologies | Method for prognosing fibrosis progression |
WO2020070057A1 (en) * | 2018-10-02 | 2020-04-09 | Tetra Laval Holdings & Finance S.A. | A system for controlling a manufacturing process for packaging units |
WO2020074727A1 (en) | 2018-10-11 | 2020-04-16 | Genepred Biotechnologies | Method for detecting fibrosis especially keloid |
CN111073884A (zh) * | 2020-02-14 | 2020-04-28 | 昆明理工大学 | 提高非编码区域距离<50bp的SNP中具有功能效应的SNP位点检测准确率的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004132974A (ja) | 1995-06-02 | 2004-04-30 | Univ South Florida | 結合組織増殖因子 |
JP2007515162A (ja) | 2003-11-18 | 2007-06-14 | インペリアル・イノベイションズ・リミテッド | 線維症の治療において使用する化合物の同定のためのctgf及びtrkaレセプターを使用するスクリーニング方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0730663B1 (en) | 1993-10-26 | 2003-09-24 | Affymetrix, Inc. | Arrays of nucleic acid probes on biological chips |
US20030092019A1 (en) * | 2001-01-09 | 2003-05-15 | Millennium Pharmaceuticals, Inc. | Methods and compositions for diagnosing and treating neuropsychiatric disorders such as schizophrenia |
EP1434993B1 (en) * | 2001-09-18 | 2013-04-24 | Fibrogen, Inc. | Methods of assaying connective tissue growth factor |
US7405274B2 (en) * | 2003-06-04 | 2008-07-29 | Fibrogen, Inc. | Connective tissue growth factor antibodies |
EP2094289B1 (en) * | 2006-12-04 | 2013-03-13 | Promedior, Inc. | Combination of sap and enalapril for use in the treatment of fibrotic or fibroproliferative disorders |
BR112012028189A2 (pt) | 2010-05-04 | 2019-09-24 | Univ Saix Marseille | gene da suscetibilidade de tratamento antiviral e seus usos. |
BR112014002347B1 (pt) | 2011-08-05 | 2021-09-21 | Inserm - Institut National De La Santé Et De La Recherche Médicale | Método in vitro para determinar um risco de desenvolvimento de fibrose hepática ou cirrose |
-
2009
- 2009-02-19 EP EP09305159A patent/EP2221387A1/en not_active Withdrawn
-
2010
- 2010-02-18 EP EP10703912.5A patent/EP2398911B1/en active Active
- 2010-02-18 US US13/201,520 patent/US9297044B2/en active Active
- 2010-02-18 CN CN201080008683.5A patent/CN102325904B/zh active Active
- 2010-02-18 JP JP2011550565A patent/JP5837825B2/ja active Active
- 2010-02-18 KR KR1020117021902A patent/KR101748679B1/ko active IP Right Grant
- 2010-02-18 BR BRPI1008936A patent/BRPI1008936B8/pt active IP Right Grant
- 2010-02-18 CA CA2752802A patent/CA2752802C/en active Active
- 2010-02-18 CN CN201610204906.4A patent/CN105907843A/zh active Pending
- 2010-02-18 WO PCT/EP2010/052048 patent/WO2010094740A1/en active Application Filing
-
2015
- 2015-08-21 JP JP2015164050A patent/JP2016047045A/ja active Pending
-
2016
- 2016-02-16 US US15/045,107 patent/US20160230232A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004132974A (ja) | 1995-06-02 | 2004-04-30 | Univ South Florida | 結合組織増殖因子 |
JP2007515162A (ja) | 2003-11-18 | 2007-06-14 | インペリアル・イノベイションズ・リミテッド | 線維症の治療において使用する化合物の同定のためのctgf及びtrkaレセプターを使用するスクリーニング方法 |
Also Published As
Publication number | Publication date |
---|---|
EP2221387A1 (en) | 2010-08-25 |
EP2398911A1 (en) | 2011-12-28 |
US20160230232A1 (en) | 2016-08-11 |
CN102325904B (zh) | 2016-03-30 |
US20120135403A1 (en) | 2012-05-31 |
CA2752802C (en) | 2018-04-03 |
JP2016047045A (ja) | 2016-04-07 |
WO2010094740A1 (en) | 2010-08-26 |
KR20120004971A (ko) | 2012-01-13 |
CA2752802A1 (en) | 2010-08-26 |
BRPI1008936B8 (pt) | 2021-07-27 |
BRPI1008936A2 (pt) | 2016-10-11 |
US9297044B2 (en) | 2016-03-29 |
JP2012524520A (ja) | 2012-10-18 |
EP2398911B1 (en) | 2017-10-18 |
BRPI1008936B1 (pt) | 2021-04-06 |
JP5837825B2 (ja) | 2015-12-24 |
CN102325904A (zh) | 2012-01-18 |
CN105907843A (zh) | 2016-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101748679B1 (ko) | 섬유증 감수성 유전자 및 이의 용도 | |
KR101571523B1 (ko) | 심혈관 질환과 연관된 유전적 감수성 변이 | |
KR101290621B1 (ko) | 안질환 치료용 방법 및 조성물 | |
CN101641451A (zh) | chr8q24.21上的癌症易感性变体 | |
US20040002470A1 (en) | Novel human gene relating to respiratory diseases, obesity, and inflammatory bowel disease | |
KR20090127939A (ko) | 유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 2 및 염색체 16 상의 유전적 변이 | |
CN109476698B (zh) | 基于基因的炎性肠病诊断 | |
US20030190639A1 (en) | Genes involved in intestinal inflamatory diseases and use thereof | |
CN107602690A (zh) | 肺动脉高压相关的ptgis基因突变及其应用 | |
WO2006022629A1 (en) | Methods of identifying risk of type ii diabetes and treatments thereof | |
KR20090087486A (ko) | 타입 2 당뇨병의 유전적 감수성 변이 | |
US20030099958A1 (en) | Diagnosis and treatment of vascular disease | |
US20080199480A1 (en) | Methods for Identifying Risk of Type II Diabetes and Treatments Thereof | |
IL179831A (en) | In vitro method for detecting the presence or possibility of autism or autism disorder, and in vitro method for selecting compounds with biological activity on autism or autism disorders | |
CA2497597A1 (en) | Methods for identifying subjects at risk of melanoma and treatments | |
KR102003835B1 (ko) | 섬유증 감수성 il22ra2 유전자 및 이의 용도 | |
KR101850065B1 (ko) | TSHR(Thyroid Stimulating Hormone Receptor) 유전자 돌연변이 및 DIO2(type 2 iodothyronine deiodinase)유전자의 SNP 검출을 이용한 갑상선기능저하증 환자의 약물치료방법 결정을 위한 정보제공방법 | |
WO2006022636A1 (en) | Methods for identifying risk of type ii diabetes and treatments thereof | |
WO2006022633A1 (en) | Methods for identifying a risk of type ii diabetes and treatments thereof | |
WO2006022634A1 (en) | Methods for identifying risk of type ii diabetes and treatments thereof | |
JP2005528089A (ja) | 末梢動脈閉塞疾患の遺伝子 | |
US20090258344A1 (en) | Methods for identifying risk of breast cancer and treatments thereof | |
CA2826522A1 (en) | Genetic polymorphism in pnlpa3 associated with liver fibrosis methods of detection and uses thereof | |
KR100909709B1 (ko) | 골밀도 및 골절 위험과 itga1 유전자 다형성과의연관성 | |
TW202313972A (zh) | 新nrg1融合物、融合接合處及檢測彼等之方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |